DeepSeek представит на следующей неделе мультимодальную модель V4 с поддержкой генерации изображений, видео и текста

Deepseek V4 Llm ии мультимодальность китай pandaily.com

На следующей неделе DeepSeek выпустит свою мультимодальную большую языковую модель V4 с нативной поддержкой генерации изображений, видео и текста, отдав приоритет раннему доступу отечественным партнерам по чипам Huawei и Cambricon перед NVIDIA и AMD. — pandaily.com

28 февраля Financial Times опубликовала сегодня статью в блоге, сообщающую, что DeepSeek на следующей неделе выпустит свою новую мультимодальную большую языковую модель V4 с нативной поддержкой функций генерации изображений, видео и текста.

Это первое крупное обновление версии DeepSeek с момента запуска модели для логических рассуждений R1 в январе 2025 года, которое, как ожидается, дополнительно заполнит рыночный спрос на недорогие модели с открытым исходным кодом в Китае.

При выпуске V4 на следующей неделе DeepSeek планирует одновременно опубликовать краткое техническое объяснение, а подробный инженерный отчет последует примерно через месяц.

Что касается аппаратной адаптации, источники указывают, что DeepSeek обеспечивает глубокую поддержку отечественных вычислительных мощностей, заключив партнерство с Huawei и Cambricon для оптимизации аппаратной адаптации модели V4, что, как ожидается, значительно повысит спрос на отечественные полупроводники и ускорит процессы «инференса» ИИ-моделей на отечественных чипах.

Другая информация показывает, что DeepSeek V4 отдал приоритет предоставлению раннего доступа отечественным поставщикам, включая Huawei, не предоставляя тестовые версии NVIDIA и AMD, нарушая стандартные отраслевые практики. Разработчики ИИ обычно делятся предрелизными версиями крупных моделей с производителями чипов, такими как NVIDIA и AMD, чтобы их программное обеспечение эффективно работало на широко используемом оборудовании; ранее DeepSeek тесно сотрудничал с техническим персоналом NVIDIA.

По данным надежных источников, предварительная версия V4 с кодовым названием «sealion-lite» прошла закрытое внутреннее тестирование, окно контекста которого расширено до 1 миллиона токенов, нативно поддерживая мультимодальные возможности рассуждения для глубокого анализа и понимания сложных входных данных, таких как чрезвычайно длинные тексты и большие библиотеки кода. Предыдущая информация указывает на то, что V4 может быть мега-фундаментальной моделью масштаба триллиона параметров.

Источник : IT Home

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: