По сообщению IT Home от 22 мая, ByteDance выпустила Lance — легковесную нативную унифицированную мультимодальную модель ИИ с всего лишь 3 миллиардами активированных параметров.
В отличие от большинства существующих мультимодальных подходов, которые разделяют «понимание» и «генерацию» на отдельные модули и затем объединяют их, Lance с самого начала разрабатывалась как единая система, которая с этапа обучения обрабатывает понимание изображений, понимание видео, генерацию изображений, генерацию видео и кросс-модальное редактирование в рамках единой архитектуры.
Модель с открытым исходным кодом нацелена на растущий спрос на эффективный мультимодальный ИИ, способный работать с различными типами медиа без необходимости использования нескольких специализированных моделей. Ее компактное количество параметров (3B) делает ее пригодной для развертывания на периферийных и потребительских аппаратных платформах, где более крупные модели непрактичны.
Этот выпуск продолжает линию активных инвестиций ByteDance в исследования базовых моделей, опираясь на предыдущие релизы, включая Seedance. Lance доступна для загрузки и развертывания через каналы открытого исходного кода компании.
Унифицированный подход модели к мультимодальному ИИ представляет собой примечательный архитектурный выбор в области, где большинство конкурентов используют гибридные конвейеры, сочетающие отдельные специализированные модели для разных задач.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




