AI-стартап Sand.ai в течение трех дней подряд открыл исходный код своего основного технологического стека для генерации аудио- и видеоконтента на GitHub.
Релизы включают:
- daVinci-MagiHuman — мультимодальная модель генерации с 15 миллиардами параметров
- MagiAttention v1.1.0 — распределенный модуль внимания
- MagiCompiler — унифицированный фреймворк для компиляции обучения и инференса

Sand.ai был основан бывшим ученым Microsoft Research Asia Цао Юэ (Cao Yue), а члены команды ранее участвовали в разработке Swin Transformer.
Компания специализируется на авторегрессионных мировых моделях и ранее выпускала такие модели, как Magi-1 (генерация видео) и GAGA-1 (аудиовизуальная генерация).

Инициатива с открытым исходным кодом направлена на обмен достижениями в области архитектуры моделей, вычислительной инфраструктуры и компиляционных фреймворков, внося вклад в базовую инфраструктуру для видеогенерации.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




