Компания Alibaba объявила об открытии исходного кода Fun-Audio-Chat, модели речевого взаимодействия нового поколения, разработанной командой Tongyi.
В открытый пакет входят веса модели с 8 миллиардами параметров (8B), код логического вывода и подробные примеры интеграции Function Call, позволяющие разработчикам подключать модель к внешним инструментам и сервисам.
Разработанная для обеспечения более естественных и плавных голосовых бесед, Fun-Audio-Chat использует сквозную архитектуру для лучшего понимания и генерации непрерывной речи. Встроенная функция Function Call значительно расширяет возможности применения модели для сложных, многоэтапных задач. Alibaba заявила, что инициатива с открытым исходным кодом направлена на снижение барьеров для разработчиков и ускорение инноваций в рамках экосистемы голосового ИИ.
Источник: AI daliy
(*) Имейте ввиду: редакции некоторых изданий могут придерживаться предвзятых взглядов в освящении новостей.
8/9
Автор – Pandaily




