Alibaba представляет Fun-Audio-Chat, новую комплексную модель голосового взаимодействия с открытым исходным кодом.

ai,alibaba,fun-audio-chat,голосовой ии,машинное обучение,открытый исходный код

Alibaba представила Fun-Audio-Chat, новую модель речевого взаимодействия с открытым исходным кодом. Модель с 8 млрд параметров обеспечивает естественные голосовые беседы и интеграцию с внешними сервисами. Цель – ускорить инновации в области голосового ИИ.

Компания Alibaba объявила об открытии исходного кода Fun-Audio-Chat, модели речевого взаимодействия нового поколения, разработанной командой Tongyi.

В открытый пакет входят веса модели с 8 миллиардами параметров (8B), код логического вывода и подробные примеры интеграции Function Call, позволяющие разработчикам подключать модель к внешним инструментам и сервисам.

Разработанная для обеспечения более естественных и плавных голосовых бесед, Fun-Audio-Chat использует сквозную архитектуру для лучшего понимания и генерации непрерывной речи. Встроенная функция Function Call значительно расширяет возможности применения модели для сложных, многоэтапных задач. Alibaba заявила, что инициатива с открытым исходным кодом направлена на снижение барьеров для разработчиков и ускорение инноваций в рамках экосистемы голосового ИИ.

Источник: AI daliy

(*) Имейте ввиду: редакции некоторых изданий могут придерживаться предвзятых взглядов в освящении новостей.
8/9