Alibaba Cloud совершенствует модели Tongyi Bailing, обостряя конкуренцию в области голосового ИИ.

alibaba,tongyi bailing,искусственный интеллект,распознавание речи,клонирование голоса,open source

Alibaba представила обновления голосовых моделей Tongyi Bailing: Fun-ASR (31 язык, RAG), Fun-CosyVoice3 (клонирование голоса). Открытый исходный код для ИИ на устройствах.

23 декабря 2025 года компания Alibaba представила значительные обновления своей линейки голосовых моделей Tongyi Bailing.

В релиз вошли модели распознавания речи (Fun-ASR), преобразования текста в речь (Fun-CosyVoice3) и сквозного голосового взаимодействия (Fun-Audio-Chat), при этом облегченные версии полностью доступны с открытым исходным кодом.

Fun-ASR поддерживает распознавание смешанной речи на 31 языке и представляет механизм RAG. Fun-CosyVoice3 позволяет осуществлять кросс-лингвальное клонирование голоса. Модели с небольшим количеством параметров и открытым исходным кодом делают высокопроизводительный речевой ИИ возможным для развертывания на устройствах.

Источник: GEEKPARK

Всегда имейте в виду, что редакции некоторых изданий могут придерживаться предвзятых взглядов в освещении новостей.
8/9