23 декабря 2025 года компания Alibaba представила значительные обновления своей линейки голосовых моделей Tongyi Bailing.
В релиз вошли модели распознавания речи (Fun-ASR), преобразования текста в речь (Fun-CosyVoice3) и сквозного голосового взаимодействия (Fun-Audio-Chat), причем облегченные версии полностью доступны с открытым исходным кодом.
Fun-ASR поддерживает распознавание смешанной речи на 31 языке и внедряет механизм RAG. Fun-CosyVoice3 обеспечивает кросс-языковое клонирование голоса. Открытые модели с небольшим количеством параметров делают высокопроизводительный речевой ИИ возможным для развертывания на устройствах.
Источник: GEEKPARK
Всегда имейте в виду, что редакции некоторых изданий могут придерживаться предвзятых взглядов в освещении новостей.
8/9
Автор – Pandaily




