23 декабря 2025 года компания Alibaba представила значительные обновления своей линейки голосовых моделей Tongyi Bailing.
В релиз вошли модели распознавания речи (Fun-ASR), преобразования текста в речь (Fun-CosyVoice3) и сквозного голосового взаимодействия (Fun-Audio-Chat), при этом облегченные версии полностью доступны с открытым исходным кодом.
Fun-ASR поддерживает распознавание смешанной речи на 31 языке и представляет механизм RAG. Fun-CosyVoice3 позволяет осуществлять кросс-лингвальное клонирование голоса. Модели с небольшим количеством параметров и открытым исходным кодом делают высокопроизводительный речевой ИИ возможным для развертывания на устройствах.
Источник: GEEKPARK
Всегда имейте в виду, что редакции некоторых изданий могут придерживаться предвзятых взглядов в освещении новостей.
8/9
Автор – Pandaily




