Cohere выпускает семейство открытых мультиязычных моделей для ИИ

Cohere ии модели мультиязычность открытый вес автономность techcrunch.com

Модели Tiny Aya от Cohere поддерживают более 70 языков и могут работать на обычных устройствах без интернета. Открытый вес моделей позволяет использовать и модифицировать их код. — techcrunch.com

Компания Cohere, специализирующаяся на корпоративных ИИ-решениях, представила новое семейство мультиязычных моделей на полях проходящего в Индии саммита по искусственному интеллекту. Модели под названием Tiny Aya имеют открытый вес, что означает общедоступность их базового кода для использования и модификации кем угодно. Они поддерживают более 70 языков и могут работать на обычных устройствах, таких как ноутбуки, без подключения к интернету.

Модель, выпущенная исследовательским подразделением компании Cohere Labs, поддерживает южноазиатские языки, включая бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи. 

Базовая модель содержит 3,35 миллиарда параметров — показатель ее размера и сложности. Cohere также выпустила TinyAya-Global — версию, доработанную для лучшего следования командам пользователей, предназначенную для приложений, требующих широкой языковой поддержки. Региональные варианты дополняют семейство: TinyAya-Earth для африканских языков; TinyAya-Fire для южноазиатских языков; и TinyAya-Water для Азиатско-Тихоокеанского региона, Западной Азии и Европы.

Cohere выпускает семейство открытых мультиязычных моделей для ИИ
Источник изображения: Cohere

«Такой подход позволяет каждой модели развивать более прочную лингвистическую основу и культурные нюансы, создавая системы, которые ощущаются более естественными и надежными для сообществ, которым они предназначены. В то же время все модели Tiny Aya сохраняют широкое мультиязычное покрытие, что делает их гибкими отправными точками для дальнейшей адаптации и исследований», — говорится в заявлении компании.

Cohere отметила, что эти модели, обученные на одном кластере из 64 GPU H100 (тип высокопроизводительных чипов от Nvidia) с использованием относительно скромных вычислительных ресурсов, идеально подходят для исследователей и разработчиков, создающих приложения для аудиторий, говорящих на родных языках. Модели способны работать непосредственно на устройствах, поэтому разработчики могут использовать их для обеспечения автономного перевода. Компания отметила, что разработала свое базовое программное обеспечение для использования на устройствах, требуя меньше вычислительной мощности, чем большинство сопоставимых моделей.

Cohere выпускает семейство открытых мультиязычных моделей для ИИ
Источник изображения: Cohere

В лингвистически разнообразных странах, таких как Индия, подобная возможность работы в автономном режиме может открыть множество приложений и сценариев использования без необходимости постоянного доступа в интернет.

Модели доступны на HuggingFace — популярной платформе для обмена и тестирования ИИ-моделей, а также на Cohere Platform. Разработчики могут скачать их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания также публикует наборы данных для обучения и оценки на HuggingFace и планирует выпустить технический отчет с подробным описанием методологии обучения.

Генеральный директор стартапа Эйдан Гомес заявил в прошлом году, что компания планирует выйти на биржу «вскоре». По данным CNBC, компания завершила 2025 год на высокой ноте, показав 240 миллионов долларов годовой регулярной выручки, с ростом на 50% квартал к кварталу в течение года.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: