Google переманила команду разработчиков ИИ-стартапа Hume AI

ии,google,голос,hume ai,gemini,технологии

Google наняла CEO и ведущих разработчиков голосового ИИ-стартапа Hume AI, что сигнализирует о растущем переходе к голосовому интерфейсу как предпочтительному способу взаимодействия вместо экранов. Эта “acqui-hire” подчеркивает тренд в IT-индустрии.

Оставшаяся часть Hume AI продолжит поставлять свои технологии другим фирмам в сфере искусственного интеллекта. Финансовые детали сделки не разглашаются.

TechCrunch обратился к Google и Hume AI для подтверждения этой информации.

По данным Wired, генеральный директор Алан Коуэн и около семи других инженеров будут работать с DeepMind над улучшением голосовых функций Gemini.

Приобретение команды Hume AI — недавний пример того, как ведущая ИИ-корпорация переманивает лучшие кадры, обходя регуляторный контроль, приобретая команду стартапа, а не саму компанию целиком. В прошлом году Google наняла генерального директора и ведущих исследователей вирусного стартапа в области ИИ-кодирования Windsurf, а OpenAI за последние месяцы поглотила несколько команд, включая Covogo и Roi. Федеральная торговая комиссия (FTC) недавно заявила, что уделит более пристальное внимание подобным сделкам.

Эта сделка также демонстрирует, что голос становится следующим рубежом в области искусственного интеллекта.

Секретный ингредиент Hume AI — это способность её модели понимать эмоции и настроение пользователя по голосу. В 2024 году стартап запустил свой Empathetic Voice Interface — диалоговый ИИ с эмоциональным интеллектом. По данным PitchBook, Hume AI привлекла около 80 миллионов долларов, а по прогнозам Wired, в этом году выручка компании достигнет 100 миллионов долларов.

Однако Hume AI — не единственная компания, работающая над моделями, ориентированными на голос. Google постоянно совершенствует свою функцию Gemini Live, которая позволяет пользователю вести диалог с чат-ботом. В прошлом месяце Google выпустила новую нативную аудиомодель для API Live, улучшившую способность модели «обрабатывать сложные рабочие процессы», согласно примечаниям к выпуску Gemini API.

Другие игроки индустрии также активно инвестируют в голосовые возможности. Сообщается, что OpenAI готовится к масштабному обновлению своих аудиомоделей в преддверии запуска персонального аудиоустройства, созданного совместно с Jonny Ive (io), которое ожидается в этом году. Недавние утечки указывают на то, что это может быть устройство в форме наушников-вкладышей.

В прошлом году *Meta также активизировала свои усилия в области ИИ-аудио, приобретя стартап Play AI. Умные очки Ray-Ban от создателя *Facebook всё больше полагаются на голосовые и аудиофункции для выполнения таких задач, как улучшение слышимости разговоров в шумных помещениях и обеспечение управления без помощи рук для звонков, текстовых сообщений, музыки и фотографий.

«Голос — единственный приемлемый режим ввода для носимых устройств», — заявила TechCrunch инвестор Ванесса Ларко. «Это приобретение лишь ускорит потребность в голосовых приложениях».

Спрос на голосовые возможности продолжает расти. Ранее в этом месяце стартап по генерации голоса с помощью ИИ ElevenLabs сообщил, что его годовая регулярная выручка (ARR) превысила 330 миллионов долларов.

*Facebook, *Instagram и *WhatsApp принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: