Оставшаяся часть Hume AI продолжит поставлять свои технологии другим фирмам в сфере искусственного интеллекта. Финансовые детали сделки не разглашаются.
TechCrunch обратился к Google и Hume AI для подтверждения этой информации.
По данным Wired, генеральный директор Алан Коуэн и около семи других инженеров будут работать с DeepMind над улучшением голосовых функций Gemini.
Приобретение команды Hume AI — недавний пример того, как ведущая ИИ-корпорация переманивает лучшие кадры, обходя регуляторный контроль, приобретая команду стартапа, а не саму компанию целиком. В прошлом году Google наняла генерального директора и ведущих исследователей вирусного стартапа в области ИИ-кодирования Windsurf, а OpenAI за последние месяцы поглотила несколько команд, включая Covogo и Roi. Федеральная торговая комиссия (FTC) недавно заявила, что уделит более пристальное внимание подобным сделкам.
Эта сделка также демонстрирует, что голос становится следующим рубежом в области искусственного интеллекта.
Секретный ингредиент Hume AI — это способность её модели понимать эмоции и настроение пользователя по голосу. В 2024 году стартап запустил свой Empathetic Voice Interface — диалоговый ИИ с эмоциональным интеллектом. По данным PitchBook, Hume AI привлекла около 80 миллионов долларов, а по прогнозам Wired, в этом году выручка компании достигнет 100 миллионов долларов.
Однако Hume AI — не единственная компания, работающая над моделями, ориентированными на голос. Google постоянно совершенствует свою функцию Gemini Live, которая позволяет пользователю вести диалог с чат-ботом. В прошлом месяце Google выпустила новую нативную аудиомодель для API Live, улучшившую способность модели «обрабатывать сложные рабочие процессы», согласно примечаниям к выпуску Gemini API.
Другие игроки индустрии также активно инвестируют в голосовые возможности. Сообщается, что OpenAI готовится к масштабному обновлению своих аудиомоделей в преддверии запуска персонального аудиоустройства, созданного совместно с Jonny Ive (io), которое ожидается в этом году. Недавние утечки указывают на то, что это может быть устройство в форме наушников-вкладышей.
В прошлом году *Meta также активизировала свои усилия в области ИИ-аудио, приобретя стартап Play AI. Умные очки Ray-Ban от создателя *Facebook всё больше полагаются на голосовые и аудиофункции для выполнения таких задач, как улучшение слышимости разговоров в шумных помещениях и обеспечение управления без помощи рук для звонков, текстовых сообщений, музыки и фотографий.
«Голос — единственный приемлемый режим ввода для носимых устройств», — заявила TechCrunch инвестор Ванесса Ларко. «Это приобретение лишь ускорит потребность в голосовых приложениях».
Спрос на голосовые возможности продолжает расти. Ранее в этом месяце стартап по генерации голоса с помощью ИИ ElevenLabs сообщил, что его годовая регулярная выручка (ARR) превысила 330 миллионов долларов.
*Facebook, *Instagram и *WhatsApp принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Rebecca Bellan




