Mirelo привлекла 41 млн долларов от Index и a16z, чтобы решить проблему беззвучных видеороликов, созданных ИИ.

ии,звуковые эффекты,генеративный ии,стартапы,финансирование,видео

Немецкий стартап Mirelo, разрабатывающий ИИ для добавления синхронизированных звуковых эффектов к видео, привлек $41 млн посевного финансирования. Инвестиции возглавили Index Ventures и Andreessen Horowitz. Средства пойдут на развитие конкурентоспособности компании на рынке генеративного ИИ для видео.

Ранее в этом году берлинский стартап выпустил Mirelo SFX v1.5 — модель искусственного интеллекта, которая интерпретирует видео для добавления синхронизированных звуковых эффектов (SFX).

Это привлекло внимание венчурных капиталистов, готовящихся к революции генеративного ИИ в играх. Двухлетний немецкий стартап привлек $41 млн в рамках посевного раунда под руководством Index Ventures и Andreessen Horowitz, эксклюзивно узнал TechCrunch.

Этот новый капитал поможет Mirelo более эффективно конкурировать в своей зарождающейся нише. Пока стартап находился в режиме «стелс» и испытывал нехватку ресурсов, крупные компании, такие как Sony и Tencent, выпустили модели видео в SFX. То же самое сделали Kling AI, принадлежащая Kuaishou из Китая, и ElevenLabs, которую также поддерживает a16z.

Хотя Mirelo уже отличается от них более узкой специализацией, для победы над этими моделями в долгосрочной перспективе стартапу необходимо нанять дополнительных сотрудников. В общей сложности стартап ожидает, что его команда из 10 человек «удвоится, если не утроится» к концу следующего года, сообщил TechCrunch генеральный директор и соучредитель Mirelo Си Джей Саймон-Гэбриел.

Новые сотрудники будут поддерживать исследования и разработки Mirelo, а также его продуктовую стратегию и стратегию выхода на рынок. Стартап опубликовал свои модели на Fal.ai и Replicate и ожидает, что в краткосрочной перспективе основным источником дохода будет использование API, сказал Саймон-Гэбриел. Но компания также инвестирует в развитие своей рабочей среды для создателей контента, Mirelo Studio, которая в конечном итоге сможет поддерживать полное профессиональное использование.

По мере подготовки Mirelo к масштабированию, стартап и его инвесторы также предвидят проблемы с обучающими данными, которые преследовали другие компании, занимающиеся генеративным ИИ. По словам Джорджии Стивенсон, руководившей инвестициями Index, Mirelo основывал свои модели на общедоступных и приобретенных звуковых библиотеках и подписывает партнерства с разделением доходов, которые уважают права артистов. 

Это напряженность, присущая инструментам генеративного ИИ, но Mirelo не вытесняет музыкантов и саунд-дизайнеров — по крайней мере, пока. Используя модель freemium, включающую рекомендуемый план для создателей контента стоимостью 20 евро в месяц (примерно $23,50), стартап в основном ориентируется на любителей и продвинутых пользователей, надеющихся «озвучить» видео, созданные ИИ.

По словам Саймон-Гэбриела, создатели контента не смогут в полной мере воспользоваться этим новым потенциалом без аудио.

«Джордж Лукас сказал, что звук — это 50% впечатлений от просмотра фильма. Это не преувеличение», — сказал он. «Если что-то и есть, так это преуменьшение. Вы можете взять абсолютно те же изображения, и звук создаст совершенно другую атмосферу, в зависимости от звука и музыки, которые вы вставите».

Он и его соучредитель Флориан Венцель сами являются исследователями в области ИИ и музыкантами, и в дорожной карте стартапа есть генерация музыки с помощью ИИ. Но Mirelo видит больший спрос на звуковые эффекты, отчасти потому, что исследований в этой области меньше, чем в других областях ИИ, сказал Саймон-Гэбриел.

«Здесь проще построить настоящий ров, а затем на нем заработать», — отметил он.

Это может окупиться для Mirelo. Саймон-Гэбриел отказался раскрыть новую оценку компании, но заявил, что она «очень значительно» выросла по сравнению с его ранее нераскрытым раундом pre-seed. Этот предыдущий раунд возглавляла берлинская фирма Atlantic, которая также участвовала в новом финансировании, доведя общий объем привлеченных средств Mirelo до $44 миллионов и помогая сократить разрыв в ресурсах.

Стартап также поддерживается ангелами, которые придают авторитет его технологии и могут открыть новые двери, включая генерального директора Mistral Артура Менша, главного научного сотрудника Hugging Face Томаса Вольфа, соучредителя Fal.ai Буркай Гура и других.

Тем не менее, команда осознает, что видео, сгенерированные ИИ, могут быть не «немыми» долго.

Например, генератор видео Gemini теперь включает саундтреки, созданные на основе модели видео в аудио DeepMind Veo 3.1. Но, если что-то и произошло, то Саймон-Гэбриел чувствует себя оправданным. «Теперь внезапно люди понимают: „О, может быть, нам стоит добавить звук“. Но, конечно, его нужно добавить. Это немного похоже на немое кино против звукового, верно? Это имеет большое значение!»