Неожиданный поворот: музыкальная ИИ-модель Lyria 3 от Google появляется в Gemini уже сегодня

ии музыка Gemini Google Lyria arstechnica.com

С помощью простого запроса можно сгенерировать 30 секунд чего-то похожего на музыку. Google интегрирует модель Lyria 3 в Gemini, делая ИИ-генерацию музыки доступной для всех. — arstechnica.com

Американский поэт Генри Уодсворт Лонгфелло называл музыку «универсальным языком человечества». Остается ли это правдой, когда так называемая музыка генерируется вероятностным роботом, а не человеком? Скоро узнаем. Google объявила, что ее новейшая модель ИИ Lyria 3 развертывается в приложении Gemini, значительно расширяя доступ к генерации музыки с помощью ИИ.

Google DeepMind уже некоторое время работает над Lyria, предоставляя ограниченный доступ в ориентированных на разработчиков продуктах, таких как Vertex AI. Lyria 3 более функциональна, чем предыдущие версии, и ей быстрее пользоваться. Просто выберите новую опцию «Создать музыку» в приложении Gemini или веб-интерфейсе, чтобы начать. Вы можете описать, что хотите, и даже загрузить изображение, чтобы помочь роботу уловить нужную атмосферу. И через несколько секунд вы получите музыку (или что-то похожее).

Если были какие-то сомнения относительно того, считаются ли треки Lyria все еще человеческим творческим начинанием, не волнуйтесь! В отличие от предыдущих версий модели, вам даже не нужно предоставлять текст в своем запросе. Вы можете быть расплывчаты в своих пожеланиях, и модель создаст подходящий текст для 30-секундной песни. Хотя при таком ограничении, возможно, более уместным будет слово «джингл».

В дополнение к треку, каждое задание по созданию музыки будет сопровождаться изображением в стиле обложки альбома, созданным моделью Nano Banana. В Gemini также будет предустановлен набор ИИ-треков, которые вы сможете ремикшировать по своему желанию. Инструменты Lyria 3 также появятся в наборе инструментов Google Dream Track для YouTube Shorts, что хорошо сочетается с возможностями видео Veo AI.

,

Так какие же треки можно ожидать от Gemini? Google предоставила несколько примеров:

«Sweet Like Plantain»

Запрос: Я испытываю ностальгию. Создай трек для моей мамы о прекрасном времени, проведенном в детстве, и воспоминаниях о ее домашней кухне с бананами. Сделай его веселым афробит-треком с настоящим африканским колоритом.

«Motown Parody»

Запрос: Классический соул Motown 1970-х годов. Богатая, оркестровая R&B аранжировка. Теплая басовая линия с мелодичными вставками, плотно сидящая на стабильном барабанном ритме с четкой малым барабаном и тамбурином. Винтажное органное гармоническое полотно. Секция из трех духовых инструментов. Хриплый мужской тенор в стиле госпел.

«Pop Flutter»

Запрос: Меланхолично и легко. Мягкий, воздушный женский вокал с интимностью. Быстрый ритм барабанов и баса, с низкими частотами и смягченный. Глубокие, теплые басовые волны. Мечтательные аккорды электропианино и тонкие текстуры колокольчиков. Атмосфера дождливого города.

«Sea Shanty»

Запрос: Аутентичная а капелла морская шанти с участием мощного мужского хора, поющего в традиционном формате «вопрос-ответ». Произведение полностью вокальное, опирается на синхронизированные удары ногами по деревянной палубе и резкие хлопки в ладоши для создания ритмического пульса. Ведущий — обветренный мужской баритон с хриплым тембром, поющий повествовательные «кричащие» строки. Ему немедленно отвечает мощный мужской хор, поющий богатыми, грубыми гармониями в «ответных» строках. Голоса записаны с естественным реверберацией помещения, имитирующей акустическую среду деревянной палубы корабля, что придает вокалу резонансное, атмосферное качество. Исполнение энергичное и драйвовое, хор подхватывает ритм ударов ногами, создавая ощущение сфокусированного, коллективного усилия. Инструментов нет, только многослойные текстуры коллективных мужских голосов в диапазонах тенора, баритона и баса, все это способствует уверенному, монолитному звучанию.

Неприятные ноты

Музыка, сгенерированная ИИ, — не новое явление. Несколько компаний предлагают модели, которые обрабатывают и гомогенизируют музыку, созданную человеком, и в результате треки могут звучать удивительно «реалистично», если не сказать немного перегружено. Стриминговые сервисы уже переполнены поддельными ИИ-исполнителями, некоторые из которых собрали тысячи слушателей, которые, возможно, даже не осознают, что слушают музыкальный эквивалент блендера на режиме «пюре».

Тем не менее, для этого приходится искать инструменты, а Google предоставляет аналогичные возможности в приложении Gemini. Поскольку это одна из самых популярных ИИ-платформ, мы, вероятно, увидим гораздо больше ИИ-музыки в Интернете. Google утверждает, что треки, сгенерированные с помощью Lyria 3, будут иметь встроенную аудиоверсию SynthID от Google. Это означает, что вы всегда сможете проверить, была ли аудиозапись создана с помощью ИИ Google, загрузив ее в Gemini, подобно тому, как вы можете проверять изображения и видео на наличие тегов SynthID.

Google также заявляет, что стремилась создать музыкальный ИИ, который уважает авторские права и партнерские соглашения. Если вы укажете конкретного исполнителя в своем запросе, Gemini не будет пытаться скопировать его стиль. Вместо этого он обучен воспринимать это как «широкое творческое вдохновение». Хотя компания также отмечает, что этот процесс не является безошибочным, и некоторые элементы оригинального выражения могут слишком сильно имитировать исполнителя. В таких случаях Google предлагает пользователям сообщать о таком совместно используемом контенте.

Lyria 3 запускается в веб-интерфейсе Gemini сегодня и должна появиться в мобильном приложении в течение нескольких дней. Она работает на английском, немецком, испанском, французском, хинди, японском, корейском и португальском языках, но Google планирует вскоре добавить новые языки. Хотя все пользователи будут иметь некоторый доступ к генерации музыки, те, у кого есть подписки AI Pro и AI Ultra, будут иметь более высокие лимиты использования, но детали неясны.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: