Google Gemini Omni выводит создание AI-видео и диалоговое редактирование на новый уровень

Google Gemini Omni ии видео генерация techtimes.com

Google представляет Gemini Omni — инструмент ИИ для диалогового создания и редактирования видео, а также генерации медиаконтента в различных форматах. — techtimes.com

Google официально представила свою новейшую систему искусственного интеллекта Gemini Omni на конференции Google I/O. С ее помощью создание видео с помощью ИИ становится намного проще, чем раньше.

Запуск начинается с Gemini Omni Flash — версии, ориентированной на видео, которая позволяет пользователям генерировать и редактировать контент с использованием подсказок на естественном языке и мультимедийных вводов.

Google Gemini Omni выводит создание AI-видео и диалоговое редактирование на новый уровень
Google/YouTube

Gemini Omni Flash интегрируется в ряд платформ Google, включая приложение Gemini, Google Flow, YouTube Shorts и YouTube Create. Компания также планирует расширить доступ для разработчиков и корпоративных пользователей в будущих обновлениях.

Система основана на более ранних инновациях, таких как «Nano Banana», которая в 2025 году расширила возможности Gemini по генерации изображений.

С Gemini Omni Google переходит от создания статических изображений к полностью интерактивным рабочим процессам генерации и редактирования видео.

Одной из наиболее примечательных особенностей Gemini Omni является возможность редактирования в режиме диалога. Вместо использования традиционных инструментов редактирования пользователи могут изменять видео с помощью команд на естественном языке.

Google заявляет, что система сохраняет визуальную согласованность при редактировании, гарантируя, что персонажи остаются стабильными, а сцены сохраняют непрерывность даже после существенных изменений. Поведение движения, освещение и взаимодействие объектов спроектированы так, чтобы оставаться реалистичными и связными на протяжении всех правок.

Модель также включает улучшенное понимание физики реального мира, что позволяет создавать более естественные визуальные эффекты, такие как отражения, движение и динамические трансформации объектов.

Поскольку контент, генерируемый ИИ, становится все более совершенным, Google также внедряет меры защиты для решения проблем подлинности. Весь контент, созданный с помощью Gemini Omni, будет включать водяные знаки SynthID, которые идентифицируют медиа как сгенерированные ИИ.

TechRadar сообщает, что компания расширяет инструменты верификации в Gemini, Chrome и Поиске, чтобы повысить прозрачность и снизить риски дезинформации в медиа, сгенерированных ИИ.

Изначально пользователи смогут создавать персонализированные ИИ-видеоаватары, используя собственный голос. Однако более продвинутые функции манипуляции голосом остаются на рассмотрении, поскольку Google оценивает последствия для безопасности.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: