Google официально представила свою новейшую систему искусственного интеллекта Gemini Omni на конференции Google I/O. С ее помощью создание видео с помощью ИИ становится намного проще, чем раньше.
Запуск начинается с Gemini Omni Flash — версии, ориентированной на видео, которая позволяет пользователям генерировать и редактировать контент с использованием подсказок на естественном языке и мультимедийных вводов.

Gemini Omni Flash интегрируется в ряд платформ Google, включая приложение Gemini, Google Flow, YouTube Shorts и YouTube Create. Компания также планирует расширить доступ для разработчиков и корпоративных пользователей в будущих обновлениях.
Система основана на более ранних инновациях, таких как «Nano Banana», которая в 2025 году расширила возможности Gemini по генерации изображений.
С Gemini Omni Google переходит от создания статических изображений к полностью интерактивным рабочим процессам генерации и редактирования видео.
Одной из наиболее примечательных особенностей Gemini Omni является возможность редактирования в режиме диалога. Вместо использования традиционных инструментов редактирования пользователи могут изменять видео с помощью команд на естественном языке.
Google заявляет, что система сохраняет визуальную согласованность при редактировании, гарантируя, что персонажи остаются стабильными, а сцены сохраняют непрерывность даже после существенных изменений. Поведение движения, освещение и взаимодействие объектов спроектированы так, чтобы оставаться реалистичными и связными на протяжении всех правок.
Модель также включает улучшенное понимание физики реального мира, что позволяет создавать более естественные визуальные эффекты, такие как отражения, движение и динамические трансформации объектов.
Поскольку контент, генерируемый ИИ, становится все более совершенным, Google также внедряет меры защиты для решения проблем подлинности. Весь контент, созданный с помощью Gemini Omni, будет включать водяные знаки SynthID, которые идентифицируют медиа как сгенерированные ИИ.
TechRadar сообщает, что компания расширяет инструменты верификации в Gemini, Chrome и Поиске, чтобы повысить прозрачность и снизить риски дезинформации в медиа, сгенерированных ИИ.
Изначально пользователи смогут создавать персонализированные ИИ-видеоаватары, используя собственный голос. Однако более продвинутые функции манипуляции голосом остаются на рассмотрении, поскольку Google оценивает последствия для безопасности.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Jose Enrico




