На конференции Google I/O представили Gemini Omni — инструмент для создания видео по любому запросу и их редактирования в режиме диалога

ref · 20.Май.2026 01:20:00

19 мая компания Google на конференции Google I/O 2026 представила новую серию моделей Gemini Omni, позиционируемых как генеративные медиамодели, способные «создавать всё на основе любого ввода данных». В настоящее время основной акцент сделан на видеоконтенте. Gemini Omni объединяет способности Gemini к логическим рассуждениям с возможностями генерации мультимедийного контента: в качестве исходных данных могут использоваться изображения, аудио, видео и текст одновременно. С помощью естественного языка можно создавать высококачественные видеоролики; при этом каждая последующая команда редактирования накладывается на предыдущую, образ персонажа остаётся неизменным, а физические законы соблюдаются на протяжении всего диалога. Улучшена способность модели к интуитивному моделированию физических процессов (гравитация, кинетическая энергия, гидродинамика), а также доступ к знаниям Gemini в таких областях, как история, наука и культура, что позволяет сочетать повествование с реальным смыслом изображений. Ранее в прошлом году Google выпустила модель Nano Banana, обеспечившую умные функции Gemini для генерации и редактирования изображений; Gemini Omni стала её полноценным продолжением в сфере видео.

Первая версия — Gemini Omni Flash — с сегодняшнего дня доступна всем подписчикам Google AI Plus, Pro и Ultra по всему миру через приложение Gemini и инструмент для создания видео Google Flow; также бесплатно предлагается в YouTube Shorts и приложении YouTube Create. В ближайшие недели модель будет открыта для разработчиков и корпоративных пользователей посредством API. В будущем планируется добавить поддержку генерации изображений и аудио; функция редактирования звука пока находится на стадии оценки безопасности и временно недоступна. Что касается безопасности, то во всех видео, созданных с помощью Omni, автоматически встраивается невидимый цифровой водяной знак SynthID, проверяемый в приложении Gemini, Chrome и поисковике Google. Кроме того, Google запустила функцию «Цифровой аватар», позволяющую создавать видео с изображением и голосом самого пользователя; в настоящее время компания тщательно изучает вопрос расширения возможностей редактирования аудио.

Блог Google

Тема	Ответов	Просм.
谷歌发布 Gemini 3.5 Flash，速度 4 倍于同类前沿模型常规 ai , gemini , google , 大模型 , google-io	5	20.05.2026
Gemini Spark 正式向美国所有 AI Ultra 订阅者开放，月费 100 美元起，可后台持续执行跨应用任务常规 gemini , google , spark	4	31.05.2026
谷歌 SynthID 进驻搜索与 Chrome，OpenAI 宣布接入该标准常规 openai , ai内容溯源 , synthid , c2pa , google	3	20.05.2026
Google Marketing Live 2026：搜索广告全面接入 Gemini，动态广告 9 月起升级至 AI Max 常规 google , gemini , 广告 , ai-max , google-marketing-liv	2	21.05.2026
谷歌 AI Mode 月活破 10 亿，搜索框 25 年最大升级常规 google , google-io , 搜索 , ai-mode , agent	3	20.05.2026

На конференции Google I/O представили Gemini Omni — инструмент для создания видео по любому запросу и их редактирования в режиме диалога

Связанные темы