Google、新動画生成AI「Gemini Omni」発表 編集機能も強化
- 白石 奈々

- 19 時間前
- 読了時間: 2分

テキストや画像、音声を使った対話型の動画生成・編集に対応
米Googleは現地時間5月19日、年次開発者会議「Google I/O 2026」のキーノートで、生成AIモデル群「Gemini Omni」を発表した。テキスト、画像、音声、動画を横断的に扱う“ネイティブマルチモーダルAI”として位置付けており、第1弾として「Gemini Omni Flash」を公開した。
テキストや画像から動画を生成・編集
Gemini Omni Flashは、複数メディアを入力として扱いながら、自然言語ベースで動画を生成・編集できる点が特徴だ。テキストだけでなく、画像や既存動画、音声を組み合わせた入力に対応し、対話形式で映像を修正できる。
Omni Flashは「あらゆる入力からコンテンツを生成する」ことを目指したモデルで、短尺動画をリアルタイムに近い速度で生成できるとしている。従来の動画生成AI「Veo」がテキスト生成を中心としていたのに対し、Omniは既存動画を素材として編集・変換できる点を特徴とする。
例えば、「人物をアニメ風に変更」「夕方の街並みに変える」といった指示を自然言語で入力できる。対話を続けながら動画を段階的に修正できる点も特徴の1つとしている。

また、GoogleはGemini Omniを、昨年公開した画像生成AI「Nano Banana」に続くクリエイティブAIとして紹介している。対話形式でコンテンツを編集しながら生成する思想を動画領域へ拡張した形だ。
GeminiアプリやGoogle Flowへ展開
Gemini Omni Flashは19日から、Geminiアプリや映像制作ツール「Google Flow」でGoogle AI Plus / Pro / Ultra加入者向けに提供を開始した。Googleは今後、YouTube向け展開やAPI提供も予定している。
Googleは今回、「Gemini 3.5 Flash」やAIエージェント「Gemini Spark」も同時発表した。Gemini Omniは、Googleが進めるマルチモーダルAI戦略の中核モデルの1つとして位置付けられそうだ。
参照サイト
Google Japan Blog
Gemini Omni を発表



