Google、新動画生成AI「Gemini Omni」発表　編集機能も強化

白石奈々
5月21日
読了時間: 2分

テキストや画像、音声を使った対話型の動画生成・編集に対応

　米Googleは現地時間5月19日、年次開発者会議「Google I/O 2026」のキーノートで、生成AIモデル群「Gemini Omni」を発表した。テキスト、画像、音声、動画を横断的に扱う“ネイティブマルチモーダルAI”として位置付けており、第1弾として「Gemini Omni Flash」を公開した。

https://www.youtube.com/watch?v=KUyRq7szZsM

video : @Google

テキストや画像から動画を生成・編集

　Gemini Omni Flashは、複数メディアを入力として扱いながら、自然言語ベースで動画を生成・編集できる点が特徴だ。テキストだけでなく、画像や既存動画、音声を組み合わせた入力に対応し、対話形式で映像を修正できる。

　Omni Flashは「あらゆる入力からコンテンツを生成する」ことを目指したモデルで、短尺動画をリアルタイムに近い速度で生成できるとしている。従来の動画生成AI「Veo」がテキスト生成を中心としていたのに対し、Omniは既存動画を素材として編集・変換できる点を特徴とする。

　例えば、「人物をアニメ風に変更」「夕方の街並みに変える」といった指示を自然言語で入力できる。対話を続けながら動画を段階的に修正できる点も特徴の1つとしている。

　また、GoogleはGemini Omniを、昨年公開した画像生成AI「Nano Banana」に続くクリエイティブAIとして紹介している。対話形式でコンテンツを編集しながら生成する思想を動画領域へ拡張した形だ。

GeminiアプリやGoogle Flowへ展開

　Gemini Omni Flashは19日から、Geminiアプリや映像制作ツール「Google Flow」でGoogle AI Plus / Pro / Ultra加入者向けに提供を開始した。Googleは今後、YouTube向け展開やAPI提供も予定している。

　Googleは今回、「Gemini 3.5 Flash」やAIエージェント「Gemini Spark」も同時発表した。Gemini Omniは、Googleが進めるマルチモーダルAI戦略の中核モデルの1つとして位置付けられそうだ。

参照サイト

Google Japan Blog

Gemini Omni を発表

https://blog.google/intl/ja-jp/company-news/technology/gemini-omni/

スマートフォン - ガジェット・IT・AI・FinTechに関するWebメディア

Google、新動画生成AI「Gemini Omni」発表　編集機能も強化

テキストや画像、音声を使った対話型の動画生成・編集に対応

テキストや画像から動画を生成・編集

GeminiアプリやGoogle Flowへ展開

TAGs

関連記事

OpenAI、「ChatGPT Work」発表　業務向けAIエージェントを提供

OpenAI、「GPT-5.6」を正式公開　3モデル展開で性能とコストを最適化

ワイモバイル、SIMフリー新サービス「Free Style」開始

Nothing「Phone (4b)」発表 Glyph Bar刷新と大容量電池

シャオミ、名古屋にXiaomi Store開業国内3大商圏を網羅

テキストや画像、音声を使った対話型の動画生成・編集に対応

テキストや画像から動画を生成・編集

GeminiアプリやGoogle Flowへ展開

TAGs

OpenAI、「ChatGPT Work」発表 業務向けAIエージェントを提供

OpenAI、「GPT-5.6」を正式公開 3モデル展開で性能とコストを最適化

ワイモバイル、SIMフリー新サービス「Free Style」開始

Nothing「Phone (4b)」発表 Glyph Bar刷新と大容量電池

シャオミ、名古屋にXiaomi Store開業 国内3大商圏を網羅

OpenAI、「ChatGPT Work」発表　業務向けAIエージェントを提供

OpenAI、「GPT-5.6」を正式公開　3モデル展開で性能とコストを最適化

シャオミ、名古屋にXiaomi Store開業国内3大商圏を網羅