top of page

Google DeepMind、リアルタイムで3D仮想世界を生成する「Genie 3」を発表

  • 執筆者の写真: 桜井 未来
    桜井 未来
  • 8月6日
  • 読了時間: 2分

更新日:8月7日

Google DeepMind、リアルタイムで仮想世界を生成する「Genie 3」を発表
image : Google DeepMind


一度見たオブジェクトを記憶する視覚メモリ、気象・物体の即時追加など、Genie 2から大幅に性能向上


 米Google DeepMindは現地時間8月5日、テキストの指示からリアルタイムで操作可能な3D仮想環境を生成する「Genie 3」を発表した。ユーザーやAIが数分間にわたり継続して操作できるインタラクティブな空間を生成可能で、前バージョンのGenie 2と比べて持続性や表現力が大きく向上している。


image : @googledeepmind on Youtube

進化した主なポイント

 Genie 3は「視覚的記憶」と呼ばれる仕組みを採用しており、ユーザーが一度見た場所やオブジェクトをしばらくの間維持できるため、仮想世界内の整合性が強化されている。また、描画解像度は720p、フレームレートは24fpsに達し、視覚体験としてもスムーズな表現が可能となった。特徴的な機能として、ユーザーがテキストで入力した指示をもとに、仮想空間内で天候や登場キャラクター、物体の有無といった要素を即座に変化させられる「即時環境編集」も備えている。これにより、創造的なシナリオ構築や実験がシームレスに行えるようになっている。


AGIに向けた重要性

 DeepMindは、こうした世界モデルを、汎用人工知能(AGI)の基盤技術とみなしている。仮想環境を使った学習により、AIが現実世界で遭遇する多様な状況を模擬的に体験できるようになり、予測力や判断能力の向上が期待されている。仮想空間内で繰り返しタスクを経験することで、倉庫作業のような実世界の業務に必要なスキルの習得を効率化する応用例も示されている。こうした訓練を通じて、ロボットは環境に対する理解と適応を深めていく可能性がある。


現在の制限と将来の可能性

 Genie 3は、現在は限定的な研究利用に留まっており、一般公開の予定は明かされていない。また、生成される文字情報や標識などは、明確なプロンプトを与えなければ視認性が低くなるケースがあり、インターフェースとしての完成度には改善の余地がある。インタラクションの自由度や物理挙動の精度についても課題は残っているが、開発の進展により今後さらに洗練された仮想体験が可能になると期待されている。



参照サイト

Google DeepMind公式サイト

Genie 3: A new frontier for world models



TAGs


bottom of page