Google DeepMind、リアルタイムで3D仮想世界を生成する「Genie 3」を発表

桜井未来
8月6日
読了時間: 2分

更新日：8月7日

Google DeepMind、リアルタイムで仮想世界を生成する「Genie 3」を発表 — image : Google DeepMind

一度見たオブジェクトを記憶する視覚メモリ、気象・物体の即時追加など、Genie 2から大幅に性能向上

　米Google DeepMindは現地時間8月5日、テキストの指示からリアルタイムで操作可能な3D仮想環境を生成する「Genie 3」を発表した。ユーザーやAIが数分間にわたり継続して操作できるインタラクティブな空間を生成可能で、前バージョンのGenie 2と比べて持続性や表現力が大きく向上している。

image : @googledeepmind on Youtube

進化した主なポイント

　Genie 3は「視覚的記憶」と呼ばれる仕組みを採用しており、ユーザーが一度見た場所やオブジェクトをしばらくの間維持できるため、仮想世界内の整合性が強化されている。また、描画解像度は720p、フレームレートは24fpsに達し、視覚体験としてもスムーズな表現が可能となった。特徴的な機能として、ユーザーがテキストで入力した指示をもとに、仮想空間内で天候や登場キャラクター、物体の有無といった要素を即座に変化させられる「即時環境編集」も備えている。これにより、創造的なシナリオ構築や実験がシームレスに行えるようになっている。

AGIに向けた重要性

　DeepMindは、こうした世界モデルを、汎用人工知能（AGI）の基盤技術とみなしている。仮想環境を使った学習により、AIが現実世界で遭遇する多様な状況を模擬的に体験できるようになり、予測力や判断能力の向上が期待されている。仮想空間内で繰り返しタスクを経験することで、倉庫作業のような実世界の業務に必要なスキルの習得を効率化する応用例も示されている。こうした訓練を通じて、ロボットは環境に対する理解と適応を深めていく可能性がある。

現在の制限と将来の可能性

　Genie 3は、現在は限定的な研究利用に留まっており、一般公開の予定は明かされていない。また、生成される文字情報や標識などは、明確なプロンプトを与えなければ視認性が低くなるケースがあり、インターフェースとしての完成度には改善の余地がある。インタラクションの自由度や物理挙動の精度についても課題は残っているが、開発の進展により今後さらに洗練された仮想体験が可能になると期待されている。

参照サイト

Google DeepMind公式サイト

Genie 3: A new frontier for world models

https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

&SMART - ガジェット・IT・AI・FinTechに関するWebメディア

Google DeepMind、リアルタイムで3D仮想世界を生成する「Genie 3」を発表

一度見たオブジェクトを記憶する視覚メモリ、気象・物体の即時追加など、Genie 2から大幅に性能向上

進化した主なポイント

AGIに向けた重要性

現在の制限と将来の可能性

TAGs

関連記事

人気記事

みんなの銀行がBaaSパートナー30社を突破

iPhone 17eのノッチは継続？新たな情報が公開

ワイモバイル、縦折り「nubia Flip 3」と横折り「nubia Fold」を発表

Samsung、三つ折りスマホ「Galaxy Z TriFold」発表

格安SIM満足度調査：mineoが4年ぶり総合1位、IIJmioが格安スマホで2年連続トップ