Google の AI 研究組織 DeepMind は、「無限の」種類のプレイ可能な 3D 世界を生成できるモデルを公開しました。
「Genie 2」と呼ばれるこのモデルは、今年初めにリリースされたDeepMindの「Genie」の後継であり、一枚の画像とテキストによる説明(例えば「森の中にいるかわいいヒューマノイドロボット」)からインタラクティブなリアルタイムシーンを生成できます。この点において、フェイフェイ・リー氏の会社World LabsやイスラエルのスタートアップDecartが開発中のモデルと類似しています。
DeepMindは、Genie 2は「非常に多様で豊かな3D世界」を生成できると主張しており、その中にはユーザーがマウスやキーボードを使ってジャンプや水泳などのアクションを行える世界も含まれる。動画で学習したこのモデルは、オブジェクトの相互作用、アニメーション、照明、物理特性、反射、そして「NPC」の行動をシミュレートすることができる。

Genie 2のシミュレーションの多くはAAA級のビデオゲームのように見えます。これは、モデルのトレーニングデータに人気タイトルのプレイデータが含まれていることが原因である可能性が高いです。しかし、DeepMindは多くのAI研究機関と同様に、競争上の理由などから、データの入手方法について多くの詳細を明らかにしていません。
知的財産権への影響について疑問が残る。DeepMindはGoogleの子会社であるため、YouTubeへの自由なアクセス権を有しており、Googleは以前、利用規約においてYouTube動画をモデルの学習に利用することをDeepMindに許可していると示唆していた。しかし、Genie 2は基本的に「視聴」したビデオゲームの無許可コピーを作成していると言えるのだろうか?それは裁判所の判断に委ねられるべきだろう。
DeepMindによれば、Genie 2は、一人称視点や等角投影ビューなど、さまざまな視点で最長1分間、大部分が10秒から20秒持続する一貫した世界を生成できるという。
「Genie 2はキーボードのキーを押すという操作にインテリジェントに反応し、キャラクターを識別して正しく動かします」とDeepMindはブログ記事に記している。「例えば、私たちのモデルは矢印キーで木や雲ではなくロボットを動かすことができると理解しています。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日

Genie 2のようなモデル(いわゆるワールドモデル)のほとんどは、ゲームや3D環境をシミュレートできますが、アーティファクト、一貫性、幻覚といった問題を抱えています。例えば、DecartのMinecraftシミュレーター「Oasis」は解像度が低く、レベルのレイアウトをすぐに「忘れて」しまいます。
しかし、Genie 2は、シミュレーションされたシーンのうち、視界にない部分を記憶し、再び視界に入ったときに正確にレンダリングすることができます。(World Labsのモデルも同様の機能を備えています。)
Genie 2で作られたゲームは、1分ごとに進行状況が消去されてしまうので、正直言ってそれほど面白くないでしょう。だからこそDeepMindは、このモデルを研究・創造ツールとして位置付けており、「インタラクティブな体験」のプロトタイプ作成やAIエージェントの評価に活用しています。
「Genie 2の分布外一般化機能のおかげで、コンセプトアートや描画を完全にインタラクティブな環境に変換できます」とDeepMindは記している。「そして、Genie 2を使ってAIエージェント向けに豊かで多様な環境を迅速に構築することで、研究者はエージェントがトレーニング中に経験したことのない評価タスクを生成できるようになります。」

クリエイター、特にビデオゲーム業界のクリエイターたちは、複雑な思いを抱いているかもしれません。Wired誌の最近の調査によると、多数の従業員を解雇したActivision Blizzardのような大手企業は、AIを活用してコスト削減、生産性向上、そして人員削減を補っていることが明らかになりました。
それでもなお、GoogleはAIの次なる大ブームとなると期待される世界モデル研究に、ますます多くのリソースを投入している。10月には、DeepMindがOpenAIの動画生成ツール「Sora」の開発を率いていたティム・ブルックスを、動画生成技術と世界シミュレーターの開発に採用した。そして2年前、DeepMindはNetHackなどのビデオゲームにおける「オープンエンド性」の実験で最もよく知られるティム・ロックテシェルをMetaから引き抜いた。
TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る