OpenAIのSora動画生成モデルはビデオゲームもレンダリングできる

OpenAIのSora動画生成モデルはビデオゲームもレンダリングできる
OpenAI ソラ マインクラフト
画像クレジット: OpenAI

OpenAIの新しい(そして初の!)動画生成モデル「Sora」は、実に印象的な映画のような映像を生成できる。しかし、少なくとも今夜発表された技術論文から判断すると、このモデルはOpenAIが当初発表したよりもさらに優れた性能を備えているようだ

OpenAIの研究者らが共同執筆した「世界シミュレータとしてのビデオ生成モデル」と題された論文は、Soraのアーキテクチャの重要な側面を明らかにしています。例えば、Soraは任意の解像度とアスペクト比(最大1080p)のビデオを生成できることが示されています。論文によると、Soraはループ動画の作成から、動画の時間軸の前後への延長、既存動画の背景変更まで、幅広い画像・動画編集タスクを実行できます。

しかし、筆者にとって最も興味深いのは、OpenAIの共著者が言うように、Soraの「デジタル世界をシミュレートする」能力です。ある実験では、OpenAIはSoraに「Minecraft」という単語を含むプロンプトを入力し、プレイヤーキャラクターを操作しながら、MinecraftそっくりのHUDとゲーム(そして物理法則を含むゲームのダイナミクス)をレンダリングさせました。

OpenAI SoraはMinecraftをシミュレートできるみたいですね。もしかしたら次世代ゲーム機は「Sora box」になって、ゲームが2~3段落のテキストで配信されるようになるかもしれませんね。pic.twitter.com/9BZUIoruOV

— アンドリュー・ホワイト 🐦‍⬛ (@andrewwhite01) 2024年2月16日

では、Soraはどのようにしてこれを実現しているのでしょうか?NVIDIAのシニア研究者ジム・ファン氏(Quartz経由)の見解によると、Soraはクリエイティブなエンジンというよりも、「データ駆動型の物理エンジン」に近いとのことです。Soraは単に一枚の写真や動画を生成するだけでなく、環境内の各オブジェクトの物理特性を決定し、その計算に基づいて写真や動画(あるいは場合によってはインタラクティブな3Dワールド)をレンダリングします。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

「これらの機能は、ビデオモデルの継続的なスケーリングが、物理世界とデジタル世界、そしてそこに生息する物体、動物、人間の高性能シミュレーターの開発に向けた有望な道筋であることを示唆している」とOpenAIの共著者らは書いている。

さて、Soraの通常の限界はビデオゲームの領域にも当てはまります。ガラスの割れるといった基本的なインタラクションの物理特性を正確に近似することができません。また、 モデル化できるインタラクションであっても、Soraはしばしば一貫性に欠けます。例えば、ハンバーガーを食べている人物はレンダリングできるものの、噛み跡はレンダリングできないのです。

それでも、もし私が論文を正しく読んでいるなら、Soraはテキスト記述のみから、よりリアルな、もしかしたらフォトリアリスティックな、手続き型ゲーム生成への道を開く可能性があるように思えます。これは興奮と恐怖が同程度に混ざり合ったものです(例えば、ディープフェイクへの影響を考えてみてください)。おそらくこれが、OpenAIが今のところSoraを非常に制限されたアクセスプログラムでのみ公開することを選択した理由でしょう。

できるだけ早く、もっと多くのことを学べることを願っています。

OpenAIの最新モデルSoraは動画を生成できる — しかも、その動画はなかなか良い出来栄えだ

トピック

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る