OpenAIの最新モデルSoraは動画を生成できる — しかも、その動画はなかなか良い出来栄えだ

OpenAIの最新モデルSoraは動画を生成できる — しかも、その動画はなかなか良い出来栄えだ

OpenAI は、Runway のようなスタートアップや、Google や Meta のようなテクノロジー大手の足跡をたどり、ビデオ生成に参入しています。

OpenAIは本日、テキストから動画を生成する生成AIモデル「Sora」を発表しました。OpenAIによると、Soraは簡潔な(あるいは詳細な)説明、あるいは静止画を入力するだけで、複数のキャラクター、様々な動き、背景のディテールを含んだ1080pの映画のようなシーンを生成できるとのことです。

Sora は、既存のビデオ クリップを「拡張」して、不足している詳細を最大限に補うこともできます。

「Soraは言語を深く理解しており、プロンプトを正確に解釈し、生き生きとした感情を表現する魅力的なキャラクターを生成することができます」とOpenAIはブログ記事に記しています。「このモデルは、ユーザーがプロンプトで何を求めているのかだけでなく、それらが現実世界にどのように存在するのかまで理解しています。」

さて、OpenAIのSoraのデモページには、上記のように大げさな表現が散りばめられています。しかし、このモデルから厳選されたサンプルは、少なくともこれまで見てきた他のテキスト動画変換技術と比べると、かなり印象的です 

まず、Soraは様々なスタイル(例:フォトリアリスティック、アニメーション、白黒)で、最長1分間の動画を生成できます。これは、ほとんどのテキスト動画モデルよりもはるかに長いです。また、これらの動画は、物体が物理的に不可能な方向に移動するといった、私が「AIの奇妙さ」と呼ぶものに必ずしも陥らないという意味で、ある程度の一貫性を保っています。

Sora で生成されたアート ギャラリーのツアーをご覧ください (ビデオ GIF 変換ツールによる圧縮のため、粗さは無視してください)。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

OpenAI ソラ
画像クレジット: OpenAI

あるいは、花が咲くこのアニメーション:

OpenAI ソラ
画像クレジット: OpenAI

ソラの動画の中には、ヒューマノイドを題材にした作品がいくつかあります。例えば、街並みを背景に立つロボットや、雪道を歩く人などです。背景にあまり動きがないせいか、ビデオゲームのような雰囲気が漂っています。一方で、車が一方向に走っていたのに突然バックしたり、腕が布団カバーに溶け込んだりと、AI特有の奇妙な動きが多くの動画に散りばめられています。

OpenAI ソラ
画像クレジット: OpenAI

OpenAIは、その優れた点にもかかわらず、このモデルが完璧ではないことを認めています。そして、次のように述べています。

「[Sora]は複雑なシーンの物理特性を正確にシミュレートするのに苦労する可能性があり、因果関係の具体的な事例を理解できない場合があります。例えば、人がクッキーを一口食べたとしても、その後クッキーに噛み跡が残らない場合があります。また、モデルはプロンプトの空間的な詳細を混乱させる可能性があり、例えば左右を混同したり、特定のカメラの軌跡を追うなど、時間の経過とともに発生するイベントの正確な説明に苦労する場合があります。」

OpenAIはSoraを研究プレビューと位置付けており、モデルの学習に使用されたデータについてはほとんど明らかにしていない(約1万時間の「高品質」ビデオを除く)。また、Soraの一般公開も控えている。その理由は悪用される可能性にある。OpenAIは、悪意のある人物がSoraのようなモデルを様々な方法で悪用する可能性があることを正しく指摘している。

OpenAIは、専門家と協力してモデルの脆弱性を調査し、動画がSoraによって生成されたかどうかを検知するツールを開発していると述べています。また、このモデルを一般向け製品に組み込む場合は、生成された出力に来歴メタデータが含まれるようにするとしています。

「私たちは世界中の政策立案者、教育者、そしてアーティストと協力し、彼らの懸念を理解し、この新しい技術の有益な活用事例を特定していきます」とOpenAIは述べています。「広範な調査とテストを実施しているにもかかわらず、人々が私たちの技術をどのように有益に利用するか、あるいはどのように悪用するかをすべて予測することはできません。だからこそ、実世界での使用から学ぶことは、時間をかけてより安全なAIシステムを構築し、リリースしていく上で重要な要素だと考えています。」

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る