ランウェイの新しいビデオ生成AI、Gen-3は、改善されたコントロールを提供します

Cemubo vgnpne 0

Watch

高品質の AI 生成ビデオをめぐる競争が激化しています。

月曜日、映画・画像コンテンツ制作者向けの生成AIツールを開発するRunwayは、Gen-3 Alphaを発表しました。同社の最新AIモデルは、テキスト説明と静止画から動画クリップを生成します。Runwayによると、このモデルは、従来の主力動画モデルであるGen-2と比較して、生成速度と忠実度が「大幅に」向上しており、作成する動画の構造、スタイル、動きを細かく制御できるとのことです。

Gen-3 は、エンタープライズ顧客や Runway のクリエイティブパートナープログラムに参加しているクリエイターを含む Runway 加入者向けに、近日中に提供される予定です。

「Gen-3 Alphaは、幅広い動作、身振り、感情を持つ表情豊かな人間キャラクターの生成に優れています」とRunwayはブログ記事に記している。「幅広いスタイルと映画用語を解釈し、想像力豊かなトランジションとシーン内の要素の正確なキーフレーミングを可能にするように設計されています。」

Gen-3 Alphaには、動画の最大記録時間が10秒に制限されるなど、いくつかの制限があります。しかし、Runwayの共同創設者であるアナスタシス・ゲルマニディス氏は、Gen-3は、アップグレードされたインフラストラクチャでトレーニングされた次世代モデルファミリーに登場する複数の動画生成モデルの最初のモデルであり、最小のモデルに過ぎないと明言しています。

「このモデルは複雑なキャラクターやオブジェクトのインタラクションに苦労する可能性があり、生成は必ずしも物理法則に正確に従うとは限りません」と、ゲルマニディス氏は今朝のTechCrunchのインタビューで語った。「この最初のロールアウトでは、5秒と10秒の高解像度生成をサポートし、Gen-2よりも生成時間が著しく短縮されます。5秒のクリップは45秒、10秒のクリップは90秒で生成されます。」

Gen-3 Alphaは、他の動画生成モデルと同様に、膨大な数の動画（および画像）のサンプルでトレーニングされ、これらのサンプルのパターンを「学習」して新しいクリップを生成できるようにしました。トレーニングデータはどこから来たのでしょうか？Runwayは明言しませんでした。最近では、生成AIベンダーがそのような情報を自発的に提供することはほとんどなく、その理由の一つは、トレーニングデータを競争上の優位性と見なし、それに関連する情報を秘密にしているからです。

テッククランチイベント

サンフランシスコ | 2025年10月27日～29日

「社内に研究チームがあり、すべてのトレーニングを監督しています。そして、厳選された社内データセットを使ってモデルをトレーニングしています」とゲルマニディス氏は言い、それ以上は何も言わなかった。

滑走路 Gen-3 — RunwayのGen-3モデルのサンプル。ぼやけや解像度が低いのは、Gen-3ではなく、TechCrunchが使用した動画からGIFへの変換ツールによるものです。**画像クレジット：** Runway

「アーティストと緊密に協力し、この問題に対処するための最善のアプローチを模索しています」と彼は述べた。「さらなる成長と次世代モデルの構築を目指し、様々なデータパートナーシップを模索しています。」

「新しく改良された社内ビジュアル・テキストモデレーションシステムは、自動監視機能を備えており、不適切または有害なコンテンツをフィルタリングします」とゲルマニディス氏は述べています。「C2PA認証は、すべての第3世代モデルで作成されたメディアの出所と真正性を検証します。モデルの性能と高忠実度コンテンツ生成能力が向上するにつれ、私たちは整合性と安全性の取り組みに引き続き多大な投資を行っていきます。」

Runwayはまた、「大手エンターテインメントおよびメディア企業」と提携・協力し、より「スタイル的に制御された」一貫性のあるキャラクターを実現し、「特定の芸術的および物語的要件」をターゲットとしたGen-3のカスタムバージョンを作成したことも明らかにした。同社はさらに、「これは、生成されたキャラクター、背景、および要素が、様々なシーンで一貫した外観と動作を維持できることを意味します」と付け加えている。

動画生成モデルにおける大きな未解決問題は制御、つまり、クリエイターの芸術的意図に沿った一貫性のある動画をモデルに生成させることです。同僚のデビン・コールドウェイが最近書いたように、従来の映画制作における単純な問題、例えば登場人物の服の色を選ぶといった作業でさえ、生成モデルでは各ショットが独立して作成されるため、回避策が必要になります。時には回避策でさえも効果がなく、編集者に膨大な手作業を強いることになります。

Runwayは、Google（クラウドコンピューティングのクレジットを保有）やNvidia、そしてAmplify Partners、Felicis、Coatueなどのベンチャーキャピタルなどを含む投資家から2億3,650万ドル以上を調達しています。同社は、生成AI技術への投資を拡大する中で、クリエイティブ業界と密接に連携してきました。Runwayは、エンタープライズ顧客の制作パートナーとして機能するエンターテインメント部門、Runway Studiosを運営し、AIによって全面的または部分的に制作された映画を紹介する初のイベントの一つであるAI Film Festivalを主催しています。

しかし、競争は激化しています。

ジェネレーティブAIスタートアップのLumaは先週、ミームをアニメーション化する能力で話題を呼んでいる動画ジェネレーター「Dream Machine」を発表しました。そしてわずか数ヶ月前、AdobeはAdobe Stockメディアライブラリのコンテンツを学習させた独自の動画生成モデルを開発中であることを発表しました。

他にも、OpenAIのSoraのような既存ツールがあります。Soraは依然としてアクセスが厳しく制限されていますが、OpenAIはマーケティングエージェンシーやインディーズ映画、ハリウッド映画監督にSoraの活用を促しています。（OpenAIのCTOであるミラ・ムラティは、2024年のカンヌ映画祭に出席しました。）今年のトライベッカ映画祭では、AIツールを使って制作された映画のキュレーションでRunwayと提携している監督たちが、Soraを使って制作した短編映画を早期アクセスで上映しました。

Google はまた、画像生成モデルである Veo を、ドナルド・グローバー (別名チャイルディッシュ・ガンビーノ) や彼のクリエイティブエージェンシーである Gilga など、厳選されたクリエイターに提供し、YouTube Shorts などの製品に Veo を導入する取り組みを進めている。

さまざまなコラボレーションがどのように展開するにせよ、1 つ明らかなことは、生成 AI ビデオツールが、私たちが知っている映画およびテレビ業界をひっくり返す恐れがあるということです。

映画監督のタイラー・ペリーは最近、ソラの可能性を目の当たりにした後、8億ドル規模の制作スタジオ拡張計画を中止したと発表しました。『アベンジャーズ／エンドゲーム』などのマーベル作品の監督ジョー・ルッソは、1年以内にAIが本格的な映画を制作できるようになると予測しています。

ハリウッドのアニメーターと漫画家を代表する組合であるアニメーションギルドが委託した2024年の調査によると、AIを導入した映画制作会社の75%が、AI導入後に人員削減、統合、または廃止を行ったことが明らかになりました。また、この調査では、2026年までに米国のエンターテインメント業界で10万人以上の雇用が生成型AIによって破壊されると予測されています。

動画生成ツールが他の生成 AI 技術の轍を踏んでクリエイティブな仕事の需要が急激に減少することがないよう、非常に強力な労働保護策を講じる必要がある。

Posted by Cemubo