VFXアーティストは、ハリウッドがAIを搾取ではなく創造に活用できることを示す

VFXアーティストは、ハリウッドがAIを搾取ではなく創造に活用できることを示す

ハリウッドはAIをめぐる労働争議に巻き込まれているかもしれないが、この技術は遥か昔から映画やテレビに浸透していた。ロサンゼルスで開催されたSIGGRAPHでは、アルゴリズムや生成ツールが数え切れないほどの講演や発表で披露された。GPT-4やStable Diffusionのような技術がどのような位置づけになるかはまだ不明だが、制作のクリエイティブな側面は、アーティストに取って代わるのではなく、アーティストの能力を拡張する形で実現できるのであれば、それらを受け入れる準備ができている。

SIGGRAPH は映画やテレビの制作に関するカンファレンスではなく、コンピュータ グラフィックスと視覚効果に関するカンファレンス (50 年の歴史があります!) であり、近年、トピックは必然的に重複するようになりました。

今年は、ストライキが大きな問題となり、プレゼンテーションや講演ではほとんど取り上げられませんでした。しかし、アフターパーティーやネットワーキングイベントでは、ほぼ全員が真っ先にストライキについて触れていました。とはいえ、SIGGRAPHは技術とクリエイティブの才能を結集するカンファレンスであり、私が感じた雰囲気は「大変だけど、その間も技術の向上を続けよう」というものでした。

制作現場におけるAIへの懸念は、幻想とまでは言わないまでも、確かに少々誤解を招くものです。画像やテキストモデルといった生成AIは飛躍的に進歩しており、脚本家やアーティストの仕事を代替してしまうのではないかという懸念が生じています。確かに、スタジオの幹部たちは、AIツールによって脚本家や俳優の一部を代替するという、有害かつ非現実的な希望を口にしています。しかし、AIは映画やテレビの世界にかなり前から存在し、アーティスト主導の重要なタスクを担ってきました。

数多くのパネル、技術論文発表、インタビューで、この傾向が見受けられました。もちろん、VFXにおけるAIの歴史を知るのも興味深いでしょうが、今回は、様々な形態のAIがエフェクトや制作の最先端でどのように活用されてきたかをご紹介します。

ピクサーのアーティストが機械学習とシミュレーションを活用

初期の事例の一つは、ピクサーが最新作『エレメンタル』で使用したアニメーション技術に関する2つのプレゼンテーションでした。この映画の登場人物は他の作品よりも抽象的で、火、水、空気でできた人物を作るのは容易ではありません。これらの物質のフラクタル的な複雑さを、見た目はそのままに、明確な動きと表現力を持つ身体へと昇華させる様子を想像してみてください。

アニメーターやエフェクトコーディネーターが次々と説明するように、プロシージャル生成はプロセスの核心であり、数十体のキャラクターを構成する炎や波、蒸気をシミュレートし、パラメータ化する役割を果たしていました。キャラクターから漂う炎や雲の細かな一筋一筋を手作業で彫刻し、アニメーション化することは、決して選択肢ではありませんでした。それは非常に退屈で、労働集約的で、創造的な作業というよりは技術的な作業になるからです。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

しかし、プレゼンテーションで明らかになったように、彼らは望ましい効果を生み出すためにシミュレーションと高度なマテリアルシェーダーに大きく依存していたものの、アートチームとプロセスはエンジニアリング側と深く絡み合っていました。(この目的のために、ETHチューリッヒの研究者とも協力しました。)

一例として、メインキャラクターの一人である炎でできたエンバーの全体的な見た目が挙げられます。炎をシミュレートしたり、色を微調整したり、多数のダイヤルを調整したりするだけでは、結果に影響を与えるには不十分でした。最終的に、炎は現実の炎の見え方だけでなく、アーティストが望む外観を反映する必要がありました。そこで彼らは「ボリューメトリック・ニューラル・スタイル・トランスファー(NST)」を採用しました。スタイル・トランスファーとは、例えば自撮り写真をエドヴァルド・ムンク風の画風に変えたりすることで、多くの人が経験したことがある機械学習技術です。

このケースでは、チームは「パイロシミュレーション」、つまり生成された炎の生のボクセルを、アーティストがキャラクターの炎に望む表現(より様式化され、シミュレーション的ではない)に基づいてトレーニングされたスタイル転送ネットワークに通しました。結果として得られたボクセルは、シミュレーションのような自然で予測不可能な外観でありながら、アーティストの選択による紛れもない特徴も備えています。

NSTがエンバーの炎にスタイルを加えている様子を簡略化した例。画像クレジット:ピクサー

もちろん、アニメーターたちは、AI を使って映画を制作したという考えに敏感ですが、実際はそうではありません。

「ピクサーが『エレメンタル』の制作にAIを使ったと言う人がいたら、それは間違いです」と、ピクサーのポール・カニューク氏はプレゼンテーション中に強調した。「エレメンタルのシルエットのエッジを形作るのには、ボリューメトリックNSTを使いました」

(誤解のないよう申し上げますが、NST は AI の範疇に入る機械学習技術ですが、Kanyuk 氏が指摘したかったのは、芸術的な成果を達成するためのツールとして使用されたということであり、単に「AI で作られた」ものなど何もありませんでした。)

その後、アニメーションチームとデザインチームの他のメンバーが、プロシージャルツール、ジェネレーティブツール、スタイルトランスファーツールなどを用いて、アーティストのパレットやムードボードに合わせて風景の色を変更したり、「ヒーロー」となる手描きの建物を変形させたユニークな建物で街区を埋めたりする手法について説明しました。AIとAI関連ツールは、アーティストの目的を達成するために存在し、面倒な手作業をスピードアップし、望ましい外観とのより良好な一致を実現しているという明確なテーマが示されました。

AIが対話を加速する

DNEGがアニメーション化した「ニモナ」の画像。画像クレジット: DNEG

DNEGのシニアAI研究者、マルティーヌ・ベルトラン氏からも同様の意見を聞きました。DNEGは、最近制作したVFX・ポストプロダクションチームで、素晴らしいビジュアルを誇る『ニモナ』のアニメーションを手がけました。彼女は、既存のエフェクトや制作パイプラインの多くは、特にルックデベロップメントと環境デザインにおいて、非常に手間がかかると説明しました。(DNEGはこれらのトピックに触れた「プロシージャルとパフォーマンスの接点」というプレゼンテーションも行いました。)

「制作プロセスで膨大な時間が無駄になっていることに、人々は気づいていません」とベルトランは語った。監督と協力してショットの適切なルックを見つける作業は、1回の試行で数週間かかることもあり、その間、コミュニケーションが不足していたり​​、不十分だったりすると、その数週間分の作業が無駄になってしまうことも少なくない。「これは非常にフラストレーションが溜まる作業です」と彼女は続け、AIはこうしたプロセスや、最終製品とは程遠く、あくまでも探索的で大まかな段階のプロセスを加速させる優れた方法だと説明した。

AIを活用してアーティストの作業効率を高めることで、「クリエイターと監督の間の対話が可能になる」と彼女は述べた。エイリアンのジャングルは確かにそうだが、こんな感じだろうか? それともこんな感じだろうか? 神秘的な洞窟はこんな感じだろうか? それともこんな感じだろうか? ニモナのような、クリエイター主導で視覚的に複雑なストーリーでは、迅速なフィードバックを得ることが特に重要だ。監督が1週間後に却下するようなルックをレンダリングするのに1週間を無駄にするのは、制作の深刻な遅延につながる。

実際、SokrispyのCEO、サム・ウィッカート氏が講演で説明したように、プリビズのような初期のクリエイティブ作業において、新たなレベルのコラボレーションとインタラクションが実現されています。同社はHBOの「The Last of Us」の冒頭で、アウトブレイクのシーンのプリビズを担当しました。このシーンは、車内で無数のエキストラ、カメラワーク、特殊効果を伴う複雑な「ワンシーン」です。

より現実的なシーンでは AI の使用は限られていましたが、音声合成、手続き型環境生成、その他のツールの改善が、このますます技術志向のプロセスにどのように貢献できるか、また実際に貢献したかは容易にわかります。

Wonder Studioによって生成された最終ショット、モーションキャプチャデータ、マスク、3D環境。画像クレジット: Wonder Studio

数々の基調講演やプレゼンテーションで引用されたWonder Dynamicsは、アーティストの完全なコントロール下で制作に機械学習プロセスを活用する新たな事例を提供しています。高度なシーンおよびオブジェクト認識モデルは、通常の映像を解析し、人間の俳優を瞬時に3Dモデルに置き換えます。これはかつては数週間から数ヶ月かかっていたプロセスです。

ワンダーダイナミクスは、ウェブプラットフォームにフルサービスのCGキャラクタースタジオを導入しました。

しかし、数ヶ月前に彼らが私に話してくれたように、自動化されているのはクリエイティブな作業ではなく、クリエイティブな判断をほとんど伴わない、骨の折れる機械的な(時にはロト的な)作業なのだ。「これは彼らの仕事を妨げるものではありません。客観的なVFX作業の80~90%を自動化し、彼らには主観的な作業を残すのです」と共同創業者のニコラ・トドロヴィッチ氏は当時語っていた。私はSIGGRAPHで彼と共同創業者で俳優のタイ・シェリダン氏に会ったが、彼らは街の人気者であることを楽しんでいた。業界が何年も前に彼らが始めた方向へと進んでいることは明らかだった。(ちなみに、9月に開催されるTechCrunch DisruptのAIステージでシェリダン氏に会いに来てください。)

とはいえ、ストライキ中の脚本家や俳優たちの警告は、VFX業界によって決して無視されているわけではない。実際、彼らもそれに同調しており、彼らの懸念は似通っている――たとえそこまで実存的ではないとしても。俳優にとって、肖像や演技(あるいは脚本家にとって、想像力や声)は生活の糧であり、それが盗用され、完全に自動化されるという脅威は、恐ろしいものだ。

制作プロセスの他の段階にいるアーティストにとっても、自動化の脅威は現実のものであり、これはテクノロジーの問題というよりもむしろ人の問題です。私が話を聞いた多くの人々は、情報に乏しいリーダーによる誤った判断こそが真の問題であることに同意しました。

「AIは非常に賢そうに見えるので、意思決定プロセスを機械に委ねてしまうかもしれません」とベルトラン氏は述べた。「そして、人間が責任を機械に委ねてしまうと、恐ろしい事態に陥るのです。」

AIを活用してクリエイティブプロセスを強化または効率化できれば、例えば反復的な作業にかかる時間を削減したり、チームや予算の少ないクリエイターがリソースに恵まれたクリエイターに匹敵する成果を上げられるようにしたりすれば、変革をもたらす可能性があります。しかし、一部のエグゼクティブが熱心に検討しているように、クリエイティブプロセスがAIに委ねられるとしたら、ハリウッドに既に浸透しているテクノロジーにもかかわらず、ストライキは始まったばかりでしょう。