Nvidia は世界モデル、つまり人間が自然に開発する世界のメンタルモデルからインスピレーションを得た AI モデルに参入しています。
ラスベガスで開催されたCES 2025において、NVIDIAは「物理法則を考慮した」動画を予測・生成できる世界モデル群を一般公開すると発表しました。NVIDIAはこのモデル群を「Cosmos World Foundation Models(コスモス・ワールド・ファンデーション・モデル)」、略して「Cosmos WFMs(コスモス・WFM)」と呼んでいます。
特定のアプリケーションに合わせて微調整できるモデルは、Nvidia の API および NGC カタログ、GitHub、AI 開発プラットフォーム Hugging Face から入手できます。
「NVIDIAは、物理ベースのシミュレーションと合成データ生成向けに、Cosmos WFMの第一弾を公開します」と、同社はTechCrunchに提供したブログ記事に記している。「企業規模に関わらず、研究者や開発者は、商用利用も認められているNVIDIAの寛容なオープンモデルライセンスの下で、Cosmosモデルを自由に利用できます。」

Cosmos WFM ファミリーには多数のモデルがあり、低遅延およびリアルタイム アプリケーション用の Nano、高性能ベースライン モデル用の Super、最高品質および忠実度の出力用の Ultra の 3 つのカテゴリに分かれています。
モデルのパラメータ数は40億から140億までで、Nanoが最小、Ultraが最大です。パラメータ数はモデルの問題解決能力とほぼ一致しており、パラメータ数が多いモデルはパラメータ数の少ないモデルよりも一般的に優れたパフォーマンスを発揮します。
NVIDIAはCosmos WFMの一環として、「アップサンプリングモデル」、拡張現実(AR)向けに最適化されたビデオデコーダー、責任ある利用を保証するガードレールモデル、そして自動運転車開発のためのセンサーデータ生成などのアプリケーション向けに微調整されたモデルもリリースします。NVIDIAによると、これらのモデルは他のCosmos WFMモデルと同様に、実世界の人間同士のやり取り、環境、産業、ロボット工学、運転データ2,000万時間分から得られた9,000兆トークンでトレーニングされました。(AIにおいて「トークン」とは、この場合はビデオ映像などの生データを表します。)
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
コメントを求められたNvidiaの広報担当者は、TechCrunchに対し、Cosmosは「保護された作品をコピーしたり侵害したりするようには設計されていない」と語った。
Nvidiaは、テキストやビデオフレームを与えられたCosmos WFMモデルは、ロボットや自動運転車などのモデルのトレーニングをブートストラップするための「制御可能な高品質の」合成データを生成できると主張した。

「NVIDIA Cosmosのオープンモデルスイートにより、開発者は自動運転車の走行映像や倉庫内を移動するロボットなどのデータセットを使ってWFMをカスタマイズできます」とNVIDIAはプレスリリースで述べています。「Cosmos WFMは物理AIの研究開発向けに特別に設計されており、テキスト、画像、動画、ロボットセンサーやモーションデータなどの入力データを組み合わせて物理ベースの動画を生成することができます。」
Nvidiaは、Waabi、Wayve、Foretellix、Uberなどの企業がすでに、ビデオの検索やキュレーションから自動運転車向けのAIモデルの構築まで、さまざまなユースケースでCosmos WFMの試験運用に取り組んでいると述べた。
「生成AIはモビリティの未来を牽引するでしょう。そのためには、豊富なデータと非常に強力なコンピューティング能力の両方が求められます」と、UberのCEO、ダラ・コスロシャヒ氏は声明で述べています。「NVIDIAとの協業により、業界にとって安全でスケーラブルな自動運転ソリューションの実現を加速させることができると確信しています。」
注目すべき重要な点は、Nvidiaの世界モデルは厳密な意味で「オープンソース」ではないということです。広く受け入れられている「オープンソース」AIの定義に従うためには、AIモデルは、人間がそれを「実質的に」再現し、学習データに関するあらゆる関連情報(データの出所や入手方法、ライセンス方法など)を開示できるように、その設計に関する十分な情報を提供する必要があります。
NVIDIAはCosmos WFMのトレーニングデータの詳細を公開しておらず、モデルをゼロから再作成するために必要なツールも全て公開していません。おそらくこれが、このテクノロジー大手がモデルをオープンソースではなく「オープン」と呼んでいる理由でしょう。
「ラマが企業にもたらした成果を、コスモスがロボット工学と産業用AIの世界にもたらすことを心から願っています」と、エヌビディアのジェンスン・フアンCEOは月曜日の記者会見で語った。