パラレルドメインは、合成データなしでは自動運転はスケールしないと述べている

パラレルドメインは、合成データなしでは自動運転はスケールしないと述べている

自動運転を安全に実現するには、車両を公道に出す前に、起こり得るあらゆる状況を想定したソフトウェアのトレーニングに、ほぼ無限の時間をかける必要があります。これまで、自動運転関連企業はアルゴリズムのトレーニングに膨大な実世界データを収集してきましたが、実世界データのみでエッジケースへの対応方法をシステムにトレーニングすることは不可能です。それだけでなく、そもそも膨大なデータを収集、分類、ラベル付けするだけでも時間がかかります。

Cruise、Waymo、Waabiといった自動運転車メーカーの多くは、現実世界から収集したデータでは不可能なスピードと制御レベルで、認識モデルのトレーニングとテストに合成データを使用しています。自動運転企業向けのデータ生成プラットフォームを構築したスタートアップ企業Parallel Domainは、合成データは、視覚・認識システムを支えるAIを拡張し、現実世界の予測不可能な状況に備える上で不可欠な要素であると述べています。

このスタートアップは、March Capitalがリードし、Costanoa Ventures、Foundry Group、Calibrate Ventures、Ubiquity Venturesといったリターン投資家も参加した、3,000万ドルのシリーズB資金調達を完了したばかりです。Parallel Domainは自動車市場に注力しており、先進運転支援システム(ADAS)を開発する大手OEMや、より高度な自動運転システムを開発する自動運転企業に合成データを供給してきました。共同創業者兼CEOのケビン・マクナマラ氏によると、Parallel Domainは現在、ドローンとモバイルコンピュータービジョンへの事業拡大を目指しています。

「コンテンツ生成における生成AIアプローチにも力を入れています」とマクナマラ氏はTechCrunchに語った。「生成AIの進歩をどのように活用すれば、より多様な物、人、行動を現実世界にもたらすことができるでしょうか? 繰り返しになりますが、ここで難しいのは、物理的に正確なレンダラーができたら、車が遭遇するであろう何百万通りものシナリオを実際にどのように構築していくかということです。」

マクナマラ氏によると、このスタートアップ企業は北米、欧州、アジアで拡大する顧客基盤をサポートするチームも雇用したいと考えている。

仮想世界の構築

A sample of Parallel Domain's synthetic data
Parallel Domainの合成データのサンプル。 画像提供:  Parallel Domain

パラレルドメインは2017年に設立された当初、現実世界の地図データに基づいた仮想世界の構築に注力していました。過去5年間で、パラレルドメインは車、人、様々な時間帯、天候、そして仮想世界を面白くするあらゆる行動を仮想世界に取り込み、その世界を拡張してきました。これにより、パラレルドメインの顧客(グーグル、コンチネンタル、ウーブン・プラネット、トヨタ・リサーチ・インスティテュートなど)は、視覚・認識システムを実際に訓練・テストするために必要な動的なカメラ、レーダー、ライダーデータを生成できるとマクナマラ氏は述べています。 

Parallel Domainの合成データプラットフォームは、トレーニングとテストの2つのモードで構成されています。トレーニングでは、お客様はモデルのトレーニングに使用する高レベルのパラメータ(例えば、高速道路での走行で雨天が50%、夜間が20%、救急車が常に存在する状況など)を記述します。システムはこれらのパラメータを満たす数十万ものサンプルを生成します。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

テスト側では、Parallel Domain は、顧客が世界内の動的なオブジェクトの配置を制御できるようにする API を提供します。その後、その API をシミュレータに接続して特定のシナリオをテストできます。

例えばWaymoは、様々な気象条件をテストするために合成データを活用することに特に熱心だと、TechCrunchに語った。(免責事項:WaymoはParallel Domainの正式な顧客ではない。)Waymoは、気象を、現実世界とシミュレーションで走行したすべての距離に適用できる新たなレンズと捉えている。なぜなら、任意の気象条件でそれらの経験をすべて再現することは不可能だからだ。

テストでもトレーニングでも、Parallel Domainのソフトウェアはシミュレーションを作成するたびに、各シミュレーションエージェントに対応するラベルを自動生成します。これにより、機械学習チームは、データのラベル付けという煩雑なプロセスを経ることなく、教師あり学習とテストを行うことができます。

Parallel Domainは、自動運転関連企業がトレーニングとテストのニーズのほとんど、あるいは全てに合成データを利用する世界を構想しています。現在、合成データと実世界データの比率は企業によって異なります。マクナマラ氏によると、豊富なデータ収集の実績を持つ老舗企業は、ニーズの約20~40%に合成データを使用しています。一方、製品開発プロセスの初期段階にある企業は、80%を合成データに、20%を実世界データに依存しています。

マーチ・キャピタルのパートナーであり、現在はパラレル・ドメインの取締役の一人であるジュリア・クライン氏は、合成データが機械学習の将来において重要な役割を果たすと考えていると述べた。 

「コンピュータービジョンモデルのトレーニングに必要な現実世界のデータを入手することは、しばしば障害となり、データの取り込み、ラベル付け、そして実際に使用できる状態への準備において遅延が発生します」とクライン氏はTechCrunchに語った。「Parallel Domainでは、そのプロセスが大幅に加速され、現実世界のデータセットでは得られない可能性のある問題にも対処しています。」

レベッカ・ベランはTechCrunchのシニアレポーターであり、人工知能を形作るビジネス、政策、そして新たなトレンドを取材しています。彼女の記事はForbes、Bloomberg、The Atlantic、The Daily Beastなどの出版物にも掲載されています。

レベッカに連絡したり、レベッカからの連絡を確認するには、 [email protected]にメールを送信するか、Signal で rebeccabellan.491 に暗号化されたメッセージを送信してください。

バイオを見る