自動運転車メーカーはシミュレーターを用いて自動運転システムを訓練し、「エージェント」(歩行者、自転車、信号機、他の車両など)への反応方法を学習させています。真に高度な自動運転システムを実現するには、これらのエージェントが自動運転車や他の車両に対して現実的な行動と反応を示す必要があります。
インテリジェントエージェントの作成とトレーニングは、Waymoが解決に取り組んでいる課題の一つであり、自動運転研究の世界では共通の課題となっています。そこでWaymoは木曜日、自動運転研究コミュニティ向けに新たなシミュレーターを発表しました。このシミュレーターは、事前に構築されたシミュレーションエージェントとWaymoの膨大な認識データを備え、インテリジェントエージェントをトレーニングするための環境を提供します。
「従来のシミュレーターでは、エージェントが事前に定義されていることが多く、誰かがそのエージェントがどのように行動すべきかのスクリプトを書いていますが、必ずしもその通りに行動するとは限りません」と、ウェイモの研究責任者であるドラゴ・アンゲロフ氏はビデオインタビューでTechCrunchに語った。
「私たちの場合、このシミュレーターには、環境内のあらゆる人々の行動を観察する車両の大規模データセットが組み合わされています。あらゆる人々の行動を観察することで、私たちはどのように行動すべきかをどれだけ学ぶことができるでしょうか?私たちはこれを「強力な模倣コンポーネント」と呼んでおり、堅牢でスケーラブルなAVシステムを開発するための鍵となります。」
Waymo社によると、Waymaxと名付けられたこのシミュレーターは「軽量」で、研究者が迅速に反復処理を行えるように設計されているという。軽量とは、シミュレーションがリアルなエージェントや道路で完全に肉付けされていないことを意味する。むしろ、道路グラフの大まかな表現を示し、エージェントは特定の属性が組み込まれた境界ボックスとして表現される。これは基本的に、研究者がエージェントや環境の見た目ではなく、複数の道路利用者間の複雑な行動により焦点を当てることができる、よりクリーンな環境だとAnguelov氏は説明する。

このシミュレーターは現在GitHubで公開されていますが、商用利用はできません。これは、Waymoのより大規模な取り組みの一環であり、研究者がWaymo Open Datasetなどのツールにアクセスできるようにすることで、自動運転車の開発を加速させることを目的としています。
Waymoは、研究者がWaymaxを使って作成した作品を閲覧できないとしているが、だからといって、Alphabet傘下のAV企業がツールやデータを共有することで利益を得られないわけではない。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Waymoは、自動運転車に関連する問題の解決を支援するため、研究者向けのチャレンジを定期的に開催しています。2022年には、「Simulated Agents(シミュレートされたエージェント)」と呼ばれるチャレンジを開催しました。Waymoはシミュレーターにエージェントを配置し、研究者にテスト車両に対してリアルな動作をするようにエージェントを訓練する課題を与えました。チャレンジの進行中、Waymoはエージェントを訓練するための十分に堅牢な環境が整っていないことに気づきました。そこでWaymoはGoogle Researchと協力し、閉ループ方式で実行できる、つまりシステムの動作を継続的に監視・調整することで有意義な結果を生み出す、より適切な環境を共同で開発しました。
こうしてWaymoはWaymaxにたどり着いたのです。
アンゲロフ氏によると、ウェイモは来年、新しいシミュレーターを使ってこのチャレンジを再度実施する可能性が高いという。こうしたチャレンジを通して、同社は自動運転業界がマルチエージェント環境といった特定の問題においてどれほど進んでいるかを把握し、ウェイモの技術がそれらとどのように比較されるかを確認することができる。
「ウェイモオープンデータセットとこれらのシミュレーターは、学術的または研究的な議論を私たちが有望だと考える方向に導くための手段であり、人々がどのような開発をするのかを見るのが楽しみです」とアンゲロフ氏は述べ、これらのチャレンジは自動運転とロボット工学の研究分野への注目を集め、ひいては才能を引き付けることにも役立つと指摘した。
研究者はまた、ウェイマックスのシミュレーターは強化学習の改良に役立ち、自動運転システムが創発的な行動を示すことにつながる可能性があると述べた。強化学習とは、エージェントが環境と相互作用し、それぞれの行動に対する報酬またはペナルティという形でフィードバックを受け取ることで意思決定を学習する機械学習用語の一例であり、人間が世界を移動するのと似ている。エージェントの場合、例えば、シミュレーション上の歩行者は他の歩行者にぶつからないことで報酬を受け取るかもしれない。
アンゲロフ氏は、この技術が人間が必ずしも示さないような行動、例えば様々な種類の車線変更や、複数の車両が互いを自動運転車と認識すれば一貫した運転を行うといった行動につながる可能性があると述べている。その結果、より安全な自動運転が実現する可能性がある。
Waabiの新しいシミュレーターは自動運転車技術の拡大を加速させる可能性がある
レベッカ・ベランはTechCrunchのシニアレポーターであり、人工知能を形作るビジネス、政策、そして新たなトレンドを取材しています。彼女の記事はForbes、Bloomberg、The Atlantic、The Daily Beastなどの出版物にも掲載されています。
レベッカに連絡したり、レベッカからの連絡を確認するには、 [email protected]にメールを送信するか、Signal で rebeccabellan.491 に暗号化されたメッセージを送信してください。
バイオを見る