Googleの卓球ロボットが340ヒットのラリーを制す様子をご覧ください

Googleの卓球ロボットが340ヒットのラリーを制す様子をご覧ください
卓球をするロボット
画像クレジット: Google

あらゆるボードゲームでAIが人類を(今のところは比喩的に)圧倒しているだけでは物足りないかのように、Google AIは卓球でも人類を圧倒するAIを開発しました。今のところは「協力的」だと強調されていますが、この進歩のペースでいけば、あっという間にプロを圧倒するようになるかもしれません。

「i-Sim2Real」と呼ばれるこのプロジェクトは、単に卓球をテーマとしているのではなく、むしろ、人間の速いペースで比較的予測不可能な行動に対応し、それを取り囲むロボットシステムの構築を目指しています。卓球は、バスケットボールやクリケットとは異なり、制約がかなり厳しく、複雑さとシンプルさのバランスが取れているという利点があります。

「Sim2Real」とは、機械学習モデルに仮想環境やシミュレーションで動作を学習させ、その知識を現実世界に適用するAI作成プロセスを指す。これは、動作するモデルに到達するまでに何年もの試行錯誤が必要となる場合に必要となる。シミュレーションでこれを行うことで、何年もかかるリアルタイムトレーニングを数分または数時間で実行できる。

しかし、シミュレーションで何かが常に可能とは限りません。例えば、ロボットが人間とインタラクトする必要がある場合はどうでしょうか?これはシミュレーションがそれほど簡単ではないため、まず現実世界のデータが必要になります。結局、鶏が先か卵が先かという問題に陥ってしまいます。つまり、人間とインタラクトするロボットを作成し、そのデータを生成するためには人間のデータが必要なため、人間のデータがないのです。

Google の研究者たちは、シンプルなところから始めてフィードバック ループを作ることでこの落とし穴を回避しました。

[i-Sim2Real]は、人間の行動に関するシンプルなモデルを大まかな出発点として用い、シミュレーションでの訓練と現実世界への展開を交互に行います。各反復において、人間の行動モデルとポリシーの両方が改良されます。

ロボットもまだ学習を始めたばかりなので、人間の行動をあまり正確に再現できなくても大丈夫です。ゲームを重ねるごとに実際の人間のデータが蓄積され、精度が向上し、AIの学習が促進されます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

このアプローチは見事に成功し、チームの卓球ロボットは340人の選手を相手にラリーを繰り広げることができました。ぜひご覧ください。

また、ボールを別の領域に返すことも可能です。数学的精度で正確に返すことはできませんが、戦略を実行するのに十分な精度です。

研究チームは、より目標指向的な行動、例えば様々な位置から特定の場所にボールを返すといった行動についても、異なるアプローチを試みた。繰り返しになるが、これは究極の卓球マシンを作ることではない(とはいえ、そうなる可能性は高いが)。同じ行動を何千回も繰り返さなくても、人間とのインタラクションを効率的に訓練する方法を見つけることが目的だ。

Google チームが採用した手法の詳細については、以下の概要ビデオをご覧ください。

トピック

デヴィン・コールドウェイはシアトルを拠点とする作家兼写真家です。

彼の個人ウェブサイトは coldewey.cc です。

バイオを見る