つまずきにくいロボットが困難な地形にリアルタイムで適応

つまずきにくいロボットが困難な地形にリアルタイムで適応

ロボットは即興で行動するのが難しく、通常とは異なる路面や障害物に遭遇すると、通常は急停止または激しく転倒することになります。しかし、研究者たちは、あらゆる地形にリアルタイムで適応し、砂、岩、階段などの急激な変化に遭遇しても、その場で歩容を変えて移動を続けるロボット移動の新しいモデルを開発しました。

ロボットの動きは多様かつ正確で、階段の登り方や荒れた地形の横断などを「学習」できますが、これらの動作は、ロボットが個別に訓練したスキルを切り替えて動作させるようなものです。Spotのようなロボットは、押されたり蹴られたりしても跳ね返って元に戻ることで有名ですが、実際には、システムは歩行という一貫した方針を維持しながら、物理的な異常を修正しようとしているだけです。適応的な動作モデルはいくつかありますが、非常に特殊なもの(例えば、実際の昆虫の動きに基づいたモデル)もあれば、効果を発揮するまでに時間がかかるものもあり、ロボットは効果を発揮するまでに確実に転倒してしまいます。

Facebook AI、カリフォルニア大学バークレー校、カーネギーメロン大学の研究チームは、これを「急速運動適応」と呼んでいます。これは、人間や他の動物が様々な状況に合わせて、素早く、効果的に、そして無意識のうちに歩き方を変えることができるという事実に由来しています。

「例えば、歩くことを覚えて初めてビーチに行くとします。足が沈み込み、引き抜くにはより力を入れなければなりません。奇妙な感覚ですが、数歩も歩けば、硬い地面の上を歩くのと同じように自然に歩けるようになります。その秘密は何でしょうか?」と、Facebook AIとカリフォルニア大学バークレー校に所属する上級研究員、ジテンドラ・マリク氏は問いかけました。

確かに、これまで一度もビーチに行ったことがないなら、いや、たとえ後になってビーチを訪れたとしても、柔らかい地面の上を歩けるような特別な「砂モード」に入るわけではありません。動きを変える方法は、外部環境を実際に理解することなく、自動的に行われます。

このロボット虫は本物の昆虫のように即興で歩くことができる

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

シミュレーション環境の可視化。もちろん、ロボットはこれを視覚的に認識することはできない。画像クレジット:バークレーAI研究所、Facebook AI研究所、CMU

「身体は、様々な身体的条件が身体に及ぼす様々な影響を感知することで、その条件に反応しているのです」とマリク氏は説明した。RMAシステムも同様の仕組みで機能する。「新しい条件で歩くとき、非常に短い時間、つまり0.5秒かそれ以下で、十分な計測値が得られ、それらの条件がどのようなものか推測し、歩行方針を修正するのです。」

システムは完全にシミュレーションでトレーニングされ、現実世界の仮想バージョンで、ロボットの小さな頭脳(すべてはオンボードの限られた計算ユニット上でローカルに実行されます)が、(仮想)関節、加速度計、その他の物理センサーから送られてくるデータを即座に観察して反応することで、最小限のエネルギーで前進を最大化し、転倒を回避することを学習しました。

RMAアプローチの完全な内在性を強調するために、マリク氏はロボットが視覚入力を一切使用していないことを指摘する。しかし、視覚を持たない人間や動物が問題なく歩行できるのであれば、ロボットが歩行できない理由はないだろう。しかし、歩行する砂や岩の正確な摩擦係数といった「外的要因」を推定することは不可能であるため、ロボットは単に自分自身を注意深く監視しているだけである。

「私たちは砂について学ぶのではなく、足が沈むことについて学ぶのです」と、同じくバークレー出身の共著者アシシュ・クマール氏は語った。

最終的に、このシステムは2つの部分から構成されます。ロボットの歩行を実際に制御する常時実行のメインアルゴリズムと、ロボットの内部計測値の変化を監視する適応アルゴリズムです。重要な変化が検出されると、適応アルゴリズムはそれを分析し、「脚はこう動くべきなのに、こう動いている。つまり、状況はこうなっている」といった具合に、メインモデルに自己調整方法を指示します。その後、ロボットはこれらの新しい条件下でどのように前進するかのみを考え、事実上、特化した歩行を即興で実現します。

ロボットがさまざまな硬い表面を横断しても落ちない映像。
画像クレジット:バークレーAIリサーチ、Facebook AIリサーチ、CMU

ニュースリリースにあるように、シミュレーションで訓練した後、現実世界で見事に成功した。

ロボットは、砂、泥、ハイキングコース、背の高い草、土の山の上を、すべての試験において一度も失敗することなく歩行することができました。ハイキングコースの階段を下りる試験では、70%の試験で成功しました。訓練中に不安定な地面や沈下する地面、邪魔になる植生、階段を目にしたことがなかったにもかかわらず、セメントの山と小石の山の上を80%の試験でうまく移動しました。また、体重の100%に相当する12kgのペイロードを積載した状態で移動した際も、高い成功率で高さを維持しました。

こうした状況の多くの例は、こちらのビデオまたは(ごく簡単に)上記の GIF でご覧いただけます。

ディズニー・イマジニアリングのプロジェクト・キウイは、グルートの存在を信じさせてくれる自由歩行ロボットだ。

マリク氏は、ニューヨーク大学カレン・アドルフ教授の研究に賛同した。アドルフ教授の研究は、人間の歩行学習プロセスがいかに適応性が高く自由度が高いかを示している。研究チームの直感は、あらゆる状況に対応できるロボットを作るには、多様なモードから選択するのではなく、ゼロから適応を学習する必要があるというものだった。

すべてのオブジェクトとインタラクションを徹底的にラベル付けして文書化することで、よりスマートなコンピューター ビジョン システムを構築することはできないのと同様 (常に増え続ける)、砂利、泥、瓦礫、濡れた木材などの上を歩くための 10、100、あるいは数千もの特殊なパラメータを持つロボットを、多様で複雑な物理世界に向けて準備することはできません。さらに言えば、前進動作という一般的な概念以外は何も指定したくないかもしれません。

「ロボットの脚に関するアイデアや形態については、事前にプログラムしていません」とクマール氏は語った。

これは、システムの基礎(最終的に四足歩行に適応した完全に訓練されたシステムではない)が、他の脚付きロボットだけでなく、AIとロボット工学のまったく異なる領域にも適用できる可能性があることを意味します。

「ロボットの脚は手の指に似ています。脚が環境と相互作用し、指が物体と相互作用するのと同じです」と、カーネギーメロン大学の共著者であるディーパック・パタック氏は指摘する。「基本的な考え方はどんなロボットにも応用できます。」

さらにマリク氏は、基本アルゴリズムと適応アルゴリズムの組み合わせは他のインテリジェントシステムにも応用できる可能性があると示唆した。スマートホームや自治体のシステムは既存のポリシーに依存する傾向があるが、もしそれらが臨機応変に適応できたらどうなるだろうか?

研究チームは現時点では、Robotics: Science and Systems会議で論文を発表するにとどまっており、今後多くの追加研究が必要であることを認めています。例えば、即興歩行を一種の「中期」記憶として内部ライブラリに構築したり、視覚を用いて新しい移動スタイルを開始する必要性を予測したりすることなどが挙げられます。しかし、RMAアプローチは、ロボット工学における永続的な課題に対する有望な新しいアプローチであると考えられます。

ロボットスタートアップのための資金調達の5つの必須事項