ロボットはすでにここにいる

ロボットはすでにここにいる

先週公開されたブログ記事で、Metaは「ロボットはどこにいるのか?」と問いかけています。答えは簡単です。彼らはここにいます。ただ、どこを探せばいいのかを知っておく必要があるのです。これは少しもどかしい答えです。それは私も承知しています。車や運転支援に関する議論は脇に置いて、誰もがロボットだと認める点に焦点を当てましょう。まず、あのAmazonの配達は、ロボットの支援がなければあなたのところには届きません。

もっと適切な質問はこうでしょう。「なぜロボットはもっと普及していないのか?」そしてもっと端的に言うと、「なぜ今、私の家にはもっとロボットがいないのか?」これは非常に複雑な問題で、多くのニュアンスを含んでいます。その多くは、「汎用」ロボットという概念を取り巻くハードウェアの限界という現状に起因しています。ルンバはロボットです。世界中にルンバが数多く存在するのは、ルンバが一つのことを得意としているからです(さらに10年間の研究開発により、「かなり良い」状態からさらに進化を遂げました)。

質問の前提に欠陥があるというよりは、むしろ少し捉え直すべき点です。「なぜロボットがもっと普及していないのか?」というのは、ロボット工学に詳しくない人が尋ねるのに全く正当な疑問です。長年ハードウェアに携わってきた私としては、たいていそこから答えを始めます。過去10年間、ロボットグリッパーの潜在的な問題点について議論する会話を何度も重ねてきたので、会話全体を独占できる自信があります。

Metaの見解はソフトウェアベースであり、それは当然と言えるでしょう。ここ数年、ロボット学習、導入・管理、ノーコード・ローコードソリューションといった様々な重要分野に取り組むスタートアップ企業の爆発的な増加を目の当たりにしてきました。ROSの開発、維持、そして改善に注がれてきた20年近くの研究開発に、改めて敬意を表します。長年ROSを支えてきたOpen Roboticsは、Alphabetに買収されました。Alphabetは、自社開発のIntrinsicとEveryday Robots(組織全体のリソース削減の影響を不均衡に受けたものの)を通じて、この分野で独自の取り組みを行ってきました。

Meta/Facebookも、時折、独自のスカンクワークスプロジェクトを進行中であることは間違いない。今のところ、Alphabet/Googleが長年取り組んできたプロジェクトに匹敵する規模だと示唆するものは見当たらないが、こうしたプロジェクトが姿を現すのを見るのは常に興味深い。生成AIに関する議論の急増と関連していると思われる発表の中で、このソーシャルメディア界の巨人は、「高度な感覚運動スキルを実行できる汎用的な具現化AIエージェントに向けた2つの大きな進歩」を発表した。

ここで直接引用します:

人工視覚野(VC-1):多様な感覚運動技能、環境、そして身体性をサポートする初めての単一知覚モデルです。VC-1は、Meta AIと学術パートナーが作成した画期的なEgo4Dデータセットから、人々が日常的なタスクを実行する動画を用いて学習されています。そして、VC-1は仮想環境における17種類の感覚運動タスクにおいて、既存の最高の結果と同等か、それを上回る成績を達成しました。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

適応型(感覚運動)スキルコーディネーション(ASC)と呼ばれる新しいアプローチは、物理的な環境におけるロボットの移動操作(物体への移動、物体の持ち上げ、別の場所への移動、物体の配置、この繰り返し)という困難なタスクにおいて、ほぼ完璧なパフォーマンス(98% の成功率)を実現します。

画像クレジット: Meta

間違いなく興味深い研究であり、今後、この研究をさらに掘り下げていくことができるのが楽しみです。「汎用」という言葉が最近よく使われるようになりました。ロボット工学においては常に興味深い話題ですが、テスラのロボット発表をきっかけに、汎用ヒューマノイドロボットが次々と登場しています。長年、「マスクについて何を言っても、テスラはEVへの関心を新たにした」と言われてきましたが、今の私もOptimusについてほぼ同じように感じています。Optimusは、フォームファクターに関する議論を新たにすると同時に、この技術の難しさを説明する際に明確なビジュアルを提供するという、重要な二重の役割を果たしています。人々の期待を劇的に高めつつ、同時にそれを和らげることは可能なのでしょうか?

繰り返しになりますが、これらの議論はGPTのブレークスルーすべてとうまく噛み合っています。これらはすべて非常に素晴らしいものですが、ロドニー・ブルックスは数週間前のこのニュースレターで、物事を混同することの危険性を非常にうまく指摘しています。「人々は過度に楽観的だと思います。彼らはパフォーマンスと能力を勘違いしています。人間の優れたパフォーマンスを見れば、その人が何に優れているかが分かります。私たちは人間のモデル化にかなり長けていますが、同じモデルは当てはまりません。これらのシステムの1つから素晴らしいパフォーマンスを見ても、それが隣接する空間で、あるいは異なるデータでどのように機能するかはわかりません。」

共変ロボットアーム
画像クレジット: Covariant

もちろん、ProMatで話を聞いたほとんどの人たちに、ロボット工学における生成AIの将来的な役割について意見を尋ねました。その答えは…実に多岐にわたりました。気にしない人もいれば、この技術に非常に厳格な役割を期待する人もいれば、これらすべてが将来に何を意味するかについて依然として非常に楽観的な人もいます。先週のニュースレターでは、Covariant(新たに7500万ドルを調達したばかり)のCEO、ピーター・チェン氏が、汎用AIに関して興味深い見解を示しました。

最近のChatGPTが登場する以前は、自然言語処理AIが数多く存在していました。検索、翻訳、感情検出、スパム検出など、膨大な数の自然言語AIが存在していました。GPT以前のアプローチは、ユースケースごとに、より小さなデータのサブセットを用いて、特定のAIをそのユースケース向けにトレーニングするというものでした。現在の結果を見てみると、GPTは基本的に翻訳という分野を廃止し、翻訳向けにトレーニングすらしていません。基盤モデルアプローチは、基本的に、ある状況に特化した少量のデータを用いたり、ある状況に特化したモデルをトレーニングしたりするのではなく、より多くのデータを用いて大規模な基盤汎用化モデルをトレーニングすることで、AIをより汎用化するというものです。

もちろん、Covariantは現在、ピッキングと配置に非常に注力しています。率直に言って、これは彼らを長期間夢中にさせるほど大きな課題です。しかし、このようなシステムがもたらす期待の一つは、実世界でのトレーニングです。実際にロボットを現実世界で実際に働かせている企業は、機械が周囲の世界とどのように相互作用するかに関する非常に強力なデータベースとモデルを構築しています(この点では、研究施設の壁は制限となる場合があります)。

研究者や企業が強化している、一見バラバラに見える構成要素が、いつかどれほど融合して真に汎用的なシステムを生み出すかは容易に想像できます。ハードウェアとAIがそのレベルに達すると、それらを訓練するためのフィールドデータは底なしの宝庫となるでしょう。実は、ProMatの会場でロボットの配置を少し変えてみたことがあります。市販されている技術の現状から、どれだけ近いのかを見極めようとしたのです。

当面は、プラットフォームアプローチは非常に理にかなっています。例えば、ボストン・ダイナミクスはSpotを通じて、顧客にiPhoneモデルを効果的に販売しています。まず、印象的なハードウェアの第1世代を製造します。次に、関心のある企業にSDKを提供します。計画通りに進めば、チームが想像もしなかったような機能を持つ製品が突如として完成します。(BDのガイドラインに従って)製品の背面に銃を搭載する必要がないと仮定すれば、これは非常にエキサイティングな提案です。

画像クレジット: 1X

1X TechnologiesのNEOロボットについて、同社がロボット工学と生成AIのまさに交差点で生き残りたいと考えていることは明らかだが、まだ明確なことを言うのは時期尚早だ。OpenAIという強力な味方がいることは確かだ。生成AIの巨人である同社のStartup Fundは、Tiger Globalなどを含む2,350万ドルの資金調達ラウンドを主導した。

1Xの創設者兼CEOであるベルント・オイヴィンド・ボルニッチは、「1Xは、新興技術を人々の日常生活に思慮深く統合するという私たちのミッションに共感し、OpenAIがこのラウンドをリードすることを大変嬉しく思います。投資家の皆様のご支援を得て、ロボティクス分野で大きな進歩を遂げ、世界の労働市場を拡大し続けていきます。」と述べています。

オプティマスとネオの現在の姿はこんな感じです。pic.twitter.com/JG2m9LUz3i

— ブライアン・ヒーター(@bheater)2023年4月5日

この点に関して(少なくとも私にとっては)興味深いのは、1Xが実はしばらく前から存在していたということです。このノルウェー企業は、ごく最近(ちょうど1ヶ月前)簡潔なブランド変更を行うまで、Halodiという社名でした。同社が食品サービス向けに開発していたヒューマノイド型ロボットの原型を見るには、ほんの1、2年前まで遡るだけで十分です。その技術は2021年のモデルよりも明らかに洗練されているように見えますが、車輪付きのベースは、レンダリング画像で見られるようなロボットの実現には、まだ長い道のりが残されていることを物語っています。

ちなみに、これは私だけかもしれませんが、ここでは何らかの収束進化が起こっているようです。

画像クレジット: Tesla/Figure/IX — 著者によるコラージュ

上から下まで、テスラ・オプティマス、フィギュア01、そして1X Neoのレンダリング画像です。もちろん直接のコピーではありませんが、まるでいとこ同士のように見えます。Neoはフォーマルな場でもパーカーを着ることを主張するタイプです。いいですか、私は工業デザイナーではありませんが、カウボーイハットとかはどうでしょう?

サッカーボールを持ったロボット
画像クレジット: MIT CSAIL

今週のニュースは、2つの研究プロジェクトで締めくくりましょうか?まずはMIT発の楽しいプロジェクトです。よく考えてみると、サッカーは移動能力をテストするのに最適な方法です。ロボカップが20年近くもキックを続けているのには理由があります。しかし、ドリブルボットの場合は、草、泥、砂といった不整地が課題となります。

MITのプルキット・アグラワル教授はこう語る。

今日のロボットのほとんどは車輪付きです。しかし、洪水や地震といった災害が発生したら、ロボットに人間の捜索救助を支援してもらいたいと思うでしょう。平坦でない地形を移動できる機械が必要ですが、車輪付きロボットではそのような地形を移動できません。脚付きロボットを研究する最大の目的は、現在のロボットシステムが到達できない地形に到達することです。

画像クレジット: UCLA

2つ目の研究プロジェクトは、UCLAサムエリ工学部によるもので、折り紙ロボットに関する研究成果を最近発表しました。「オリガメック」とも呼ばれる「オリガメカノボット」は、薄いポリエステル製のブロックに埋め込まれたセンサーを活用しています。主任研究員のアンクル・メータ氏は、この技術に関してかなり先進的な計画を立てています。

「自然災害や人為的災害といった、こうした危険で予測不可能なシナリオでは、折り紙ロボットが特に役立つことが証明されるかもしれません」と彼はニュースに関連した投稿で述べた。「ロボットは特殊な機能向けに設計され、需要に応じて迅速に製造できます。また、まだ遠い未来の話ですが、他の惑星には、そのようなシナリオに耐える探査ロボットが非常に望まれる環境が存在するかもしれません。」

金星の表面ほどではないが、それでも獲物を感知するハエトリグサはかなり興味深い。

求人

さあ、求人情報をまた一新してみませんか?今後も定期的に、少しずつ掲載していく予定です。掲載してもらう一番良い方法は、LinkedInで私をフォローして、私が新しい求人情報を公開したスレッドに返信することです。これは確かに最も効率的な方法ではありませんが、私にとってはうまくいっている方法なので、このまま続けていこうと思います。

今週お話ししたように、これまで取り上げられなかったものを優先的に取り上げていきます。

人間のためのロボットの仕事

脱出(14役)

Apptronik(20ロール)

器用さ(18ロール)

ジギタリス(3つの役割)

ファントムオート(21役)

サンクチュアリAI(15ロール)

スラムコア(5つの役割)

トヨタが手掛けた(4つの役割)

画像クレジット: Bryce Durbin/TechCrunch

アクチュエーターと一緒に遠い世界を探検しましょう。こちらからご登録ください。