Figureの創業者兼CEO、ブレット・アドコック氏は木曜日、ヒューマノイドロボット向けの新たな機械学習モデルを発表した。ベイエリアのロボット工学企業であるFigureがOpenAIとの提携から撤退することをアドコック氏が発表してから2週間後のこのニュースは、「ジェネラリスト」のVision-Language-Action(VLA)モデルであるHelixを中心に展開される。
VLAはロボット工学における新しい現象であり、視覚と言語コマンドを活用して情報処理を行います。現在、この分野で最もよく知られている例は、Google DeepMindのRT-2です。RT-2は、ビデオと大規模言語モデル(LLM)を組み合わせてロボットを学習します。
Helixも同様の仕組みで動作し、視覚データと言語プロンプトを組み合わせてロボットをリアルタイムで制御します。Figure誌は、「Helixは優れた物体汎化能力を示し、自然言語で尋ねるだけで、これまでのトレーニングでは見たことのない、形状、サイズ、色、材質などが異なる数千もの新しい家庭用品を拾い上げることができます」と記しています。

理想的な世界では、ロボットに何かを指示するだけで、ロボットはただそれを実行するでしょう。Figureによると、Helixはまさにそこで活躍します。このプラットフォームは、視覚と言語処理のギャップを埋めるように設計されています。自然言語の音声プロンプトを受信すると、ロボットは周囲の環境を視覚的に評価し、タスクを実行します。
図には、「クッキーの袋を右側のロボットに渡す」や「クッキーの袋を左側のロボットから受け取り、開いた引き出しに入れる」といった例が示されています。どちらの例も、2台のロボットが連携して作業を行うものです。これは、Helixが2台のロボットを同時に制御し、1台がもう1台を補助して様々な家事を行うように設計されているためです。
Figureは、同社が家庭環境においてヒューマノイドロボットO2を用いて行ってきた取り組みに焦点を当て、VLMを紹介しています。住宅は倉庫や工場のような構造や一貫性がないため、ロボットにとって非常に扱いにくい場所として知られています。
学習と制御の難しさは、複雑なロボットシステムと家庭の両立を阻む大きな障害です。これらの問題に加え、5桁から6桁の価格設定が、ほとんどのヒューマノイドロボット企業が家庭用ロボットの開発を優先していない理由です。一般的に、家庭用ロボットの開発は、まず産業顧客向けに開発し、信頼性の向上とコスト削減を図ってから取り組むのが一般的です。家事支援は、まだ数年後の課題です。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
TechCrunchが2024年にFigureのベイエリアオフィスを視察した際、アドコック氏は同社のヒューマノイドロボットが家庭環境でテストされている様子をいくつか披露した。当時、FigureはBMWなどの企業との職場実験に重点を置いていたため、この作業は優先順位が低いように見えた。

Figureは木曜日のHelix発表で、家庭環境をそれ自体が優先事項とすべきであることを明確に示しました。家庭環境は、この種のトレーニングモデルをテストするには困難で複雑な環境です。例えば、キッチンでロボットに複雑なタスクを学習させることで、ロボットは様々な環境で幅広い行動をとれるようになります。
「ロボットが家庭で役立つためには、特に見たことのない物体に対して、オンデマンドで知的な新しい行動を生成できる必要があります」とフィギュア氏は言います。「ロボットにたった一つの新しい行動を教えるだけでも、現状では相当な人間の労力が必要です。博士号レベルのエキスパートによる何時間もの手動プログラミング、あるいは何千回ものデモンストレーションが必要とされているのです。」
手動プログラミングは家庭には無理です。未知の要素が多すぎるからです。キッチン、リビング、バスルームはそれぞれ大きく異なります。調理や掃除に使う道具も同じです。さらに、人は散らかしたままにしたり、家具の配置を変えたり、様々な照明環境を好むものです。この方法は時間と費用がかかりすぎます。もっとも、Figureには後者の費用は確かに十分にあります。
もう一つの選択肢はトレーニングです。それも徹底的に。実験室で物体を拾い上げて配置するように訓練されたロボットアームは、しばしばこの手法を用いています。しかし、デモ機を非常に多様なタスクに対応できるほど堅牢なものにするには、何百時間もの反復作業が必要です。ロボットが何かを最初から正しく拾い上げるには、過去に何百回もそれを繰り返している必要があります。
ヒューマノイドロボットを取り巻く多くの分野と同様に、Helixの開発はまだ非常に初期段階にあります。この投稿でご覧いただけるような、短くて質の高い動画を制作するために、舞台裏では多くの作業が行われていることをご承知おきください。本日の発表は、本質的には、プロジェクトの成長を支えるために、より多くのエンジニアを招き入れるための採用活動と言えるでしょう。
ブライアン・ヒーターは、2025年初頭までTechCrunchのハードウェア編集者を務めていました。Engadget、PCMag、Laptop、そして編集長を務めたTech Timesなど、数々の大手テクノロジー系メディアで活躍してきました。Spin、Wired、Playboy、Entertainment Weekly、The Onion、Boing Boing、Publishers Weekly、The Daily Beastなど、様々なメディアに寄稿しています。Boing Boingのインタビューポッドキャスト「RiYL」のホストを務め、NPRのレギュラーコメンテーターとしても活躍しています。クイーンズのアパートでは、ジュニパーという名のウサギと暮らしています。
バイオを見る