
Google DeepMindは火曜日、インターネット接続を必要とせずにロボット上でローカルにタスクを実行できる「Gemini Robotics On-Device」という新しい言語モデルをリリースした。
3月にリリースされた同社の前モデル「Gemini Robotics」をベースに、Gemini Robotics On-Deviceはロボットの動きを制御できます。開発者は自然言語プロンプトを使用して、様々なニーズに合わせてモデルを制御・微調整できます。
Googleは、ベンチマークにおいて、このモデルの性能はクラウドベースのGemini Roboticsモデルに近いレベルであると主張している。同社は、一般的なベンチマークでは他のオンデバイスモデルよりも優れていると述べているが、具体的なモデル名は明らかにしていない。

同社はデモで、このローカルモデルを実行するロボットがバッグのジッパーを開けたり、服を畳んだりする様子を披露した。Googleによると、このモデルはALOHAロボット向けに学習されたが、後に両腕のFranka FR3ロボットとApptronikのApolloヒューマノイドロボットにも適応させたという。
Google は、双腕型 Franka FR3 が、工業用ベルト上での組み立て作業など、これまで「見たことのない」シナリオや物体への対処に成功したと主張している。
Google DeepMindは、Gemini Robotics SDKもリリースしています。同社によると、開発者はMuJoCo物理シミュレータ上でこれらのモデルを使用することで、ロボットに50~100種類のタスクのデモンストレーションを見せ、新しいタスクを学習させることができるとのことです。
他のAIモデル開発者もロボティクス分野に参入しています。Nvidiaはヒューマノイド用の基礎モデルを作成するためのプラットフォームを構築しています。Hugging Faceはロボティクス向けのオープンモデルとデータセットを開発するだけでなく、ロボットの開発にも取り組んでいます。そして、Mirae Assetが支援する韓国のスタートアップ企業RLWRLDは、ロボットの基礎モデルの開発に取り組んでいます。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
トピック
IvanはTechCrunchで世界の消費者向けテクノロジーの動向をカバーしています。インドを拠点とし、以前はHuffington PostやThe Next Webなどの出版物で勤務していました。
Ivan からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal の ivan.42 に暗号化されたメッセージを送信してください。
バイオを見る