Google、ロボットでローカルに実行できる新しいGeminiモデルを発表

Google、ロボットでローカルに実行できる新しいGeminiモデルを発表
3Dレンダリング、ロボットハンドによる立方体の組み立て
画像クレジット: Westend61 / Getty Images

Google DeepMindは火曜日、インターネット接続を必要とせずにロボット上でローカルにタスクを実行できる「Gemini Robotics On-Device」という新しい言語モデルをリリースした。

3月にリリースされた同社の前モデル「Gemini Robotics」をベースに、Gemini Robotics On-Deviceはロボットの動きを制御できます。開発者は自然言語プロンプトを使用して、様々なニーズに合わせてモデルを制御・微調整できます。

Googleは、ベンチマークにおいて、このモデルの性能はクラウドベースのGemini Roboticsモデルに近いレベルであると主張している。同社は、一般的なベンチマークでは他のオンデバイスモデルよりも優れていると述べているが、具体的なモデル名は明らかにしていない。

画像クレジット: Google

同社はデモで、このローカルモデルを実行するロボットがバッグのジッパーを開けたり、服を畳んだりする様子を披露した。Googleによると、このモデルはALOHAロボット向けに学習されたが、後に両腕のFranka FR3ロボットとApptronikのApolloヒューマノイドロボットにも適応させたという。

Google は、双腕型 Franka FR3 が、工業用ベルト上での組み立て作業など、これまで「見たことのない」シナリオや物体への対処に成功したと主張している。

Google DeepMindは、Gemini Robotics SDKもリリースしています。同社によると、開発者はMuJoCo物理シミュレータ上でこれらのモデルを使用することで、ロボットに50~100種類のタスクのデモンストレーションを見せ、新しいタスクを学習させることができるとのことです。 

他のAIモデル開発者もロボティクス分野に参入しています。Nvidiaはヒューマノイド用の基礎モデルを作成するためのプラットフォームを構築しています。Hugging Faceはロボティクス向けのオープンモデルとデータセットを開発するだけでなく、ロボットの開発にも取り組んでいます。そして、Mirae Assetが支援する韓国のスタートアップ企業RLWRLDは、ロボットの基礎モデルの開発に取り組んでいます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

トピック

IvanはTechCrunchで世界の消費者向けテクノロジーの動向をカバーしています。インドを拠点とし、以前はHuffington PostやThe Next Webなどの出版物で勤務していました。

Ivan からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal の ivan.42 に暗号化されたメッセージを送信してください。

バイオを見る