Hugging FaceがオペレーターのようなエージェントAIツールを無料でリリース

Hugging FaceがオペレーターのようなエージェントAIツールを無料でリリース
ハグフェイスロゴ
画像クレジット: Hugging Face

Hugging Faceのチームは、クラウドホスト型のコンピューターを使ったAI「エージェント」を無料で公開しました。ただし、動作がかなり遅く、時々ミスをするので注意が必要です。

Hugging Faceのエージェント「Open Computer Agent」はウェブ経由でアクセスでき、Firefoxを含む複数のアプリケーションがプリインストールされたLinux仮想マシンを利用できます。OpenAIのOperatorと同様に、Open Computer Agentにタスク(例えば「Googleマップを使ってパリのHugging Face本社を見つける」など)を実行させると、エージェントが必要なプログラムを起動して必要な手順を学習するので、あとは待つだけです。

Open Computer Agentは単純なリクエストは問題なく処理できます。しかし、TechCrunchのテストでは、フライト検索のような複雑なリクエストはうまく処理できませんでした。また、Open Computer AgentはCAPTCHAテストに遭遇し、解読できないこともよくあります。

また、Open Computer Agent を使用するには、仮想キューで待機する必要があります。このキューの長さは需要に応じて数秒から数分です。

smolagentsでコンピューター使用を開始します!🥳

-> ビジョンモデルの性能が向上するにつれて、複雑なエージェントワークフローを駆動できるようになります。特にQwen-VLモデルは、組み込みのグラウンディング、つまり画像内の任意の要素を座標で特定する機能をサポートしており、これにより… pic.twitter.com/mI8MuWZkIS

— m_ric (@AymericRoucher) 2025年5月6日

もちろん、Hugging Faceチームの目標は最先端のコンピューターエージェントを構築することではありませんでした。むしろ、オープンAIモデルの性能が向上し、クラウドインフラ上での実行コストが削減されていることを実証したかったのです。

「ビジョンモデルの能力が向上するにつれて、複雑なエージェントワークフローを強化できるようになります」と、Hugging Face のエージェントチームのメンバーである Aymeric Roucher 氏は X の投稿で述べています。「[これらのモデルの一部は]組み込みのグラウンディング、つまり画像内の任意の要素をその座標で見つける機能をサポートしているため、[仮想マシン内の]任意のアイテムをクリックできます。」

エージェント技術は完璧とは程遠いものの、企業が生産性向上のために導入を検討していることから、投資は増加傾向にあります。KPMGの最近の調査によると、65%の企業がAIエージェントの導入を試みています。Markets and Marketsは、AIエージェント市場が2025年の78億4,000万ドルから2030年には526億2,000万ドルに成長すると予測しています。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

トピック

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る