OpenAI は私に、同社の新しい AI エージェント「Operator」をテストする時間を 1 週間与えてくれました。Operator は、インターネット上で自動的にタスクを実行できるシステムです。
Operatorは、テクノロジー業界が描くAIエージェントのビジョンに最も近い存在です。AIエージェントとは、生活の退屈な部分を自動化し、私たちが本当に好きなことに時間を使えるようにするシステムです。しかし、OpenAIのエージェントを使った私の経験から判断すると、真に「自律的な」AIシステムはまだ手の届かないところにあるように思えます。
OpenAI は、GPT-4o の視覚的理解と o1 の推論機能を組み合わせた Operator を強化する新しいモデルをトレーニングしました。
このモデルは基本的なタスクにはうまく機能しているようです。Operatorがボタンをクリックしたり、ウェブサイトのメニューを操作したり、フォームに入力したりする様子を観察しました。AIは時折、自律的にアクションを実行することに成功し、AnthropicやGoogleが開発したウェブベースのエージェントよりもはるかに高速に動作しました。
しかし、試用期間中、OpenAIのエージェントを自分が望んでいた以上にサポートしていることに気づきました。Operatorに一つ一つの問題を指導しているような感覚で、特定のタスクは完全に自分の負担から外したいと思っていました。
テスト中は、何度も質問に答え、権限を付与し、個人情報を入力し、エージェントが困ったときにサポートする必要がありました。
自動車で例えると、Operator はクルーズ コントロール付きの車を運転しているようなもので、時々ペダルから足を離して車が自動運転するようなものですが、本格的な自動操縦にはほど遠いものです。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
実際、OpenAI は、Operator の頻繁な一時停止は設計によるものだと述べています。
Operatorを支えるAIは、OpenAIのChatGPTのようなチャットボットを支えるAIと同様に、長期間にわたって独立して動作することが難しく、同様の幻覚症状に陥りやすい。そのため、OpenAIはOperatorに過度の意思決定権や機密性の高いユーザー情報を与えたくないと考えている。これはOpenAIにとって安全な選択かもしれないが、Operatorの実用性は低下する。
とはいえ、OpenAIの最初のエージェントは、あらゆるウェブサイトのフロントエンドを利用できるAIの概念実証(そしてインターフェース)として、実に素晴らしいものです。しかし、真に独立したAIシステムを構築するには、テクノロジー企業は、これほど多くの操作を必要としない、より信頼性の高いAIモデルを構築する必要があります。
少し「実践的」すぎる
私の Operator トライアルは引っ越しの週と重なったため、引っ越しの手配については OpenAI のエージェントに手伝ってもらいました。
Operatorに新しい駐車許可証の購入を手伝ってほしいと頼んだところ、OpenAIの担当者が「もちろんです」と答え、私のPC画面にブラウザのウィンドウを開きました。
その後、オペレーターはブラウザでサンフランシスコの駐車許可証を検索し、正しい市の Web サイト、さらには正しいページに移動してくれました。
Operatorでは、動作中でもコンピューターの他の部分を操作できます。これはGoogleのProject Marinerでは不可能です。これは、OpenAIのエージェントが実際にはコンピューター上で動作しているのではなく、どこかのクラウド上で動作しているからです。

駐車許可証を取得するために、Operatorに様々なプロセスを開始する許可を何度も与えなければなりませんでした。また、氏名、電話番号、メールアドレスなどの個人情報を入力するフォームの入力を求める際にも停止してしまいました。Operatorが途中で途切れてしまうこともあり、ブラウザを操作してエージェントを元の状態に戻さざるを得ないこともありました。
別のテストでは、Operatorにギリシャ料理のレストランを予約してもらいました。Operatorは、私の住んでいる地域で手頃な価格の素敵なレストランを見つけてくれました。しかし、フロー全体を通して6つ以上の質問に答えなければなりませんでした。

AIエージェントを通して予約をするだけで6回以上も介入しなければならないのに、一体どこまで自分でやった方が楽なのでしょうか?Operatorのテスト中に、私は何度もこの疑問を自問しました。
エージェント・アズ・ア・プラットフォーム
いくつかのテストで、何らかの理由でOperatorをブロックするウェブサイトに遭遇しました。例えば、TaskRabbitを使って電気技師を予約しようとしたところ、OpenAIのエージェントからエラーが発生したというメッセージが表示され、代わりに別のサービスを利用できるか尋ねられました。Expedia、Reddit、YouTubeも、AIエージェントによるプラットフォームへのアクセスをブロックしました。
しかし、他のサービスもOperatorを積極的に採用しています。Instacart、Uber、eBayはOpenAIと提携してOperatorを立ち上げ、人間に代わってエージェントがウェブサイトを操作できるようにしました。
これらの企業は、ユーザーインタラクションのサブセットが AI エージェントによって促進される未来に備えています。
「お客様は様々なエントリーポイントを通じてInstacartを利用しています」と、Instacartの最高製品責任者であるダニエル・ダンカー氏はTechCrunchのインタビューで述べた。「Operatorは、そうしたエントリーポイントの一つになる可能性があると考えています。」
OpenAIのエージェントが個人に代わってInstacartのウェブサイトを利用できるようにすることは、Instacartと顧客を切り離してしまうように思える。しかし、ダンカー氏は、Instacartは顧客がどこにいても対応したいと考えていると述べている。
「我々はOpenAIと同様に、エージェントシステムが消費者のデジタル資産との関わり方に大きな影響を与えるだろうと確信しており、非常に自信を持っている」とeBayの最高AI責任者、ニッツァン・メケル・ボブロフ氏はTechCrunchとのインタビューで語った。
AIエージェントの人気が高まったとしても、Mekel-Bobrov氏は、ユーザーは必ずeBayのウェブサイトを訪れるだろうと予想しており、「オンラインの目的地はどこにもなくなることはない」と指摘している。
信頼の問題
Operator が数回幻覚を起こして、危うく数百ドルの損害を被るところだったため、Operator を信頼できなくなりました。
例えば、私は不動産会社に新しいアパートの近くに駐車場を探してほしいと頼みました。結局、歩いて数分で行ける駐車場を2つ提案されました。

予算をはるかに超えていた上に、ガレージはアパートからかなり遠かったんです。一つは徒歩20分、もう一つは徒歩30分もかかりました。結局、オペレーターが間違った住所を入力していたことが判明しました。
OpenAIがエージェントにクレジットカード番号、パスワード、メールへのアクセスを提供しないのはまさにこのためです。もしOpenAIがここで私に介入させなかったら、Operatorは私が必要としない駐車場に何百ドルも無駄にしていたでしょう。
このような幻覚は、実際に有用な自律エージェント、つまり面倒なタスクを肩代わりしてくれるエージェントにとって、大きな障害となります。基本的なミス、特に現実世界に影響を与えるミスを犯しやすいエージェントを信頼する人はいないでしょう。
OpenAIはOperatorによって、AIシステムがウェブを閲覧するための素晴らしいツールを開発したようだ。しかし、基盤となるAIがユーザーの指示を確実に実行できるようになるまでは、これらのツールは大した役には立たないだろう。それまでは、人間はエージェントを支援することしかできず、その逆はあり得ない。それでは、本来の目的が達成されない。
TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください。