
OpenAI は、自律的に Web を閲覧し、クラウドでホストされる仮想マシン内の特定のソフトウェアを使用してユーザーの要求を満たす AI エージェントである Operator を動かす AI モデルを更新しています。
Operatorはまもなく、OpenAIのoシリーズの「推論」モデルの最新版の一つであるo3をベースにしたモデルを使用する予定です。以前は、OperatorはGPT-4oのカスタムバージョンを使用していました。
多くのベンチマークによれば、o3 は、特に数学や推論を伴うタスクにおいては、はるかに高度なモデルです。
OpenAIはブログ投稿で、「Operatorの既存のGPT-4oベースモデルをOpenAI o3ベースのバージョンに置き換えます。(Operatorの)APIバージョンは引き続き4oベースのままです。」と述べています。
Operatorは、ここ数ヶ月でAI企業がリリースした数多くのエージェントツールの一つです。企業は、ほぼ監督なしで確実にタスクを遂行できる高度なエージェントの開発に競い合っています。
Googleは、Gemini APIを通じて「コンピュータ使用」エージェントを提供しており、同様にウェブを閲覧し、ユーザーに代わって操作を実行できます。また、より消費者向けのMarinerも提供しています。Anthropicのモデルは、ファイルの閲覧やウェブページのナビゲーションといったコンピュータタスクも実行できます。
OpenAIによると、o3 Operatorと呼ばれる新しいOperatorモデルは、「確認と拒否に関する[OpenAIの]決定の境界をモデルに教える」ために設計されたデータセットを含む「コンピューター使用のための追加の安全性データで微調整」されたという。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
OpenAIは、o3 Operatorの特定の安全性評価におけるパフォーマンスを示す技術レポートを公開しました。技術レポートによると、o3 OperatorはGPT-4o Operatorモデルと比較して、「違法」な活動や機密性の高い個人データの検索を拒否する可能性が低く、プロンプトインジェクションと呼ばれるAI攻撃の影響を受けにくいことが示されています。
「o3 Operatorは、Operatorの4oバージョンで使用したのと同じ多層的な安全性アプローチを採用しています」とOpenAIはブログ投稿で述べています。「o3 Operatorはo3のコーディング機能を継承していますが、コーディング環境やターミナルへのネイティブアクセスは提供していません。」
トピック
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る