GoogleがProject Marinerを発表:あなたに代わってウェブを利用するAIエージェント

GoogleがProject Marinerを発表:あなたに代わってウェブを利用するAIエージェント

Googleは水曜日、ウェブ上でアクションを実行できる初のAIエージェントを公開した。これは、同社のDeepMind部門が開発した研究用プロトタイプ「Project Mariner」である。Geminiを搭載したこのエージェントは、Chromeブラウザを制御し、画面上のカーソルを動かし、ボタンをクリックしたり、フォームに入力したりすることで、人間とほぼ同様にウェブサイトを操作・閲覧できる。

Google によれば、同社はまず水曜日に、事前に選ばれた少数のテスト参加者に AI エージェントをリリースする。

Googleは、Geminiがウェブサイトを読み、要約し、そして今ではウェブサイトを利用するための新しい方法を模索し続けています。Google幹部はTechCrunchに対し、これは「根本的に新しいUXパラダイムシフト」の一環だと語っています。つまり、ユーザーがウェブサイトと直接やり取りするのではなく、代わりにそれを実行する生成AIシステムとやり取りするようになるということです。

プロジェクト・マリナーの初見映像。画像クレジット: Google

こうした変化は、TechCrunchのような出版社からWalmartのような小売業者まで、これまでは実際のユーザーに自社のウェブサイトを訪問して利用してもらうためにGoogleに依存してきた数百万の企業に影響を及ぼす可能性がある。

TechCrunch とのデモで、Google Labs ディレクターの Jaclyn Konzelmann 氏が Project Mariner の仕組みを披露しました。

Chromeの拡張機能を使ってAIエージェントを設定すると、ブラウザの右側にチャットウィンドウがポップアップ表示されます。「このリストに基づいて食料品店のショッピングカートを作成してください」といった指示をエージェントに与えることができます。

Project Marinerの使用時の様子です。画像クレジット: Google

そこから、AIエージェントは食料品店(この場合はSafeway)のウェブサイトに移動し、商品を検索して仮想ショッピングカートに追加しました。すぐにわかるのは、エージェントの遅さです。カーソルの動きの間に約5秒の遅延がありました。エージェントは時折、タスクを中断してチャットウィンドウに戻り、特定の商品(ニンジンの本数など)について説明を求めていました。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Googleのエージェントはクレジットカード番号や請求情報の入力ができないため、チェックアウトできません。また、Project MarinerではユーザーのCookieを受け入れたり、利用規約に署名したりすることもできません。Googleは、ユーザーのコントロールを強化するため、エージェントによるこれらの操作を意図的に許可していないと述べています。

舞台裏では、Googleのエージェントがブラウザウィンドウのスクリーンショットを撮影し(ユーザーは利用規約に同意する必要があります)、クラウド上のGeminiに送信して処理しています。Geminiはその後、ウェブページをナビゲートするための指示をユーザーのコンピュータに送信します。

Project Mariner は、フライトやホテルの検索、家庭用品の買い物、レシピの検索など、現在はユーザーが Web 上でクリックする必要があるその他のタスクにも使用できます。

大きな注意点の一つは、Project MarinerはChromeブラウザの最前面にあるアクティブなタブでのみ動作するということです。つまり、エージェントがバックグラウンドで動作している間は、コンピューターを他の用途に使用できません。Geminiがゆっくりとクリックする様子を見守る必要があります。Google DeepMindの最高技術責任者であるコレイ・カヴクチュオグル氏は、これはGoogleのAIエージェントが何をしているのかをユーザーに知らせるための、非常に意図的な決定だと述べています。

「(Geminiは)ユーザーに代わって行動を起こすようになったので、段階的に進めていくことが重要です」と、カヴククオグル氏はTechCrunchのインタビューで述べた。「これは相互補完的なものです。個人としてウェブサイトを利用できるように、エージェントもウェブサイト上で行うすべての操作を行えるようになります。」

ウェブサイトの所有者は、GoogleのAIエージェントがユーザーのパソコン画面上で動作すると聞いて安心するかもしれません。それは、出版社や小売業者が依然としてユーザーの注目を集められることを意味するからです。しかし、GoogleのAIエージェントは、ユーザーが訪問するウェブサイトへのエンゲージメントを低下させる可能性があり、将来的にはユーザーがこれらのウェブサイトを全く利用しなくなるかもしれません。

「[Project Mariner]は、まさに今私たちが目にしている、根本的に新しいUXパラダイムシフトです」とコンゼルマン氏はTechCrunchに語った。「このすべてを通して、ユーザーのウェブとのインタラクション方法、そしてパブリッシャーが将来、ユーザーだけでなくエージェントにも最適な体験を提供する方法をどのように変えていくのか、私たちはそれを見極める必要があります。」

Googleは水曜日、Project Marinerのほかにも、より具体的なタスク向けの他のAIエージェントをいくつか発表した。

AIエージェントの一つであるDeep Researchは、多段階的な調査プランを作成することで、ユーザーが複雑なトピックを探索するのを支援することを目的としています。これは、同じく多段階的な推論が可能なOpenAIのo1と競合すると思われます。しかし、Googleの広報担当者は、このエージェントは数学や論理的推論の問題を解いたり、コードを書いたり、データ分析を行うようには設計されていないと述べています。このAIエージェントは本日Gemini Advancedで展開され、2025年にはGeminiアプリに搭載される予定です。

難しい質問や大規模な質問が提示された場合、Deep Research は、その質問に答えるための複数ステップのアクションプランを作成します。ユーザーがプランを承認すると、Deep Research は数分かけて質問に答え、Web 検索を行い、その結果に関する詳細なレポートを生成します。

Googleの新たなAIエージェント「Jules」は、開発者のコ​​ーディング作業を支援することを目的としています。GitHubのワークフローに直接統合され、Julesは既存の作業を確認し、GitHub上で直接変更を加えることができます。Julesは本日、一部のベータテスター向けにリリースされ、2025年後半に正式版がリリースされる予定です。

最後に、Google DeepMindは、長年ゲームプレイAIの開発に携わってきた実績を基に、ビデオゲームの操作を支援するAIエージェントの開発に取り組んでいると発表しました。GoogleはSupercellなどのゲーム開発会社と協力し、Geminiが「クラッシュ・オブ・クラン」などのゲーム世界を解釈する能力をテストしています。Googleはこのプロトタイプのリリース日を明らかにしていませんが、この開発は、仮想世界だけでなく現実世界でも操作を支援するAIエージェントの開発に役立つと述べています。

Project MarinerがGoogleの膨大なユーザーベースにいつ展開されるかは不明ですが、展開されれば、これらのエージェントはウェブ全体に大きな影響を与えるでしょう。ウェブは人間が利用するために設計されていますが、GoogleのAIエージェントはその基準を変える可能性があります。