Googleフォトは、GoogleのGemini AIモデルを搭載した実験的な機能「Ask Photos」のリリースにより、AIの力をさらに強化します。この新機能は今夏後半にリリース予定で、ユーザーは写真の内容やその他のメタデータをAIが理解し、自然言語クエリを使ってGoogleフォトのコレクション全体を検索できるようになります。
これまでユーザーは写真の中の特定の人物、場所、物を検索することができましたが、自然言語処理のおかげで、AIのアップグレードにより適切なコンテンツがより直感的に見つかり、手動による検索プロセスが軽減されると、Googleは火曜日に年次開発者会議Google I/O 2024で発表しました。
例えば、「エッフェル塔」といった写真の中の特定のものを探す代わりに、AIに「私が訪れた国立公園ごとのベストショット」を見つけるといった、より複雑な作業を依頼できるようになりました。AIは、照明、ぼかし具合、背景の歪みの少なさなど、様々なシグナルを用いて、与えられた写真の中で「ベスト」な写真かどうかを判断するのです。そして、その情報と、写真セットの位置情報や日付の理解を組み合わせることで、米国の国立公園で撮影された画像だけを検索することができます。

この機能は、Googleフォトで最近リリースされた「フォトスタック」を基盤としています。フォトスタックは、ほぼ重複した写真をグループ化し、AIを活用してグループ内の最適な写真をハイライト表示します。フォトスタックと同様に、デジタルコレクションが増えていく中で、ユーザーが必要な写真を見つけやすくすることを目指しています。Googleによると、Googleフォトには毎日60億枚以上の画像がアップロードされており、その規模の大きさがお分かりいただけるでしょう。
さらに、「写真に質問」機能では、ユーザーが質問をすることで、様々な役立つ回答を得ることができます。旅行や他のグループでのベストショットを尋ねるだけでなく、写真に何が写っているかを人間のような感覚で理解する必要があるような質問をすることもできます。
例えば、親が Google フォトに、子供の過去 4 回の誕生日パーティーでどんなテーマを使ったかを尋ねると、以前使われた人魚、お姫様、ユニコーンのテーマとその時期に関する写真や動画とともに、簡単な答えが返ってくる。

このようなクエリは、Google フォトが入力したキーワードだけでなく、「テーマのある誕生日パーティー」といった自然言語の概念も理解しているため実現しています。また、AI のマルチモーダル機能を活用して、写真内にクエリに関連する可能性のあるテキストが含まれているかどうかを判断することも可能です。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
本日開催されたGoogle I/O開発者会議に先立ち、CEOのサンダー・ピチャイ氏が報道陣にデモを行ったもう一つの事例では、ユーザーがAIに子供の水泳の進捗状況を見せるよう指示したところ、AIは子供が泳いでいる様子を時系列で写真や動画のハイライトとしてまとめて表示しました。
もう1つの新機能は、写真内のテキストから検索機能を使って答えを見つけるというものです。これにより、車のナンバープレートやパスポート番号など、後で思い出したいものを写真に撮っておき、必要な時にAIにその情報を取得してもらうことができます。
AIが間違った対応をして、それを修正した場合(例えば、誕生日パーティーの写真ではない写真や、休暇中に特に強調したくない写真にフラグを立てた場合など)、AIはその対応を記憶し、時間の経過とともに改善していきます。これはつまり、AIとのやり取りが長くなるほど、AIがあなたに合わせてパーソナライズされるようになることを意味します。
共有したい写真が見つかったら、AIが写真の内容を要約したキャプションの下書き作成を手伝ってくれます。今のところは基本的な要約で、様々なスタイルを選択することはできません。(ただし、内部的にはGeminiを使用しているため、適切なプロンプトを入力すれば、特定のスタイルが返される可能性があります。)
Googleは、特定のケースでは応答しないようガードレールを設けると述べている(例えば、AIに「最高のヌード」を尋ねないようにするなど)。また、モデルのトレーニング時には、不快な可能性のあるコンテンツは含まれていない。しかし、この機能は実験的なものであり、Googleがユーザーの利用状況に応じて、今後、追加の制御が必要になる可能性がある。
「Ask Photos」機能は、当初は米国で英語版のみで提供され、その後、より多くの市場に展開されます。また、現時点ではAIチャットボットに質問するのと同様に、テキストベースの機能のみです。しかし、将来的にはAndroidと同様に、デバイス上で動作するGeminiとより深く連携される可能性があります。
同社は、Googleフォトに保存されているユーザーの個人データは広告には使用されないと述べています。また、Googleによると、「まれに不正行為や危害に対処する必要がある場合」を除き、人間が「Ask Photos」のAIによる会話や個人データを確認することはありません。Googleフォトに保存されているユーザーの個人データは、Geminiのような他の生成AI製品の学習にも使用されません。
AIニュースレターを始めます!6月5日から受信ボックスに配信を開始するには、こちらからご登録ください。

サラは2011年8月からTechCrunchの記者として働いています。彼女はReadWriteWebで3年以上勤務した後、TechCrunchに入社しました。記者になる前は、銀行、小売、ソフトウェアなど、様々な業界のIT業界で働いていました。
Sarah からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal で sarahperez.01 に暗号化されたメッセージを送信してください。
バイオを見る