DeepMindの創業者デミス・ハサビス氏によると、Googleはマルチモーダル生成AIツール「Gemini」の人物描写能力をまもなく「停止解除」できると期待しているという。人物画像の指示に応答する機能は「今後数週間」以内に再開される予定だとハサビス氏は本日述べた。
グーグルは先週、ジェミニ機能が、米国建国の父たちを白人男性だけではなく多様な人々の集団として描くなど、歴史的に見て矛盾した画像を生成しているとユーザーから指摘されたことを受けて、同機能を停止した。
ハサビス氏は本日バルセロナで開催されたモバイル・ワールド・コングレスでのステージ上のインタビューで、製品の混乱についての質問に答えた。
モデレーターのWiredのスティーブン・レヴィ氏から画像生成機能の不具合について説明を求められたハサビス氏は、詳細な技術的説明を避けた。代わりに、ユーザーが基本的に「普遍的な描写」を求めているにもかかわらず、Googleがそれを認識できなかったことが問題の原因だと示唆した。また、この例は「高度なAIに伴う微妙な差異」を示唆しているとも述べた。
これは私たち全員が取り組んでいる分野です。例えば、『犬の散歩をしている人や病院にいる看護師の写真をください』といったプロンプトを表示する場合、明らかにある種の『普遍的な描写』が求められます。特にGoogleは200か国以上、つまり世界中のあらゆる国にサービスを提供しています。つまり、ユーザーがどこから来ているのか、どのような背景を持っているのか、どのような状況にいるのかはわかりません。ですから、非常に普遍的な可能性を示す必要があるのです。」
ハサビス氏は、この問題は結局のところ、ジェミニの人物画像出力の多様性を促進するという「善意の機能」が「全体にわたってあまりにも露骨に」適用されたことに尽きると述べた。
歴史上の人物に関する内容を求めるプロンプトは「当然のことながら」、返される情報は「はるかに狭い範囲に絞られる」はずだと彼は付け加え、ジェミニが将来、人々に関するプロンプトにどのように取り組む可能性があるかを示唆した。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
「もちろん、歴史的正確さにはこだわっています。そのため、修正作業中はこの機能をオフラインにしていますが、近いうちにオンラインに戻れるよう願っています。数週間後、数週間後です。」
プロパガンダを拡散しようとする独裁政権など、悪意ある主体による生成AIツールの悪用をいかに防ぐかという追加質問に対し、ハサビス氏は単純な答えを示さなかった。この問題は「非常に複雑」であり、制限を定め、それを強制するためには社会全体の動員と対応が必要となるだろうと彼は示唆した。
「本当に重要な研究と議論が必要です。テクノロジー企業だけでなく、市民社会や政府も参加する必要があります」と彼は述べた。「これはすべての人に影響を与える社会技術的な問題であり、誰もが議論に参加する必要があります。これらのシステムにどのような価値を持たせたいのでしょうか?それらは何を象徴するのでしょうか?悪意のある人物が同じテクノロジーにアクセスするのを、そして、あなたがおっしゃっているように、システムの開発者が意図していなかった有害な目的のためにテクノロジーを転用するのを、どのように防ぐのでしょうか?」
Googleも提供しているオープンソースの汎用AIモデルの課題に触れ、同氏は次のように付け加えた。「顧客は、完全に制御できるオープンソースシステムを使いたいと考えています。しかし、システムがますます強力になるにつれて、下流の人々が使用するものが有害でないことをどのように保証するかという疑問が生じます。」
「今のところ、システムはまだ比較的初期段階なので、問題にはならないと思います。しかし、3年、4年、5年先を見据え、計画能力を持ち、世界で行動し、問題や目標を達成できる次世代システムについて議論し始めるとしたら、社会はこれらの問題について真剣に考えなければならないと思います。もしこれが蔓延し、個人からならず者国家に至るまで、悪意のある者がそれらを利用できるようになったらどうなるでしょうか。」
インタビューの中で、ハサビス氏はAIデバイスについて、そして生成AIがモバイル市場における新たな発展を牽引し続ける中で、モバイル市場が今後どのような方向に向かうのかについても意見を求められ、前世代のAIアシスタントのような「ギミック」ではなく、人々の日常生活に役立つ「次世代スマートアシスタント」の波が来ると予測しました。そして、こうした波は人々が持ち歩くモバイルハードウェアのあり方さえも変える可能性があると示唆しました。
「そもそも、どんなデバイスが適切かという疑問も出てくるでしょう」と彼は示唆した。「しかし、5年以上経った今、スマートフォンは本当に完璧なフォームファクターと言えるのでしょうか? AIシステムがユーザーの置かれた状況を少しでも理解し、日常生活でより役立つようにするためには、メガネか何かが必要になるかもしれません。ですから、これから様々な素晴らしい発明が生まれると思います。」
Googleは、歴史的な不正確さを受けて、AIツールGeminiの人物画像生成機能を一時停止した。
ナターシャは2012年9月から2025年4月まで、ヨーロッパを拠点とするTechCrunchのシニアレポーターを務めていました。CNET UKでスマートフォンレビューを担当した後、TechCrunchに入社しました。それ以前は、silicon.com(現在はTechRepublicに統合)で5年以上ビジネステクノロジーを担当し、モバイルとワイヤレス、通信とネットワーク、ITスキルに関する記事を主に執筆しました。また、ガーディアン紙やBBCなどのフリーランスとして活動した経験もあります。ケンブリッジ大学で英語学の優等学位を取得し、ロンドン大学ゴールドスミス・カレッジでジャーナリズムの修士号を取得しています。
バイオを見る