ヒンディー語版GoogleのAI概要には品質向上が必要

ヒンディー語版GoogleのAI概要には品質向上が必要

インドの言語多様性を考えると、デジタルコンテンツ企業はコンテンツの正確な表示と翻訳に既に課題を抱えています。Googleも最近インドで導入したAIオーバービュー機能で同様の問題に直面しています。

同社は8月初旬に、インド国内でAIオーバービューのヒンディー語対応を導入しました。インドのユーザーは、検索ページを離れることなくヒンディー語と英語を切り替えることができます。しかし、この機能は残念ながら一貫性に欠けています。

簡単な例として、Googleのブログから抽出した検索結果があります。GIF画像には「Cheeni ki jagah chai mai kya daal sakte hai?」という検索ワードが表示されました。これは「お茶の砂糖の代わりは何ですか?」という意味です。テスト中に単語の順序を変えて「Chai mai cheeni ke jagah kya daal sakte hai?」と入力したところ、Googleは回答を表示しませんでした。

もう一つの問題は、英語の単語を直訳する際に発生しました。ヒンディー語で「夏に食べられる食べ物は何ですか?」と尋ねたところ、回答の一つに「Chiknai wali cheezien」という「ベタベタしたもの」という表現があり、これは紛らわしいです。英語に切り替えてみると、Googleは「Oily(油っぽい)」という選択肢を提示しましたが、食べ物に関して言えば「sticky(粘着性のある)」とは全く異なる意味です。どちらにしても、少し奇妙な提案です。

別の例では、YouTubeの所有権について尋ねたところ、AI Overviewsはヒンディー語で「2023年2月16日まで、ニール・モハンがGoogleのCEOでした」と回答しましたが、これは誤りです。英語のテキストには正しく「2023年2月16日現在、ニール・モハンがGoogleのCEOです」と記載されていました。

画像クレジット: Google (スクリーンショット)

質的な問題もあります。「今年のディワリはいつですか?」と質問したところ、シンプルな答えではなく、昨年のディワリに関する段落が表示され、次にリンクのカルーセルが表示され、最後に私たちが求めていた本当の答えが表示されました。

スパイスの入った食べ物を食べられるかどうかをヒンディー語と英語の両方で何度も尋ねたところ、AI Overview を通じて一貫性のない回答が返ってきました。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

しかし、月経や妊娠といった他のトピックに関する結果は、より懸念されるものがあります。結婚後、いつ子供を持つことを考えるべきかという質問の一つでは、概要の回答の最初の段落に、夫婦は少なくとも2年間待つべきだと、分かりにくいヒンディー語で書かれていました。

また、25歳前後で結婚した場合、「3年間」の猶予があるとも述べられていたが、具体的には言及されていなかった。この段落は、インドのニュースサイトに掲載されたヒンディー語のスライドショー記事から引用されたものとみられ、その記事はQuoraなどのブログ上の様々な意見に基づいて書かれていた。

画像クレジット: Google (スクリーンショット)

生理中に何を食べるべきか聞いたところ、「牛乳をいろいろなものと一緒に飲む」や、気分のムラを抑えるためにレモンを飲むといった回答がありました。

画像クレジット: Google (スクリーンショット)

GoogleのAIによる概要表示は文脈も見逃しています。デリーの飲食店について質問したところ、シク教徒の礼拝所であるバングラ・サーヒブ・グルドワラは24時間営業で、お茶やサモサ、カチョリなどのインドの軽食が手に入ると提案されました。しかし、この提案には、元記事には記載されていた重要な点が抜けています。それは、これらの品物がグルドワラの外でも手に入るということです。AIツールは要約時にこの重要な点を見逃していました。軽食は礼拝所には置いていないのです。

画像クレジット: Google (スクリーンショット)

英語で同様の質問を行った結果の中には、ヒンディー語のものよりもはるかに優れたものもありました。これは、ヒンディー語で利用可能な情報源の数と質の高さが一因かもしれません。しかし、私たちが指摘した問題の一部は、文脈から外れた要約や不正確な翻訳など、Googleシステムのミスによるものでした。Googleはインドにおける検索と言語の問題に取り組んでおり、最初の試みでより良い結果が得られるはずでした。

GoogleはTechCrunchに対し、AI概要機能は、出力の品質に高い信頼性がある検索クエリに対してのみ表示されると述べ、この機能は「当社の中核となる検索品質システムに根ざしている」ものであり、「上位のウェブ結果によって裏付けられた情報のみを表示する」と述べた。

「当社のテストでは、AIオーバービューの精度は、注目スニペットなどの他の機能と同等であることが示されています。問題が発生した場合、それは当社のシステムがウェブコンテンツを誤って解釈したり、ウェブ上の不正確な情報を反映したりしたことが原因である可能性があります。私たちは、他の検索機能と同様に、こうした事例を改良に役立てています」とGoogleの広報担当者はTechCrunchに語った。 

Googleは引用元の質を非難できる。しかし、質問と情報源がAIによって要約される価値があると判断したのはGoogleのアルゴリズムである。すべてのユーザーが情報源サイトの資料を見て、不正確または理解しにくい回答を表示したとしてGoogleを非難するわけではない。 

AI OverviewsはGoogleにとって期待外れの取り組みでした。今年初め、同社はRedditの回答を「ピザに接着剤を加える」というユーザーへの回答として表示したことで、大きな批判を浴びました。また、別のユーザーには「1日に小さな石を1つ食べる」とアドバイスしましたが、これはThe Onionからの回答でした。私たちがヒンディー語でテストした例の多くは、トピックに関する正しい情報を提供していませんでした。

インドには8億3000万人以上のインターネットユーザーがおり、そのかなりの数が検索にGoogleを利用しています。より多くのユーザーに現地語でAI Overviewsを利用してもらいたいのであれば、同社は言語とコンテンツの精度を向上させる必要があります。