今週の AI: 買い物客は本当に Amazon の GenAI を望んでいるのか?

今週の AI: 買い物客は本当に Amazon の GenAI を望んでいるのか?

AIのように急速に変化する業界に追いつくのは至難の業です。AIがあなたの代わりにそれをこなしてくれるようになるまで、機械学習の世界における最近の話題や、私たちが単独では取り上げなかった注目すべき研究や実験をまとめてご紹介します。

今週、Amazonは、同社の商品カタログとウェブ上の情報を学習したAI搭載ショッピングアシスタント「Rufus」を発表しました。RufusはAmazonのモバイルアプリに常駐し、商品の検索、商品比較、購入すべき商品のおすすめなどをサポートします。

「『ランニングシューズを買うときに何を考慮すべきか』といった、買い物を始める際の幅広いリサーチから、『トレイルランニングシューズとロードランニングシューズの違いは何か』といった比較まで…Rufusは、顧客が自分のニーズに合った最適な商品を見つけやすく、見つけやすくする」とアマゾンはブログ投稿に記した。

それは素晴らしいですね。でも、本当に誰がそれを強く求めているのか、というのが私の疑問です 。

生成AI、特にチャットボットといっ​​た形態のAIが、一般の人々が関心を持つ、あるいは考えることすらしないテクノロジーだとは、私には思えません。調査結果もそれを裏付けています。昨年8月、ピュー研究所の調査によると、米国でOpenAIのGenAIチャットボットChatGPTについて聞いたことがある人(成人の18%)のうち、実際に使ったことがある人はわずか26%でした。もちろん、利用状況は年齢によって異なり、50歳未満の若者の方が高齢者よりも使用経験があると回答した人の割合が高い傾向にあります。しかし、間違いなく最も人気のあるGenAI製品であるにもかかわらず、大多数の人がその使い方を知らない、あるいは気にかけないのが現状です。

確かに、RufusのようなGenAIは、特定の用途に合わせた買い物(例:冬服の探し方)、商品カテゴリーの比較(例:リップグロスとオイルの違い)、おすすめの商品(例:バレンタインデーのギフト)の提示といった、特定の限定的なタスクに役立ちます。しかし、これはほとんどの買い物客のニーズに応えているのでしょうか?eコマースソフトウェアのスタートアップ企業Namogooの最近の調査によると、そうではないようです。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Namogooは、数百人の消費者にオンラインショッピングに関するニーズと不満点について質問した結果、商品画像が優れたeコマース体験に最も大きく貢献し、次いで商品レビューと商品説明であることが分かりました。回答者は、検索を4番目に重要視し、「シンプルなナビゲーション」を5番目に重要視しました。好み、情報、購入履歴の記憶は2番目に重要でした。

つまり、人々は一般的に商品を意識しながら買い物をし、検索は後回しにしているということです。もしかしたら、Rufusがこの状況を一変させるかもしれません。しかし、特に導入が難航した場合は(Amazonの他のGenAIショッピング実験の反響を考えると、そうなる可能性は十分にあります)、私はそうは思いません。しかし、もっと奇妙なことが起きていることもあるのでしょう。

ここ数日間で注目されたその他の AI 関連ニュースは次のとおりです。

  • Google マップが GenAI を実験中: Google マップは、新しい場所の発見を支援する GenAI 機能を導入します。大規模言語モデル(LLM)を活用したこの機能は、Google マップ上の 2 億 5,000 万以上の場所と 3 億人を超えるローカルガイドの投稿を分析し、ユーザーの探しているものに基づいたおすすめを表示します。 
  • 音楽などの GenAI ツール: Google のその他のニュースでは、このテクノロジー大手は、音楽、歌詞、画像を作成するための GenAI ツールをリリースし、より高性能な LLM の 1 つである Gemini Pro を世界中の Bard チャットボットのユーザーに提供しました。
  • 新しい「オープン」な AI モデル:故 Microsoft 共同創業者ポール アレン氏が設立した非営利の AI 研究機関である Allen Institute for AI は、他のモデルよりも「オープン」であると主張する GenAI 言語モデルをいくつかリリースしました。さらに重要なのは、開発者がトレーニング、実験、さらには商用化のために自由に使用できるようにライセンスが付与されていることです。
  • FCC、AI生成通話の禁止に着手: FCCは、ロボコールにおける音声複製技術の使用を根本的に違法とすることを提案しており、これにより、こうした詐欺行為を行う運営者を起訴しやすくなる。
  • Shopifyが画像エディタをリリース: Shopifyは、商品画像をより美しく仕上げるためのGenAIメディアエディタをリリースします。販売者は7つのスタイルからタイプを選択するか、プロンプトを入力して新しい背景を生成できます。
  • GPTの呼び出し: OpenAIは、ChatGPTユーザーがあらゆるチャットでGPTを呼び出せるようにすることで、OpenAIのAIモデルを搭載したサードパーティ製アプリであるGPTの普及を促進しています。ChatGPTの有料ユーザーは、「@」と入力してリストからGPTを選択することで、会話にGPTを導入できます。 
  • OpenAI が Common Sense と提携: OpenAI は、無関係の発表で、子供向けのさまざまなメディアやテクノロジーの適合性を審査し、ランク付けする非営利団体 Common Sense Media と提携し、親、教育者、若者向けの AI ガイドラインと教育資料を共同で作成すると発表した。
  • 自律ブラウジング: Arc Browser を開発している Browser Company は、ユーザーに代わって Web を閲覧し、検索エンジンを経由せずに結果を表示する AI の構築を目指しています。

さらなる機械学習

AIは、特定の状況、媒体、あるいは発話において何が「正常」あるいは「典型的」なのかを認識できるのでしょうか?ある意味で、大規模言語モデルは、データセット内のどのパターンが他のパターンに最も類似しているかを特定するのに特に適しています。そして実際、イェール大学の研究者たちは、AIが他のものの集合体の中であるものの「典型性」を識別できるかどうかを研究した結果、まさにそのことを発見しました。例えば、100冊のロマンス小説が与えられたとします。モデルがそのジャンルについて蓄積している情報に基づいて、どれが最も「典型的」で、どれが最も「典型的」ではないでしょうか?

興味深いことに(そして苛立たしいことに)、バラス・コヴァーチ教授とガエル・ル・メンズ教授は、BERTの亜種である独自のモデルに長年取り組んできました。そして、まさに論文を発表しようとしていた矢先に、ChatGPTが登場し、多くの点で彼らが行っていたことと全く同じ結果になりました。「泣きたくなるほどで​​した」とル・メンズ教授はニュースリリースで述べています。しかし朗報は、新しいAIと彼らの古い調整済みモデルの両方が、この種のシステムがデータセット内の典型的なものと非典型的なものを識別できることを示唆していることです。これは将来役立つ可能性のある発見です。両教授は、ChatGPTは実践的には彼らの論文を裏付けているものの、その閉鎖的な性質のために科学的に扱うのが難しいと指摘しています。

ペンシルベニア大学の科学者たちは、もう一つの奇妙な概念、つまり「常識」を定量化しようと試みました。数千人に「与えれば与えられる」や「賞味期限切れの食品は食べない」といった発言がどの程度「常識的」であるかを評価してもらいました。予想通り、パターンは現れたものの、「集団レベルで認識された信念はほとんどなかった」のです。

「私たちの研究結果は、常識というものが各人独自のものであり、その概念が想像するほど一般的ではないことを示唆しています」と、共同筆頭著者のマーク・ホワイティング氏は述べています。なぜこれがAIニュースレターに掲載されているのでしょうか?それは、他のほとんどすべてのことと同様に、AIが最終的に持つと期待されるような「単純な」常識が、実際には全く単純ではないことが判明したからです。しかし、このように常識を定量化することで、研究者や監査人は、AIがどの程度の常識を持っているか、あるいはAIがどのようなグループやバイアスに合致しているかを判断できるかもしれません。

バイアスと言えば、多くの大規模言語モデルは取り込む情報に関してかなり曖昧です。つまり、適切なプロンプトを与えても、不快な、誤った、あるいはその両方を示す反応をしてしまう可能性があるのです。Latimerは、より包括的な設計を意図したモデルで、この状況を変えようとしているスタートアップ企業です。

彼らのアプローチについてはまだ詳細が明らかにされていないものの、ラティマー氏によると、彼らのモデルは検索拡張生成(応答を改善すると考えられている)と、独自のライセンスコンテンツ、そしてこれらのデータベースには通常含まれていない様々な文化から収集されたデータを使用しているとのことです。そのため、何かについて質問されても、モデルは19世紀のモノグラフにまで遡って答える必要はありません。ラティマー氏がより詳しい情報を発表した際に、このモデルについてより詳しく知ることができるでしょう。

画像クレジット: Purdue / Bedrich Benes画像クレジット: Purdue / Bedrich Benes

AIモデルが確実にできることの一つは、木を育てることです。それも偽の木です。パデュー大学デジタル林業研究所(私もそこで働きたいと思っています。ぜひ連絡ください)の研究者たちは、木の成長をリアルにシミュレートする超小型モデルを開発しました。これは一見単純そうに見えて、実はそうではない問題の一つです。ゲームや映画を作るなら、うまく機能する木の成長をシミュレートすることはできますが、本格的な科学研究ではどうでしょうか?「AIは一見普及しているように見えますが、これまでのところ、自然とは無関係な3Dジオメトリのモデリングにおいて、非常に高い成功を収めています」と、筆頭著者のベドリッチ・ベネス氏は述べています。

彼らの新しいモデルは約1メガバイトで、AIシステムとしては非常に小さい。しかし、もちろんDNAはさらに小さく高密度であり、根から芽まで、樹木全体をエンコードしている。このモデルはまだ抽象的なものであり、決して自然の完璧なシミュレーションではないが、樹木の成長の複雑さが比較的単純なモデルでエンコードできることを示すものだ。

最後にご紹介するのは、ケンブリッジ大学の研究者たちが開発したロボットです。このロボットは人間よりも速く、90%の精度で点字を読み取ります。なぜでしょうか?実は、これは視覚障害者が使うためのものではありません。研究チームは、ロボットの指先の感度と速度をテストするための、興味深く、簡単に定量化できるタスクだと判断したのです。ズームするだけで点字を読めるなら、それは良い兆候です!この興味深いアプローチについて詳しくは、こちらをご覧ください。または、以下の動画をご覧ください。