マイクロソフトはBingの新機能でAIに注力

マイクロソフトはBingの新機能でAIに注力

マイクロソフトはBingの拡張の次なる段階に着手している。そして、当然のことながら、その重点はAIにある。

今週ニューヨーク市で行われたプレビュー イベントで、CVP 兼消費者向け最高マーケティング責任者の Yusuf Mehdi 氏をはじめとする Microsoft 幹部が、この記者を含む報道関係者に、今後数日、数週間、数か月にわたって Bing に導入されるさまざまな機能を紹介しました。

彼らは車輪の再発明というより、過去3ヶ月ほどの間にマイクロソフトがBingエクスペリエンスに注入してきたものを基に構築していると言えるでしょう。マイクロソフトによると、OpenAIのGPT-4およびDALL-E 2モデルを搭載したAIチャットボット「Bing Chat」のリリース以来、1日あたり1億人を超えるアクティブユーザーを抱えるBingの訪問者は、5億件以上のチャットに参加し、2億枚以上の画像を作成しています。

今後、Bing Chat では画像やグラフィックを中心とした回答がさらに充実し、Bing はより視覚的にわかりやすくなります。また、ユーザーが Bing Chat の履歴をエクスポートしたり、サードパーティ製プラグイン(後述)のコンテンツを取り込んだりできる機能により、よりパーソナライズされたサービスへと進化します。さらに、Bing Chat は画像を見ながら質問に答えられるようになるという意味で、マルチモーダル性も実現します。

「検索の変革はまさに進行中だと言っても過言ではないでしょう」と、メフディ氏は用意した発言の中で述べた。「私たちは今日が、この『検索ミッション』の次世代の始まりになると考えています。」

オープンで視覚的な

本日より、新しいBing(Bing Chat搭載版)が、順番待ちなしでご利用いただけます。Microsoftアカウントでサインインすれば、どなたでもお試しいただけます。

これは数ヶ月前にリリースされたエクスペリエンスとほぼ同じです。しかし、先ほども触れたように、Bing Chat はまもなく画像で応答します ― 少なくとも意味のある場合には。質問(例えば「マチュピチュはどこですか?」)への回答には、関連する画像があればそれが表示されます。これは、Bing の標準的な検索フローに似ていますが、カードのようなインターフェースに凝縮されています。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Microsoft Bing チャット
Bing Chatの新機能、ビジュアルによる回答。画像クレジット: Microsoft

イベントのデモでは、広報担当者が「サワロサボテンは花を咲かせますか?」と質問を入力すると、Bing Chatが1段落にわたる回答と、そのサボテンの画像を表示しました。私にとっては、Google検索の「ナレッジパネル」を彷彿とさせました。

マイクロソフトは、具体的にどのようなカテゴリーのコンテンツが画像表示のトリガーとなるのかを明らかにしていません。しかし、露骨な画像が表示されないようにフィルタリング機能を備えていると主張しています。

マイクロソフトの責任あるAI責任者であるサラ・バード氏は、Bing ChatはBing検索に既に導入されているフィルタリングとモデレーションの恩恵を受けていると語った。さらに、Bing Chatは「毒性分類器」、つまり潜在的に有害なプロンプトを検出するように訓練されたAIモデルとブラックリストを組み合わせて使用​​し、チャットを比較的クリーンな状態に保つ。

注目すべきは、これらの対策にもかかわらず、2月上旬にプレビュー版が初めて公開されたBing Chatが暴走するのを防げなかったことです。私たちの取材では、このチャットボットがワクチンに関する誤情報を吐き出し、アドルフ・ヒトラーの視点から憎悪に満ちた長文を書き綴っているのが見つかりました。他の記者は、このチャットボットに脅迫をさせたり、複数の身元を偽装させたり、さらにはBing Chatを叱責したことで非難したりしました。

マイクロソフトに対するもう一つの批判として、同社はわずか数ヶ月前に、AI部門内の倫理・社会チームを解雇しました。この動きにより、マイクロソフトはAI原則が製品設計と密接に結びついていることを保証できる専任チームを失ってしまいました。

しかしバード氏は、意義ある進歩はあったものの、こうしたAIの問題は一夜にして解決するものではないと主張している。Bing Chatは公開されているとはいえ、だ。バード氏によると、他の対策としては、ユーザーがBing Chatを使ってフィッシングメールを作成しようとするなどの不正行為を監視するため、人間のモデレーターチームが設置されているという。

しかし、報道関係者には厳選されたデモ以外、最新バージョンのBingに触れる機会がなかったため、どれほどの違いがあったかは分かりません。より多くの人々がBingに触れれば、きっと明らかになるでしょう。

Bing Chat の改善点の一つは、応答の透明性、特に事実に基づく応答の透明性です。まもなく、文書の要約や内容(例えば「このページにはブルックリン橋について何が書いてあるか?」)を求められた場合、それが20ページのPDFであろうとWikipediaの記事であろうと、Bing Chat は情報の出典を示す引用文を表示します。引用文をクリックすると、該当する箇所がハイライト表示されます。

生産性の出現

ビジュアル面におけるもう一つの新機能として、Bing Chat は適切な質問とデータを入力すると、チャートやグラフを作成できるようになります。これまでは、「ブラジルで最も人口の多い都市はどこ?」といった質問をすると、基本的な結果リストが表示されていました。しかし、近い将来にリリースされるプレビュー版では、Bing Chat はこれらの結果を視覚的に、そしてユーザーが選択したチャート形式で表示できるようになります。

これは、特に今後予定されている強化されたテキストから画像への生成機能と組み合わせると、Bing が本格的な生産性プラットフォームに向けて一歩前進したことを示しているように思われます。

Microsoft Bing チャット
Bing Chat のイメージクリエーター。画像クレジット: Microsoft

今後数週間のうちに、DALL-E 2 を搭載した、テキストプロンプトから画像を生成できる Microsoft のツールである Bing Image Creator が、英語以外の言語(合計100言語以上)にも対応する予定です。英語と同様に、ユーザーは追加のプロンプト(例えば「うさぎの画像を作ってください」に続いて「今度は毛皮をピンク色にしてください」など)を使って、生成した画像を絞り込むことができます。

生成アート AI は最近よく話題になっていますが、必ずしも楽観的な理由からというわけではありません。

マイクロソフトは、公式見解ではフェアユースの問題だとしているものの、作品がトレーニングデータに巻き込まれたクリエイターへの補償策を検討しているのかどうか、バード氏に尋ねた。Shutterstockなど、AI生成ツールを導入している複数のプラットフォームは、こうした流れでクリエイター向けの基金を設立している。Spawningのように、アーティストがAIモデルのトレーニングを完全に拒否できる仕組みを構築しているプラ​​ットフォームもある。

バード氏は、これらの問題はいずれ対処しなければならないだろうと示唆し、コンテンツ制作者は何らかの形での補償を受けるべきだと主張した。しかし、今週は具体的な発言には応じなかった。

マルチモーダル検索

画像関連では、Bing Chat がテキストだけでなく画像も理解する機能を強化しています。ユーザーは画像をアップロードし、ウェブ上で関連コンテンツを検索できるようになります。例えば、かぎ針編みのタコの画像へのリンクをコピーし、Bing Chat に「どうやって作るの?」と質問すれば、ステップバイステップの説明が表示されます。

マルチモーダル性は、モバイル版Edgeアプリの新しいページコンテキスト機能にも活かされています。ユーザーは、閲覧中のモバイルページに関連する質問をBing Chatで行うことができます。

マイクロソフトはどちらの見解も示していませんが、これらの新しいマルチモーダル機能は、テキストに加えて画像を理解できるGPT-4から派生している可能性が高いようです。OpenAIがGPT-4を発表した際、同モデルの画像理解機能はすべての顧客に公開されていませんでした。そして現在も公開されていません。しかし、OpenAIへの主要な投資家であり、緊密な協力関係にあるマイクロソフトは、何らかの特権的なアクセス権を持っていると推測できます。

もちろん、どんな画像アップロードツールも悪用される可能性があります。そのため、マイクロソフトは自動フィルタリングとハッシュ化によって不正アップロードをブロックしていると、バード氏は言います。ただし、これらの機能がどれほど効果的かは不明です。私たち自身で画像アップロードをテストする機会がなかったからです。

新しいチャット機能

Bing Chat に導入されるのは、マルチモーダル機能と新しいビジュアル機能だけではありません。

まもなく、Bing Chat はユーザーのチャット履歴を保存し、中断したところから再開したり、以前のチャットに戻ったりできるようになります。これは、OpenAI が最近 ChatGPT に導入したチャット履歴機能に似た機能で、チャットのリストと各チャットに対するボットの返信が表示されます。

チャット履歴機能の詳細については、チャットがどれくらいの期間保存されるかなど、まだ明確にされていません。しかし、ユーザーはいつでも履歴を削除できるとMicrosoftは述べています。これは、複数の欧州連合(EU)加盟国政府がChatGPTに対して抱いていた批判への対応です。

Microsoft Bing チャット
Bing Chatからのチャットのエクスポートと共有。 画像クレジット: Microsoft

Bing Chatにはエクスポートと共有機能も追加され、ユーザーは会話をソーシャルメディアやWord文書で共有できるようになります。MicrosoftのWebエクスペリエンスチームのパートナーGMであるデナ・サンダース氏は、TechCrunchに対し、Bing Chatで作成されたグラフや画像用の、より堅牢なコピー&ペーストシステムを開発中だが、まだプレビュー段階ではないと語った。

しかし、Bing Chat に最も大きな変革をもたらしたのは、おそらくプラグインでしょう。OpenTable や Wolfram Alpha といったパートナーが提供するプラグインは、Bing Chat の機能を大幅に拡張します。例えば、ユーザーが予約をしたり、視覚化を作成したり、科学や数学の難問を解いたりするのに役立ちます。

チャット履歴と同様に、まだ公開されていないプラグイン機能はまだ初期段階にあります。プラグインマーケットプレイスと呼べるものはなく、プラグインはBing Chatのウェブインターフェースからオン/オフを切り替えることができます。

サンダース氏は、Bing Chatプラグインスキームが、OpenAIが最近導入したChatGPT用プラグインと関連している、あるいは同一である可能性を示唆したものの、確証は得られなかった。両者の類似性を考えれば、確かにその可能性は納得できる。

エッジをリフレッシュ

Bing Chatは、もちろんWebだけでなくEdgeでもご利用いただけます。そして、EdgeもBing Chatと同じく刷新されます。

2月に初めてプレビューされた、新しく改良されたEdgeは、MicrosoftのWindows 11のデザイン哲学に沿って角が丸くなっています。ブラウザ内の要素は、Microsoftの広報担当者の言葉を借りれば、より「コンテナ化」され、Microsoftアカウントの画像が中央より左に移動するなど、全体に微妙な調整が加えられています。

Bing Chat を活用した Edge のツール「Compose」では、基本的なプロンプト(例:「愛犬の誕生日パーティーの招待状を書いてください」)を入力するだけでメールなどを作成できますが、新しいオプションでは、生成されるテキストの長さ、言い回し、トーンをほぼ自由に調整できます。希望するトーンを入力すると、Bing Chat がそれに合ったメッセージを作成します。バード氏によると、「憎悪的な」や「人種差別的な」といった明らかに問題のあるトーンの使用を防ぐためのフィルターが搭載されています。

しかし、少なくとも私にとっては、Compose よりもはるかに興味深いのは、特定の Bing Chat プロンプトを自動化に変換する Edge のアクションです。

EdgeサイドバーのBing Chatで「別のブラウザからパスワードを取得」のようなコマンドを入力すると、Edgeの閲覧データ設定ページが開きます。一方、「『プラダを着た悪魔』を再生」というプロンプトでは、Vuduや(予想通り)Microsoft Storeなどのストリーミングオプションのリストが表示されます。閲覧タブを自動的に整理し、色分けするアクションもあります。

Microsoft Bing チャット
Edgeアクションの実演。画像クレジット: Microsoft

アクションは現在、初期段階にあります。しかし、Microsoftがどこへ向かっているのかは明らかです。アクションは最終的にはEdgeを超えて、Office 365などの他のMicrosoft製品にまで拡大し、将来的にはWindowsデスクトップ全体にも展開されるのではないかと予想されます。

サンダース氏は、これが終局であるかどうかについては肯定も否定もしなかった。「Microsoft Buildにご期待ください」と、マイクロソフトが近々開催する開発者会議に言及して彼女は言った。もちろん、期待している。