Microsoft Copilotは、画面を読み上げ、深く考え、音声で話しかけることができるようになりました。

Microsoft Copilotは、画面を読み上げ、深く考え、音声で話しかけることができるようになりました。

Microsoft は、Copilot AI 搭載製品のエンタープライズ スイートに対する一連のアップデートを発表してから 1 週間後、画面に表示されている内容を理解して質問に応答できるツールを含む、Windows 上の新しい Copilot 機能をすべてのユーザー向けにリリースします。

iOS、Android、Windows、そしてウェブ向けの刷新されたCopilotアプリが本日リリースされました。いずれも、Microsoftの表現によれば、より「温かみのある」「個性的な」スタイルのCopilotを搭載しています。Microsoftはまた、このチャットボットをWhatsAppにも導入し、ユーザーはMetaのメッセージングプラットフォーム上の他のボットと同様に、ダイレクトメッセージ(DM)経由でCopilotとチャットできるようになります。

副操縦士ビジョン

Copilot Visionは、PC上で閲覧している内容を把握します。具体的には、Microsoft Edgeでアクセスしているサイトを覗き見ることができるレンズです。Copilot Pro専用の新しいオプトインプログラムであるCopilot Labsを介して提供されるCopilot Visionは、実験的なCopilot機能を利用でき、Webページ上のテキストと画像を分析し、それらに関するクエリ(例:「この写真の料理のレシピは何ですか?」)に回答できます。

Edgeのアドレスバーに「@copilot」と入力すると起動するVisionは、技術的に驚異的なものではありません。GoogleはAndroidで同様の検索技術を提供しており、最近その技術の一部をChromeにも導入しました。

しかし、マイクロソフトは、Copilot Vision は従来の画面分析機能よりも強力でプライバシーに配慮していると主張している。

「Copilot Visionは…次のステップを提案し、質問に答え、やりたいことをナビゲートし、タスクを支援します。これらはすべて、自然言語で話しかけるだけで行えます」と、MicrosoftはTechCrunchに共有されたブログ記事で述べています。「新しいアパートに家具を揃えようとしているところを想像してみてください。Copilot Visionは、家具の検索、適切なカラーパレットの選定、ラグからスローまであらゆる選択肢の検討、さらには見ているものを配置する方法の提案までサポートします。」

副操縦士ビジョン
Copilot Visionを使ってウェブ上の写真について質問する。画像クレジット: Microsoft

AIのプライバシーに関する失態による悪評を再び避けたいマイクロソフトは、Copilot Visionは会話の直後にデータを削除するように設計されていることを強調している。処理された音声、画像、テキストは保存されず、モデルの学習にも使用されない、と同社は主張している。少なくとも今回のプレビュー版ではそうではない。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Copilot Visionは、解釈できるウェブサイトの種類にも制限があります。Microsoftは現時点では、有料コンテンツや「センシティブ」なコンテンツではこの機能をブロックしており、Visionは事前に承認された「人気のある」ウェブサイトのリストのみを対象としています。

「センシティブ」なコンテンツとは具体的に何を指すのでしょうか?ポルノ?暴力?現時点では、マイクロソフトは何も明らかにしていません。

AIツールでペイウォールを回避しているという非難により、マイクロソフトは近年、法廷闘争に巻き込まれている。ニューヨーク・タイムズ紙は、マイクロソフトがBingのチャットボット「Copilot」を通じて同紙の記事を提供することで、ユーザーがペイウォールを回避できるようにしていたと主張している。タイムズ紙によると、特定の方法で指示すると、マイクロソフトと緊密に協力しているOpenAIのモデルをベースにしたCopilotは、有料記事のスニペットを逐語的に(またはほぼ逐語的に)提供していたという。

マイクロソフトは、現在米国のみで展開されているCopilot Visionは、ウェブサイトの「AIに関する機械可読な制御」を尊重すると述べている。例えば、ボットによるAIトレーニングのためのデータスクレイピングを禁止するルールなどだ。しかし、同社はVisionが具体的にどの制御を尊重するかについては明らかにしていない。現在、複数の制御が採用されている。マイクロソフトに詳細を問い合わせた。

多くの大手パブリッシャーは、データが許可なく使用されることを恐れるだけでなく、これらのツールによってサーバーコストが急騰するのを防ぐため、AIツールによるウェブサイトの閲覧をブロックすることを選択しています。現在の傾向が続けば、Copilot Visionはウェブ上の主要ニュースサイトの一部では機能しない可能性があります。

マイクロソフトは、懸念を和らげるために「フィードバックを受け入れる」ことに尽力していると述べた。

「一般公開に先立ち、安全対策の改良を継続し、プライバシーと責任をあらゆる活動の中心に据えていきます」とマイクロソフトはブログ投稿で述べています。「Copilotでは、閲覧中のウェブサイトのコンテンツを特別に処理したり、AIのトレーニングを行ったりすることはありません。Copilot Visionは、ユーザーと一緒に、ページ上で初めて目にする画像とテキストを読み取り、解釈するだけです。」

もっと深く考える

Vision と同様に、Copilot の新しい Think Deeper 機能は、Microsoft のアシスタントをより多用途にするための試みです。

マイクロソフトによると、Think Deeper は、段階的な回答を返すまでに時間がかかる「推論モデル」のおかげで、Copilot にさらに複雑な問題を推論する能力を与えるという。

どの推論モデルを使っているのか?と尋ねると、Microsoftは少し慎重な態度で、「Think DeeperはOpenAIの最新モデルをMicrosoftが微調整したものを使用している」とだけ答えた。行間を読むと、OpenAIのo1モデルのカスタマイズ版であることは間違いないだろう。

「Think Deeperは、複雑な選択肢を2つ並べて比較するなど、あらゆる日常的な実用的課題に役立つように設計しました」とマイクロソフトはブログ記事に記している。「Think Deeperは、難しい数学の問題を解くことから、家のプロジェクト管理にかかる費用を比較検討することまで、あらゆることに役立ちます。」

マイクロソフトはプレス資料の中でThink Deeperのポテンシャルをかなり強調していました。しかし、ベースモデルがO1だと仮定すると、いくつかの点で間違いなく不十分でしょう。マイクロソフトがベースモデルにどのような機能強化を施したのか、そしてThink Deeperの限界についてどれほど率直に語ってくれるのか、非常に興味深いところです。

Think Deeperは、オーストラリア、カナダ、ニュージーランド、米国、英国のCopilot Labsユーザー限定で本日から利用可能となります。

副操縦士の声

本日より一般公開されるCopilotの新機能、Copilot Voice(GitHubのCopilot Voiceとは別物です)は、ニュージーランド、カナダ、オーストラリア、英国、米国で英語版がリリースされます。Voiceには4種類の合成音声が追加され、Copilotに話しかけると、その返答を音声で聞くことができます。

副操縦士の声
画像クレジット: Microsoft

OpenAIのChatGPT向けAdvanced Voice Modeと同様に、Copilot Voiceは会話中のあなたの口調を感知し、それに応じて応答します。また、Copilot Voiceが応答している間は、いつでも発言を挟むことができます。Microsoftの広報担当者によると、このモードは「Copilotアプリ向けに微調整された新しいモデルを搭載した最新の音声技術」を使用しているとのことです。どのような技術なのか、どのモデルなのか、具体的な情報については、口を閉ざしています。

一つ注意しておきたいのは、Copilot Voiceには時間制限があるということです。Copilot Pro加入者は通話時間が長くなりますが、その時間は需要に応じて「変動する」とMicrosoftは説明してくれました。

パーソナライゼーション

マイクロソフトによれば、新しいパーソナライゼーション設定により、Copilot はすぐにユーザーの好みや嗜好に合わせてカスタマイズされるようになるという。

設定を有効にすると、Copilot は過去の操作や履歴、および他の Microsoft アプリやサービス (Microsoft はどのアプリやサービスかは明かしません) との操作に基づいて、Copilot の使用方法を推奨します。

「これは、Copilot の便利な機能と会話のきっかけの両方についての便利なガイドを提供することで、使い始めるのに役立ちます」と Microsoft はブログ投稿に書いています。

Copilotのパーソナライゼーション機能は、WindowsのCopilot設定メニューでオフにできますが、英国やEUではすぐには提供されません。しかし、その他の地域では本日午後から設定が利用可能になる予定です。

マイクロソフトとEUは、同社のAI製品の展開をめぐって緊張関係にある。5月、EUはマイクロソフトに対し、EUのオンラインガバナンス制度であるデジタルサービス法に基づき、世界全体の年間売上高の最大1%の罰金を科す可能性があると警告した。これは、同社がAI生成ツールに関する情報提供要請に応じなかったことを受けた措置である。

マイクロソフト以外にも、アップルやメタなど多くのテクノロジー大手は、EUのデータプライバシーやモデル展開を規定する法律に抵触することを懸念し、EU内でのAIツールの導入に慎重な姿勢を取っている。

「欧州経済領域(EEA)およびその他の一部の国のユーザーについては、Copilotのパーソナライゼーションをこのレベルで提供する前に、現在オプションを検討中です」とMicrosoftの広報担当者はTechCrunchに語った。「一部の機能は、EEAでは後日ご利用いただけなくなります。」