スマートホームにおけるAIの問題点

スマートホームにおけるAIの問題点

先週、AmazonとGoogleはスマートホームの新たな章とも言える新たな取り組みを開始しました両社の新しい音声アシスタントであるAlexa PlusとGemini for Homeは、生成AIと大規模言語モデルを基盤としてゼロから再構築され、より会話的で、文脈を理解し、アクションを起こすことができるようになりました。これは、両社が10年以上前に最初のスマートスピーカーを発売して以来、ホームコントロールにおける最大の転換点となります。

それ以来、スマートホームの普及は停滞しています。複雑で分かりにくく、その価値が必ずしも明確ではないからです。GoogleとAmazonは、AIを活用したこの新しい波に賭け、よりスマートでシンプル、そしてより高性能なスマートホームを実現しようとしています。先週、両社の担当者と話をし、新しいハードウェアとソフトウェアの戦略を目の当たりにしてきたので、私は期待を抱いています。しかし、少なくとも3つの大きなハードルがあると考えています。信頼性、速度、そして価格に見合うだけの価値があることを証明することです。

生成AIがスマートホームをスマートにする方法

生成AIといえばテキストや画像を生成するものと考えるかもしれませんが、家庭から収集したデータを分析し、パターンを識別したり、文脈を解釈したりすることもできます。これは、スマートホームに必要なインテリジェンスレイヤーを提供し、私たちをこれまでのコマンド&コントロールの世界から、アンビエントコンピューティングという約束の地へと導くことができます。このアップグレードにより、理論上は、アプリをいじったり、自動化を設定したり、音声アシスタントに必要な正確なフレーズを習得したりするのに何時間も費やすことなく、家庭が状況に積極的に反応し、対応できるようになります。

大きなハードルは 3 つあると思います。信頼性、速度、そして料金を支払う価値があることを証明することです。

「過去10年間で私たちが抱えていた最大のギャップは、そのインテリジェンス層です」とGoogle Homeのアニッシュ・カトゥカラン氏は語り、現在のGoogleアシスタント、Alexa、Siriのコマンド中心の性質がスマートホームの大きな制約となってきたと付け加えた。「業界として、私たちはこれをハードコーディングや、もしこうなったらこうするといった文法で解決してきました」。しかし、生成AIとLLMによって、アシスタントは私たちがより簡単にインタラクションできるインテリジェンス層になることができると彼は言う。「これは間違いなく転換点です」

Googleにとって、この転換は今月、「Gemini for Home」の展開とともに始まります。Googleのスマートホームエコシステム全体に追加される「基盤となるインテリジェンス」であるGemini for Homeは、Googleの既存のハードウェアすべてと新しいGoogle Homeアプリに搭載されます。ただし、最新のカメラやドアベル、そして近日発売予定のスマートスピーカー、そして将来発売される可能性のある新しいスマートディスプレイで最も効果的に機能します。

Google Homeスピーカー

AIを活用した新たな機能は、主にスマートホームアシスタントに焦点を合わせています。スマートホームアシスタントは、自然言語を理解し、使用し、自宅内外の出来事を理解、生成、要約する機能を備えています。これらの機能は、米国およびその他のいくつかの国で実施されている新しいオプトイン早期アクセスプログラムの一環として、徐々に追加されています。

Amazonでは、AI搭載のAlexa Plusアシスタントが3月から早期アクセスプログラムに導入されています。そして先週、Amazonは米国で販売される最新ハードウェアにAlexa Plusが「箱から出してすぐに使える」状態になると発表しました。

アマゾンのデバイスおよびサービス部門を率いるパノス・パナイ氏は、Alexa Plusと新しいハードウェアを組み合わせることで「魔法のようにつながる体験」が生まれ、スマートホームに変革をもたらすだろうと語った。

Amazonは先週、Alexa Plusを最適化するように設計されたRingの2つのスマートディスプレイと新しいカメラとともに、新しいEcho StudioとEcho Dot Maxを発売した。

スマートホームが単一用途のデバイスから集合知的な空間へと進化を遂げられず、毎年失望させられてきたスマートホームユーザーにとっては、これは空約束のように聞こえるかもしれません。しかし、Alexa Plusを数ヶ月使い、GeminiがGoogle Homeにもたらす機能をいくつか試してみた結果、その可能性が見えてきました。それも遠い未来に。

最も大きな変更点は、両方の音声アシスタントが、単に話す内容だけでなく、その意図を理解できるようになったことです。例えば、設置した電球の名前や裏口の鍵の名前を一つ一つ覚えておく必要はもうありません。「夕食を作るから、電気をつけて」といったフレーズで、どの部屋にいてもキッチンの電気が点灯するようになります。

また、接続されたガジェットの管理もより良くなるはずです。そうすれば、スマートホームは家庭内の誰にとってもよりシンプルになります。夫はこれまでAlexaのルーティンを作ったことがありませんでしたが、最近、毎晩午後10時に照明を消したいと言いました。設定できるかと尋ねられたので、Alexaに希望を伝えるだけでいいと伝えました。すると、夫は実際に設定してくれて、うまくいきました。夫は感心し、そして少なからず驚いていました。

Googleにも同様の機能が提供されていますが、機能は限定的です。新しいGoogle Homeアプリの「Ask Home」チャットボットは、音声やテキスト入力に応答し、ルーティンや自動化を作成できます。デモを見たところ、「もっと安全に過ごしたい」という質問をすると、照明のオンオフ、ドアや窓の開閉通知の設定、外出時にすべてのドアを施錠して照明を消すなど、自宅にいることをシミュレートするルーティンを提案してくれました。

スマートホームへの道のハードル

これらはすべてスマートホームのユーザビリティ向上という点で励みになりますが、業界は依然としてこれらのコマンドが常に機能することを保証する必要があります。多くのAlexa PlusやGeminiの初期ユーザーが指摘しているように、新しい音声アシスタントは古いスマートホームでは必ずしも動作しません。誰もがこれが課題であることを認めています。「法学修士(LLM)は創造性に優れていますが、同じことを何度も繰り返して予測可能な結果を​​出すのは得意ではありません」とカトゥカラン氏は言います。「前世代の機械学習は、まさにそれを実現するのが得意でした。私たちにとっての短期的な課題は、この2つを融合させることです。」

そのため、GoogleはGeminiの2つのバージョンをリリースします。Gemini for Homeは、自然言語を理解できる一方で、家庭向けに特化して設計された、より構造化されたアシスタントです。Gemini Liveは、よりクリエイティブで自由な会話を楽しめるチャットボットで、ウェイクワードを繰り返す必要はありません。一部のスマートスピーカーで、サブスクリプション制で利用可能になります。

Alexa Plusとは異なり、Gemini Liveはスマートホームを制御できず、いかなるアクションも実行できません。Kattukaran氏は、最終的にはこれら2つを統合する予定であり、Liveの機能こそがスマートホーム制御の未来だとKattukaran氏は考えています。しかし、Geminiのどちらのバージョンにも「学習曲線があり、初日から完璧になることはないだろう」と警告しています。

Amazonは異なるアプローチを取り、ホーム向けLLMに全力を注ぎました。Alexa Plusは、家電を操作したり自由に会話したりすることができます。同社は、新しいLLMを従来のスマートホームのより構造化されたAPIパスウェイに接続する方法を開発しました。「LLMは考え、ラウンドトリップを行い、適切なAPIを呼び出すようにしています」とパナイ氏は言います。「これが私たちの秘訣だと思います。このレベルに到達している企業は他にありません。」

実際には、Alexa Plusは指示通りに動作しないこともあります。チームは現在もこの乖離を修正するために作業を進めており、それがAlexa Plusがまだ早期アクセス段階にある理由の一つだと彼は言います。

Amazonによると、Alexa Plusは視覚言語モデルを用いてRingカメラの映像を解釈し、家の中で起きた出来事を要約できるという。今回のケースでは、実際には起こらなかった出来事、つまり誰も犬に餌を与えなかったことまでもが要約される。

古いものを新しいものに確実に置き換えることは、これらの企業が乗り越えなければならない最初のハードルです。これまでAlexa Plusをテストしてきた中で、以前と同じように動作しないケースが何度かありました。Alexa Plusが古いルーチンを認識しないため、やり直さなければなりませんでしたし、自然言語コマンドから製品名を解析できないため、あまり知られていないデバイスの名前を変更しなければなりませんでした。(私はLivというスマート蚊よけシステムを持っていますが、「Livをオンにして」と頼むと、Alexaはカメラのライブストリームを見せようとします。)

2つ目のハードルは、クラウドへの依存度が高いことです。Alexa PlusのテストとGemini for Homeの短いデモを見たところ、応答時間は従来のアシスタントと比べて明らかに遅く、10秒以上かかることもよくありました。

すべてが遅いわけではありません。ローカル接続するAlexaでMatterデバイスを制御する方が速く、Google Homeも同様の速度になるはずです。また、Amazonは、新しいOmnisenseプラットフォームがEchoスマートスピーカー上で一部のデータをローカル処理できると述べています。

しかし、Alexa Plusは主にクラウド上で動作します。「(クラウドの)遅延やセキュリティについては心配していません」とパナイ氏は言います。「チームは、お客様にバランスの取れたサービスを提供する方法を理解しています。」彼は、クラウドこそが最適なソリューションだと考えていると付け加えました。しかし、私はこれに反対です。常時接続のインターネットに依存するスマートホームは、機能不全のスマートホームです。

両社は、この新しいAIをスマートホームの待望の継続収益モデルと見なしている。

最後に、おそらく最も大きなハードルは、人々がお金を出しても買うような、本当に魅力的な製品を作り出す必要があることです。

両社とも、生成AIをスマートホームにおける待望の継続収益モデルと見なしていることは明らかです。AlexaとGoogle Assistantは登場から10年間は​​無料でしたが、これらの新バージョンでは、Geminiの高度な機能のほとんどを利用するには、PrimeメンバーシップまたはGoogle Home Premiumのサブスクリプションが必要です(旧バージョンのAlexaと自然言語対応のGeminiは無料でご利用いただけます)。また、主力機能の多くには、RingまたはNestのサブスクリプションも必要です。

Ring カメラからの AI によるテキスト説明など、Alexa Plus の新しいインテリジェンスの重要な機能には、サブスクリプションが必要です。

人々が追加料金を払ってでも手に入れたいと思うような製品が登場するまでには、まだ程遠い。しかし、何がその流れを変えるのだろうか? 家を制御するだけでなく、あなたに代わって管理までしてくれるプロアクティブなAIアシスタントは、十分な価値を提供できるだろうか? 両社ともその方向に進んでおり、彼らがどのような製品を生み出すのか、興味深いところだ。

「私たちは長年、AI警備員、AIペットシッター、AI高齢者介護といったビジョンを描いてきました」とカトゥカラン氏は語る。「これらは家庭における基本的なニーズであり、これらの要素を組み合わせることで、そのビジョンを実現し始めることができると考えています。」

Googleの新しい「Home Brief」は、自宅で行われたすべての行動を要約することができ、プロアクティブなシステムの基礎を築きます。Amazonの新しいOmnisenseプラットフォームは、Alexaが家の住人についてより深く理解し、適切な対応を行えるように支援します。両社のスマートセキュリティカメラは、AIによるテキストによる説明と顔認識技術のおかげで、AIアシスタントの仮想の目となりつつあります。

侵入型カメラへの依存を減らし、ミリ波、超広帯域無線、超音波、Soliレーダー、RFセンサーといった環境センサーの活用をもっと進めてほしい。もっとも、実装ははるかに難しいが。プライバシー重視のAppleや、ローカルコントロールに注力するHome Assistantのような企業が、魅力的なソリューションで参入できる分野だ。

生成型AIは真にインテリジェントな住宅を実現する鍵となるかもしれないが、そこに到達するにはまだ長い道のりがあることは明らかだ。そして、その競争は今始まる。

このストーリーのトピックと著者をフォローすると、パーソナライズされたホームページ フィードで同様の記事が表示され、電子メールによる更新を受け取ることができます。

  • ジェニファー・パティソン・トゥーイ