今朝の大々的な発表から数時間後、Humaneは少数の報道陣にオフィスを開放した。サンフランシスコのSoMa地区にある目立たない建物に構えるこのオフィスは、このスタートアップのハードウェア設計チームの本拠地となっている。
隣のオフィスにはHumane社の製品エンジニアが勤務し、通りを挟んだ向かい側のオフィスでは電気工学チームが業務を行っています。同社はニューヨークにもオフィスを構えていますが、250名の従業員の大部分はここサンフランシスコにいます。
現在、スペースの大部分は一連のデモステーション(撮影禁止)で占められており、様々なAIピンが様々な服装で並べられ、その外観上の仕組みが明らかにされています。しかし、これらのデモに参加する前に、Humaneの共同創設者たちは、会社のビジョンを示すフラットスクリーンを挟んで、小さな椅子の前に立っています。
CEOのベサニー・ボンジョルノ氏は、Apple入社初日に共同創業者兼社長のイムラン・チャウドリ氏と出会った経緯から、同社の歴史を簡潔に説明する。同社の歴史は全て、かつての雇用主に遡る。そこで彼らは、CTOのパトリック・ゲイツ氏をはじめ、約90名の元Apple社員を引き抜いたのだ。

一方、チャウドリ氏は、同社の歴史をS字カーブ、つまり15年周期の技術革新が基盤を形成し、最終的には次世代へと道を譲るサイクルに例える。「前の時代は停滞した」と彼は聴衆に語りかけ、スマートフォンは「16年目」だと述べた。しかし、これもまた、最初のiPhoneを2007年に発売した元雇用主への皮肉めいた言い回しのようにも見える。
彼はHumaneの最初の製品を「新しい考え方、新しい機会感覚」と位置づけ、さらに「AIを製品化」するための取り組みだと付け加えた。対面でのプレゼンテーションは、以前のビデオで想像していたよりも、はるかに現実的なものだった。確かに、プレゼンテーションの発言は依然として壮大で包括的であり、襟に装着するこのデバイスを、部屋ほどの大型メインフレームから始まったコンピューティングの旅の次のステップとして位置づけている。しかし、実際にデバイスが目の前に展開されると、会話はより現実的なものになった。
マッチ箱サイズのこのデバイスは、Snapdragonプロセッサと32GBのローカルストレージを搭載しています。カメラはスマートフォン用に設計された12メガピクセルセンサーですが、Humane独自のモジュールに統合されています。加速度計、ジャイロスコープ、深度センサー、飛行時間センサーも搭載されています。Apple製品と同様に、カリフォルニアで設計され、主にアジアで製造されています。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
デバイスの外装の大部分は、搭載部品の大半を収めたタッチパネルと、4~5時間駆動するバッテリーで占められています。その上には、カメラバーのようなものが配置され、上記のセンサーとレーザー投影システムが組み込まれています。レーザー投影システムは、このデバイス全体の中でも群を抜いて視覚的に目を引く部分です。カメラバーは下向きに傾斜しています。Humane社によると、様々な体型のユーザーでピンをテストした結果、胸囲の大きいユーザーにも対応できるデザインに落ち着いたとのことです。
同社はまた、レーザー投影が視認性を確保するため、肌の色の異なる様々な人を対象にテストを行ったと説明している。視覚的に魅力的ではあるものの、この投影は本質的に音声重視の製品においては副次的な機能と捉えられている。しかし、デバイス上部にある小さな上向きスピーカーが聞こえないほど騒がしい、あるいは静かすぎる環境にいる場合は、タッチパッドをタップするとカメラが手を探し始め、手が見つかると投影を開始する。

チャウドリ氏は5月のTEDトークでこの機能を実演しました。1~2分経つと、ボンジョルノ氏から電話がかかってきて、ピンがテキスト形式で彼の手のひらに投影します。そこからボンジョルノ氏は手のひらをタップして電話に出たり拒否したりできます。システムがその動きを認識し、それに応じて動作します。
しかし、レーザーははるかに多くの情報を表示できます。メッセージのテキストを表示し、同じ手でピンチインすることでスクロールできます。撮影した画像の簡易プレビューも表示できますが、緑色のレーザーは写真の微妙なディテールを強調するのにはあまり適していません。
AI Pinは少し重量がありますが、同梱の「バッテリーブースター」のおかげで、バッテリー駆動時間は約9時間となり、その重さはある程度相殺されます。また、卵型のケースも付属しており、これを使うとさらにフル充電できます。Pin、ブースター、または両方をケースに差し込むと、磁石でカチッと固定されます。充電は、本体背面のピンに差し込むことで行います。また、家庭用充電パッドも同梱されています。
ボンジョルノ氏は、当初の報道で報じられていた初期ロット10万台を正式に認めた。「他のハードウェアスタートアップと同様に、あらゆるシナリオを想定して慎重に計画を立てたいと考えています」と彼女は語る。「当初は、需要の観点と、需要が10万台を超えた場合の選択肢を確保するために、何が保守的で、正しく、責任ある行動なのかを真剣に検討していました。」
彼女はさらに、昨日時点で11万人以上が待機リストに登録していると述べた。ただし、この数字は購入予定者数というよりは、むしろ好奇心の表れであり、頭金は不要だった。リストは世界中に広がっているが、このデバイスは米国でのみ予約注文が可能で、米国では「来年初旬」に発売される予定だ。最初の待機リストのグループには、製品購入の「優先アクセス」が与えられる。

このデバイスの心臓部はAIです。生成型AIをめぐる現在の盛り上がりの波に乗った先駆的なハードウェア製品の一つですが、これが最後になることは間違いありません。サム・アルトマン氏の名前は、発表当初からこのスタートアップと密接に結びついています。アルトマン氏とOpenAIは、この製品の開発にどの程度深く関わっていたのでしょうか。
「2020年のシリーズAはサムがリードしました。イムランは、サムがシリーズAのターゲットであり、ぜひ参加してもらいたいと明確に言っていました」とボンジョルノ氏は語ります。「コンピューターの未来を私たち全員が信じていたことに対して、お互いに深い尊敬と期待を抱いていたと思います。彼は私たちの素晴らしい支持者であり、サポーターであり、アドバイスやガイダンスが必要な時はいつでも電話をかけてくれます。私たちはOpenAIチームと協力し、エンジニアリングチームとも緊密に連携してきました。」
チャウドリ氏によると、GPTはシステムが活用する多くのLLMの一つです。また、GPT-4もシステムが使用するインスタンスの一つとなることも確認しました。しかし、最終的には、特定のタスクに活用されるAIシステムの精度は、設計上、やや曖昧になっています。ピンが適切な行動方針を決定することで、ケースバイケースでアクセスされるのです。
これはウェブベースのクエリにも当てはまります。システムは様々な検索エンジンやWikipediaなどのリソースをクロールします。公式コンテンツパートナーもいれば、そうでないものもあります。今のところ、パートナーは限られています。OpenAIとMicrosoftに加え、システムのデフォルトの音楽アプリとして機能しているTidalもあります。デモで示された例は、「Princeがプロデュースした音楽を再生する」というものでした。これは、より単純な「Princeの曲を再生する」という表現とは異なります。
「当社のAIの一部は独自のものです。独自のAIを構築し、GPTやOpenAIのモデルなどを活用しています」とボンジョルノ氏は語る。「LLMや他社の多くのサービスも追加できます。私たちの目標は、誰もが利用できるプラットフォームとなり、様々なAI体験やサービスにアクセスできるようにすることです。そのため、ビジネスモデルはそれを可能にするように構築されています。また、プラットフォーム上に様々な収益モデルや収益源を追加することも検討していく予定です。」

目標は、LLM(言語モデル)やウェブ検索、アップデートといったバックエンドでの処理の両面において、シームレスな体験を提供することです。このシステムは、継続的にアップデートをプッシュし、バックグラウンドで新機能を追加するように設計されています。また、搭載GPSを活用し、最近尋ねられた質問や位置情報といった追加のコンテキスト情報も活用します。
写真もまた、パズルの大きなピースです。搭載カメラは120度の視野角を持つ超広角レンズを搭載しています。オートフォーカスは搭載されておらず、固定焦点距離です。少なくともサンフランシスコのオフィスの照明の下では、写真はしっかりと写っていました。撮影時にピンが水平かどうかを考慮し、それに応じて最終画像の向きを調整するなど、デバイス上でかなりの量のコンピュテーショナルフォトグラフィーが行われます。
すべてがまだ初期段階のように感じられますが、製品に多大な労力(と資金)が注ぎ込まれたことは明らかです。最大の疑問符は需要かもしれません。Humaneは本当にキラーアプリを見つけたのでしょうか?スマートウォッチメーカーにとって、健康管理は長年その答えでした。しかし、健康トラッキングの役割はここで大幅に縮小されています。
この製品は着用者の肌に直接接触するわけではないため、収集できる健康指標は、おそらく歩数計としての機能以外には限定されています。ただし、この機能も現在はサポートされていません。現時点で最大の健康関連機能はカロリー計算で、具体的には、名前が伏せられたサードパーティの食品識別プラットフォームを使用して、カメラにかざした食べ物のカロリーやその他の栄養成分を表示します。

未だ実績のないデバイスにとって、価格は確かにハードルとなるだろう。699ドルはスマートフォンの基準からすれば大した金額ではないが、第一世代の製品と新しいフォームファクターに求めるには高額すぎる。月額24ドルの追加料金も問題だが、ボンジョルノ氏はこう付け加える。「電話番号が付与され、通話、テキスト、データが使い放題になる。さらに、当社のAIサービスすべてに加えて、AIクエリも好きなだけ利用できる。ChatGPTがこれほどまでに盛り上がっていることを実感している。既に多くの人が料金を支払ってアクセスしている」
ただし、その月に支払いを行わない場合、サブスクリプションを開始するまで、製品は実質的に文鎮となってしまいます。
セッション終了前に、チャウドリ氏に、なぜヘッドマウントディスプレイが主流だったにもかかわらず、なぜあえて襟型のディスプレイを採用したのかを尋ねてみた。確かに、彼の元雇用主であるAppleは、近々発売されるVision Proで顔に賭けている。
「コンテクスチュアル・コンピューティングは、これまで顔に装着するものだと思われてきました」と彼は語る。「しかし、それには多くの問題があります。多くの人は、非常に明確な理由があって眼鏡をかけています。それは、見やすくするため、あるいは目を保護するためです。フレームの形や重さなど、それは非常に個人的な決定です。すべてが、あなたと同じくらいユニークなものに関わってきます。コンテクスチュアル・コンピューティングを実現する上で、コンテクスチュアル・コンピューティングの力、そしてそれが障害となっていることを考えると、別の方法があるはずです。そこで私たちは、よりパーソナルなものを可能にする要素は何かを探り始めました。私たちは皆、服を着ているという事実に着目しました。では、服のコンテクスト情報を提供するデバイスをどのように装着できるでしょうか?」