RabbitのWebベースの「大規模アクションモデル」エージェントが10月1日にr1に登場

RabbitのWebベースの「大規模アクションモデル」エージェントが10月1日にr1に登場

Rabbit r1は2024年初頭のマストハブガジェットでしたが、同社の大胆な約束が実現しなかったため、その期待は急速に薄れてしまいました。CEOのジェシー・リュウ氏は「発売初日に期待が高すぎた」と認めつつも、来週予定されているデバイスアップデートで、自慢の大型アクションモデルがついにウェブ上で無料公開されると述べました。

懐疑論者はこれを(当然のことながら)少なすぎる、遅すぎる、あるいは目標の変更とみなすかもしれないが、Web およびモバイル アプリ用のプラットフォームに依存しないエージェントを構築するという Rabbit の目標は、まだ大部分が理論的なものではあるものの、根本的な価値を持っている。

TechCrunchの取材に対し、リュ氏は過去6ヶ月間、出荷、バグ修正、応答時間の改善、そして細かな機能追加と、目まぐるしい日々を送ってきたと述べた。しかし、r1には16回の無線アップデートが行われたにもかかわらず、基本的な機能はLLMとの連携、あるいはUberやSpotifyといった7つの特定のサービスへのアクセスに限定されている。

「あれはLAMの初版で、データワーカーから収集した録音データでトレーニングされたものですが、汎用性はなく、それらのサービスにしか接続できません」と彼は述べた。それがLAMと呼ばれるものであったかどうかは、現時点ではほぼ議論の余地がある。モデルが何であれ、Rabbitがデビュー時に詳細に説明した機能は提供していなかったのだ。

画像クレジット:ウサギ

ジェネラリストウェブベースエージェント

しかし、Rabbit 社は、Lyu が私に実演してくれた LAM の、特定のアプリやインターフェースに特化しない最初の汎用バージョンをリリースする準備ができています。

このバージョンは、既存のWebVoyagerをベースにしたWebベースのエージェントで、コンサートのチケット購入、ウェブサイトの登録、オンラインゲームのプレイなど、あらゆる日常的なタスクの手順を推論します。「私たちの目標は非常に明確です。9月末には、r1でできることが一気に増えます。あらゆるウェブサイトでできることはすべてサポートされるはずです」とリュウ氏は述べています。(同社はその後、アップデートの最終日を10月1日と発表しました。)

タスクが与えられると、まずそのタスクをステップに分解し、画面上のボタン、フィールド、画像など、位置や外観に関係なく、それらを分析することでタスクの実行を開始します。そして、ウェブサイトの仕組みについて学習した内容に基づいて、適切な要素と対話します。

リモートで操作していたLyuさんを通して、映画祭用の新しいウェブサイトを登録するように指示しました。数秒ごとにGoogleでドメインレジストリを検索し、その中から一つ(スポンサー付きのものだったと思います)を選び、ドメインボックスに「film festival」と入力すると、表示された選択肢の中から「filmfestival2023.com」を14ドルで選択しました。厳密に言えば、「2025年向け」とか「ホラー映画祭」といった制約は何も与えていませんでした。

同様に、LyuがR1を検索して購入するように指示したところ、すぐにeBayにたどり着き、何十台も売りに出されていました。ユーザーにとっては良い結果だったかもしれませんが、報道陣にプレゼンテーションを行う会社の創設者にとってはそうではありませんでした!彼は笑い飛ばし、公式ウェブサイトからのみ購入するようにと付け加えて、もう一度指示を出しました。エージェントは成功しました。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

次に、Dictionary.comの日替わり単語ゲームをプレイさせました。少しばかりの迅速なエンジニアリングが必要でしたが(モデルは「ゲーム終了」ボタンを押すだけですぐに終了できるという抜け道を見つけました)、なんとか成功しました。

ところで、どのブラウザを使うのでしょうか?リュウ氏によると、クラウド上の新しいクリーンなブラウザを使うとのことですが、Chrome拡張機能のようなローカルバージョンも開発中とのこと。つまり、既存のセッションを利用できるようになり、サービスにログインする必要がなくなるということです。

そのため、ユーザーは当然のことながら(そして当然のことながら)、企業に自分の認証情報への完全なアクセス権を与えることに警戒感を抱いており、エージェントには認証情報は搭載されていません。Lyu氏は、将来的には、認証情報を含む、隔離された小さな言語モデルを非公開で呼び出してログインを実行できるようになると示唆しました。これがどのように機能するかは未解決の問題のようですが、この分野の新しさを考えると、ある程度は予想通りと言えるでしょう。

Rabbitウェブサイトに掲載されているアプリ内UI分析の例。画像提供: Rabbit

まだ学習中

デモを見て、いくつか気づいたことがありました。まず、この会社とその開発者たちに、(一部の人が信じているように)精巧な作り話ではないと信じるならば、これは実際に機能する汎用ウェブエージェントのように見えます。そして、それ自体が初めてではないとしても、消費者が簡単にアクセスできるものとしては間違いなく初めてでしょう。

「Excelや法務文書といった業種に特化した企業はありますが、これは消費者向けの総合エージェントとしては初の試みだと思います」とリュウ氏は述べた。「ウェブサイトで実現できることは何でもできるというのがコンセプトです。まずはウェブサイト向けの総合エージェントを、次にアプリ向けのエージェントを提供する予定です。」

第二に、迅速なエンジニアリングが依然として非常に必要であることが示されました。リクエストの伝え方によって、成功と失敗の分かれ目が容易に生まれ、一般消費者がそれを許容できるとは考えにくいでしょう。

リュ氏は、これはあくまで「プレイグラウンド版」であり、決して最終版ではないと警告した。また、完全に機能する汎用ウェブエージェントではあるものの、まだ多くの点で改善の余地があると指摘した。例えば、「このモデルは計画を立てるには十分賢いが、手順を省略するほど賢くはない」と同氏は述べた。ユーザーがeBayで電子機器を購入したくないことや、検索後にスポンサー検索結果の山を避けるためにスクロールダウンすべきことを「学習」することはできない。

モデルの改善のためにユーザーデータは収集されません — 今のところ。Lyu氏は、このようなシステムには基本的に評価方法がないため、改善が行われたかどうかを定量的に判断するのが難しいためだと説明しています。ただし、「ティーチモード」も近々追加される予定で、特定の種類のタスクの実行方法をモデルに教えることができます。

興味深いことに、同社はワープロ、音楽プレーヤー、そしてもちろんブラウザといったアプリと連携できるデスクトップエージェントの開発にも取り組んでいます。まだ初期段階ですが、既に機能しています。「目的地を入力する必要すらありません。コンピューターを操作しようとするだけです。インターフェースさえあれば、操作可能です。」

第三に、いまだに「キラーアプリ」、少なくとも明らかなキラーアプリは存在しません。エージェントは素晴らしいのですが、残念ながら1日8時間ブラウザの前に座っているので、個人的にはあまり使い道がありません。素晴らしいアプリケーションは確かにいくつかあるでしょうが、例えばロボット掃除機のようにブラウザベースのオートマトンがいかに便利であるかを明白に示すようなものは思い浮かびません。

またアプリではダメですか?

私は、Rabbit のビジネス モデル全体に​​対して、基本的に「これはアプリになる可能性がある」という一般的な異論を唱えました。

リュウは明らかにこの批判を何度も聞いており、自分の答えに自信を持っていた。

「計算してみれば、全く意味が分からない」と彼は言った。「確かに技術的には実現可能だが、初日からAppleとGoogleを怒らせることになるだろう。彼らは絶対にこれをSiriやGeminiより優れたものにすることはできないだろう。Appleの知能がGoogleのものをもっとうまくコントロールできるはずがないのと同じだ。逆もまた然りだ。しかも彼らは収益の30%も取る!もし最初からアプリを作っていたら、こんな勢いはなかっただろう。」

使用中のrabbit r1。ハンドモデル:ワシントン・ポストのクリス・ベラスコ氏。画像クレジット:デビン・コールドウェイ / TechCrunch

Rabbitの基本的な売り文句は、サードパーティ製のAIやデバイスが、ユーザーと同じように、他のすべてのサービスにアクセスし、それらを外部から操作できるというものだ。Lyu氏はこれを「クロスプラットフォームの汎用エージェントシステム」と呼んだ。「すべてのUIを制御します。まずはウェブサイトから始め、その後Windows、macOS、そしてスマートフォンへと展開していきます。」

そういえば、「将来的に携帯電話を作らないとは言っていません」。これは、より小型でシンプルなデバイスという当初の理念とは相反するのではないでしょうか? もしかしたらそうかもしれませんし、そうでないかもしれません。

その間、彼らは今年初めに約束したことを着実に実行に移し始めています。新型モデルは、今週中にOTAアップデートが配信され、すべてのR1オーナーに提供される予定です。アップデートの起動方法も同時にお知らせします。リュウ氏は、いつもの控えめな表現で、期待に胸を膨らませているユーザーに注意を促しました。

「期待値は正しく設定しています。完璧ではありません」と彼は言った。「人類がこれまでに達成した最高の成果に過ぎないのです。」