マヌス島はおそらく中国にとって第二の「ディープシークの瞬間」ではないだろう

マヌス島はおそらく中国にとって第二の「ディープシークの瞬間」ではないだろう

先週プレビュー版がリリースされた「エージェント型」AIプラットフォーム「Manus」は、テイラー・スウィフトのコンサートよりも大きな話題を呼んでいる。

Hugging Faceの製品責任者は、Manusを「これまで試した中で最も印象的なAIツール」と評しました。AI政策研究者のディーン・ボール氏は、Manusを「AIを活用した最も洗練されたコンピューター」と評しました。Manusの公式Discordサーバーはわずか数日間で13万8000人以上のメンバーに成長し、Manusの招待コードは中国の転売アプリXianyuで数千ドルで販売されていると報じられています。

しかし、この誇大宣伝が正当なものかどうかは明らかではない。

素晴らしい https://t.co/TfeV9QZ1d0

— ジャック(@jack)2025年3月9日

Manusは完全にゼロから開発されたわけではない。ソーシャルメディアの報道によると、このプラットフォームは、AnthropicのClaudeやAlibabaのQwenなど、既存のAIモデルと微調整されたAIモデルを組み合わせて使用​​し、調査レポートの作成や財務報告書の分析といったタスクを実行している。

しかし、Manusを開発している中国のスタートアップ企業Butterfly Effectのウェブサイトでは、不動産の購入からビデオゲームのプログラミングまで、このプラットフォームで実現できることの大胆な例をいくつか挙げている。

Xで話題になった動画の中で、Manusの研究リーダーであるYichao “Peak” Ji氏は、同社のプラットフォームがOpenAIのディープラーニングやOperatorといったエージェントツールよりも優れていることを示唆した。Ji氏によると、Manusは、Web閲覧やソフトウェアの使用など、AIが作業を実行する能力を測る汎用AIアシスタントのベンチマークであるGAIAにおいて、ディープラーニングを上回る性能を示しているという。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

「[Manus]は単なるチャットボットやワークフローではありません」とジ氏は動画の中で述べた。「構想と実行の間のギャップを埋める、完全に自律的なエージェントです。[…] 私たちはこれを、人間と機械の協働における次世代のパラダイムだと考えています。」

しかし、初期のユーザーの中には、マヌスが万能薬ではないと言う人もいます。

AIスタートアップPleiasの共同創業者であるアレクサンダー・ドリア氏は、Xの投稿で、Manusのテスト中にエラーメッセージと無限ループに遭遇したと述べています。他のXユーザーは、Manusが事実に関する質問で間違いを犯し、その研究成果を一貫して引用していないこと、そしてオンラインで簡単に見つかる情報を見逃していることを指摘しています。

Deep Researchは15分以内で完了しました。残念ながら、Manus AIは50分後にステップ18/20で失敗しました!😑 パフォーマンスはかなり良好で、Manusの出力を見ていましたが、非常に優れているように見えました。ただし、同じプロンプトを2回実行すると時間がかかりすぎて少しイライラします! https://t.co/bGtmOI65CP

— デリヤ・ウヌトマズ医学博士 (@DeryaTR_) 2025 年 3 月 8 日

私自身のマヌス島での経験は、それほど良いものではありませんでした。

配達範囲内にある人気ファストフード店でフライドチキンサンドイッチを注文するという、一見単純なリクエストをプラットフォームに処理してもらいました。ところが、約10分後、Manusはクラッシュしてしまいました。2回目の試みでは、条件に合うメニュー項目は見つかりましたが、注文手続きを完了できず、チェックアウトリンクすら提供されませんでした。

マヌス
マヌスでフライドチキンサンドイッチを注文するのは、なかなかイライラする経験だ。画像提供:マヌス

Manusは、ニューヨーク発日本行きの航空券を予約するように指示した際にも同様に失敗しました。曖昧さの余地がほとんどないと思われる指示(例えば「ビジネスクラスの航空券を検索し、価格と日程の柔軟性を優先する」など)に対して、Manusができたことは、複数の航空会社のウェブサイトやKayakなどの航空券検索エンジンの運賃へのリンクを提示することだけでした。しかも、その一部は機能していませんでした。

マヌス
マヌス社では今のところ東京行きの航空券を予約できません。画像クレジット:マヌス社

次の数回のタスクがうまくいくかもしれないと期待して、マヌスに徒歩圏内のレストランで一人分のテーブルを予約するように頼みました。しかし、数分後には失敗しました。次に、NARUTO風の格闘ゲームを作ってほしいとプラットフォームに依頼しました。ところが、30分後にエラーが発生し、諦めることにしました。

過去 3 日間 Manus AI を試した後の正直な意見、良い点と悪い点は次のとおりです。

良い点:
– インターネット上での調査と生成されるレポートは素晴らしい。
– スクリプトをバックグラウンドで実行してタスクを実行する機能は素晴らしい。
– プランは…

— AshutoshShrivastava (@ai_for_success) 2025年3月9日

マヌス社の広報担当者はTechCrunchにダイレクトメッセージで以下の声明を送った。

少人数のチームとして、私たちはManusを継続的に改善し、ユーザーの問題解決を実際に支援するAIエージェントの開発に注力しています。[…] 現在のクローズドベータ版の主な目的は、システムの様々な部分にストレステストを実施し、問題点を特定することです。皆様から共有いただいた貴重なご意見に深く感謝いたします。

では、マヌス島が技術的に期待していた成果を得られなかったのなら、なぜ破綻したのだろうか?招待枠の少なさがもたらした排他性など、いくつかの要因が影響している。

中国メディアはすぐにManusをAIの画期的進歩だと大々的に宣伝し、QQニュースは「国産品の誇り」と評した。一方、ソーシャルメディア上のAIインフルエンサーたちは、Manusの機能について誤情報を拡散した。広く共有された動画では、Manusと思しきデスクトッププログラムが複数のスマートフォンアプリを横断して操作する様子が映っていた。しかし、Ji氏は、この動画は実際にはManusのデモではないことを確認した。

X上の他の影響力のあるAIアカウントは、Manusと中国のAI企業DeepSeekを比較しようとしましたが、必ずしも事実に基づいたものではありませんでした。Butterfly EffectはDeepSeekとは異なり、自社でモデルを開発していませんでした。DeepSeekは多くの技術を公開していましたが、Butterfly Effectはそうではありませんでした。少なくとも今のところは。

Butterfly Effectに公平を期すために言うと、Manusはまだ早期アクセス段階です。同社はコンピューティング能力の拡張と、報告された問題の修正に取り組んでいると主張しています。しかし、現状のプラットフォームでは、Manusは技術革新よりも誇大宣伝が先行しているように見えます。

太平洋標準時午後6時2分更新:Manus社の広報担当者の声明を追加し、Manus社の背後にある会社の誤認を訂正しました。

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る