イーロン・マスク氏のAI企業xAIは水曜日遅くに、最新の主力AIモデル「Grok 4」をリリースし、月額300ドルの新しいAIサブスクリプションプラン「SuperGrok Heavy」を発表した。
Grokは、OpenAIのChatGPTやGoogleのGeminiといったモデルに対するxAIの回答であり、画像分析や質問への回答が可能です。ここ数ヶ月、Grokはマスク氏のソーシャルネットワーク「X」(xAIが最近買収)との連携をさらに強化しました。しかし、その一方で、Grokの不正行為は何百万人ものユーザーの目に留まるようになりました。
Grok 4への期待は高まっています。xAIの最新AIモデルは、今夏後半にリリースが予定されているOpenAIの次期AIモデル、GPT-5と競合することになります。
「学術的な問題に関しては、Grok 4は例外なく、あらゆる分野で博士号レベルを超えています」とイーロン・マスク氏は水曜日夜のライブ配信で述べた。「時には常識に欠けることもあるでしょうし、まだ新しい技術を発明したり、新しい物理学を発見したりはしていませんが、それは時間の問題です。」

Grok 4の発売は、イーロン・マスク率いる企業にとって激動の1週間の真っ只中に行われました。水曜日の早朝、リンダ・ヤッカリーノ氏が約2年間同社に在籍したXのCEOを退任しました。Xは後任をまだ発表していません。
ヤッカリーノ氏の辞任は、Grokの公式自動アカウントXが、ハリウッドの「ユダヤ人幹部」を批判しヒトラーを称賛する反ユダヤ主義的なコメントでユーザーを誘導してからわずか数日後に起きた。xAIはGrokのアカウントを一時的に制限し、不快な投稿を削除せざるを得なかった。この事件を受けて、xAIはGrokの公開システムプロンプトから最近追加されたセクションを削除したようだ。これはAIチャットボットが従うべき指示リストで、「政治的に不適切な」主張を躊躇しないように指示するものだった。
マスク氏とxAIのリーダーたちは、この事件について議論することをほとんど避け、代わりにGrok 4のパフォーマンスと機能に焦点を当てた。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
xAIは水曜日に、Grok 4とGrok 4 Heavyという2つのモデルを発表しました。後者は同社の「マルチエージェント版」で、パフォーマンスが向上しています。マスク氏によると、Grok 4 Heavyは複数のエージェントを同時に生成して問題に取り組み、それぞれのエージェントが「勉強会のように」それぞれの作業を比較することで最適な答えを見つけ出すとのことです。
同社は、Grok 4が、数学、人文科学、自然科学などの分野で数千ものクラウドソーシングされた質問に答えるAIの能力を測定する難易度の高いテストである「Humanity's Last Exam」を含む、複数のベンチマークで最高レベルのパフォーマンスを示していると主張しています。xAIによると、Grok 4は「ツール」なしで「Humanity's Last Exam」で25.4%のスコアを獲得し、GoogleのGemini 2.5 Pro(21.6%)やOpenAIのo3(高)(21%)を上回りました。
xAIは、「ツール」付きのGrok 4 Heavyは44.4%のスコアを達成し、ツール付きのGemini 2.5 Proの26.9%のスコアを上回ったと主張しています。
非営利団体Arc Prizeによると、GrokはARC-AGI-2テスト(AIが視覚パターンを識別するパズルのような問題で構成される、もう一つの難関ベンチマーク)で16.2%という最高スコアを達成したという。これは、次に優れた商用AIモデルであるClaude Opus 4のほぼ2倍のスコアだ。

xAIは、Grok 4およびGrok 4 Heavyに加え、これまでで最も高額なAIサブスクリプションプラン「SuperGrok Heavy」を月額300ドルで開始しました。このプランに加入すると、Grok 4 Heavyの早期プレビューと新機能への早期アクセスが提供されます。このプランは、OpenAI、Google、Anthropicが提供する超プレミアムプランに類似していますが、xAIは現在、主要なAIプロバイダーの中で最も高額なサブスクリプションを提供しています。
SuperGrok Heavyの加入者は、xAIが今後数ヶ月以内にリリース予定の新製品の一部に早期アクセスできる可能性があります。同社は水曜日、AIコーディングモデルを8月、マルチモーダルエージェントを9月、動画生成モデルを10月にリリースすると発表した。
xAIは、開発者がGrok 4モデルを使用してアプリケーションを構築できるよう、APIを通じてGrok 4をリリースしています。xAIのエンタープライズ部門への参入はまだ2か月しか経っていないものの、ハイパースケーラーと協力し、彼らのクラウドプラットフォームを通じてGrokを提供する予定です。
Grokはベンチマークにおいて最高レベルのパフォーマンスを誇っているものの、xAIがChatGPT、Claude、Geminiの真の競合として企業にGrokを売り込もうとする中で、最近の失敗を乗り越えるのは容易ではないかもしれない。企業がGrokの欠点も含めて導入する準備が整っているかどうかは、まだ分からない。
マックスウェル・ゼフは、TechCrunchのAI専門シニアレポーターです。以前はGizmodo、Bloomberg、MSNBCでAIの台頭やシリコンバレーの銀行危機などを取材してきました。サンフランシスコを拠点としています。取材以外の時間は、ハイキング、サイクリング、ベイエリアのグルメ巡りを楽しんでいます。
Maxwell からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal の mzeff.88 に暗号化されたメッセージを送信してください。
バイオを見る