イーロン・マスク氏のAI企業xAIは月曜日遅くに、最新の主力AIモデル「Grok 3」をリリースし、GrokのiOSおよびWebアプリの新機能を公開した。
Grokは、OpenAIのGPT-4oやGoogleのGeminiなどのモデルに対するxAIの回答であり、画像を分析して質問に答えることができ、マスクのソーシャルネットワークであるXの多くの機能に利用されている。数か月間開発されてきたGrok 3は、楽観的に言えば2024年のリリースが予定されていたが、その期限には間に合わなかった。
月曜日は野心的なローンチです。
xAIは、メンフィスにある約20万台のGPUを備えた巨大なデータセンターを使用してGrok 3をトレーニングしてきました。Xへの投稿で、マスク氏は、Grok 3は、裁判資料などを含む拡張トレーニングセットを使用して、前身のGrok 2よりも「10倍」(またはそれ以上)のコンピューティング能力で開発されたと主張しました。

「Grok 3はGrok 2よりも桁違いに能力が高い」とマスク氏は月曜日のライブストリーミングプレゼンテーションで述べた。「たとえその真実が政治的に正しいとされることと矛盾する場合でも、真実を最大限に追求するAIだ」
Grok 3は、正確にはモデルのファミリーです。Grok 3の小型版であるGrok 3 miniは、精度を多少犠牲にしながらも、より迅速に質問に回答します。Grok 3のすべてのモデルと関連機能はまだ利用可能ではありませんが(一部はベータ版です)、月曜日から展開が開始されました。
xAIは、Grok 3がAIME(数学のサンプル問題に対するモデルのパフォーマンスを評価する)やGPQA(博士課程レベルの物理学、生物学、化学の問題を用いてモデルを評価する)などのベンチマークでGPT-4oを上回ったと主張しています。xAIによると、Grok 3の初期バージョンは、異なるAIモデルを互いに競わせ、ユーザーが好みの回答に投票するクラウドソーシングテストであるChatbot Arenaでも競争力のあるスコアを獲得しました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日

新しいGrok 3ファミリーの2つのモデル、Grok 3 ReasoningとGrok 3 mini Reasoningは、OpenAIのo3-miniや中国のAI企業DeepSeekのR1といった「推論」モデルと同様に、問題を慎重に「考え抜く」ことができます。推論モデルは結果を出す前に自ら事実確認を試みるため、通常モデルが陥りやすい落とし穴を回避するのに役立ちます。
xAI は、Grok 3 Reasoning が、AIME 2025 と呼ばれる新しい数学ベンチマークを含むいくつかの一般的なベンチマークで、o3-mini の最高バージョンである o3-mini-high を上回っていると主張しています。

これらの推論モデルは、Grokアプリからアクセスできます。ユーザーはGrok 3に「考えろ」と指示するか、より複雑なクエリの場合は「ビッグブレイン」モードを利用して、追加のコンピューティング能力を活用した推論を行うことができます。xAIは、これらの推論モデルが数学、科学、プログラミングの問題に最適であると説明しています。
マスク氏は、Grokアプリでは推論モデルの「思考」の一部が隠蔽されていると述べた。これは、AIモデル開発者が他のモデルから知識を抽出するために用いる手法「蒸留」を防ぐためだ。最近、DeepSeekはOpenAIのモデルを蒸留して独自のモデルを作成したとして非難された。
Grokの推論モデルは、Grokアプリの新機能「DeepSearch」の基盤となっています。これは、OpenAIのディープリサーチのようなAIを活用した研究ツールに対するxAIの回答です。DeepSearchはインターネットとXをスキャンして情報を分析し、質問に対する回答の要約を提供します。
XのPremium+プラン(月額50ドル)の加入者は、まずGrok 3にアクセスできるようになります。その他の機能は、xAIがSuperGrokと呼ぶ新プランでのみ利用可能です。SuperGrokは月額30ドル、または(リーク情報が正しければ)年額300ドルで提供され、追加の推論機能とDeepSearchクエリが利用可能になり、画像生成も無制限に行えます。

マスク氏によると、今後、早ければ約1週間後にはGrokアプリに「音声モード」が追加され、Grokモデルに合成音声が付与されるという。さらに数週間後には、DeepSearch機能とともに、Grok 3モデルがxAIのエンタープライズAPI経由で利用可能になる。
xAIは今後数ヶ月以内にGrok 2をオープンソース化する予定だとマスク氏は語った。
「私たちの基本的な考え方は、次のバージョンが完全にリリースされたら、Grokの最新バージョンをオープンソース化するということです」と彼は続けた。「Grok 3が成熟し安定したら、おそらく数ヶ月以内にGrok 2をオープンソース化する予定です。」
マスク氏が約2年前にGrokを発表した際、彼はこのAIモデルをエッジの効いた、フィルターを通さない、そして反「Woke(覚醒)」的なもの、つまり他のAIシステムが答えないような物議を醸す質問にも喜んで答える、と売り込んだ。そして、その約束の一部は果たした。例えば、下品な質問をするように言われると、GrokとGrok 2は喜んで従い、ChatGPTではまず聞かれないような、色彩豊かな言葉を吐き出すのだ。
しかし、Grok 3以前のGrokモデルは政治的な話題については慎重で、特定の境界線を越えようとしませんでした。実際、ある調査では、Grokはトランスジェンダーの権利、多様性プログラム、不平等といったテーマにおいて政治的に左寄りであることが示されています。
マスク氏は、この動作はGrokのトレーニングデータ(公開ウェブページ)に起因すると非難し、「Grokを政治的に中立な状態に近づける」と誓った。xAIがこの目標を達成したかどうか、そしてその結果がどうなるかはまだ明らかではない。
TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください。