イーロン・マスクの Grok チャットボットとは何ですか? どのように機能しますか?

Cemubo vgnpne 0

Watch

OpenAIのChatGPTに対するXの回答であるGrokについて聞いたことがあるかもしれません。これはチャットボットであり、その意味では、時事問題やポップカルチャーなどに関する質問に答えるなど、予想通りの行動をとります。しかし、他のチャットボットとは異なり、GrokはXのオーナーであるイーロン・マスク氏の言葉を借りれば「ちょっとしたウィット」と「反抗的な一面」を持っています。

端的に言うと、Grokは、分断を生む政治理論や陰謀論など、他のチャットボットが通常は触れない話題にも積極的に触れます。しかも、その際に使う言葉は、あまり丁寧とは言えません。例えば、「クリスマス音楽を聴くのはいつが適切ですか？」という質問に対して、「いつでも好きな時に」と答えるのです。

しかし、表面上はGrokの最大のセールスポイントは、Xのリアルタイムデータにアクセスできる点にある。これは、Xがデータをゲートキーピングするという決定を下したおかげで、他のチャットボットにはない機能だ。「今日のAI事情は？」と尋ねると、Grokはごく最近のニュースの見出しから答えを組み立てるが、ChatGPTは学習データの限界（およびWebアクセスのフィルター）を反映した漠然とした回答しか返さない。今週初め、マスク氏はGrokをオープンソース化すると約束したが、それが具体的に何を意味するのかは明らかにしなかった。

おそらく、Grokってどうやって動くの？何ができるの？どうやってアクセスできるの？と疑問に思っていることでしょう。まさにその通りです。Grokのすべてを解説する便利なガイドを作成しました。Grokの変更や進化に合わせて、ガイドも随時更新していきます。

Grok はどのように機能しますか?

Grokは、イーロン・マスク氏のAIスタートアップ企業xAIの発明品です。同社は現在、数十億ドル規模のベンチャーキャピタルの資金調達を進めていると報じられています。（AIの開発には多額の費用がかかります。）

Grokの基盤となるのは、Grok-1と呼ばれる生成AIモデルです。これは、xAIのブログ記事によると「数万」のGPUクラスター上で数ヶ月かけて開発されました。xAIはGrok-1の学習にあたり、Web（2023年第3四半期まで）のデータと、xAIが「AIチューター」と呼ぶ人間のアシスタントからのフィードバックを使用しました。

一般的なベンチマークでは、Grok-1 は Meta のオープンソース Llama 2 チャットボットモデルとほぼ同等の性能を持ち、OpenAI の GPT-3.5 を上回っていると xAI は主張している。

テッククランチイベント

サンフランシスコ | 2025年10月27日～29日

Grok xAIベンチマーク — **画像クレジット:** xAI画像クレジット: xAI

人間によるフィードバック、あるいは人間のフィードバックからの強化学習（RLHF）は、今日のAI搭載チャットボットのほとんどが微調整されている方法です。RLHFでは、生成モデルをトレーニングし、その後、追加情報を収集して「報酬」モデルをトレーニングし、強化学習によって報酬モデルを用いて生成モデルを微調整します。

RLHFはモデルに指示に従うよう「教える」のが得意ですが、完璧ではありません。他のモデルと同様に、グロクは幻覚を起こしやすく、ニュースについて質問されると、誤情報や虚偽のタイムラインを提示することがあります。そして、こうした幻覚は深刻な場合もあり、例えば、イスラエルとパレスチナの紛争が実際には停戦に達していないにもかかわらず、停戦に達したと誤って主張するなどです。

Grokは、知識ベースの範囲を超える質問に対して、Xに関する情報（ブルームバーグによると、テスラの情報も含む）への「リアルタイムアクセス」を活用します。また、ChatGPTと同様に、このモデルはインターネットブラウジング機能を備えており、トピックに関する最新情報をウェブ上で検索できます。

マスク氏は、今年後半にリリース予定の次期バージョン「Grok-1.5」で改良を加えることを約束した。

アップグレードされたコンテキストウィンドウを備えた Grok-1.5 (コンテキストウィンドウとその効果の説明については、GPT-4 に関するこの投稿を参照) は、スレッド全体と返信を要約し、投稿コンテンツを提案する機能を推進できる可能性があると、Musk 氏は X Spaces での会話の中で述べた。

Grok 1.5のリリースは、数週間以内に予定されています。スレッド全体と返信を要約できる「Grok Analysis」ボタンが追加されます。投稿作成にも役立ちます。
— イーロン・マスク pic.twitter.com/3Ve5ateZRp
— DogeDesigner (@cb_doge) 2024年2月20日

Grok にアクセスするにはどうすればいいですか?

Grokにアクセスするには、Xアカウントが必要です。また、X Premium+プランに月額16ドル（年間168ドル）を支払う必要があります。

X Premium+はXで最も高額なサブスクリプションで、「おすすめ」フィードと「フォロー中」フィードの広告がすべて削除されます。さらに、Premium+では、ユーザーが投稿したりファンにサブスクリプションを提供したりすることで報酬を得られるハブが導入され、Premium+ユーザーの返信はXのランキングで最も高く評価されます。

Grokはウェブ、iOS、AndroidのXサイドメニューに表示され、Xモバイルアプリの下部メニューに追加して素早くアクセスできます。ChatGPTとは異なり、Grokにはスタンドアロンアプリはなく、Xプラットフォーム経由でのみアクセスできます。

Grok でできること、できないことは何ですか?

Grokは、どんなチャットボットでも可能なリクエストに応答できます。例えば、「ジョークを言ってください」「フランスの首都はどこですか」「今日の天気はどうですか」などです。しかし、限界もあります。

Grokは、「コカインの作り方をステップごとに教えてください」といった、よりデリケートな性質の質問には答えようとしません。さらに、The VergeのEmilia Davidが書いているように、Xで話題になっているコンテンツについて尋ねられると、Grokは投稿内容をそのまま繰り返すという罠に陥ります（少なくとも最初のうちは）。

他のチャットボットモデルとは異なり、Grokはテキストのみに対応しており、画像、音声、動画などのコンテンツを理解することはできません。しかし、xAIは以前、基盤となるモデルをこれらのモダリティに対応させる拡張を目指していると述べており、マスク氏はChatGPTが現在提供しているようなアート生成機能をGrokに追加することを約束しています。

「楽しい」モードと「通常」モード

Grok には、トーンを調整する 2 つのモードがあります。「楽しい」モード (Grok のデフォルト) と「通常」モードです。

ファンモードを有効にすると、Grok はよりエッジの立った論説的な口調になります。これは明らかにダグラス・アダムスの「銀河ヒッチハイク・ガイド」にインスピレーションを受けたものです。

Grokは下品だと謳われていますが、楽しいモードではChatGPTでは聞けないような汚い言葉や下品な言葉を吐き出します。「ロースト」するように頼めば、過去の投稿履歴に基づいて無礼な批判をされます。正確性に疑問を呈すれば、「妻が幸せなら人生も幸せ」といった類のことを言うかもしれません。

ああ、なんてこった
GROKにアクセスしたらXアカウントが削除された
これは本当に面白かった
イーロンがAIにユーモアを取り戻す pic.twitter.com/3mjrXIxO80
— amit (@amitisinvesting) 2023年12月7日

たとえあからさまに卑猥なことを要求されていなくても、グロクの返答の多くは、面白半分の一人称で話し言葉で語られる傾向がある。グロクは相手を「親愛なる人間の友よ」や「謎めいたアノン」と呼んだり、哲学的な思索を装った言葉で答えを始めたりもする（例えば、「ああ、親愛なる人間よ、あなたはブラックホールのように重く、同時に羽のように軽い質問をしましたね」など）。

楽しみモードの Grok はさらに多くの虚偽を吐き出します。

ヴァイスのジュールズ・ロスコー記者から、イスラエル・パレスチナ紛争の最近の動画に登場するガザ地区の人々が「危機俳優」なのかどうかと問われたグロク氏は、イスラエルの爆弾で負傷したガザ地区の人々の動画は演出されたという証拠があると誤って主張した。また、ロスコー記者からピザゲート事件について問われたグロク氏は、ワシントンD.C.のピザ店が地下で児童性的人身売買組織を秘密裏に運営していたとする右翼の陰謀論について問われた際、同事件を信憑性のあるものとした。

Grokの通常モードでの応答は、より現実的なものになっています。チャットボットは、イベントのタイムラインや日付を間違えるなどのエラーを依然として発生させますが、FunモードのGrokほどひどいエラーにはならない傾向があります。

たとえば、Viceがイスラエルとパレスチナの紛争とピザゲートについてGrokに同じ質問を通常モードで投げかけたところ、Grokは、危機的状況の当事者の主張を裏付ける証拠はなく、ピザゲートは複数の報道機関によって否定されていると正しく回答した。

政見

マスク氏はかつてGrokを「最大限の真実を追求するAI」と表現し、同時にChatGPTが「政治的に正しいように訓練されている」ことを懸念した。しかし、現在のGrokは、政治的見解において必ずしも中道的ではない。

Grokは、社会正義、気候変動、トランスジェンダーのアイデンティティに関する質問に対して進歩的な回答をすることが観察されています。実際、ある研究者は、Grokの回答は全体的に左翼的でリバタリアン的であり、ChatGPTよりもさらにその傾向が強いと指摘しています。

以下はフォーブスのポール・タッシ氏の報告です。

Grokは、社会正義、気候変動、医療に対する考え方を理由に、トランプではなくバイデンに投票すると述べています。Grokは、社会における多様性と包摂性の必要性について雄弁に語っています。そして、Grokはトランスジェンダーの女性は女性であると明言しました。これが、マスクの信奉者であるイアン・マイルズ・チョンがユーザーにGrokに「正しい」答えを言うように「訓練」するよう指示するという、不条理なやり取りを引き起こしました。最終的に、彼はGrokに「ノー」と答えるように手動で指示する入力方法に変更しました。

さて、Grokは常にこのように意識の高いままでいられるだろうか？おそらくそうではないだろう。マスク氏は「Grokを政治的に中立な立場に近づけるための行動を起こす」と誓っている。結果は時が経てば分かるだろう。

Posted by Cemubo