アントロピックは、同社の新しいAIチャットボットモデルがOpenAIのGPT-4に勝ったと主張している。

アントロピックは、同社の新しいAIチャットボットモデルがOpenAIのGPT-4に勝ったと主張している。

Googleと数億ドル規模のベンチャーキャピタル(そしておそらく近いうちにさらに数億ドル規模の資金提供を受ける)の支援を受けるAIスタートアップ企業Anthropicは本日、GenAI技術の最新バージョンであるClaudeを発表しました。同社は、このAIチャットボットは性能面でOpenAIのGPT-4を凌駕していると主張しています。

アンスロピックの新しいGenAIであるClaude 3は、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opusという3つのモデルからなるファミリーで、Opusが最も強力です。アンスロピックによると、これらのモデルはいずれも分析と予測において「能力の向上」を示しており、ChatGPTやGPT-4、GoogleのGemini 1.0 Ultra(Gemini 1.5 Proは除く)などのモデルと比較して、特定のベンチマークにおいてパフォーマンスが向上しています。

注目すべきは、Claude 3がAnthropic初のマルチモーダルGenAIであるということです。つまり、GPT-4やGeminiの一部の派生モデルと同様に、画像だけでなくテキストも分析できます。Claude 3は、写真、チャート、グラフ、技術図表を処理し、PDF、スライドショー、その他のドキュメント形式から描画できます。

Claude 3は、GenAIのライバル製品よりも一歩進んで、1回のリクエストで複数の画像(最大20枚)を分析できます。これにより、画像の比較・対比が可能になるとAnthropicは述べています。

しかし、クロード3の画像処理には限界があります。

アントロピック社は、モデルによる人物識別を無効にしました。これは倫理的および法的影響を懸念してのことでしょう。また、同社は、Claude 3は「低品質」画像(200ピクセル未満)では誤認識を起こしやすく、空間推論(アナログ時計の文字盤の読み取りなど)や物体数え(Claude 3は画像内の物体の正確な数え方ができない)といったタスクでは問題を抱えていることを認めています。

アントロピック・クロード3
画像クレジット: Anthropic

Claude 3はアートワークを生成することもできません。モデルは画像分析のみを目的とします ― 少なくとも現時点では。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

アンスロピック社によると、テキストでも画像でも、Claude 3は従来機種と比較して、複数ステップの指示をより正確に理解し、JSONなどの形式で構造化された出力を生成し、英語以外の言語でも会話できるようになっているとのことです。また、Claude 3は「リクエストをより繊細に理解する」ようになったため、質問への回答を拒否する頻度も減少するとアンスロピック社は述べています。さらに、近いうちにモデルは質問への回答の出典を明示し、ユーザーが回答を検証できるようにします。

「Claude 3は、より表現力豊かで魅力的な応答を生成する傾向があります」とAnthropicはサポート記事に記しています。「従来のモデルと比較して、プロンプトや操作が容易になりました。ユーザーは、より短く簡潔なプロンプトで、望ましい結果が得られることに気づくはずです。」

これらの改善の一部は、Claude 3 の拡張されたコンテキストに由来しています。

モデルのコンテキスト、またはコンテキストウィンドウとは、モデルが出力を生成する前に考慮する入力データ(例:テキスト)を指します。コンテキストウィンドウが小さいモデルは、ごく最近の会話の内容さえも「忘れる」傾向があり、話題から逸れてしまうことがあり、多くの場合、問題を引き起こします。加えて、コンテキストウィンドウが大きいモデルは、取り込むデータの物語の流れをより適切に把握し、より文脈に富んだ応答を生成できます(少なくとも仮説的には)。

Anthropicによると、Claude 3は当初20万トークン(約15万語相当)のコンテキストウィンドウをサポートし、一部の顧客は最大100万トークン(約70万語)のコンテキストウィンドウを利用できるとのことです。これは、Googleの最新GenAIモデルである前述のGemini 1.5 Proと同等で、こちらも最大100万トークンのコンテキストウィンドウを提供しています。

さて、Claude 3 が以前のものよりアップグレードされているからといって、それが完璧であるという意味ではありません。

アントロピックは技術ホワイトペーパーの中で、Claude 3も他のGenAIモデルを悩ませている問題、すなわちバイアスや幻覚(つまり作り話)から逃れられないことを認めています。一部のGenAIモデルとは異なり、Claude 3はWeb検索ができず、2023年8月以前のデータを使用してのみ質問に答えることができます。また、Claudeは多言語対応ですが、一部の「リソースの少ない」言語については英語ほど流暢ではありません。

しかし、Anthropic は今後数か月以内に Claude 3 を頻繁にアップデートすることを約束しています。

「モデルインテリジェンスが限界に近づいているとは考えておらず、今後数か月以内にClaude 3モデルファミリーに[機能強化]をリリースする予定です」と同社はブログ投稿に書いている。

OpusとSonnetは現在、ウェブ、Anthropicの開発コンソールおよびAPI、AmazonのBedrockプラットフォーム、GoogleのVertex AI経由で利用可能です。Haikuは今年後半にリリース予定です。

価格の内訳は次のとおりです。

  • Opus: 入力トークン100万個あたり15ドル、出力トークン100万個あたり75ドル
  • ソネット:入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドル
  • Haiku: 入力トークン100万個あたり0.25ドル、出力トークン100万個あたり1.25ドル

これがクロード3です。しかし、これを3万フィートの視点から見るとどうなるのでしょうか?

以前お伝えしたように、Anthropicの野望は「AI自己学習」のための次世代アルゴリズムの開発です。このアルゴリズムは、メールの返信、調査、アートや書籍の生成などができるバーチャルアシスタントの構築に活用できる可能性があります。その一部は、 GPT-4 などの大規模言語モデルで既に実用化されています。

アントロピックは前述のブログ記事でこれについて示唆しており、クロード 3 に機能を追加して、クロードが他のシステムと対話し、「インタラクティブに」コーディングし、「高度なエージェント機能」を提供できるようにすることで、すぐに使える機能を強化する予定であると述べています。

この最後の部分は、OpenAIが、文書からスプレッドシートへのデータ転送や経費報告書の自動作成、会計ソフトへの入力といった複雑なタスクを自動化するソフトウェアエージェントの開発を目指していると報じられていることを想起させます。OpenAIはすでに、開発者がアプリに「エージェントのような体験」を組み込めるようにするAPIを提供しており、Anthropicもそれに匹敵する機能を提供することを目指しているようです。

アンスロピック社のGenAI訓練技術「コンスティテューショナルAI」の進化が楽しみです。同社によれば、この技術によりGenAIの行動はより理解しやすく、予測しやすく、必要に応じて調整しやすくなるとのことです。コンスティテューショナルAIは、AIモデルがシンプルな指針に基づいて質問に答え、タスクを実行することで、人間の意図にAIを合わせる方法を提供することを目指しています。例えば、クロード3号の場合、アンスロピック社はクラウドソーシングによるフィードバックに基づき、障害のある人々を理解し、アクセスできるようにモデルに指示する指針を追加したと述べています。

アントロピックの最終目的が何であれ、長期的な取り組みであることは間違いない。昨年5月に流出したプレゼン資料によると、同社は今後12ヶ月ほどで最大50億ドルの資金調達を目指しているという。これは、OpenAIとの競争力を維持するために必要な最低限の資金額と言えるかもしれない(そもそも、モデルのトレーニングは安価ではないのだ)。同社は着実に前進しており、GoogleとAmazonからそれぞれ20億ドルと40億ドルの出資とコミットメントを受けており、その他の支援者からも合わせて10億ドルを優に超える資金を調達している。