アンスロピックは木曜日に開催された初の開発者会議で、少なくとも一般的なベンチマークでのスコアで言えば業界最高クラスである2つの新しいAIモデルを発表した。
アンスロピック社によると、同社の新しいClaude 4ファミリーモデルの一部であるClaude Opus 4とClaude Sonnet 4は、大規模なデータセットの分析、長期的なタスクの実行、複雑なアクションの実行が可能だという。両モデルはプログラミングタスクで優れたパフォーマンスを発揮するように調整されており、コードの作成と編集に適しているという。
有料ユーザーと同社の無料チャットボットアプリのユーザーの両方がSonnet 4にアクセスできますが、Opus 4にアクセスできるのは有料ユーザーのみです。AmazonのBedrockプラットフォームとGoogleのVertex AIを介したAnthropicのAPIの場合、Opus 4は100万トークン(入力/出力)あたり15ドル/75ドル、Sonnet 4は100万トークン(入力/出力)あたり3ドル/15ドルとなります。
トークンとは、AIモデルが処理する生のデータのことです。100万トークンは約75万語に相当し、これは『戦争と平和』の約16万3000語分の長さに相当します。

アンスロピックは、収益の大幅な増加を目指しており、Claude 4モデルを発表しました。報道によると、元OpenAI研究者によって設立された同社は、2027年には年間22億ドルの収益を予想しており、120億ドルの収益達成を目指しています。アンスロピックは最近、25億ドルの信用枠を設定し、フロンティアモデルの開発コストの上昇を見込んでAmazonをはじめとする投資家から数十億ドルの資金を調達しました。
AI競争において、ライバル企業はポールポジションを維持することを容易なものにしていません。Anthropic社は今年初めに、新たな主力AIモデル「Claude Sonnet 3.7」と、エージェント型コーディングツール「Claude Code」をリリースしましたが、OpenAIやGoogleなどの競合他社は、強力なモデルと独自の開発ツールでAnthropic社を凌駕しようと競い合っています。
Anthropic は Claude 4 と真剣に取り組んでいます。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
本日発表された2つのモデルのうち、より高性能なOpus 4は、ワークフローの多くのステップにわたって「集中的な作業」を維持できるとAnthropic社は述べています。一方、Sonnet 4はSonnet 3.7の「代替品」として設計されており、Anthropic社の以前のモデルと比較してコーディングと計算処理能力が向上し、より正確に指示に従うと同社は述べています。
Claude 4ファミリーはSonnet 3.7よりも「報酬ハッキング」を行う可能性が低いとAnthropicは主張しています。報酬ハッキングは仕様ゲーミングとも呼ばれ、モデルがタスクを完了するために近道や抜け穴を利用する行動です。
誤解のないよう明確に述べておくと、これらの改良によって、あらゆるベンチマークで世界最高のモデルが誕生したわけではありません。例えば、Opus 4は、モデルのコーディング能力を評価するために設計されたSWE-bench Verifiedにおいて、GoogleのGemini 2.5 ProやOpenAIのo3、GPT-4.1を上回っていますが、マルチモーダル評価のMMMUや、博士課程レベルの生物学、物理学、化学関連の設問からなるGPQA Diamondではo3を上回ることはできませんでした。

それでも、アンスロピックは、強化された有害コンテンツ検出機能やサイバーセキュリティ対策など、より厳格な安全対策を講じた上でOpus 4をリリースしています。同社は、社内テストの結果、Opus 4はSTEM分野の知識を持つ者による化学兵器、生物兵器、核兵器の入手、製造、配備能力を「大幅に向上させる」可能性があり、アンスロピックの「ASL-3」モデル仕様に達する可能性があると主張しています。
アントロピック社によると、Opus 4とSonnet 4はどちらも「ハイブリッド」モデルであり、ほぼ瞬時の応答と、より深い推論のための拡張思考(人間が理解する概念と同様にAIが「推論」および「思考」できる範囲)が可能です。推論モードをオンにすると、モデルは回答を出す前に、与えられた問題に対する可能な解決策をより時間をかけて検討できます。
アンスロピック社によると、モデルが推論を行う際には、思考プロセスの「ユーザーフレンドリーな」要約を表示するとのことだ。なぜ全体を見せないのか?アンスロピック社はTechCrunchに提供されたブログ記事の草稿の中で、その理由の一つはアンスロピック社の「競争優位性」を守るためだと認めている。
Opus 4とSonnet 4は、検索エンジンなどの複数のツールを並行して使用し、推論とツールを交互に使用することで回答の質を向上させることができます。また、事実を抽出して「メモリ」に保存することで、タスクをより確実に処理し、Anthropicが「暗黙知」と呼ぶものを時間の経過とともに構築します。
モデルをよりプログラマーフレンドリーにするため、Anthropicは前述のClaude Codeのアップグレードを展開しています。開発者がAnthropicのモデルを使って特定のタスクをターミナルから直接実行できるようにするClaude Codeは、IDEとの統合が可能になり、開発者がサードパーティ製アプリケーションと接続できるSDKも提供されます。
今週初めに発表された Claude Code SDK により、サポートされているオペレーティング システム上で Claude Code をサブプロセスとして実行できるようになり、Claude モデルの機能を活用する AI 搭載のコーディング アシスタントやツールを構築できるようになります。
Anthropicは、MicrosoftのVS Code、JetBrains、GitHub向けのClaude Code拡張機能とコネクタをリリースしました。GitHubコネクタを使用すると、開発者はClaude Codeにタグを付けてレビュー担当者のフィードバックに返信したり、コード内のエラーを修正したり、コードを変更したりすることができます。
AIモデルは依然として高品質なソフトウェアのコーディングに苦労しています。コード生成型AIは、プログラミングロジックの理解能力といった弱点により、セキュリティ上の脆弱性やエラーを招く傾向があります。しかし、コーディングの生産性を向上させるというAIの期待から、企業や開発者はAIを急速に導入しています。
Anthropic はこれを痛感しており、より頻繁なモデル更新を約束しています。
「私たちは…より頻繁なモデルアップデートに移行し、お客様に画期的な機能をより早くお届けできるよう、継続的な改善を継続的に提供していきます」と、スタートアップは投稿草稿に記しています。「このアプローチにより、私たちは継続的にモデルを改良・強化し、お客様を常に最先端技術の領域に導いていきます。」