OpenAIがこれまでで最大のAIモデル「GPT-4.5 Orion」を発表

OpenAIがこれまでで最大のAIモデル「GPT-4.5 Orion」を発表

午後2時40分(太平洋標準時)更新:GPT-4.5のリリースから数時間後、OpenAIはAIモデルのホワイトペーパーから「GPT-4.5は最先端のAIモデルではない」という一文を削除しました。GPT-4.5の新しいホワイトペーパーにはこの一文は含まれていません。以前のホワイトペーパーへのリンクはこちらです。元の記事は以下です。

OpenAIは木曜日、待望のAIモデル「GPT-4.5」(コードネーム「Orion」)をリリースすると発表した。GPT-4.5はOpenAI史上最大のモデルであり、同社のこれまでのリリースよりも多くの計算能力とデータを用いてトレーニングされている。

OpenAI はホワイトペーパーの中で、その規模にもかかわらず、GPT-4.5 を最先端のモデルとは考えていないと述べています。

OpenAIの月額200ドルのプラン「ChatGPT Pro」の加入者は、木曜日から研究プレビューの一環としてChatGPTでGPT-4.5にアクセスできるようになります。OpenAIのAPIの有料プランを利用している開発者も、本日からGPT-4.5を利用できるようになります。他のChatGPTユーザーについては、ChatGPT PlusとChatGPT Teamに登録している顧客は来週中にモデルを入手できる予定だと、OpenAIの広報担当者がTechCrunchに語りました。

業界はOrionの登場を待ちわびており、Orionは従来のAI学習手法の実現可能性を示す先駆けとなると考える者もいる。GPT-4.5は、OpenAIがGPT-4、GPT-3、GPT-2、GPT-1の開発に用いたのと同じ主要技術、すなわち教師なし学習と呼ばれる「事前学習」段階で計算能力とデータ量を劇的に増加させる手法を用いて開発された。

GPT-4.5以前のすべてのGPT世代では、スケールアップによって数学、文章作成、コーディングなど、あらゆる領域でパフォーマンスが大幅に向上しました。実際、OpenAIはGPT-4.5のサイズ拡大により、「より深い世界知識」と「より高い感情知能」が得られたと述べています。しかし、データとコンピューティングのスケールアップによるメリットが頭打ちになり始めている兆候があります。いくつかのAIベンチマークにおいて、GPT-4.5は中国のAIスタートアップDeepSeek、Anthropic、そしてOpenAI自身による新しいAI「推論」モデルに匹敵しています。

OpenAIは、GPT-4.5の運用コストが非常に高いことを認めています。そのコストの高さから、同社は長期的にGPT-4.5をAPIで提供し続けるかどうかを検討中だと述べています。GPT-4.5のAPIにアクセスするには、OpenAIは開発者に対し、入力トークン100万語(約75万語)ごとに75ドル、出力トークン100万語ごとに150ドルを請求しています。これに対し、GPT-4oは入力トークン100万語あたり2.50ドル、出力トークン100万語あたり10ドルです。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

OpenAIはTechCrunchに共有されたブログ記事で、「GPT-4.5を研究プレビューとして公開することで、その長所と限界をより深く理解したいと考えています」と述べています。「私たちはまだGPT-4.5の能力を探求している段階であり、人々が予想外の方法でGPT-4.5をどのように活用するかを見るのが楽しみです。」

まちまちのパフォーマンス

OpenAIは、GPT-4.5が同社のAPIとChatGPTの大部分を支える主力モデルであるGPT-4oの代替品となることを意図したものではないことを強調しています。GPT-4.5はファイルや画像のアップロード、ChatGPTのキャンバスツールなどの機能をサポートしていますが、ChatGPTのリアルな双方向音声モードのサポートなどの機能は現時点では欠けています。

プラス面としては、GPT-4.5 は GPT-4o や他の多くのモデルよりもパフォーマンスが優れています。

OpenAIのSimpleQAベンチマーク(AIモデルを単純で事実に基づいた質問でテストする)において、GPT-4.5はGPT-4oやOpenAIの推論モデルであるo1、o3-miniよりも精度が高くなっています。OpenAIによると、GPT-4.5は他の多くのモデルよりも幻覚を起こす頻度が低いため、理論上は誤認識の可能性が低いと考えられます。

OpenAIは、同社の最高性能AI推論モデルの一つであるディープリサーチをSimpleQAに掲載しませんでした。OpenAIの広報担当者はTechCrunchに対し、ディープリサーチのこのベンチマークにおけるパフォーマンスを公表しておらず、比較対象としては適切ではないと主張しました。注目すべきは、AIスタートアップ企業Perplexityのディープリサーチモデルは、他のベンチマークではOpenAIのディープリサーチと同等のパフォーマンスを示しており、この事実の正確性に関するテストではGPT-4.5を上回っていることです。

SimpleQAベンチマーク。画像クレジット: OpenAI

コーディング問題のサブセットであるSWE-Bench Verifiedベンチマークにおいて、GPT-4.5はGPT-4oおよびo3-miniとほぼ同等の性能を示しましたが、OpenAIのディープリサーチやAnthropicのClaude 3.7 Sonnetには及びませんでした。別のコーディングテストであるOpenAIのSWE-Lancerベンチマーク(AIモデルの完全なソフトウェア機能を開発する能力を測定する)では、GPT-4.5はGPT-4oとo3-miniの両方を上回りましたが、ディープリサーチには及びませんでした。

OpenAIのSwe-Bench検証済みベンチマーク。画像クレジット: OpenAI
OpenAIのSWe-Lancer Diamondベンチマーク。画像クレジット: OpenAI

GPT-4.5は、AIMEやGPQAといった難解な学術ベンチマークにおいて、o3-mini、DeepSeekのR1、Claude 3.7 Sonnet(技術的にはハイブリッドモデル)といった主要なAI推論モデルの性能には及ばない。しかし、GPT-4.5は、これらのテストにおいて主要な非推論モデルと同等かそれ以上の性能を示しており、数学や科学関連の問題において優れた性能を発揮していることを示唆している。

OpenAIはまた、人間の意図を理解する能力など、ベンチマークでは十分に捉えきれない領域において、GPT-4.5が他のモデルよりも質的に優れていると主張しています。GPT-4.5はより温かく自然なトーンで応答し、ライティングやデザインといったクリエイティブなタスクでも優れたパフォーマンスを発揮するとOpenAIは述べています。

ある非公式テストでは、OpenAIはGPT-4.5と他の2つのモデル(GPT-4oとo3-mini)に、数式とコードに基づいてグラフィックを表示するためのフォーマットであるSVGでユニコーンを作成するよう指示しました。GPT-4.5は、ユニコーンに似たものを作成できた唯一のAIモデルでした。

左:GPT-4.5、中央:GPT-4o、右:o3-mini。画像クレジット: OpenAI

別のテストでは、OpenAIはGPT-4.5と他の2つのモデルに、「テストに失敗してつらい時期を過ごしています」というプロンプトに応答するように依頼しました。GPT-4oとo3-miniは役立つ情報を提供しましたが、GPT-4.5の応答が最も社会的に適切でした。

「今回のリリースを通じて、GPT-4.5の機能をより完全に把握できることを期待しています」とOpenAIはブログ投稿で述べた。「学術的なベンチマークが必ずしも現実世界の有用性を反映しているとは限らないことを認識しているからです。」

GPT-4.5の感情知能の活用例。画像クレジット: OpenAI

スケーリングの法則に異議を唱える

OpenAIは、GPT-4.5は「教師なし学習で可能なことの限界にある」と主張しています。それは確かに真実かもしれませんが、このモデルの限界は、事前学習の「スケーリング則」が今後も維持されないという専門家の推測を裏付けているようにも見えます。

OpenAIの共同創設者で元チーフサイエンティストのイリヤ・スツケバー氏は12月に、「データのピークに達した」と述べ、「私たちが知っているような事前学習は間違いなく終焉を迎えるだろう」と付け加えた。彼の発言は、AI投資家、創業者、研究者らが11月にTechCrunchの特集記事で共有した懸念を反映している。

事前学習のハードルへの対応として、OpenAIを含む業界は推論モデルを採用してきました。推論モデルは非推論モデルよりもタスクの実行に時間がかかりますが、より一貫性がある傾向があります。AI推論モデルが問題を「考える」ために使用する時間と計算能力を増やすことで、AIラボはモデルの能力を大幅に向上させることができると確信しています。

OpenAIは、最終的にGPTシリーズモデルを「o」推論シリーズと統合する予定で、今年後半にGPT-5をリリースする予定です。GPT-4.5は、学習コストが非常に高く、何度も遅延し、社内の期待に応えられなかったと報じられていますが、単独でAIベンチマークの王座を獲得することはないかもしれません。しかし、OpenAIはGPT-4.5を、はるかに強力なものへの足がかりと捉えているようです。