OpenAIは木曜日、最新の小型AIモデル「GPT-4o mini」を発表しました。OpenAIによると、同社の現行の最先端AIモデルよりも安価で高速なGPT-4o miniは、本日より開発者向けに、また一般ユーザー向けにはChatGPTのWebアプリとモバイルアプリを通じてリリースされます。エンタープライズユーザーは来週からアクセス可能になります。
同社によると、GPT-4o miniは、テキストと画像を含む推論タスクにおいて、業界をリードする小型AIモデルを上回る性能を発揮します。小型AIモデルの性能向上に伴い、GPT-4 OmniやClaude 3.5 Sonnetといった大規模モデルと比較して、速度とコスト効率に優れていることから、開発者の間で人気が高まっています。開発者がAIモデルに繰り返し実行を依頼するような、大規模で単純なタスクには、小型AIモデルが便利な選択肢となります。
GPT-4o miniは、OpenAIが提供する最小モデルとしてGPT-3.5 Turboに取って代わります。Artificial Analysisのデータによると、OpenAIは最新のAIモデルが推論能力を測定するベンチマークであるMMLUで82%のスコアを獲得したと発表しています。これは、Gemini 1.5 Flashの79%、Claude 3 Haikuの75%を上回っています。また、数学的推論能力を測定するMGSMでは、GPT-4o miniは87%のスコアを獲得しました。これは、Flashの78%、Haikuの72%を上回っています。

さらにOpenAIによると、GPT-4o miniは以前のフロンティアモデルよりも大幅に運用コストが低く、GPT-3.5 Turboよりも60%以上安価です。現在、GPT-4o miniはAPIでテキストと画像をサポートしており、OpenAIによると、将来的にはビデオとオーディオ機能もサポートする予定です。
「世界中のあらゆる場所でAIの恩恵を受けられるようにするには、モデルをより手頃な価格にする必要があります」と、OpenAIのプロダクトAPI責任者であるオリヴィエ・ゴデメント氏はTechCrunchのインタビューで述べた。「GPT-4o miniは、その方向への大きな一歩だと考えています。」
OpenAIのAPIを利用して開発を行う開発者向けに、GPT4o miniは入力トークン100万個あたり15セント、出力トークン100万個あたり60セントで提供されています。このモデルのコンテキストウィンドウは12万8000トークン(書籍1冊分程度)で、知識のカットオフは2023年10月です。
OpenAIはGPT-4o miniの正確な規模を明らかにしていませんが、Llama 3 8b、Claude Haiku、Gemini 1.5 Flashといった他の小型AIモデルとほぼ同レベルだと述べています。しかし、同社はLMSYS.orgのチャットボット分野でのリリース前テストに基づき、GPT-4o miniは業界をリードする小型モデルよりも高速で、コスト効率が高く、スマートであると主張しています。初期の独立系テストでは、このことが裏付けられているようです。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
「同等のモデルと比較して、GPT-4o miniは非常に高速で、平均出力速度は1秒あたり202トークンです」と、Artificial Analysisの共同創設者であるGeorge Cameron氏はTechCrunchへのメールで述べています。「これはGPT-4oやGPT-3.5 Turboの2倍以上の速度であり、多くのコンシューマーアプリケーションやLLMを用いたエージェント的アプローチなど、速度に依存するユースケースにとって魅力的なソリューションとなります。」
OpenAIのChatGPT Enterprise向け新ツール
OpenAIは木曜日に、企業顧客向けの新ツールを発表しました。ブログ投稿では、金融、ヘルスケア、法務サービス、政府機関など、規制の厳しい業界の企業がログ記録や監査の要件を遵守できるよう支援するEnterprise Compliance APIを発表しました。
同社によると、これらのツールにより、管理者はChatGPT Enterpriseのデータを監査し、適切な対応を行うことができるようになるという。APIは、会話、アップロードされたファイル、ワークスペースのユーザーなど、タイムスタンプ付きのインタラクション記録を提供する。
OpenAIは、特定のビジネスユースケース向けに作成されたChatGPTのカスタムバージョンであるワークスペースGPTに対して、管理者がよりきめ細かな制御を行えるようにもしています。これまで、管理者はワークスペース内で作成されたGPTアクションを完全に許可またはブロックすることしかできませんでしたが、今後はワークスペースのオーナーがGPTが操作できるドメインの承認済みリストを作成できるようになります。
マックスウェル・ゼフは、TechCrunchのAI専門シニアレポーターです。以前はGizmodo、Bloomberg、MSNBCでAIの台頭やシリコンバレーの銀行危機などを取材してきました。サンフランシスコを拠点としています。取材以外の時間は、ハイキング、サイクリング、ベイエリアのグルメ巡りを楽しんでいます。
Maxwell からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal の mzeff.88 に暗号化されたメッセージを送信してください。
バイオを見る