OpenAIはo3-miniモデルの思考プロセスの詳細を公開した

OpenAIはo3-miniモデルの思考プロセスの詳細を公開した

中国のAI企業DeepSeekを含むライバルからの圧力に応えて、OpenAIは最新のAIモデルo3-miniが段階的な「思考」プロセスを伝達する方法を変更している。

OpenAIは木曜日、同社のAI搭載チャットボットプラットフォーム「ChatGPT」の無料および有料ユーザー向けに、モデルの「推論」ステップの詳細と質問への回答に至る過程を示す更新された「思考の連鎖」を表示すると発表した。OpenAIによると、o3-miniを「高度な推論」構成で使用しているChatGPTのプレミアムプラン加入者にも、この更新された表示が表示されるという。

「o3-miniの思考回路をアップデートし、モデルの思考過程をより理解しやすくしました」とOpenAIの広報担当者はTechCruchへのメールで述べた。「このアップデートにより、モデルの推論過程を追うことができ、より明確で信頼性の高い回答が得られるようになります。」

OpenAI o3-mini CoT
画像クレジット: OpenAI

o3-miniのような推論モデルは、結果を出す前に徹底的に事実検証を行い、モデルが陥りやすい落とし穴を回避するのに役立ちます。その代償として、推論モデルが解に到達するまでに少し時間がかかります。通常は数秒から数分程度長くなります。

DeepSeekのR1モデルは、o3-miniに似た「推論」モデルであり、思考プロセスを完全に明らかにします。多くのAI研究者は、これが望ましいアプローチだと主張しています。モデルの学習を容易にするだけでなく、推論ステップは特定の状況においてユーザーエクスペリエンスを向上させ、モデルが正しい方向、あるいは間違っている方向を示している可能性を示すのに役立ちます。

OpenAIは、競争上の理由もあって、o3-miniとその前身であるo1およびo1-miniの推論手順を完全に公開しないことを選択しました。代わりに、ユーザーには推論手順の要約のみが提示されましたが、その要約には誤りが含まれていることもありました。

o1-preview のリリース前に🍓について説明させていただいた際、CoT のライブ映像を目にされた方々は、これが大きな出来事になるだろうと確信し、「なるほど!」と感嘆されるのが常でした。これらは生の CoT ではありませんが、実現に大きく近づいたと言えるでしょう。この体験を世界と共有できることを嬉しく思います。https://t.co/72ZpPrHmfK

— ノアム・ブラウン(@polynoamial)2025年2月6日

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

OpenAIはまだo3-miniの推論ステップのすべてを公開していないが、同社は「バランスを見つけた」と述べている。o3-miniは「自由に考え」、その「考え」をより詳細な要約にまとめることができるという。

「明瞭性と安全性を向上させるため、モデルが思考の連鎖をそのままレビューし、安全でないコンテンツを削除し、複雑なアイデアを簡素化する後処理ステップを追加しました」とOpenAIの広報担当者は続けた。「さらに、この後処理ステップにより、英語圏以外のユーザーは思考の連鎖を母国語で受け取ることができるため、よりアクセスしやすくフレンドリーな体験が実現します。」

先週のReddit AMAで、OpenAIの最高製品責任者であるKevin Weil氏は、この変化が近づいていることを示唆した。

「今日公開しているものよりも、もっと多くのものをお見せできるよう取り組んでいます。[モデルの思考プロセスの公開は]もうすぐです」と彼は述べた。「まだ全ては未定ですが、思考の連鎖をすべて公開することで、競争力のある抽出が可能になります。しかし、人々(少なくともパワーユーザー)がそれを望んでいることも分かっているので、適切なバランスを見つけるつもりです。」

TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る