中国の研究所が、OpenAI の o1 に匹敵する初の「推論」AI モデルの 1 つと思われるものを公開しました。
水曜日、クオンツトレーダーが出資するAI研究会社DeepSeekはDeepSeek-R1のプレビューをリリースした。同社はこれがo1と競合する推論モデルだと主張している。
ほとんどのモデルとは異なり、推論モデルは質問やクエリをより時間をかけて検討することで、効果的に事実確認を行います。これにより、モデルが陥りやすい落とし穴のいくつかを回避できます。
o1と同様に、DeepSeek-R1はタスクを通して推論し、事前に計画を立て、モデルが答えに到達するのに役立つ一連のアクションを実行します。これにはしばらく時間がかかる場合があります。o1と同様に、質問の複雑さによっては、DeepSeek-R1は回答を出す前に数十秒間「考える」場合があります。

DeepSeekは、DeepSeek-R1(正確にはDeepSeek-R1-Lite-Preview)が、2つの一般的なAIベンチマークであるAIMEとMATHにおいて、OpenAIのo1-previewモデルと同等の性能を発揮すると主張しています。AIMEは他のAIモデルを用いてモデルの性能を評価しますが、MATHは文章題の集合です。しかし、このモデルは完璧ではありません。Xのコメンテーターの中には、DeepSeek-R1は三目並べなどの論理問題(o1も同様)で苦戦していると指摘する人もいました。
DeepSeekは簡単にジェイルブレイク(脱獄)できます。つまり、安全対策を無視するような方法でプロンプトを出し、操作を強制されるのです。あるXユーザーは、このモデルを使って詳細なメタンフェタミンのレシピを入力させました。
また、DeepSeek-R1は政治的にセンシティブすぎると判断されたクエリをブロックしているようです。私たちのテストでは、このモデルは中国の習近平国家主席、天安門事件、そして中国による台湾侵攻の地政学的影響に関する質問への回答を拒否しました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日

この行動は、中国政府がこの地域のAIプロジェクトに圧力をかけていることによるものと思われます。中国のAIモデルは、その応答が「中核的社会主義価値観を体現している」ことを保証するために、中国のインターネット規制当局によるベンチマークテストを受ける必要があります。報道によると、政府はモデルの学習に使用できない情報源のブラックリストを提案するほどであり、その結果、多くの中国のAIシステムは、規制当局の怒りを買う可能性のあるトピックへの応答を拒否しています。
推論モデルへの注目が高まる中、「スケーリング則」の実現可能性が精査され始めています。スケーリング則とは、モデルにデータと計算能力を投入すれば、その能力は継続的に向上するという長年信じられてきた理論です。OpenAI、Google、Anthropicといった主要なAI研究機関のモデルは、かつてほど劇的な進歩を遂げていないという報道が相次いでいます。
その結果、新たなAIアプローチ、アーキテクチャ、開発手法の模索が加速しています。その一つがテストタイムコンピューティングで、o1やDeepSeek-R1といったモデルの基盤となっています。推論コンピューティングとも呼ばれるテストタイムコンピューティングは、モデルにタスク完了のための追加の処理時間を提供します。
「新たなスケーリングの法則の出現を目撃している」と、マイクロソフトのCEO、サティア・ナデラ氏は今週、同社のIgniteカンファレンスの基調講演で、テスト時間のコンピューティングに言及して述べた。
DeepSeekは、DeepSeek-R1をオープンソース化し、APIを公開する予定だとしており、興味深い事業を展開している。同社は、AIを活用して取引判断を行う中国のクオンツヘッジファンド、ハイフライヤー・キャピタル・マネジメントの支援を受けている。
DeepSeek の最初のモデルの 1 つである、DeepSeek-V2 と呼ばれる汎用テキストおよび画像分析モデルは、ByteDance、Baidu、Alibaba などの競合他社に、一部のモデルの使用料を値下げさせ、他のモデルを完全に無料にすることを余儀なくさせました。
High-Flyerは、モデル学習用のサーバークラスターを自社で構築しており、最新のクラスターは1万基のNvidia A100 GPUを搭載し、10億円(約1億3800万ドル)の費用がかかったと報じられています。コンピュータサイエンスの学位を持つLiang Wenfeng氏によって設立されたHigh-Flyerは、DeepSeekを通じて「超知能」AIの実現を目指しています。
TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る