DeepSeekの精錬された新しいR1 AIモデルは単一のGPUで実行できる

DeepSeekの精錬された新しいR1 AIモデルは単一のGPUで実行できる
モバイル版DeepSeekのウェルカムページ
画像クレジット:ジャスティン・サリバン / ゲッティイメージズ

DeepSeekのアップデート版R1推論AIモデルは、今週AIコミュニティの注目を集めているかもしれない。しかし、この中国のAI研究機関は、新型R1の小型版「DeepSeek-R1-0528-Qwen3-8B」もリリースした。DeepSeekによると、このモデルは特定のベンチマークにおいて、同規模のモデルを凌駕する性能を発揮するという。

アリババが5月に発売したQwen3-8Bモデルを基盤として作られた、より小型のアップデート版R1は、難問集であるAIME 2025において、GoogleのGemini 2.5 Flashよりも優れたパフォーマンスを発揮した。

DeepSeek-R1-0528-Qwen3-8B は、別の数学スキル テストである HMMT においても、Microsoft が最近リリースした Phi 4 推論プラス モデルとほぼ一致しています。

DeepSeek-R1-0528-Qwen3-8Bのようないわゆる蒸留モデルは、一般的にフルサイズのものよりも性能が劣ります。しかし、プラス面としては、計算負荷がはるかに低いことです。クラウドプラットフォームNodeShiftによると、Qwen3-8Bの実行には40GB~80GBのRAMを搭載したGPU(例えば、Nvidia H100)が必要です。フルサイズの新型R1には、約12個の80GB GPUが必要です。

DeepSeekは、アップデートされたR1によって生成されたテキストを取得し、それを用いてQwen3-8Bを微調整することで、DeepSeek-R1-0528-Qwen3-8Bを学習させました。AI開発プラットフォームHugging Faceのモデル専用ウェブページで、DeepSeekはDeepSeek-R1-0528-Qwen3-8Bを「推論モデルに関する学術研究と小規模モデルに重点を置いた産業開発の両方に利用できる」と説明しています。

DeepSeek-R1-0528-Qwen3-8BはMITライセンス(permissive license)に基づいて提供されており、制限なく商用利用可能です。LM Studioを含む複数のホストが既にAPIを通じてこのモデルを提供しています。

トピック

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る