話題の AI 企業 DeepSeek は、OpenAI の DALL-E 3 を上回る性能を持つと主張する新しいマルチモーダル AI モデルのセットをリリースしました。
AI開発プラットフォーム「Hugging Face」からダウンロード可能なこれらのモデルは、DeepSeekがJanus-Proと呼ぶ新しいモデルファミリーの一部です。パラメータ数は10億から70億までの範囲です。パラメータ数はモデルの問題解決能力にほぼ相当し、パラメータ数が多いモデルはパラメータ数の少ないモデルよりも一般的に優れたパフォーマンスを発揮します。
Janus-Pro は MIT ライセンスに基づいているため、制限なく商用利用できます。

DeepSeekが「斬新な自己回帰フレームワーク」と表現するJanus-Proは、画像の分析と新規画像の作成の両方が可能です。同社によると、AI評価ベンチマークであるGenEvalとDPG-Benchにおいて、Janus-Proの最大モデルであるJanus-Pro-7Bは、DALL-E 3に加え、PixArt-alpha、Emu3-Gen、Stability AIのStable Diffusion XLなどのモデルよりも優れた性能を発揮しています。
確かに、これらのモデルの一部は古いタイプであり、ほとんどの Janus-Pro モデルは最大 384 x 384 の解像度の小さな画像しか分析できません。しかし、モデルのコンパクトなサイズを考慮すると、Janus-Pro のパフォーマンスは印象的です。
「Janus-Proは従来の統合モデルを凌駕し、タスク特化型モデルの性能に匹敵、あるいは上回っています」とDeepSeekはHugging Faceへの投稿で述べています。「Janus-Proのシンプルさ、高い柔軟性、そして有効性は、次世代の統合マルチモーダルモデルの有力な候補となるでしょう。」

中国のAIラボDeepSeekは、クオンツトレーディング会社High-Flyer Capital Managementの出資が主な資金となっている。同社のチャットボットアプリがApple App Storeのランキングでトップに躍り出たことで、今週、注目を集めている。DeepSeekの言語モデルは、計算効率の高い手法を用いて学習されており、ウォール街の多くのアナリストや技術者の間で、米国がAI競争における優位性を維持できるのか、そしてAIチップの需要が持続できるのかという疑問が生じている。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
追記:以前の記事では、Janus-Proモデルは小さい画像(384 x 384)しか出力できないと記載していましたが、これは誤りです。この誤りをお詫び申し上げます。
TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る