Deep CogitoがハイブリッドAI「推論」モデルでステルス状態から脱却

Deep CogitoがハイブリッドAI「推論」モデルでステルス状態から脱却

新しい企業、Deep Cogito がステルス状態から脱し、「推論」モードと非推論モードを切り替えることができる、公開利用可能な AI モデル ファミリーを発表しました。

OpenAIのo1のような推論モデルは、複雑な問題を段階的に解くことで効果的に自己検証を行う能力により、数学や物理学などの分野で大きな期待を集めています。しかし、この推論には、計算量の増加とレイテンシというコストがかかります。そのため、Anthropicなどの研究室は、推論コンポーネントと標準的な非推論要素を組み合わせた「ハイブリッド」モデルアーキテクチャの開発に取り組んでいます。ハイブリッドモデルは、単純な質問に迅速に答えながら、より複雑なクエリの検討に時間をかけることができます。

Deep CogitoのモデルはすべてCogito 1と呼ばれ、ハイブリッドモデルです。Cogitoは、Metaや中国のAIスタートアップDeepSeekのモデルを含む、同規模の最高のオープンモデルよりも優れた性能を発揮すると主張しています。

「各モデルは直接回答することも、回答前に自己分析することもできます(推論モデルのように)。」(同社ブログ記事より)と同社は説明している。「(これらはすべて)少人数のチームによって約75日間で開発されました。」

Cogito 1モデルのパラメータ数は30億から700億までで、Cogito社によると、今後数週間から数か月のうちに最大6710億のパラメータを持つモデルが加わる予定です。パラメータ数はモデルの問題解決能力にほぼ相当し、一般的にパラメータ数が多いほど性能は向上します。

念のため言っておきますが、Cogito 1はゼロから開発されたわけではありません。Deep Cogitoは、MetaのオープンなLlamaモデルとAlibabaのQwenモデルをベースに独自のモデルを構築しました。同社によると、ベースモデルのパフォーマンスを向上させ、トグル式の推論を可能にするために、新たなトレーニング手法を採用したとのことです。

Cogitoの社内ベンチマーク結果によると、推論機能を備えたCogito 1モデルの中で最大のCogito 70Bは、DeepSeekのR1推論モデルをいくつかの数学および言語評価で上回りました。推論機能を無効にしたCogito 70Bは、汎用AIテストであるLiveBenchにおいて、Metaが最近リリースしたLlama 4 Scoutモデルを凌駕しました。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

すべての Cogito 1 モデルは、クラウド プロバイダーの Fireworks AI および Together AI の API 経由でダウンロードまたは使用できます。

ディープ・コギト
Cogito 1のパフォーマンスと、他の公開されている人気のAIモデルとの比較画像クレジット: Deep Cogito

「現在、私たちはスケーリング曲線の初期段階にあり、従来の大規模言語モデルの学習後/継続学習に通常割り当てられる計算リソースのほんの一部しか使用していません」とCogitoはブログ記事に記している。「今後は、自己改善のための補完的な学習後アプローチを検討していきます。」

カリフォルニア州への提出書類によると、サンフランシスコを拠点とするDeep Cogitoは2024年6月に設立されました。同社のLinkedInページには、共同創業者であるドリシャン・アローラ氏とドゥルブ・マルホトラ氏の2名が記載されています。マルホトラ氏は以前、GoogleのAIラボDeepMindでプロダクトマネージャーを務め、生成検索技術の開発に携わっていました。アローラ氏はGoogleのシニアソフトウェアエンジニアでした。

PitchBookによると、サウスパーク・コモンズなどの支援を受けているディープコギトは、「汎用スーパーインテリジェンス」の構築を野心的に目指している。同社の創業者たちは、この言葉が「ほとんどの人間よりも優れたタスクを遂行し、私たちがまだ想像もしていない全く新しい能力を発見できる」AIを意味すると理解している。

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る