AIモデルの圧縮アルゴリズムの開発に取り組んできた欧州のスタートアップ企業Pruna AIは、木曜日に最適化フレームワークをオープンソース化する。
Pruna AI は、キャッシュ、プルーニング、量子化、蒸留などのいくつかの効率化手法を特定の AI モデルに適用するフレームワークを作成しています。
「圧縮モデルの保存と読み込み、これらの圧縮方法の組み合わせの適用、そして圧縮後の圧縮モデルの評価も標準化しています」とPruna AIの共同設立者兼CTOであるジョン・ラチワン氏はTechCrunchに語った。
特に、Pruna AI のフレームワークは、モデルを圧縮した後に品質が大幅に低下するかどうか、およびパフォーマンスがどの程度向上するかを評価できます。
「たとえるなら、私たちはハギングフェイス社がトランスフォーマーやディフューザーを標準化した方法、つまり、それらの呼び出し方、保存方法、読み込み方法などに似ています。私たちも効率化のために同じことを行っています」と彼は付け加えた。
大手AI研究機関は既に様々な圧縮手法を採用しています。例えば、OpenAIは主力モデルの高速化版を作成するために蒸留技術を活用しています。
OpenAIはGPT-4の高速版であるGPT-4 Turboをこの方法で開発したと考えられます。同様に、Flux.1-schnell画像生成モデルは、Black Forest LabsのFlux.1モデルの精製版です。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
蒸留とは、「教師-生徒」モデルを用いて大規模なAIモデルから知識を抽出する手法です。開発者は教師モデルにリクエストを送信し、その出力を記録します。得られた回答は、データセットと比較され、その精度が検証されることがあります。これらの出力は生徒モデルの学習に使用され、生徒モデルは教師の行動を近似するように学習されます。
「大企業では、こうしたものを社内で構築するのが一般的です。オープンソースの世界で見つかるものは、通常、単一の手法に基づいています。例えば、LLM用の量子化手法が1つ、拡散モデル用のキャッシュ手法が1つ、といった具合です」とRachwan氏は言います。「しかし、それらすべてを集約し、使いやすく、組み合わせやすいツールは見つかりません。そして、これこそがPrunaが今まさに提供している大きな価値なのです。」

Pruna AI は、大規模言語モデルから拡散モデル、音声テキスト変換モデル、コンピューター ビジョン モデルまで、あらゆる種類のモデルをサポートしていますが、現在は特に画像とビデオの生成モデルに重点を置いています。
Pruna AIの既存ユーザーには、ScenarioやPhotoRoomなどが挙げられます。オープンソース版に加え、Pruna AIは最適化エージェントを含む高度な最適化機能を備えたエンタープライズ版も提供しています。
「近々リリースする最もエキサイティングな機能は、圧縮エージェントです」とラクワン氏は述べた。「基本的に、モデルを渡して、『速度を上げたいけど、精度は2%以上落とさないでください』と指示するだけです。あとはエージェントが魔法のように働きます。最適な組み合わせを見つけて、それを返します。開発者として何もする必要はありません。」
Pruna AIのプロ版は時間単位で課金されます。「AWSなどのクラウドサービスでGPUをレンタルするときの感覚と似ています」とRachwan氏は言います。
モデルがAIインフラの重要な部分を占める場合、最適化されたモデルを使用することで推論にかかるコストを大幅に削減できます。例えば、Pruna AIは、圧縮フレームワークを使用することで、Llamaモデルを大きな損失なく8分の1に縮小しました。Pruna AIは、お客様が圧縮フレームワークを投資として回収できると考えてくれることを期待しています。
Pruna AIは数ヶ月前に650万ドルのシードラウンドで資金調達を実施しました。このスタートアップには、EQT Ventures、Daphni、Motier Ventures、Kima Venturesなどが投資しています。
ロマン・ディレットは2025年4月までTechCrunchのシニアレポーターを務めていました。テクノロジーとテクノロジー系スタートアップに関する3,500本以上の記事を執筆し、ヨーロッパのテクノロジーシーンで影響力のある人物としての地位を確立しています。スタートアップ、AI、フィンテック、プライバシー、セキュリティ、ブロックチェーン、モバイル、ソーシャルメディア、メディアにおいて深い知識を持っています。TechCrunchで13年の経験を持つ彼は、シリコンバレーとテクノロジー業界を熱心に取材する同誌のお馴染みの顔です。彼のキャリアは21歳のときからTechCrunchでスタートしています。パリを拠点とする彼は、テクノロジー業界の多くの人々から、街で最も知識豊富なテクノロジージャーナリストとみなされています。ロマンは、誰よりも早く重要なスタートアップを見つけるのを好みます。Revolut、Alan、N26を取材した最初の人物でもあります。Apple、Microsoft、Snapによる大型買収に関するスクープ記事も執筆しています。執筆活動をしていない時は、開発者としても活動しており、テクノロジーの背後にある仕組みを理解しています。彼は過去50年間のコンピュータ業界に関する深い歴史的知識も有しています。イノベーションと社会構造への影響を結びつける方法を熟知しています。ロマンは、起業家精神を専門とするフランスの名門ビジネススクール、エムリヨン・ビジネススクールを卒業しています。テクノロジー分野で女性の教育とエンパワーメントを推進するStartHerや、テクノロジーで難民のエンパワーメントを支援するTechfugeesなど、複数の非営利団体を支援してきました。
バイオを見る