Flowは、コンパニオンチップとちょっとした努力でCPUのパワーを100倍にできると主張している。

Flowは、コンパニオンチップとちょっとした努力でCPUのパワーを100倍にできると主張している。

Flow Computing というフィンランドの新興企業は、シリコンエンジニアリング史上最も大胆な主張をしている。それは、同社独自のコンパニオンチップを追加することで、どの CPU もそのパフォーマンスを瞬時に 2 倍にすることができ、ソフトウェアの調整によって 100 倍まで向上させることができるというものだ。

これがうまくいけば、AI メーカーの飽くことのないコンピューティング需要に業界が対応できるようになるかもしれません。

Flowは、フィンランドの国営研究機関であるVTT(国立研究所のような存在)のスピンアウト企業です。Flowが商業化しているチップ技術(Parallel Processing Unitと名付けられています)は、同研究所で行われた研究の成果です(VTTは出資者ですが、知的財産権はFlowが所有しています)。

Flow氏自身も認めているように、この主張は表面上は滑稽だ。アーキテクチャやコードベースを問わず、CPUから魔法のように性能を引き出すことなど不可能だ。もしそうなら、IntelやAMD、あるいは他の企業が何年も前にそれを実現していたはずだ。

しかし、Flow は理論的には可能なことに取り組んできた。ただ、誰もそれを実現できていないだけだ。

中央処理装置(CPU)は、真空管やパンチカードの黎明期から長い道のりを歩んできましたが、根本的な部分では今も変わっていません。主な制約は、並列プロセッサではなくシリアルプロセッサであるため、一度に1つの処理しか実行できないことです。もちろん、CPUは複数のコアとパスウェイ間で1秒間に10億回もその処理を切り替えますが、これらはすべてCPUのシングルレーンという性質に対応するための手段です。(対照的に、GPUは関連する多くの計算を同時に行いますが、特定の演算に特化しています。)

「CPUはコンピューティングにおける最も弱い部分です」と、Flowの共同創業者兼CEOであるティモ・ヴァルトネン氏は述べた。「CPUは本来の役割を果たせていません。この状況を変える必要があります。」

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

CPUは非常に高速になりましたが、ナノ秒レベルの応答性を備えていても、次のタスクを開始する前に1つのタスクを完了する必要があるという基本的な制限があるため、命令の実行方法には膨大な量の無駄が生じます。(私はチップエンジニアではないので、ここでは単純化して説明しています。)

Flowが主張するのは、この制限を取り除き、CPUを片側一車線の道路から複数車線の高速道路へと変えることです。CPUは依然として一度に1つのタスクしか実行できませんが、FlowのPPU(同社がPPUと呼ぶ)は、基本的にチップ上でナノ秒単位のトラフィック管理を実行し、タスクをプロセッサに出し入れする速度を従来よりも高速化します。

CPUをキッチンで働くシェフに例えてみましょう。シェフの仕事の速さには限界がありますが、もし超人的なアシスタントがシェフの手からナイフや道具を出し入れしたり、調理済みの食材を片付けたり、新しい食材を入れたり、シェフ本来の仕事以外の作業をすべて省いてくれたらどうでしょうか?シェフは両手しか持っていませんが、10倍の速さで作業できるようになります。

FPGA PPU強化チップと未改造のIntelチップの比較を示すグラフ(ログ内、注記)。PPUコア数を増やすことで、パフォーマンスは継続的に向上する。画像クレジット: Flow Computing

完璧な例えではありませんが、Flowの社内テストや業界関係者とのデモ(そして彼らはあらゆる関係者と協議しています)から、ここで何が起こっているのかをある程度はご理解いただけると思います。PPUはクロック周波数を上げたり、システムに過剰な熱や電力を発生させるような負荷をかけたりはしません。つまり、シェフに2倍の速さで刻むように要求されているわけではないのです。PPUは、既に実行されているCPUサイクルをより効率的に利用しているだけです。

この種のことは全く新しいものではないとヴァルトネン氏は言う。「これは高水準の学術界で研究され、議論されてきました。並列化は既に実現可能ですが、レガシーコードが壊れてしまい、結局役に立たなくなってしまいます。」

つまり、実現可能だったのです。ただ、世界中のコードを根本から書き直さなければ実現できないため、現実的ではありません。同様の問題は、別の北欧コンピューティング企業であるZeroPointによって解決され、システムの他の部分とのデータの透明性を維持しながら、高度なメモリ圧縮を実現しました。

言い換えれば、Flowの大きな成果は高速トラフィック管理ではなく、テスト済みのCPUやアーキテクチャ上のコードに一切変更を加えることなく、それを実現することです。PPUをダイに統合するだけで、任意のチップ上で任意のコードを2倍の速度で実行できるというのは、少々的外れに聞こえるかもしれません。

Flowのビジネス成功を阻む最大の課題はここにある。ソフトウェア製品とは異なり、Flowの技術はチップ設計レベルで組み込む必要があるため、遡及的に機能することはなく、PPUを搭載した最初のチップの登場はかなり先になるだろう。FlowはFPGAベースのテスト環境でこの技術が機能することを実証しているが、チップメーカーが期待される効果を実感するには、相当なリソースを投入する必要があるだろう。

Flow の創設チーム、左から: Jussi Roivainen、Martti Forsell、Timo Valtonen。画像クレジット:フロー コンピューティング

しかし、これらの向上の規模と、ここ数年のCPUの改良が反復的かつ限定的であったという事実を考えると、チップメーカーはFlowにかなり切実に迫っている可能性が高い。レイアウトを1つ変更するだけで、1世代でパフォーマンスを2倍にできるとしたら、それは当然のことだ。

PPUとCPUの組み合わせでより適切に動作するようにソフトウェアをリファクタリングおよび再コンパイルすることで、さらなるパフォーマンス向上が期待できます。Flow社によると、同社の技術を活用するためにコードを修正(必ずしも完全に書き直したわけではない)することで、パフォーマンスが最大100倍向上したという。同社は、Flow対応チップ向けに最適化したいソフトウェア開発者にとって、この作業を簡素化するための再コンパイルツールの提供に取り組んでいる。

Flowの技術について説明を受け、この問題に関する外部の視点として言及されたTirias Researchのアナリスト、Kevin Krewell氏は、ファンダメンタルズよりも業界での普及を懸念している。

彼は、AIアクセラレーションが現在最大の市場であり、NVIDIAの人気チップH100のような専用チップでターゲットにできる分野だと、まさに的確に指摘した。PPUアクセラレーション搭載CPUは全般的に利益をもたらすだろうが、チップメーカーは波風を立てたくないかもしれない。そして、これらの企業が、その選択によって5カ年計画が狂ってしまう可能性が高い中で、ほとんど実証されていない技術に多額のリソースを投入する意思があるかどうかという疑問も残る。

Flowの技術は、あらゆるチップメーカーにとって必須のコンポーネントとなり、同社を一躍富豪へと押し上げるのだろうか?それとも、節約志向のチップメーカーは現状維持を決意し、着実に成長するコンピューティング市場から利益を搾り取ろうとするのだろうか?おそらくその中間だろう。しかし、たとえFlowがここで大きな技術的偉業を成し遂げたとしても、他のスタートアップ企業と同様に、同社の将来は顧客次第であることは明らかだ。

Flow は、Butterfly Ventures が主導し、FOV Ventures、Sarsia、Stephen Industries、Superhero Capital、Business Finland が参加した 400 万ユーロ (約 430 万ドル) のプレシード資金を獲得し、ステルス状態から脱したばかりです。