AI、特に生成型AI(画像やテキストなどを生成するAI)の需要の高まりは、AI推論チップ市場を急速に活性化させています。推論チップはAI推論プロセスを加速させます。AI推論プロセスとは、AIシステムが特定のデータセットで「トレーニング」を行い、学習した内容に基づいて出力(テキスト、画像、音声など)を生成するプロセスです。AI推論チップは、テキストプロンプトをアートワークに変換するStable Diffusionや、数行の散文を長編詩やエッセイなどに拡張するOpenAIのGPT-3などのシステムから、より高速な生成を行うために使用できます(そして実際に使用されています)。
多くのベンダー(スタートアップ企業から大手企業まで)が、AI推論チップの開発と販売に積極的に取り組んでいます。Hailo、Mythic、Flex Logixなど、新興企業もその例です。一方、既存企業では、Googleがテンソルプロセッシングユニット(TPU)で優位を競い、AmazonはInferentiaに賭けています。しかし、激しい競争にもかかわらず、AIチップ推論市場を独占しながらも、ハードウェアをサポートするソフトウェアとサービスのスイートを提供することで差別化を図っているNeuRealityのような企業は、競争にひるむことなく参入しています。
この件に関して、NeuRealityは本日、Samsung Ventures、Cardumen Capital、Varana Capital、OurCrowd、XT Hi-Techが主導し、SK Hynix、Cleveland Avenue、Korean Investment Partners、StoneBridge、Glory Venturesが参加したシリーズA資金調達ラウンドで3,500万ドルを調達したと発表した。共同創業者兼CEOのMoshe Tanach氏はTechCrunchに対し、調達した資金はNeuRealityの主力AI推論チップの設計を2023年初頭に完成させ、顧客に出荷するために充当されると語った。
「NeuRealityは、従来のCPU中心のアーキテクチャから脱却し、高性能と低レイテンシーを実現し、コストと消費電力を可能な限り効率化する新世代のAI推論ソリューションを構築するというビジョンを掲げて設立されました」とタナック氏はTechCrunchへのメールで述べた。「AIを活用できる企業のほとんどは、AmazonやMetaといったAIに投資する大企業が持つような資金も、大規模な研究開発費も持っていません。NeuRealityは、AI技術を簡単かつ手頃な価格で導入したいすべての人に提供します。」
NeuRealityは、2019年にツビカ・シュムエリ氏、ヨッシ・カサス氏、そしてマーベルとインテルでエンジニアリング・ディレクターを務めたタナック氏によって共同設立されました。シュムエリ氏は、メラノックス・テクノロジーズでバックエンド・インフラストラクチャ担当バイスプレジデント、ハバナ・ラボでエンジニアリング担当バイスプレジデントを務めていました。カサス氏は、メラノックスでシニア・エンジニアリング・ディレクターを務め、半導体企業EZchipではインテグレーション部門の責任者を務めていました。
NeuRealityは創業当初から、クラウドデータセンターや「エッジ」コンピューター、つまりオンプレミスで稼働し、データ処理の大部分をオフラインで行うマシン向けのAIハードウェアを市場に投入することに注力してきました。タナック氏によると、同社の現世代製品ラインナップであるネットワーク接続処理装置(NAPU)は、コンピュータービジョン(写真内の物体を認識するアルゴリズムなど)、自然言語処理(テキスト生成・分類システム)、レコメンデーションエンジン(eコマースサイトで商品を提案するようなもの)といったAI推論アプリケーションに最適化されています。
NeuRealityのNAPUは、本質的に複数種類のプロセッサを組み合わせたハイブリッドです。AI推論の負荷分散、ジョブスケジューリング、キュー管理といった機能を実行できます。これらの機能は従来ソフトウェアで実行されていましたが、必ずしも効率的ではありませんでした。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日

NeuRealityのNR1は、NAPUファミリーのFPGAベースSKUであり、ネットワーク接続型の「サーバー・オン・チップ」で、AI推論アクセラレータを内蔵し、ネットワークおよび仮想化機能を備えています。NeuRealityは、NR1とネットワーク接続型推論サーバーを搭載したPCIeカードであるNR1-Mモジュールと、複数のNR1-MとNR1をペアリングする独立したモジュールであるNR1-Sも提供しています。
ソフトウェア面では、NeuReality は、クラウドおよびローカル ワークロード用のソフトウェア開発キット、ランタイムの問題の解決に役立つデプロイメント マネージャー、監視ダッシュボードなどの一連のツールを提供します。
「AI推論のためのソフトウェア、そして異機種混合コンピューティングとコンパイル・デプロイメントの自動フローのためのツールは、当社の革新的なハードウェアアプローチを支える魔法の力です」とタナック氏は述べています。「NAPUテクノロジーの最初の受益者は、チャットボット、音声ボット、自動文字起こし、感情分析、そして文書スキャンや欠陥検出などのコンピュータービジョンのユースケースをサポートするインフラを必要とする企業やクラウドソリューションプロバイダーです。…世界がディープラーニングプロセッサの改良に注目していた間、NeuRealityは、その周囲のシステムとその上位のソフトウェアレイヤーを最適化することに注力し、より高い効率性と推論のデプロイメントフローの簡素化を実現しました。」
NeuRealityは、パフォーマンスに関する主張の一部を実証的な証拠で裏付けていないことに注意する必要がある。同社はZDNetへの最近の記事で、自社のハードウェアはディープラーニングアクセラレータベンダーが提供する既存のGPUやASICと比較して、1ドルあたりのパフォーマンスが15倍向上すると見積もっていると述べたものの、検証のためのベンチマークデータを公開していない。また、同社は独自のネットワークプロトコルの詳細も明らかにしていない。このプロトコルは、以前、既存のソリューションよりも高性能であると主張していた。
これらの問題はさておき、大規模なハードウェアの提供は容易ではありません。特にカスタムAI推論チップが必要な場合はなおさらです。しかしタナック氏は、NeuRealityはAMD傘下の半導体メーカーであるザイリンクスと生産面で提携し、NR1のハードウェア要件策定のためにIBMと提携するなど、必要な基盤を築いてきたと主張しています。(NeuRealityの設計パートナーでもあるIBMは、以前、IBMクラウドでの使用に向けてNeuRealityの製品を「評価中」と発表していました。)タナック氏によると、NeuRealityは2021年5月からパートナー企業にプロトタイプを出荷しているとのことです。
タナック氏によると、NeuRealityはIBM以外にも、レノボ、AMD、そして名前を伏せたクラウドソリューションプロバイダー、システムインテグレーター、ディープラーニングアクセラレーターベンダー、そして「推論を利用する」企業とも連携し、導入を進めているという。しかし、タナック氏は、現在どれだけの顧客を抱えているか、また、収益面でどの程度の見込みがあるのかについては明らかにしなかった。
「パンデミックによって企業の成長が鈍化し、多くのディープラーニングベンダー間の統合が進んでいることは認識しています。しかし、私たちにとっては何も変わりません。来年末から2024年にかけて推論技術の導入が爆発的に増加すると予想されており、私たちの技術こそがまさにその成長の実現と推進力となるからです」とタナック氏は述べています。「NAPUは、より幅広い技術力を持たない企業にAIを提供します。また、『ハイパースケーラー』や次世代データセンターの顧客といった大規模ユーザーが、AI利用の拡大をサポートできるようにもなります。」
イスラエルのSamsung Venturesの責任者であるオリ・カーシュナー氏は、電子メールでの声明で次のように述べています。「データセンターやオンプレミスのユースケースにおいて、より効率が高く、導入が容易な推論ソリューションに対する大きなニーズが差し迫っていると認識しており、これがNeuRealityへの投資の理由です。同社の革新的なディスアグリゲーション、データ移動、処理技術は、コンピューティングフロー、コンピューティングストレージフロー、そしてインストレージコンピューティングを向上させます。これらはすべて、AIソリューションの導入と成長にとって不可欠です。」
現在40名の従業員を抱えるNeuRealityは、今後2四半期でさらに20名を雇用する予定です。これまでにベンチャーキャピタルから4,800万ドルを調達しています。