「フィーチャーストア」は、その陰鬱で不透明な呼び名から、あまり魅力的なテーマのようには聞こえないかもしれません。
しかし、これらは企業、そして消費者が日々利用するAIシステムに不可欠な要素です。だからこそ、市場機会が遠い将来まで拡大すると見込むベンチャー企業からの注目と投資がますます集まっています。
AIシステムは多くのコンポーネントで構成されており、その一つが特徴です。特徴とは、システムにおいて入力として機能する個々の変数です。特徴について考える際には、AIシステムが使用するデータが、行(システムが予測を学習するためのデータ)と列(それらの例を説明するデータ)に整理された表をイメージすると分かりやすいでしょう。特徴とは、各例を説明するために使用される属性です。例えば、AIスパム検出ツールは、メール本文の単語や送信者の連絡先情報といった特徴を使用します。
単一のAIシステム内では、機能の活用はアドホックなプロセスになりがちです。しかし、データサイエンスチームが数十から数千ものシステムの保守を担当するエンタープライズ規模では、機能を管理・追跡する場所が不可欠になります。
AIシステムが依存する機能を整理、保存、提供するための一元化されたリポジトリであるフィーチャーストアの登場です。2017年にUberによってコンセプトとして導入されたフィーチャーストアは、組織内の異なるチーム間で機能を構築・共有するための統一された場所を提供します。
「特徴ストアは、データと機械学習の交差点に位置しています」と、企業向け特徴ストアソフトウェアを開発するスタートアップ企業Tecton.aiのCEO、マイケル・デル・バルソ氏はTechCrunchへのメールで述べた。「[特徴ストアは]データチームがリアルタイムデータを用いて高品質な特徴を迅速かつ確実に構築し、それらを本番環境でリアルタイム推論に利用できるようにするため、『MLOps』スタックの重要な部分です。データと[AI]モデル間のインターフェースとして機能します。」
単なるデータベースの枠を超え、特徴量ストアはデータエンジニアが特徴量に関する統計情報(どの特徴量が使用されたか、どこで使用されたか、モデルにどのような影響を与えたかなど)を確認できるようにします。また、特徴量ストアはデータを変換するため、ユーザーは必ずしもコードを記述することなく、特徴量の集計、フィルタリング、結合を行うことができます。(レストランで注文を集計して「過去30分間の注文数」という特徴量値を取得することを想像してみてください。)
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
デル・バルソ氏は次のように説明しています。「高度なフィーチャストアは…本番環境のパイプラインを自動化し、バッチデータソースやリアルタイムソースからデータを収集し、リアルタイムでデータを変換して、オフラインおよびオンラインストアに保存します。(多くの場合、)パイプラインの健全性、データドリフト、サービスレベルなどを監視するための組み込み監視機能も備えています。」

フィーチャーストアは、チーム間の連携を強化し、AIシステム開発を効率化することを約束します。需要が高まるにつれ、テクノロジー大手やTectonのようなスタートアップ企業は、そのニーズに応える製品を開発しており、投資家も熱心に支援しています。
テクトンは2019年の創業以来、アンドリーセン・ホロウィッツやセコイア・キャピタルなどのベンチャーキャピタルから6,000万ドルを調達し、フィーチャーストアプラットフォームの構築を進めてきました。競合企業のラスゴとモレキュラは、それぞれ約2,000万ドルのベンチャーキャピタル資金を獲得しています。
GoogleとAWSも現在、フィーチャーストアソリューションを提供しています。DatabricksやSpliceといった後期段階のAI開発プラットフォームのスタートアップも同様です。
「投資家は、様々な業界の企業が機械学習とAIを活用して新たな製品や収益源を構築しているのを目の当たりにしてきました。彼らは、このトレンドを一般大衆に広めるソリューションの必要性を理解しています」と、Rasgoの共同創業者兼CEOであるジャレッド・パーカー氏はTechCrunchへのメールで述べた。「フィーチャーストアは、モデルを本番環境に迅速に導入するための道筋を提供すると同時に、機械学習を推進するデータパイプラインの集中化、連携、ガバナンスも可能にします。」
フィーチャーストア分野を急成長させているのは、AIシステムを本番環境に確実かつ効率的に導入するための一連のプラクティスであるMLOpsの急成長です。Cognilyticaによると、フィーチャーストア製品やサービスを含むMLOpsプラットフォームの世界市場は、2019年の3億5000万ドルから2025年には40億ドルに成長すると予測されています。
デル・バルソ氏の説明によると、この増加は、企業が長年AIシステムの本番環境への導入とその後の維持に苦労してきた後に、「運用可能な」機械学習を採用し始めたことを示している。2020年のForresterの調査によると、企業の41%が機械学習モデルの運用化に課題を抱えており、「そのためのプロセスが不足している」と回答している。2019年のあるホワイトペーパーでは、企業が他のITイニシアチブよりもAIと機械学習を優先しているにもかかわらず、AIプロジェクトの約85%が最終的に失敗すると示唆されている。

「オペレーショナル機械学習とは、顧客向けアプリケーションを強化し、ビジネスプロセスを自動化するために、本番環境で機械学習を実行することです」とデル・バルソ氏は述べています。「オペレーショナル機械学習は、不正検出、リアルタイムの価格設定、商品推奨、リスク評価など、非常に幅広いユースケースをサポートするために使用できます。これは未来であり、オペレーショナル機械学習の構築と導入に優れた企業は、大きな競争優位性を獲得するでしょう。」
では、これはフィーチャーストアの将来にとって何を意味するのでしょうか?豊富な資金と関心を持つ顧客を抱えるデル・バルソ氏は、クラウドを活用して、天気や株価といった公開データに基づく機能を広く利用できるようにする機会を見出しています。また、自動化がフィーチャーストアにおいてより大きな役割を果たすようになると予想しており、既存の機能の再利用を提案したり、必要に応じて新しい機能を作成したりすることも期待しています。
彼の予測は、デロイトの「テックトレンド2021」レポートの内容と一致しています。同社は、フィーチャーストアは将来的には、モデル化されるデータの種類に基づいて特定の機能の需要を予測できるようになる可能性があり、機能提供の遅延を削減することでAIシステムのパフォーマンスを向上させる可能性があると記しています。
「理想的な世界では、データ サイエンティストは単に「これが私が予測しようとしていることです」と言うだけで、機能ストアがそのユース ケースに最も予測力のある機能を提案(または構築)します」とデル バルソ氏は述べています。
パーカー氏の視点から見ると、データ変換と機能管理は、AI の価値を最大限に引き出すために業界が習得しなければならない最前線であり、機能ストアはこれを実現する方法です。
「モデルの良し悪しはデータ次第です。機械学習用のデータ準備に膨大な時間がかかるため、実稼働まで至らないプロジェクトがあまりにも多くあります。…市場はこの問題に苦慮しており、データサイエンス機能における俊敏性とスピードの向上がもたらす大きな競争優位性を理解しています」とパーカー氏は述べています。「フィーチャーストアの活用によってプロセスを加速することで、より多くのモデルを実稼働させ、AIの潜在能力を最大限に発揮できるようになります。」