自然言語処理(NLP)は、テキストを解析して要約や生成などのタスクを行うAI分野であり、急成長を遂げている技術です。ジョン・スノー・ラボとグラディエント・フローが2021年に実施した調査によると、テクノロジーリーダーの60%がNLP予算が2020年と比較して10%以上増加したと回答し、3分の1は支出が30%以上増加したと回答しています。フォーチュン・ビジネス・インサイツは、2020年のNLP市場規模を165億3000万ドルと推定しています。
このような背景の中、オープンソースのNLPフレームワークHaystackを開発するスタートアップ企業Deepsetは本日、GVがリードし、Harpoon Ventures、System.One、Lunar Ventures、Acequia Capitalが参加したシリーズA投資で1,400万ドルを調達したことを発表しました。この資金調達は、NLPを活用したソフトウェア構築のための新しいサブスクリプション製品「Deepset Cloud」の提供開始と同時に行われました。
「オープンソースへの信念を原動力に、Deepsetチームは長年にわたり、オープンソースのNLPコミュニティにモデルと研究成果を提供してきました」と、ルシック氏はTechCrunchへのメールで述べた。「当社の主力オープンソース製品であるHaystackは、大規模組織向けのNLP構築で得られた経験、専門知識、ノウハウ、そしてスケーラブルでAPI駆動型のNLPバックエンドアプリケーションのための適切な構成要素の必要性から生まれました。」
CEOのミロス・ルシッチ氏は、2018年にマルテ・ピエッチ氏とティモ・モラー氏とともにDeepsetを共同設立した。データサイエンスのバックグラウンドを持つピエッチ氏とモラー氏は、アドテックのスタートアップ企業Plistaから移籍し、AIを活用した広告作成ツールなどの製品に携わっていた。
Haystackは、開発者がNLPユースケース向けのパイプラインを構築できるようにします。元々は検索アプリケーション向けに開発されたこのフレームワークは、特定の質問(例えば「スタートアップはなぜベルリンに移転しているのか?」)に答えたり、ドキュメントを精査したりするエンジンを強化することができます。
Haystackは、大量のデータを持つウェブサイトや社内Wikiから詳細な情報を探す「知識ベース」検索にも対応しています。Rusic氏によると、Haystackは金融サービス企業のリスク管理ワークフローの自動化に活用されており、「事業見通しは?」「過去数年間の収益の推移は?」といったクエリに対して結果を返すことができます。Alcatel-Lucent Enterpriseのような他の組織では、Haystackを活用して、現場の技術者にドキュメントを推奨する仮想アシスタントを導入しています。

ルシック氏によると、Haystackの目標は、開発者と製品部門が最新のAPI駆動型NLPアプリを迅速に、そして成功裏に構築できるようにすることでした。データサイエンスチームにとってプロトタイプを作成することは多くの場合簡単ですが、プロトタイプから本番環境への移行には課題が生じる可能性があると彼は指摘しています。2019年のガートナーの調査によると、NLPプロジェクトを含むAIプロジェクトの約80%は、本番環境に移行していません。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
「[Haystackを使用すれば]開発チームはフルスタックNLPアプリケーションを構築するためのあらゆるコンポーネントを備え、適切なワークフローのガイドを受けることができます。…現代のNLPは非常に急速に進化しており、オープンソースを通じて最先端の研究と実際の製品化可能な技術との間のギャップを埋めることがはるかに容易になっています」とRusic氏は述べています。「[構築済みのNLPシステム]は[Haystackの]基盤であり、追加のトレーニングなしでパイプラインで優れた結果をもたらすことがよくあります。必要に応じて、エンドユーザーや専門家が[システム]またはパイプラインの新しいイテレーションをテストして使用することでフィードバックを提供し、カスタマイズを行います。」
しかし、すべての企業がDIYルートを選択する、あるいは望んでいるわけではありません。マネージドソリューションを希望する企業には、前述のDeepset Cloudがあります。これは、NLPサービスのライフサイクル全体にわたって顧客をサポートします。このサービスは、実験(つまり、アプリのテストと評価、ユースケースへの調整、概念実証の構築)から始まり、本番環境でのアプリのラベル付けと監視で終了します。
「Deepset Cloudで開発されたすべてのNLPサービスは、APIを統合するだけで、あらゆるエンドアプリケーションで利用できます」とルシック氏は述べた。「アプリケーションの例としては、NLP駆動型のエンタープライズ検索(「現代的なGoogleのような」検索)やナレッジマネジメントなどが挙げられます。」
新たに調達した資金(総額1,560万ドル)により、Deepsetはオープンソースの成功(現在数千の組織がHaystackを利用)を収益増加につなげることを目指しています。ルシック氏によると、ドイツ・ベルリンに拠点を置く30名の従業員を抱える同社は、2021年の最初の資金調達ラウンド前に自力で立ち上げ、損益分岐点に達しており、現在ではエアバスを含む大企業を顧客としています。
「(新たな資金を得て)オープンソースのHaystack NLPプロジェクトの構築を継続し、より多くの機能を追加することで、NLPに精通したバックエンド開発者がNLPサービスをより簡単に構築できるようにします」とルシック氏は述べた。「また、Deepset Cloudを、言語対応アプリケーションを構築するための本格的なエンタープライズ向けSaaS(Software as a Service)へと開発します。これには、より柔軟なワークフローの実現、よりきめ細かな製品ライフサイクルガイダンス、ラベリングやデータ統合といった必須ツールと補足ツールの提供が含まれます。」
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといったガジェット系ブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る