ドイツのスタートアップ企業Kern AIがモジュール型NLP開発プラットフォームのシード資金を獲得

ドイツのスタートアップ企業Kern AIがモジュール型NLP開発プラットフォームのシード資金を獲得

自然言語処理(NLP)は決して新しい分野ではありませんが、ChatGPTをはじめとする生成AIのブームのおかげで、ここ数ヶ月で人々の意識に急速に浸透しました。Hugging FaceのTransformersや、ChatGPTのライバルであるBardの基盤となる予定のGoogleのLaMDAといった他のNLPモデルと並んで、AIが主流に躍り出る日がもうすぐそこまで来ているという実感が湧いています。

しかし、ChatGPTにいくつかのキーワードを入力してニック・ケイヴ風の歌詞を作成させようとする人にとっては、基礎となるAIモデルの開発に費やされるすべての作業、つまり大衆市場で消費できるレベルに到達する作業は見逃されやすい。

NLPモデルを作成するには、アルゴリズムだけでなく、大量の高品質なトレーニングデータが必要です。これらのトレーニングデータは正確に「ラベル付け」されています。ラベル付けとは、機械が理解し学習できるように生データを分類する技術です。このラベル付けプロセスを支援する企業は数多く存在しますが、その一つがドイツのスタートアップ企業Kern AIです。同社は、NLP開発者やデータサイエンティストがラベル付けプロセスを制御するだけでなく、付随タスクを自動化・統合し、低品質データへの対応を可能にするプラットフォームを構築しました。

「データ中心」のNLP

現在、NLPがAIのホットなトレンドの一つとなっている中、Kern AIは本日、シード資金として270万ユーロ(290万ドル)を調達したことを発表しました。これは、保険会社BarmeniaやVHV Versicherungen、物流会社Metro Supply Chain Group傘下のEvolution Time Critical、そしてベンチャーキャピタルの支援を受けたスタートアップ企業Crowd.devといった企業クライアントへの導入拡大を加速させるものです。同社はまた、オープンソース版のNLPは、SamsungやDocuSignといった企業のデータサイエンティストにも利用されていると述べています。

2020年にボンで設立された同社の共同創業者兼CEOであるヨハネス・ヘッター氏は、「NLPがデジタル化の核となる技術になるという信念を持って」会社を設立したと述べ、開発者はNLP開発プロセスに対するより多くの制御と柔軟性を必要としていることを認めた。

同社の主力製品はオープンソースのRefineryであり、開発者はこれを使用することで、ラベル付けを半自動化し、トレーニングデータ内の低品質のデータセットを識別し、すべてのデータを単一のインターフェースで監視することで、データ中心のアプローチでNLPモデルを構築できます。

一方、同じくオープンソースの Bricks は、開発者が Refinery に統合できるモジュール式の標準化された「コード スニペット」のコレクションであり、同社によれば「NLP 自動化を推進するアプリケーション ロジック」です。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Kern AI: Refinery の動作例。画像提供: Kern AI

ヘッター氏によると、Kern AIプラットフォームの典型的な実世界でのユースケースは、企業の社内ツールの利用だ。例えば、物流会社は「明日の午後4時までにヨーテボリの工場にパレット20枚を発送してほしい」といった顧客からの依頼に応じる必要がある。このような時間的制約のある依頼には迅速な対応が求められる。物流会社はKern AIを活用することで、受信した依頼を自社の輸送管理システム(TMS)と同期させ、依頼の意図と要件を自動的に検出することができる。

「これは、サービス受信トレイを当社の商用製品のワークフローと同期させることで実現され、Refineryにデータがプッシュされます」とヘッター氏はTechCrunchに説明した。「開発者はここでNLP技術を用いてリクエストを分析し、構造化された抽出情報をTMSに直接プッシュすることができます。」

したがって、これはある意味では Zapier のようなものと似た方法で動作しますが、ルールベースのアプローチに従うのではなく、より複雑な自然言語理解のために構築されています。

現状

実のところ、プロプライエタリとオープンソースの両方の分野において、既に無数の類似プラットフォームが存在します。例えば、最近160万ドルのシードラウンドの資金調達を行ったArgillaや、昨年Label Studio向けに2500万ドルというより巨額の資金調達を完了したHeartexなどが挙げられます。さらに、Snorkel AIはプロプライエタリ製品でありながら、これまでに約1億3500万ドルの資金調達を達成しています。

では、Kern AIの何が他と違うのでしょうか?Hötter氏によると、Kern AIは現在市場で唯一の「オープンコアでモジュール式のフルスタック」です。つまり、Kern AIのプラットフォームは、Label Studioなどの既存のラベリングプラットフォームにプラグインする開発者向けアドオンとして、あるいはデータ中心のNLPアプリケーション全体を構築するために使用できるということです。

「つまり、Refineryをトレーニングデータの管理と構築のみを行うアプリケーションとして使うこともできます。例えば、高度なNLP製品の開発を目指しており、データ構築のための優れたソリューションを必要としているスタートアップ企業の場合などです」とヘッター氏は述べた。「あるいは、Refineryのアルゴリズムを使ってリアルタイムAPIを展開し、バリューチェーン全体をカバーするワークフロー全体をオーケストレーションすることも可能です。私たちの目標は、データチームの現在の技術スタックに関わらず、最新のNLPの進歩を活用できるようにすることです。そのため、私たちのプラットフォームはモジュール式になっています。」

Kern AI には現在約 9 人の従業員がおり、本社のボンに物理的なオフィスを構えながら、大部分がリモートで勤務しています。

Kern AIはこれまで、プレシードラウンドで55万ユーロ(58万7000ドル)の小額の資金調達を行っており、新たに290万ドルを調達したことで、プラットフォームの機能セットを拡張し、音声や文書ベースのデータを含むワークフローに対応し、より幅広い業界のユースケースに対応する製品を開発する予定だとヘッター氏は述べた。また、現在は招待制となっている無料の個人向けプランの一般提供を迅速に進めるとも述べた。 

Kern AI のシードラウンドは、Seedcamp と Faber が共同で主導し、xdeck、Another.vc、および少数のエンジェル投資家が参加しました。

ポールはロンドンを拠点とするTechCrunchのシニアライターで、主に(ただしそれだけではない)英国およびヨーロッパのスタートアップの世界に特化していました。オープンソースソフトウェアビジネスなど、情熱を注いだ他のテーマについても執筆していました。2022年6月にTechCrunchに入社する前は、The Next Web(現在はFinancial Times傘下)とVentureBeatで、コンシューマー向けおよびエンタープライズ向けテクノロジーを10年以上取材してきました。企画書の送付先:paul.sawers [at] techcrunch.com セキュア/匿名の情報はSignal(PSTC.08)まで。また、Bluesky(@jambo.bsky.social)にも参加していました。

バイオを見る