GoogleのGradientがSend AIを支援し、企業が複雑な文書からデータを抽出できるように支援

GoogleのGradientがSend AIを支援し、企業が複雑な文書からデータを抽出できるように支援

新興のオランダのスタートアップ企業は、正確性とセキュリティが最も重要となる大量の複雑な文書から企業がデータを抽出できるように支援したいと考えており、そのために Google の Gradient Ventures の支援を確保したばかりだ。

Send AI は、企業が独自のデータ抽出ニーズに合わせて AI モデルを微調整できるカスタマイズ可能なプラットフォームを備え、UiPath、Abbyy、Rossum、Kofax など、ドキュメント処理分野の既存の企業に挑戦しています。

例えば、保険業界のように規制の厳しい業界で事業を展開している企業は、PDFや紙のファイルから、様々な向きや背景の「ノイズ」で撮影されたスマートフォンの写真まで、多種多様なフォーマットを処理しなければならないでしょう。このような非標準の「非構造化」データは、人間が解析するだけでも十分に困難ですが、完全に機械主導のアプローチでは、請求の却下や払い戻しの誤り、そして後々の管理上の煩わしさにつながる可能性があります。

実際、一般的な市販の文書処理ソフトウェアは、複数の業界にまたがる一般的な文書タイプ向けに設計されていることが多く、特定のユースケースには適していません。一方、Send AIを使用すれば、企業はコンピュータービジョンモデルをトレーニングして特定の文書を認識し、別の言語モデルを使用して関連データを抽出・検証することができます。さらに、疑わしい点があれば人間が介入し、Webインターフェースを通じて各ステップを制御・検証することができます。

「この検証は、想定された番号が本当に番号であるかどうかを確認するだけの単純なものから、データベースに登録番号を検索して一致するものがあるかどうかを確認する、より高度なものまであります」と、Send AIの創設者兼CEOであるトム・トレンテルマン氏はTechCrunchに語った。「あらゆる不備は報告され、人間によるレビューが行われます。」

2021年にアムステルダムでAutopilotとして設立されたSend AIは、以前は大学卒業生の同窓会ファンドから10万ドルの小額の投資を調達していましたが、事業を拡大し始め、GoogleのGradient VenturesとKeen Venture Partnersが共同でリードし、DeepMindなどの企業出身の多くのエンジェル投資家が参加したプレシードラウンドの資金調達で、さらに220万ユーロ(240万ドル)を調達しました。

Send AIが企業の文書からのデータ抽出を支援する方法

企業はAPIを介してSend AIのクラウドベースソフトウェアにアクセスし、メールで送信された文書からデータを集約することができます。Send AIは文書を受信すると、視覚的に強化した上で、言語モデルに送信し、分類と抽出を行います。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

ターゲット市場に関して、トレンテルマン氏は、同社が実質的にターゲットにしているのは「文書処理に最も苦労している」大企業だと述べているが、実際には大量の文書を処理するあらゆる企業がこの技術を活用できる可能性があるという。

AI送信: データ抽出
画像クレジットSend AI: データ抽出

言うまでもなく、Send AIは、既に市場に出回っている多数の既存の文書処理ツールに加え、OpenAIがGPT-X(ChatGPTの基盤)で展開しているような、強力な大規模言語モデルを基盤としたサービスを販売する新種のスタートアップ企業とも競合関係にあります。しかし、Trentelman氏は、こうした製品は要約や質問への回答など、大量の文書に対して高い精度が求められる「主観的に良い」スコアが求められる状況では非常に効果的だと認めていますが、それはまた別の話です。

「これらのテクノロジーは、遅かれ早かれ壁にぶつかるでしょう。大規模で汎用的なLLMは、依然として予測不可能で、速度が遅く、コストもかかります」とトレンテルマン氏は述べた。「Send AIでは、お客様が独自のソリューションを構築できるようにしています。」

Send AI は、内部的には小規模なオープンソース モデルに基づいて構築されており、顧客はまずこのモデルを手作業で少量の文書を処理してトレーニングし、その後、人間が手作業で修正を加えながら、新しい文書に対してこの処理を繰り返します。

Send AIの価格設定は、クレジットベースの基本プランで、顧客は処理ステップごとに料金を支払います。「これにより、50ページのPDFを処理するのか、それとも単一のテキストスニペットを処理するのかを区別することができます」とトレンテルマン氏は述べています。「当社のモデルは安価で高速、そして信頼性が高いため、顧客ごとに導入できます。これにより、顧客はデータとパフォーマンスを自ら管理できます。これが、医療保険や政府機関といった規制の厳しい業界で当社が成功を収めている理由です。」

顧客が自らのデータを管理する

Send AIは、顧客が自らのデータに対するコントロールを与えられるため、規制の厳しい業界にとって魅力的な技術だと謳っています。クラウドベースであることを考えると、これは一見矛盾しているように思えるかもしれません。しかし、Trentelman氏は、OpenAIのような典型的なLLMの仕組みを指摘し、複数の異なる顧客からのトレーニングデータを単一のモデルに統合することで機密データの漏洩リスクが高まると指摘しています。まさにこれが、LLMを活用したソフトウェア内で個人データを保護することを謳うスタートアップ企業が数多く登場している理由です。

Send AI は、顧客ごとに小規模で独立したオープンソースのトランスフォーマー モデルを展開することで、このような懸念に対処しようとします。

「私たちは仕事をこなすためにさまざまなロボットを使っています。箱から出した状態では大した機能はありませんが、高品質のデータでトレーニングすれば、強力かつ正確になります」とトレンテルマン氏は語った。

そのため、モデルと関連するトレーニングデータはSend AIのクラウド上に保存されますが、分離されたモデルを使用することで、データの保存場所を正確に特定し、リクエストに応じて削除することができます。Trentelman氏によると、これはSend AIを他のプロバイダーよりも「優先候補」にするのに十分であり、データプライバシーを重視する企業にとって、オンプレミス展開が唯一の選択肢ではないことを納得させるのにある程度役立つとのことです。

「最近では、規制の厳しい企業でも、サプライヤーが広範な規制を遵守する限り、パブリッククラウドの利用を許可しています」とトレンテルマン氏は述べた。「当初はオンプレミスで導入できるかどうかという質問が常にありましたが、最終的には1社を除いて全てが当社のパブリッククラウドを採用してくれました。」

Send AIは現在、プライベートベータモードで運用されていますが、既に保険大手のAxaをはじめとする有力な顧客を獲得しています。現在7名のチームを擁する同社は、新たな資金注入により、正式商用化に向けて年内に人員を倍増させる予定です。