AIモデル開発プラットフォームを立ち上げるスタートアップ企業Galileoは本日、Battery Venturesがリードし、The Factory、Walden Catalyst、FPV Ventures、Kaggle共同創業者のアンソニー・ゴールドブルーム氏をはじめとするエンジェル投資家が参加したシリーズAラウンドで1,800万ドルを調達したと発表した。今回の資金調達により、同社の累計調達額は2,310万ドルとなり、Galileoのエンジニアリングおよび市場開拓チームの拡大、そして新たなデータモダリティに対応するためのコアプラットフォームの拡張に充てられると、CEOのVikram Chatterji氏がTechCrunchへのメールで述べた。
AIの活用が企業全体で普及するにつれ、重大なAIエラーの検査、発見、修正を容易にする製品への需要が高まっています。最近の調査(MLOps Communityによる)によると、データサイエンティストと機械学習エンジニアの84.3%が、モデルの問題の検出と診断にかかる時間がチームにとって問題であると回答しています。また、4人に1人以上(26.2%)が、問題の検出と修正に1週間以上かかっていると認めています。
こうした問題には、AIシステムの学習に使用されたラベルに誤りが含まれる、誤ったラベル付けデータ(例えば、木の写真に誤って「観葉植物」というラベルが付けられているなど)が含まれます。また、データの進化によってAIシステムの精度が低下する場合(パンデミック前のデータで学習された株式市場モデルなど)、あるいはデータが特定の領域を十分に代表していない場合(例えば、顔写真のデータセットに肌の色が濃い人よりも肌の色が薄い人が多いなど)に発生する、データドリフトやデータの不均衡に関する問題もあります。
Galileoのプラットフォームは、「自動ロガー」とシステムを破壊する問題を特定するアルゴリズムを用いて、チーム間のAI開発パイプラインを体系化することを目的としています。オンプレミス環境に導入できるように構築されたGalileoは、開発前からポストプロダクションまで、AIワークフロー全体、そしてテキスト、音声、画像といった非構造化データモダリティにも対応します。
データサイエンスにおいて「非構造化」データとは通常、請求書やセンサーデータのように、事前に設定されたデータモデルやスキーマに従って整理されていないデータを指します。ガリレオの2人目の共同創業者であるアティンドリヨ・サンヤル氏は、高品質なデータがモデルに確実に取り込まれるようにするためのExcelやPythonスクリプトベースのプロセスは手作業で行われ、エラーが発生しやすく、コストもかかると主張しています。

「Galileoでデータを検査すると、ユーザーはラベル付けの誤り、過小評価されている言語、不要なデータといったデータエラーのロングテールを瞬時に発見できます。Galileo内でこれらのデータを削除、再ラベル付け、あるいは本番環境から類似データを追加することで、即座に対応できます」と、サンヤル氏はTechCrunchのメールインタビューで語った。「Galileoが機械学習データワークフローをエンドツーエンドでサポートすることは、チームにとって非常に重要でした。モデルが本番環境にあるときでも、Galileoは自動的にデータドリフトをチームに通知し、次にトレーニングに最も価値のあるデータを提示してくれるのです。」
Galileoの共同創業チームは10年以上にわたり機械学習製品の開発に携わり、AIシステム開発の課題に直接直面してきたと語っています。チャタジー氏はGoogle AIで製品管理を率い、サンヤル氏はUberのAI部門でエンジニアリングを指揮し、AppleのSiriチームの初期メンバーでもありました。3人目の共同創業者であるヤシュ・シェス氏もGoogleのベテランで、以前は同社の音声認識プラットフォームチームを率いていました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Galileoのプラットフォームは、機械学習モデルを本番環境に導入・保守するためのツールセットであるMLOpsと呼ばれる、急成長中のソフトウェア分野に属しています。MLOpsの需要は非常に高く、ある推計によると、MLOpsの市場規模は2025年までに40億ドルに達する可能性があります。
この分野に参入するスタートアップ企業は数多く存在し、例えばCometは昨年11月に5,000万ドルを調達しました。他にも、Arize、Tecton、Diveplane、Iterative、台湾に拠点を置くInfuseAIなどがVCの支援を受けています。
しかし、わずか数ヶ月前にサービスを開始したにもかかわらず、ガリレオには「急成長」のスタートアップ企業からフォーチュン500企業まで、多くの有料顧客がいるとサンヤル氏は主張する。「当社の顧客は、ヘイトスピーチ検出、コンタクトセンターにおける発信者の意図検知、会話型AIによる顧客体験の拡張といった機械学習アプリケーションの構築にガリレオを利用しています」と彼は付け加えた。
サンヤル氏は、ガリレオの無料版であるガリレオコミュニティエディションのリリースにより、登録者数がさらに増加すると予想しています。コミュニティエディションでは、自然言語処理に取り組むデータサイエンティストが、有料版に含まれるツールの一部を使用して機械学習モデルを構築できるとサンヤル氏は述べています。
「ガリレオコミュニティエディションでは、誰でも無料でサインアップでき、ラベル付きデータでモデルをトレーニング中、またはラベルなしデータで推論実行中に数行のコードを追加して、強力なガリレオUIを使用してデータエラーを即座に検査、発見、修正したり、次にラベル付けする適切なデータを選択したりすることができます」と彼は付け加えた。
サンヤル氏は売上高の数字については質問に対し明らかにしなかった。しかし、サンフランシスコに拠点を置くガリレオの従業員数は5月の14人から現在「20人以上」に増加していると指摘した。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る