トニックは、合成データがスケーラビリティとセキュリティの問題を解決する新しいビッグデータになると考えています。

トニックは、合成データがスケーラビリティとセキュリティの問題を解決する新しいビッグデータになると考えています。

ビッグデータはまやかしだ。何年も前から、あらゆる企業はデジタルデータのあらゆる情報を、何らかのデータベースに保存すべきだと言われてきた。そうしないと、経営陣が競合他社などに対する競争力情報を失う恐れがあるからだ。

しかし、ビッグデータには問題が 1 つあります。それは、その量が膨大すぎることです。

ペタバイト規模のデータを処理し、ビジネスインサイトを生み出すには、費用と時間がかかります。さらに悪いことに、膨大なデータがあちこちに散らばっていると、世界中のあらゆるハッカーグループにとって、企業にとって格好の標的となってしまいます。ビッグデータは維持費、保護費、そしてプライバシー保護にも費用がかかります。そして、結局のところ、得られる利益はそれほど大きくないかもしれません。多くの場合、適切にキュレーションされ、厳選されたデータセットは、膨大な量の生データよりも迅速かつ優れたインサイトを提供してくれるのです。

企業は何をすべきでしょうか? そうです、ビッグデータに関する罪を正すための強壮剤が必要なのです。

Tonicは、生データをソフトウェアエンジニアやビジネスアナリストが利用できる、より管理しやすくプライベートなデータセットに変換する「合成データ」プラットフォームです。その過程で、Tonicのアルゴリズムは元のデータを匿名化し、統計的には同一でありながら合成されたデータセットを作成します。これにより、個人情報が安全に共有されることはありません。

例えば、オンラインショッピングプラットフォームには、顧客の取引履歴や購入商品などが保存されています。そのデータを社内のエンジニアやアナリスト全員と共有するのは危険です。なぜなら、その購入履歴には個人を特定できる情報が含まれている可能性があり、知る必要のない者はアクセスすべきではないからです。Tonicは、元の決済データを、全く同じ統計特性を持ちながらも元の顧客とは紐付けられていない、より小規模なデータセットに変換することができます。こうすることで、エンジニアはアプリを、アナリストはマーケティングキャンペーンをテストすることができ、プライバシーに関する懸念を抱くことなく、テストを実施できます。

合成データをはじめとする大規模データセットのプライバシー保護手法は、ここ数ヶ月、投資家から大きな注目を集めています。先週、Skyflow社が調達した資金調達ラウンドについてお伝えしました。同社は、ポリモーフィック暗号化を用いて、従業員が必要なデータのみにアクセスし、それ以外のデータへのアクセスをブロックすることを目指しています。BigIDは、より包括的な視点から、どのデータがどこにあり、誰がアクセスすべきか(つまり、地域のプライバシー法に基づいてデータガバナンス)を追跡します。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Tonicのアプローチは、プライバシーの問題だけでなく、データセットの規模が拡大するにつれて生じるスケーラビリティの課題も解決できるという利点があります。この組み合わせは投資家の注目を集めています。今朝、同社はGGVのGlenn Solomon氏とOren Yunger氏が主導するシリーズAラウンドで800万ドルを調達したことを発表しました。Yunger氏は同社の取締役に就任する予定です。

同社は2018年に4人の創業者によって設立されました。CEOのイアン・コーは、COOのカール・ハンソン(二人の出会いは中学校時代)とCTOのアンドリュー・コロンビと共にPalantirで働いていました。また、コーはTableau在籍中に同社のエンジニアリング責任者であるアダム・カモアとも共に働いていました。シリコンバレーで最大規模かつ最も成功しているデータインフラ企業で培ったこうした経験が、Tonicの製品DNAの一部となっています。

トニックのチーム。写真はトニックより。

コー氏は、Tonicは現代のソフトウェアエンジニアリングで発生する最も明白なセキュリティ上の欠陥のいくつかを防ぐように設計されていると説明しました。エンジニアリングチームのデータパイプライン処理時間を節約するだけでなく、「Tonicは、機密データが本番環境から、本番システムよりも常にセキュリティが低い下位の環境に移動する心配もありません」。

コー氏によると、後にTonicとなるアイデアは、Palantirの銀行顧客で問題のトラブルシューティングを行っていた際に生まれたという。問題解決にはデータが必要だったが、そのデータは非常に機密性が高いため、チームはその差を埋めるために合成データを使うことになった。コー氏は、特に昨今の法改正を踏まえ、合成データの有用性をより多くの人々に、より厳密な方法で提供したいと考えている。「規制当局の圧力が、データに関するチームの実践を真に変革させていると思います」と彼は指摘した。

Tonicの技術の鍵となるのは、生データを評価し、すべてのレコード間の関係性を統計的に定義するサブセッターです。この分析の一部はデータソースに応じて自動化されますが、自動化できない場合は、TonicのUIを利用してデータサイエンティストがデータセットを登録し、手動で関係性を定義することができます。最終的に、Tonicは企業内のデータ利用者全員が利用できる合成データセットを生成します。

コー氏は今回の資金調達により、使いやすさとオンボーディング、そして顧客へのこのモデルのメリットの訴求にさらに力を入れたいと考えている。「様々な意味で、私たちは新たなカテゴリーを創造しています。つまり、人々がその価値を理解し、理解し、アーリーアダプターとしてのマインドセットを持つ必要があるということです」と彼は述べた。

このラウンドには、リード投資家のGGVに加え、Bloomberg Beta、Xfund、Heavybit、Silicon Valley CISO Investments、そしてエンジェル投資家のAssaf Wand氏とAnthony Goldbloom氏も参加した。

Skyflow、企業の個人データ保護を支援するため1,750万ドルを追加調達

ダニー・クライトンはCRVの投資家であり、かつてはTechCrunchの寄稿ライターでした。

バイオを見る