データは世界最大のリソースの一つとして台頭し、動画レコメンデーションエンジンやデジタルバンキングから、急成長を遂げるAI革命に至るまで、あらゆるものを支えています。しかし、データベースからデータウェアハウス、データレイクなど、データがますます分散化している現代において、リアルタイムのシナリオで活用できるよう、これらすべてを互換性のあるフォーマットに統合することは、途方もない作業になりかねません。
例えば、即時かつリアルタイムのデータアクセスを必要としないアプリケーションでは、一定の間隔でデータをまとめてバッチ処理するだけで済みます。このいわゆる「バッチデータ処理」は、月次売上データの処理などに役立ちます。しかし、多くの場合、企業はデータが作成されると同時にリアルタイムでアクセスする必要があり、例えば、すべての売上に関する最新情報に依存するカスタマーサポートソフトウェアでは、これが極めて重要になる場合があります。
一方、配車アプリも、乗客とドライバーをつなぐためにあらゆる種類のデータポイントを処理する必要があり、これは数日で済むものではありません。こうしたシナリオでは、「ストリームデータ処理」と呼ばれる処理が求められます。これは、データを収集・統合してリアルタイムアクセスを実現するものですが、設定がはるかに複雑です。
Dozer は、プラグアンドプレイのデータ インフラストラクチャ バックエンドを介して、あらゆるソースから高速な読み取り専用 API を直接提供することで、この課題に対処しようとしています。
Dozerは、約1年前にシンガポールを拠点に設立されたVivek Gudapuri氏とMatteo Pelati氏の手によるものです。二人はアジアと東ヨーロッパに10名の分散型チームを構築し、現在のソースコード(つまり、完全にオープンソースではない)から完全に収益化可能な製品へと拡大する準備を進めています。
Dozerは、少数の非公開のデザインパートナーと製品のテストを行ってきましたが、本日、ステルス状態から脱し、すべての開発者がアクセスできるようになりました。また、同社はSequoia Capitalのインド支社(Surgeプログラム経由)、GoogleのGradient Ventures、そしてJanuary Capitalから300万ドルのシード資金を調達したことも発表しました。

分散型
分散データを変換、統合、活用するために設計されたツールはすでに無数に存在しています。これには、Apache Flink、Airbyte、Fivetran などのストリーミング データベースや ETL (抽出、変換、ロード) ツール、Redis などの一時データ ストレージ用のキャッシュ レイヤー、システム間でデータをやりとりするための Hasura や Supabase などによるインスタント API が含まれます。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Dozer は、これらすべてのさまざまなカテゴリにまたがって機能し、最良と思われる部分を採用して、リアルタイム データ アプリの基盤となるインフラストラクチャと配管の構築に伴う摩擦を取り除きます。
ユーザーはDozerを既存のデータスタック(データベース、データウェアハウス、データレイクなど)に接続し、Dozerがリアルタイムのデータ抽出、キャッシュとインデックス作成、そして低レイテンシのAPIを介したデータ表示を行います。AirbyteやFivetranのようなサービスがデータウェアハウスへのデータ取り込みを支援するのに対し、Dozerは「最も効率的な方法でデータにアクセスできるようにする」という逆の側面に重点を置いていると、Gudapuri氏はTechCrunchに説明しました。
グダプリ氏は、Dozerは「独自のアプローチ」を採用しており、非常に具体的な問題にのみ対処する、と述べた。例えば、既存のストリーミングデータベースは、Dozerが提供するリアルタイムのデータ更新とAPIを単一の製品で提供すること以上に多くの問題を解決している。
「私たちは、これらの各カテゴリーにおいて適切な量の問題を解決することで、開発者に迅速なビルド体験と、すぐに使えるパフォーマンスを提供します」とグダプリ氏は述べた。「開発者は(現在)同じことを実現するために、複数のツールを統合する必要があります。」
例えば、既存のストリーミングデータベースは、クエリエンジン、データ探索、OLAP(オンライン分析処理)など、データベースエクスペリエンス全体をユーザーに提供しようとするでしょう。Dozerは意図的にこれらの機能を提供しず、代わりにPelati氏が「事前計算済みビュー」と呼ぶSQL、Python、JavaScriptを使用した機能に重点を置いています。これらはすべて、低レイテンシのgRPCおよびREST API経由でアクセスできます。
Pelati 氏によれば、この理由により、Dozer はデータクエリの待ち時間の改善を約束できるという。
「こうした設計上の選択により、Dozerは顧客向けアプリケーションに不可欠な、はるかに優れたクエリレイテンシを実現します」とペラティ氏は述べています。「通常であれば数ヶ月かかるデータアプリ全体を、たった一人の開発者で数分で立ち上げることができます。チームが複数の統合を構築・維持する必要がないため、時間とコストを節約できます。」
(完全には)オープンソース要素
Dozerは「オープンソース」プラットフォームとして宣伝されていますが、GitHubでライセンスをざっと確認すると、Elasticライセンス2.0(ELv2)を使用していることがわかります。これは、エンタープライズサーチ企業のElasticが2年前に真のオープンソースからの移行の一環として採用したライセンスと同じです。実際、Elasticライセンスはオープンソースとは認められていません。なぜなら、サードパーティがソフトウェアを入手して、ホスト型またはマネージド型のサービスとして独自に提供することを禁じているからです。
より正確に言えば、ELv2は「ソースコードが利用可能な」ライセンスと言えるでしょう。これは、MITのようなより寛容なオープンソースライセンスの多くの利点、例えばコードベースの透明性、Dozerの機能拡張、機能の微調整やバグ修正などを提供することを意味します。AWSやその他のクラウド大手がDozer上で直接収益化を図ろうとしない限り、これだけでもあらゆる規模の企業の心を掴むには十分でしょう。
しかし同社は、「近いうちに」デュアルライセンスに移行する予定であり、Dozerプロジェクトのコアとなるすべてのライセンスは「1つのコアモジュール」を除いてMITライセンスとなると述べた。さらに同社は、Python、React、JavaScriptを含むすべてのクライアントライブラリが既にMITライセンスになっていることを強調している。
Dozerが取り組んでいるのと同様の問題を解決するために、社内ツールを開発している企業がいくつかあることは注目に値します。その中には、数年前にBulldozerを開発したNetflixも含まれます。特筆すべきは、Bulldozerの主要な開発者の一人であるIoannis Papapanagiotou氏が現在Dozerのアドバイザーを務めていることです。
Dozerはまだ初期段階ですが、多くの著名な支援者から300万ドルの資金を調達しており、商業化に向けて順調に進んでいます。商業化には、多数のアドオン機能を備えたホスト型SaaS版の導入も含まれます。Gudapuri社によると、今後数ヶ月以内にサービスが開始される予定です。
「ホスト型サービスは、自動スケーリング、即時のデプロイメント、セキュリティ、コンプライアンス、レート制限、およびいくつかの追加機能に対応します」とグダプリ氏は述べた。