データは企業にとって金鉱です。
適切に管理されていれば、全員に責任を持たせるための重要なツールとなるだけでなく、大規模に、より良い意思決定につながる明確さと洞察も得られます。
しかし、ほとんどの企業はデータ1.0にとどまっており、データを手作業で事後対応的なサービスとして活用しています。中には、シンプルな自動化によってチームの生産性を向上させるデータ2.0への移行を開始している企業もあります。暗号資産データの複雑さは、データに新たな機会をもたらしました。それは、体系的なインテリジェンスと自動化を通じて価値創造を拡大できるデータ3.0という新たな領域への移行です。これが、私たちのデータ3.0への道のりです。
Coinbaseは金融会社でもテクノロジー企業でもなく、暗号通貨を扱う会社です。この違いは、私たちのデータの扱い方に大きな影響を与えます。暗号通貨を扱う会社として、私たちは(通常の1つか2つの種類のデータではなく)3つの主要な種類のデータを扱っており、それぞれが複雑で多様です。
- ブロックチェーン: 分散化されており、公開されています。
- 製品: 大規模かつリアルタイム。
- 財務: 高精度であり、多くの財務/法律/コンプライアンス規制の対象となります。

私たちは、多様なデータを連携させ、データサイロを排除し、問題が発生する前に解決し、他の方法では存在しなかったであろう Coinbase の機会を創出することで、どのように価値創造を拡大できるかということに重点を置いてきました。
LinkedInやeBayといったテクノロジー企業、そしてCapital Oneをはじめとする金融セクターで働いた経験から、私はデータ1.0からデータ3.0への進化を目の当たりにしてきました。データ1.0では、データはアドホックな手動サービスや緊急事態への対応といった、リアクティブ(受動的)な機能として捉えられていました。
データ2.0では、シンプルなツールとサードパーティのソリューションを活用して、手作業や反復的なタスクの一部を自動化し、チームの生産性を向上させます。ただし、データチームは依然として、より多くの価値を生み出すために人材の増員に頼るケースがほとんどです。そして最終的に、データ3.0の段階では、オープンソース技術と社内技術を連携させてデータシステムを構築し、価値創造を根本的に拡大します。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
データ3.0の涅槃への道
データ3.0の最大のメリットは、あらゆるデータフローにもたらされる効率性と一貫性です。これにより、企業は限られたリソースの中で当面のニーズに対応しながら、長期的な成功につながる包括的なデータ基盤を構築できるようになります。企業が小規模で急速に変化している段階では、この違いは明らかではないかもしれませんが、企業が規模を拡大し、急成長を遂げるにつれて、データフロー全体の一貫性(あるいは一貫性の欠如)が大きな課題となり、早期にビジョンを確立しなければ軌道修正が困難になる可能性があります。
世界最高峰のテクノロジー企業でさえ、特定の課題を解決するために、異なるエンジニアリングチームがそれぞれ独自のデータ製品やサービスを構築するという悪習慣が生まれてしまうことがあります。その結果、エンドツーエンドのデータシステムの標準化されたワークフローに大きなギャップが生じ、大規模なデータの構築と運用が困難になることがあります。さらに悪いことに、こうした単発の取り組みが大きくなり、統合と移行に時間を要するスタンドアロンシステムになってしまうこともあります。こうしたシステムはレガシーシステムとして残存し、企業に莫大な技術的負債をもたらすことがよくあります。
ブロックチェーン技術とデータ活用事例は絶えず進化しており、私たちのデータ3.0への取り組みはまだ終わりに近づいています。とはいえ、これまでの進歩を大変誇りに思っています。これまでの取り組みとシステムの概要をご紹介します。

データの保存と処理
特定のテクノロジーを採用する選択肢に関わらず、ストレージの分離、コンピューティングの分離、そして「唯一の真実のソース」のセマンティクスという3つの主要コンポーネントについて明確な戦略が必要です。これらのコンポーネントを分離し、明確な技術戦略を策定することで、企業の成長に伴うパフォーマンスと容量のボトルネックを回避できます。
データプラットフォームとアプリケーション
様々なニーズに対応するため、社内技術、オープンソースツール、ベンダーソリューションを組み合わせて活用していますが、各カテゴリーにおける具体的なソリューションの選定においては、明確なトレードオフを設けています。これにより、将来的に重複や曖昧さが生じないようにしています。これは、イベントシステム、データオーケストレーションワークフロー、ビジネスインテリジェンスレイヤー、そして実験プラットフォームの管理方法にも当てはまります。これにより、高度に分離され、スケーラブルなアーキテクチャが実現しています。
機械学習とプラットフォーム
近年のAIの隆盛を考えると、データチームの中で最も「目立つ」部分と言えるかもしれませんが、同時にデータチームの中で最もクロスファンクショナルな要素でもあります。Coinbaseの真にエンドツーエンドの機械学習プラットフォームであるNostradamusは、データパイプライン、トレーニング、デプロイメント、サービス提供、実験など、あらゆる機械学習モデルをサポートしています。この機械学習プラットフォームは、データエコシステムの他のすべての部分を念頭に置いて構築されているため、機械学習によって目の前の問題を解決できるだけでなく、ビジネスの成長に合わせて成長し、拡張できるように設計されています。
データサイエンスとデータ製品
これら2つの領域は、データチームの中でおそらく最もエンドユーザーフレンドリーな部分です。なぜなら、これらは基本的に、お客様に満足と価値を提供するためにキュレーションされた、精緻化されたデータインサイトのプレゼンテーション層だからです。また、上記のすべての取り組みから最も直接的な恩恵を受けるのも、この2つの領域です。
チームの最も重要な任務は、データ サイエンティストがマシンから離れて、マシンがデータを提供してスケーラブルな方法で消費者に価値を生み出すことに集中する必要があることです (マシンとデータ消費者の間の仲介者になるのではなく)。
データは世界で最も価値のある(そして脆弱な)リソースである
Early Stageは、スタートアップ起業家と投資家のための、最高のハウツーイベントです。最も成功している創業者やベンチャーキャピタルがどのように事業を構築し、資金調達を行い、ポートフォリオを管理しているかを直接聞くことができます。資金調達、採用、営業、製品市場適合、PR、マーケティング、ブランド構築など、会社設立のあらゆる側面を網羅します。各セッションには聴衆の参加も組み込まれており、質疑応答やディスカッションのための十分な時間も設けられています。チェックアウト時にコード「TCARTICLE」を入力すると、チケットが20%オフになります。