Google CloudがBigQuery向けの新しいデータ損失防止ツールをリリース

Google CloudがBigQuery向けの新しいデータ損失防止ツールをリリース

大企業は必然的にあらゆる種類の機密データを収集します。多くの場合、それは顧客や従業員の個人識別情報(PII)や、限られたユーザーのみがアクセスすべきその他の情報です。しかし、大企業が収集するデータ量が増加するにつれて、手作業によるデータの検出と分類ではもはや対応しきれません。Googleは最近、Automatic DLP(データ損失防止)というツールをリリースしました。このツールは、BigQueryユーザーがデータウェアハウス内の機密データを検出・分類し、その結果に基づいてアクセスポリシーを設定できるようにします。Automatic DLPは以前はパブリックプレビューでしたが、この度一般公開されました。

「多くのお客様が直面している課題の一つは、自社のデータをより適切に保護し、顧客の個人情報(PII)を守り、コンプライアンスを遵守し、あるいはデータ管理をより適切に行えるように、自社のデータを理解することです」と、Google Cloudのこのサービス担当プロダクトマネージャー、スコット・エリス氏は語った。「お客様が直面している課題の一つは、まさに自社データに対する最初の認識、つまり可視性にあると私たちは考えています。」

エリス氏は、多くの企業が導入している手動のプロセスでは、現在流入してくるデータの規模に対応できないと指摘した。そのため、たとえば個人情報が意図せず漏洩しないようにするためには、すべての列を調べて PII などを確認する自動化システムが必要だ。

画像クレジット: Google Cloud

さらに、多くの企業が大量の非構造化データも収集しているという、もう一つの問題があります。「お客様から伺った最大の課題の一つは、メールアドレスの列があれば、それを知っていれば良いということです。一度知ってしまえば、それをデータとして扱うことができます。しかし、非構造化データの場合は、少し異なる課題が生じます。メモ欄があるかもしれません。これは非常に貴重な情報です。しかし、時折、誰かがそこに機密情報を書き込むことがあります。こうしたデータは、少し異なるものとして扱う必要があります。場合によっては、修復方法も異なるものになることがあります」とエリス氏は説明しました。

Automatic DLP の導入を少しでも容易にするため、チームは Google データスタジオ用の新しいダッシュボード テンプレートをいくつか作成しました。これにより、ユーザーは高度な概要と、よりグラフィカルな調査ツールに簡単にアクセスできるようになります。Google Cloud Console を使用してデータを詳細に分析することもできますが、これは必ずしもユーザーフレンドリーとは言えません。もちろん、このデータを Looker などの BI ツールに取り込んで調査することも可能ですが、チームは、ユーザーがデータに簡単にアクセスできるようにすることで、Automatic DLP の豊富な知見を結集したデータ活用を可能にしたいと考えました。

画像クレジット: Google Cloud

今回のリリースでは、Googleはユーザーにデータのプロファイリング頻度と条件を設定できる新しいツールも提供しています。サービス開始当初はGoogleチームがデフォルトを設定していましたが、お客様との対話の中で、プロファイラーの実行間隔を異なるものにする必要があるユースケースが数多くあることがすぐに明らかになりました。例えば、誰かがテーブルのスキーマを変更した場合、ある企業ではすぐにプロファイリングを行いたいと考える一方で、別の企業ではテーブルに新しいデータが入力されるまで数日待つことを望むかもしれません。

チームが構築したもう一つの新機能は、Google Cloudのセキュリティ分析サービスであるChronicleとの統合です。Chronicleは、すべてのテーブルのリスクスコアをChronicleと自動的に同期できるようになりました。チームは今後、さらなる統合を構築していく予定です。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

フレデリックは2012年から2025年までTechCrunchに在籍していました。また、SiliconFilterを設立し、ReadWriteWeb(現ReadWrite)にも寄稿しています。フレデリックは、エンタープライズ、クラウド、開発者ツール、Google、Microsoft、ガジェット、交通機関など、興味のあるあらゆる分野をカバーしています。

バイオを見る