ゼロコピーのためのガイド
ゼロコピー連携を使用すると、複数のデータベースに保存されているデータに同時にアクセスできます。移動、コピー、再フォーマットは必要ありません。
ゼロコピー連携を使用すると、複数のデータベースに保存されているデータに同時にアクセスできます。移動、コピー、再フォーマットは必要ありません。
最後に引っ越したときのことを覚えていますか?膨大な数の家財道具を荷造りし、トラックに積んで運び、新居で荷解きするプロセスを経たことでしょう。おそらく、運搬中に家財道具が破損しないよう祈ったはずです。もし家財道具を完璧な状態で新居までテレポートできるとしたらどうでしょうか。物理的な世界では(まだ)不可能ですが、ゼロコピー連携を利用すれば、データを実際に移動することなく連携できます。
ゼロコピーでは、複製や移動をせずに、データを2つ以上のデータストア間で共有できます。これは、SnowflakeやGoogle BigQueryなどのクラウドデータウェアハウスにデータを保管している企業にとって朗報です。一部の組織は、データの複製を伴う顧客データプラットフォーム(CDP)の導入に抵抗を感じています。ゼロコピー連携であれば、物理的なデータ移動というマイナス要素なしで、データハーモナイゼーション、ID管理、組み込みのアナリティクス、有効化といったCDPのメリットを活用できます。
以降のセクションでは、ゼロコピー連携の詳細、他の転送手法との違い、使用開始の方法について解説しています。
ゼロコピーとは、データを複製したり、物理的に移動したりすることなく、複数のソースのデータを集約して一元化する連携テクノロジーです。ゼロコピーを導入することで、複数のデータベースのデータにアクセスできます。何かを移動したり、コピーしたり、再フォーマットしたりする必要はありません。ゼロコピーには、データへのすばやく簡単なアクセスを実現するだけでなく、データの移動や変更に伴うコストやエラーリスクを低減する効果もあります。
ゼロコピーを使用すると、一元化したプラットフォームで他のデータリポジトリ(データソース)とのリンクを確立できます。ここで、データの共有経路を確立する手順を見ていきましょう。
データフェデレーションとは、外部データプラットフォームのデータに接続し、中央リポジトリから参照可能にする仕組みです。データフェデレーションを完了すると、データを1か所で分析できるようになります。まずは、外部データプラットフォームへの接続を作成し、データストリームを定義しましょう。
データ共有(データ出力)では、中央データリポジトリのデータを外部データプラットフォームと共有できます。データ共有により、外部システムで内部データを表またはビューとしてネイティブに表示できます。内部中央リポジトリのデータだけでなく、リポジトリで生成されるあらゆるデータインサイトも共有できます。では、ゼロコピーでデータを共有する手順を見ていきましょう。
ゼロコピーは、従来の手法にはない重要なメリットを組織にもたらします。
ゼロコピーによるデータガバナンスでは、プロセスがシンプルになり、複数のソース間でデータが同期されなくなるリスクを軽減できます。その結果、ソースデータの整合性の保持につながります。このシンプルなプロセスが、データセキュリティの維持と不正アクセスの抑制に役立ちます。
ゼロコピーでは、データの複製を回避できるため、ストレージコストを削減できます。データの保存場所にあるデータに、ほぼリアルタイムでアクセスできます。ストレージスペースへの追加投資は発生しません。
ゼロコピーでは、さまざまなデータソースやプールのデータにアクセスできます。データの変換、複製、コピーは不要です。従来のデータ転送手法では、一般にETLパイプラインが必要でしたが、脆弱でメンテナンスコストも高額でした。ゼロコピー連携なら、チームは元の保存場所にあるデータにほぼリアルタイムでアクセスできます。
ほぼリアルタイムでデータにアクセスできるため、元の場所にあるデータが更新されると、変更内容が直ちに反映されます。データをコピーまたは複製する方式では、複数のバージョンが作成されることになります。誰かがコピーを変更した場合は、他のすべてのコピーを個別に更新しなければなりません。ゼロコピー連携は、この課題を解消します。
あるストレージから別のストレージへデータを移動することは、一般的な作業です。多くの場合、このプロセスには、抽出-変換-ロード(ETL)や抽出-ロード-変換(ELT)など、何らかのデータ変換を伴います。しかし、データ転送には課題が伴うため、データ転送を避ける組織もあります。ゼロコピーは、データ転送に伴ういくつかの課題を緩和することで、顧客データプラットフォームなどの一元的なシステムの使い勝手を高めます。
| 従来のデータ転送手法 | ゼロコピー | |
| 複製 | ソースデータを元の場所からターゲットにコピー | データは元の場所のまま |
| 更新 | データは最後の同期時点までの正確性に限られる | データにリアルタイムまたはほぼリアルタイムでアクセス |
| コスト | ユーザーはデータの移動および同期コストを負担 | 物理的なデータ移動コストなし |
| 規制要件 | ガバナンスの複雑化により、コンプライアンスの維持が困難 | ユーザーの責任対象はソースデータのみ |
| エラー | データ移動でエラーやミスが発生する可能性あり | 移動に伴うエラーなし |
| メンテナンス | コピーと同期でさらに複雑化 | 管理が容易 |
ゼロコピー連携は、さまざまなプロジェクトや業界で効果を発揮します。以下はその一例です。
製造業、eコマース、小売業の場合、ゼロコピー連携を使用することで、サプライチェーンと在庫データを結合して一元化できます。在庫レベルや生産プロセスの変化を追跡しやすくなり、納期や運用コストに関する意思決定に役立ちます。
Web、モバイル、店頭やその他の場所に散在している顧客データを一元化することで、強力なインサイトを導き出し、統合された顧客プロファイルを確立できます。マーケティングチームは、CDPに集約されたデータを駆使して効果的なマーケティングキャンペーンを作成し、ターゲット顧客にアピールできます。
ゼロコピー連携は、疑わしい活動を検知するのに役立ちます。たとえば、金融機関の場合、さまざまなシステムで発生する金融取引を1つのシステムに集約して分析できます。その結果、パターンや潜在的な不正行為を特定できます。
ヘルスケア組織の場合、医療チームが電子カルテ(EHR)、ラボシステム、ウェアラブルデバイスの患者データにアクセスできるようになると、より包括的な患者プロファイルを作成できます。
ゼロコピー連携とは、データをコピーまたは複製することなく、ソース間でデータを共有するための転送プロトコルです。
ゼロコピー連携では、Snowflakeなどのデータソースと、Salesforce Data 360などの顧客データプラットフォーム(CDP)間を接続する経路を確立します。この接続は双方向で動作します。つまり、ソースデータを一元的に参照し、そこから得たインサイトをソースと共有できます。
ゼロコピー連携では、複数のデータソースと双方向でデータを同時に共有できます。データを移動、コピー、再フォーマットする必要はありません。すばやく簡単にデータにアクセスできるだけでなく、データ転送に通常伴うコストやエラーリスクを低減できるというメリットもあります。
ゼロコピー連携により、組織はデータを複製することなく、幅広いデータにアクセスできます。その結果、深いインサイトを導き出し、包括的な顧客プロファイルを確立し、構造化データと非構造化データに対してエージェント型AIを適用し、データのセキュリティを維持しやすくなります。