Skip to Content

Qu’est-ce que le zero copy ?

Photo d'une vendeuse et d'un client dans une boutique de vêtements, regardant une tablette / intégration zéro copie
Photo d'une vendeuse et d'un client dans une boutique de vêtements, regardant une tablette / intégration zéro copie

Comment une plate-forme de données clients peut-elle compléter votre entrepôt de données ? En offrant un accès instantané aux données sans qu'il soit nécessaire de les déplacer.

Vous souvenez-vous de la dernière fois que vous avez déménagé ? Vous avez probablement dû emballer trop de choses, les transporter en camion et déballer les cartons au nouvel endroit en espérant que le contenu ait survécu au voyage. Mais imaginez que vos meubles et vos biens puissent se téléporter en parfait état dans votre nouveau lieu de vie. Ce n’est pas (encore) possible dans le monde physique, mais avec une intégration zero copy, vous pouvez traiter les données de vos clients de cette manière.

Grâce au zero copy ou zero ETL (extract-transform-load, ou « extraction, transformation, chargement » en français), il est possible de partager des données entre deux ou plusieurs espaces de stockage de données sans les déplacer. Il s’agit d’une excellente solution pour les entreprises qui stockent des données dans un entrepôt de données cloud comme Snowflake ou Google BigQuery. Certaines d’entre elles hésitent à adopter une plate-forme de données clients (CDP) parce qu’elles ne veulent pas dupliquer les données.

Désormais, elles ne sont plus obligées de le faire. Grâce à l’intégration zero copy, les utilisateurs peuvent bénéficier des avantages d’une CDP, tels que l’harmonisation des données, la gestion des identités, l’analyse intégrée et l’activation, sans les inconvénients liés au déplacement physique des données.

Ce que vous apprendrez

Qu’est-ce que l’intégration zero copy ?

L’intégration zero copy permet d’accéder simultanément à des données qui se trouvent dans plusieurs bases de données différentes, sans avoir à déplacer, copier ou reformater quoi que ce soit. En plus de rendre l’accès plus rapide et plus facile, cette solution réduit les dépenses et les risques d’erreurs qui existent toujours lorsque des données doivent être déplacées ou modifiées.

La copie de données d’une base de données à une autre est une pratique courante. Souvent, ce processus implique une forme de transformation des données appelée « extraction-transformation-chargement » (ETL). Il peut s’agir d’une étape utile, voire nécessaire, dans la gestion des données de l’entreprise.

Mais cela représente aussi certains défis. Voici quelques-unes des différences entre les méthodes traditionnelles (copying) et l’approche zero copy :

 TraditionnelZero copy
RéplicationCopie des données sources de l’emplacement d’origine vers l’emplacement cibleLes données restent à l’emplacement d’origine
Mises à jourLes données ne sont exactes qu’à partir du dernier point de synchronisationLes données sont accessibles en temps réel
CoûtL’utilisateur paie le coût du déplacement et de la synchronisation des donnéesPas de coût de déplacement des données
Exigences réglementairesIl est plus difficile d’assurer la conformité en raison d’une gouvernance plus complexeL’utilisateur n’est responsable que des données sources
ErreursTout déplacement de données induit un risque d’erreursPas d’erreurs liées au déplacement
MaintenanceLa copie et la synchronisation créent plus de complexitéPlus facile à gérer

En règle générale, la copie physique des données entraîne des coûts de transport, des risques d’erreurs, des complications en matière de gouvernance et de gestion des données, ainsi que des retards dans la synchronisation des données.

Comment fonctionne l’intégration zero copy ? Le mécanisme proprement dit diffère d’une plate-forme à l’autre et selon que l’on accède aux données depuis la CDP vers l’entrepôt de données ou vice versa.

Dans les exemples suivants, nous utiliserons Salesforce Data Cloud comme CDP et notre partenaire Snowflake comme entrepôt de données. D’autres fournisseurs pourraient être utilisés sans que le fonctionnement change de manière significative.

(Retour en haut)

Qu’est-ce qu’un entrepôt de données ?

Un entrepôt de données est simplement un endroit fiable où l’on stocke et accède aux données importantes de l’entreprise. 

Les entrepôts de données traditionnels travaillent avec des données hautement structurées dans des tableaux formatés. Ils ont tendance à être assez lents et compliqués. En revanche, les entrepôts de données modernes, comme Snowflake, peuvent prendre en charge presque tous les types de données, les traiter rapidement et sont plus faciles à utiliser. Parce qu’ils sont conçus sur des plates-formes cloud telles qu’Amazon et Google, ils sont plus faciles à connecter à d’autres systèmes utilisant ces mêmes plates-formes, p. ex. les CDP.

(Retour en haut)

Fonctionnement : de la CDP à l’entrepôt de données

Dans ce cas, nous sommes à l’intérieur de notre entrepôt de données et nous voulons accéder aux données qui se trouvent dans la CDP. En d’autres termes, les informations partent de la CDP pour aller vers l’entrepôt de données. Ce processus est parfois appelé partage de données.

Les étapes habituelles sont les suivantes :

  1. Dans la CDP, identifiez les objets – ou les données clés – que vous souhaitez partager. Dans le contexte de Salesforce Data Cloud, il s’agit d’objets de data lake (données nettoyées), d’objets de modèle de données (structurés par l’utilisateur de la CDP pour ses cas d’utilisation) et d’objets des connaissances calculées (pour des formules telles que la valeur à vie).
  2. Grâce au pointer-et-cliquer, liez ces objets à la cible de partage de données, dans ce cas Snowflake.
  3. Dans Snowflake, l’utilisateur peut effectuer des requêtes parmi les données stockées dans Snowflake et, en même temps, parmi les objets liés par le partage de données.

En coulisse, le processus crée des « tableaux virtuels » qui décrivent les données de Data Cloud auprès de Snowflake. Un tableau virtuel est comme une fenêtre offrant une vue sur les données d’une base de données. Mais au lieu de copier et de stocker les données réelles, un tableau virtuel ne contient que la structure des données. Il s’agit d’un plan ou d’un pointeur vers l’emplacement dans la CDP où les données peuvent être trouvées. Mais les données elles-mêmes restent dans la CDP.

« Il est possible de trouver des données en direct dans Salesforce à partir de Snowflake et de s’assurer que les modifications apportées aux objets Salesforce seront répercutées dans Snowflake », explique Sriram Sethuraman, responsable produit de Salesforce Data Cloud. « Cela permettra aux développeurs et aux data scientists de construire des modèles d’apprentissage automatique et des applications alimentées par l’IA sur la plate-forme Snowflake, en combinant les données de Salesforce et de Snowflake. »

(Retour en haut)

Fonctionnement : de l’entrepôt de données à la CDP

Nous sommes maintenant à l’intérieur de notre CDP et nous aimerions accéder aux données qui se trouvent dans notre entrepôt de données. Ce processus est parfois appelé fédération de données.

Il y a beaucoup de bonnes raisons de suivre un tel processus. Les entrepôts de données tels que Snowflake et Google BigQuery contiennent généralement une quantité massive de données, y compris des données transactionnelles (liées aux achats par exemple) et des données sur les produits. Bien qu’il ne s’agisse pas de données « clients » typiques, ces informations peuvent être très utiles pour calculer le degré de fidélité d’un client ou pour élaborer une recommandation sur la base des détails des produits qu’il achète.

Par exemple, voici comment accéder aux données de l’entrepôt de données dans Salesforce Data Cloud :

  1. Salesforce Data Cloud monte les tableaux de l’entrepôt de données en tant qu’objets d’un data lake externe. (Le montage est un processus qui crée un plan de données virtuel, comme celui décrit ci-dessus.)
  2. Data Cloud remplit ses fonctions habituelles, telles que la gestion des identifiants, l’analyse, la segmentation, etc.
  3. La CDP peut accéder aux données de l’entrepôt de données en effectuant des requêtes fédérées (ou combinées) qui incluent les données dans Data Cloud et les objets fournis par l’entrepôt de données.

(Retour en haut)

Comment Buyers Edge utilise la technologie zero copy

La réussite des entrepôts de données cloud tels que Snowflake, Databricks, Google BigQuery et Amazon Redshift est tout à fait logique. Nous avons observé que de nombreux clients les ont au moins testés. Et beaucoup les utilisent désormais comme partie intégrante de leurs architectures de données. Mais aucun entrepôt de données ne remplit toutes les fonctions d’une CDP, telles que la gestion des identités et l’analytique conviviale.

Buyers Edge – une société leader dans l’optimisation des achats dans le secteur de la restauration – souhaitait établir un profil client unifié dans une CDP tout en accédant aux données d’achat stockées dans un entrepôt de données. Leur principal objectif était de fournir de meilleures informations sur les clients à leurs équipes de vente et de marketing.

Grâce à la connexion zero copy entre Data Cloud et leur entrepôt, Buyers Edge accède désormais aux données d’achat nécessaires pour construire des modèles prédictifs, permettant à leurs équipes de vente et de marketing de produire de meilleures offres, messages et expériences pour leurs prospects et clients.

« Grâce à la technologie zero copy, l’accès aux données clients stockées dans Salesforce devient un jeu d’enfant, et il n’est plus nécessaire de déplacer, de dupliquer ou de reformater les données », a déclaré Sean Donahue, directeur général de la plate-forme Buyers Edge. « Cela permet d’économiser du temps et des ressources, de supprimer les silos de données, d’harmoniser les données pour obtenir des informations et des analyses, et de donner aux entreprises une vue d’ensemble globale et en temps réel de leurs clients. »

Au fur et à mesure que les entreprises telles que Buyers Edge évoluent, leurs besoins changent également. C’est pourquoi une technologie telle que le zero copy peut les aider à élaborer une stratégie de gestion des données plus souple.

Après tout, les grandes entreprises utilisent en moyenne 976 applications différentes et la quantité de données créées, capturées, copiées et consommées devrait plus que doubler d’ici à 2026. Grâce à la puissance du partage de données zero copy, il sera beaucoup plus facile de profiter de l’explosion des données qui se profile.

Devenez un héros du zero copy

Dans ce webinaire gratuit, découvrez comment les entreprises utilisent la technologie zero copy avec Data Cloud et Snowflake pour éliminer la complexité et offrir une meilleure expérience client.

(Retour en haut)