2023-01-02 09:45 Temps de lecture : 15 min

Tout ce que vous devez savoir sur le maillage de données

L'architecture Data Mesh ambitionne d'établir une source d'autorité partagée pour les données au sein d'une entité. Son objectif est de cultiver une culture et une gouvernance axées sur les données, permettant ainsi aux équipes autonomes de collaborer, d'innover et d'exploiter ces données efficacement. Décortiquons ensemble le concept de Data Mesh.

Qu'est-ce que le Data Mesh ?

En termes simples, le Data Mesh est une architecture de gestion des données décentralisée. Au lieu de centraliser les données dans un unique département, elle vise à déléguer la responsabilité et la propriété des données aux équipes qui les utilisent directement. Cette approche reconnaît la donnée comme un atout majeur, et encourage une meilleure gouvernance, qualité et intégration, tout en favorisant une prise de décision basée sur les données.

L'Architecture Data Mesh

Une architecture Data Mesh se compose généralement de trois éléments clés : les sources de données, l'infrastructure et les pipelines de données orientés domaine, gérés par les responsables métier.

Crédit image : Microsoft

  • Sources de données : Il s'agit des diverses sources au sein de l'organisation, telles que bases de données, APIs et capteurs.
  • Infrastructure de données : C'est l'infrastructure sous-jacente servant à stocker, traiter et gérer les données, incluant les lacs de données, entrepôts de données et autres systèmes.
  • Pipelines de données orientés domaine : Ces pipelines déplacent les données des sources vers l'infrastructure, les rendant accessibles aux équipes métier. Les responsables métier assurent la qualité et l'adéquation des données aux besoins de l'entreprise.

Ces trois composants sont interconnectés et intégrés, et non isolés en silos. Avec une approche Data Mesh, les équipes sont responsables de la qualité, de l'accès et de la sécurité des données qu'elles utilisent. Cette décentralisation favorise une utilisation efficace des données, permettant des prises de décision éclairées. Cela rend également les données plus accessibles, transparentes et fiables, promouvant une culture axée sur les données.

Étapes de conception d'une architecture Data Mesh

Pour déployer une architecture Data Mesh, les étapes suivantes peuvent être suivies :

#1. Identification des domaines d'activité

La première étape consiste à identifier les domaines d'activité, soit les secteurs de l'entreprise qui fournissent de la valeur aux clients. Chaque domaine doit avoir un responsable dédié, responsable des données utilisées.

#2. Mise en place de la gouvernance des données

Il est crucial d'établir un cadre de gouvernance clair pour une utilisation responsable et éthique des données. Cela implique de définir les rôles et responsabilités, d'établir des normes de qualité et de précision, et de définir les processus d'accès et d'utilisation des données.

#3. Définition de la propriété des données

Chaque domaine doit être responsable de ses données, y compris leur qualité et leur précision. Le domaine doit être impliqué dans la création, la maintenance, l'utilisation et la diffusion des données.

#4. Promotion de la culture des données

Pour permettre aux employés de prendre des décisions basées sur des données, la promotion de la culture des données est essentielle. Ceci peut être réalisé par des formations et en fournissant des outils et des ressources pour l'analyse et l'utilisation des données.

#5. Démocratisation de l'accès aux données

Le Data Mesh prône la démocratisation des données, c'est-à-dire un accès étendu à tous les employés via des outils et ressources adaptés. Cela rend les données accessibles et utilisables dans toute l'organisation.

#6. Implémentation des opérations de données

Pour assurer une gestion et une maintenance adéquates des données, il faut mettre en place des processus pour les opérations de données, telles que l'ingestion, la transformation, le stockage et la récupération.

Principes du Data Mesh

Le Data Mesh est mis en œuvre via un ensemble de principes et pratiques visant à instaurer une culture de prise de décision basée sur les données et à simplifier l'accès et l'utilisation des données à travers l'organisation.

Ces quatre principes incluent :

Crédit image : altexsoft

#1. Propriété et architecture décentralisées orientées domaine

L'accent est mis sur l'organisation des données par domaine métier, chaque unité étant responsable de la qualité des données qu'elle utilise. Cela assure un alignement avec les besoins de l'entreprise et de ses clients, et facilite l'accès aux données provenant d'autres parties de l'organisation.

#2. Les données en tant que produit

Les données sont traitées comme un actif précieux qui nécessite une gestion rigoureuse, incluant la définition des produits de données, la création d'équipes dédiées et l'établissement d'une feuille de route.

#3. Infrastructure de données libre-service en tant que plate-forme

Ce principe encourage un modèle en libre-service où les unités métier ont plus de contrôle et un accès plus facile aux données.

#4. Gouvernance informatique fédérée

Un cadre de gouvernance des données est établi en tenant compte des besoins et objectifs de toutes les parties prenantes, garantissant ainsi une utilisation responsable et éthique des données, et encourageant la culture des données et la prise de décision éclairée.

Importance du Data Mesh

L'adoption d'un Data Mesh peut être motivée par plusieurs raisons :

Amélioration de la qualité et de la précision des données

En organisant les données par domaine et en établissant des responsabilités et une gouvernance claires, le Data Mesh contribue à améliorer la qualité et la précision des données, assurant ainsi l'alignement avec les besoins de l'entreprise et des clients et une prise de décision plus éclairée.

Accessibilité et convivialité accrues des données

Le Data Mesh favorise la démocratisation des données, les rendant accessibles à tous les employés via des outils et ressources adéquats. Cela contribue à améliorer la culture des données et la prise de décision.

Meilleur contrôle sur les données

Les unités métier ont un meilleur contrôle sur les données et leur qualité, assurant ainsi leur alignement avec les besoins de l'entreprise et facilitant leur accessibilité et utilisation par les personnes concernées.

Une meilleure gouvernance des données

Le Data Mesh promeut la mise en place de cadres de gouvernance clairs pour une utilisation responsable et éthique des données, incluant la définition des rôles, la mise en place de normes de qualité et de précision, et la définition des processus d'accès et d'utilisation.

En somme, l'adoption d'un Data Mesh aide les organisations à mieux exploiter leurs données et à favoriser une culture de prise de décision basée sur les données.

Data Mesh contre Data Lake

Le Data Mesh et le Data Lake diffèrent en termes d'orientation, d'organisation des données, d'importance accordée à la gouvernance et à la culture des données, ainsi que de l'approche d'accès et d'utilisation des données.

Voici un tableau comparatif :

Data MeshData Lake
Se concentre sur les besoins de l'entreprise et de ses clientsSe concentre sur les aspects techniques du stockage et du traitement des données
Organise les données autour des domaines de l'entrepriseOrganise les données dans une structure de fichiers hiérarchique
Les données sont détenues et régies par des unités commercialesLes données peuvent être consultées par plusieurs départements ou équipes
Souligne la gouvernance des données et la culture des donnéesNe se concentre pas nécessairement sur la gouvernance des données ou la culture des données
Permet une culture de prise de décision basée sur les donnéesFournit un référentiel centralisé pour le stockage et le traitement des données
Encourage l'accès aux données en libre-serviceIl peut nécessiter une intervention informatique pour accéder aux données et les utiliser
Favorise la démocratisation des donnéesProblèmes de confidentialité
Suit les principes de la conception axée sur le domaineNe suit pas un cadre de conception spécifique
Implique des processus et des pratiques d'opérations de donnéesPeut ne pas avoir de processus spécifiques pour les opérations de données
Cela peut nécessiter une planification et une conception plus initialesCela peut être plus flexible et permettre un stockage de données ad hoc et un traitement

Un Data Lake est un référentiel central où les données structurées et non structurées sont stockées à grande échelle sous leur forme brute. Il permet de stocker et d'analyser les données de manière plus flexible et plus rentable que les entrepôts de données traditionnels.

Le Data Mesh, quant à lui, est conçu pour que les équipes possèdent et gèrent leurs propres données sans dépendre d'un groupe centralisé.

Ressources d'apprentissage du Data Mesh

De nombreuses ressources sont disponibles en ligne pour approfondir le Data Mesh. Il peut être difficile de sélectionner les plus utiles. Une compréhension correcte est cruciale pour appliquer efficacement les concepts dans votre travail.

Ces ressources fournissent une base pour comprendre les principes et pratiques du Data Mesh et vous aident à développer les compétences nécessaires pour gérer et analyser les données dans un environnement Data Mesh.

#1. Data Mesh – Un concept moderne de gestion de données décentralisée

Ce cours Udemy aborde les principes fondamentaux de l'architecture Data Mesh pour une gestion efficace des données et propose des études de cas sur sa mise en œuvre.

Le cours peut être complété en une semaine selon votre emploi du temps. Il est conçu pour offrir un aperçu complet du Data Mesh, ce qui peut nécessiter plus de temps pour assimiler pleinement le contenu.

#2. Data Mesh : la classe de maître complète

Ce cours est excellent pour les professionnels souhaitant progresser. Il couvre chaque sujet lié à la conception d'un Data Mesh et d'une architecture de produit de données.

Après ce cours, vous serez capable d'appliquer le concept de Data Mesh dans des entreprises réelles. Aucune connaissance préalable n'est nécessaire.

#3. Data Mesh : fournir une valeur basée sur les données à grande échelle

Ce livre présente le concept de Data Mesh, un aperçu clair de la conception d'une architecture de Data Mesh, ainsi qu'un guide pour la stratégie et l'exécution du Data Mesh.

De nombreux lecteurs ont trouvé ce livre utile et pratique pour comprendre et implémenter les principes et modèles de Data Mesh.

Conclusion

Le Data Mesh est un modèle de conception et un cadre culturel pour créer une organisation axée sur les données, reposant sur l'idée de créer une « source unique de vérité » et promouvant le concept de données en tant que produit.

Cela est réalisé grâce à une gouvernance des données décentralisée, où des équipes interfonctionnelles sont responsables de la qualité, de la disponibilité et de la maintenance des données dans leur domaine.

Le Data Mesh souligne aussi l'importance d'établir une compréhension claire des contrats de données entre les équipes et encourage l'utilisation d'outils de découverte des données pour faciliter le partage au sein de l'organisation.

J'espère que cet article vous a été utile pour en savoir plus sur le Data Mesh et ses principes. Vous pourriez également être intéressé à en savoir plus sur la virtualisation des données.

Auteur
France

Rédacteur tech, guides pratiques et astuces numériques.