Articles
La qualité des données en « boucle fermée »

La qualité des données en « boucle fermée »

Les « quatre mousquetaires » de la qualité des données en action

« Un pour tous, tous pour un ! ». Cette célèbre devise des « quatre mousquetaires » est, depuis, passée dans le langage courant, pour souligner que les « initiatives en solitaire » ne servent à rien et que la réussite est uniquement possible lorsque plusieurs composants interagissent avec fluidité. C’est précisément la raison pour laquelle cela s’applique aussi aux mesures visant à rehausser la qualité des données dans l’entreprise. 

D’Artagnan, Athos, Porthos et Aramis, tels sont les noms des quatre mousquetaires dans la littérature et au cinéma. Pour la qualité des données, les quatre mousquetaires sont l’analyse des données, le nettoyage des données, la protection des données et la surveillance des données.

Analyse des données : l’état des lieux de la qualité des données

En tant que premier mousquetaire, l’analyse des données vise à dresser un état des lieux des données disponibles dans l’entreprise. Pour nombre de structures, cette première étape constitue déjà un défi de taille car, en général, les données à analyser résident sur différents systèmes disséminés dans l’entreprise. La mission critique de cette analyse est de fournir des informations fiables quant à la nature et à la qualité des données clients, même en présence de gros volumes à traiter. 

Par ailleurs, cette phase permet de définir des règles et des outils de mesure spécifiques à l’entreprise, dans l’optique d’enrichir les enregistrements existants. Grâce à des filtres et segmentations appropriés, l’analyse des données permet en outre d’identifier des « aberrations » ou des « anomalies », qu’il est ensuite possible de traiter au moyen de mesures supplémentaires d’amélioration de la qualité.

Nettoyage des données : la consolidation des enregistrements disséminés

Le deuxième mousquetaire, à savoir le nettoyage des données, se concentre sur l’élimination des lacunes et insuffisances de la qualité mises en lumière lors de l’analyse précédente. Pour cela, les données disponibles sont extraites des différents systèmes sources de l’entreprise au moyen de connecteurs natifs. Les enregistrements font l’objet d’un contrôle d’adresse, les doublons et multiples occurrences de mêmes enregistrements sont recherchés et les enregistrements peuvent, le cas échéant, être enrichis avec des informations supplémentaires, par exemple des géodonnées ou des informations provenant d’analyses statistiques secondaires. Tous ces éléments constituent le socle du « Golden Record », qui représente la « mère de tous les enregistrements de données de référence ». 

Protection des données : la garantie d’une qualité pérenne des données

En tant que troisième mousquetaire, la protection des données ne doit pas être interprétée au sens juridique du terme, mais regroupe les mesures servant à garantir la préservation et l’extension de la qualité élevée des données clients obtenue précédemment. À cet égard, la priorité consiste à vérifier l’absence d’erreurs, si possible dès la saisie ou la modification des données. Cette approche vise aussi à détecter, afficher, puis corriger immédiatement les erreurs de transcription audio, de lecture et/ou de saisie, directement à la création d’un enregistrement.

Surveillance des données : la confiance c’est bien, le contrôle c’est mieux

Enfin, la surveillance des données, qui représente le dernier mousquetaire, s’assure que le travail des trois autres n’a pas été réalisé en vain. Dans le cas contraire, il existe un danger de « corruption insidieuse » des données clients et, bien souvent, celle-ci sera identifiée trop tard. Les déménagements, les changements de nom après un divorce, les décès, mais aussi les changements de nom de rue et de lieu, ou les regroupements de communes sont des raisons fréquentes de cette corruption insidieuse. Cette dernière peut réduire pratiquement à néant les mesures instaurées lors des trois autres phases et les efforts associés.

La surveillance des données est, en quelque sorte, un détecteur des faiblesses de leur qualité et permet d’identifier celles-ci avant qu’elles n’impactent le système cible. À cet égard, les règles et directives de qualité des données spécifiées par l’entreprise constituent la base de cette détection. Ces exigences sont aussi contrôlées en continu par rapport aux modifications et actualisations nécessaires.

Un pour tous, tous pour un : une démarche intégrée, garante de l’optimisation réussie des données clients

De nombreuses entreprises ont reconnu l’importance d’une qualité élevée des données pour garantir des processus métier irréprochables dans les domaines les plus variés. Malheureusement, elles définissent toutefois différentes priorités et limitent fréquemment leurs efforts aux seules mesures déterminées. Elles oublient alors que la devise des mousquetaires citée en préambule s’applique aussi à la gestion des données de référence. À quoi sert l’analyse détaillée des données si elle n’aboutit pas à des mesures de nettoyage correspondantes ? De même, les effets positifs d’un premier nettoyage seront rapidement « dilués » si aucune mesure n’est prise pour maintenir durablement un haut niveau de qualité des données. Enfin, la meilleure surveillance des données est également vaine lorsque les résultats ne sont pas réinjectés dans une nouvelle analyse en vue de déclencher un nouveau processus d’amélioration de la qualité des données. Tout cela démontre aussi que les initiatives visant à améliorer la qualité des données clients de l’entreprise ne peuvent être limitées dans le temps, ni être ponctuelles. Il est  nécessaire d’avoir une boucle fermée intégrée et continue, afin d’optimiser et de garantir durablement la qualité des données : Un pour tous, tous pour un.

L’objectif : une vision complète des clients, qui leur assure un parcours optimal

Certes, certains événements ont un caractère unique, à l’instar de la création d’un nouveau système CRM, de la migration d’un ERP ou encore du rachat d’une entreprise. Ces événements exigent une migration et une consolidation des données et peuvent être les déclencheurs d’une initiative d’optimisation de la qualité des données. Toutefois, dans la majorité des cas, lorsque les entreprises se préoccupent de l’optimisation de la qualité de leurs données clients, c’est qu’elles ont besoin de créer une vision à 360 degrés précise, exhaustive et actualisée des clients, afin de pouvoir leur offrir un accompagnement optimal tout au long de leur parcours individuel. La vision à 306 degrés se justifie aussi par d’autres raisons :

  • Les banques et assurances sont ainsi en mesure de respecter les réglementations légales toujours plus strictes en matière de conformité (par ex., principe « connaître son client »).
  • Les entreprises manufacturières optimisent ainsi leurs processus de production à la demande et leurs coûts d’approvisionnement.
  • Les entreprises du secteur de l’énergie peuvent ainsi établir de nouveaux tarifs, et concevoir des concepts d’énergie et de mobilité avec souplesse et rapidité. Par ailleurs, elles optimisent la qualité du service client, car elles peuvent consulter toutes les données et informations sur un client en cliquant sur un bouton.
  • Les entreprises du secteur de la distribution sont ainsi en mesure d’assurer un accompagnement attrayant du client et de le fidéliser sur le moyen terme. 

Du Golden Record au « Golden Profile »

Plus les clients évoluent vers le « numérique », plus il est important pour les entreprises de collecter et de consolider les données et informations qu’elles détiennent à leur propos. Mais, il est tout aussi essentiel de suivre les « traces » laissées par les clients aujourd’hui sur Internet et les réseaux sociaux.

Golden Record / Golden Profile
Golden Record / Golden Profile

Avec le concept Ground Truth, la société Uniserv a mis au point une méthodologie de résolutions et de procédures qui aide les entreprises à créer le Golden Profile de chaque client. Ce profil agrège dans un enregistrement central les données d’adresse du client, son comportement d’achat, ses centres d’intérêt et préférences, mais aussi ses communications et son interaction avec l’entreprise. Par ailleurs, le Golden Profile intègre les « traces » que le client laisse derrière lui sur Internet et sur les réseaux sociaux. Autrement dit, les données de référence de chaque client (Golden Record), ainsi que les données de mouvement (données de transaction et d’interaction) sont regroupées (Golden Profile). Le concept Ground Truth assure, par ailleurs, une actualisation permanente de ces données, ainsi que leur synchronisation via les différentes sources de données.

En particulier pour l’analyse prédictive, Uniserv a conçu, en partenariat avec l’école supérieure des médias (HdM) de Stuttgart, un prototype sur la base du concept Ground Truth. Ce prototype visait à démontrer l’importance de la qualité des données pour la qualité des prévisions.

Dans le cadre d’un mémoire de licence, cette corrélation a été examinée pour la première fois par une approche empirique. Le mémoire a été rédigé par Paul Titze, étudiant du département de l’information et de la communication dans la filière d’informatique de gestion et de médias numériques à l’école supérieure HdM. Grâce à différents scénarios de test réalisant des analyses de données au moyen de données de référence de différentes qualités, Paul Titze a vérifié la corrélation entre les données de référence de qualité élevée et les résultats de l’analyse via l’apprentissage automatique supervisé (Supervised Machine Learning). Résultat : principalement avec l’apprentissage automatique, pour lequel les données de référence constituent la base de l’apprentissage de l’algorithme, une base de données préparée avec soin via la gestion des données de référence a donné de bien meilleures prévisions que l’apprentissage automatique avec un jeu de données brut.

Ainsi, dans le monde numérique, le concept Ground Truth deviendra au final un composant central d’une qualité optimale et pérenne des données dans l’entreprise.

Conclusion : Un pour tous, tous pour un : Ce principe fondamental vaut pour les quatre mousquetaires dans la littérature et au cinéma, mais aussi avant tout pour les quatre mousquetaires de la qualité des données : l’analyse des données, l’enrichissement des données, la protection des données et la surveillance des données. Chaque composante exige une planification et une mise en œuvre minutieuses. Néanmoins, seules une interaction et une intégration parfaites au sein d’une boucle fermée permettent à l’entreprise de rehausser la qualité de ses données vers un nouveau niveau à la fois pérenne et optimisable par la suite. Cette démarche est obligatoire pour instaurer les bases de la mise en œuvre du concept Ground Truth. Ainsi, l’entreprise sera en mesure d’obtenir une vision à 360 degrés des clients à la fois précise, exhaustive et actualisée, et aura alors confiance en la qualité intrinsèque de ses données.