Articles

Consolidation des données: compilation des informations

Une des fonctions les plus importantes de la qualité des données consiste à identifier les enregistrements se rapportant à un même objet métier comme, par exemple, le même partenaire commercial ou le même produit.

Cette exigence s’impose dans une multitude de contextes :

  • Identification des doublons dans le stock de l’entreprise
  • Recoupements entre les différentes listes externes destinées à l’acquisition de nouveaux clients
  • Recoupements lors de la compilation d’informations issues de différents systèmes sources dans le cadre de l’intégration des données
  • Affectation des informations provenant des stocks de référence

Outre les aspects déjà décrits, il existe également d’autres exigences commerciales ayant pour but la création de groupes « particuliers » d’objets métiers et qui servent, en premier lieu, à acquérir de nouvelles informations et à enrichir les données déjà recueillies.  

En outre, l’enrichissement des données (Data Enhancement) permet de combler toutes les lacunes constatées au niveau des données et des informations. Celles-ci peuvent être, par exemple, des données démographiques ou géographiques proposées par des fournisseurs tiers. Exemple :   

  • Les personnes appartenant à un même ménage peuvent être regroupées via l’utilisation d’un SIG (système d’informations géographiques).  

consolidate : une fonction performante de DQ

L’identification des enregistrements similaires et la création de groupes à partir de cette classification ne constituent, néanmoins, que la moitié de l’équation. En effet, il est souvent tout aussi important que les diverses informations des membres du groupe identifié soient consolidées afin d’obtenir une information complète et homogène. Cela peut se faire en intégrant les données compilées dans un enregistrement maître (Master Record) qui contient une combinaison des informations provenant de tous les enregistrements du groupe. C’est précisément là qu’intervient la fonction consolidate qui permet à l’utilisateur d’établir des règles pouvant être appliquées à chaque groupe de doublons dans le cadre d’un processus automatisé.

consolidate prend en charge les deux modes « Enrichissement » et « Agrégation » :

  • L’ enrichissement consiste à ce que les informations provenant de l’enregistrement maître soient reprises dans tous les autres éléments du groupe. Cela peut être, par exemple, un numéro de référence, une adresse e-mail ou d’autres informations utilisées pour enrichir les enregistrements.
  • L’ agrégation consiste, quant à elle, à regrouper les informations procédant des différents éléments du groupe pour les ajouter à l’enregistrement maître.L’utilisateur peut ainsi, par exemple :

    • Calculer la somme des chiffres d’affaires contenus dans différents enregistrements.
    • Sélectionner l’information la plus complète à partir de plusieurs enregistrements (p.ex. Prénom complet au lieu de l’initiale)
    • Associer les informations partielles à une information complète.

Tous ces atouts font de consolidate un complément idéal au module mailBatch. Toutefois, la fonction consolidate ne requiert pas nécessairement l’utilisation de mailBatch . Dans les cas les plus simples où les enregistrement se rapportant au même objet métier peuvent être identifiés à partir d’une valeur clé, l’utilisateur peut configurer consolidate de manière à ce que les groupes puissent être créés à partir des clés primaires.  

Les possibilités d’utilisation de consolidate sont très nombreuses . Elles vont de la reprise des informations provenant d’une base de données de référence (p. ex. données de communication ou évaluations de risque) à la création d’un enregistrement maître à partir de plusieurs enregistrements selon des règles complexes, en passant par la création de liens entre les enregistrements des différents systèmes via l’établissement de relations entre les clés.

Ces articles pourraient également vous intéresser :