uniserv

Comparaison tolérante aux erreurs et recherche de doublons dans l’ensemble des objets de données en mode de traitement par lots (bulk mode) : pour une qualité de données irréprochable à l’échelle de toute l’entreprise.

 

L’utilisation de données correctes, cohérentes et sans doublons est une condition indispensable pour le succès de toute entreprise. Ceci vaut non seulement pour les données clients, mais aussi pour les autres catégories de données gérées par l’entreprise. Garantir un degré élevé et constant de la qualité des données d’entreprise est le meilleur moyen d’assurer des processus métier efficaces dans tous les services de l’entreprise et d’obtenir des rapports et des prévisions fiables, ces derniers étant indispensables pour optimiser la planification et gestion stratégiques, ainsi que pour garantir le respect scrupuleux des obligations de conformité.

 

Dans ce contexte, la comparaison tolérante aux erreurs des données métier stockées dans une ou plusieurs bases de données s’avère incontournable. En effet, les données enregistrées à plusieurs reprises sous différentes formes (doublons) alourdissent inutilement les coûts informatiques et donnent lieu à des informations erronées qui peuvent entraîner des décisions inappropriées. De plus, l’efficacité des activités opérationnelles de l’entreprise se voit réduite à chaque fois que les données doivent être recherchées et corrigées manuellement.

 
dataMatch est essentiellement utilisé dans les situations où il est nécessaire d’identifier les objets en double dans les données métier via des champs non formatés (données textuelles). Les fonctions spécifiques d’analyse et de recherche jouent un rôle particulièrement important dans le cas des champs textuels (par ex. désignations d’articles ou de produits, titres de livres ou de chansons, auteurs ou interprètes, désignations de chantiers ou de projets). dataMatch offre à cet égard la possibilité d’effectuer la déduplication de manière tolérante aux erreurs à l’aide d’une multitude d’attributs de recherche et d’algorithmes développés à cet effet (logique floue, phonétique, synonymes, etc.). Ainsi, vous pourrez identifier les doublons même en cas d’erreurs de lecture, de frappe ou de compréhension auditive.

Avec dataMatch, Uniserv met à votre disposition un outil puissant pour la déduplication de l’ensemble des données métier afin d’améliorer la qualité des données à l’échelle de toute l’entreprise. À la différence de mailBatch, qui procède au traitement des données clients à l’aide d’une base de connaissances standard pour les noms et les adresses, dataMatch utilise des dictionnaires, des règles de similitude et de segmentation, ainsi que des règles sensibles au contexte et des paramètres d’analyse définis selon les besoins de chaque projet ou secteur d’activité.

dataMatch vous aide, entre autres,

  • à détecter les doublons et à prévenir leur création
  • à regrouper les informations disponibles sur les données issues des différentes sources
  • à enrichir les enregistrements en les comparant avec des répertoires externes contenant des informations supplémentaires

Avec dataMatch, vous optimisez la qualité des données dans toutes les applications métier :

  • Systèmes MDM – par ex. comparaison des données produits dans le cadre de la gestion des informations produits (Product Information Management)
  • Systèmes CRM – par ex. comparaison des articles et des opportunités de vente
  • Système ERP – comparaison des données de base articles et produits
  • Systèmes SCM / Systèmes d’approvisionnement – comparaison des données de base articles et produits, complétée par ex. par les modalités/conditions et les données fournisseurs
  • Migration et intégration des données – comparaison de tout type de données métier

Idéal pour l’utilisation dans le cadre de la suite logicielle DQ Batch Suite d’Uniserv, dataMatch convient parfaitement pour le traitement des stocks de données volumineux provenant de différentes sources. En l’utilisant avec dataRetrieval, la solution Uniserv dédiée à la recherche en temps réel dans les multiples données d’entreprise, vous obtiendrez des données cohérentes et sans doublons en un temps record.


www.uniserv.com  | 
21.05.2012