mailBatch est un système expert pour une identification des doublons tolérante aux erreurs dans des stocks de données existants. Le système permet d'identifier les adresses doubles, même si les mêmes adresses n'apparaissent pas de la même manière dans les différents lots de données (tables) en raison d'une erreur de lecture, d'audition et/ou de saisie, de l'utilisation d'abréviations différentes ou de synonymes ou de l'emploi de règles de saisies différentes (exemple : ordre différent des éléments composant le nom). Ceci se fait à travers l'analyse des informations d'adresses à l'aide de référentiels de règles et concepts spécifiques aux pays, d'une phonétique adaptée à la zone linguistique ou d'une logique floue spécifique à l'adresse.
Voir également à ce sujet Processus de recherche tolérant aux erreurs.
mailBatch a été créé pour la comparaison de masse de type n:n. Il s'agit de vérifier en principe chaque nouvelle adresse rentrée par rapport à toutes les autres adresses susceptibles d'être des doubles. Ceci signifie, par exemple, qu'un million d'adresses nouvellement enregistrées déclenchent un potentiel d'env. 500 milliards de comparaisons tolérantes aux erreurs à effectuer en très peu de temps. Malgré les performances actuelles des ordinateurs, ce type de tâche ne peut être réalisée dans un délai acceptable et avec une qualité fiable qu'avec l'aide de technologies logicielles spécialement étudiées à cet effet.
mailBatch est un outil performant. Il permet de traiter les plus grands volumes de données dans un temps acceptable avec une qualité d'identification des plus élevées. Il va de soi que la performance dépend du matériel informatique utilisé et des tâches concernées. Il est capable de traiter plus d'un million d'adresses par heure pour une comparaison "standard" sur un serveur INTEL de capacité moyenne et ses performances peuvent atteindre plusieurs dizaines de millions d'adresses par heure sur des serveurs puissants et pour des tâches spécifiques.
Uniserv est listé dans le carré magic des outils de qualité des données 2007 de Gartner (« Magic Quadrant for Data Quality Tools 2007 ») suite ...
________________________
Validation postale:
3 nouveaux pays experts sont à votre disposition : la Hongrie, la Slovaquie et la Rép. Tchèque. Testez en direct !