Fragen & Antworten zum Thema Adressen-Retrieval und Kundenidentifikation
Ab welcher Adressmenge ist ein Tool zur Adressidentifikation sinnvoll?
Sobald man die manuelle Übersicht durch einfachen Vergleich verliert, schleichen sich Dubletten ein. Man verliert die Übersicht zwar schon ab ca. 500 Adressen. Durch Sortierung lassen sich Dubletten eventuell noch bis ca. 10.000 Adressen überblicken. Darüber hinaus wird ein Tool zur Dublettenvermeidung unabdingbar.
Was unterscheidet mailRetrieval von der bei allen Datenbanken standardmäßig vorhandenen Suche mit "Wildcards"?
- Die Ergebnisse werden wesentlich schneller zurückgeliefert. Auch bei Bestandsgrößen von mehreren Millionen Adressen liegt die Antwortzeit üblicherweise unter einer Sekunde.
- Die Suche mit mailRetrieval kann auch ohne Wildcards fehlertolerant erfolgen. Dies ist wichtig zu erwähnen, da die Eingabe von Wildcards voraussetzt, dass der Anwender ahnt, wo eine Abweichung vorhanden sein könnte!
- Die Dublettenprüfung kann ohne Benutzeraktion automatisch bei jeder Neuanlage und Änderung durchgeführt werden. Damit wird auch ohne intensive Recherche des Users die Entstehung von Dubletten weitestgehend automatisch verhindert.
- Es erfolgt auch dann eine sichere Identifikation wenn zum Beispiel
- Wörter vertauscht sind: Müller Hans statt Hans Müller
- Wörter abgekürzt sind: H. Müller statt Hans Müller
- der Name anders klingt als er geschrieben wird: Meier statt Mayer
- einfach ein Data-Entry-Fehler vorliegt: üller statt Müller
- Die Ergebnisse werden nach dem Grad der Übereinstimmung zurückgeliefert. Dies erleichtert wesentlich die Bedienung und erspart endloses Blättern in Ergebnislisten.
Was ist die maximal mit mailRetrieval zu verwaltende Adressmenge?
Die technisch maximale Grenze liegt jenseits aller in der Praxis vorkommenden Werte. Natürlich hängt die performant zu verwaltende Adressdatenbankgröße auch von den verfügbaren Ressourcen (CPU sowie Platten- und Hauptspeicherkapazität) ab. In der Praxis ist die Menge der in der Datenbank gespeicherten Adressen für eine Real-time-Adressenidentifikation nicht so wesentlich, da diese sich ja unter Umständen auf mehrere Länder verteilen kann. Wichtig ist die pro Land ohne Segmentierung performant zu verwaltende Adressmenge.
Hierzu ein Beispiel aus der Praxis: Einige Anwender von mailRetrieval managen Adressdatenbanken mit mehr als 60 Millionen redundanzfreien Consumer Adressen pro Land.
Müssen für mailRetrieval größere Adressdatenbanken segmentiert werden?
Nein! Segmentierung ist eine Technik, die üblicherweise von Systemen mit einfachen Technologien angewendet werden muss, um auch bei sehr großen Adressdatenbanken akzeptable Performance zu erzielen. Der große Nachteil der Segmentierung ist, dass üblicherweise zwischen den Segmenten keine Dublettenerkennung erfolgt. Hier gibt es beim Abgleich "blinde Flecken", in denen meist eine nicht unerhebliche Anzahl unerkannter Dubletten verbleibt. Lediglich eine Aufteilung nach Ländern ist aus organisatorischen Gründen bei sehr großen internationalen Anwendungen unter Umständen ratsam.
Welche Performance bietet mailRetrieval?
Die konkrete Performance hängt natürlich wesentlich von den Ressourcen (CPU sowie Platten- und Hauptspeicherkapazität) ab. Da Uniserv für die Adressidentifikation in real-time spezielle fehlertolerante Suchverfahren entwickelt hat, bieten diese hohe Performance bei geringer Ressourcenanforderung. Hierzu ein Beispiel aus der Praxis:
Das Verwalten von 10 Mio. Adressen ohne Segmentierung auf einem kleineren Intel-Server mit 1 GHz und 500MB RAM führt zu einer durchschnittlichen Responsezeit für fehlertolerante Suche auf allen Namens- und Adressfeldern von unter 0,5 Sekunden!
Stellt mailRetrieval für den Update sicher, dass die Datenintegrität und die Transaktionssicherheit zwischen Datenbank und der mailRetrieval-Indexstruktur gewährleistet ist?
Ja. Hier werden je nach Einsatzumfeld unterschiedliche Verfahren eingesetzt. Als allgemeine Lösung im Client/Server-Umfeld unterstützt mailRetrieval das Two-Phase-Commit-Protokoll.
Kann mailRetrieval neben interaktiven Anwendungen auch in Batch-Anwendungen eingesetzt werden?
Ja. Besonders, wenn im Vergleich zur Datenbankgröße nur kleine Adressmengen integriert werden müssen und kurze Reaktionszeiten notwendig sind, wird die automatische Dublettenerkennung und das dynamische Clustern von Adressen auch im Batch eingesetzt.
Sollte die automatische Dublettenprüfung nur für Adressneuanlagen oder auch für Adressveränderungen durchgeführt werden?
Es ist wichtig, dass neben den Neuanlagen auch die Adressveränderungen auf Dubletten geprüft werden. Die Erfahrung hat gezeigt, dass bei Unternehmen, die nur die Neuanlagen überprüfen, eine nicht unerhebliche Anzahl von Dubletten über die Änderungsfunktion in die Adressdatenbank gelangen. Ihr zuständiger Ansprechpartner bei Uniserv gibt Ihnen gerne weitere Hintergrundinformation zu diesem Punkt.
Benötigt mailRetrieval im Client/Server-Betrieb noch zusätzliche Connectivity-Software?
Nein. Im mailRetrieval-Server und dem jeweiligen Client-Kit sind alle benötigten Komponenten enthalten. Die Uniserv-Client/Server-Technologie setzt direkt auf der in jedem Betriebssystem vorhandenen TCP/IP-Systemsoftware auf. Zusätzliche Connectivity-Software wird nicht benötigt.
Ist mailRetrieval auch in der Lage, dublettenverdächtige Adressen zu identifizieren, wenn diese mit jeweils gültigen, aber unterschiedlichen oder ähnlichen Adressen angegeben sind? (Beispielsweise Dreher in der Hausnummer oder ähnliche, aber jeweils gültige Straßen.)
Selbstverständlich. Da mailRetrieval keine Segmentierung benötigt, hat die Software damit überhaupt kein Problem. Diese Situation tritt bei Systemen auf, die bei großen Datenbanken Segmentierungen durchführen müssen - mitunter sogar bis auf die Ebene des Hauses, um eine akzeptable Performance zu erzielen.
Muss der Update mit mailRetrieval immer kombiniert mit einer postalischen Prüfung durchgeführt werden?
Nein, aber es ist empfehlenswert, diese Systeme zusammen einzusetzen. Generell können Sie mailRetrieval ohne postalische Prüfung nutzen Es ist jedoch empfehlenswert, vor Neuanlage oder Änderung von Adressen in der Adressdatenbank diese auch postalisch zu prüfen, um sicherzustellen, dass nicht nur keine Dubletten, sondern auch nur postalisch korrekte Adressen in der Datenbank gespeichert werden.
Können mit mailRetrieval auch Adressen über andere Informationen als Namens- und Adresselemente fehlertolerant gesucht werden?
Selbstverständlich! Die fehlertolerante Suche ist zum Beispiel auch über Telefonnummer, e-Mail- oder WEB-Adresse, Geburtsdatum oder beliebige, andere Felder wie Umsatzsteuer-, Kunden-, Kreditkartennummer oder ähnlichem möglich.
Warum ist es empfehlenswert, eine Adressdatenbank auch dann, wenn diese mit mailRetrieval real-time verwaltet wird, periodisch mit mailBatch zu überprüfen?
In den meisten Anwendungen ist es üblich, dass bei entsprechendem Dublettenverdacht der Anwender bei einer Adressenneuanlage oder -änderung einen Hinweis erhält, der akzeptiert oder zurückgewiesen werden kann. Durch Fehlbedienung oder, weil die endgültige Klärung kurzfristig nicht möglich ist, kommt es auch in solchen Systemen zur unbewussten oder in Kauf genommenen doppelten oder mehrfachen Dublettenanlage.
Diese Fälle können Sie in einem periodischen mailBatch-Lauf aufspüren und asynchron klären.