Fachthemen

Data Profiling mit professionellen Data Profiling Tools

Mit dem Data Profiling Tool von Uniserv ermitteln Sie den Ist-Zustand Ihrer Daten und verbessern die Datenqualität

Zum Beispiel vor der Überführung in andere Systeme, bei Migrationen oder vor dem Beginn größerer Datenqualitätsprojekte.

Das Data Profiling Tool kann aber nicht nur Fehler, Anomalien, Inkonsistenzen u. v. m. in Ihren Datenbeständen aufspüren, sondern auch bei der Datenqualitätsverbesserung helfen. Dazu verfügt es über eine Funktionalität zum Aufsetzen und Verfolgen von entsprechenden Projekten, das sogenannte Problemmanagement. Das Data Profiling Tool wird zum Beispiel für die Analyse von Finanz-, Transaktions-, Statistik- oder Auftragsdaten eingesetzt.

Typische Einsatzszenarien des Data Profiling Tools

Aufgaben des Data Profiling Tools

  • Kooperative Datenanalyse und Erforschung von Datenqualität
  • Erstellen von Profilen auf Basis von Snapshots
  • Dokumentieren, Managen und Verfolgen von Datenqualitätsproblemen

Funktionalität des Data Profiling Tools

  • Profile auf Feldebene

    • Minimum, Maximum
    • Werte und Muster
    • Eindeutigkeit
    • … u. v. m.

  • Abhängigkeitsprüfungen

    • Wert von Attribut X wird von Attributen A, B, C eindeutig bestimmt

  • Eindeutigkeitsprüfungen

    • Eindeutigkeit der Kombination der Attribute A, B, C

  • Join-Prüfungen

    • Überschneidung zwischen Attributen A, B in Tabelle 1 und X, Y in Tabelle 2

Funktionalität des Problemmanagements

  • Probleme können auf allen Ebenen definiert werden

    • Datenhaltungssystem
    • Entity (Datenbanktabelle)
    • Datenfeld

  • Probleme können Mitarbeitern zugewiesen werden

    • Mit E-Mail-Benachrichtigung
    • Mit Beispielsätzen

  • Reports der Datenprofile bzw. Probleme können erstellt werden

    • Übersicht über Problemfälle nach wählbaren Kriterien
    • Übersicht über die Anzahl noch zu analysierender Felder

Datenanalyse und Data Profiling in 3 Schritten

Data Profiling Process

Verfügbar ist das Data Profiling Tool in folgenden Versionen:

  • Workstation

    • Typisches Einsatzszenario: Einpersonen-Analyseprojekte mit kleinen Datenmengen
    • Windows-Einzelplatz-Lösung
    • Unterstützt alle gängigen Datenbanken und auch Flat Files

  • Entry Server

    • Typisches Einsatzszenario: kooperative Analyseprojekte mit wenigen Mitarbeitern, kleine bis mittlere Datenmengen
    • Client-/Server-Gruppenanwendung – Client Windows, Server Windows
    • Unterstützt alle gängigen Datenbanken und auch Flat Files
    • Mehrprozessor-Unterstützung

  • Advanced Server

    • Typisches Einsatzszenario: große kooperative Analyseprojekte mit vielen Mitarbeitern, große Datenmengen
    • Client-/Server-Gruppenanwendung – Client Windows, Server Windows oder Unix
    • Unterstützt alle gängigen Datenbanken und auch Flat Files
    • Mehrprozessor-Unterstützung