Pressemeldungen

Träger des Uniserv-Forschungspreises zu Gast

Dr. rer. nat. Christian Schulz hält bei Uniserv einen Vortrag zu seiner Arbeit
„High Quality Graph Partitioning“.

Pforzheim, 06.10.2014 – Der Träger des diesjährigen Uniserv-Forschungspreises „Algorithmen für effiziente Datenverarbeitung“ Dr. rer. nat. Christian Schulz hielt am 29. September 2014 auf Einladung von Uniserv einen Vortrag im Hause zu seiner prämierten Dissertation „High Quality Graph Partitioning“. Der von ihm entwickelte Open-Source Graphpartitionierer KaHIP (Karlsruhe High Quality Partitioning) liefert innerhalb kürzester Zeit die beste bekannte Lösung für die hoch qualitative Partitionierung eines Graphen und schlägt damit alle bisherigen Werkzeuge. Bedeutsam ist dies insbesondere in sozialen Netzwerken, im Big Data oder auch im Kundendatenmanagement, wo es darauf ankommt, Ergebnisse möglichst in Echtzeit zu erhalten. 

Die Arbeit von Dr. Christian Schulz liefert Methoden und Software zur effizienten, das heißt schnellen und hoch-qualitativen Graph-Partitionierung. Hoch-qualitativ bedeutet in diesem Zusammenhang sehr gut in Bezug auf ein Kriterium wie beispielsweise den Kantenschnitt, also die Zahl der Verbindungen zwischen den einzelnen Blöcken eines Graphs. Graphen ihrerseits dienen der mathematischen Darstellung und numerischen Simulation einer Vielzahl von Problemen in Wissenschaft und Technik. Insbesondere sind sie gut geeignet, soziale Netzwerke abzubilden, also die Beziehungen zwischen Menschen. Übertragen auf das Kundendatenmanagement und damit auf Smart Customer MDM von Uniserv bedeutet dies die Abbildung der Beziehung von Kunden oder Personen in einer Kundendatenbank. Und je schneller dies geht, desto schneller kann beispielsweise der so genannte Golden Record als Basis für die 360°-Sicht gebildet werden – bei Datenbanken im Millionenbereich ein enormer Mehrwert, wo Zeit im wahrsten Sinne des Wortes Geld kostet.

Träger des Uniserv-Forschungspreises zu Gast
Träger des Uniserv-Forschungspreises zu Gast
Träger des Uniserv-Forschungspreises zu Gast
Träger des Uniserv-Forschungspreises zu Gast
Träger des Uniserv-Forschungspreises zu Gast

Graphdatenbanken sind spezialisierte NoSQL-Datenbanken, die besonders auf die Speicherung und Verarbeitung von Abfragen und Transaktionen auf Graphen optimiert sind. Speziell im Big Data muss ein Graph bzw. eine Graphdatenbank partitioniert werden, sobald die Datenmenge oder die Zahl der Abfragen/Transaktionen so groß werden, dass ein einzelner Server oder Prozessor dieses Volumen nicht mehr bewältigen kann. Die Partitionierung kann dabei effizient oder nicht effizient geschehen. Entscheidend ist hierbei, den Kantenschnitt zwischen den Partitionen des Graphen zu minimieren, damit mehrere Server möglichst wenig kommunizieren müssen. Das wiederum wirkt zurück auf die Geschwindigkeit, mit der Abfragen bzw. Transaktionen auf den Graphen bzw. die Graphdatenbank erfolgen. Je minimaler der Kantenschnitt, desto schneller die Kommunikation und desto kostengünstiger die Durchführung.