Pressemeldungen

Uniserv verleiht den Forschungspreis 2019 am KIT an Dr. Timo Bingmann

Timo Bingmann liefert mit seiner Dissertation „Scalable String and Suffix Sorting: Algorithms, Techniques, and Tools" gleich mehrere wichtige und bahnbrechende Beiträge zur Forschung: sowohl auf dem weitreichenden Gebiet der effizienten und skalierenden String- und Suffix-Sortierung, als auch dem nicht minder bedeutenden Feld von Big Data.

Pforzheim, den 26.06.2019 - Die Uniserv GmbH stiftete am 19. Juni 2019 im Rahmen des Tags der Informatik am Karlsruher Institut für Technologie (KIT) erneut den Forschungspreis für die beste Dissertation auf dem Gebiet „Algorithmen für effiziente Datenverarbeitung“. Preisträger ist in diesem Jahr Dr. Timo Bingmann, der das Auswahlgremium mit seiner Dissertation „Scalable String and Suffix Sorting: Algorithms, Techniques, and Tools" überzeugte.

Dr. Timo Bingmann begegnete am Beginn seiner Dissertation einem erstaunlichen Dilemma: Einerseits gibt es "im Prinzip" Index-Datenstrukturen, die alle Treffer für ein einzelnes Suchmuster mit einem Zeit- und Energieaufwand finden, der unabhängig von der Größe der Datenbank ist. Andererseits gibt es kaum Erkenntnisse dazu, wie man diese Datenstrukturen auf modernen Hochleistungsrechnern konstruiert und für große Datenmengen skaliert. Die Auflösung dieses Dilemmas führte Dr. Bingmann auf eine überraschende Forschungs-Odyssee, die sich schließlich als sehr fruchtbar erweisen sollte.

Er entwickelte einen umfassenden Katalog von beweisbar effizienten Algorithmen für das parallele Sortieren von Zeichenketten. Der Kunstgriff dieser Verfahren besteht dabei darin, dass im Wesentlichen beim Sortieren immer nur die Buchstaben betrachtet werden, die benötigt werden, um die Reihenfolge der Zeichenketten festzulegen. Seine auf diesen Ergebnissen basierenden Veröffentlichungen haben hohe Anerkennung in der wissenschaftlichen Community gefunden und eine Vielzahl weiterer Arbeiten und Veröffentlichungen zu dieser und verwandten Fragestellungen ausgelöst. Ohne Übertreibung darf daher bereits dieser Teil von Dr. Timo Bingmanns Dissertation als bahnbrechend bezeichnet werden.

Doch dies war offensichtlich noch nicht genug: Ein anderes grundlegendes Problem ist, dass fortgeschrittene Algorithmen für die Indexkonstruktion zur effizienten Suche und Sortierung von Zeichenketten recht kompliziert sind. Mit herkömmlichen Werkzeugen für die parallele Programmierung sind sie deshalb nur schwer zu implementieren. Herr Dr. Bingmann hat deshalb als führender Designer und Entwickler ein neues Framework für die komfortable Programmierung von verteilten Rechnern realisiert, genannt „Thrill“.  Dieses System ist in Teilen vergleichbar mit den bekannten Big-Data-Werkzeugen MapReduce und Spark aber gleichzeitig mächtiger und in vielen praktischen Anwendungsfällen effizienter.

Dr. Heiko Papenfuß, Manager DQ Customer & Cloud Operations bei Uniserv, zur Arbeit des Preisträgers: „Die Krönung dieser außerordentlichen Bemühungen sind Indexkonstruktionsalgorithmen, die mit ca. einer Seite Pseudocode sehr nah am Thrill-Framework darstellbar sind und auf realen Parallelrechnern hervorragend skalieren. Herr Dr. Bingmann hat mit Thrill grundsätzliche Werkzeuge geschaffen, deren Bedeutung weit über die Indexkonstruktion hinausgeht, und die ganz allgemein einen wichtigen Beitrag zur Entwicklung effizienter paralleler Algorithmen darstellen. Nicht zuletzt hat Thrill das Potential, ein wichtiges Werkzeug für Big Data zu werden.“

Zusammenfassend lässt sich feststellen, dass Timo Bingmann in seiner Dissertation gleich mehrere wichtige und bahnbrechende Beiträge zur Forschung liefert, sowohl auf dem weitreichenden Gebiet der effizienten und skalierenden String- und Suffix-Sortierung, als auch dem nicht minder bedeutenden Feld von Big Data. Dabei hat es Herr Bingmann in exzellenter Weise verstanden, Theorie und Praxis fundiert und überzeugend zu verbinden, und hat auf diese Weise über die eigentliche Forschungsleistung hinaus wichtige Impulse im Algorithm Engineering gesetzt.

Link zur Dissertation