Dominik Probst

Dominik Probst, M. Sc.

Department Informatik (INF)
Lehrstuhl für Informatik 6 (Datenmanagement)

Raum: Raum 08.157
Martensstraße 3
91058 Erlangen
Bayern

Geplante Anwesenheit

Die folgenden Zeiten sind die Zeiten, in denen die Anwesenheit am ehesten erwartet werden kann. Da sich dies je nach Terminen durchaus ändern kann, sollten immer Sprechzeiten vereinbart werden:

Jede Woche Mo, Di, Mi, 09:00 - 15:00, Raum 08.157, Martensstraße 3

Dominik Probst ist seit Januar 2020 wissenschaftlicher Mitarbeiter an unserem Lehrstuhl.

Von Oktober 2014 bis September 2019 war er Tutor in Konzeptioneller Modellierung (acht Semester) und unserem Versuch des Fertigungstechnischen Praktikums (Sommersemester 2016 und Sommersemester 2017).

Sprechstunden können schriftlich per E-Mail vereinbart werden.

Projekt (CRIS)

  • Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees

    (Projekt aus Eigenmitteln)

    Laufzeit: seit 19. September 2022

    Mit dem andauernden Anstieg globaler Datenvolumina gewinnt die Datenbankkompression immer weiter an Relevanz. Während die Kompression numerischer Datentypen umfassend erforscht wurde, erfährt die Kompression von Zeichenketten erst neuerdings wieder verstärkte wissenschaftliche Beachtung.

    Ein vielversprechender Ansatz zur Stringkompression ist die Kompression mittels Symboltabellen, bei der wiederkehrende Substrings innerhalb einer Datenbank durch kurze Codes substituiert werden. Eine korrespondierende Tabelle ermöglicht dabei eine reibungslose Rekonstruktion der Originaldaten. Dieser Ansatz besticht durch kurze Kompressions- und Dekompressionszeiten, wobei die Kompressionsrate stark von der Qualität der Symboltabelle abhängig ist.

    Das Forschungsprojekt FST fokussiert sich auf die Erzeugung optimierter Symboltabellen zur Maximierung der Kompressionsrate. Dafür werden die namensgebenden Frequent-Substring Trees konstruiert, eine Trie-artige Datenstruktur, die alle potenziellen Tabelleneinträge abbildet und die mit Hilfe von Metadaten die Identifizierung optimaler Einträge ermöglicht.

    Das primäre Ziel des Forschungsprojektes ist die Steigerung der Kompressionsrate von Stringkompressionsverfahren, ohne die Kompressions- und Dekompressionszeiten signifikant zu beeinträchtigen.

  • Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration

    (Projekt aus Eigenmitteln)

    Laufzeit: 2. Januar 2020 - 19. September 2022

    Die Kompression von Daten spielt im Datenmanagement nicht erst seit Kurzem eine entscheidende Rolle. Komprimierte Daten lassen sich platzsparender dauerhaft ablegen und effizienter über das Netzwerk versenden. Durch die ständig steigenden Datenmengen erhöht sich die Wichtigkeit guter Kompressionsverfahren jedoch immer weiter.

    Im Rahmen von Projekt Anania (Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration) erforschen wir, inwiefern klassische Kompressionsverfahren in relationalen Datenbanken über Verfahren aus dem maschinellen Lernen ergänzt und verbessert werden können.

    Im Fokus des Projektes stehen Autoencoder, die bei tupelweiser Anwendung semantische Zusammenhänge in Relationen erkennen können und so eine weitere Verbesserung bei der Kompression von relationalen Daten versprechen. Auch bilden Kombinationen von Autoencodern und klassischen Kompressionsverfahren einen möglichen Betrachtungsschwerpunkt des Projektes.

    Randbemerkung: Der Name des Projektes "Anania" wurde in Anlehnung an den Schmetterling "Anania funebris" gewählt. Ein Autoencoder erinnert in seiner stilisierten Form stark an die Silhouette eines Schmetterlings mit ausgebreiteten Flügeln, wodurch die Wahl dieses Akronyms passend erschien.

Lokale Publikationsliste (CRIS)