
Dominik Probst (M.Sc.)
Lehrstuhl für Informatik 6 (Datenmanagement)
Wissenschaftliche Mitarbeitende Lehrstuhl für Informatik 6 (Datenmanagement)
Adresse
Kontakt
- E-Mail: dominik.probst@fau.de
- Telefon: +49 9131 85-27885
- URL: www.cs6.tf.fau.de/person/dominik-probst/
Dominik Probst ist seit Januar 2020 wissenschaftlicher Mitarbeiter an unserem Lehrstuhl.
Vorgeschichte am Lehrstuhl
Von Oktober 2014 bis September 2019 war er Tutor in Konzeptioneller Modellierung (acht Semester) und unserem Versuch des Fertigungstechnischen Praktikums (im SS2016 und SS2017).
Forschung
Er beschäftigt sich vor allem mit Kompressionsverfahren in Datenbanken. Außerdem beteiligt er sich unter anderem an Forschungsarbeiten zur Verbesserung der Lehre am Lehrstuhl.
Die zugeordneten Projekte und Veröffentlichungen können im CRIS (Current Research Information System) der FAU nachgeschlagen werden:
Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees
(Projekt aus Eigenmitteln)Laufzeit: seit 19. September 2022Mit dem andauernden Anstieg globaler Datenvolumina gewinnt die Datenbankkompression immer weiter an Relevanz. Während die Kompression numerischer Datentypen umfassend erforscht wurde, erfährt die Kompression von Zeichenketten erst neuerdings wieder verstärkte wissenschaftliche Beachtung.
Ein vielversprechender Ansatz zur Stringkompression ist die Kompression mittels Symboltabellen, bei der wiederkehrende Substrings innerhalb einer Datenbank durch kurze Codes substituiert werden. Eine korrespondierende Tabelle ermöglicht dabei eine reibungslose Rekonstruktion der Originaldaten. Dieser Ansatz besticht durch kurze Kompressions- und Dekompressionszeiten, wobei die Kompressionsrate stark von der Qualität der Symboltabelle abhängig ist.
Das Forschungsprojekt FST fokussiert sich auf die Erzeugung optimierter Symboltabellen zur Maximierung der Kompressionsrate. Dafür werden die namensgebenden Frequent-Substring Trees konstruiert, eine Trie-artige Datenstruktur, die alle potenziellen Tabelleneinträge abbildet und die mit Hilfe von Metadaten die Identifizierung optimaler Einträge ermöglicht.
Das primäre Ziel des Forschungsprojektes ist die Steigerung der Kompressionsrate von Stringkompressionsverfahren, ohne die Kompressions- und Dekompressionszeiten signifikant zu beeinträchtigen.
Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration
(Projekt aus Eigenmitteln)Laufzeit: 2. Januar 2020 - 19. September 2022Die Kompression von Daten spielt im Datenmanagement nicht erst seit Kurzem eine entscheidende Rolle. Komprimierte Daten lassen sich platzsparender dauerhaft ablegen und effizienter über das Netzwerk versenden. Durch die ständig steigenden Datenmengen erhöht sich die Wichtigkeit guter Kompressionsverfahren jedoch immer weiter.
Im Rahmen von Projekt Anania (Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration) erforschen wir, inwiefern klassische Kompressionsverfahren in relationalen Datenbanken über Verfahren aus dem maschinellen Lernen ergänzt und verbessert werden können.
Im Fokus des Projektes stehen Autoencoder, die bei tupelweiser Anwendung semantische Zusammenhänge in Relationen erkennen können und so eine weitere Verbesserung bei der Kompression von relationalen Daten versprechen. Auch bilden Kombinationen von Autoencodern und klassischen Kompressionsverfahren einen möglichen Betrachtungsschwerpunkt des Projektes.
Randbemerkung: Der Name des Projektes "Anania" wurde in Anlehnung an den Schmetterling "Anania funebris" gewählt. Ein Autoencoder erinnert in seiner stilisierten Form stark an die Silhouette eines Schmetterlings mit ausgebreiteten Flügeln, wodurch die Wahl dieses Akronyms passend erschien.
2025
Graph-based QSS: A Graph-based Approach to Quantifying Semantic Similarity for Automated Linear SQL Grading
Datenbanksysteme für Business, Technologie und Web (BTW 2025) (Bamberg, 3. März 2025 - 7. März 2025)
DOI: 10.18420/BTW2025-13
BibTeX: Download , , :
2021
Erfahrungen mit kombinierten digitalen Lernhilfen bei Datenbank-Vorlesungen
In: Datenbank-Spektrum (2021)
ISSN: 1618-2162
DOI: 10.1007/s13222-021-00370-2
BibTeX: Download , , , :
Lehre
Seine Lehraufgaben als Mitarbeiter umfassen unter anderem:
- Betreuung von Seminararbeiten, Projektarbeiten und Abschlussarbeiten (zugeordnete Veranstaltungen: NTDM und BDSem)
- Übungsbetreuung und Veranstaltungsorganisation im Fach „Prozessorientierte Informationssysteme“ (Themen: u.a. BPMN, Geschäftsprozessmodellierung, Prozessgesteuerte Architekturen) im SS2020 und SS2021
- Co-Dozent (SS2022 und SS2023) und alleiniger Dozent (SS2024 und SS2025) im Fach „Knowledge Discovery in Databases“ (Thema: Data Mining mit Ausflügen Richtung OLAP) mit 400+ Anmeldungen pro Semester (Link zu aktuellen Materialien: https://fau-cs6.github.io/KDD/)
Seine aktuellen Lehrveranstaltungen können über Campo eingesehen werden: