Dominik Probst (M.Sc.)

Lehrstuhl für Informatik 6 (Datenmanagement)

Wissenschaftliche Mitarbeitende

Adresse

Martensstraße 3 91058 Erlangen

08.157

Kontakt

E-Mail: dominik.probst@fau.de
Telefon: +49 9131 85-27885

Dominik Probst ist seit Januar 2020 wissenschaftlicher Mitarbeiter an unserem Lehrstuhl.

Vorgeschichte am Lehrstuhl

Von Oktober 2014 bis September 2019 war er Tutor in Konzeptioneller Modellierung (acht Semester) und unserem Versuch des Fertigungstechnischen Praktikums (im SS2016 und SS2017).

Forschung

Er beschäftigt sich vor allem mit Kompressionsverfahren in Datenbanken. Außerdem beteiligt er sich unter anderem an Forschungsarbeiten zur Verbesserung der Lehre am Lehrstuhl.

Die zugeordneten Projekte und Veröffentlichungen können im CRIS (Current Research Information System) der FAU nachgeschlagen werden:

Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees

(Projekt aus Eigenmitteln)
Project leader: Klaus Meyer-Wegener
Term: since 19. September 2022
Acronym: FST
Abstract
Mit dem andauernden Anstieg globaler Datenvolumina gewinnt die Datenbankkompression immer weiter an Relevanz. Während die Kompression numerischer Datentypen umfassend erforscht wurde, erfährt die Kompression von Zeichenketten erst neuerdings wieder verstärkte wissenschaftliche Beachtung.
Ein vielversprechender Ansatz zur Stringkompression ist die Kompression mittels Symboltabellen, bei der wiederkehrende Substrings innerhalb einer Datenbank durch kurze Codes substituiert werden. Eine korrespondierende Tabelle ermöglicht dabei eine reibungslose Rekonstruktion der Originaldaten. Dieser Ansatz besticht durch kurze Kompressions- und Dekompressionszeiten, wobei die Kompressionsrate stark von der Qualität der Symboltabelle abhängig ist.
Das Forschungsprojekt FST fokussiert sich auf die Erzeugung optimierter Symboltabellen zur Maximierung der Kompressionsrate. Dafür werden die namensgebenden Frequent-Substring Trees konstruiert, eine Trie-artige Datenstruktur, die alle potenziellen Tabelleneinträge abbildet und die mit Hilfe von Metadaten die Identifizierung optimaler Einträge ermöglicht.
Das primäre Ziel des Forschungsprojektes ist die Steigerung der Kompressionsrate von Stringkompressionsverfahren, ohne die Kompressions- und Dekompressionszeiten signifikant zu beeinträchtigen.
→More information
Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration

(Projekt aus Eigenmitteln)
Project leader: Klaus Meyer-Wegener
Term: 2. Januar 2020 - 19. September 2022
Acronym: ANANIA
Abstract
Die Kompression von Daten spielt im Datenmanagement nicht erst seit Kurzem eine entscheidende Rolle. Komprimierte Daten lassen sich platzsparender dauerhaft ablegen und effizienter über das Netzwerk versenden. Durch die ständig steigenden Datenmengen erhöht sich die Wichtigkeit guter Kompressionsverfahren jedoch immer weiter.
Im Rahmen von Projekt Anania (Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration) erforschen wir, inwiefern klassische Kompressionsverfahren in relationalen Datenbanken über Verfahren aus dem maschinellen Lernen ergänzt und verbessert werden können.
Im Fokus des Projektes stehen Autoencoder, die bei tupelweiser Anwendung semantische Zusammenhänge in Relationen erkennen können und so eine weitere Verbesserung bei der Kompression von relationalen Daten versprechen. Auch bilden Kombinationen von Autoencodern und klassischen Kompressionsverfahren einen möglichen Betrachtungsschwerpunkt des Projektes.
Randbemerkung: Der Name des Projektes "Anania" wurde in Anlehnung an den Schmetterling "Anania funebris" gewählt. Ein Autoencoder erinnert in seiner stilisierten Form stark an die Silhouette eines Schmetterlings mit ausgebreiteten Flügeln, wodurch die Wahl dieses Akronyms passend erschien.
→More information

2025

Köberlein L., Probst D., Lenz R.:
Graph-based QSS: A Graph-based Approach to Quantifying Semantic Similarity for Automated Linear SQL Grading
Datenbanksysteme für Business, Technologie und Web (BTW 2025) (Bamberg, 3. März 2025 - 7. März 2025)
DOI: 10.18420/BTW2025-13
BibTeX: Download

2021

Lenz R., Haller D., Probst D., Wahl A.:
Erfahrungen mit kombinierten digitalen Lernhilfen bei Datenbank-Vorlesungen
In: Datenbank-Spektrum (2021)
ISSN: 1618-2162
DOI: 10.1007/s13222-021-00370-2
BibTeX: Download

Lehre

Seine Lehraufgaben als Mitarbeiter umfassen unter anderem:

Betreuung von Seminararbeiten, Projektarbeiten und Abschlussarbeiten (zugeordnete Veranstaltungen: NTDM und BDSem)
Übungsbetreuung und Veranstaltungsorganisation im Fach „Prozessorientierte Informationssysteme“ (Themen: u.a. BPMN, Geschäftsprozessmodellierung, Prozessgesteuerte Architekturen) im SS2020 und SS2021
Co-Dozent (SS2022 und SS2023) und alleiniger Dozent (SS2024 und SS2025) im Fach „Knowledge Discovery in Databases“ (Thema: Data Mining mit Ausflügen Richtung OLAP) mit 400+ Anmeldungen pro Semester (Link zu aktuellen Materialien: https://fau-cs6.github.io/KDD/)

Seine aktuellen Lehrveranstaltungen können über Campo eingesehen werden:

Sommersemester 2025

Knowledge Discovery in Databases

Begleitseminar zu Abschlussarbeiten: Neue Technologien im Datenmanagement-Umfeld

Übungen zu KDD

Wintersemester 2024/25

Keine passenden Einträge gefunden.

Adresse

Kontakt

Social Media und Webportale

Vorgeschichte am Lehrstuhl

Forschung

Projekt (CRIS)

Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees

Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration

Lokale Publikationsliste (CRIS)

2025

2021

Lehre

Lehre

Sommersemester 2025Sommersemester 2025

Vorlesung

Seminar

Übung

Wintersemester 2024/25Wintersemester 2024/25

Sommersemester 2025

Wintersemester 2024/25