Maximilian Langohr

Maximilian Langohr, M. Sc.

Department Informatik (INF)
Lehrstuhl für Informatik 6 (Datenmanagement)

Raum 08.151
Martensstraße 3
91058 Erlangen
Bayern

Telefon: +49 9131 85-27800
E-Mail: maximilian.langohr@fau.de
Webseite: https://www.cs6.tf.fau.de/person/maximilian-langohr/

Maximilian Langohr ist seit August 2020 wissenschaftlicher Mitarbeiter an unserem Lehrstuhl.

Forschungsschwerpunkt

ReProVide

Dieses Projekt wird durch die Deutsche Forschungsgemeinschaft (DFG) im Rahmen des Schwerpunktprogramms SPP 2037 „Scalable Data Management for Future Hardware“ gefördert.

Ziel dieses Projekts ist es, neuartige Hardware und Optimierungstechniken für die skalierbare, leistungsfähige Verarbeitung von Big Data bereitzustellen. Wir zielen insbesondere auf große Datenmengen mit flexiblen Schemata (zeilenorientierte, spaltenorientierte, dokumentenorientierte, irreguläre und/oder nicht-indexierte Daten) sowie auf Datenströme, wie sie in der Klick-Strom-Analyse, in Unternehmensquellen wie E-Mails, Software-Logs und Diskussionsforum-Archiven sowie in Sensoren im Internet of Things (IoT) und Industrie 4.0 zu finden sind. In diesem Bereich untersucht das Projekt das Potenzial Hardware-konfigurierbarer, FPGA-basierter Systems-on-Chip (SoCs) für die Daten-nahe Verarbeitung, bei der Berechnungen direkt bei den Datenquellen stattfinden. Basierend auf FPGA-Technologie und insbesondere deren dynamischer Rekonfiguration schlagen wir eine generische Architektur mit dem Namen ReProVide für die kostengünstige Verarbeitung von Datenbankanfragen vor.

Die Konzepte sollen die Integration von FPGA-basierten Beschleunigern in verfügbare SQL-, NoSQL- und In-Memory-Datenbanksysteme sowie Stream-Processing-Frameworks ermöglichen. Unser Ziel ist es dabei, flüchtige und nichtflüchtige Daten direkt an ReProVide-Knotenpunkte anzuschließen, die nicht nur bereinigte und integrierte Datensätze enthalten, sondern auch zur temporären oder persistenten Speicherung ungereinigter Daten aus neuen Datenquellen und Datenströmen verwendet werden können.

Mehr Informationen

Projekte

KR@KEN

Im Rahmen des DFG geförderten Projektes „ReProVide“ entwickeln wir ein System, dass sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FPG, SoC) ausführt. KR@KEN ist dabei zuständig für die Verwaltung des Clusters, das Sammeln von Meta-Informationen und Statistiken, sowie die Einplanung und Ausführung der Anfragen.

SKYSHARK

Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, dass sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FGPA, SoC) ausführt. Im Rahmen des Forschungsprojektes soll ein neuer Datenbank-Benchmark entwickelt werden. Dieser soll dabei helfen, die Stärken des im Projekt entwickelten Prototypens zeigen. Dabei wollen wir evaluieren, ob und wie man Echtzeit Flugdaten (ADS-B Transponder) und Flugpläne für die Entwicklung eines solchen Benchmarks verwenden kann. Der Fokus liegt dabei auf drei Kategorien von Datenbankanfragen:

Relationale Anfragen (z.B. Flugpläne)
Stromverarbeitende Anfragen (z.B. Echtzeit Flugüberwachung)
Verknüpfung von Strömen mit relationalen Daten (z.B. Flugraumüberwachung)

Der Benchmark soll dabei nicht, wie z.B. die Benchmarks der TCP, zur reinen Leistungsevaluierung dienen, sondern einen Test unter realen Bedingungen und auf der Realität basierenden Anwendungsszenarien darstellen. Mehr Informationen zu unserem Benchmark gibt es auf skyshark.org.

HiWi Stellen

Aktuell gibt es keine offene Stellen.

Abschlussarbeiten und Projekte

Offen

Vergeben

Master-Projekt – „SKYHSARK 2.0: Weiterentwicklung und Verbesserung von SKYSHARK“

SKYSHARK ist ein Benchmark für stromverarbeitende Systeme mit dem Fokus auf moderner Hardware (z.B. FPGA). Für den Benchmark verwendet SKYSHARK Echtzeit- Trackingdaten von Flugzeugen (ADS-B). Im Rahmen des Master-Projekts soll der Benchmark weiterentwickelt und mittels Referenzimplementierungen (z.B. Apache Flink) auf unseren Messrechnern getestet werden. Weiterhin soll das Tooling sowie das Benchmarking-Tool weiterentwickelt werden. Die Ergebnisse dieser Arbeit werden auf unserer Homepage (https://skyshark.org) sowie auf GitHub veröffentlicht und helfen Wissenschaftler:innen auf der ganzen Welt, ihre Systeme zu testen und zu benchmarken.

Abgeschlossen

Bachelor-Praktikum – „Konzeptionierung und Entwicklung eines Demo-Dashboards zur Visualisierung von Echtzeit Flugdaten (ADS-B)“

Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, das sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FPGA, SoC) ausführt. Für die Demonstration unseres Prototyps nutzen wir einen selbstentwickelten Benchmark namens Skyshark. Auf Basis dieses Benchmarks soll ein Dashboard entwickelt werden, welches Flugzeugbewegungen und Flugpläne in Echtzeit anzeigen kann.

Kentnisse in der Webentwicklung (Angular, NodeJS, REST) erforderlich
Kenntnisse in Java, SpringBoot wünschenswert
Grundlegende Kenntnisse in SQL wünschensert

Masterarbeit – „Konzeption und Entwicklung eines Query Repository zum Speichern und Verwlaten von relationalen und strombasierten Anfragen für das Forschungsprojekt ReProVide“

Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, das sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FGPA, SoC) ausführt. Im Rahmen des Forschungsprojektes soll ein Query Repository entwickelt werden. Dieses Repository soll folgende Aufgaben erfüllen:

Speichern und Verwalten von relationalen und strombasierten Anfragen
Verwlaten der Danebankschemata und Acceleratoren
Auswergun und Visualisierung von Performanve Metriken

Alle Funktionen müssen mittels einer Web-Applikation verwaltbar und visualisierbar sein.

Masterarbeit – SKYSHARK

Im Rahmen der Masterarbeit soll ein Prototyp entwickelt werden, der es ermöglicht Echtzeit Flugdaten mittels Diensten wie OpenSky Network (https://opensky-network.org ) zu sammeln und mit Informationen zu Flugplänen anzureichern. Weiterhin sollen Anfragen aus den oben genannten Kategorien konzeptioniert und an Hand der vorhandenen Daten getestet und evaluiert werden. Als letztes solle der so entwickelte Benchmark mit bestehenden Benchmarks, verglichen und Vor- und Nachteil herausgestellt werden.

Bachelorarbeit – KR@KEN

Im Rahmen der Bachelorarbeit soll eine solche prototypische Implementierung geplant und umgesetzt werden. Dabei sind folgende Punkte besonders wichtig:

Implementierung der physischen Operatoren zur Ausführung der Teilgraphen
Integration von möglichen Verzögerungen, die jederzeit angepasst werden können
Modularer Aufbau des Prototypens für zukünftige Erweiterungen

Der entwickelte Prototyp muss mit dem bestehenden System kommunizieren können. Nötige Schnittstellen und Protokolle sind bereits vorhanden. Die Implementierung des Prototypens findet in Java statt. Ein wichtiger Teil der Arbeit ist neben der Ausarbeitung der Bachelorarbeit die Dokumentation des Codes.

Das Team

Mert Baran
Benedikt Döring
David Schmidt
Açelya Aksu
Tim Vogler
Stefan Meißner

Publikationen

Lokale Publikationsliste (CRIS)

2023

Langohr M., Vogler T., Meyer-Wegener K.:
SKYSHARK: A Benchmark with Real-world Data for Line-rate Stream Processing with FPGAs
Lernen, Wissen, Daten, Analysen (LWDA) (Marburg, 9. Oktober 2023 - 11. Oktober 2023)
In: Leyer M, Wichmann J (Hrsg.): Lernen, Wissen, Daten, Analysen (LWDA) Conference Proceedings, Marburg, Germany, October 9-11, 2023 2023
Open Access: https://ceur-ws.org/Vol-3630/LWDA2023-paper9.pdf
URL: https://ceur-ws.org/Vol-3630/LWDA2023-paper9.pdf
BibTeX: Download

2021

Schwab P., Röckl J., Langohr M., Meyer-Wegener K.:
Performance Evaluation of Policy-Based SQL Query Classification for Data-Privacy Compliance
In: Datenbank-Spektrum (2021)
ISSN: 1618-2162
DOI: 10.1007/s13222-021-00385-9
URL: https://link.springer.com/article/10.1007/s13222-021-00385-9
BibTeX: Download

2020

Langohr M.:
Konzeption und prototypische Implementierung einer regelbasierten Anfrageklassifizierung zur Einhaltung des Datenschutzes (Masterarbeit, 2020)
BibTeX: Download
Schwab P., Langohr M., Meyer-Wegener K.:
A Framework for DSL-Based Query Classification Using Relational and Graph-Based Data Models
3rd Joint International Workshop on Graph Data Management Experiences & Systems (GRADES) and Network Data Analytics (NDA) (Portland, OR, 14. Juni 2020 - 14. Juni 2020)
In: ACM (Hrsg.): GRADES-NDA'20: Proceedings of the 3rd Joint International Workshop on Graph Data Management Experiences & Systems (GRADES) and Network Data Analytics (NDA) 2020
DOI: 10.1145/3398682.3399167
URL: https://dl.acm.org/doi/abs/10.1145/3398682.3399167
BibTeX: Download
Schwab P., Langohr M., Meyer-Wegener K.:
We Know What You Did Last Session: Policy-Based Query Classification for Data-Privacy Compliance With the DataEconomist
SSDBM 2020: 32nd International Conference on Scientific and Statistical Database Management (Vienna, Virtual Conference, 7. Juli 2020 - 9. Juli 2020)
DOI: 10.1145/3400903.3401692
BibTeX: Download

2019

Schwab P., Langohr M., Röckl J., Vöhringer D., Wahl AM., Meyer-Wegener K.:
Query-Driven Enforcement of Rule-Based Policies for Data-Privacy Compliance
LWDA 2019 Lernen, Wissen, Daten, Analysen (Berlin, Germany, 30. September 2019 - 2. Oktober 2019)
In: Proc. Conf. "Lernen, Wissen, Daten, Analysen" 2019
Open Access: http://ceur-ws.org/Vol-2454/paper_56.pdf
URL: http://ceur-ws.org/Vol-2454/paper_56.pdf
BibTeX: Download

Maximilian Langohr