Maximilian Langohr

Maximilian Langohr, M. Sc.

Department Informatik (INF)
Lehrstuhl für Informatik 6 (Datenmanagement)

Raum: Raum 08.151
Martensstraße 3
91058 Erlangen
Bayern

Maximilian Langohr ist seit August 2020 wissenschaftlicher Mitarbeiter an unserem Lehrstuhl.

Forschungsschwerpunkt

ReProVide

Dieses Projekt wird durch die Deutsche Forschungsgemeinschaft (DFG) im Rahmen des Schwerpunktprogramms SPP 2037 „Scalable Data Management for Future Hardware“ gefördert.

Ziel dieses Projekts ist es, neuartige Hardware und Optimierungstechniken für die skalierbare, leistungsfähige Verarbeitung von Big Data bereitzustellen. Wir zielen insbesondere auf große Datenmengen mit flexiblen Schemata (zeilenorientierte, spaltenorientierte, dokumentenorientierte, irreguläre und/oder nicht-indexierte Daten) sowie auf Datenströme, wie sie in der Klick-Strom-Analyse, in Unternehmensquellen wie E-Mails, Software-Logs und Diskussionsforum-Archiven sowie in Sensoren im Internet of Things (IoT) und Industrie 4.0 zu finden sind. In diesem Bereich untersucht das Projekt das Potenzial Hardware-konfigurierbarer, FPGA-basierter Systems-on-Chip (SoCs) für die Daten-nahe Verarbeitung, bei der Berechnungen direkt bei den Datenquellen stattfinden. Basierend auf FPGA-Technologie und insbesondere deren dynamischer Rekonfiguration schlagen wir eine generische Architektur mit dem Namen ReProVide für die kostengünstige Verarbeitung von Datenbankanfragen vor.

Die Konzepte sollen die Integration von FPGA-basierten Beschleunigern in verfügbare SQL-, NoSQL- und In-Memory-Datenbanksysteme sowie Stream-Processing-Frameworks ermöglichen. Unser Ziel ist es dabei, flüchtige und nichtflüchtige Daten direkt an ReProVide-Knotenpunkte anzuschließen, die nicht nur bereinigte und integrierte Datensätze enthalten, sondern auch zur temporären oder persistenten Speicherung ungereinigter Daten aus neuen Datenquellen und Datenströmen verwendet werden können.


Projekte

KR@KEN

 

Im Rahmen des DFG geförderten Projektes „ReProVide“ entwickeln wir ein System, dass sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FPG, SoC) ausführt. KR@KEN ist dabei zuständig für die Verwaltung des Clusters, das Sammeln von Meta-Informationen und Statistiken, sowie die Einplanung und Ausführung der Anfragen.

SKYSHARK

 

Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, dass sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FGPA, SoC) ausführt. Im Rahmen des Forschungsprojektes soll ein neuer Datenbank-Benchmark entwickelt werden. Dieser soll dabei helfen, die Stärken des im Projekt entwickelten Prototypens zeigen. Dabei wollen wir evaluieren, ob und wie man Echtzeit Flugdaten (ADS-B Transponder) und Flugpläne für die Entwicklung eines solchen Benchmarks verwenden kann. Der Fokus liegt dabei auf drei Kategorien von Datenbankanfragen:

  1. Relationale Anfragen (z.B. Flugpläne)
  2. Stromverarbeitende Anfragen (z.B. Echtzeit Flugüberwachung)
  3. Verknüpfung von Strömen mit relationalen Daten (z.B. Flugraumüberwachung)

Der Benchmark soll dabei nicht, wie z.B. die Benchmarks der TCP, zur reinen Leistungsevaluierung dienen, sondern einen Test unter realen Bedingungen und auf der Realität basierenden Anwendungsszenarien darstellen.


Abschlussarbeiten und Projekte

Masterarbeit/Masterprojekt – SKYSHARK [Vergeben]

Im Rahmen der Masterarbeit soll ein Prototyp entwickelt werden, der es ermöglicht Echtzeit Flugdaten mittels Diensten wie OpenSky Network (https://opensky-network.org ) zu sammeln und mit Informationen zu Flugplänen anzureichern. Weiterhin sollen Anfragen aus den oben genannten Kategorien konzeptioniert und an Hand der vorhandenen Daten getestet und evaluiert werden. Als letztes solle der so entwickelte Benchmark mit bestehenden Benchmarks, verglichen und Vor- und Nachteil herausgestellt werden.

 

Bachelorarbeit – KR@KEN [Abgeschlossen]

Im Rahmen der Bachelorarbeit soll eine solche prototypische Implementierung geplant und umgesetzt werden. Dabei sind folgende Punkte besonders wichtig:

  • Implementierung der physischen Operatoren zur Ausführung der Teilgraphen
  • Integration von möglichen Verzögerungen, die jederzeit angepasst werden können
  • Modularer Aufbau des Prototypens für zukünftige Erweiterungen

Der entwickelte Prototyp muss mit dem bestehenden System kommunizieren können. Nötige Schnittstellen und Protokolle sind bereits vorhanden.  Die Implementierung des Prototypens findet in Java statt. Ein wichtiger Teil der Arbeit ist neben der Ausarbeitung der Bachelorarbeit die Dokumentation des Codes.

 

Publikationen

Lokale Publikationsliste (CRIS)

2021

2020

2019