Forschungsprojekte

Aktuelle Forschungsprojekte

Term: 1. April 2025 - 31. Juli 2026
Funding source: Siemens AG
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

Building on previous successes in change point analysis, this project advances scalable methods for analyzing large, heterogeneous industrial time series data from power plants. By combining data-driven algorithms with expert knowledge and a platform-based deployment close to the data (cloud deployment), the project enables faster insights, improved anomaly interpretation, and practical decision support for complex thermodynamic systems

More information

Term: 19. September 2022 - 31. Dezember 2027
Project leader:

Mit dem andauernden Anstieg globaler Datenvolumina gewinnt die Datenbankkompression immer weiter an Relevanz. Während die Kompression numerischer Datentypen umfassend erforscht wurde, erfährt die Kompression von Zeichenketten erst neuerdings wieder verstärkte wissenschaftliche Beachtung.

Ein vielversprechender Ansatz zur Stringkompression ist die Kompression mittels Symboltabellen, bei der wiederkehrende Substrings innerhalb einer Datenbank durch kurze Codes substituiert werden. Eine ko…

More information

Abgeschlossene Projekte

Term: 1. Januar 2024 - 31. Dezember 2024
Funding source: Siemens AG
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

This research project investigates the use of unsupervised change point analysis (CPA) methods for knowledge discovery in large-scale industrial time series datasets. Change point analysis offers a promising tool to mine large time series datasets by identifying abrupt and unexpected changes in time series data without requiring supervision. Relating the detected events between multiple signals offers valuable insight into the behavior of complex, dynamical systems enabling to mine events of interest often hidden in the vast amount of data produced by the systems. We apply the methods to sensor data from combined cycle power plants with thousands of simultaneous data streams.

More information

Term: since 16. Mai 2023
Project leader:

To test and evaluate a heterogeneous stream-processing system consisting of an FPGA-based systemon-chip and a host, we develop a benchmark called SKYSHARK. It uses real-world data from air-traffic control that is publicly available. These data are enhanced for the purpose of the benchmark without changing their characteristics. They are further enriched with aircraft and airport data. We define 14 queries with respect to the particular requirements of our system. They should be useful for other…

More information

Term: 1. Januar 2023 - 1. Januar 2026
Funding source: Siemens AG
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

We propose to investigate the following research questions:

- Which characteristics enable a data quality framework to best identify and cluster the most relevant data quality problems in arbitrary business data landscapes?

- Can we capture the knowledge about typical data quality concerns and possible solutions in a knowledge graph in order to infer potential solutions in any given case?

- How can the data quality metrics in such a framework be designed in general to align well…

More information

Term: 1. April 2022 - 31. März 2025
Funding source: Siemens AG
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

This research project aims to develop different efficient methods that enable knowledge mining in large time series datasets to uncover relationships and descriptive patterns within the dataset. A key focus is the identification of relationships, which are uncovered using the technique of changepoint correlation that we are actively developing within the project. As the project aims to support or even automate a manual process, visualization, and demonstration of the techniques in question also play a major role in the development.

More information

Term: 1. August 2021 - 31. Juli 2024
Funding source: Deutsche Forschungsgemeinschaft (DFG)
Project leader:

Die schnelle und energieeffiziente Analyse von Petabytes an Daten erfordert eine massiv parallele Verarbeitung bereits an der Datenquelle. Das Ziel des ReProVide-Projekts ist es, neuartige FPGA-basierte Lösungen zur intelligenten Speicherung und quellnahen Datenverarbeitung zusammen mit neuartigen Optimierungstechniken bereitzustellen, die die Geschwindigkeit und Rekonfigurierbarkeit von FPGA-Hardware für die skalierbare und leistungsfähige Reduktion großer Datenmengen nutzen. 

In Phas…

More information

Term: 2. Januar 2020 - 19. September 2022
Project leader:

Die Kompression von Daten spielt im Datenmanagement nicht erst seit Kurzem eine entscheidende Rolle. Komprimierte Daten lassen sich platzsparender dauerhaft ablegen und effizienter über das Netzwerk versenden. Durch die ständig steigenden Datenmengen erhöht sich die Wichtigkeit guter Kompressionsverfahren jedoch immer weiter.

Im Rahmen von Projekt Anania (Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration) erforschen wir, inwiefern klassische Ko…

More information

Term: since 1. Juni 2019
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

Der Zweck des Semantic Web ist es, den weltweiten Zugang zum Wissen der Menschheit in maschinenverarbeitbarer Form zu ermöglichen. Ein großes Hindernis dabei ist, dass Wissen oft entweder inkohärent repräsentiert oder gar nicht externalisiert und nur in den Köpfen von Menschen vorhanden ist. Der Aufbau eines Wissensgraphen und die manuelle Erstellung und Fortschreibung einer Ontologie durch einen Domänenexperten ist eine mühsame Arbeit, die einen großen initialen Aufwand erfordert, bis das Erg…

More information

Term: 1. April 2019 - 30. September 2025
Project leader:

More information

Term: 1. August 2018 - 30. September 2021
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

Im Rahmen des Projekts SIML (Schemainferenz und maschinelles Lernen) werden Methoden der topologischen Datenanalyse und des unüberwachten Lernens kombiniert untersucht, eingesetzt und weiterentwickelt, um aus unstrukturierten, multivarianten Daten ein konzeptuelles Schema abzuleiten.

More information

Term: 28. August 2017 - 1. März 2023
Funding source: DFG / Schwerpunktprogramm (SPP)
Project leader: , ,

Dieses Projekt wird durch die Deutsche Forschungsgemeinschaft (DFG) im Rahmen des Schwerpunktprogramms SPP 2037 "Scalable Data Management for Future Hardware" gefördert.

Ziel dieses Projekts ist es, neuartige Hardware und Optimierungstechniken für die skalierbare, leistungsfähige Verarbeitung von Big Data bereitzustellen. Wir zielen insbesondere auf große Datenmengen mit flexiblen Schemata (zeilenorientierte, spaltenorientierte, dokumentenorientierte, irreguläre und/oder nicht-indexierte Daten) sowie auf Datenströme, wie sie in der Klick-Strom-Analyse, in Unternehmensquellen wie E-Mails, Software-Logs und Diskussionsforums-Archiven sowie in Sensoren im Internet of Things (IoT) und in Industrie 4.0 zu finden sind. In diesem Bereich untersucht das Projekt das Potenzial Hardware-konfigurierbarer, FPGA-basierter Systems-on-Chip (SoCs) für die Daten-nahe Verarbeitung, bei der Berechnungen direkt bei den Datenquellen stattfinden. Basierend auf FPGA-Technologie und insbesondere deren dynamischer Rekonfiguration schlagen wir eine generische Architektur mit dem Namen ReProVide für die kostengünstige Verarbeitung von Datenbankanfragen vor.

More information

Term: 1. Januar 2017 - 31. Dezember 2020
Funding source: Sonstige EU-Programme (z. B. RFCS, DG Health, IMI, Artemis), Bayerische Staatsministerien
Project leader:

Im Rahmen des EFRE-E|ASY-Opt Teilprojektes wird das Potential von Data Mining Methoden im Bereich der Fertigung des produzierenden Gewerbes untersucht. Speziell das Trainieren von Deep-Learning Modellen stellt eine rechenintensive Aufgabe dar, welche mitunter Stunden bis mehrere Tage in Anspruch nehmen kann. Die Trainingszeit kann durch die Verwendung eines bereits trainierten Modells erheblich verkürzt werden, sofern die Ziel und Quellaufgabe in engen Zusammenhang zueinander stehen. Dieser Zusammenhang wird aktuell noch nicht vollumfänglich verstanden.

Das Ziel dieses Forschungsprojektes ist die Umsetzung eines Systems namens REAPER (Reusable Neural Network Pattern Repository), um Data Scientists bei der Speicherung und Wiederverwendung von bereits trainierten Deep-Learning Modellen zu unterstützen.

More information

Term: 1. April 2015 - 31. Dezember 2018
Project leader:

"Sie sollten Ihre Anfragen kennen!" - so könnte man den englischen (kürzeren) Titel des Projekts übersetzen.  Es geht darum, nicht einfach eine Datenbank haben zu wollen, sondern sich zuerst auch einmal Gedanken darüber zu machen, was man aus dieser Datenbank dann an Auswertungen (die sich in Anfragen hinschreiben lassen) eigentlich haben möchte. Mit der Erstellung einer Datenbank ist eine Menge Arbeit verbunden, nicht nur mit der Einrichtung der Software auf einem Rechner, sondern vor allem auch mit der Erfassung der ganzen Daten. Dieser Aufwand sollte zielgerichtet erbracht werden. Das Projekt wird also Anfragen sammeln, die zum Teil dann sogar automatisch in einen Datenbank-Entwurf überführt werden können. Das spart zum einen Ressourcen, unterstützt zum anderen aber auch das wichtige Datenschutz-Ziel der sog. Datensparsamkeit.

More information

Term: 1. Januar 2015 - 30. September 2018
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

Im Rahmen des Projekts wird erforscht, wie die Intention einer elektronisch getätigten Interaktion explizit gemacht werden kann, ohne damit den Dokumentationsaufwand substantiell zu erhöhen. Gelingt dies, können aus den getätigten Sprechakten Inferenzen abgeleitet werden, z.B. um an die Erfüllung von Versprechen zu erinnern, Fehler zu vermeiden und fallspezifisch bekannte Kommunikationsmuster zu unterstützen.

More information

Term: 1. September 2014 - 31. Dezember 2018
Project leader:

Die Welt der Datenverwaltungssysteme ist in den letzten Jahren sehr viel unübersichtlicher geworden. Neben die gut etablierten Relationalen Datenbanksysteme sind sog. NoSQL-Systeme getreten, die vorgeben, mit viel größeren Datenmengen umgehen zu können, die zugleich aber weniger Funktionen zum effizienten Zugriff auf die Daten anbieten und auch weniger Konsistenzgarantien abgeben. Damit stellt sich die Frage, wann man bei einer Relationalen Datenbank bleiben und wann man auf ein NoSQL-System übergehen sollte.  Vor dieser Frage stehen immer mehr Organisationen. Dieses Projekt sammelt die Kriterien, nach denen man eine solche Entscheidung begründet treffen kann - und sollte.

More information

Term: 1. November 2013 - 31. August 2024
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

Mehr und mehr Unternehmen sammeln möglichst alle anfallenden Daten in sogenannten "Data Lakes". Obwohl die Daten damit prinzipiell für beliebige Analysen zur Verfügung stehen, bleibt es dennoch unerlässlich für die Analyse, ein Verständnis für die Bedeutung und die Verknüpfungsoptionen der Daten zu entwickeln. Analysten, die diese Arbeit bereits geleistet haben, formulieren Anfragen, in denen solches Wissen implizit enthalten ist. Wenn dieses Wissen jedoch nicht mit anderen geteilt wird, bleiben mögliche Synergien ungenutzt und das Verständnis der Daten im "Data Lake" wird erschwert. Wir extrahieren automatisiert Teile dieses Wissens aus analytischen Anfragen, um es in aufbereiteter Form für nachfolgende Analysen nutzen zu können. Datenanalysten werden dadurch schneller auf relevante Datenquellen aufmerksam und die Datenintegration wird erleichtert.

More information

Term: 1. August 2012 - 31. Dezember 2018
Funding source: DFG / Forschungsgruppe (FOR)
Project leader:

Die Beobachtung von Tieren kann durch moderne Technik enorm verbessert werden. Gerade bei Fledermäusen war das in der Vergangenheit sehr schwierig, denn sie sind nachtaktiv und auch relativ klein.  Was man ihnen als Sender zumuten darf, muss weniger als 10% ihres Körpergewichts ausmachen. Die Entwicklung der Mikroelektronik erlaubt es inzwischen, komplette Computer zu bauen, die diese Bedingung erfüllen.  Die senden nicht mehr nur einen Signalton, sondern Daten.  Die Bodenstation nimmt diese Daten auf und wertet sie aus.  Das beginnt mit der aktuellen Position der Fledermaus, geht weiter über die Begegnung mit anderen Fledermäusen (besonders interessant: Mutter und Kind) und endet bei Körpertemperatur, Pulsschlag und anderen Biosensoren.  Die Daten werden gesammelt und im Verbund ausgewertet.  Leider sind sie relativ ungenau und auch mit vielen Störungen behaftet, so dass es eine erhebliche Aufgabe bedeutet, sie zunächst zu bereinigen.  Das Fernziel des Projekts ist die gezielte Erhebung der Daten in Bezug auf die gewünschten Auswertungen, um so Energie zu sparen und die Fledermäuse noch länger beobachten zu können.

More information

Term: 1. November 2011 - 31. Dezember 2013
Funding source: BMFTR / Spitzencluster
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

The integration of medical products into the actual workflows and working processes of a productive environment is a difficult, time-consuming and cost-intensive task for both manufacturers and operators. Despite the standardization of DICOM and HL7, the integration of software components and medical products into a hospital information system still represents a huge task, owing to a lack of appropriate validation environments. The objective of this project is to create a generic test environment…

More information

Term: 15. Januar 2009 - 15. Februar 2012
Funding source: Industrie
Project leader:

Prof. Dr. Richard Lenz

Professur für evolutionäres Datenmanagement

The application of IT-supported processes in plant engineering - especially in the areas of engineering, procurement, and construction (EPC) - is steadily increasing. Thus, the data quality in the information management systems becomes more and more important. The information management systems have the following challenges: The amounts of data increase, the integration of the tools is not optimized and due to the system heterogeneous. The quality of the deliverables (documents, parts lists, drawings…

More information

Term: 1. Oktober 2008 - 30. September 2017
Project leader:

DSAM ist eine Middleware zur Verwaltung von globalen und auf heterogene Plattformen verteilten Datenstromanfragen. Diese Plattformen umfassen sowohl Datenstrommanagementsysteme (DSMS) als auch Sensornetzwerke. Das Ziel ist wie beim MDA-Ansatz, ein plattformunabhängiges Modell, das hier in Form von globalen Anfragen vorliegt, automatisch auf eine heterogene und verteilte Landschaft von stromverarbeitenden Komponenten abzubilden. Die in einer abstrakten Anfragesprache definierten Anfragen werden unter Berücksichtigung von Kostenschätzern und topologischen Einschränkungen partitioniert. Die dadurch entstehenden Teilanfragen werden in die Anfragesprachen der Zielsysteme übersetzt. Bei Sensornetzwerken verfolgen wir dabei den Ansatz der Codegenerierung. Weitere Herausforderungen sind das Monitoring des gesamten Systems sowie insbesondere im Bereich der Sensornetzwerke die effiziente Verwaltung von Metadaten und die Dezentralisierung der Anfrageverwaltung.

More information

  • AnFACS (2007 – 2012)

    Analyse von föderierten Zugriffskontrollsystemen
  • CoBRA DB (2005-2011)

    komponentenbasiertes, zur Laufzeit anpassbares Datenbanksystem
  • Comaera (2005-2007)

    Software-Komponenten mit quantitativen Eigenschaften und Performanzvorhersage
  • COMQUAD (2002-2005)

    Software-Komponenten mit quantitativen Eigenschaften und Adaptivität
  • CubeStar (1996-2002)

    Modellierung und Anfrageverarbeitung in Data-Warehouse-Systemen
  • dbprost (2007-2010)

    Datenbankgestützte Prozessautomatisierung bei Software Tests
  • DQ-Step (2009-2012)

    Verbesserung der Datenqualität bei einem Referenzunternehmen im Anlagenbau
  • fCMDB08(2008-2009)

    Föderierte Configuration-Management-Datenbank für Siemens IT Solutions and Services
  • FlexWCM (2002-2005)

    Flexible Konzepte für das Web-Content-Management
  • i6 M²EtIS (2009 – 2014)

    i6 Massive Multiplayer EvenT Integration System
  • i6sdb (2006 – 2011)

    Datenstrom- und Datenbanksysteme
  • iArch (2003-2007)

    Integratives IT-Architekturmanagement
  • iRM (2001-2005)

    Integration Repository Manager
  • Marrakesch (auf Englisch) (2000-2005)

    Vertragsverhandlungen von komplex konfigurierbaren Produkten und Dienstleistungen
  • medITalk (2010-2016)

    Horizontale Innovationen zur Produkt- und Prozessoptimierung
  • Prozessorientierte Informationssysteme im Krankenhaus und im Versorgungsnetz (2002-2005)
  • Pixtract (2007-2012)

    Effiziente objekterkennungsbasierte Annotation von Bildern
  • ProHTA (2010-2015)

    Prospective Health Technology Assessment
  • ProMed (2007 – 2012)

    Prozessunterstützung in der Medizin
  • PubScribe (1999-2002)

    Untersuchung von Publish/Subscribe-Mechanismen
  • RETAVIC (auf Englisch) (2002-2008)

    Audio- und Video-Konvertierung in Echtzeit für MMDBVS
  • SCINTRA (2001-2004)

    Die Anwendung von Datenbanktechnologien im Grid fokussierte dieses Projekt.
  • SeMeOr (2005-2008)

    Sicherheitsmetrik für Organisationen
  • SFB 539 (Glaukome einschließlich Pseudoexfoliationssyndrom (PEX)) (2003-2009)

    Integration von IT-Systemen zu einem hochwertigen Gesamtregister für die klinische Forschung.
  • SKM (2002-2006)

    Semantisches Knowledge Management
  • SUSHy (2011-2014)

    Entwicklung eines neuartigen und übergeordneten Gesamtsystems für komplexe Anlagen
  • TDQMed (2011-2015)

    Testdatenqualität für medizinische Geräte