Datenintegration

Datenbanksysteme spielen auch bei der Anwendungsintegration eine gewichtige Rolle, denn im Kern jedes Integrationsprojekts steht die Datenintegration, die einerseits die semantische Abstimmung ("Mapping") und andererseits die systemübergreifende Synchronisation betrifft. Zwischen den zu integrierenden Anwendungen müssen Daten ausgetauscht und konsistent gehalten werden. Dabei verursacht vor allem die semantische Integration von Datentypen und -instanzen einen hohen manuellen Bearbeitungsaufwand. Deshalb muss nach Methoden und Techniken zur Minimierung dieses Aufwands gesucht werden.

Projekte:

OCEAN: Open and Collaborative Query-Driven Analytics

Mehr und mehr Unternehmen sammeln möglichst alle anfallenden Daten in sogenannten "Data Lakes". Obwohl die Daten damit prinzipiell für beliebige Analysen zur Verfügung stehen, bleibt es dennoch unerlässlich für die Analyse, ein Verständnis für die Bedeutung und die Verknüpfungsoptionen der Daten zu entwickeln. Analysten, die diese Arbeit bereits geleistet haben, formulieren Anfragen, in denen solches Wissen implizit enthalten ist. Wenn dieses Wissen jedoch nicht mit anderen geteilt wird, bleiben mögliche Synergien ungenutzt und das Verständnis der Daten im "Data Lake" wird erschwert. Wir extrahieren automatisiert Teile dieses Wissens aus analytischen Anfragen, um es in aufbereiteter Form für nachfolgende Analysen nutzen zu können. Datenanalysten werden dadurch schneller auf relevante Datenquellen aufmerksam und die Datenintegration wird erleichtert.

Mehr Informationen

DQ-Step: DQ-Step - Improvement of data quality at a reference enterprise in plant engineering

The application of IT-supported processes in plant engineering - especially in the areas of engineering, procurement, and construction (EPC) - is steadily increasing. Thus, the data quality in the information management systems becomes more and more important. The information management systems have the following challenges: The amounts of data increase, the integration of the tools is not optimized and due to the system heterogeneous. The quality of the deliverables (documents, parts lists, drawings…

Mehr Informationen

SIML: Schemainferenz und maschinelles Lernen

Im Rahmen des Projekts SIML (Schemainferenz und maschinelles Lernen) werden Methoden der topologischen Datenanalyse und des unüberwachten Lernens kombiniert untersucht, eingesetzt und weiterentwickelt, um aus unstrukturierten, multivarianten Daten ein konzeptuelles Schema abzuleiten.

Mehr Informationen

PHAROS: Processing Heterogeneous Assets and Resources to discover Ontologies and Semantics

Der Zweck des Semantic Web ist es, den weltweiten Zugang zum Wissen der Menschheit in maschinenverarbeitbarer Form zu ermöglichen. Ein großes Hindernis dabei ist, dass Wissen oft entweder inkohärent repräsentiert oder gar nicht externalisiert und nur in den Köpfen von Menschen vorhanden ist. Der Aufbau eines Wissensgraphen und die manuelle Erstellung und Fortschreibung einer Ontologie durch einen Domänenexperten ist eine mühsame Arbeit, die einen großen initialen Aufwand erfordert, bis das Erg…

Mehr Informationen

Kontaktpersonen:

Beteiligte Wissenschaftler:

Publikationen: