Navigation

Datenintegration und Provisioning von Speicherungssystemen für das Data Mining in Fertigungsprozessdaten

Datenintegration und Provisioning von Speicherungssystemen für das Data Mining in Fertigungsprozessdaten

(Drittmittelfinanzierte Gruppenförderung – Teilprojekt)

Titel des Gesamtprojekts: EFRE EIASY-Opt - Kompetenz- und Analyseprojekt für die "datengetriebene Prozess- und Produktionsoptimierung mittels Data Mining und Big Data"
Projektleitung:
Projektbeteiligte: ,
Projektstart: 05/02/17
Projektende: 04/30/22
Akronym: E|ASY-Opt INF6
Mittelgeber: Sonstige EU-Programme (z. B. RFCS, DG Health, IMI, Artemis), Bayerische Staatsministerien
URL: https://www.faps.fau.de/curforsch/efre-easy-opt/

Abstract

Bevor ein Data Mining auf den Fertigungsprozessdaten beginnen kann, müssen diese – aus sehr
unterschiedlichen und aller Voraussicht nach heterogenen Datenquellen stammend
– zunächst integriert werden. Ziel ist es, hier die aktuellen Methoden zu
erproben und so weiterzuentwickeln, dass sie für die spezielle Einsatzumgebung der
Fertigungssteuerung in KMUs tauglich werden. Auch die anschließende Speicherung
der Daten ist keineswegs trivial, da die Menge sehr groß werden kann ("Big
Data"). Man denkt heute sofort an die sog. NoSQL-Systeme, die aber nur
eine der vielen Möglichkeiten darstellen und beim selektiven Zugriff auf die
Daten nur sehr eingeschränkte Möglichkeiten bieten. Abhängig vom Datenvolumen,
von den Datenstrukturen und vor allem von den benötigten Zugriffen ist eine
geeignete Speicherungsform zu bestimmen, die außerdem noch den Bedürfnissen von
KMUs gerecht wird, also nicht zu viele Ressourcen bindet und auch keine
aufwändige Administration verlangt.
Wie im Hauptantrag schon beschrieben, werden die Fertigungsprozessdaten heute zu einem durchaus
signifikanten Teil noch gar nicht zusammengeführt, geschweige denn ausgewertet.
Es wird aber angenommen, dass sich hier noch sehr viele Informationen
extrahieren und veranschaulichen lassen, die zu einer erheblichen Verbesserung
der Prozesse beitragen könnten, etwa im Bereich der vorausschauenden
Instandhaltung. Dazu stehen die Methoden des Data Mining (z.B. Vorhersage,
Assoziationsregeln, Klassifikation, Cluster-Analyse und Ausreißer-Erkennung)
zur Verfügung, die auf diese Daten angewendet werden könnten. Dabei sind
allerdings zuvor zwei Problembereiche zu adressieren:

  1. Heterogenität der Daten:
    Die verschiedenen Quellsysteme werden ihre Daten in ganz verschiedenen Formaten und Strukturen
    erzeugen, oft wohl als Protokolldateien. Wir haben einige Erfahrung mit der
    (semantischen) Integration heterogener Datenbestände und kennen auch die
    Ansätze in der Literatur. Ein Data Mining setzt in den allermeisten Fällen
    einen integrierten und gereinigten Datenbestand voraus.
  2. Provisioning von Datenspeichersystemen:
    Früher nahm man einfach immer eine relationale Datenbank. Das hat sich geändert; das Spektrum
    ist viel breiter geworden. Es geht in etwa von Hadoop/HDFS über (sehr unterschiedliche) NoSQL-Syste­me, klassische Datenbanken und Data Warehouses bis hin zu
    Datenstromverarbeitungssystemen und Complex-Event Processing. Welches System
    wann am besten passt und wie man es dann konfigurieren muss, hängt von sehr
    vielen Parametern ab: der Art der Daten und der Zugriffe, dem Datenvolumen, den
    Anforderungen an Konsistenz und Ausfallsicherheit usw. Damit beschäftigen wir
    uns gerade allgemein in zwei Dissertations-Projekten. Die könnten von den sehr
    konkreten Anforderungen in E|ASY-Opt profitieren und andererseits ihr
    Methodenwissen dort einbringen.

Mögliche Arbeitsschritte werden dabei sein:

  • umfassende Analyse der in den Fertigungsprozessen anfallenden Daten
  • Bereinigung der in das Data Mining einzubeziehenden Datenbestände (Umgang mit fehlenden Daten,
    Inkonsistenzen, Rauschen, Dubletten usw.)
  • Integration der Datenbestände aus unterschiedlichen Quellen (ggf. Umwandlung von Strukturen und
    Werten, Definition und Implementierung von Mapping-Funktionen)
  • Auswahl einer geeigneten
    Speicherungsform nach den Kriterien Datenvolumen, Datenstrukturen und Zugriffsmuster
  • Realisierung der Zugriffe zur Bereitstellung der Daten für das Data Mining (Bestimmung der
    "Task-relevant Data")
  • Inkrementelle Aktualisierung der Datenbestände beim Eintreffen neuer Daten aus den
    Fertigungsprozessen

Personen

Projektleitung

Melanie Bianca Sigl, M. Sc.

  • Adresse:
    Martensstraße 3
    91058 Erlangen
  • Telefonnummer: +49 9131 85-28683
  • E-Mail: melanie.sigl@fau.de

Prof. Dr. Klaus Meyer-Wegener

  • Tätigkeit: Lehrstuhlinhaber
  • Adresse:
    Martensstraße 3
    91058 Erlangen
  • Telefonnummer: +49 9131 85-27892
  • E-Mail: klaus.meyer-wegener@fau.de

Vorzimmer

  • Cécile Astor
    • Telefonnummer: +49 9131 85-27893
    • Faxnummer: +49 9131 85-28854
    • E-Mail: cs6-office@fau.de
    • Sprechzeiten: Jede Woche Mo, 8:30 - 14:00, Raum 08.139,
      Jede Woche Di, Mi, Do, 8:30 - 13:30, Raum 08.139,

Weitere Beteiligte

Thomas Heinl, Sophie Russ, Demian Vöhringer