• Navigation überspringen
  • Zur Navigation
  • Zum Seitenende
Organisationsmenü öffnen Organisationsmenü schließen
Friedrich-Alexander-Universität Lehrstuhl für Informatik 6 CS6
  • FAUZur zentralen FAU Website
  1. Friedrich-Alexander-Universität
  2. Technische Fakultät
  3. Department Informatik
Suche öffnen
    • Impressum
    • Datenschutz
    • Barrierefreiheit
    1. Friedrich-Alexander-Universität
    2. Technische Fakultät
    3. Department Informatik
    Friedrich-Alexander-Universität Lehrstuhl für Informatik 6 CS6
    Menu Menu schließen
    • Lehrstuhl
      • Aktuelles
      • Über uns
      • Personen
      • Kontakt
      Hauptseite Lehrstuhl
    • Forschung
      • Evolutionäre Informationssysteme
        • Open and Collaborative Query-Driven Analytics
        • Data Driven Relationship Discovery in Large Time Series Datasets
        • Processing Heterogeneous Assets and Resources to discover Ontologies and Semantics
        • Sprechaktbasiertes Fallmanagement
        • Schemainferenz und maschinelles Lernen
      • Datenqualität
        • DQ-Step – Improvement of data quality at a reference enterprise in plant engineering
        • Datenqualität und Innovationsfähigkeit von Medizinprodukten
      • Datenintegration
        • Open and Collaborative Query-Driven Analytics
        • Processing Heterogeneous Assets and Resources to discover Ontologies and Semantics
        • Schemainferenz und maschinelles Lernen
        • DQ-Step – Improvement of data quality at a reference enterprise in plant engineering
      • Prozessmanagement
        • Sprechaktbasiertes Fallmanagement
      • Datenbanksysteme
        • Know Your Queries!
        • REAPER: A Framework for Materializing and Reusing Deep-Learning Models
        • SKYSHARK – Benchmarking von Datenanalysesystemen mit Echtzeit-Flugdaten
        • Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration
        • Schemainferenz und maschinelles Lernen
        • Bewertung von Datenspeichersystemen
        • Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees
        • Anfrageoptimierung und Daten-nahe Verarbeitung auf Rekonfigurierbaren SoCs für Big-Data-Analyse
        • Query-Optimierung und Near-Data-Processing auf rekonfigurierbaren SoCs für Big Data Analyse (Phase II)
      • Datenstromsysteme
        • Data Stream Application Manager
        • SKYSHARK – Benchmarking von Datenanalysesystemen mit Echtzeit-Flugdaten
        • Systemübergreifende Optimierung von Datenstromanfragen
      • Datenmanagement in den Digital Humanities
        • Campusnetzwerk Digitale Geistes- und Sozialwissenschaften
        • Franken in historischen Reiseberichten
      • Moderne Datenbanksysteme
        • Pufferverwaltung und Datenzugriff
      Hauptseite Forschung
    • Lehre
      • Lehrveranstaltungen
      • Curriculum
      • Examensarbeiten
      • Prüfungsinformationen
      Hauptseite Lehre

    Lehrstuhl für Informatik 6

    Datenmanagement

    Bereichsnavigation: Forschung
    • Abgeschlossene Forschungsprojekte
    • Veröffentlichungen
    • Evolutionäre Informationssysteme
    • Datenqualität
    • Datenintegration
    • Prozessmanagement
    • Datenbanksysteme
      • Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration (Arbeitstitel, noch vorläufig)
      • Data Stream Application Manager
      • Know Your Queries!
      • REAPER: A Framework for Materializing and Reusing Deep-Learning Models
      • SKYSHARK - Benchmarking von Datenanalysesystemen mit Echtzeit-Flugdaten
      • Architektur von Nicht-Multiplen Autoencodern mit Nicht-Verlustbehafteter Informations-Agglomeration
      • Schemainferenz und maschinelles Lernen
      • Bewertung von Datenspeichersystemen
      • Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees
      • Anfrageoptimierung und Daten-nahe Verarbeitung auf Rekonfigurierbaren SoCs für Big-Data-Analyse
      • Query-Optimierung und Near-Data-Processing auf rekonfigurierbaren SoCs für Big Data Analyse (Phase II)
    • Datenstromsysteme
    • Datenmanagement in den Digital Humanities
    • Pufferverwaltung und Datenzugriff
    • Moderne Datenbanksysteme

    Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees

    Erzeugung von Symboltabellen für die Komprimierung von Zeichenketten mit Hilfe von Frequent-Substring Trees

    (Projekt aus Eigenmitteln)

    Titel des Gesamtprojektes:
    Projektleitung: Klaus Meyer-Wegener
    Projektbeteiligte: Dominik Probst
    Projektstart: 19. September 2022
    Projektende:
    Akronym: FST
    Mittelgeber:
    URL:

    Abstract

    Mit dem andauernden Anstieg globaler Datenvolumina gewinnt die Datenbankkompression immer weiter an Relevanz. Während die Kompression numerischer Datentypen umfassend erforscht wurde, erfährt die Kompression von Zeichenketten erst neuerdings wieder verstärkte wissenschaftliche Beachtung.

    Ein vielversprechender Ansatz zur Stringkompression ist die Kompression mittels Symboltabellen, bei der wiederkehrende Substrings innerhalb einer Datenbank durch kurze Codes substituiert werden. Eine korrespondierende Tabelle ermöglicht dabei eine reibungslose Rekonstruktion der Originaldaten. Dieser Ansatz besticht durch kurze Kompressions- und Dekompressionszeiten, wobei die Kompressionsrate stark von der Qualität der Symboltabelle abhängig ist.

    Das Forschungsprojekt FST fokussiert sich auf die Erzeugung optimierter Symboltabellen zur Maximierung der Kompressionsrate. Dafür werden die namensgebenden Frequent-Substring Trees konstruiert, eine Trie-artige Datenstruktur, die alle potenziellen Tabelleneinträge abbildet und die mit Hilfe von Metadaten die Identifizierung optimaler Einträge ermöglicht.

    Das primäre Ziel des Forschungsprojektes ist die Steigerung der Kompressionsrate von Stringkompressionsverfahren, ohne die Kompressions- und Dekompressionszeiten signifikant zu beeinträchtigen.

    Publikationen

      Lehrstuhl für Informatik 6 (Datenmanagement)
      Friedrich-Alexander-Universität Erlangen-Nürnberg

      Martensstraße 3
      91058 Erlangen
      • Kontakt
      • Impressum
      • Datenschutz
      • Barrierefreiheit
      • Facebook
      • RSS Feed
      • Xing
      Nach oben