Textdokument
Datenintegration zur Anfragezeit.
Lade...
Volltext URI
Dokumententyp
Dateien
Zusatzinformation
Datum
2015
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik
Zusammenfassung
In der Big-Data-Ära werden neue Daten oft in einer Geschwindigkeit gesammelt, die klassische Integration mit statischen ETL-Prozessen und globalen Schemata nicht mehr erlaubt. Diese Arbeit stellt das Prinzip der Datenintegration zur Anfragezeit vor, das darauf abzielt, zur Laufzeit einer Datenbankanfrage zusätzliche externe Datenquelle zu integrieren, und diese direkt im Anfrageergebnis darzustellen. Um dieses Ziel zu erreichen, wurde eine Reihe neuer Methoden, Algorithmen und Systeme entwickelt. An erster Stelle steht ein Top-k-Entity-Augmentation-System, das es ermöglicht, einen Datensatz ad hoc um neue Attribute zu erweitern. Darauf aufbauend wurde ein Datenbanksystem weiterentwickelt, das sogenannte Open-World-SQL-Anfragen verarbeitet, also Anfragen die über das definierte Schema hinausgehen. Die letzte Komponente ist ein Datenkurationssystem, das darauf zielt, die individuelle Nachnutzbarkeit heterogener Datenbestände für die Ad-hoc-Integration zu erhöhen, ohne jedoch ein zentrales Schema vorauszusetzen.