Data Profiling – Effiziente Entdeckung Struktureller Abhängigkeiten

Papenbrock, Thorsten

Data Profiling – Effiziente Entdeckung Struktureller Abhängigkeiten

dc.contributor.author	Papenbrock, Thorsten
dc.contributor.editor	Grust, Torsten
dc.contributor.editor	Naumann, Felix
dc.contributor.editor	Böhm, Alexander
dc.contributor.editor	Lehner, Wolfgang
dc.contributor.editor	Härder, Theo
dc.contributor.editor	Rahm, Erhard
dc.contributor.editor	Heuer, Andreas
dc.contributor.editor	Klettke, Meike
dc.contributor.editor	Meyer, Holger
dc.date.accessioned	2019-04-11T07:21:26Z
dc.date.available	2019-04-11T07:21:26Z
dc.date.issued	2019
dc.description.abstract	Daten sind nicht nur in der Informatik, sondern auch in vielen anderen wissenschaftlichen Disziplinen ein unverzichtbares Wirtschaftsgut. Sie dienen dem Austausch, der Verknüpfung und der Speicherung von Wissen und sind daher unverzichtbar in Forschung und Wirtschaft. Leider sind Daten häufig nicht ausreichend dokumentiert um sie direkt nutzen zu können – es fehlen Metadaten, welche die Struktur und damit Zugriffsmuster der digitalen Informationen beschreiben. Informatiker und Experten anderer Disziplinen verbringen daher viel Zeit damit, Daten strukturell zu analysieren und aufzubereiten. Da die Suche nach Metadaten jedoch eine hoch komplexe Aufgabe ist, scheitern viele algorithmische Ansätze schon an kleinen Datenmengen. In der Dissertation, die dieser Zusammenfassung zugrunde liegt, stellen wir drei neuartige Ent-deckungsalgorithmen für wichtige und zugleich schwierig zu findende Typen von Metadaten vor: Eindeutige Spaltenkombinationen, funktionale Abhängigkeiten und Inklusionsabhängigkeiten. Die vorgeschlagenen Algorithmen übertreffen deutlich den bisherigen Stand der Technik in Laufzeit und Ressourcenverbrauch und ermöglichen so die Nutzbarmachung von erheblich größeren Datensätzen. Da die Anwendung solcher Algorithmen für fachfremde Nutzer nicht einfach ist, entwickeln wir zusätzlich das Programm Metanome zur intuitiven Datenanalyse. Metanome bietet dabei nicht nur die in dieser Arbeit vorgeschlagenen Algorithmen an, sondern auch Entdeckungsalgorithmen für andere Typen von Metadaten. Am Anwendungsfall der Schema-Normalisierung demonstrieren wir schließlich, wie die gefundenen Metadaten effektiv genutzt werden können.	de
dc.identifier.doi	10.18420/btw2019-28
dc.identifier.isbn	978-3-88579-683-1
dc.identifier.pissn	1617-5468
dc.identifier.uri	https://dl.gi.de/handle/20.500.12116/21713
dc.language.iso	de
dc.publisher	Gesellschaft für Informatik, Bonn
dc.relation.ispartof	BTW 2019
dc.relation.ispartofseries	Lecture Notes in Informatics (LNI) – Proceedings, Volume P-289
dc.title	Data Profiling – Effiziente Entdeckung Struktureller Abhängigkeiten	de
gi.citation.endPage	476
gi.citation.startPage	467
gi.conference.date	4.-8. März 2019
gi.conference.location	Rostock
gi.conference.sessiontitle	Dissertationspreise

Dateien

Originalbündel

1 - 1 von 1

Name:: D1-1.pdf
Größe:: 1.16 MB
Format:: Adobe Portable Document Format

Herunterladen

Sammlungen

P289 - BTW2019 - Datenbanksysteme für Business, Technologie und Web