Logo des Repositoriums
 

Data Profiling – Effiziente Entdeckung Struktureller Abhängigkeiten

dc.contributor.authorPapenbrock, Thorsten
dc.contributor.editorGrust, Torsten
dc.contributor.editorNaumann, Felix
dc.contributor.editorBöhm, Alexander
dc.contributor.editorLehner, Wolfgang
dc.contributor.editorHärder, Theo
dc.contributor.editorRahm, Erhard
dc.contributor.editorHeuer, Andreas
dc.contributor.editorKlettke, Meike
dc.contributor.editorMeyer, Holger
dc.date.accessioned2019-04-11T07:21:26Z
dc.date.available2019-04-11T07:21:26Z
dc.date.issued2019
dc.description.abstractDaten sind nicht nur in der Informatik, sondern auch in vielen anderen wissenschaftlichen Disziplinen ein unverzichtbares Wirtschaftsgut. Sie dienen dem Austausch, der Verknüpfung und der Speicherung von Wissen und sind daher unverzichtbar in Forschung und Wirtschaft. Leider sind Daten häufig nicht ausreichend dokumentiert um sie direkt nutzen zu können – es fehlen Metadaten, welche die Struktur und damit Zugriffsmuster der digitalen Informationen beschreiben. Informatiker und Experten anderer Disziplinen verbringen daher viel Zeit damit, Daten strukturell zu analysieren und aufzubereiten. Da die Suche nach Metadaten jedoch eine hoch komplexe Aufgabe ist, scheitern viele algorithmische Ansätze schon an kleinen Datenmengen. In der Dissertation, die dieser Zusammenfassung zugrunde liegt, stellen wir drei neuartige Ent-deckungsalgorithmen für wichtige und zugleich schwierig zu findende Typen von Metadaten vor: Eindeutige Spaltenkombinationen, funktionale Abhängigkeiten und Inklusionsabhängigkeiten. Die vorgeschlagenen Algorithmen übertreffen deutlich den bisherigen Stand der Technik in Laufzeit und Ressourcenverbrauch und ermöglichen so die Nutzbarmachung von erheblich größeren Datensätzen. Da die Anwendung solcher Algorithmen für fachfremde Nutzer nicht einfach ist, entwickeln wir zusätzlich das Programm Metanome zur intuitiven Datenanalyse. Metanome bietet dabei nicht nur die in dieser Arbeit vorgeschlagenen Algorithmen an, sondern auch Entdeckungsalgorithmen für andere Typen von Metadaten. Am Anwendungsfall der Schema-Normalisierung demonstrieren wir schließlich, wie die gefundenen Metadaten effektiv genutzt werden können.de
dc.identifier.doi10.18420/btw2019-28
dc.identifier.isbn978-3-88579-683-1
dc.identifier.pissn1617-5468
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/21713
dc.language.isode
dc.publisherGesellschaft für Informatik, Bonn
dc.relation.ispartofBTW 2019
dc.relation.ispartofseriesLecture Notes in Informatics (LNI) – Proceedings, Volume P-289
dc.titleData Profiling – Effiziente Entdeckung Struktureller Abhängigkeitende
gi.citation.endPage476
gi.citation.startPage467
gi.conference.date4.-8. März 2019
gi.conference.locationRostock
gi.conference.sessiontitleDissertationspreise

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
D1-1.pdf
Größe:
1.16 MB
Format:
Adobe Portable Document Format