Autor*innen mit den meisten Dokumenten
Neueste Veröffentlichungen
- ZeitschriftenartikelNews(Datenbank-Spektrum: Vol. 13, No. 2, 2013)
- ZeitschriftenartikelDer Lehrstuhl Datenbanken an der Universität Leipzig(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Rahm, ErhardDer Lehrstuhl Datenbanken an der Universität Leipzig befasst sich schwerpunktmäßig mit automatisierten Verfahren zur Integration und Analyse großer Mengen heterogener Daten, v.a. aus dem Web. Im Zusammenhang mit “Big Data” werden unterschiedlichste Hochleistungsstrategien verfolgt, u.a. Skew-resistente Lastbalancierungsmethoden für MapReduce sowie die Nutzung moderner Grafikprozessoren (GPUs). Zum Matching von Modellen (Schemas, Ontologien) und von Instanzdaten wurden leistungsfähige Verfahren und mehrere Prototypen entwickelt. Untersucht werden ferner Methoden zur Evolution von Ontologien und Mappings, um die Auswirkungen von Ontologieänderungen zu minimieren. Der Bericht gibt nach einer Einleitung zur Entwicklung des Lehrstuhls einen Überblick zu den aktuellen Forschungsthemen. Angaben zum Lehrprofil runden die Darstellung ab.
- ZeitschriftenartikelWas lange währt, wird endlich gut: Temporale Daten im SQL-Standard(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Petković, DušanNach vielen Jahren Arbeit hat das Normierungsgremium die Spezifikation von temporalen Daten im neuesten SQL-Standard verabschiedet. Sie hat ihren Ursprung in früheren Vorschlägen, die aus mehreren verschiedenen Quellen stammen. Der wichtigste Unterschied zu den früheren Planungen ist, dass sich die ganze Spezifikation innerhalb des zweiten Teils des SQL-Standards („SQL/Foundations“) und nicht in einem separaten Teil befindet. (Das ist auch gut so, weil das Standardisierungsgremium eine nicht sehr komplexe Spezifikation erstellt hat, wie man aus dem letzten Abschnitt dieses Artikels sehen kann.)In diesem Artikel werden die Erweiterungen des SQL-Standards in Bezug auf temporale Daten beschrieben. Zuerst werden die so genannten „application-time period tables“ erläutert und ihre möglichen Anwendungen in der Praxis gezeigt. Die zweite generelle Erweiterung, systemversionierte Tabellen, wird auf ähnliche Art und Weise dargestellt. Am Ende des Artikels wird eine kritische Stellungnahme zur vorliegenden Spezifikation gemacht, und die wichtigsten, noch fehlenden temporalen Eigenschaften werden vorgestellt.
- ZeitschriftenartikelEditorial(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Freytag, Johann-Christoph; Mitschang, Bernhard
- ZeitschriftenartikelEffiziente Verarbeitung allgemeiner Anfragen in RDF Triple-Stores(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Brodt, Andreas; Mitschang, BernhardRDF erfreut sich als Datenformat wachsender Beliebtheit aufgrund seiner Fähigkeit, (semi-)strukturierte Daten ohne vordefiniertes Datenbankschema verwalten zu können. Das Gros der Forschung im Bereich RDF-Datenbanken konzentrierte sich bislang auf die Suche komplexer Graphmuster, die Ressourcen anhand ihrer Beziehungen identifizieren. Eine „Record-orientierte“ Sicht auf die Attribute der Ressourcen, wie von RDBMS gewohnt, ist hierbei oft ineffizient, da die einzelnen Attribute erst zu Records verbunden werden müssen. Außerdem sind RDF-Datenbanken oft auf die Suche exakter Graphmuster optimiert, was wertbasiertes Suchen mit beliebigen Vergleichsoperatoren erschwert.Wir stellen einen Ansatz vor, der die Attributwerte von Ressourcen in RDF-Datenbanken effizient ermittelt, ohne die Effizienz der komplexen Graphmustersuche zu kompromittieren. Hierzu bestimmen wir zuerst die Ressourcen, die der Anfrage entsprechen, und laden dann alle ihre Attributwerte gleichzeitig, unter Ausnutzung zusammenhängender Speicherbereiche. Außerdem stellen wir am Beispiel von Geodaten vor, wie domänenspezifische Indexe in RDF-Datenbanken integriert werden können, um wertbasierte Anfrageprädikate effizient auszuführen.
- ZeitschriftenartikelImproving RDF Data Through Association Rule Mining(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Abedjan, Ziawasch; Naumann, FelixLinked Open Data comprises very many and often large public data sets, which are mostly presented in the Rdf triple structure of subject, predicate, and object. However, the heterogeneity of available open data requires significant integration steps before it can be used in applications. A promising and novel technique to explore such data is the use of association rule mining. We introduce “mining configurations”, which allow us to mine Rdf data sets in various ways. Different configurations enable us to identify schema and value dependencies that in combination result in interesting use cases. We present rule-based approaches for predicate suggestion, data enrichment, ontology improvement, and query relaxation. On the one hand we prevent inconsistencies in the data through predicate suggestion, enrichment with missing facts, and alignment of the corresponding ontology. On the other hand we support users to handle inconsistencies during query formulation through predicate expansion techniques. Based on these approaches, we show that association rule mining benefits the integration and usability of Rdf data.
- ZeitschriftenartikelBTW 2013 – Zwischen wissenschaftlicher Geschichte und moderner Herausforderung(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Köppen, Veit; Schäler, Martin; Grebhahn, Alexander; Saake, Gunter
- ZeitschriftenartikelBericht zur Herbstschule „Information Retrieval“ 2012(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Reinel, Dirk
- ZeitschriftenartikelDissertationen(Datenbank-Spektrum: Vol. 13, No. 2, 2013)
- ZeitschriftenartikelThe Linked Data Benchmark Council Project(Datenbank-Spektrum: Vol. 13, No. 2, 2013) Boncz, Peter; Fundulaki, Irini; Gubichev, Andrey; Larriba-Pey, Josep; Neumann, ThomasDespite the fast growth and increasing popularity, the broad field of RDF and Graph database systems lacks an independent authority for developing benchmarks, and for neutrally assessing benchmark results through industry-strength auditing which would allow to quantify and compare the performance of existing and emerging systems.Inspired by the impact of the Transaction Processing Performance Council (TPC) Benchmarks on relational databases, the LDBC consortium formed by University and Industry researchers and practitioners has recently launched a European Commision sponsored project that will offer the first comprehensive set of open and vendor-independent benchmarks for RDF and Graph technologies. The consortium will incorporate the Linked Data Benchmark Council (LDBC) which will survive the project and will supervise the process of obtaining and reporting results as well as fostering the creation and maintenance of new and existing benchmarks. This paper describes the state-of-the-art benchmarks in RDF and Graph databases and overviews the technical challenges that should be addressed in the development of such benchmarks. With this paper we would like to invite the readers to participate in the LDBC effort towards the development of Linked Data Benchmarks, both from the user prospective (by sharing available usage scenarios, datasets, query workloads) and the vendor perspective (by reporting the results of systems and research prototypes).