Logo des Repositoriums
 

Datenbank Spektrum 13(2) - Juli 2013

Autor*innen mit den meisten Dokumenten  

Auflistung nach:

Neueste Veröffentlichungen

1 - 10 von 12
  • Zeitschriftenartikel
    Improving RDF Data Through Association Rule Mining
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Abedjan, Ziawasch; Naumann, Felix
    Linked Open Data comprises very many and often large public data sets, which are mostly presented in the Rdf triple structure of subject, predicate, and object. However, the heterogeneity of available open data requires significant integration steps before it can be used in applications. A promising and novel technique to explore such data is the use of association rule mining. We introduce “mining configurations”, which allow us to mine Rdf data sets in various ways. Different configurations enable us to identify schema and value dependencies that in combination result in interesting use cases. We present rule-based approaches for predicate suggestion, data enrichment, ontology improvement, and query relaxation. On the one hand we prevent inconsistencies in the data through predicate suggestion, enrichment with missing facts, and alignment of the corresponding ontology. On the other hand we support users to handle inconsistencies during query formulation through predicate expansion techniques. Based on these approaches, we show that association rule mining benefits the integration and usability of Rdf data.
  • Zeitschriftenartikel
    Der Lehrstuhl Datenbanken an der Universität Leipzig
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Rahm, Erhard
    Der Lehrstuhl Datenbanken an der Universität Leipzig befasst sich schwerpunktmäßig mit automatisierten Verfahren zur Integration und Analyse großer Mengen heterogener Daten, v.a. aus dem Web. Im Zusammenhang mit “Big Data” werden unterschiedlichste Hochleistungsstrategien verfolgt, u.a. Skew-resistente Lastbalancierungsmethoden für MapReduce sowie die Nutzung moderner Grafikprozessoren (GPUs). Zum Matching von Modellen (Schemas, Ontologien) und von Instanzdaten wurden leistungsfähige Verfahren und mehrere Prototypen entwickelt. Untersucht werden ferner Methoden zur Evolution von Ontologien und Mappings, um die Auswirkungen von Ontologieänderungen zu minimieren. Der Bericht gibt nach einer Einleitung zur Entwicklung des Lehrstuhls einen Überblick zu den aktuellen Forschungsthemen. Angaben zum Lehrprofil runden die Darstellung ab.
  • Zeitschriftenartikel
    Was lange währt, wird endlich gut: Temporale Daten im SQL-Standard
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Petković, Dušan
    Nach vielen Jahren Arbeit hat das Normierungsgremium die Spezifikation von temporalen Daten im neuesten SQL-Standard verabschiedet. Sie hat ihren Ursprung in früheren Vorschlägen, die aus mehreren verschiedenen Quellen stammen. Der wichtigste Unterschied zu den früheren Planungen ist, dass sich die ganze Spezifikation innerhalb des zweiten Teils des SQL-Standards („SQL/Foundations“) und nicht in einem separaten Teil befindet. (Das ist auch gut so, weil das Standardisierungsgremium eine nicht sehr komplexe Spezifikation erstellt hat, wie man aus dem letzten Abschnitt dieses Artikels sehen kann.)In diesem Artikel werden die Erweiterungen des SQL-Standards in Bezug auf temporale Daten beschrieben. Zuerst werden die so genannten „application-time period tables“ erläutert und ihre möglichen Anwendungen in der Praxis gezeigt. Die zweite generelle Erweiterung, systemversionierte Tabellen, wird auf ähnliche Art und Weise dargestellt. Am Ende des Artikels wird eine kritische Stellungnahme zur vorliegenden Spezifikation gemacht, und die wichtigsten, noch fehlenden temporalen Eigenschaften werden vorgestellt.
  • Zeitschriftenartikel
    Editorial
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Freytag, Johann-Christoph; Mitschang, Bernhard
  • Zeitschriftenartikel
    News
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013)
  • Zeitschriftenartikel
    BTW 2013 – Zwischen wissenschaftlicher Geschichte und moderner Herausforderung
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Köppen, Veit; Schäler, Martin; Grebhahn, Alexander; Saake, Gunter
  • Zeitschriftenartikel
    Effiziente Verarbeitung allgemeiner Anfragen in RDF Triple-Stores
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Brodt, Andreas; Mitschang, Bernhard
    RDF erfreut sich als Datenformat wachsender Beliebtheit aufgrund seiner Fähigkeit, (semi-)strukturierte Daten ohne vordefiniertes Datenbankschema verwalten zu können. Das Gros der Forschung im Bereich RDF-Datenbanken konzentrierte sich bislang auf die Suche komplexer Graphmuster, die Ressourcen anhand ihrer Beziehungen identifizieren. Eine „Record-orientierte“ Sicht auf die Attribute der Ressourcen, wie von RDBMS gewohnt, ist hierbei oft ineffizient, da die einzelnen Attribute erst zu Records verbunden werden müssen. Außerdem sind RDF-Datenbanken oft auf die Suche exakter Graphmuster optimiert, was wertbasiertes Suchen mit beliebigen Vergleichsoperatoren erschwert.Wir stellen einen Ansatz vor, der die Attributwerte von Ressourcen in RDF-Datenbanken effizient ermittelt, ohne die Effizienz der komplexen Graphmustersuche zu kompromittieren. Hierzu bestimmen wir zuerst die Ressourcen, die der Anfrage entsprechen, und laden dann alle ihre Attributwerte gleichzeitig, unter Ausnutzung zusammenhängender Speicherbereiche. Außerdem stellen wir am Beispiel von Geodaten vor, wie domänenspezifische Indexe in RDF-Datenbanken integriert werden können, um wertbasierte Anfrageprädikate effizient auszuführen.
  • Zeitschriftenartikel
    An Overview on Execution Strategies for Linked Data Queries
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Hartig, Olaf
    The publication of Linked Open Data on the Web has gained tremendous momentum over the last five years. This development makes possible (and interesting) the execution of queries using up-to-date data from multiple, automatically discovered data sources. As a result, we currently witness the emergence of a new research area that focuses on an online execution of Linked Data queries; i.e. queries that range over data that is made available using the Linked Data publishing principles.This article provides a general overview on this new area. In particular, we introduce the specific challenges that need to be addressed and then focus on possible strategies for executing Linked Data queries. Furthermore, we classify approaches proposed in the literature w.r.t. these strategies.
  • Zeitschriftenartikel
    Extraktion, Mapping und Verlinkung von Daten im Web
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013) Auer, Sören; Lehmann, Jens; Ngonga Ngomo, Axel-Cyrille; Stadler, Claus; Unbehauen, Jörg
    In diesem Artikel geben wir einen Überblick über verschiedene Herausforderungen des Managements von Linked Data im Web. Mit der DBpedia Wissensextraktion aus Wikipedia, dem skalierbaren Linking von Wissensbasen und dem Mapping relationaler Daten nach RDF stellen wir drei Ansätze vor, die zentrale Phasen des Lebenszyklus von Daten im Web ausmachen.
  • Zeitschriftenartikel
    Dissertationen
    (Datenbank-Spektrum: Vol. 13, No. 2, 2013)