Autor*innen mit den meisten Dokumenten
Neueste Veröffentlichungen
- ZeitschriftenartikelGenerierung des Datenzugriffs in Anwendungsprogrammen(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Schwarz, HolgerDatenzugriffe auf externe und heterogene Datenbestände sind ein grundlegender Bestandteil von Anwendungsprogrammen in ganz unterschiedlichen Anwendungsbereichen. Vielfach können diese Datenzugriffe nicht über statisch eingebettete Anweisungen realisiert werden, sondern müssen dynamisch generiert werden. In diesem Beitrag wird das Spektrum relevanter Anwendungsbereiche vorgestellt. Ausgehend von einzelnen Systembeispielen werden wichtige Aspekte anfragegenerierender Systeme verallgemeinert. Hierzu wird eine Systemklassifikation vorgestellt und die Bedeutung der Klassifikation insbesondere für Optimierungsaspekte erläutert. Ferner werden drei grundlegende Implementierungskonzepte für anfragegenerierende Systeme vorgestellt und deren Eignung für einzelne Anwendungsklassen diskutiert.
- ZeitschriftenartikelBericht zur Herbstschule Information Retrieval 2010(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Metzger, Steffen; Hose, Katja; Broschart, Andreas
- ZeitschriftenartikelDas Sombi-Framework zum Ermitteln geeigneter Suchfunktionen für biologische Modelldatenbasen(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Waltemath, Dagmar; Henkel, Ron; Meyer, Holger; Heuer, AndreasDie Wiederverwendung von Simulationsmodellen biologischer Systeme ist mit der ansteigenden Zahl der in Modelldatenbanken gespeicherten Modelle zu einem wichtigen Forschungsproblem geworden. Ein Teilproblem ist die effiziente Suche nach relevanten Modellen in einer Datenbasis. Als Lösungsansatz wurde kürzlich die Nutzung von Information-Retrieval-Techniken für das bewertete Finden von Modellen vorgestellt.Die im Folgenden beschriebene Software stellt Anwendungsentwicklern ein Framework zur Evaluation verschiedener Retrieval- und Rankingfunktionen unter Nutzung unterschiedlicher Datenbasen zur Verfügung. Der modulare Aufbau des Frameworks ermöglicht die Unterstützung weiterer XML-basierter Beschreibungsformate sowie das Einbinden zusätzlicher Funktionen. Voraussetzungen für die Verwendung des Frameworks sind die Kodierung der Simulationsmodelle in einem XML-basierten Standard-Repräsentationsformat sowie die Verfügbarkeit von semantischen Modellinformationen, z.B. in Form von in Ontologien kodierten Meta-Informationen. Sombi wurde als Evaluationswerkzeug für Datenbankentwickler im Bereich der Modellspeicherung in der Systembiologie entwickelt. Eine Verwendung des Frameworks auf anderen Anwendungsgebieten ist jedoch vorstellbar.
- ZeitschriftenartikelEditorial(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Härder, Theo; Schenkel, Ralf
- ZeitschriftenartikelNews(Datenbank-Spektrum: Vol. 11, No. 1, 2011)
- ZeitschriftenartikelOptimierungstechniken in Column Stores(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Fekete, DavidColumn Stores als spaltenbasierte Datenbankmanagementsysteme (DBMS) sind als Alternative zu zeilenbasierten DBMS für Anwendungen in den Bereichen Data Warehousing (DWH) und Business Intelligence (BI) in den Fokus gerückt. Mittlerweile sind mehrere Systeme am Markt vorhanden, die insbesondere das Leistungsverhalten der in DWH vorherrschenden Leseanfragen optimieren sollen. In diesem Beitrag wird gezeigt, welche Optimierungstechniken zusätzlich bei Columns Stores auf welchen Ebenen mit wie großem Effekt eingesetzt werden können. Einer Beschreibung und Analyse einer Auswahl dieser Techniken folgt die Präsentation einer empirischen Evaluation letzterer in einem kommerziellen Column-Store-DBMS anhand des auf DWH ausgelegten Star Schema Benchmark (SSB).
- ZeitschriftenartikelSelf-Tuning for Short-Term Memory Consumers(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Overbeck, Ludger C.; Schmidt, KarstenWe present an approach to adequately consider short-term memory consumers when using self-tuning buffer techniques. For instance, sort operations often need (large) amounts of memory but only for a short time. Moreover, certain operators, e.g., joins, require (lots of) memory to produce results that are retrieved only once. Unfortunately, most traditional self-tuning techniques fail to observe those peaks, as they need to monitor a system for a while before tuning it, which is often too late.
- ZeitschriftenartikelAnduIN: Anwendungsentwicklung für drahtlose Sensornetzwerke(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Klan, Daniel; Sattler, Kai-UweEine der größten Herausforderung bei der Anwendungsentwicklung für drahtlose Sensornetzwerke ist der effiziente Umgang mit den oftmals stark beschränkten Ressourcen. Die Entwicklung neuer Systeme gestaltet sich entsprechend aufwendig und teuer. In der vorliegenden Arbeit soll mit AnduIN ein Ansatz gezeigt werden, welcher die Entwicklung entsprechender Lösungen dahingehend vereinfacht, dass lediglich die Zielstellung beschrieben werden muss. Das System analysiert diese und entscheidet selbstständig, welche Funktionen in welcher Form zu realisieren sind.
- ZeitschriftenartikelAn Efficient Blocking Technique for Reference Matching using MapReduce(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Paradies, MarcusDocument Clustering has become an increasingly important task in the area of data mining and information retrieval. With growing data volumes, CPU—and memory-efficient techniques for clustering algorithms are receiving considerable attention in the research community. To deal with huge amounts of data (e.g., documents from Wikipedia or CiteSeerX which are several GB in size), distributed clustering techniques have been designed to provide scalable and flexible approaches. We study the problem of document clustering in the area of Entity Matching, where documents from various data sources are matched together. More specifically, we focus on a common optimization technique called blocking which reduces the enormous search space by clustering the data sources into smaller groups and processes comparisons only within a group. In this article, we describe our experiences and findings in applying the MapReduce framework to deal with huge bibliographic data sets and to provide a flexible, scalable and easy-to-use blocking technique to reduce the search space for Entity Matching.
- ZeitschriftenartikelRDF-Stores und RDF-Query-Engines(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Neumann, Thomas; Weikum, GerhardRDF ist das Datenmodell der Semantic-Web- und Linked-Data-Initiativen, das zunehmend Verbreitung findet. Es zeichnet sich durch feinkörnige Strukturierungsmöglichkeiten in Form binärer Relationen und durch flexible Typisierung ohne die Notwendigkeit eines präskriptiven Schemas aus.Aus diesen Gründen sind die effiziente Speicherung und Anfrageauswertung auf RDF-Datenkollektionen schwierige Forschungsthemen. Dieser Artikel gibt einen Überblick über verschiedene Alternativen zur Speicherung von RDF-Daten und diskutiert kurz die Probleme, die sich für die Indexierung sowie Anfrageoptimmierung und -ausführung ergeben.