Datenbank Spektrum 11(1) - März 2011

https://dl.gi.de/handle/20.500.12116/11558

Auflistung nach:

1 - 10 von 13

Zeitschriftenartikel
An Efficient Blocking Technique for Reference Matching using MapReduce
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Paradies, Marcus
Document Clustering has become an increasingly important task in the area of data mining and information retrieval. With growing data volumes, CPU—and memory-efficient techniques for clustering algorithms are receiving considerable attention in the research community. To deal with huge amounts of data (e.g., documents from Wikipedia or CiteSeerX which are several GB in size), distributed clustering techniques have been designed to provide scalable and flexible approaches. We study the problem of document clustering in the area of Entity Matching, where documents from various data sources are matched together. More specifically, we focus on a common optimization technique called blocking which reduces the enormous search space by clustering the data sources into smaller groups and processes comparisons only within a group. In this article, we describe our experiences and findings in applying the MapReduce framework to deal with huge bibliographic data sets and to provide a flexible, scalable and easy-to-use blocking technique to reduce the search space for Entity Matching.
Zeitschriftenartikel
AnduIN: Anwendungsentwicklung für drahtlose Sensornetzwerke
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Klan, Daniel; Sattler, Kai-Uwe
Eine der größten Herausforderung bei der Anwendungsentwicklung für drahtlose Sensornetzwerke ist der effiziente Umgang mit den oftmals stark beschränkten Ressourcen. Die Entwicklung neuer Systeme gestaltet sich entsprechend aufwendig und teuer. In der vorliegenden Arbeit soll mit AnduIN ein Ansatz gezeigt werden, welcher die Entwicklung entsprechender Lösungen dahingehend vereinfacht, dass lediglich die Zielstellung beschrieben werden muss. Das System analysiert diese und entscheidet selbstständig, welche Funktionen in welcher Form zu realisieren sind.
Zeitschriftenartikel
Bericht zur Herbstschule Information Retrieval 2010
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Metzger, Steffen; Hose, Katja; Broschart, Andreas
Zeitschriftenartikel
Das Sombi-Framework zum Ermitteln geeigneter Suchfunktionen für biologische Modelldatenbasen
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Waltemath, Dagmar; Henkel, Ron; Meyer, Holger; Heuer, Andreas
Die Wiederverwendung von Simulationsmodellen biologischer Systeme ist mit der ansteigenden Zahl der in Modelldatenbanken gespeicherten Modelle zu einem wichtigen Forschungsproblem geworden. Ein Teilproblem ist die effiziente Suche nach relevanten Modellen in einer Datenbasis. Als Lösungsansatz wurde kürzlich die Nutzung von Information-Retrieval-Techniken für das bewertete Finden von Modellen vorgestellt.Die im Folgenden beschriebene Software stellt Anwendungsentwicklern ein Framework zur Evaluation verschiedener Retrieval- und Rankingfunktionen unter Nutzung unterschiedlicher Datenbasen zur Verfügung. Der modulare Aufbau des Frameworks ermöglicht die Unterstützung weiterer XML-basierter Beschreibungsformate sowie das Einbinden zusätzlicher Funktionen. Voraussetzungen für die Verwendung des Frameworks sind die Kodierung der Simulationsmodelle in einem XML-basierten Standard-Repräsentationsformat sowie die Verfügbarkeit von semantischen Modellinformationen, z.B. in Form von in Ontologien kodierten Meta-Informationen. Sombi wurde als Evaluationswerkzeug für Datenbankentwickler im Bereich der Modellspeicherung in der Systembiologie entwickelt. Eine Verwendung des Frameworks auf anderen Anwendungsgebieten ist jedoch vorstellbar.
Zeitschriftenartikel
Dissertationen
(Datenbank-Spektrum: Vol. 11, No. 1, 2011)
Zeitschriftenartikel
Editorial
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Härder, Theo; Schenkel, Ralf
Zeitschriftenartikel
Generierung des Datenzugriffs in Anwendungsprogrammen
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Schwarz, Holger
Datenzugriffe auf externe und heterogene Datenbestände sind ein grundlegender Bestandteil von Anwendungsprogrammen in ganz unterschiedlichen Anwendungsbereichen. Vielfach können diese Datenzugriffe nicht über statisch eingebettete Anweisungen realisiert werden, sondern müssen dynamisch generiert werden. In diesem Beitrag wird das Spektrum relevanter Anwendungsbereiche vorgestellt. Ausgehend von einzelnen Systembeispielen werden wichtige Aspekte anfragegenerierender Systeme verallgemeinert. Hierzu wird eine Systemklassifikation vorgestellt und die Bedeutung der Klassifikation insbesondere für Optimierungsaspekte erläutert. Ferner werden drei grundlegende Implementierungskonzepte für anfragegenerierende Systeme vorgestellt und deren Eignung für einzelne Anwendungsklassen diskutiert.
Zeitschriftenartikel
Kurz erklärt: Datenfusion
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Bleiholder, Jens; Naumann, Felix
Zeitschriftenartikel
News
(Datenbank-Spektrum: Vol. 11, No. 1, 2011)
Zeitschriftenartikel
Optimierungstechniken in Column Stores
(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Fekete, David
Column Stores als spaltenbasierte Datenbankmanagementsysteme (DBMS) sind als Alternative zu zeilenbasierten DBMS für Anwendungen in den Bereichen Data Warehousing (DWH) und Business Intelligence (BI) in den Fokus gerückt. Mittlerweile sind mehrere Systeme am Markt vorhanden, die insbesondere das Leistungsverhalten der in DWH vorherrschenden Leseanfragen optimieren sollen. In diesem Beitrag wird gezeigt, welche Optimierungstechniken zusätzlich bei Columns Stores auf welchen Ebenen mit wie großem Effekt eingesetzt werden können. Einer Beschreibung und Analyse einer Auswahl dieser Techniken folgt die Präsentation einer empirischen Evaluation letzterer in einem kommerziellen Column-Store-DBMS anhand des auf DWH ausgelegten Star Schema Benchmark (SSB).

Auflistung Datenbank Spektrum 11(1) - März 2011 nach Titel

Treffer pro Seite

Sortieroptionen