Auflistung Datenbank Spektrum 11(1) - März 2011 nach Titel
1 - 10 von 13
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelAn Efficient Blocking Technique for Reference Matching using MapReduce(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Paradies, MarcusDocument Clustering has become an increasingly important task in the area of data mining and information retrieval. With growing data volumes, CPU—and memory-efficient techniques for clustering algorithms are receiving considerable attention in the research community. To deal with huge amounts of data (e.g., documents from Wikipedia or CiteSeerX which are several GB in size), distributed clustering techniques have been designed to provide scalable and flexible approaches. We study the problem of document clustering in the area of Entity Matching, where documents from various data sources are matched together. More specifically, we focus on a common optimization technique called blocking which reduces the enormous search space by clustering the data sources into smaller groups and processes comparisons only within a group. In this article, we describe our experiences and findings in applying the MapReduce framework to deal with huge bibliographic data sets and to provide a flexible, scalable and easy-to-use blocking technique to reduce the search space for Entity Matching.
- ZeitschriftenartikelAnduIN: Anwendungsentwicklung für drahtlose Sensornetzwerke(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Klan, Daniel; Sattler, Kai-UweEine der größten Herausforderung bei der Anwendungsentwicklung für drahtlose Sensornetzwerke ist der effiziente Umgang mit den oftmals stark beschränkten Ressourcen. Die Entwicklung neuer Systeme gestaltet sich entsprechend aufwendig und teuer. In der vorliegenden Arbeit soll mit AnduIN ein Ansatz gezeigt werden, welcher die Entwicklung entsprechender Lösungen dahingehend vereinfacht, dass lediglich die Zielstellung beschrieben werden muss. Das System analysiert diese und entscheidet selbstständig, welche Funktionen in welcher Form zu realisieren sind.
- ZeitschriftenartikelBericht zur Herbstschule Information Retrieval 2010(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Metzger, Steffen; Hose, Katja; Broschart, Andreas
- ZeitschriftenartikelDas Sombi-Framework zum Ermitteln geeigneter Suchfunktionen für biologische Modelldatenbasen(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Waltemath, Dagmar; Henkel, Ron; Meyer, Holger; Heuer, AndreasDie Wiederverwendung von Simulationsmodellen biologischer Systeme ist mit der ansteigenden Zahl der in Modelldatenbanken gespeicherten Modelle zu einem wichtigen Forschungsproblem geworden. Ein Teilproblem ist die effiziente Suche nach relevanten Modellen in einer Datenbasis. Als Lösungsansatz wurde kürzlich die Nutzung von Information-Retrieval-Techniken für das bewertete Finden von Modellen vorgestellt.Die im Folgenden beschriebene Software stellt Anwendungsentwicklern ein Framework zur Evaluation verschiedener Retrieval- und Rankingfunktionen unter Nutzung unterschiedlicher Datenbasen zur Verfügung. Der modulare Aufbau des Frameworks ermöglicht die Unterstützung weiterer XML-basierter Beschreibungsformate sowie das Einbinden zusätzlicher Funktionen. Voraussetzungen für die Verwendung des Frameworks sind die Kodierung der Simulationsmodelle in einem XML-basierten Standard-Repräsentationsformat sowie die Verfügbarkeit von semantischen Modellinformationen, z.B. in Form von in Ontologien kodierten Meta-Informationen. Sombi wurde als Evaluationswerkzeug für Datenbankentwickler im Bereich der Modellspeicherung in der Systembiologie entwickelt. Eine Verwendung des Frameworks auf anderen Anwendungsgebieten ist jedoch vorstellbar.
- ZeitschriftenartikelDissertationen(Datenbank-Spektrum: Vol. 11, No. 1, 2011)
- ZeitschriftenartikelEditorial(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Härder, Theo; Schenkel, Ralf
- ZeitschriftenartikelGenerierung des Datenzugriffs in Anwendungsprogrammen(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Schwarz, HolgerDatenzugriffe auf externe und heterogene Datenbestände sind ein grundlegender Bestandteil von Anwendungsprogrammen in ganz unterschiedlichen Anwendungsbereichen. Vielfach können diese Datenzugriffe nicht über statisch eingebettete Anweisungen realisiert werden, sondern müssen dynamisch generiert werden. In diesem Beitrag wird das Spektrum relevanter Anwendungsbereiche vorgestellt. Ausgehend von einzelnen Systembeispielen werden wichtige Aspekte anfragegenerierender Systeme verallgemeinert. Hierzu wird eine Systemklassifikation vorgestellt und die Bedeutung der Klassifikation insbesondere für Optimierungsaspekte erläutert. Ferner werden drei grundlegende Implementierungskonzepte für anfragegenerierende Systeme vorgestellt und deren Eignung für einzelne Anwendungsklassen diskutiert.
- ZeitschriftenartikelKurz erklärt: Datenfusion(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Bleiholder, Jens; Naumann, Felix
- ZeitschriftenartikelNews(Datenbank-Spektrum: Vol. 11, No. 1, 2011)
- ZeitschriftenartikelOptimierungstechniken in Column Stores(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Fekete, DavidColumn Stores als spaltenbasierte Datenbankmanagementsysteme (DBMS) sind als Alternative zu zeilenbasierten DBMS für Anwendungen in den Bereichen Data Warehousing (DWH) und Business Intelligence (BI) in den Fokus gerückt. Mittlerweile sind mehrere Systeme am Markt vorhanden, die insbesondere das Leistungsverhalten der in DWH vorherrschenden Leseanfragen optimieren sollen. In diesem Beitrag wird gezeigt, welche Optimierungstechniken zusätzlich bei Columns Stores auf welchen Ebenen mit wie großem Effekt eingesetzt werden können. Einer Beschreibung und Analyse einer Auswahl dieser Techniken folgt die Präsentation einer empirischen Evaluation letzterer in einem kommerziellen Column-Store-DBMS anhand des auf DWH ausgelegten Star Schema Benchmark (SSB).