Datenbank Spektrum
Datenbank-Spektrum ist das offizielle Organ der Fachgruppe Datenbanken und Information Retrieval der Gesellschaft für Informatik (GI) e.V. Die Zeitschrift widmet sich den Themen Datenbanken, Datenbankanwendungen und Information Retrieval. Sie vermittelt fundiertes Wissen über die aktuellen Standards und Technologien, deren Einsatz und ihre kommerzielle Relevanz. Neben Grundlagenbeiträgen, Tutorials, wissenschaftlichen Fachbeiträgen, aktuellen Forschungsergebnissen finden sich in jeder Ausgabe auch Informationen über die Aktivitäten der Fachgruppen, zu Konferenzen und Workshops und über neue Produkte und Bücher. Ein renommiertes Herausgebergremium aus Hochschule und Industrie gewährleistet die Qualität und fachliche Kompetenz der Beiträge.
Auflistung nach:
Auflistung Datenbank Spektrum nach Titel
1 - 10 von 376
Treffer pro Seite
Sortieroptionen
- Zeitschriftenartikel30 Jahre „Datenbanksysteme für Business, Technologie und Web“(Datenbank-Spektrum: Vol. 15, No. 1, 2015)
- Zeitschriftenartikel7 Irrtümer zum Datenschutz im Kontext von Smart Data(Datenbank-Spektrum: Vol. 16, No. 2, 2016) Wagner, Manuela; Raabe, OliverÜber Datenschutz wird im Zusammenhang neuer Phänomene wie Big Data, Industrie 4.0 und Smart Data auf allen Ebenen der Politik, Wissenschaft und Gesellschaft diskutiert. Das Recht stößt dabei in seinen Schutzfunktionen an seine Grenzen. Eine Vielzahl von Schutzmechanismen wird vielmehr in der Umsetzung von rechtlichen Prinzipien in technische Lösungen bestehen. Dieser Beitrag hat das Ziel die mit der technischen Umsetzung betrauten Informatiker über typische Missverständnisse zum Datenschutzrecht aufzuklären. Grundsätzlich ist der Rechtspraxis zwar eine Generalisierung fremd, da sich belastbare Aussagen in der Regel nur in Bezug zu einem konkreten, individuell oft einzigartigen Sachverhalt erlangen lassen. Die nachfolgenden Punkte sind jedoch einer Abstraktion zugänglich. Wir greifen hier jene Irrtümer auf, die sich in vielfältigen Forschungsprojekten an der Schnittstelle von Recht und Informatik als notorisch erwiesen haben und von besonderer Bedeutung für die Bewertung und Umsetzung von Smart-Data-Technologien sind.
- ZeitschriftenartikelA Database Perspective on Consuming Linked Data on the Web(Datenbank-Spektrum: Vol. 10, No. 2, 2010) Hartig, Olaf; Langegger, AndreasDuring recent years an increasing number of data providers adopted the Linked Data principles for publishing and connecting structured data on the Web, thus creating a globally distributed dataspace—the Web of Data. While the execution of structured, SQL-like queries over this dataspace opens possibilities not conceivable before, query execution on the Web of Data poses novel challenges. These challenges provide great opportunities for the database community.In this article we introduce the concept of Linked Data and discuss different approaches to query the Web of Data. Our goal is to provide a general understanding of this new research area and of the challenges and open issues that must be addressed.
- ZeitschriftenartikelA Link is not Enough – Reproducibility of Data(Datenbank-Spektrum: Vol. 19, No. 2, 2019) Pawlik, Mateusz; Hütter, Thomas; Kocher, Daniel; Mann, Willi; Augsten, NikolausAlthough many works in the database community use open data in their experimental evaluation, repeating the empirical results of previous works remains a challenge. This holds true even if the source code or binaries of the tested algorithms are available. In this paper, we argue that providing access to the raw, original datasets is not enough. Real-world datasets are rarely processed without modification. Instead, the data is adapted to the needs of the experimental evaluation in the data preparation process. We showcase that the details of the data preparation process matter and subtle differences during data conversion can have a large impact on the outcome of runtime results. We introduce a data reproducibility model, identify three levels of data reproducibility, report about our own experience, and exemplify our best practices.
- ZeitschriftenartikelA Real-time Materialized View Approach for Analytic Flows in Hybrid Cloud Environments(Datenbank-Spektrum: Vol. 14, No. 2, 2014) Qu, Weiping; Dessloch, StefanNext-generation business intelligence (BI) enables enterprises to quickly react in changing business environments. Increasingly, data integration pipelines need to be merged with query pipelines for real-time analytics from operational data. Newly emerging hybrid analytic flows have been becoming attractive which consist of a set of extract-transform-load (ETL) jobs together with analytic jobs running over multiple platforms with different functionality.In traditional databases, materialized views are used to optimize query performance. In cross-platform, large-scale data transformation environments, similar challenges (e.g. view selection) arise when using materialized views. In this work, we propose an approach that generates materialized views in hybrid flows and maintains these views in a query-driven, incremental manner. To accelerate data integration processes, the location of a materialization point in a transformation flow varies dynamically based on metrics like source update rates and maintenance cost in terms of flow operations. Besides, by picking up the most suitable platform for accommodating views, for example, materializing and maintaining intermediate results of Hadoop jobs in relational databases, better performance has been shown.
- ZeitschriftenartikelA Terminology Service Supporting Semantic Annotation, Integration, Discovery and Analysis of Interdisciplinary Research Data(Datenbank-Spektrum: Vol. 16, No. 3, 2016) Karam, Naouel; Müller-Birn, Claudia; Gleisberg, Maren; Fichtmüller, David; Tolksdorf, Robert; Güntsch, AntonResearch has become more data-intensive over the last few decades. Sharing research data is often a challenge, especially for interdisciplinary collaborative projects. One primary goal of a research infrastructure for data management should be to enable efficient data discovery and integration of heterogeneous data. In order to enable such interoperability, a lot of effort has been undertaken by scientists to develop standards and characterize their domain knowledge in the form of taxonomies and formal ontologies. However, these knowledge models are often disconnected and distributed. The work presented here provides a promising approach for integrating and harmonizing terminological resources to serve as a backbone for a platform. The component developed, called the GFBio Terminology Service, acts as a semantic platform for access, development and reasoning over internally and externally maintained terminological resources within the biological and environmental domain. We highlight the utility of the Terminology Service by practical use cases of semantically enhanced components. We show how the Terminology Service enables applications to add meaning to their data by giving access to the knowledge that can be derived from the terminologies and data annotated by them.
- ZeitschriftenartikelADAMpro: Database Support for Big Multimedia Retrieval(Datenbank-Spektrum: Vol. 16, No. 1, 2016) Giangreco, Ivan; Schuldt, HeikoFor supporting retrieval tasks within large multimedia collections, not only the sheer size of data but also the complexity of data and their associated metadata pose a challenge. Applications that have to deal with big multimedia collections need to manage the volume of data and to effectively and efficiently search within these data. When providing similarity search, a multimedia retrieval system has to consider the actual multimedia content, the corresponding structured metadata (e.g., content author, creation date, etc.) and—for providing similarity queries—the extracted low-level features stored as densely populated high-dimensional feature vectors. In this paper, we present ADAMpro, a combined database and information retrieval system that is particularly tailored to big multimedia collections. ADAMpro follows a modular architecture for storing structured metadata, as well as the extracted feature vectors and it provides various index structures, i.e., Locality-Sensitive Hashing, Spectral Hashing, and the VA-File, for a fast retrieval in the context of a similarity search. Since similarity queries are often long-running, ADAMpro supports progressive queries that provide the user with streaming result lists by returning (possibly imprecise) results as soon as they become available. We provide the results of an evaluation of ADAMpro on the basis of several collection sizes up to 50 million entries and feature vectors with different numbers of dimensions.
- ZeitschriftenartikelAdaptive Benutzerunterstützung in interaktiven Informationssuchprozessen(Datenbank-Spektrum: Vol. 11, No. 3, 2011) Backhausen, Daniel; Klas, Claus-Peter; Hemmje, MatthiasDie Suche nach Informationen ist ein in hohem Maße dynamischer und interaktiver Prozess, der aus verschiedenen Phasen besteht. In jeder dieser Phasen befindet sich der Suchende in einer bestimmten Situation. Diese besteht aus unterschiedlichen Faktoren, die auf den kognitiven Raum des Suchenden wirken und dadurch sein Verhalten und vor allem sein Bedürfnis nach Wissen steuern. Dies zeigt sich vor allem bei langfristigen Prozessen, die über mehrere Sitzungen hinweg verlaufen. Um den Suchenden hierbei effektiver zu unterstützen, ist es erforderlich, ein Bewusstsein über die Situation zu haben, in der sich der Suchende aktuell befindet. Darauf aufbauend können Aussehen und Verhalten eines Systems adaptiv an das dynamische Bedürfnis, das Verhalten und an die Kenntnisse des Suchenden flexibel angepasst werden. Darüber hinaus können situationsbezogene Vorschläge seitens des Systems an den Nutzer herangetragen werden, um diesen besser zu unterstützen. In dem hier vorliegenden Beitrag zeigen wir auf, wie durch eine ausführliche Analyse und Aufnahme kontextueller Faktoren eine Annäherung an das kognitive Modell des Nutzers stattfinden kann, um vor allem sitzungsübergreifende Suchaktivitäten effizienter und effektiver gestalten zu können.
- ZeitschriftenartikelALEA – Adaptive eLEArning System – Lernende datenbankbasierte Lernsysteme in der Datenbanklehre(Datenbank-Spektrum: Vol. 21, No. 2, 2021) Schneider, Kerstin; Keller, Fabian; Habekost, Pia; Schmeil, Victor; Dampmann, Markus; Schorch, FlorianIm Bereich Datenbanken werden selbstentwickelte E‑Learning-Systeme an vielen Hochschulen seit Jahren erfolgreich verwendet. An der Hochschule Harz werden E‑Learning-Systeme im Bereich Datenbanken im Rahmen der Lehre und für die Lehre entwickelt, weiterentwickelt und eingesetzt. Das Gesamtsystem, welches die zusammengehörenden Systeme umfasst, wird als ALEA bezeichnet. Es werden relevante Komponenten von ALEA erläutert, die im Rahmen der Datenbanklehre für die klassischen Teilgebiete SQL, ER-to-Relational-Mapping und Normalisierung genutzt werden.
- ZeitschriftenartikelAn Efficient Blocking Technique for Reference Matching using MapReduce(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Paradies, MarcusDocument Clustering has become an increasingly important task in the area of data mining and information retrieval. With growing data volumes, CPU—and memory-efficient techniques for clustering algorithms are receiving considerable attention in the research community. To deal with huge amounts of data (e.g., documents from Wikipedia or CiteSeerX which are several GB in size), distributed clustering techniques have been designed to provide scalable and flexible approaches. We study the problem of document clustering in the area of Entity Matching, where documents from various data sources are matched together. More specifically, we focus on a common optimization technique called blocking which reduces the enormous search space by clustering the data sources into smaller groups and processes comparisons only within a group. In this article, we describe our experiences and findings in applying the MapReduce framework to deal with huge bibliographic data sets and to provide a flexible, scalable and easy-to-use blocking technique to reduce the search space for Entity Matching.