P242 - BTW2015 - Datenbanksysteme für Business, Technologie und Web - Workshopband
Auflistung P242 - BTW2015 - Datenbanksysteme für Business, Technologie und Web - Workshopband nach Erscheinungsdatum
1 - 10 von 36
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragOntology-based retrieval of scientific data in LIFE(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Uciteli, Alexandr; Kirsten, ToralfLIFE is an epidemiological study determining thousands of Leipzig inhabitants with a wide spectrum of interviews, questionnaires, and medical investigations. The heterogeneous data are centrally integrated into a research database and are analyzed by specific analysis projects. To semantically describe the large set of data, we have developed an ontological framework. Applicants of analysis projects and other interested people can use the LIFE Investigation Ontology (LIO) as central part of the framework to get insights, which kind of data is collected in LIFE. Moreover, we use the framework to generate queries over the collected scientific data in order to retrieve data as requested by each analysis project. A query generator transforms the ontological specifications using LIO to database queries which are implemented as project-specific database views. Since the requested data is typically complex, a manual query specification would be very timeconsuming, error-prone, and is, therefore, unsuitable in this large project. We present the approach, overview LIO and show query formulation and transformation. Our approach runs in production mode for two years in LIFE.
- KonferenzbeitragOptimizing Sequential Pattern Mining Within Multiple Streams(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Töws, Daniel; Hassani, Marwan; Beecks, Christian; Seidl, ThomasAnalyzing information is recently becoming much more important than ever, as it is produced massively in every area. In the past years, data streams became more and more important and so were algorithms that can mine hidden patterns out of those non static data bases. Those algorithms can also be used to simulate processes and to find important information step by step. The translation of an English text into German is such a process. Linguists try to find characteristic patterns in this process to better understand it. For this purpose, keystrokes and eye movements during the process are tracked. The StrPMiner was designed to mine sequential patterns from this translation data. One dominant algorithm to find sequential patterns is the PrefixSpan. Though it was created for static data bases, lots of data stream algorithms collect batches and use the algorithm to find sequential patterns. This batch approach is a simple solution, but makes it impossible to find patterns in between two consequent batches. The PBuilder is introduced to find sequential patterns with a higher accuracy and is used by the StrPMiner to find patterns.
- KonferenzbeitragPlacement-Safe Operator-Graph Changes in Distributed Heterogeneous Data Stream Systems(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Pollner, Niko; Steudtner, Christian; Meyer-Wegener, KlausData stream processing systems enable querying continuous data without first storing it. Data stream queries may combine data from distributed data sources like different sensors in an environmental sensing application. This suggests distributed query processing. Thus the amount of transferred data can be reduced and more processing resources are available. However, distributed query processing on probably heterogeneous platforms complicates query optimization. This article investigates query optimization through operator graph changes and its interaction with operator placement on heterogeneous distributed systems. Pre-distribution operator graph changes may prevent certain operator placements. Thereby the resource consumption of the query execution may unexpectedly increase. Based on the operator placement problem modeled as a task assignment problem (TAP), we prove that it is NP-hard to decide in general whether an arbitrary operator graph change may negatively influence the best possible TAP solution. We present conditions for several specific operator graph changes that guarantee to preserve the best possible TAP solution.
- KonferenzbeitragModulares Verteilungskonzept für Datenstrommanagementsysteme(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Michelsen, Timo; Brand, Michael; Appelrath, H.-JürgenFür die Verteilung kontinuierlicher Anfragen in verteilten Datenstrommanagementsytemen (DSMS) gibt es je nach Netzwerk-Architektur und Anwendungsfall unterschiedliche Strategien. Die Festlegung auf eine Strategie ist u. U. nachteilig, besonders wenn sich Netzwerk-Architektur oder Anwendungsfall ändern. In dieser Ar- beit wird ein Ansatz für eine flexible und erweiterbare Anfrageverteilung in verteilten DSMSs vorgestellt. Der Ansatz umfasst drei Schritte: (1) Partitionierung, (2) Modifikation und (3) Allokation. Bei der Partitionierung wird eine kontinuierliche Anfrage in disjunkte Teilanfragen zerlegt. Die optionale Modifikation erlaubt es, Mechanismen wie Fragmentierung oder Replikation zu verwenden. Bei der Allokation werden die einzelnen Teilanfragen schließlich Knoten im Netzwerk zugewiesen, um dort ausgeführt zu werden. Für jeden der drei Schritte können unabhängige Strategien verwendet werden. Dieser modulare Aufbau ermöglicht zum Einen eine individuelle Anfrageverteilung. Zum Anderen können bereits vorhandene Strategien aus anderen Arbeiten und Systemen (z.B. eine Allokationsstrategie) integriert werden. In dieser Arbeit werden für jeden der drei Teilschritte beispielhafte Strategien vorgestellt. Außerdem zeigen zwei An- wendungsbeispiele die Vorteile des vorgestellten, modularen Ansatzes gegenüber einer festen Verteilungsstrategie.
- KonferenzbeitragBestimmung von Datenunsicherheit in einem probabilistischen Datenstrommanagementsystem(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Kuka, Christian; Nicklas, DanielaFür die kontinuierliche Verarbeitung von unsicherheitsbehafteten Daten in einem Datenstrommanagementsystem ist es notwendig das zugrunde liegende stochastische Modell der Daten zu kennen. Zu diesem Zweck existieren mehrere Ansätze, wie etwas das Erwartungswertmaximierungsverfahren oder die Kerndichteschätzung. In dieser Arbeit wird aufgezeigt, wie die genannten Verfahren in ein Datenstrommanagementsystem verwendet werden können, umso eine probabilistische Datenstromverarbeitung zu ermöglichen und wie sich die Bestimmung des stochastischen Modells auf die Latenz der Verarbeitung auswirkt. Zudem wird die Qualität der ermittelten stochastischen Modelle verglichen und aufgezeigt, welches Verfahren unter welchen Bedienungen bei der kontinuierlichen Verarbeitung von unsicherheitsbehafteten Daten am effektivsten ist.
- KonferenzbeitragAspekte einer automatischen Meinungsbildungsanalyse von Online-Diskussionen(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Liebeck, MatthiasHeutzutage haben Menschen die Möglichkeit, ihre Meinung zu verschiedensten Themen in onlinebasierten Diskussionsplattformen zu äußern. Diese Meinungen können in Form einer Meinungsbildungsanalyse genauer untersucht werden. In diesem Beitrag werden verschiedene Aspekte einer automatisierten Diskussionsverfolgung untersucht. Dazu werden Analysekriterien definiert und die vorgestellten Ansätze auf zwei deutschsprachige Datensätze angewendet.
- KonferenzbeitragUsing data-stream and complex-event processing to identify activities of bats(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Herbst, Sebastian; Tenschert, Johannes; Meyer-Wegener, Klaus
- KonferenzbeitragCBIR gestütztes Gemälde-Browsing(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Büngener, MarcZur Beantwortung der Frage, warum Bildersuchen auf Schlüsselwörtern basieren, statt auf den bildimmanenten Informationen, werden Repräsentationsmöglichkeiten für Bildinformationen vorgestellt, die Personen in die Lage versetzen, Anfragen in Form von Bildinformationen statt Schlüsselwörtern zu formulieren. Die Bildinformationen sollen in einer Weise interpretiert werden, die dem subjektiven Empfinden menschlicher Betrachter entsprechen. Als Bildinformationen werden Farben, Texturen und die Darstellung einfacher Formen ausgewertet.
- KonferenzbeitragData streams and event processing (DSEP)(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Grawunder, Marco; Nicklas, Daniela
- KonferenzbeitragUnterstützung von datengetriebenen Prozessschritten in Simulationsstudien durch Verwendung multidimensionaler Datenmodelle(Datenbanksysteme für Business, Technologie und Web (BTW 2015) - Workshopband, 2015) Walter, Monika; Hahn, AxelDie vorliegende Arbeit beschäftigt sich mit Ansätzen zur Unterstützung von datengetriebenen Prozessschritten in Simulationsstudien der diskreten Event- Simulation. Der Lösungsansatz besteht darin, die in Data-Warehouse-Systemen vorhandenen Konzepte zur optimierten Nutzung großer Datenmengen aus operativen Systemen unter Anwendung multidimensionaler Datenmodelle für die Simulationsstudien zugänglich zu machen. Der Schwerpunkt der Arbeit liegt in der Erstellung eines Konzeptes, welches Aspekte zu Verbesserungspotenzialen für die drei Bereiche Datenbeschaffung, Initialisierung und Parametrisierung von Simulationsstudien sowie Reduzierung von wahrscheinlichkeitsbasiertem Dateninput betrachtet. Ziel des Ansatzes ist es, die bereits in den Data-Warehouse-Systemen umgesetzten Aggregationsund Abstraktionsmechanismen für Simulationsstudien systematisiert zugänglich zu machen und somit den Input großer Datenmengen für diese zu ermöglichen.