P266 - BTW2017 - Datenbanksysteme für Business, Technologie und Web - Workshopband
Auflistung P266 - BTW2017 - Datenbanksysteme für Business, Technologie und Web - Workshopband nach Schlagwort "Apache Flink"
1 - 3 von 3
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragDistributed FoodBroker: Skalierbare Generierung graphbasierter Geschäftsprozessdaten(Datenbanksysteme für Business, Technologie und Web (BTW 2017) - Workshopband, 2017) Kemper, Stephan; Petermann, André; Junghanns, MartinGraphen eignen sich zur Modellierung und Analyse komplexer Zusammenha ̈nge zwischen beliebi- gen Objekten. Eine mo ̈gliche Anwendung ist die graphbasierte Analyse von Gescha ̈ftsprozessen. Fu ̈r die Entwicklung und Evaluierung entsprechener Analysetools werden Datensa ̈tze beno ̈tigt. Food- Broker ist ein Datengenerator, welcher vordefinierte Gescha ̈ftsprozesse simuliert und die Daten in Form von Graphen lokal auf einem Rechner erzeugt. Um Graphen beliebiger Gro ̈ßer erstellen zu ko ̈nnen, zeigen wir in diesem Beitrag wie FoodBroker mit Hilfe der Open-Source-Frameworks GRADOOP und Apache Flink auf verteilten Systemen implementiert werden kann.
- KonferenzbeitragPost-Debugging in Large Scale Big Data Analytic Systems(Datenbanksysteme für Business, Technologie und Web (BTW 2017) - Workshopband, 2017) Bergen, Eduard; Edlich, StefanData scientists often need to fine tune and resubmit their jobs when processing a large quantity of data in big clusters because of a failed behavior of currently executed jobs. Consequently, data scientists also need to filter, combine, and correlate large data sets. Hence, debugging a job locally helps data scientists to figure out the root cause and increases efficiency while simplifying the working process. Discovering the root cause of failures in distributed systems involve a different kind of information such as the operating system type, executed system applications, the execution state, and environment variables. In general, log files contain this type of information in a cryptic and large structure. Data scientists need to analyze all related log files to get more insights about the failure and this is cumbersome and slow. Another possibility is to use our reference architecture. We extract remote data and replay the extraction on the developer’s local debugging environment.
- KonferenzbeitragServerseitige Aggregation von Zeitreihendaten in verteilten NoSQL-Datenbanken(Datenbanksysteme für Business, Technologie und Web (BTW 2017) - Workshopband, 2017) Swoboda, OliverDie effiziente Erfassung, Abspeicherung und Verarbeitung von Zeitreihendaten spielt in der Zeit von leistungsstarken Anwendungen eine große Rolle. Durch die schnelle und stetig wachsende Erzeugung von Daten ist es nötig, diese in verteilten Systemen abzuspeichern. Dadurch wird es nötig über Alternativen zur sequenziellen Berechnung von Aggregationen, wie Minimum, Maximum, der Standardabweichung oder von Perzentilen nachzudenken. Diese Arbeit untersucht, wie existierende Zeitreihendatenbanken im Hadoop-Ökosystem Aggregationen umsetzen und welche Probleme bei der sequenzuellen Berechnung auftreten. Um diese Probleme zu lösen, wird gezeigt, wie Aggregationen auf Zeitreihendaten verteilt und parallel in verschiedenen Systemen umgesetzt werden können und welche Herangehensweise bessere Laufzeiten liefert.