Konferenzbeitrag
Überwachung von Aggregationszuständen in verteilten komponentenbasierten Datenproduktionsystemen
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Zusatzinformation
Datum
2003
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Einer der signifikantesten Vorteile von Datenbanksystemen besteht in der Möglichkeit enthaltene Daten zu aggregieren und damit die Bildung beliebiger Gesamtbeträge, Statistiken oder auch Durchschnittswerte zu gewährleisten (aus vielen Datensätzen wird als Ergebnis ein Datensatz erstellt). Ebenso wichtig wie das Zusammenführen von Daten ist die Disaggregation. Darunter ist hier, im Gegensatz zur Aggregation, die Splittung von aufaggregierten Daten in ihre Einzelbestandteile zu verstehen (für den Betrachter werden aus einem Datensatz viele Ergebnisdatensätze). In diesem Bericht werden nicht die mathematischen Möglichkeiten zur Aggregation und Disaggregation untersucht. Vielmehr zielt der Fokus auf die Nachvollziehbarkeit und damit auf die Überwachung dieser Vorgänge ab. Angenommen eine Aggregation wurde vorgenommen, wie können anschließend die eingegangenen Datensätze eindeutig wieder identifiziert und damit die Grundgesamtheit der Aggregation unmissverständlich abgeleitet werden, wenn die zu Grunde liegenden Datenbestände sich stetig ändern? Fragestellungen dieser Art werden in diesem Bericht aufgegriffen und untersucht. An einem konkreten Beispiel aus der Wirtschaft werden die Probleme mit Aggregationszuständen erläutert. Das reale Beispielunternehmen, die GfK Marketing Services, eignet sich besonders gut für diese Fragestellungen, da ihr Kapital und ihre Geschäftsidee in der Verarbeitung und Veredelung äußerst großer Datenmengen besteht. Dabei spielt ein bald weltweit verteiltes Datenproduktionssystem in den vielen Niederlassungen des Unternehmens eine tragende Rolle. Für genau dieses komponentenbasierte verteilte Datenproduktionssystem wird demnächst ein Planungs- Controlund Monitoring System benötigt, das genaue Auskunft über enthaltene Dateninhalte im Datenproduktionssystem bieten muss. Dies erweist sich als Grundlage der Untersuchungen über die Aggregationszustände in diesem Bericht, welche daran erläutert, diskutiert und evaluiert werden sollen.