(Datenbanksysteme in Business, Technologie und Web, 11. Fachtagung des GIFachbereichs “Datenbanken und Informationssysteme” (DBIS), 2005) Cammert, Michael; Heinz, Christoph; Krämer, Jürgen; Seeger, Bernhard
Der effektiven Berechnung von Joins kommt auch in der Datenstromverarbeitung essentielle Bedeutung zu. In dieser Arbeit adaptieren wir daher die für eine Vielzahl verschiedener Joinprädikate geeignete sortierbasierte Joinverarbeitung von der passiven auf die aktive Datenverarbeitung. Wir zeigen auf, wie man das Problem der Verarbeitung potentiell unbegrenzter Datenströme mit Hilfe einer exakten Zeitfenstersemantik löst. Zu deren Realisierung stellen wir verschiedene Hauptund Externspeicheralgorithmen vor. Abschließend erweitern wir die vorgestellten Operatoren für die Berechnung mehrdimensionaler Joins und zeigen experimentell die Vorteile dieses Ansatzes gegenüber binär kaskadierten Joins auf.