Autor*innen mit den meisten Dokumenten
Neueste Veröffentlichungen
- ZeitschriftenartikelNews(Datenbank-Spektrum: Vol. 11, No. 2, 2011)
- ZeitschriftenartikelSorting in Column Stores(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Bößwetter, DanielIn recent years, we have seen a number of new database architectures based on the idea of vertical fragmentation of relations. These architectures target the analysis of huge amounts of relational data, because vertical fragmentation facilitates column scans which are common in analytic applications at the expense of single-tuple operations. Although sorting is a common operation for analytics, few is known about sorting vertically fragmented relations. This paper compares various possibilities to apply (external) merge sort to vertically fragmented relations on different layers of the memory hierarchy and gives hints on when to apply which one. We propose a Greedy algorithm to find the optimum mixture of steps that leads to a sorted version of a given relation which is stored column-wise.
- ZeitschriftenartikelMultidimensional Expressions (MDX)(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Kempa, Martin
- ZeitschriftenartikelEditorial(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Härder, Theo
- Zeitschriftenartikel„Von der Torfabrik zur Denkfabrik“ Bericht zur 14. Fachtagung „Datenbanksysteme für Business, Technologie und Web“(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Bächle, Sebastian; Härder, Theo; Höfner, Volker; Klein, Joachim; Ou, Yi; Reithermann, Steffen; Schall, Daniel; Schmidt, Karsten; Weiner, Andreas
- ZeitschriftenartikelHyPer: Die effiziente Reinkarnation des Schattenspeichers in einem Hauptspeicher-DBMS(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Funke, Florian; Kemper, Alfons; Mühe, Henrik; Neumann, ThomasHyPer ist ein modernes Hauptspeicher-Datenbanksystem, das die Hardware-unterstützte virtuelle Speicherverwaltung des Betriebssystems für die Datenverwaltung und die Synchronisation zwischen OLTP-Transaktionen und OLAP-Anfragen effektiv ausnutzt. In Bezug auf die „in-core“ Datenverwaltung werden die relationalen Daten direkt, also ohne zusätzliche Indirektion durch eine DBMS-kontrollierte Puffer- und Seitenverwaltung, auf den virtuellen Adressraum des OLTP-Prozesses abgebildet. Dieser Prozess kann transaktionskonsistente Snapshots der Datenbank anlegen, indem ein neuer OLAP-Prozess abgespaltet wird (in Linux mit dem Systembefehl fork). Der copy on write-Mechanismus des Betriebssystems/Prozessors sorgt für die Konsistenzerhaltung dieses Snapshots, indem Seiten mit sich ändernden Datenobjekten repliziert werden. Dieser Snapshot-Mechanismus entspricht dem alt-bekannten Schattenspeicherkonzept, das Lorie (ACM Trans. Database Syst. 2(1), 1977) schon 1977 erfunden hat. HyPer’s Leistungsfähigkeit wird anhand des neuen „Mixed Workload CH-BenCHmark“ nachgewiesen, der die Transaktionsverarbeitung des TPC-C- und die Anfragen des TPC-H-Benchmarks in einer gemischten, parallel auf demselben Datenbestand auszuführenden Workload vereint. Die Leistungsfähigkeit eines derartigen hybriden Datenbanksystems kann für die effektive Unterstützung sogenannter „real-time business intelligence“ ausgenutzt werden, wie dies von namhaften Industrievertretern wie H. Plattner (SIGMOD, 2009) von SAP gefordert wurde.
- ZeitschriftenartikelDissertationen(Datenbank-Spektrum: Vol. 11, No. 2, 2011)
- ZeitschriftenartikelIntegrating Cluster-Based Main-Memory Accelerators in Relational Data Warehouse Systems(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Stolze, Knut; Beier, Felix; Koeth, Oliver; Sattler, Kai-UweToday, data warehouse systems are faced with challenges for providing nearly realtime response times even for complex analytical queries on enormous data volumes. Highly scalable computing clusters in combination with parallel in-memory processing of compressed data are valuable techniques to address these challenges. In this paper, we give an overview on core techniques of the IBM Smart Analytics Optimizer—an accelerator engine for IBM’s mainframe database system DB2 for z/OS. We particularly discuss aspects of a seamless integration between the two worlds and describe techniques exploiting features of modern hardware such as parallel processing, cache utilization, and SIMD. We describe issues encountered during the development and evaluation of our system and outline current research activities for solving them.
- ZeitschriftenartikelDas Fachgebiet „Datenbanksysteme und Informationsmanagement“ (DIMA) an der Technischen Universität Berlin stellt sich vor(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Li, Yuexiao; Markl, VolkerIn diesem Artikel stellen wir das Fachgebiet Datenbanksysteme an der Technischen Universität Berlin unter der Leitung von Prof. Dr. Volker Markl vor.Wir beschreiben aktuelle Forschungsprojekte und geben einen Überblick über die Lehrveranstaltungen des Fachgebiets.
- ZeitschriftenartikelSorting in a Memory Hierarchy with Flash Memory(Datenbank-Spektrum: Vol. 11, No. 2, 2011) Graefe, GoetzFlash memory continues to improve in price, capacity, reliability, durability, and performance. In addition to consumer and client devices, flash memory is also employed in many servers. Its optimal usage in various classes of server software, including web servers, file-and-print servers, and database servers, requires evaluation and analysis. The present paper analyzes the use of flash memory for database query processing including algorithms that combine flash memory and traditional disk drives.External merge sort serves as a prototypical query execution algorithm. The excellent access latency of flash memory promises substantially better sort performance than sorting with traditional disks. Surprisingly, this is true only in fairly limited cases. Flash memory as intermediate external storage improves performance in particular in situations with very limited memory.The most advantageous external sort algorithms combine flash memory and traditional disk, exploiting the fast access latency of flash memory as well as the fast transfer bandwidth and inexpensive capacity of traditional disks. Moreover, graceful degradation is required in multiple ways, both when spilling from memory to flash storage and when spilling from flash to disk. These algorithms are described in detail, including in particular their graceful transition from run generation to merging. Using such graceful degradation and incremental transitions, sorting in a three-level memory hierarchy of RAM, flash memory, and traditional disk can be generalized to database query processing with any number of levels.