P103 - BTW2007 - Datenbanksysteme in Business, Technologie und Web
Auflistung P103 - BTW2007 - Datenbanksysteme in Business, Technologie und Web nach Erscheinungsdatum
1 - 10 von 38
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragKosten und Nutzen von Datenbankreorganisationen: Grundlagen, Modelle, Leistungsuntersuchungen(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Dorendorf, StefanStetig wachsende Datenmengen und hohe Verfügbarkeitsanforderungen an Datenbanken führen dazu, dass Wartungsarbeiten (wie z.B. Datenbankreorganisationen) oft nicht mehr (oder nicht mehr vollständig) offline in zur Verfügung stehenden Zeitfenstern durchgeführt werden können bzw. dass die Kosten oder die Behinderungen des normalen Datenbankbetriebs bei online durchgeführten Wartungsarbeiten nicht mehr vernachlässigt werden können. Es ist daher wichtig, die Datenbankobjekte zu lokalisieren und einzugrenzen, bei denen ein hoher Wartungsbedarf besteht. Weiterhin ist es wünschenswert, zunächst den durch Wartungsmaßnahmen erreichbaren Nutzen vor ihrer Durchführung quantifizieren zu können. Dieser Nutzen ist insbesondere von der Workload abhängig, also von den gegen die Datenbankobjekte gerichteten Anweisungen und deren Ausführungshäufigkeiten. Der zur Workload-Abarbeitung anfallende I/O-Aufwand, der einen dominierenden Anteil am Gesamtaufwand ausmacht, lässt sich mit einer Datenbankreorganisation u.U. wesentlich beeinflussen (reduzieren). In diesem Beitrag wird eine Methode vorgestellt, die es ermöglicht, die Auswirkungen von Datenbankreorganisationen auf den zur Workload-Abarbeitung notwendigen I/O-Aufwand abzuschätzen und damit den hauptsächlichen Nutzen der Reorganisationsmaßnahmen zu quantifizieren. Die von der Reorganisationsdurchführung verursachten Kosten sollten ebenfalls vorab in die Entscheidungsfindung einbezogen und dem Nutzen gegenübergestellt werden. Wie solche Kostenabschätzungen durchgeführt werden können, wird am Beispiel von In-Place-Reorganisationen gezeigt. Weiterhin werden die Ergebnisse von in einer Beispielumgebung angestellten Messungen präsentiert.
- KonferenzbeitragDer Einfluss der Datenverteilung auf die Performanz eines Data Warehouse(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Legler, Thomas; Lehner, Wolfgang; Ross, AndrewDieses Papier befasst sich mit einer Studie über die Optimierungsmöglichkeiten von Anfragen auf verteilten Data Warehouse Architekturen mittels verschiedenartiger Verteilungsstrategien der beteiligten Tabellen am Beispiel SAP NetWeaver BI.
- KonferenzbeitragMelting Pot XML – Bringing File Systems and Databases One Step Closer(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Holupirek, Alexander; Grün, Christian; Scholl, Marc H.Ever-growing data volumes demand for storage systems beyond current file systems abilities, particularly, a powerful querying capability. With the rise of XML, the database community has been challenged by semi-structured data processing, enhancing their field of activity. Since file systems are structured hierarchically they can be mapped to XML and as such stored in and queried by an XML-aware database. We provide an evaluation of a state-of-the-art XML-aware database implementing a file system.
- KonferenzbeitragWhen the Internet Hits the Road(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Jensen, Christian S.The Internet has recovered from the dot-com crash of the early 2000’s and now features an abundance of new, innovative technologies and services. We are also witnessing the emergence of a communication and computing infrastructure that encompasses millions of people with mobile devices, such as mobile phones, with Internet connectivity. This infrastructure will soon enable the Internet to go mobile. This paper describes the background and aspirations of a new research project that is concerned with data management aspects of innovative mobile Internet services. It is argued that mobile services will be context aware, and the project devotes particu- lar attention to geographical context awareness. The project will adopt a prototyping approach where services are built and exposed to users, and where data management challenges are identified and addressed. The paper describes the evolving service platform that supports the approach chosen, it describes some of the data management techniques being integrated into the service platform, and it describes research guide- lines that the project aims to follow.
- KonferenzbeitragIntegrating Query-Feedback Based Statistics into Informix Dynamic Server(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Behm, Alexander; Markl, Volker; Haas, Peter; Murthy, KeshavaStatistics that accurately describe the distribution of data values in the columns of relational tables are essential for effective query optimization in a database management system. Manually maintaining such statistics in the face of changing data is difficult and can lead to suboptimal query performance and high administration costs. In this paper, we describe a method and prototype implementation for automatically maintaining high quality single-column statistics, as used by the optimizer in IBM Informix Dynamic Server (IDS). Our method both refines and extends the ISOMER algorithm of Srivastava et al. for maintaining a multidimensional histogram based on query feedback (QF). Like ISOMER, our new method is based on the maximum entropy (ME) principle, and therefore incorporates information about the data distribution in a principled and consistent manner. However, because IDS only needs to maintain one-dimensional histograms, we can simplify the ISOMER algorithm in several ways, significantly speeding up performance. First, we replace the expensive STHoles data structure used by ISOMER with a simple binning scheme, using a sweep-line algorithm to determine bin boundaries. Next, we use an efficient method for incorporating new QF into the histogram; the idea is to aggregate, prior to the ME computation, those bins that do not overlap with the new feedback records. Finally, we introduce a fast pruning method to ensure that the number of bins in the frequency distribution stays below a specified upper bound. Besides refining ISOMER to deal efficiently with one-dimensional histograms, we extend previous work by combining the reactive QF approach with a proactive sampling approach. Sampling is triggered whenever (as determined from QF records) actual and estimated selectivities diverge to an unacceptably large degree. Our combined proactive/reactive approach greatly improves the robustness of the estimation mechanism, ensuring very high quality selectivity estimates for queries falling inside the range of available feedback while guaranteeing reasonably good estimates for queries outside of the range. By automatically updating statistics, query execution is improved due to better selectivity estimates, and the total cost of ownership (TCO) is reduced since the database administrator need not update statistics manually for monitored columns.
- KonferenzbeitragTopX – Efficient and Versatile Top-k Query Processing for Text, Semistructured, and Structured Data(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Theobald, Martin; Schenkel, Ralf; Weikum, GerhardThis paper presents a comprehensive overview of the TopX search engine, an extensive framework for unified indexing and querying large collections of unstructured, semistructured, and structured data. Residing at the very synapse of database (DB) engineering and information retrieval (IR), it integrates efficient scheduling algorithms for top-k-style ranked retrieval with powerful scoring models, as well as dynamic and self-throttling query expansion facilities.
- KonferenzbeitragEntwurf von Informationsintegrationssystemen auf der Basis der Merkmalsmodellierung(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Busse, Susanne; Freytag, Johann-ChristophInformationsintegrationssysteme bieten einen integrierten Zugriff auf eine Menge autonomer Datenquellen. Ihr Entwurf erfordert die Abwägung zwischen einer Vielzahl sich zum Teil widersprechender Anforderungen von Nutzern und Datenbereitstellern. Es sind jedoch Typen von Integrationssystemen bekannt, die grob verschiedene Integrationsvarianten beschreiben. In diesem Papier wird gezeigt, wie die Merkmalsmodellierung aus dem Bereich der Produktlinien benutzt werden kann, um Integrationsvarianten systematisch zu beschreiben. Durch ein Matching der Anforderungsspezifikation eines geplanten Systems und der Definition existierender Integrationsvarianten kann so konkret die Wahl eines Integrationsansatzes unterstützt werden. Der Ansatz ermöglicht somit den Entwurf eines Systems als auch deren Dokumentation.
- KonferenzbeitragMobiles Computer Aided Facility Management(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Buck, Olaf; Gajcy, Robert; Linnemann, VolkerDas Gebiet des Computer Aided Facility Management (CAFM) beschäftigt sich mit der Unterstützung der Verwaltung und Bewirtschaftung von Gebäuden, Anlagen und Einrichtungen in ihrer Nutzungsphase durch die Informationstechnik. Während nicht-mobile CAFM-Systeme inzwischen weit verbreitet sind, befindet sich der Bereich der mobilen CAFM-Systeme noch weitgehend im Anfangsstadium. Mobilität bedeutet in diesem Zusammenhang, dass Liegenschaftsdaten nicht nur von einem stationären PC aus abrufbar und änderbar sind, sondern auch von einem mobilen Gerät. Dieses kann direkt im betrachteten Gebäude von Personen, die mit der Bewirtschaftung und Verwaltung eines Gebäudes betraut sind, verwendet werden. In dieser Arbeit werden die Entwicklung von Benutzerschnittstelle und Architektur eines mobilen CAFM-Systems beschrieben, das im Rahmen einer Diplomarbeit als Erweiterung des seit langem im Einsatz befindlichen CAFM-Systems consultware® der Firma PietschCONSULT GmbH in Lübeck realisiert wurde
- Editiertes BuchDatenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS)(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007)
- KonferenzbeitragFrom Personal Desktops to Personal Dataspaces: A Report on Building the iMeMex Personal Dataspace Management System(Datenbanksysteme in Business, Technologie und Web (BTW 2007) – 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme" (DBIS), 2007) Dittrich, Jens-Peter; Blunschi, Lukas; Färber, Markus; Girard, Olivier René; Kirakos Karakashian, Shant; Vaz Salles, Marcos AntonioWe propose a new system that is able to handle the entire Personal Datas-pace of a user. A Personal Dataspace includes all data pertaining to a user on all his disks and on remote servers such as network drives, email and web servers. This data is represented by a heterogeneous mix of files, emails, bookmarks, music, pictures, calendar data, personal information streams and so on. State-of-the-art tools such as desktop search engines and desktop operating systems (including the upcoming Vista) are not enough as they neither solve the problem of physical personal information independence (where is my data) nor format and data model independence (how is it stored and which application do I have to use in order to access that data). Our work builds on the visions presented in [DSKB05], which calls for a single system to manage the personal information jungle, and [FHM05], which advocates dataspaces as a new abstraction for information management. In contrast to [FHM05] this paper presents a concrete implementation of a Personal DataSpace Management System (PDSMS) termed iMeMex: integrated memex. We discuss the core architecture of iMeMex and services offered by our system. As we will show, a PDSMS can be seen as a system that occupies the middleground between a search engine, a database management system, and a traditional information integration system. A PDSMS has to bridge these separate worlds and requires: (1) no full control on data, i.e., data may be accessed bypassing the interfaces of a PDSMS, (2) simple keyword search on all data available in a dataspace without performing any semantic data integration, (3) rich querying able to mix structural, attribute, and content predicates, (4) pay-as-you-go integration capabilities, (5) the ability to define arbitrary logical views on all data, (6) durability and consistency guarantees to avoid loss of data assigned to a dataspace, and (7) update capabilities. iMeMex is the first implementation of a PDSMS we are aware of. This paper presents the architecture of iMeMex and reports on the current state of the iMeMex research project at ETH Zurich.