PARS-Mitteilungen 2014
Nutzen Sie die Buttons unter "Auflistung nach", um die Beiträge z.B. nach Beitragsart oder Session zu sortieren oder starten Sie direkt mit der Titelübersicht.
Sie können aber auch die komplette PARS-Mitteilungen 2014 als PDF-Datei laden.
Auflistung PARS-Mitteilungen 2014 nach Erscheinungsdatum
1 - 10 von 19
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelServiceorientierte Simulation auf Basis von OCCI am Beispiel der Finite Elemente Methode(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Srba, Maik; Schmitz, SimonDas Open Cloud Computing Interface (OCCI) und seine Erweiterbarkeit auch während der Laufzeit bieten die Möglichkeit bestehende Anwendungen als Service bereitzustellen. Eine Implementierung des OCCI Modells ist der rOCCI Server. Dieser wurde erweitert um das AMQP Protokoll, damit ein schneller und asynchroner Nachrichtenaustausch zwischen den verteilten Anwendungen möglich ist. Mit einer Kombination aus OCCI Service Adapters und einer simplen DSL zur Beschreibung der Anwendungsschnittstelle ist es möglich, aus bereits vorhandenen Simulationen serviceorientierte Simulationen zu implementieren, die über AMQP und OCCI vernetzt werden können. Diese sind zugleich portierbar auf andere Cloud Infrastrukturen, da sie unabhängig von den proprietären APIs der Dienstanbieter implementiert werden. Der Portierungsaufwand bestehender Simulationslösungen zwischen den Cloud Infrastrukturen wird so verringert und teilweise sogar unnötig. Als Beispiel für eine Umsetzung als serviceorientierte Simulation wurde eine bestehende FEM-Simulation ausgewählt. FEM-Simulationen stellen an die Rechenleistung von Computern hohe Ansprüche. Dadurch ist die Berechnung von FEM-Modellen – gerade für kleine und mittelständische Unternehmen (KMUs) – mit hohen Kosten allein für die Anschaffung und den Unterhalt der Hardware verbunden. Ebenso sind Lizenzkosten für die Software nötig, die unabhängig von ihrer Auslastung anfallen. Die ERAS GmbH arbeitet im Rahmen von „Cloud4E Trusted Cloud Computing for Engineering“ (als Projekt des Technologieprogramms „Trusted Cloud“ des BMWi) an der Bereitstellung eines Dienstes für FEM-Simulationen, in der Cloud. Dadurch können rechenintensive Analysen mechanischer Problemstellungen in die Cloud ausgelagert werden.
- ZeitschriftenartikelA Quantitative Comparison of PRAM based Emulated Shared Memory Architectures to Current Multicore CPUs and GPUs(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Hansson, Erik; Alnervik, Erik; Kessler, Christoph; Forsell, MarttiThe performance of current multicore CPUs and GPUs is limited in computations making frequent use of communication/synchronization between the subtasks executed in parallel. This is because the directory-based cache systems scale weakly and/or the cost of synchronization is high. The Emulated Shared Memory (ESM) architectures relying on multithreading and efficient synchronization mechanisms have been developed to solve these problems affecting both performance and programmability of current machines. In this paper, we compare preliminarily the performance of three hardware implemented ESM architectures with state-of-the-art multicore CPUs and GPUs. The benchmarks are selected to cover different patterns of parallel computation and therefore reveal the performance potential of ESM architectures with respect to current multicores.
- ZeitschriftenartikelEvaluation of Adaptive Memory Management Techniques on the Tilera TILE-Gx Platform(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Fleig, Tobias; Mattes, Oliver; Karl, WolfgangManycore processor systems are likely to be the future system structure, and even within range for usage in desktop or mobile systems. Up to now, manycore processors like Intel SCC, Tilera TILE or KALRAY’s MPPA are primarily intended to use for high performance applications, utilizing several cores with direct inter-core communication to avoid access to external memory. The spreading of these manycore systems brings up new application scenarios with multiple concurrently running high-dynamic applications, changing I/O characteristics and a not predictable memory usage. Highly dynamic workloads with varying memory usage have to be utilized. In this paper the memory management of various manycore platforms is addressed. In more detail the Tilera TILE-Gx platform will be explained, presenting results of own evaluations accessing its memory system. Based on that, the concept of the autonomous self-optimizing memory architecture Self-aware Memory (SaM) exemplarily was implemented as a software layer on the Tilera platform. The results show that adaptive memory management techniques can be realized without much management overhead, in return achieving higher flexibility and and simple usage of memory in future system architectures.
- ZeitschriftenartikelEin Cloud-basierter Workflow für die effektive Fehlerdiagnose von Loop-Back-Strukturen(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Gulbins, Matthias; Schneider, André; Rülke, SteffenEine hochkomplexe und zeitaufwändige Aufgabe beim Entwurf integrierter Mixed-Signal-Schaltkreise ist die Fehlerdiagnose. Der vorliegende Beitrag stellt einen auf Cloud-Technologien basierenden Lösungsansatz vor, der Fehler in für solche Schaltkreise typischen Strukturen aus Analog-Digitalund Digital-Analog-Wandlern lokalisiert. Das Diagnoseverfahren (Ergebnis des BMBF-Projektes DIANA) beruht auf dem sogenannten Loop-Back-Test, der zwar die Generierung von Testdaten vereinfacht, aber eine Vielzahl von Variantensimulationen mit verschiedenen Simulationsprinzipien und erheblichen Datenmengen erfordert. Diese sollen nunmehr problemangepasst und damit effizient in der Cloud realisiert werden. Für die entsprechende Informationsverarbeitung in der Cloud wurde das in dem Projekte OptiNum-Grid entwickelte Framework GridWorker adaptiert. Experimente mit ersten Anwendungsbeispielen bestätigen die Leistungsfähigkeit und Praktikabilität des Ansatzes für datenund verarbeitungsintensive Schaltkreisentwurfsaufgaben.
- ZeitschriftenheftPARS-Mitteilungen 2014(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014)
- ZeitschriftenartikelEvaluating the Energy Efficiency of Reconfigurable Computing Toward Heterogeneous Multi-Core Computing(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Nowak, FabianFuture exascale systems need to have a much better performance-to-power ratio than today’s systems. Accelerators are a promising approach to pave this path by more energy-efficient computing. We show some early results of our investigations toward energy efficiency of reconfigurable and heterogeneous computing against multi-core processors for special applications. The results are supported by a general framework and toolchain for early evaluation of potential benefits of reconfigurable hardware. As a result, heterogeneous systems based on reconfigurable hardware, efficient data exchange mechanisms, data-driven and component-based programming, and task-parallel execution can help achieve power-efficient exascale systems in future.
- ZeitschriftenartikelPBA2CUDA - A Framework for Parallelizing Population Based Algorithms Using CUDA(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Zgeras, Ioannis; Brehm, Jürgen; Knoppik, MichaelTo increase the performance of a program, developers have to parallelize their code due to trends in modern hardware development. Since the parallelization of source code is paired with additional programming effort, it is desirable to provide developers with tools to help them by parallelizing source code. PBA2CUDA is a framework for semi-automatically parallelization of source code specialized in the algorithm class of Population Based Algorithms.
- ZeitschriftenartikelAn Architecture Framework for Porting Applications to FPGAs(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Nowak, Fabian; Bromberger, Michael; Karl, WolfgangHigh-level language converters help creating FPGAbased accelerators and allow to rapidly come up with a working prototype. But the generated state machines do often not perform as optimal as hand-designed control units, and they require much area. Also, the created deep pipelines are not very efficient for small amounts of data. Our approach is an architecture framework of hand-coded building blocks (BBs). A microprogrammable control unit allows programming the BBs to perform computations in a data-flow style. We accelerate applications further by executing independent tasks in parallel on different BBs. Our microprogram implementation for the Conjugate-Gradient method on our data-driven, microprogrammable, task-parallel architecture framework on the Convey HC-1 is competitive with a 24-thread Intel Westmere system. It is 1.2× faster using only one out of four available FPGAs, thereby proving its potential for accelerating numerical applications. Moreover, we show that hardware developers can change the BBs and thereby reduce iteration count of a numerical algorithm like the ConjugateGradient method to less than 0.5× due to more precise operations inside the BBs, speeding up execution time 2.47×.
- ZeitschriftenartikelSecure Algorithms for Biomedical Research in Public Clouds(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Beck, Martin; Haupt, V. Joachim; Moennich, Jan; Roy, Janine; Jäkel, René; Schroeder, Michael; Isik, ZerrinAlgorithms from the biomedical domain have to face a rapid growth of biological data and therefore a rising demand for computing time. The predictive power of such algorithms is also further improving and becomes increasingly interesting for commercial applications. Cloud Computing – as an already established paradigm to elastically allocate computing resources on demand – offers flexible solutions to deal with the increasing request for compute power. However, security concerns remain when valuable research or business data are being processed in a Public Cloud. Herein, we describe – from the application and security perspective – three biomedical case studies from different domains: Patent annotation, cancer outcome prediction, and drug target prediction developed within the GeneCloud project. Our approach is to realize a data-centric security method to be able to compute on encrypted or blinded data in any non-trustworthy environment accessible by the user.
- ZeitschriftenartikelExperimental Generation of Configurable Circuits for Rotationally Symmetric Functions(PARS-Mitteilungen: Vol. 31, Nr. 1, 2014) Doering, Andreas C.With increasing one-time costs for the production of integrated circuits, the drive to integration of configurable circuits together with standard processor cores and interface will increase. So far, either established FPGA fabrics (e.g. Xilinx ZYNQ family) have been used or the configurable units were custom designed for a very specific function (e.g. PowerEN EFSM – TBD). It is therefore of interest to investigate the structures and algorithms for configurable circuits for a well-defined set of functions. As a first step, this paper investigates the class of functions which are invariant under cyclic shifts of their input vectors.