Zeitschriftenartikel
Fehlerbehandlung in komplexen nebenläufigen Systemen
Vorschaubild nicht verfügbar
Volltext URI
Dokumententyp
Text/Journal Article
Zusatzinformation
Datum
1998
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Springer-Verlag
Zusammenfassung
Diese Arbeit beschreibt Methoden zur Behandlung von Fehlern in nebenläufigen Systemen mit hoher Anzahl von Rechenknoten. Die hierfür meist benutzten Verfahren der dynamischen Redundanz beinhalten zum einen eine Systemrekonfiguration zwecks Deaktivierung und funktionellem Ersatz defekter physikalischer Komponenten. Verfahren für fehlertolerantes Routing ermöglichen darüber hinaus auch eine flexible Anpassung des Kommunikationsverkehrs zwischen beliebigen Rechenknoten an Fehler im System. Die Methoden für Rekonfiguration und Routing werden für verschiedene reguläre Systemtopologien (z.B. Arrays, Bäume usw.) sowie für irreguläre Topologien diskutiert. Abschließend wird dargestellt, wie nach der Phase der Rekonfiguration durch Methoden der sog. Recovery auch die Korrektheit der Daten im System wiederhergestellt werden kann. Summary This paper describes methods for the treatment of faults in concurrent systems containing a high number of computing nodes. Here, methods of dynamic redundancy imply a system reconfiguration to deactivate and replace faulty physical components. In addition, fault-tolerant routing allows to flexibly adapt the communication traffic between arbitrary nodes to fault patterns in the system. Reconfiguration and routing methods are described for several regular system topologies, e.g. arrays, trees etc. as well as for irregular ones. Finally, we discuss how after system reconfiguration the correctness of system data can be restored by so-called recovery techniques.