Fault-Tolerance Techniques for High-Performance Computing
96,29 €*
Nach dem Kauf zum Download bereit Ein Downloadlink ist wenige Minuten nach dem Kauf im eigenen Benutzerprofil verfügbar.
ISBN/EAN:
9783319209432
This timely text presents a comprehensive overview of fault tolerance techniques for high-performance computing (HPC). The text opens with a detailed introduction to the concepts of checkpoint protocols and scheduling algorithms, prediction, replication, silent error detection and correction, together with some application-specific techniques such as ABFT. Emphasis is placed on analytical performance models. This is then followed by a review of general-purpose techniques, including several checkpoint and rollback recovery protocols. Relevant execution scenarios are also evaluated and compared through quantitative models. Features: provides a survey of resilience methods and performance models; examines the various sources for errors and faults in large-scale systems; reviews the spectrum of techniques that can be applied to design a fault-tolerant MPI; investigates different approaches to replication; discusses the challenge of energy consumption of fault-tolerance methods in extreme-scale systems.
Autor: | Thomas Herault, Yves Robert |
---|---|
EAN: | 9783319209432 |
eBook Format: | |
Sprache: | English |
Produktart: | eBook |
Veröffentlichungsdatum: | 01.07.2015 |
Kategorie: | |
Schlagworte: | Algorithm-Based Fault Tolerance Fault-Tolerance Fault Predictors High-Performance Computing Resilience Silent Errors |
Anmelden
Möchten Sie lieber vor Ort einkaufen?
Haben Sie weiterführende Fragen zu diesem Buch oder anderen Produkten? Oder möchten Sie einfach doch lieber in der Buchhandlung stöbern? Wir sind gern persönlich für Sie da und beraten Sie auch telefonisch.
Buchhandlung Marabu
Telegrafenstr. 44
42929 Wermelskirchen
Telefon: 02196/1414
Mo – Fr09:00 – 18:00 UhrSa09:00 – 13:30 Uhr