Feiltoleranse
Tilgjengelighet er den viktig del av High Performance Computing. Tilgjengelighet er et mål på systemet som hvor mye tid som system er tilgjengelig. Et system kan ikke være i tilgjengelig tilstand på grunn av maskinvare eller programvare. Løsningen på svikt i systemet vi har å gjøre systemet feiltolerant.
For å unngå maskinvarefeil, kan vi bygge feiltolerante hardware hvor systemer dekomponeres i moduler; ved å dele systemet opp i moduler feil er isolert til moduler og vi kan hindre aktivering av andre typer feil, overflødig maskinvare også kan brukes. For å lage programvare feiltolerant, kan wrapper og foryngelse teknikker brukes [5].
Programmering for parallelle datamaskiner
Som tungregning har en kompleks arkitektur som gjør programmeringen mer komplisert. Vi kan løse dette problemet ved å innføre nye programmeringsmodeller.
Disse programmeringsmodeller kan spille en rolle bro mellom programmering og hardware. Balansen mellom produktivitet og effektivitet er nøkkelen mens implementere disse programmeringsmodeller [6] [7]
Referanser
[1] ML Fisher, "Optimal løsning for planlegging Problemer med å bruke Lagrange multiplikatorer.: Del I, " drift forskning , vol. 21, no. 5, pp. 1114-1127, september 1973. [2] M. Naiouf, L. De Giusti, F. Chichizola, og A. De Giusti, "Dynamic Load Balancing på ikke-homogene Clusters, "i Frontiers of High Performance Computing og Nettverk-ISPA 2 006 Workshops , 2006, s. 65-73. [3] C. Kopparapu, Load Balancing servere, brannmurer, og Caches . New York: John Wiley & Sons, Inc., 2002. [4] DA Wheeler, "Secure Programming for Linux og Unix HOWTO" på s. 00, 2003. [5] F. Piedad, High Availability: Design, Teknikker, og Prosesser . 2001. [6] WD Gropp, "Performance drevet Programmimg modeller," i Massivt parallell programmering Models, 1997. Proceedings. Tredje Working Conference on , 1997, pp 61-67 [7] K. Asanović et al, andre, Landskapet i parallell databehandling forskning:... En visning fra Berkeley
. CiteSeer 2006. Problemer i High Availability