Fouttolerantie
Beschikbaarheid is de belangrijk aspect van High Performance Computing. Beschikbaarheid is de maat van het systeem hoeveel tijd die systeem beschikbaar. Een systeem kan niet in de beschikking staat als gevolg van hardware of software storing.
De oplossing voor het falen van het systeem moeten we de systeemfout tolerant maken. Voor het vermijden van hardwarestoringen, kunnen we fouttolerante hardware waar de systemen worden ontleed in modules op te bouwen; door het verdelen stelsel in modules mislukkingen geïsoleerde modules en kunnen we de activering van andere storingen te voorkomen, redundante hardware kan ook worden gebruikt. Voor het maken van software fault tolerant, kan wrapper en verjonging technieken worden gebruikt [5].
Programming voor parallelle computers
Als High performance computing heeft een complexe architectuur die programmering complexer maakt. We kunnen dit probleem op te lossen door de invoering van de nieuwe programmering modellen. Deze programmering modellen kunnen een rol van brug tussen programmering en hardware te spelen. De balans tussen productiviteit en efficiency is de sleutel, terwijl de uitvoering van deze programmering modellen [6] [7]
Referenties
[1] ML Fisher, "optimale oplossing van Scheduling Problemen Met behulp van Lagrange multipliers.
: Deel I, " Operations Research , vol. 21, nr. 5, blz. 1114-1127, september 1973. [2] M. Naiouf, L. De Giusti, F. Chichizola en A. De Giusti, "Dynamic Load Balancing op niet-homogene Clusters, "in de Frontiers van High Performance Computing and Networking-ISPA 2006 Workshops , 2006, p. 65-73. [3] C. Kopparapu, Load Balancing Servers, Firewalls, en Caches . New York: John Wiley & Sons, Inc., 2002. [4] DA Wheeler, "Secure Programming voor Linux en Unix HOWTO ', p. 00, 2003. [5] F. Piedad, High Availability: Ontwerp, technieken en processen . 2001. [6] WD Gropp, "Prestaties gedreven programmeren hebt modellen," in de Massively Parallel Programming Models, 1997. Proceedings. Derde werkconferentie , 1997, pp 61-67 [7] K. Asanović et al, anderen, Het landschap van de parallel computing Deel IIProblemen in High Availability