10 Teraflops im Eigenbau

Der Weg zum Terascale-Cluster

Bei der Anschaffung eines neuen Hochleistungsrechners für das Virginia Polytechnic Institute schränkte ein enges Budget die Auswahl stark ein. Daher schieden Komplettsysteme der einschlägigen Supercomputer-Anbieter aus. Off-the-shelf-Rechner, bestehend aus Standardkomponenten von der Ladentheke, schienen die richtige Lösung zu sein.

Verhandlungen mit Dell über ein Intel Itanium-2-System scheiterten aber aus Kostengründen. Als Nächstes evaluierte die Hochschule 64-Bit-Rechner von IBM, AMD und Hewlett-Packard. IBM-Rechner mit dem PowerPC 970 schieden durch den späten Liefertermin (frühestens Anfang 2004) aus. Die Computer der anderen Hersteller waren bei der geplanten Rechenleistung mit neun bis elf Millionen US-Dollar allein für die Rechner-Hardware zu teuer.

Apple kündigte jedoch schon im Juni 2003 den G5 mit IBM PowerPC-970-Prozessor an - eine neue Chance für Virginia Tech. Projektleiter Dr. Srindhi Varadarajan - der bis dahin noch nie an einem Apple-Computer gearbeitet hatte - nahm mit Apple Kontakt auf und evaluierte, ob sich der G5 für den geplanten Rechner eigne.

Die PowerPC-970-CPU im G5 basiert auf IBMs Power4-Architektur, enthält aber statt der dabei üblichen vier nur einen Prozessor. Dafür bietet die "Billigversion" über die extra für Apple hinzugefügte AltiVec-Einheit eine SIMD-Unterstützung (Single Instruction Multiple Data). Die SIMD-Spitzenleistung bei 2 GHz Takt liegt bei 16 GFlop/s, parallel dazu stehen theoretisch sogar noch einmal 8 GFlop/s aus den beiden klassischen Arithmetikeinheiten zur Verfügung.

Wird etwa ein bestehendes Fortran-Programm mit dem VAST-Präprozessor in ein C-Programm mit VMX-Befehlen (Vektorbefehlen) umgewandelt, kann es die SIMD-Einheiten ohne Anpassungen nutzen. Durch diese etwas umständlich anmutende Technik konnte man aber beispielsweise bei der BLAST-Suche, dem Vergleich von Genketten, einen Leistungszuwachs um den Faktor 2 bis 3 erzielen.