Massiv: Cray XT3 Red Storm

Schlüsselstelle Interconnect

Das wesentliche Unterscheidungsmerkmal von Cray gegenüber der Konkurrenz ist das eigene Verbindungsnetzwerk mit hoher Bandbreite und niedriger Latenzzeit. Jeder einzelne Opteron-Prozessor ist direkt an das TX3 Verbindungsnetzwerk über den Seastar getauften Routing- und Kommunikationschip angebunden. Der Seastar-Router tauscht die Daten mit Hochgeschwindigkeit mit sechs benachbarten Knoten in einer 3D-Torus-Topologie aus. Die bidirektionale Spitzenbandbreite eines Links beträgt 7,6 GByte/s, die Dauerübertragungsrate bis zu 4 GByte/s.

Das Cray RAS (Reliability, Availability, Serviceability) Management System (CRMS) ist unabhängig von der TX3 und besitzt eigene Kontrollprozessoren und ein eigenes Kommunikationsnetzwerk, um die Hard- und Software-Komponenten zu visualisieren und zu managen. Das CRMS soll Probleme schon im Vorfeld erkennen und kritische Komponenten ausblenden. So sorgt es dafür, dass das restliche System ungestört weiter arbeiten kann. Cray will damit eine mittlere Zeit zwischen Fehlern von 400 Stunden (MTBF) bei 1000 Prozessoren sicherstellen. Daneben bietet RAS auch eine Wiederaufsetzmöglichkeit bei unerwarteten Hard- oder Software-Fehlern.

Bill Camp, Sandia Director of Computers, Computation, Information and Mathematics erwartet sich daher einiges von Red Storm:" Wir können durch das extrem ausgewogene System deutlich mehr echte Arbeit auf dem Rechner leisten, und das zu geringeren Gesamtkosten". Besonders erfreut ist er darüber, dass ihm im nächsten Jahr ein einfacher Prozessortausch mit dem Dual-Core Opteron annähernd die doppelte Rechenleistung bieten wird. (ala)