Cray XD1: Kampf den Cluster-Computern

Schneller Interconnect

Das Cray-RapidArray-Interconnect zeichnet sich durch eine hohe Bandbreite und geringe Latenzzeit aus. Es nutzt zwölf eigene Kommunikationsprozessoren und ein 96-GByte/s-non-blocking-Switching-Fabric pro Chassis. Damit stellt Cray eine theoretische Bandbreite von acht GByte/s zwischen jedem der Knoten aus zwei Opterons in SMP-Topologie (Symmetrischer Multiprozessor) bereit. Davon stehen effektiv 5,8 GByte/s pro Knoten zur Verfügung. Die MPI- (Message Passing Interface) Latenz liegt bei 1,6 Mikrosekunden.

Zur Verbindung mehrerer Chassis verfügt jedes über 24 externe RapidArray-Interchassis-Links mit einer Bandbreite von insgesamt 48 GByte/s. Die Hardware unterstützt MPI (Message Passing Interface), shmem (eine verbreitete, Cray-spezifische Kommunikationsbibliothek) und Bibliotheken für globale Arrays. Für eine höhere Geschwindigkeit kann die zugehörige Kommunikations-Software den Linux-Kernel umgehen. Mit den Interconnects lassen sich beliebige Netzwerktopologien aufbauen wie etwa Fat Tree, Torus, und Hypercube.

Zieht man als Maß für die Ausgewogenheit eines Höchstleistungsrechners das Verhältnis Bytes pro Flops heran, so liegt nach Crays Angaben die XD1 bei 1 Byte/Flop. Dieser Wert entspricht auch dem der legendären Cray T3E/1200. Ein typisches Cluster aus Intel Xeons mit Myrinet-Interconnect soll laut Cray nur 0,05 Byte/Flop erreichen, Power5-Systeme rund 0,13 Byte/Flop. Damit ist die XD1 für kommunikationsintensive Aufgaben bestens geeignet und kann ihre theoretische Spitzenleistung auch bei realen Anwendungen gut umsetzen. Cray adressiert daher auch den Engineering-Markt und kooperiert mit den entsprechenden Software-Häusern, um die Programmpakete für das System zu optimieren.