Deutschlands schnellster Supercomputer

29.12.2004 von UWE HARMS 
Das Leibniz-Rechenzentrum in München erhält Deutschlands Nationalen Höchstleistungsrechner. Der HLRB II basiert auf SGIs Itanium-Plattform und soll mit seinen 6656 CPUs eine Rechenleistung von 69 TFlop/s bieten.

Am 16. Dezember 2004 wurden in der Bayerischen Akademie der Wissenschaften die Verträge für Deutschlands schnellsten Supercomputer unterzeichnet. Der Vorsitzende der 1759 gegründeten Akademie, Professor Heinrich Nöth, und der Vorsitzende des Direktoriums des Leibniz-Rechenzentrums (LRZ), Professor Heinz-Gerd Hegering, platzierten gemeinsam mit Robert Übelmesser vom Supercomputer-Hersteller SGI ihre Unterschriften unter den Beschaffungsvertrag.

Die Kosten für den neuen HLRB II (Höchstleistungsrechner in Bayern) betragen 38 Millionen Euro. Diese teilen sich der Bund und das Land Bayern. Die Betriebskosten in Höhe von 3 Millionen Euro pro Jahr übernimmt das Land Bayern allein. Installiert wird der neue Rechner in einem Neubau des Leibniz-Rechenzentrums auf dem Campus der TU München in Garching. Das neue Gebäude schlägt zusätzlich mit etwa 45 Millionen Euro zu Buche.

Nach einer europaweiten Ausschreibung und einer Analyse von Benchmarks mit realen Anwendungen entschied sich das LRZ für Systeme von SGI als Plattform. Die noch unter dem Codenamen "Tornado" laufenden Rechner sind Nachfolger der aktuellen SGI Altix-Linie. Der Ausbau am LRZ erfolgt in drei Schritten.

Mehrstufiger Ausbau

Als Interimslösung installiert SGI Mitte 2005 zunächst ein Itanium-System mit 54 Prozessoren, 256 GByte Speicher und 6 TByte Plattenspeicher. Auf diesem Rechner sollen die zukünftigen Benutzer des HLRB II ihre Programme schon vorab portieren und für die neue Architektur optimieren.

In der nächsten Stufe, die voraussichtlich im März 2006 in Betrieb geht, liefert SGI die Basis des HLRB II mit 5120 Itanium-Prozessoren. Die verbauten Dualcore-CPUs mit Codenamen "Montecito" sollen für eine Spitzenleistung von 33 TFlop/s sorgen. Verglichen mit den 2 TFlop/s des aktuellen LRZ-Spitzenrechners, einer Hitachi SR8000, bedeutet dies einen großen Sprung nach vorne. Auch beim Speicher legt der HLRB II deutlich zu. Er wächst von den 1,3 TByte der Hitachi auf 20 TByte, der Plattenplatz steigt von aktuell 10 TByte auf 340 TByte.

Seine volle Leistung soll der Nationale Höchstleistungsrechner in seiner Endausbaustufe ab Juni 2007 erbringen. Dann ersetzt SGI die Intel Montecito- Prozessoren im laufenden Betrieb durch deren Nachfolger mit Codenamen Montvale. Zudem sollen sich dann 6656 der neuen Itanium-Prozessoren die Arbeit teilen und so eine Spitzenleistung von 69 TFlop/s bieten. Dies entspricht mehr als einem Faktor 30 zur bisherigen Hitachi SR8000 und würde für Platz zwei der aktuellen Supercomputer-Rangliste genügen. Der Hauptspeicher soll sich im Zuge dieses Upgrades ebenfalls auf 40 TByte und der Plattenspeicher auf 660 TByte annähernd verdoppeln.

Wenn das System komplett ausgebaut ist, wird es aus über 100 Racks bestehen, die 100 Tonnen wiegen und eine Standfläche von etwa 250 m² einnehmen. Die Leistungsaufnahme für Betrieb und Lüftung wird auf knapp 1 MWatt taxiert. Eine Wasserkühlung ist jedoch nicht erforderlich, da das System auf einem 2 m hohen Unterboden stehen wird, der für hohen Luftdurchsatz ausgelegt ist.

Anwendungsspektrum

Das LRZ hat den SGI-Rechner auf Grund der Anwendungsleistung bei realen Programmen ausgewählt. Sie stammen aus den Bereichen:

Diese sechs Applikationen gehören zu den rechenintensivsten aus 200 Programmen, die derzeit auf der Hitachi SR8000 laufen. Daneben testete das LRZ auch Kernmodule wie die Matrizenrechnung. Diese kommt in fast jeder naturwissenschaftlichen Anwendung als Library zum Einsatz.

Das LRZ untersuchte auch das Verhalten der SGI-Rechner bei verschiedenen Parallelverarbeitungsparadigmen. So ist ein Teil der Programme für MPI (Message Passing Interface) ausgelegt. Dieser Typ kommt vor allem bei Clustern mit verteiltem, unabhängigem Speicher zum Einsatz. Ein anderer Teil nutzt OpenMP-Compiler-Direktiven und erzeugt damit Threads, die auf einem gemeinsamen Speichermodell basieren. Dazwischen waren auch Hybridansätze im Test.

In fünf der sechs Applikationen zeigte SGIs ccNUMA-Architektur, die den auf die Rechnerknoten verteilten Speicher als gemeinsamen, einheitlich adressierbaren Bereich darstellt, die beste Leistung. Dieses Konzept vereinfacht zudem die Programmierung von parallelen Anwendungen erheblich.

Deutsche, Europäische (und Bayerische) Höchstleistungsrechner

In Deutschland können Wissenschaftler für große Rechenaufgaben drei Zentren nutzen: das Forschungszentrum Jülich, das Höchstleistungsrechenzentrum Stuttgart und das LRZ. Die Forscher beantragen dort Kapazität für ihre Projekte, die ein Lenkungsausschuss fachlich prüft und dann eine entsprechende Rechenzeit zuweist. In Bayern stellt die DFG (Deutsche Forschungsgemeinschaft) die Hälfte der Mitglieder, die andere Hälfte kommt aus Bayern.

Jedoch stellte der Wissenschaftsrat der Bundesregierung im November fest, dass dieses Konzept nicht mehr konkurrenzfähig ist. Um im internationalen Wettbewerb mit den USA, Japan und China künftig bestehen zu können, ist demnach ein fortlaufender qualitativer und quantitativer Ausbau der Rechnerversorgung unverzichtbar. Da sich die Kosten für international führende Höchstleistungsrechner jedoch auf rund 200 Millionen Euro belaufen und ein einzelnes Land dies nur mit Mühe finanzieren kann, empfiehlt der Wissenschaftsrat, Höchstleistungsrechner künftig durch den Zusammenschluss auf europäischer Ebene einzurichten. Das LRZ hofft nun, mit dem neuen Gebäude und dem HLRB II als europäisches Zentrum gewählt zu werden.

Kommende Forschungsprojekte sollen den neuen Rechner vor allem für die Simulation komplexer Systeme in der Physik, Materialforschung, Strömungsdynamik, Astrophysik, Chemie sowie den Geo- und Biowissenschaften nutzen. Beispiele hierfür sind die Untersuchung von Turbulenzen, Strömungen in porösen Gebilden, Entstehung und Ausbreitung von Schall, Hochtemperatur-Supraleitern und Formgedächtnismaterialien. Aber auch chemische Reaktionen bei Verbrennungs- und Katalyseprozessen, die Ausbreitung von seismischen Wellen sowie die Sequenzierung und Strukturanalyse von Proteinen soll der neue Deutsche Supercomputer berechnen.

Der Bayerische Hochleistungsrechner

Gleichzeitig, aber unabhängig von der Beschaffung des nationalen Hochleistungsrechners, hat das LRZ einen Nachfolger für den betagten Landesvektorrechner Fujitsu VPP700 bestellt. Dieser ist mit seinen 114 GFlop/s nicht mehr konkurrenzfähig und war bereits im Juni 2002 nicht mehr in den Top500 der schnellsten Supercomputer vertreten.

Auch hier kam SGI mit einem Altix-Bx2-System zum Zuge. 128 Itanium2-Prozessoren (6 MByte Cache, 1,6 GHz), 512 GByte Hauptspeicher und 11 TByte Plattenplatz stehen den Anwendern zur Verfügung. Dieser Rechner wird als Shared-Memory (gemeinsamer Speicher)-Plattform genutzt. Die wesentlichen Anwendungen kommen aus den Gebieten der Quantenchemie, Physik und Strömungsdynamik. Die Installation der Altix-Bx2 soll bereits Anfang 2005 erfolgen. (ala)