Die schnellsten Rechner der Welt

TOP500 7/2006: Supercomputing-Rangliste und HPC-Trends

03.07.2006 von Dr. Norbert Eicker
Auf der Internationalen Supercomputer Conference in Dresden wurde die aktuelle Liste der schnellsten Computer der Welt vorgestellt. Neben der Rechenleistung zeigt sie bemerkenswerte Trends für die Zukunft des High Performance Computing auf.

Als Maßstab für die inzwischen 27. Auflage der Rangliste dient das Linpack-Programm, ein synthetischer Benchmark aus dem Bereich der linearen Algebra. Dabei gilt es, große, dicht besetzte lineare Gleichungssysteme zu lösen. Die Köpfe hinter dem seit 1993 bestehenden TOP500-Projekt sind Hans Meuer (Universität Mannheim), Erich Strohmeier und Horst Simon (beide NERSC/Lawrence Berkley National Laboratory) sowie Jack Dongarra (University of Tennessee, Knoxville), der Vater des Linpack-Benchmarks.

Traditionell erscheint die Liste halbjährlich: Im November im Rahmen der Supercomputer Conference in den USA sowie im Juni auf der Internationalen Supercomputer Conference (ISC). Diese Veranstaltung ist nach fünf Jahren in Heidelberg in diesem Jahr nach Dresden übergesiedelt.

Der stärkste Computer der Welt steht weiterhin in den USA am Lawrence Livermore National Laboratory. Es handelt sich hierbei um ein BlueGene/L-System von IBM mit 131.072 Prozessoren, das bereits die letzte TOP500-Liste souverän anführte. Die maximale Rechenleistung dieses Rechners beim Linpack-Problem beträgt 280 TFlops, 280 Billiarden Fließkomma-Operationen pro Sekunde.

Zum Vergleich: Ein typischer, heute aktueller PC-Prozessor erreicht bei diesem Problem eine Leistung von etwa 4 GFlops. Diese Leistung hätte vor zehn Jahren noch genügt, um in die TOP500 der schnellsten Rechner der Welt zu gelangen. Mittlerweile sind 2026 GFlops notwendig, um in den erlauchten Kreis aufgenommen zu werden. Das Schlusslicht der Liste erreicht diese Leistung durch 1028 Xeon-CPUs mit 2,8 GHz.

Die bemerkenswertesten Verfolger

Der schnellste Rechner in Europa landet auf Platz 5. Er ist in Frankreich beim Commissariat à l'Energie Atomique (CEA) zu finden. Dieses System wurde von der französischen Firma Bull konstruiert und stellt damit eines der wenigen Systeme der Liste dar, das nicht in den USA entwickelt wurde. Es basiert auf mit Itanium2-Prozessoren bestückten Bull NovaScale-5160-Systemen, die mit einem Netzwerk der britischen Firma Quadrics verbunden sind.

Die Maschine bei CEA ist eines von drei neuen Systemen unter den ersten zehn der TOP500. Die beiden anderen sind ein Opteron-basierter SUN-Cluster am GSIC Center des Tokyo Institute of Technology auf Rang 7 sowie ein BlueGene/L-System am Forschungszentrum Jülich auf Position 8. Das in der letzten Liste noch schnellste europäische System, die Mare-Nostrum-Maschine in Barcelona, fiel hingegen auf Platz 11 zurück.

Das japanische System ist in doppelter Hinsicht bemerkenswert: Zum einen ist es das erste japanische System, das schneller ist als der Earth Simulator, der die TOP500-Liste von 2002 bis 2004 anführte. Zum anderen basiert dieses System auf US-Technologie, während die früheren großen japanischen Systeme mit Vektorprozessoren japanischer Hersteller ausgestattet waren. Interessant ist auch die Ausstattung der Maschine mit SIMD-Koprozessoren der britischen Firma ClearSpeed, die zwar bei der Ausführung des Linpack-Programms nicht zum Einsatz kamen, jedoch zu einer signifikanten Beschleunigung der eigentlichen wissenschaftlichen Anwendungen beitragen.

Auffällig an der aktuellen Liste ist die Dominanz der BlueGene-Systeme bei den wirklich großen Systemen. Diese Architektur wird bei 9 der 20 schnellsten Systeme genutzt. Sie basiert auf Power-PC-Prozessoren, die aus Gründen der Energieeffizienz und damit verbundenen Kühlungsproblemen mit nur 700 MHz getaktet sind. Während eine einzelne CPU damit nur über eine relativ bescheidene Rechenleistung verfügt, ermöglicht die geringe Wärmeentwicklung der Prozessoren, sie in großer Anzahl sehr dicht zu integrieren und damit die außergewöhnliche Leistung darzustellen.

Armes Deutschland

Auch der derzeit schnellste deutsche Computer - das JUBL-System des Forschungszentrums Jülich - ist eine BlueGene/L-Maschine. Mit ihr gelang es nach langer Zeit endlich einem deutschen Standort, wieder unter die Top10 der Liste auf Platz 8 vorzustoßen.

Dies kann jedoch nicht darüber hinwegtäuschen, dass Deutschland in den letzten Jahren sowohl im weltweiten als auch im europäischen Vergleich zurückgefallen ist: Mittlerweile ist Deutschland mit nur noch 17 Systemen in der Liste vertreten und liegt damit deutlich hinter Nationen wie Großbritannien (35), Japan (29) und China (28). Dies sah vor fünf Jahren noch ganz anders aus, als Deutschland noch 60 Einträge stellte.

Zwar fällt auch Europa als Ganzes gegenüber anderen Kontinenten zurück; schaut man genauer hin, stellt man jedoch fest, dass die Abnahme der Systeme hier im Wesentlichen auf den Abstieg Deutschlands zurückzuführen ist.

Deutschlands Schnellster: Der JUBL aus Jülich landet mit 37.330 TFlops auf Platz 8 der TOP500-Liste. (Quelle: FZ-Juelich.de)
Foto: IBM

Der Rückgang der leistungsfähigen Systeme in Deutschland ist insbesondere deshalb problematisch, da die Maschinen der TOP500-Liste sowohl für die Wissenschaft als auch für Forschung und Entwicklung in der Industrie wesentliche Werkzeuge sind. Wenn solche Systeme für Wissenschaftler in Deutschland nur noch in beschränktem Umfang zur Verfügung stehen, sind viele Bereiche international nicht mehr konkurrenzfähig.

Dies trifft zunächst Disziplinen, die bereits heute ohne solche Rechner nicht mehr auskommen, wie etwa die Grundlagenforschung in Physik und Chemie. Auch laufen zukunftsträchtige Bereiche der Lebenswissenschaften, die mehr und mehr auf Computer-basierte Methoden zurückgreifen, Gefahr, deutlich in ihrer Entwicklung behindert zu werden.

Im Kontrast zur Situation in Deutschland wird in den USA und in Japan -- sowie in letzter Zeit auch verstärkt in China -- massiv in diesem für die Forschung als Ganzes strategisch wichtigen Feld investiert.

Aktuelle Trends

Die mittlerweile 13-jährige Tradition der TOP500-Liste erlaubt es einerseits, die Entwicklung im Bereich des Supercomputing in diesem Zeitraum nachzuzeichnen. Andererseits ermöglicht sie jedoch auch, neue Trends frühzeitig zu erkennen und entsprechend zu bewerten.

In diesem Zusammenhang interessant ist die Entwicklung bei den verwendeten Architekturen, Prozessoren und Netzwerken. So ist die Liste mittlerweile eindeutig durch Cluster-Systeme dominiert, bei denen herkömmliche Server-Systeme mit mehr oder weniger speziellen Netzwerken zu großen Parallelsystemen zusammengeschaltet werden.

Diese Architektur hat insbesondere die Vektorsysteme, die die frühen Ausgaben der Liste dominiert haben, weit gehend verdrängt. Bemerkenswert ist, dass die als MPP bezeichnete Architektur massivparalleler Computer mittlerweile insbesondere bei den sehr leistungsfähigen Systemen eine Renaissance erlebt. Sie ist vor allem getragen von den BlueGene/L-Systemen der Firma IBM, allerdings haben auch einige Cray XT3-Systeme einen Anteil daran. Der starke Beitrag der großen Systeme spiegelt sich zudem darin wider, dass der Anteil von MPP-Systemen an der installierten Rechenleistung deutlich größer ist als ihr Anteil an der reinen Zahl der Systeme in der Liste.

Blade-Cluster im Kommen

Ein weiterer Trend ist, dass Cluster mehr und mehr mit Blade-Systemen realisiert werden, die eine deutlich dichtere Bauweise zulassen und damit wertvollen Platz in den Rechnerräumen sparen.

Getrieben durch die vielen Cluster-Systeme stellen mittlerweile herkömmliche Server-Prozessoren einen Großteil der Recheneinheiten der in der TOP500-Liste vertretenen Maschinen. Analog zum klassischen Markt kleiner Server wird auch die Supercomputer-Rangliste von Intel mit 265 Systemen auf Xeon- beziehungsweise Pentium-4-Basis dominiert.

Allerdings holt AMD hier in letzter Zeit stark auf und rüstet mittlerweile 80 Systeme mit seinen Opteron-Prozessoren aus. Auffallend ist, dass der Anteil der Systeme mit Itanium-Prozessoren in der neuesten Liste von 46 auf 37 zurückging. Dies ist sicherlich auch auf die Verspätung der Dual-Core-Itanium-Prozessoren (Montecito) zurückzuführen. IBMs Power-CPUs können sich vor allem durch die BlueGene/L-Systeme behaupten.

Ethernet und Linux auf dem Vormarsch

Bei den Netzwerken stellt Gigabit-Ethernet mittlerweile mehr als 50 Prozent der Einträge in der Liste. Die zugehörigen Maschinen sind jedoch bevorzugt in der unteren Hälfte zu finden. Sie werden vermutlich auch nur zu einem kleinen Teil für die klassischen Anwendungen des Parallelrechnens aus Wissenschaft, industrieller Forschung und Entwicklung eingesetzt.

Bei den leistungsstärkeren Systemen ist hingegen eine Vielfalt von Netzwerken zu beobachten, wobei es keinen klaren Spitzenreiter gibt. Die Spanne reicht hier von Standardnetzwerken wie Myrinet und Infiniband bis hin zu spezielleren Systemen wie Quadrics. Vor allem in den MPP-Systemen sind zudem proprietäre Lösungen der jeweiligen Hersteller vorherrschend.

Bei den Betriebssystemen ist Linux mittlerweile mit mehr als 60 Prozent dominant. Der Rest wird fast vollständig durch die verschiedenen Geschmacksrichtungen von Unix abgedeckt. Zwei Systeme mit Microsoft Windows stellen in diesem Bereich noch exotische Lösungen dar. Allerdings investiert Microsoft massiv in diesem Markt und hat das offizielle Erscheinen des Windows Compute Cluster Server 2003 nun schließlich für August in Aussicht gestellt.

Fazit

Zusammenfassend fällt auf, dass die durchschnittliche Zahl der Prozessoren der Systeme in der TOP500 weiter zunimmt. Dies ist zum geringeren Teil in den MPP-Systemen begründet. Es spiegelt jedoch auch die Tatsache wider, dass die Taktrate der Prozessoren im letzten Jahr nur noch moderat gestiegen ist. Ein signifikantes Anwachsen der Gesamtleistung ist somit nur noch durch den Einsatz von mehr Rechenkernen möglich.

Interessant ist auch der Trend zu Low-Power-Prozessoren gerade im Bereich der schnellsten Systeme. Die Leistung des führenden BlueGene/L-Systems wäre vermutlich mit Hochleistungsprozessoren nicht zu verwirklichen, da deren Kühlung bei hohen Stückzahlen nicht mehr zu handhaben ist. Die überragende Rechenleistung der BlueGene-Maschinen wird vielmehr durch eine massive Parallelität der Prozessoren realisiert.

Ob die mit dem Linpack-Benchmark ermittelte Leistung in den Anwendungen wirklich nutzbar und die Parallelität tatsächlich handhabbar ist, hängt stark vom Anwendungsfeld und der Investition in die Software ab. Es ist klar, dass sich die MPP-Systeme nur für ausgesuchte Anwendungsfelder eignen.

Ein anderer Trend, der sich abzuzeichnen scheint, ist der verstärkte Einsatz von Hochleistungssystemen in weniger stark von Wissenschaft, Forschung und Entwicklung geprägten Bereichen. Darauf deutet auch die hohe Investition von Microsoft im Bereich Cluster-Computing hin. Diese könnte einen weniger technisch geprägten Markt für die Methoden und Systeme des Hochleistungsrechnens erschließen. (ala)