Neue Xeon-CPUs von 50 bis 120 Watt fordern Opteron

Energie-Test: Performance pro Watt bei Quad-Core-CPUs

10.09.2008 von Christian Vilsbeck
Die Performance des Xeon 5400 mit 45-nm-Technologie überzeugt. Von der 50-Watt-Xeon-Version mit 2,66 GHz bis zum 3,33-GHz-Xeon-Modell mit 120 Watt ist alles vorhanden. Wo bekommt man mehr Performance für die konsumierte Energie? Mit SPECpower werden Energieverschwender entlarvt.

Green IT ist in aller Munde; besonders in den Marketing-Abteilungen darf dieses Buzzword nicht fehlen. Den Endkunden interessieren aber grüne Sprüche wenig. Was zählt, ist: Welche Performance bekomme ich und was kostet mich der Spaß an Energie pro Jahr? Sind die Ansprüche an die erforderliche Rechenleistung erfüllt, so wird der Energiespargedanke natürlich interessant. Wenn der Administrator seinem Finanzvorstand belegen kann, bei unverminderter oder gar höherer Performance durch neue Hardware spare das Unternehmen eine belegbare Summe an Energiekosten, so ist die Investition schnell getätigt.

Dass der Energieaspekt stets wichtiger wird, haben natürlich längst auch die Prozessorhersteller entdeckt. Von Energieeffizienz ist die Sprache, nicht mehr nur von purer Performance. So bewirbt Intel bei seinen aktuellen Xeon-Prozessoren mit 45-nm-Technologie einen deutlich geringeren Energiebedarf bei gleicher Taktfrequenz als bei den 65-nm-Vorgängermodellen der Xeon-5300-Serie.

Energiesparer: Intels neuer Quad-Core-Prozessor Xeon L5430 arbeitet mit 2,66 GHz Taktfrequenz. Die 45-nm-CPU für den Sockel LGA771 ist mit nur 50 Watt TDP spezifiziert.

Damit nicht genug, führt Intel jetzt zusätzliche Xeon-5400-CPUs mit dem neuen E-Stepping ein. Der Energiebedarf der Quad-Core-Prozessoren sei damit nochmals deutlich gesenkt worden. So bietet Intel jetzt einen Xeon L5430 mit 2,66 GHz bei einem TDP-Wert von nur 50 Watt an. Am oberen Ende warten der neue Xeon X5470 mit 3,33 GHz und 120 Watt TDP sowie der Xeon X5492 mit 3,4 GHz und 150 Watt TDP auf. Doch diese Thermal Design Power der CPUs wird in der Praxis von den Prozessoren nie ausgereizt. Hier helfen nur reale Messungen, wie sparsam eine CPU im Server wirklich arbeitet.

Mit dem Benchmark SPECpower_ssj2008 der Standard Performance Evaluation Corporation (SPEC) lässt sich die Energieeffizienz von Servern unter einheitlich festgelegten Bedingungen messen und damit vergleichen. Welche Performance pro Watt ein System mit unterschiedlichen Prozessoren liefert, lässt sich damit ebenso feststellen wie der Vergleich kompletter Server mit verschiedenen Architekturen. Mit SPECpower_ssj2008 kann man auch die Effizienz der CPU-Strompartechnologien SpeedStep von Intel und PowerNow! von AMD überprüfen.

In einem 2-Sockel-Server Intel „Stoakley“ testen wir den Xeon X5365 (3,0 GHz, 120 Watt, 65 nm), Xeon E5472 (3,0 GHz, 80 Watt, 45 nm) sowie die neuen E-Stepping-Xeons L5430 (2,66 GHz, 50 Watt, 45 nm) und X5470 (3,33 GHz, 120 Watt, 45 nm). Als Vergleich dient zusätzlich der Fujitsu-Siemens RX330 S1 mit zwei AMD Opteron 2356.

Neue Quad-Core-Xeons mit sparsamen E-Stepping

Intels Quad-Core-Xeons für 2-Sockel-Systeme gibt es seit November 2007 in der aktuellen 45-nm-Technologie. Die Taktfrequenzen der Xeon-5400-Sierie reicht von 2,0 bis 3,2 GHz. Die Modelle Xeon E5405 (2,0 GHz) bis E5450 (3,0 GHz) arbeiten mit einem FSB1333. Beim Xeon E5462 bis X5482 kennzeichnet die „2“ am Ende der Modellnummer den schnelleren FSB1600.

Im September 2008 erweitert Intel seine 5400er Xeons um drei neue Modelle und einem frischen E-Stepping. Neben den schnelleren Xeon X5470 mit 3,33 GHz Taktfrequenz und FSB1333 gibt des den Xeon X5492 mit 3,4 GHz Taktfrequenz und FSB1600. Zusätzlich präsentiert der Hersteller einen besonders sparsamen Xeon L5430 mit 2,66 GHz Taktfrequenz und FSB1333.

Den neuen Low-Power-Xeon spezifiziert Intel mit einem TDP-Wert von nur 50 Watt. Zwar hat Intel mit dem Xeon L5420 bereits einen 50-Watt-Quad-Core im Angebot, aber nur mit 2,50 statt jetzt 2,66 GHz Taktfrequenz. Das neue Topmodell der Vierkernbaureihe mit 3,4 GHz Taktfrequenz verfügt über einen TDP-Wert von 150 Watt.

Alle neuen Quad-Core-Xeons setzen unverändert zur bisherigen Xeon-5400-Serie auf den LGA771-Steckplatz sowie 12 MByte L2-Cache.

In der Tabelle finden Sie alle Xeon-5400-Prozessoren mit 45-nm-Penryn-Architektur im Überblick:

Intels 45-nm-Quad-Core-Xeons im Überblick

Prozessor

Taktfrequenz [GHz]

FSB [MHz]

L2-Cache

Kerne

TDP [Watt]

Xeon X5492

3,30

1600

2 x 6 MByte

4

150

Xeon X5482

3,20

1600

2 x 6 MByte

4

150

Xeon X5472

3,00

1600

2 x 6 MByte

4

120

Xeon E5472

3,00

1600

2 x 6 MByte

4

80

Xeon E5462

2,80

1600

2 x 6 MByte

4

80

Xeon X5470

3,33

1333

2 x 6 MByte

4

120

Xeon X5460

3,16

1333

2 x 6 MByte

4

120

Xeon X5450

3,00

1333

2 x 6 MByte

4

120

Xeon E5450

3,00

1333

2 x 6 MByte

4

80

Xeon E5440

2,83

1333

2 x 6 MByte

4

80

Xeon E5430

2,66

1333

2 x 6 MByte

4

80

Xeon E5420

2,50

1333

2 x 6 MByte

4

80

Xeon E5410

2,33

1333

2 x 6 MByte

4

80

Xeon E5405

2,00

1333

2 x 6 MByte

4

80

Xeon L5430

2,66

1333

2 x 6 MByte

4

50

Xeon L5420

2,50

1333

2 x 6 MByte

4

50

Xeon L5410

2,33

1333

2 x 6 MByte

4

50

SPECpower: Maximale Java-Performance

SPECpower_ssj2008 ermittelt bei 100 Prozent Prozessorauslastung die maximale Java-Performance des Systems. Als Java-Engine unter Windows Server 2008 Enterprise x64 dient Bea JRockit in der 64-Bit-Version 6 R27.

Vier virtuelle Java-Instanzen, die jeweils mit zwei Threads arbeiten, nutzen alle acht Kerne der 2-Sockel-Systeme voll aus. Bei diesem Test sind die Energiespar-Optionen der Prozessor aktiv, die erreichbare Performance wird durch die Vollauslastung der CPUs allerdings nicht beeinflusst.

Java-Performance: Der Xeon E5472 mit 3,0 GHz arbeitet durch seinen FSB1600 in Kombination mit DDR2-800-FB-DIMMs flinker als das 3,33-GHz-Modell X5470 mit FSB1333 und 667-MHz-Speicher. Der Java-Workload belegt viel Arbeitsspeicher, deshalb besitzt die FSB- und Speichergeschwindigkeit einen Einfluss auf die Performance.

SPECpower: Energieeffizienz Performance/Watt

Der Gesamtwert von SPECpower_ssj2008 steht für die Energieeffizienz des Systems. Der Benchmark gibt die gemittelte Performance pro Watt an, die über alle Lastzustände von 10 bis 100 Prozent gemessenen werden.

Um die Energiesparoptionen der Prozessoren zu nutzen, arbeitet Windows Server 2008 Enterprise x64 mit dem Energieschema „Ausbalanciert“. SpeedStep (Intel) und PowerNow! (AMD) zum dynamischen Regeln von Taktfrequenz und Core-Spannung je nach CPU-Auslastung sind bei den SPECpower-Benchmark aktiv:

Mit Power-Management: Der Intel-Server bietet mit den 80-Watt-Xeons E5472 die höchste Energieeffizienz. Trotz deutlich geringerer Taktfrequenz erreichen die 50-Watt-Xeons annähernd die gleiche Performance pro Watt als die 3,33-GHz-Modelle mit 120 Watt TDP. Mit der 65-nm-Vorgängerversion Xeon X5365 fällt die Energieeffizienz des Intel-Servers deutlich ab. Der Opteron-Server muss sich ebenfalls klar geschlagen geben.

Jetzt wird bei den Energieoptionen von Windows Server 2008 das Schema „Höchstleistung“ ausgewählt. Die Prozessoren arbeiten immer mit voller Taktfrequenz und Core-Spannung. Die dynamischen Power-Management-Funktionen SpeedStep (Intel) und PowerNow! (AMD) sind beim Schema „Höchstleistung“ nicht aktiv.

Im folgenden Diagramm sehen Sie die Auswirkungen des deaktivierten CPU-Power-Managements auf die Energieeffizienz der Systeme:

Ohne Power-Management: Mit inaktivem SpeedStep reduzieren die Xeons die Systemeffizienz um bis zu vier Prozent. Nur der Low-Voltage-Xeon mit 50 Watt TDP bleibt gleich effizient.

SPECpower: Kurven Energieeffizienz

Der Energieeffizienz-Benchmark SPECpower_ssj2008 ermittelt für jeden Lastzustand von 10 bis 100 Prozent die Performance-Watt-Werte der Systeme. Hier zeigt sich: Je höher die Prozessorauslastung ist, desto besser ist die Energieeffizienz des gesamten Systems.

In den Diagrammen wird die Performance/Watt von 10 bis 100 Prozent in den roten Balken dargestellt. Die blaue Kurve zeigt zusätzlich den Energieverbrauch des Systems bei der entsprechenden Prozessorauslastung an. Links in den Bildern sehen Sie jeweils die Ergebnisse mit aktivem Prozessor-Power-Management, rechts bei inaktivem SpeedStep (Intel) oder PowerNow! (AMD):

Xeon X5470 3,33 GHz 120 Watt TDP: Besonders im Teillastbereich von 20 bis 50 Prozent Prozessorauslastung steigert SpeedStep die Energieeffizienz des Servers um bis zu 10 Prozent. Unter sehr hoher Last (ab 70 Prozent) bewirkt SpeedStep nur noch sehr wenig.
Xeon E5472 3,0 GHz 80 Watt TDP: Die Energieeinsparungen im Teillastbereich sind bei dem FSB1600-Modell mit SpeedStep ein wenig geringer als beim Xeon X5470, der das neue E-Stepping besitzt.
Xeon L5430 2,66 GHz 50 Watt TDP: Die blau gekennzeichnete Energiekurve zeigt beim Low-Voltage-Xeon fast einen identischen Verlauf. Entsprechend sind die Performance-Watt-Werte mit und ohne SpeedStep hier sehr ähnlich. Durch geringe Unterschiede in der Core-Spannung und Taktfrequenz (zwischen 2,0 und 2,66 GHz) bewirkt SpeedStep beim Low-Voltage-Xeon wenig.
Xeon X5365 3,0 GHz 120 Watt TDP: Die Vorgängerversion mit 65-nm-Technologie sorgt für ein deutlich schlechteres Performance-Watt-Verhältnis als die aktuelle 45-nm-Generation. SpeedStep arbeitet beim X5365 weniger optimal als bei der 5400er Serie – im Lastbereich zwischen 80 und 100 Prozent sorgt SpeedStep für ein geringfügig schlechteres Performance/Watt-Verhältnis. Im Bereich von 10 bis 50 Prozent arbeitet SpeedStep dagegen optimal.
Opteron 2356 2,3 GHz 80 Watt TDP: AMDs PowerNow!-Technologie erhöht wie Intels SpeedStep die Energieeffizienz des Systems im Teillastbereich zwischen 10 und 50 Prozent. Zwar benötigt der Opteron-Server weniger Energie als das Intel-System mit den Xeons, die Java-Performance ist aber deutlich geringer. Deshalb sind die Performance-Watt-Werte des Opteron in allen Lastbereichen geringer als bei den Xeons.

SPECpower: Maximaler Energieverbrauch

SPECpower_ssj2008 ringt dem Testsystem im Lastzustand 100 Prozent den maximalen Energieverbrauch ab. Alle Kerne der Prozessoren sind voll ausgelastet. Die aktiven JVMs fordern zusätzlich den Arbeitsspeicher der Systeme.

Generationswechsel lohnt: Ein Austausch von zwei Xeon X5365 (65-nm-Technologie) gegen aktuelle Xeon E5472 (45-nm-Technologie) spart bei identischer Taktfrequenz von 3,0 GHz satte 89 Watt. Noch sparsamer geben sich die 50-Watt-Xeons. Auch der AMD-Server Fujitsu Siemens RX330 S1 mit beiden 80-Watt-Opterons geht sparsam mit der Energie um.

SPECpower: Minimaler Energieverbrauch

SPECpower_ssj2008 führt neben den Lasttests zusätzlich Kalibrierungsmessungen über den Energieverbrauch bei Leerlauf durch. Dabei wird der minimale Energiebedarf des Systems ermittelt.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows Server 2008 Enterprise x64 mit dem Energie-Schema „Ausbalanciert“. Die Prozessoren nutzen ihre Power-Management-Features SpeedStep (Intel) und PowerNow! (AMD) aus:

Mit Power-Management: Der 2-Sockel-AMD-Server zeigt sich im Leerlauf sehr genügsam. Unter Volllast noch sparsamer als AMD, benötigt das Intel-System mit den Xeon-L5340-CPUs nun mehr Energie. Im Leerlauf bleiben auch die Unterschiede zwischen den 50-, 80- und 120-Watt-Xeon-5400-CPUs relativ gering – im Gegensatz zu den Volllastwerten. Aus der Reihe fällt nur die 65-nm-Generation Xeon X5365.

Jetzt wird bei den Energieoptionen von Windows Server 2008 das Schema „Höchstleistung“ ausgewählt. Die dynamischen Power-Management-Funktionen SpeedStep (Intel) und PowerNow! (AMD) sind beim Schema „Höchstleistung“ nicht aktiv:

Ohne Power-Management: Bei den 65-nm-Xeons X5365 erhöht sich der Energiebedarf ohne SpeedStep im Leerlauf um satte 36 Watt. Bei den 45-nm-Xeons der 5400er-Serie sowie beim Opteron fällt der zusätzliche Energiebedarf ohne Power-Management-Features gering aus.

Fazit

Die Überprüfung der Energieeffizienz macht eines sehr deutlich: Höhere Taktfrequenzen sorgen nicht für eine entsprechend höhere Performance pro Watt. Im Gegenteil, die 50-Watt-Low-Voltage-Xeons L5430 mit 2,66 GHz Taktfrequenz ermöglichen dem Server sogar eine bessere Energieeffizienz als die 3,33-GHz-Modelle. Wenn somit nicht das letzte Quäntchen Performance benötigt wird, sollten zugunsten besserer Performance/Watt-Werte energiesparende Xeons zum Einsatz kommen.

Lohnend ist auf jeden Fall der Umstieg von 65-nm-Xeon-5300-CPUs auf die aktuelle 45-nm-Generation der Xeon-5400-Serie. So bietet ein Xeon E5472 mit 3,0 GHz eine 25 Prozent höhere Performance beim Java-Workload im Vergleich zum Xeon X5356 mit ebenfalls 3,0 GHz. Zusätzlich erhöht sich die Energieeffizienz eines 2-Sockel-Servers um 48 Prozent. Die 45-nm-Xeons konsumieren deutlich weniger Energie als die Xeon-5300-Prozessoren.

Das Power-Management-Feature SpeedStep sollte sowohl bei den Xeon-5300- als auch den Xeon-5400-CPUs auf jeden Fall aktiviert sein. Besonders im Teillastbereich zwischen 10 und 50 Prozent erhöht sich mit den Energiesparfunktionen der CPUs die Effizienz um bis zu 10 Prozent – durch einen simplen Mausklick in der Systemsteuerung. Die meisten Server agieren überwiegend in diesem Teillastbereich.

Die höchste Performance pro Watt bieten die Prozessoren allerdings unter Volllast, wie die Ergebnisse von SPECpower_ssj2008 deutlich zeigen. Deshalb sollten schon aus Gründen der Energieeffizienzsteigerung unausgelastete Server durch parallel arbeitende virtuelle Maschinen mehr Arbeit bekommen.

AMDs Quad-Core-Opteron verliert im Testsystem Fujitsu Siemens RX330 S1 in der Energieeffizienz deutlich gegen den Intel-Server mit den Xeon-CPUs. Natürlich muss darauf hingewiesen werden, dass SPECpower_ssj2008 nur auf der Java-Performance der Systeme basiert. Bei anderen Workloads kommen sicherlich differierende Ergebnisse zum Vorschein – wohl aber mit der gleichen Tendenz. Allerdings arbeitete AMD ebenso an dem SPECpower-Benchmark mit wie Intel und diverse Server-Hersteller. Laut AMD werde es mit den Ende 2008 erwarteten 45-nm-Opterons „Shanghai“ aber auch von AMD selbst veröffentlichte SPECpower_ssj2008-Ergebnisse zu sehen geben.

SPECpower_ssj2008 wird aktuell noch von der Environmental Protection Agency in den USA validiert. Laut SPEC bestehen damit gute Chancen, dass der Test als Grundlage für angedachte Energy-Star-Labels bei Servern dient. (cvi)

Standardisierter Benchmark für Energieeffizienz

Das herstellerunabhängige Benchmark-Konsortium SPEC stellt seit Anfang 2008 mit dem SPECpower_ssj2008 den ersten Industrie-Standardtest für die Evaluierung der Performance- und Energiecharakteristika von Standard-Servern zur Verfügung.

Der Benchmark wurde unter der Leitung von Klaus-Dieter Lange, Senior Performance Ingenieur bei Hewlett-Packard und SPEC-Mitglied, von den Firmen AMD, Dell, Fujitsu-Siemens, Hewlett Packard, Intel und Sun gemeinsam entwickelt. SPECpower_ssj2008 simuliert Lastzustände von 0 bis 100 Prozent in 10-Prozent-Schritten. Dabei ermittelt der Benchmark sowohl die Performance als auch den dazugehörigen Energieverbrauch des Systems.

SPECpower_ssj2008: Der Benchmark kontrolliert über einen Controller-PC den Java-Workload auf dem Testsystem (SUT=System under Test). Der Workload lastet das System von 0 bis 100 Prozent stufenweise aus. Der Controller sammelt die Performance-Werte sowie die zugehörigen Energieverbräuche und ermittelt daraus die Energieeffizienz des Testsystems. (Quelle: SPEC)

SPECpower_ssj2008 basiert auf dem Java-Server-Benchmark SPECjbb2005 von SPEC. Somit wird der Workload des Energieeffizienztests über eine typische Client-Server-Anwendung emuliert. Die Server-Performance mit Java ermittelt der Benchmark über XML-Processing sowie aufwendige Dezimalberechnungen. SPECpower_ssj2008 unterstützt Multithreading und skaliert sehr gut mit der Anzahl der Prozessoren in einem Server. Für die Performance bei SPECpower_ssj2008 sind neben den CPUs und dessen Caches die Speicherhierarchie und das Bussystem zwischen den Prozessoren verantwortlich. Die Leistungsfähigkeit des Storage-Subsystem fließt in die Performance des Benchmarks nicht mit ein. Zusätzliche Workloads für SPECpower sind laut dem Konsortium bereits geplant.

Entscheidend für die erreichbare Performance mit SPECpower_ssj2008 ist die Wahl der installierten Java-VM. Hier liegt auch der Nachteil des SPEC-Benchmarks. Die am weitesten verbreitete JVM stammt zwar von Sun, wird aber bei SPECpower_ssj2008 kaum verwendet. Stattdessen setzen fast alle bei der SPEC gemeldeten SPECpower_ssj2008-Ergebnisse auf die JVM JRockit von Bea. JRockit zeichnet sich bei diesem Benchmark durch teilweise um den Faktor zehn höhere Java-Performance aus. JRockit lässt sich zudem durch eine Vielzahl von Parametern feintunen. Erlaubt ist dabei alles, solange es dokumentiert ist.

Energieverbrauch bei unterschiedlicher Last

Für die Durchführung des SPECpower_ssj2008 werden neben dem zu untersuchenden System ein für den Benchmark zertifiziertes Leistungsmessgerät sowie ein Controller-PC benötigt.

Nach einem dreifachen Kalibriervorgang für die Performance unter Volllast kalkuliert SPECpower_ssj2008 zunächst über eine lineare Skala die Vorgaben für die Teillastzustände mit 90, 80, 70, 60, 50, 40, 30, 20 und 10 Prozent Prozessorauslastung. Entsprechend schiebt der Benchmark Wartezyklen zwischen den Java-Berechnungen ein.

Lastzustände: Nach drei Kalibriermessungen unter Volllast fährt SPECpower_ssj2008 die CPU-Auslastung in 10-Prozent-Schritten zurück. (Quelle: SPEC).

Die Synchronisation der Energiewerte mit den entsprechenden Lastzuständen auf dem zu testenden System erfolgt vom Controller-PC aus. Dieser ist über Ethernet mit dem Testsystem verbunden. Die auf dem Controller-PC ebenfalls installierte SPECpower_ssj2008-Software sammelt die Performance-Werte bei allen Lastzuständen des Testsystems. Der Controller-PC ist auch mit dem Messgerät zur Ermittlung des Energieverbrauchs per serieller Schnittstelle verbunden. Jede Sekunde sendet der Energiemesser die Wattzahl an den Controller-PC. Abgeschlossen wird der Testvorgang von SPECpower_ssj2008 mit einer Idle-Messung.

Als zusätzliche Kontrollinstanz muss ein Temperatursensor die aktuelle Umgebungstemperatur beim Testsystem messen und dem Controller-PC melden. Die Temperatur hat aber keinen Einfluss auf die Ergebnisse von SPECpower_ssj2008 – vorausgesetzt, eine zu hohe Temperatur zwingt das System nicht ins Throttling.

Als Ergebnis gibt SPECpower_ssj2008 nach zirka 75 Minuten Laufzeit eine lastabhängige Performance-Watt-Kurve aus. Für jeden Lastzustand (10-Prozent-Schritte) gibt es die ssj_ops als Performance-Angabe sowie den zugehörigen Energieverbrauch des Systems. Zusätzlich generiert SPECpower_ssj2008 einen gemittelten Gesamtwert, mit dem die Energieeffizienz eines Systems zum Ausdruck gebracht werden soll.

Virtuelle Instanzen und Multithreading

Der Java-Workload von SPECpower_ssj2008 muss vor dem ersten Lauf an das zu testende System angepasst werden. Je nach Anzahl der Prozessoren beziehungsweise CPU-Kerne sind die Anzahl der parallel arbeitenden JVMs (Java Virtual Machine) festzulegen. Durch die Multithread-Fähigkeit der Java-Engines ist zudem die Thread-Anzahl pro JVM definierbar.

Als Faustregel gilt: Die Anzahl der Prozessoren im System entspricht der Anzahl der parallel laufenden JVMs. In jeder JVM wird das Multithreading auf die Anzahl der Kerne pro CPU eingestellt. Je nach Systemarchitektur und verwendetem Betriebssystem muss getestet werden, welche Einstellung die schnellste ist. Bei einem 2-Sockel-System mit zwei Quad-Core-Prozessoren bietet sich die Konfiguration mit zwei JVMs mit je vier Threads an. Oder man lässt vier JVMs mit Dual-Threading laufen. Die erreichbare Performance von SPECpower_ssj2008 kann sich dabei durchaus um bis zu 10 Prozent unterscheiden.

Weitere zirka 10 Prozent mehr ssj_ops sind über eine festlegbare Prozessorzugehörigkeit der JVMs erreichbar. Jeder arbeitenden JVM werden nur so viele CPU-Kerne dediziert zugewiesen, wie beim Multithreading eingestellt ist. Wird in einem 8-Kerne-System (zwei Quad-Core-CPUs) SPECpower_ssj2008 beispielsweise mit zwei JVMs bei je vierfachem Multithreading gestartet, so bekommt jede JVM vier eigene Kerne zugewiesen.

Volle Auslastung: Der Screenshot zeigt SPECpower_ssj2008 bei der Arbeit. Im Beispiel arbeiten vier JVM-Instanzen mit jeweils Dual-Threading. Die acht Kerne der beiden Quad-Core-Xeons arbeiten auf Anschlag.

Der im System verfügbare Arbeitsspeicher sollte bei der Messung mit SPECpower_ssj2008 ebenfalls ausgenutzt werden. Denn je mehr Speicher den JVMs spendiert wird, desto flinker gehen sie zu Werke. Mehr RAM im System bedeutet aber auch einen höheren Energiebedarf. Da es beim SPECpower_ssj2008 um die Energieeffizienz geht, gilt es diesen Aspekt immer zu beachten. Wichtig beim SPECpower-Benchmark ist auch das Ausnutzen der Power-Management-Funktionen des Systems.

Während bei reinen Performance-Benchmarks sämtliche Energiesparfunktionen tunlichst deaktiviert sind, fördern sie hier ein besseres Ergebnis zutage. Besonders SpeedStep bei Intel-CPUs und PowerNow! bei AMD-Prozessoren zum dynamischen Anpassung der Taktfrequenz und Core-Spannung finden bei SPECpower_ssj2008 ihre besondere Bedeutung. Diese Energiespar-Technologien der CPUs sorgen im Leerlauf und im Teillastbereich für eine höhere Energieeffizienz.

Beim Betriebssystem muss zur Nutzung von SpeedStep und PowerNow! das entsprechende Energieschema ausgewählt sein. Je nach Betriebssystem ist hier auch ein spezieller Prozessortreiber notwendig.

Xeon und Opteron im Test mit Windows Server 2008

Die Energieeffizienz der Quad-Core-Xeons untersuchen wir in der Zwei-Sockel-Server-Plattform „Stoakley“ von Intel. Als Mainboard verwendet der Server ein Supermicro X7DWN+ mit Seaburg-Chipsatz. Vier FB-DIMM-Channels steuern insgesamt acht 2-GByte-Module vom Typ Nanya NT2GT72U4NB1BD-2C an. Die FB-DIMMs arbeiten bei der FSB1600-CPU Xeon E5472 mit DDR2-800-SDRAMs mit einem 5-5-5-Timing. Bei den FSB1333-Xeons steuert der Chipsatz den Speicher automatisch mit einer Geschwindigkeit von 667 MHz bei CL5 an.

Für den als Vergleich dienenden Test der Opteron-CPUs 2356 von AMD verwenden wir von Fujitsu Siemens den Zwei-Sockel-Server Primergy RX330 S1. Das Systemboard D2440-A100 verwendet einen Broadcom-BCM5780-Chipsatz. Über ihren integrierten Memory-Controller greifen die AMD-CPUs ebenfalls auf 16 GByte DDR2-667-SDRAM mit CL5 in gepufferter Ausführung zurück.

SPECpower_ssj2008 ist von der Grafik-Performance unabhängig. Auch die Performance des Storage-Subsystems beeinflusst die Geschwindigkeit von SPECpower_ssj2008 nicht. Allerdings fließt der Energiebedarf aller Komponenten in die Wertung Performance/Watt ein.

Java-Engine: Für alle Tests mit SPECpower_ssj2008 verwenden wir die JVM Bea JRockit V6 Update 3 R27.5.0 in der 64-Bit-Variante.

Während alle Xeons im gleichen System arbeiten, dient das AMD-System nur als vergleichende Einschätzung. Der Fujitsu Siemens RX330 S1 verwendet eine andere Netzteilausstattung sowie zwei 7200er-SATA-Drives statt SAS-Festplatten mit 15.000 U/min. Allerdings legt SPEC den SPECpower_ssj2008 bewusst als Systemtest aus, um komplette Server miteinander zu vergleichen. Die Gegenüberstellung des Intel-Servers mit dem AMD-System ist somit durchaus legitim.

Für den SPECpower_ssj2008 verwenden wir als Java-Engine Bea JRockit V6 Update 3 R27.5.0 in der 64-Bit-Version. Die eingestellten Java-Optionen „-Xms3600m -Xmx3600m -Xns3100m -XXaggressive -XXlargePages -XXthroughputCompaction -XXcallProfiling -XXlazyUnlocking -Xgc:genpar -XXgcthreads:2 -XXtlasize:min=12k,preferred=1024k“ dienen für die optimale Performance.

Folgende Quad-Core-Xeons testen wir mit diesen Einstellungen auf ihre Energieeffizienz:

Als Vergleich dient mit dem identischen Setting zusätzlich der Quad-Core-Opteron von AMD:

Als Betriebssystem für SPECpower_ssj2008 setzen wir Windows Server 2008 Enterprise x64 ein.