Performance und Effizienz verdoppelt

Test: Intel Xeon X5570 Nehalem-EP

Multitask Integer: SPECint_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz.

Bei den Integer-Berechnungen von SPECint_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Integer-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECint_rate_base2006 der Anzahl der Prozessorkerne des Systems. Bei den Zwei-Sockel-Servern mit Quad-Core-Prozessoren arbeiten acht Kopien parallel. Beim Nehalem-EP-System sind durch das zusätzliche Hyper-Threading 16 virtuelle Kerne vorhanden. Entsprechend arbeitet bei den Xeon-X5570-CPUs 16 parallele Kopien. Durch den CPU2006-Speicherbedarf von bis zu 2 GByte RAM pro Kopie erhöhen wir beim Nehalem-EP-System den Arbeitsspeicher von 24 auf 48 GByte. Durch die damit verbundenen zwei DIMMs pro Channel arbeitet der DDR3-Speicher mit 1066 statt 1333 MHz.

SPECint_rate_base2006: Sind alle Kerne der Prozessorpärchen im Einsatz, so arbeiten zwei Xeon X5570 (aktives Hyper-Threading) um 75 Prozent schneller als die 3,33-GHz-Vorgänger-Xeons - im Single-Thread-Test sind es „nur“ 55 Prozent. Mit deaktiviertem Hyper-Threading sind die Nehalem-EPs noch immer 56 flinker als die Xeon-X5470-CPUs. Die neue Systemarchitektur mit integrierten Speicher-Controllern und QuickPath skaliert sehr gut.
SPECint_rate_base2006: Sind alle Kerne der Prozessorpärchen im Einsatz, so arbeiten zwei Xeon X5570 (aktives Hyper-Threading) um 75 Prozent schneller als die 3,33-GHz-Vorgänger-Xeons - im Single-Thread-Test sind es „nur“ 55 Prozent. Mit deaktiviertem Hyper-Threading sind die Nehalem-EPs noch immer 56 flinker als die Xeon-X5470-CPUs. Die neue Systemarchitektur mit integrierten Speicher-Controllern und QuickPath skaliert sehr gut.

Beim Vorgänger Xeon 5400 mit klassischer FSB-/Chipsatz-Architektur sieht es mit der Skalierung noch deutlich schlechter aus. Arbeitet beispielsweise der Xeon X5470 im Single-Thread-Test noch 30 Prozent schneller als der Opteron 2384, bleiben im Multi-Task-Test nur noch 17 Prozent übrig. Das AMD-System ist durch die in den CPUs integrierten Speicher-Controllern und den HyperTransport-Schnittstellen bei Multi-Task/Multi-Thread-Anwendungen mit vielen Speicherzugriffen deutlich im Vorteil.

Wie sehr das Nehalem-EP-System von seiner neuen Architektur mit integrierten Speicher-Controllern und dem QuickPath-Interface profitiert, zeigt auch der Vergleich zum 4-Sockel-Server mit vier 6-Core-Xeons sehr deutlich. Trotz insgesamt 24 Kerne erreichen die vier Xeon-X7460-CPUs nur die Integer-Performance der zwei Quad-Core-Nehalems. Gerade bei massiv parallel arbeitenden Anwendungen mit Speicherbedarf skaliert die bisherige klassische Intel-Architektur mit FSBs und Speicherverkehr über den Chipsatz deutlich schlechter.