4-Sockel-CPUs im Vergleich

Intel Xeon X7560 im Test - Neue Generation überflügelt Vorgänger

Multitask Floating Point: SPECfp_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008/R2 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Floating-Point-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Floating-Point-Berechnungen von SPECfp_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Floating-Point-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECfp_rate_base2006 der Anzahl der Prozessorkerne des Systems. Im 4-Sockel-Xeon-X7560-Server arbeiten beispielsweise durch die insgesamt 32 Kerne sowie das zusätzliche Hyper-Threading 64 Kopien parallel. Pro Kopie ist ein Speicherbedarf von 2 GByte RAM notwendig.

SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen setzen sich die vier Xeon X7560 sogar um den Faktor 3,4 von den X7460-Vorgängermodellen ab. Auch gegenüber den 2x Xeon X7560 Konfiguration skaliert die Performance sehr gut. Dem 4fach-System kommt zu Gute, dass jede CPU via QuickPath direkt mit den benachbarten verbunden ist und somit auch der Speicher zur Verfügung steht.
SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen setzen sich die vier Xeon X7560 sogar um den Faktor 3,4 von den X7460-Vorgängermodellen ab. Auch gegenüber den 2x Xeon X7560 Konfiguration skaliert die Performance sehr gut. Dem 4fach-System kommt zu Gute, dass jede CPU via QuickPath direkt mit den benachbarten verbunden ist und somit auch der Speicher zur Verfügung steht.

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für "Non-Intel-Processors" (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5680 und X7560 für eine optimale Vergleichbarkeit mit dem Opteron 6174 ebenfalls mit -QxO:

SPECfp_rate_base2006

Compiler-Option

-fast (automatisch)

-QxO (SSE3)

4x Xeon X7560

414

386

2x Xeon X7560 FlexMem

213

207

2x Xeon X5680

219

176

2x Opteron 6174

--

196

Die Xeon-X5680-Prozessoren (32-nm-Westmere-Architektur) verlieren durch die Einstellung -QxO mit 20 Prozent massiv Performance, wenn maximal SSE3 unterstützt wird. Beim Xeon X7560 mit 45-nm-Nehalem-Architektur beträgt der Einbruch nur drei bis sieben Prozent.