4-Sockel-CPUs im Vergleich

Intel Xeon X7560 im Test - Neue Generation überflügelt Vorgänger

Multitask Integer: SPECint_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008/R2 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Integer-Berechnungen von SPECint_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Integer-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECint_rate_base2006 der Anzahl der Prozessorkerne des Systems. Im 4-Sockel-Xeon-X7560-Server arbeiten beispielsweise durch die insgesamt 32 Kerne sowie das zusätzliche Hyper-Threading 64 Kopien parallel. Pro Kopie ist ein Speicherbedarf von 2 GByte RAM notwendig.

SPECint_rate_base2006: Die vier Xeon X7560 bieten einen 2,7-fachen Integer-Durchsatz im Vergleich zum Vorgängermodell Xeon X7460. Die neue Architektur mit integrierten Speicher-Controllern und QuickPath-Verbindungen macht den großen Performance-Gewinn möglich. Sehr gut ist auch die Skalierung der Rechenleistung gegen über der 2-Sockel-Konfiguration mit FlexMem (Ohne FlexMem = beide CPUs haben ihren eigenen Speicher. Mit FlexMem = In einem 4-Sockel-System, dass nur mit zwei CPUs bestückt ist, können auch die DIMM-Steckplätze der beiden leeren CPU-Sockel genutzt werden; die Speicherbandbreite steigt). In der 4-Sockel-Konfiguration profitieren die Xeon X7560 zusätzlich gegenseitig von der summierten Speicherbandbreite.
SPECint_rate_base2006: Die vier Xeon X7560 bieten einen 2,7-fachen Integer-Durchsatz im Vergleich zum Vorgängermodell Xeon X7460. Die neue Architektur mit integrierten Speicher-Controllern und QuickPath-Verbindungen macht den großen Performance-Gewinn möglich. Sehr gut ist auch die Skalierung der Rechenleistung gegen über der 2-Sockel-Konfiguration mit FlexMem (Ohne FlexMem = beide CPUs haben ihren eigenen Speicher. Mit FlexMem = In einem 4-Sockel-System, dass nur mit zwei CPUs bestückt ist, können auch die DIMM-Steckplätze der beiden leeren CPU-Sockel genutzt werden; die Speicherbandbreite steigt). In der 4-Sockel-Konfiguration profitieren die Xeon X7560 zusätzlich gegenseitig von der summierten Speicherbandbreite.

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für "Non-Intel-Processors" (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5680 und X7560 für eine optimale Vergleichbarkeit mit dem Opteron 6174 ebenfalls mit -QxO:

SPECint_rate_base2006

Compiler-Option

-fast (automatisch)

-QxO (SSE3)

4x Xeon X7560

473

440

2x Xeon X7560 FlexMem

242

224

2x Xeon X5680

257

235

2x Opteron 6174

--

193

Die Xeon-Prozessoren verlieren durch die Einstellung -QxO zirka sieben bis neun Prozent Performance.