Nehalem-EX vs. AMD 12-Core-Opteron 6100

Intel Xeon X7560 - Neue 8-Core-CPU im Test

Multitask Integer: SPECint_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Integer-Berechnungen von SPECint_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Integer-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECint_rate_base2006 der Anzahl der Prozessorkerne des Systems. Beispielsweise arbeiten beim Zwei-Sockel-Server mit Opteron-6174-CPUs 24 Kopien parallel. Beim Westmere-EP-System mit Xeon X5670 und X5680 (Hexa-Core) sind durch das zusätzliche Hyper-Threading 24 virtuelle Kerne vorhanden. Entsprechend laufen auch hier 24 parallele Kopien mit einem Speicherbedarf von 2 GByte RAM pro Kopie. Das Xeon-X7560-System mit den zwei 8-Core-CPUs verlangt durch das zusätzliche Hyper-Threading nach 32 Kopien.

SPECint_rate_base2006: Die zwei Xeon X7560 platzieren sich zwischen den Hexa-Core-Xeon-5600-Modellen. Das Ergebnis ist gut, bedenkt man, dass die CPUs zwar acht statt sechs Kerne haben, aber mit deutlich geringerer Taktfrequenz arbeiten. Müssen die zwei Xeon X7560 aber nur mit ihrem eigenen Speicher auskommen (ohne FlexMem), so sinkt die Performance auf das Niveau der Opteron-6174-CPUs. Sehr groß ist allerdings der Sprung gegenüber der Xeon-7400-Vorgängerplattform – zwei Xeon X7560 (2,26 GHz / 8 Core) sind schneller als vier Xeon X7460 (2,66 GHz / 6 Core).
SPECint_rate_base2006: Die zwei Xeon X7560 platzieren sich zwischen den Hexa-Core-Xeon-5600-Modellen. Das Ergebnis ist gut, bedenkt man, dass die CPUs zwar acht statt sechs Kerne haben, aber mit deutlich geringerer Taktfrequenz arbeiten. Müssen die zwei Xeon X7560 aber nur mit ihrem eigenen Speicher auskommen (ohne FlexMem), so sinkt die Performance auf das Niveau der Opteron-6174-CPUs. Sehr groß ist allerdings der Sprung gegenüber der Xeon-7400-Vorgängerplattform – zwei Xeon X7560 (2,26 GHz / 8 Core) sind schneller als vier Xeon X7460 (2,66 GHz / 6 Core).

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für „Non-Intel-Processors“ (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5570, X5670, X5680 und X7560 für eine optimale Vergleichbarkeit mit dem Opteron 2435 und 6174 ebenfalls mit -QxO:

SPECint_rate_base2006

Compiler-Option

-fast (automatisch)

-QxO (SSE3)

Xeon X7560 FlexMem

242

224

Xeon X5570

176

165

Xeon X5670

237

220

Xeon X5680

257

235

Opteron 2435

--

112

Opteron 6174

--

193

Die Xeon-Prozessoren verlieren durch die Einstellung –QxO zirka sechs bis neun Prozent Performance.