Xeon E5-2640, E5-2660 und E5-2690

Konkurrenz chancenlos - Intel Xeon E5-2600 Serie im Test

Analyse: Szenarien mit hohem Speicherbedarf

Bei Workloads mit Speicherbedarf zeigen die neuen Xeon-E5-2600-Prozessoren ihre volle Stärke. Jetzt machen sich die vier DDR3-1600-Speicher-Channels pro CPU, der 20 MByte große L3-Cache (8-Core / 15 MByte bei 6-Core) sowie die zwei 8-GT/s-QuickPath-Links zwischen den E5-Modellen bemerkbar. Der Xeon X5680 muss sich noch mit drei DDR3-1333-Channels pro CPU, 12 MByte L3-Cache sowie einem 6,4-GT/s-QuickPath-Link zwischen den Prozessoren begnügen.

Beim Java-Workload von SPECpower, wo multiple JVMs parallel arbeiten und bereits verstärkt Arbeitsspeicher benötigt wird, sind die zwei Xeon E5-2690 mit 1.204.565 ssj_ops 77 Prozent schneller als die Vorgängermodelle Xeon X5680. Auch gegenüber AMDs 16-Core-CPUs Opteron 6276 sind Intels 8-Core-Xeons 56 Prozent schneller. Selbst die Hexa-Core-Modelle Xeon E5-2640 sind zwei Prozentpunkte schneller als die Opterons. Interessant ist auch der Vergleich des E5-2640-Päärchens (2,5 GHz Basistakt) mit dem Hexa-Core-Vorgänger Xeon X5680 (3,33 GHz Basistakt): Während beide Generationen bei Workloads, die in die Caches der CPUs passen ungefähr auf einem Leistungsniveau arbeiten, ändert sich bei hohem Arbeitsspeicherbelastung das Bild. Die Xeon-E5-2640-CPUs arbeiten trotz geringerer Taktfrequenz (maximal 2,8 GHz im Turbo-Modus) 16 Prozent schneller als die X5680er Modelle.

Bei Java-Workloads wie SPECjvm2008, wo weniger Arbeitsspeicher als bei SPECpower benötigt wird, ändert sich das Bild etwas: Intels Xeon-E5-2690-Prozessoren sind jetzt statt 77 "nur" noch 59 Prozent schneller als das Xeon-X5680-Päärchen. Hier wirkt sich die höhere Speicherbandbreite von vier DDR3-1600-Channel pro CPU (Xeon X5680: drei DDR3-1333-Channels) weniger aus.

Bandbreite: Der Xeon E5-2600 kommuniziert mit der benachbarten CPU über zwei QuickPath-Links. Jeder Prozessor besitzt zudem ein Quad-Channel-Speicher-Interface.
Bandbreite: Der Xeon E5-2600 kommuniziert mit der benachbarten CPU über zwei QuickPath-Links. Jeder Prozessor besitzt zudem ein Quad-Channel-Speicher-Interface.
Foto: Intel

Die Leistungsfähigkeit der Prozessoren bei sehr speicherintensiven Workloads überprüfen wir mit der Benchmark-Suite SPEC CPU2006. Bei unserem Standard-Setup mit Intel 10.1 Compiler und SSE3-Unterstützung finden alle CPUs die identischen Voraussetzungen. Multiple Kopien lasten alle Kerne jeweils voll aus. Während die zwei Xeon E5-2690 beim Rendering (Floating-Point-Workload passt in Cache) "nur" 45 Prozent schneller sind als ein Xeon-X5680-Duett, ziehen die 2690er-CPUs beim sehr speicherintensiven SPECfp_rate_base2006 um satte 81 Prozent davon. Auch gegenüber AMDs Opteron-6276-Päärchen sind die Xeon E5-2690 noch 46 Prozent schneller.

Beim ebenfalls sehr speicherintensiven Integer-Test SPECint_rate_base2006 kann der für diese Workloads optimierte Opteron 6276 etwas Boden gutmachen: Die Xeon-E5-2690-CPUs liefern hier aber immer noch einen 44 Prozent höheren Durchsatz. AMDs Opteron 6276 mit 16-Core-Technologie erreicht nur die Performance des Xeon E5-2640 mit Hexa-Core.

Unsere Messungen des Speicherdurchsatzes mit STREAM bescheinigen dem Xeon-E5-2690-Päärchen mit 76 GByte/s auch den höchsten Wert. Damit erreichen die neuen Xeons einen 81 Prozent höheren Durchsatz im Vergleich zum Xeon-X5680-Päärchen. Der mögliche Speicherdurchsatz hängt auch von der Taktfrequenz der CPUs ab, je höher diese ist, desto mehr Daten lassen sich einlesen. AMDs Opteron-6200-CPUs sind trotz Quad-Channel-DDR3-1600-Speicher gegenüber den Intel-CPUs im Nachteil.