Günstiger 16-Core-Prozessor für Server

CPU-Test - AMD Opteron 6366 HE

09.01.2013 von Christian Vilsbeck
AMD hat mit dem Opteron 6366 HE einen auf Energieeffizienz optimierten Prozessor für Server im Programm. Durch 16 Piledriver-Kerne soll die CPU zudem durch hohe Performance punkten. Mit attraktivem Preis fordert der Opteron 6366 HE Konkurrenten wie den Xeon E5-2430 heraus. Im Test überzeugt der Prozessor überwiegend.

Die aktuelle Opteron-6300-Serie ist für Server mit zwei und vier Sockeln ausgelegt. Bei der Architektur nutzt AMD seine Piledriver-Kerne, die auch in Desktop-Prozessoren wie dem FX-8350 zum Einsatz kommen. Während es für Clients maximal acht Kerne arbeiten, besitzen die Opteron-6300-CPUs bis zu 16 Cores.

Beim Test des Opteron 6380 im TecChannel-Testlabor überzeugt die 16-Core-CPU auch mit einer Performance, die genau im Bereich ähnlich teurer Xeon-E5-2600-Modelle liegt. Während der Opteron 6380 in der Preisliste mit 1088 US-Dollar aufgeführt ist, bietet AMD mit dem Opteron 6366 HE für 575 US-Dollar ebenfalls einen 16-Core-Prozessor an. Das knapp halb so teure Modell ist zudem mit nur 85 statt 115 Watt TDP spezifiziert. AMD stuft den Prozessor über das angehängte "HE" auch als "High Efficiency" ein. Demnach sollte der Opteron 6366 HE insbesondere in der Energieeffizienz punkten.

Weniger Watt bei gleicher Kernanzahl zum fast halben Preis; gespart wird bei der Taktfrequenz. Statt mit 2,5 GHz Basistakt wie beim Opteron 6380 operiert das HE-Modell mit nur 1,8 GHz. Doch meistens agieren die Kerne via Turbo CORE mit höheren Frequenzen. So können beim Opteron 6366 HE alle Kerne mit bis zu 2,3 GHz oder die Hälfte der Cores mit bis zu 3,1 GH arbeiten - solange die CPU unterhalb der spezifizierten TDP-Grenze von 85 Watt bleibt. Zum Vergleich: Beim Opteron 6380 können alle Kerne auf bis zu 2,8 GHz hochtakten. Sind nur bis zu acht Cores aktiv, dann dürfen es maximal 3,4 GHz sein.

AMD Opteron 6366 HE: Der 16-Core-Prozessor mit Piledriver-Architektur arbeitet mit 1,8 GHz Basistakt. Turbo CORE erlaubt einzelnen Kernen bis zu 3,1 GHz. Platz nimmt die CPU weiterhin im Socket G34 der Vorgänger Opteron 6100 und 6200.

Abgesehen von den Unterschieden im Preis, TDP und Taktfrequenzen unterscheidet sich der Opteron 6366 HE nicht vom 6380er. Die CPU ist aus zwei je acht Kerne fassende 32-nm-Siliziumplättchen aufgebaut, die intern via HyperTransport kommunizieren. Neben insgesamt 16 MByte L2-Cache steht dem Prozessor auch ein 16 MByte großer L3-Cache zur Verfügung. Reicht der üppige Cache zum Puffern der Workloads nicht aus, so steuert der Opteron 6366 HE über seine vier integrierten Speicher-Channel DDR3-DIMMs mit bis zu 1866 MHz an. Ausführliche Detail zur Piledriver-Architektur des Opteron 6366 HE finden Sie in unserem Artikel CPU-Test: Opteron 6380 mit 16 Kernen.

Ein Blick in die Preisliste von Intel zeigt mit dem Xeon E5-2430 für 551 US-Dollar bei 2-Sockel-Servern den Hauptkonkurrenten unseres Testmodells Opteron 6366 HE. Intels Xeon E5-2430 mit Sandy-Bridge-Architektur überzeugte im TecChannel-Test bereits mit einer sehr hohen Energieeffizienz. Der Hexa-Core-Prozessor ist mit 95 Watt TDP spezifiziert, etwas mehr als die 85 Watt des Opterons. Die Taktfrequenz liegen relativ ähnlich: 2,2 GHz Basistakt, via Turbo 2.0 können einzelne Kerne mit bis zu 2,7 GHz arbeiten. Beim Speicher steuert der Xeon E5-2430 drei DDR3-1333-Channels an. Der Datenpuffer ist auch kleiner: insgesamt 1,5 MByte L2-Cache (256 KByte pro Kern) und 15 MByte L3-Cache müssen genügen.

In vielen Serverinstallationen finden sich nicht die teuren Topmodelle, sondern die erschwinglicheren Varianten, wie der Opteron 6366 HE und Xeon E5-2430. Die Gegenüberstellung der Kontrahenten ist dabei ebenso interessant wie der Vergleich mit den teureren Top-Modellen. Insbesondere wenn viel Wert auf hohe Energieeffizienz gelegt wird, muss nicht zu den Highend-CPUs gegriffen werden.

Im TecChannel-Testlabor überprüfen wir die Leistungsfähigkeit des Opteron 6366 HE bei Integer- und Floating-Point-Anwendungen, Verschlüsselung, Rendering und Simulation. Außerdem wird die Geschwindigkeit bei Java-Applikationen ebenso untersucht wie die Energieeffizienz der Systeme. Als Vergleich zum Opteron 6366 HE dienen AMDs Vorgängermodelle der Opteron-6200-Serie sowie die Konkurrenten Xeon E5-2430, E5-2640, E5-2660 und E5-2690.

Opteron 6300: Modelle im Überblick

AMD bietet den Opteron 6300 Abu Dhabi in zehn verschiedenen Modellen an. Durch Turbo CORE können beim Opteron 6300 alle Kerne mit 300 bis 500 MHz höher im Vergleich zur Grundtaktfrequenz arbeiten - solange der Multithread-Workload den Prozessor nicht über die TDP-Grenze treibt. Sind Workloads aktiv, die nicht multithread-optimiert sind, so schickt Turbo CORE die Hälfte der Kerne in den Energiesparmodus C6 "schlafen". Die übrigen Kerne können dann mittels Max Turbo CORE mit einer über 1 GHz erhöhten Taktfrequenz rechnen - je nach Modell.

In der Tabelle finden Sie alle Opteron-6300-Prozessoren im Überblick:

Alle Opteron-6300-Modelle im Überblick

Prozessor

Kerne

Grundtaktfrequenz [GHz]

Turbo CORE [GHz]

Max Turbo CORE [GHz]

TDP [Watt]

Preise [US-Dollar]

Opteron 6386 SE

16

2,8

3,2

3,5

140

1392

Opteron 6380

16

2,5

2,8

3,4

115

1088

Opteron 6378

16

2,4

2,7

3,3

115

867

Opteron 6376

16

2,3

2,6

3,2

115

703

Opteron 6348

12

2,8

3,1

3,4

115

575

Opteron 6344

12

2,6

2,9

3,2

115

415

Opteron 6328

8

3,2

3,5

3,8

115

575

Opteron 6320

8

2,8

3,1

3,3

115

293

Opteron 6308

4

3,5

--

--

115

501

Opteron 6366 HE

16

1,8

2,3

3,1

85

575

Analyse: Core-Rechenleistung

Sind alle Kerne bei AMDs Opteron 6366 HE (1,8 GHz Basistakt) unter Last, so arbeitet der Prozessor durch Turbo CORE mit 2,3 GHz. Allerdings darf der Workload die CPU nicht über die TDP-Grenze hieven, sonst reduziert der Opteron automatisch wieder die Taktfrequenz. Bei einem Integer-Workload, der überwiegend im Cache der Prozessoren gehalten wird, liefert das Opteron-6366-HE-Päärchen gegenüber den 6380er eine 18 Prozent geringere Performance. Dies entspricht ziemlich genau der geringeren Turbo-CORE-Taktfrequenz; der Opteron 6380 lässt alle Kerne mit 2,8 GHz arbeiten. Im Vergleich mit dem ähnlich teuren Xeon E5-2430 rechnet der Opteron 6366 HE dafür vier Prozent schneller. Auch das Vorgängermodell Opteron 6262 HE wird mit 30 Prozent mehr Geschwindigkeit deutlich geschlagen.

Bei ebenfalls in den Cache passenden Floating-Point-Workloads ohne SSE/AVX-Optimierung zeigt sich allerdings der Nachteil der Integer-lastigen Piledriver-Architektur des Opteron 6366 HE. Im Single-Thread-Modus arbeitet der Opteron 6366 HE bei 3,1 GHz (Max Turbo CORE) zirka 28 Prozent langsamer als ein Xeon E5-2430 bei 2,7 GHz (Turbo). Gegenüber dem Opteron 6380, der mit Max Turbo CORE 3,4 GHz ermöglicht, ist der 6366er zehn Prozent langsamer. Nutzt der Floating-Point-Workload alle Kerne, so rechnet der 16-Core-Opteron-6366, dem im Prinzip durch sein Modulkonzept nur acht FP-Kerne zur Verfügung stehen, noch immer sieben Prozent langsamer als der Xeon E5-2430 mit Hexa-Core.

Bei der RSA-Verschlüsselung, bei der die Opterons traditionell stark sind, zieht der Opteron 6366 HE seinem preislichen Hauptkonkurrenten Xeon E5-2430 um eine 27 Prozent höhere Performance davon. Selbst gegenüber dem mehr als doppelt so teuren Xeon E5-2660 ist der Opteron 6366 HE sieben Prozent flinker. Beim verwendeten openSSL-Benchmark erfolgt die Verschlüsselung sehr Integer-lastig; dies kommt der Auslegung der AMD-Architektur sehr entgegen. Der AES-Befehlssatz wird bei den RSA-Tests nicht verwendet.

Analyse: Workloads mit Speicherbedarf

AMDs Opteron 6366 HE kann wie der Opteron 6380 DDR3-DIMMs mit Geschwindigkeiten bis 1866 MHz ansteuern. Unser Socket-G34-Testserver ist jedoch nur mit DDR3-1600-Speicherriegeln ausgestattet. Mit DDR3-1866 würde sich unseren Erfahrungen mit verschiedenen Speichergeschwindigkeiten zufolge eine rund zwei Prozent höhere Performance erreichen lassen.

Bei den Java-Workloads von SPECjvm2008 (Base Run), die bereits verstärkt den Arbeitsspeicher benötigen, arbeitet das Opteron-6366-HE-Päärchen rund 16 Prozent langsamer als die Opteron-6380-CPUs; dieses zu erwartende Ergebnis resultiert aus der geringeren Taktfrequenz. Gegenüber dem preislichen Hauptkonkurrenten Intel Xeon E5-2430 ist der Opteron 6366 HE knapp sechs Prozent langsamer. Dafür zieht die neue Piledriver-CPU seinem Vorgänger Opteron 6262 HE mit einer 19 Prozent höheren Performance davon.

Der noch etwas Speicher-intensivere Java-Workload von SPECpower_ssj2008, wo multiple JVMs parallel arbeiten, zeigt zwischen dem Opteron 6366 HE und dem Xeon E5-2430 praktisch ein identisches Ergebnis. Hier kommt dem Opteron sein größerer Cache (32 MByte) sowie die höhere Speicherbandbreite (Quad-Channel-DDR3-1600 pro CPU) zugute. Der Xeon E5-2430 besitzt nur einen rund halb so großen Cache und ein Triple-Channel-DDR3-1333-Interface pro Prozessor.

CPU2006: Performance Integer und Floating Point

Die Leistungsfähigkeit der Prozessoren bei sehr speicherintensiven Workloads überprüfen wir mit der Benchmark-Suite SPEC CPU2006. Bei unserem Standard-Setup mit Intel 10.1 Compiler und SSE3-Unterstützung finden alle CPUs die identischen Voraussetzungen. Multiple Kopien lasten alle Kerne jeweils voll aus. Auf CPU-spezifische Optimierungen verzichten wir, damit lässt sich die Leistungsfähigkeit bei Standard-Software sehr gut abbilden.

Beim Integer-Workload SPECint_rate_base2006 platziert sich der Opteron 6366 HE knapp 24 Prozent vor dem Xeon E5-2430. Bei den Ganzzahlenberechnungen profitiert der Opteron von seiner Piledriver-Architektur, die primär für Integer-Workloads optimiert ist. Sieht man sich auf SPEC.org die hochoptimierten Werte der Hersteller an, so schrumpft der Vorsprung allerdings auf neun Prozent.

Bei den nochmals mehr Speicher fordernden Fließkommaberechnungen von SPECfp_rate_base2006 bleibt der Opteron 6366 HE bei unseren Standard-Compiler-Einstellungen noch 17 Prozent vor dem Xeon E5-2430. Die Piledriver-Architektur (wie auch Bulldozer bei den 6200er Opterons) weist eben nur die halbe Anzahl von FP-Einheiten im Vergleich zu den Integer-Units auf. Mit extremen Peak-Tuning (Herstellerangaben von SPECfp_rate_2006) reduziert sich der Vorsprung wieder etwas: der Opteron 6366 HE ist nur noch elf Prozent flinker.

Analyse: Energieeffizienz

Die Energieeffizienz der Server-Plattformen überprüfen wir mit der Benchmark-Suite SPECpower_ssj2008 unter Windows Server 2008 R2 mit SP1. Der Test verwendet parallel laufende Java-Workloads mit aufwendigem XML-Processing. Der Benchmark gibt die gemittelte Performance pro Watt an, die über alle Lastzustände von 10 bis 100 Prozent gemessenen wird.

Zunächst betrachten wir den Energiebedarf der Server im Leerlauf. Das für die Opteron-Serien 6200 und 6300 verwendete 2-Sockel-System Supermicro A+ 1022G-URF nimmt mit zwei Opteron 6366 HE 112 Watt auf. Sind zwei Opteron 6266 HE eingesetzt, so steigt das Messgerät mit 116 Watt etwas mehr an. Die Fertigungstechnologie verharrt bei der Opteron-6300-Serie unverändert zur Vorgängerserie auf 32 nm Strukturbreite. Allerdings sollen die Leckströme im Vergleich zu den Bulldozer-basierenden CPUs mit Piledriver geringer sein. Nochmals deutlich sparsamer mit nur 61 Watt zeigt sich die Xeon-E5-2430-Plattform. Die verwendete LGA1356-Testplattform Dell PowerEdge R520 nutzt aber auch zwei 495-Watt-Netzteile (Opteron: 2x 750-Watt-Netzteile) sowie nur drei DIMM pro CPU (Opteron: 4 DIMMs pro CPU). Doch selbst die nahezu identisch ausgestattete LGA2011-Plattform (2x 750-Watt-Netzteil, 4x 8-GByte-DDR3-1600-DIMMs pro CPU) für den Xeon E5-2600 ist mit 91 bis 94 Watt deutlich sparsamer als das Opteron-6300-System.

Unter Volllast zeigen sich die Auswirkungen der TDP-Einstufungen der Prozessoren. Jetzt kann sich der Opteron 6366 HE mit 85 Watt TDP deutlich vom 115-Watt-Modell Opteron 6380 distanzieren: Der identische Server ist mit den HE-CPU-Päärchen satte 90 Watt sparsamer. Die reine TDP-Einstufung alleine erklärt aber noch nicht den großen Unterschied - hier wären es maximal 2x 30 Watt = 60 Watt. Man kann somit davon ausgehen, dass die Opteron 6366 HE ihren TDP-Wert deutlich weniger ausreizen wie die Opteron 6380. Auch gegenüber den ebenfalls mit 85 Watt TDP eingestuften Opteron 6262 HE zeigen sich die 6366er im Server nochmals 14 Watt sparsamer. Dies stützt die These, dass der Opteron 6366 HE deutlich unter seiner TDP-Spezifikation bleibt. Noch weniger Energie als das Opteron-6366-HE-System benötigt mit nur 209 Watt nur der Dell PowerEdge R520 mit den zwei Xeon E5-2430, die mit 95 Watt TDP eingestuft sind.

Werden die Energiewerte mit der Performance verknüpft, so ergibt sich die Energieeffizienz des Systems. Obwohl die Rechengeschwindigkeit des Opteron 6366 HE auf dem Niveau des Xeon E5-2430 liegt, fällt das AMD-System aufgrund des höheren Energiebedarfs gegenüber dem Konkurrenten deutlich zurück. Der Opteron-6366-HE-Server bietet eine 37 Prozent geringere Effizienz als das Xeon-E5-2430-System. Auf der anderen Seite steigt die Effizienz mit den Opteron-6366-HE-CPUs um 28 Prozent gegenüber den Opteron-6262-HE-Vorgängern. Und trotz geringerer Performance und halben Preis bieten die Opteron 6366 HE eine fast identische Energieeffizienz wie die Opteron 6380.

Bei unseren SPECpower-Tests verwenden wir normal ausgestattete Server und eine Oracle-Java-Engine. Mit hoch optimierten, aber wenig praxisrelevanten konfigurierten Servern (1 Netzteil, Minimalausstattung für wenig Energiebedarf) und Peak-Tuning spezieller Java-Engines lassen sich wie bei CPU2006 wieder wesentlich höhere Werte erreichen. Bei den auf SPEC.org gemeldeten Werten liegt ein Opteron-6366-HE-System auch gut im Effizienzbereich eines Xeon-E5-2440-Servers. Insgesamt sind aber die Systeme mit Xeon E5 weiterhin effizienter.

Fazit

Wird statt auf möglichst hohe Rechenleistung viel Wert auf eine optimale Energieeffizienz gelegt, dann greifen Sie bei AMD-basierenden Servern zum Opteron 6366 HE. Der 16-Core-Prozessor bietet zum fast halben Preis die identische Performance pro Watt wie der Opteron 6380. Auch wer günstige 2-Sockel-Server sucht, wird bei Systemen mit dem Opteron 6366 HE fündig.

Einschränkungen in der Performance müssen auf den Preis bezogen nicht gemacht werden. AMDs Opteron 6366 HE liegt in der Rechenleistung insgesamt gesehen auf dem Niveau des ähnlich teuren Xeon E5-2430. Allerdings sind typische 2-Sockel-Serven mit Intels Hexa-Core-Prozessor entsprechenden Systemen mit den 16-Kern-Opterons in der Energieeffizienz deutlich überlegen.

Durch seine Plattform-Kompatibilität lässt sich der Opteron 6366 HE aber auch in vorhandenen Socket-G34-Servern einsetzen - verfügbares BIOS-Update vorausgesetzt. So kann bei einem System mit den Vorgänger-CPUs Opteron 6262 HE durch ein Upgrade der Prozessoren eine 28 Prozent höhere Energieeffizienz erreicht werden.

An Features mangelt es dem Opteron 6366 HE gegenüber dem Xeon E5 jedenfalls nicht. Die im Serverumfeld oft notwendige üppige Speicherausstattung bedient der Opteron mit vier DDR3-Channels pro CPU sogar besser als die Xeon-E5-2400-Serie mit drei Channels. Alle modernen Befehlssätze wie SSE 4.2, AVX, AES und Virtualisierungs-Features sind für AMD und Intel kein Problem.

Somit lässt sich AMDs Opteron 6366 HE durchaus als Alternative zu den Xeon-E5-2400-CPUs sehen - auch wenn die Energieeffizienz nicht so gut ist wie bei Intel. Wie so oft werden in der Praxis entsprechende Angebote von Servern den Ausschlag für die eine oder andere Architektur geben. (cvi)

Testsysteme im Detail

AMDs Opteron 6380, 6366 HE, 6262 HE und 6276 testen wir im 2-Sockel-Betrieb in dem 1U-Rackserver Supermicro A+ 1022G-URF. Das System setzt auf AMDs SR5670-Chipsatz. Jedem Prozessor stehen vier Registered DDR3-1600-DIMMs zur Verfügung. Insgesamt verfügt das System mit acht 8-GByte-Riegeln über 64 GByte Arbeitsspeicher. Der ebenfalls in diesem System getestete Opteron 6180 SE steuert den Speicher mit 1333 MHz Taktfrequenz an.

Socket-G34-Plattform: Der 2-Sockel-Server Supermicro A+ 1022G-URF arbeitet mit dem Opteron 6100, 6200 und 6300.

Der Xeon E5-2430 wird im LGA1356-Server Dell PowerEdge R520 getestet. Das 2U-Rackmount-System nutzt den C600-Chiposatz von Intel. Jeder Prozessor kann auf drei Registered DDR3-1333-DIMMs mit je 8 GByte Kapazität zurückgreifen (insgesamt 48 GByte).

Intels Xeon-E5-Prozessoren 2640, 2660 und 2690 nehmen im 2-Sockel-LGA2011-Server Intel R2208GZ4GSSPP Platz. Der 2U-Rackmount-Server verwendet als Systemboard Intels S2600GZ "Grizzly Pass" mit C600-Chipsatz. Jedem Prozessor stehen vier Registered DDR3-1600-DIMMs Samsung 2Rx4 PC3-12800R mit je 8 GByte Kapazität zur Verfügung. Insgesamt verfügt der Server durch die acht eingesetzten DIMMs über 64 GByte RAM. Optional sind pro CPU acht DIMMs (2 pro Channel) möglich. Der Xeon E5-2660 und E5-2690 steuern den Speicher mit 1600 MHz an. Intels Xeon E5-2640 ermöglicht nur 1333 MHz.

Intels Xeon X5570 "Nehalem-EP" sowie den Xeon L5630 und X5680 "Westmere-EP" testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel ein 4 GByte Registered DIMM vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Insgesamt besitzt das System damit 24 GByte Arbeitsspeicher - 12 GByte pro CPU mit drei Channels.

Romley-EP-Plattform: Intels Zwei-Sockel-Server R2208GZ4GSSPP mit dem Systemboard S2600GZ verwenden wir zum Test der Xeon-E5-2600-CPUs.

Um insbesondere für die Energiemessungen möglichst gleiche Voraussetzungen für die AMD- und Intel-Server zu ermöglichen, arbeiten in den Systemen an der SAS/SATA-Backplane jeweils zwei SATA-RAID-Edition-Festplatten. Bei den Energiemessungen achten wir darauf, die minimale Anzahl von DIMMs zu verwenden, bei der noch alle Speicher-Channels belegt sind. Unterschiede gibt es bei den Netzteilen. Der Xeon-X5680-Server bezieht seine Energie aus zwei 770-Watt-Netzteilen. Im Supermicro-Server des Opteron 6180 SE, 6262 HE, 6276 und 6380 sowie im Xeon-E5-2600-System sind zwei 750-Watt-Netzteile verbaut. Im Dell PowerEdge R520 (Xeon E5-2400) sind zwei 495-Watt-Netzteile integriert.

Als Betriebssystem setzen wir Windows Server 2008/R2 SP1 Enterprise x64 ein. Tests unter Linux erfolgen mit CentOS 6.0 in der 64-Bit-Version.