Erste 12-Core-CPU Magny-Cours
Neue Generation im Test - AMD Opteron 6174 mit 12 Kernen
Das Kräfteverhältnis zwischen AMD und Intel bei den Servern mit zwei Prozessoren war bis klar geregelt. Intels Mitte März 2010 vorgestellten 6-Core-CPUs der Xeon-5600-Serie führen die Ranglisten sowohl in der Performance als auch Energieeffizienz gegenüber den Opteron-2400-Modellen klar an. Trotz gleicher Kernanzahl sind Intels 32-nm-Xeons mit Taktfrequenzen bis 3,33 GHz, zusätzlichem Hyper-Threading und drei DDR3-1333-Speicher-Channels pro CPU klar im Vorteil.
AMD setzt jetzt mit der neuen Opteron-6100-Serie „Magny-Cours“ zum Gegenschlag an. Durch eine Kernverdoppelung arbeiten die 6100er Prozessoren nun mit zwölf Rechenwerken. Damit besitzt AMD die x86-CPUs, die mit deutlichem Abstand die höchste Kernanzahl aufweisen. Auch Intels in Kürze erwarteter Xeon Nehalem-EX mit 8-Core-Architektur hat hier das Nachsehen – jedenfalls in der Kernanzahl.
- CPU2006 64 Bit - Multitasking - SPECint_rate_base2006
Die zwei Opteron 6174 arbeiten 72 Prozent schneller als die 2,6-GHz-Hexa-Core-Opterons. Intels Xeon-5600-Modelle sind für den Opteron 6174 trotz doppelter Kernanzahl nicht zu schlagen. Die Xeons profitieren bereits durch ihre deutlich höhere Taktfrequenz sowie dem zusätzlichem Hyper-Threading. - CPU2006 64 Bit - Multitasking - SPECint_rate_2006 - optimierte Herstellerangaben
Mit speziellen Compilern und Bibliotheken wird das Integer-Leistungsvermögen gegenüber unseren Standardeinstellungen fast verdoppelt. Der Opteron 6174 liegt jetzt auf einem Niveau mit Intels Xeon X5680. - CPU2006 64 Bit - Multitasking - SPECfp_rate_base2006
Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen zieht das Opteron-6174-Päärchen den Opteron-2435-Modellen mit 81 Prozent höherer Leistung davon – trotz 15 Prozent geringerer Taktfrequenz. Die neuen 12-Core-Opterons profitieren deutlich von ihrer hohen Speicherbandbreite mit vier DDR3-1333-Channels pro CPU. Selbst die mit 3,33 GHz arbeitenden Xeon-5680-Modelle können bei identischer Compiler-Einstellung –QxO den Opteron nicht besiegen. Die Xeons müssen sich mit drei DDR3-1333-Channels pro Prozessor begnügen. Durch den hohen RAM-Bedarf von CPU2006 sind zwei DIMMs pro Channel verbaut, der Xeon X5570 schaltet hier auf 1066 MHz zurück. - CPU2006 64 Bit - Multitasking - SPECfp_rate_2006 - optimierte Herstellerangaben
Bei den sehr speicherintensiven und damit Speicherbandbreiten-abhängigen Fließkommaszenarios lässt sich die Performance durch spezielle Compiler und Bibliotheken gegenüber unseren Standardeinstellungen um zirka 31 bis 72 Prozent steigern. An der Reihenfolge der Prozessoren und somit am Kräfteverhältnis ändert sich allerdings wenig. - STREAM 5.8 OMP 64 Bit - Speicherbandbreite
Die beiden Opteron-6174-Prozessoren holen aus den insgesamt acht DDR3-1333-Channels einen Speicherdurchsatz von 51,8 GByte/s heraus. Damit überbieten die neuen 12-Core-CPUs ihre Vorgänger um den Faktor 2,7. Zwei Xeon-5600-CPUs erreichen mit ihren insgesamt sechs DDR3-1333-Channel nur 78 Prozent der Speicherbandbreite des Opteron-6174-Systems. - SPECjvm2008 - Base Run - Performance Java Runtime Environment
Die beiden Opteron-6174-Prozessoren können sich nur durch eine 21 Prozent höhere Performance von den Hexa-Core-Opterons absetzen. Die beiden Xeon-5600-Prozessoren platzieren sich mit ihrer Hexa-Core-Technologie plus Hyper-Threading deutlich vor den 12-Core-Opterons. - SPECpower_ssj2008 - Java-Performance - 100 Prozent Load
Der Workload ist speicherintensiver als bei SPECjvm2008 - das kommt den Opteron-6174-CPUs entgegen. Die 12-Core-Prozessoren können ihre vielen Kerne ausnutzen und sie profitieren von der hohen Speicherbandbreite der vier DDR3-1333-Channels pro CPU. Das Opteron-6174-Duett liegt an der Spitze und erreicht eine 66 Prozent höhere Performance im Vergleich zum Opteron-2435-Päärchen – bei gleicher Fertigungstechnologie und ähnlichem ACP-Wert. - SPECpower_ssj2008 - Performance/Watt - CPU-Powermanagement on
Das Opteron-6174-System bietet die höchste Energieeffizienz. Die deutlich höhere Performance bei fast unveränderter ACP-Einstufung von 80 Watt im Vergleich zum Opteron 2435 macht sich hier bezahlt. Selbst dem bereits sehr effizienten Intel-basierenden System mit den 32-nm-Xeon-5600-CPUs bleibt das Nachsehen. Hier erhöhen die zwei Xeon X5670 im Vergleich zu den Xeon-X5570-CPUs (einfacher Austausch) die Energieeffizienz des Servers um 29 Prozent. - SPECpower_ssj2008 - Performance/Watt - CPU-Powermanagement off
Mit inaktivem PowerNow! reduzieren die zwei Opteron 6174 die Systemeffizienz um ein knappes Prozent. Ähnlich sieht es bei den zwei Xeon X5670 und X5680 aus, wenn SpeedStep die Taktfrequenz und Core-Spannung nicht je nach Auslastung dynamisch regeln darf. Bei den zwei Xeon-X5570-CPUs verschlechtert sich die Effizienz noch um zirka zwei Prozent. Beim Opteron-2435-System geht die Effizienz ohne PowerNow! um ein gutes Prozent zurück. - SPECpower_ssj2008 - Energieaufnahme Plattform unter Volllast
Der Opteron 6174 ist von AMD mit 80 Watt ACP eingestuft. Damit liegen die Dodeca-Core-CPUs nur minimal über den 75 Watt ACP des Opteron 2435.Unter Volllast benötigt das Opteron-6174-System deswegen nur geringfügig mehr an Energie. Wie sehr der Energieverbrauch der Plattform von den CPUs abhängt, zeigt der Vergleich des Xeon L5520 mit dem X5680. Im identischen 2-Sockel-Server steigt die Leistungsaufnahme mit den 130-Watt-Modellen Xeon X5680 auf 399 Watt. Stecken in der gleichen Plattform zwei stromsparende Xeon L5520 (45-nm-Nehalem) mit 60 Watt TDP, so agiert der Server äußerst sparsam. - SPECpower_ssj2008 - Energieaufnahme Plattform im Leerlauf - Energiesparmodus an
Im Leerlauf mit PowerNow! arbeiten die Opteron-6174-CPUs mit 800 MHz Taktfrequenz und 0,925 V Kernspannung. Die 12-Core-Prozessoren agieren mit der neuen Maranello-Plattform und DDR3-Speicher sehr sparsam. Durch das zusätzliche Abschalten komplett ruhender Kerne machen sich die 12 Rechenwerke des Opteron 6174 gegenüber den Hexa-Core-Opterons nicht negativ bemerkbar. - SPECpower_ssj2008 - Energieaufnahme Plattform im Leerlauf - Energiesparmodus aus
Im Leerlauf steigt bei den Xeon X5670 der Energiebedarf ohne SpeedStep lediglich um ein Watt. Beim Xeon X5680 erhöht sich der Konsum dagegen um sieben Watt. Die Opteron-6174-Modelle erhöhen ihren Energiebedarf im Leerlauf ohne Powermanagement sogar um 14 Watt, die Opteron-2435-CPUs um 10 Watt. Hier zeigt sich, dass AMD das Powermanagement des Opteron 6174 weiter verbessert hat (siehe Artikelabschnitt „Sparsam durch C1e und Cool Speed“). - SunGard ACR 4.0 64 Bit - Monte Carlo Simulation
Die 12-Core-Opterons setzen sich durch ihre Kernverdoppelung deutlich vom Opteron-2435-Päärchen ab. Allerdings bleiben die Xeon-5600-Modelle weiterhin in Führung. Die Kombination aus höheren Taktfrequenzen plus Hyper-Threading lässt die 32-nm-Xeons trotz halber Kernanzahl schneller rechnen. Die Reduktion der Taktfrequenz war bei den Opteron-6100-Modellen notwendig, um den Energiebedarf stabil zu halten. - CINEBENCH 11.5 64 Bit - Single-Thread-Rendering
Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core nutzt hier nichts. Durch seine geringere Taktfrequenz von 2,2 GHz muss der Opteron 6174 sich dem Opteron 2435 (2,6 GHz) geschlagen geben. Durch die Turbo-Technologie arbeiten der Xeon X5570 und X5670 mit 3,33 GHz (plus drei „Speed Bins“), der Xeon X5680 erhöht auf 3,6 GHz Taktfrequenz um zwei „Speed Bins“. Durch diesen Taktfrequenzvorteil sind die AMD-CPUs im Single-Thread-Modus klar im Nachteil. - CINEBENCH 11.5 64 Bit - Multi-Thread-Rendering
Jetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. Das Opteron-6174-Päärchen profitiert von den insgesamt 24 physischen Kernen und schließt zu den Xeon-X5670-Prozessoren auf. Hyper-Threading erwirkt bei den Xeons ein Plus von zirka 24 Prozent. So erreicht beispielsweise der Xeon X5670 mit deaktiviertem HT nur 12,07 Punkte.
Bei Servern sind neben purer Rechenleistung zusätzlich hohe Speicherbandbreiten gefragt. Auch hier weist der Opteron „Magny-Cours“ einiges auf: Vier Speicherkanäle für DDR3-1333-DIMMs sorgen pro CPU für mehr als eine Bandbreitenverdoppelung. Die Vorgängermodelle der Opteron-2400-Serie sind auf zwei DDR2-800-Channels beschränkt. Durch die neue Speichertechnologie mit den verdoppelten Kanälen hat die über viele Jahre beibehaltene Plattformstabilität mit dem Socket F allerdings ausgedient. Die Opteron-6100-Prozessoren nehmen im Steckplatz G34 nebst zugehöriger neuer Plattform „Maranello“ Platz. Hier führt AMD auch Direct Connect Architectur 2.0 ein – mit schnelleren und zusätzlichen HyperTransport-Links.
- Opteron 6100 Magny-Cours
Die zwölf Prozessorkerne des Opteron 6174 arbeiten mit 2,2 GHz Taktfrequenz. AMD benötigt hierfür ein relativ großes Gehäuse, um die zwei 6-Core-Siliziumplättchen zu verbauen. - Opteron 6100 Magny-Cours
Die 12-Kern-CPUs benötigen den neuen Sockel G34 mit 1944 Kontaktpins. Die hohe Anzahl von Pins im Vergleich zum Socket F mit 1207 Kontakten ist durch die vier Speicherkanäle sowie den vier HT-Links notwendig. - Opteron 6100 Magny-Cours
Jeder Opteron 6100 besitzt vier integrierte Speicher-Channels für DDR3-1333-DIMMs. - Opteron 6100 Magny-Cours
Der Opteron 6100 basiert auf der K10-Architektur mit 45-nm-Fertigungstechnologie. (Quelle: AMD) - Opteron 6100 Magny-Cours
Die zwölf Kerne des Opteron 6100 setzen sich aus zwei 6-Core-Dies zusammen. Die Verbindung beider Siliziumplättchen erfolgt über HyperTransport. (Quelle: AMD) - Opteron 6100 Magny-Cours
Die Opteron-6100-Prozessoren stattet AMD erstmals mit „Direct Connect Architecture 2.0“ aus. Darunter versteht AMD einen integrierten 4-Channel-Speicher-Controller für DDR3-1333-DIMMs. Außerdem besitzen die CPUs vier HyperTransport-3.0-Links. (Quelle: AMD)
Im TecChannel-Testlabor überprüfen wir, welches Leistungsvermögen AMDs neue Opteron-6100-Serie bietet. Für die Tests steht uns ein 2-Sockel-Referenzsystem von AMD mit zwei Opteron 6174 zur Verfügung. Die 12-Core-CPUs arbeiten mit 2,2 GHz Taktfrequenz und besitzen mit 80 Watt ACP nur eine geringfügig höhere Energieeinstufung als die zum Vergleich dienenden Opteron 2435 (2,6 GHz / Hexa-Core / 75 Watt ACP). Von Intel stellen wir die Xeon-Serien 5500 (45 nm / Quad-Core) und 5600 (32 nm / Hexa-Core) den AMD-CPUs gegenüber. Alle Prozessoren arbeiten in möglichst identisch ausgestatteten 2-Sockel-Systemen.
Wir überprüfen die Performance der CPUs bei Integer- und Floating-Point-Anwendungen sowie bei Verschlüsselung, Rendering und Simulation. Die Geschwindigkeit bei Java-Applikationen wird ebenso untersucht wie die Energieeffizienz der Zwei-Sockel-Systeme. Außerdem messen wir den Speicherdurchsatz der Server.