Überraschend günstig und effizient
Test - AMD Opteron 6174 im Quartett
Mit dem zwölfkernigen Opteron 6100 bietet AMD einen Prozessor für verschiedene Systeme an. Die CPU ist sowohl für den Betrieb in 2-Sockel-Systemen als auch für den Einsatz in Servern mit vier Sockeln ausgelegt.
Im Betrieb als Doppelpack konkurriert der Opteron primär mit Intels Xeon-5600-Prozessoren. Zwar müssen AMDs 12-Kern-CPUs in der reinen Rechenleistung den Hexa-Core-Xeons meist den Vortritt lassen, aber sie sind nicht meilenweit entfernt. In der Energieeffizienz zeigen sich Opteron-6100-Systeme dagegen mehr als nur konkurrenzfähig gegenüber den Xeon-5600-Servern.
- CPU2006 64 Bit - Multitasking - SPECint_rate_base2006 SSE3-Compiler-Setting
Die vier Opteron 6174 setzen sich natürlich deutlich von den CPU-Doppelpacks ab, die vier Xeon X7560 liegen jedoch außer Reichweite. Die Xeons skalieren beim Einsatz von „Standardanwendungen“ besser vom Schritt von zwei auf vier CPUs. - CPU2006 64 Bit - Multitasking - SPECint_rate_2006 - optimierte Herstellerangaben
Mit speziellen Compilern und Bibliotheken wird das Integer-Leistungsvermögen gegenüber unseren Standardeinstellungen fast verdoppelt. Die vier Opteron 6174 bleiben dennoch hinter den vier Xeon X7560. Dafür zeigen die 12-Kern-Prozessoren bei optimierter Software eine sehr gute Skalierung. - CPU2006 64 Bit - Multitasking - SPECfp_rate_base2006 SSE3-Compiler-Setting
Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen und SSE3-Support zieht das Xeon-X7560-Quartett den vier Opteron-6174-CPUs ebenfalls davon. Sehr stark präsentiert sich dagegen das Opteron-Päärchen, selbst die mit 3,33 GHz arbeitenden Xeon-5680-Modelle können bei identischer Compiler-Einstellung -QxO den Opteron nicht besiegen. - CPU2006 64 Bit - Multitasking - SPECfp_rate_2006 - optimierte Herstellerangaben
Bei den sehr speicherintensiven Fließkommaszenarios lässt sich die Performance durch spezielle Compiler und Bibliotheken gegenüber unseren Standardeinstellungen bei den vier Opteron 6174 um bis zu 94 Prozent steigern. Bei dem hochoptimierten, aber weniger praxisrelevanten Szenario, überholt das Opteron-Quartett sogar die vier Xeon X7560. - VMware VMmark - Konsolidierte Virtualisierungs-Performance - ESX-Server
Die vier Xeon X7560 bieten eine 27 Prozent höhere Virtualisierungsleistung als das Opteron-Quartett. Durch den massiven möglichen Speicher durch 64 DIMMs im Xeon-Server sind 50 Tiles möglich (1 Tile = 6 VMs; benötigt zirka 6 GB RAM) sind die Xeon-7500-Systeme im Vorteil. Im 4S-Opteron-Server (Dell PowerEdge R815) stehen nur 32 DIMMs zur Verfügung. - VMware VMmark - Virtualisierungs-Performance 1 Tile (6 VMs) - ESX-Serve
Obwohl der Xeon-X7560-Server die sehr hohe Anzahl von 50 Tiles laufen lässt, ist die Performance in einer VM sogar noch über dem Niveau der anderen Systeme. Allerdings zeigt sich hier, dass alle Prozessoren innerhalb der virtuellen Maschine eine sehr ähnliche Leistung ermöglichen. - STREAM 5.8 OMP 64 Bit - Speicherbandbreite
Die vier Opteron-6174-Prozessoren holen aus den insgesamt 16 DDR3-1333-Channels einen Speicherdurchsatz von 78 GByte/s heraus. Die vier Xeon X7560 erreichen dagegen nur knapp die Bandbreite der zwei Xeon X5680. Der etwas enttäuschende Durchsatz wird auch durch die Latenzzeiten der SMBs verursacht. Mit einer gcc-compilierten Linux-Variante von STREAM holen die Xeon X7560 etwas mehr aus dem Speicher. So erreichen damit zwei Xeon X7560 immerhin 28 statt nur 20 GByte/s. - SPECjvm2008 - Base Run - Performance Java Runtime Environment
Die vier Opteron 6174 und das Xeon-X7560-Quartett bieten fast die identische Performance. Eine sehr gute Java-Leistung erzielen auch die zwei Xeon X5680 mit Hexa-Core-Technologie. - SPECpower_ssj2008 - Java-Performance - 100 Prozent Last
Der Workload ist speicherintensiver als bei SPECjvm2008 und skaliert besser mit der Anzahl der Prozessoren / Kerne. Mit insgesamt 32 Speicherkanälen setzen sich die vier Xeon X7560 etwas mehr von den vier Opteron 6174 mit 16 Channels ab. Dafür überholen zwei Opteron 6174 jetzt die zwei Xeon X5680 - dank der höheren Speicherbandbreite. - SPECpower_ssj2008 - Performance/Watt - CPU-Powermanagement an
Die Opteron-6174-Systeme nutzen die Energie am effizientesten aus, egal ob mit zwei oder vier Prozessoren. Mit deutlichem Abstand folgen die Xeon-X7560-Server – trotz höherer Performance als die Opteron-Systeme. Selbst die für hohe Effizenz bekannten 32-nm-Xeon-5600-CPUs bleibt gegenüber den 45-nm-Opterons das Nachsehen. - SPECpower_ssj2008 - Energieaufnahme Plattform unter Volllast
Der Dell PowerEdge R815 mit vier Opteron 6174 zeigt sich für ein Vierwegesystem sehr zurückhaltend im Energiekonsum. Die 12-Kern-CPUs sind mit 80 Watt ACP eingestuft. Dells PowerEdge R810 mit zwei Xeon X7560 (130 Watt TDP) benötigt nur 106 Watt weniger. Das 4-fach-Xeon-X7560-System QSSC-S4R nimmt mit 1113 Watt dagegen mehr als die doppelte Energie im Vergleich zum R810 mit zwei Xeon X7560 auf. Hier zeigt sich, dass der QSSC-S4R-Chassis mit vier 850-W-Netzteilen und seiner Vielzahl an redundanten Lüftern deutlich mehr Energie benötigt. - SPECpower_ssj2008 - Energieaufnahme Plattform im Leerlauf - Energiesparmodus an
Das 4-Sockel-System Dell PowerEdge R815 zeigt, wie sparsam die Opteron-6100-Plattform sein kann. Der sehr identische 4-Sockel-Server PowerEdge R810 – bestückt mit zwei Xeon 7560 – genehmigt sich bereits gute 30 Watt mehr im Leerlauf. Der QSSC-S4R mit vier Xeon X7560 zollt der Auslegung auf hohe Betriebssicherheit Tribut. - openSSL 0.9.8b 64 Bit - Encryption RSA2048
Der Test läuft überwiegend im Cache ab. Die vier 12-Core-Opterons 6174 verschlüsseln 37 Prozent schneller als die mit ähnlicher Taktfrequenz agierenden 8-Core-Xeons X7560, die zusätzlich noch über Hyper-Threading verfügen. Die AES-Beschleunigung der 32-nm-Xeon-5600-Serie kommt hier nicht zum Einsatz. - openSSL 0.9.8b 64 Bit - Decryption RSA2048
Das Entschlüsseln erledigen die vier Opteron 6174 sogar 51 Prozent schneller als die vier Octa-Core-Xeons X7560. Der Speicherdurchsatz ist bei den openSSL-Workloads vernachlässigbar. - CINEBENCH 11.5 64 Bit - Single-Thread-Rendering
Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core nutzt hier nichts. Durch seine geringere Taktfrequenz von 2,2 GHz muss der Opteron 6174 der Intel-Konkurrenz deutlich geschlagen geben. Durch die Turbo-Technologie arbeitet der Xeon X7560 jetzt mit 2,66 statt 2,26 GHz Taktfrequenz. Deswegen überholt der Xeon X7560 auch den Xeon X7460. - CINEBENCH 11.5 64 Bit - Multi-Thread-Rendering
Jetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. Die vier Opterons mit 12-Core-Architektur rendern mit 48 Threads. Bei den vier Xeon X7560 (8 Core plus Hyper-Threading) sind insgesamt 64 Threads aktiv.
Im Segment der 4-Sockel-Server mit x86-Architektur gibt es für den Opteron 6100 nur Intels Xeon-7500-Serie als Gegner. Die Octa-Core-CPUs mit zusätzlichem Hyper-Threading überzeugen im Quartett mit sehr hoher Rechenleistung, wie unser Test bereits zeigte. Zusätzlich überzeugt Intels Xeon-7500-Plattform durch seine RAS-Features wie die MCA-Technologie. Insbesondere Anwendern von RISC-Maschinen wird damit der Umstieg auf eine x86-Plattform schmackhaft gemacht.
AMD will mit einem anderen Merkmal punkten: Rechenleistung einer 4-Sockel-Maschine zum Preis eines 2-Sockel-Servers. Oder anders gesagt: Ein Opteron-6100-Server mit vier CPUs soll deutlich weniger kosten als ein 4S-System mit Xeon-7500-Prozessoren. Die Aussagen lassen sich bestätigen. Das Testsystem für vier Opteron 6174, ein Dell PowerEdge R815, kostet mit 128 GByte RAM zirka 16.000 Euro. Der vergleichbare Dell PowerEdge R810 mit vier Xeon X7560 und 128 GByte RAM steht für zirka 26.000 Euro in der Preisliste - bei ansonsten identischer Konfiguration.
Stellt man bei Dell einen 2-Sockel-Server PowerEdge R710 mit zwei Xeon X5680 und 128 GByte RAM zusammen, läuft es auf eine Summe von knapp 14.000 Euro hinaus. Für etwa 13.000 Euro gibt es den PowerEdge R715 mit zwei Opteron 6176SE, den schnellsten 12-Core-Opterons.
- Dell PowerEdge R815
Der 4-Sockel-Server dient uns als Testsystem für das Opteron-6174-Quartett. - 4-Sockel-Plattform
Jeder der vier Opteron 6174 besitzt vier integrierte Speicher-Channels für DDR3-1333-DIMMs. Im Dell PowerEdge R815 sind pro Speicherkanal zwei DIMMs möglich - insgesamt 32 Speicherriegel. - Opteron 6174
Die zwölf Prozessorkerne des Opteron 6174 arbeiten mit 2,2 GHz Taktfrequenz. AMD benötigt hierfür ein relativ großes Gehäuse, um die zwei 6-Core-Siliziumplättchen zu verbauen. - Socket G34
Die 12-Kern-CPUs benötigen den Sockel G34 mit 1944 Kontaktpins. Die hohe Anzahl von Pins im Vergleich zum Socket F mit 1207 Kontakten ist durch die vier Speicherkanäle sowie den vier HT-Links notwendig. - Opteron 6100 Features
Der Opteron 6100 basiert auf der K10-Architektur mit 45-nm-Fertigungstechnologie. (Quelle: AMD) - Floorplan
Die zwölf Kerne des Opteron 6100 setzen sich aus zwei 6-Core-Dies zusammen. Die Verbindung beider Siliziumplättchen erfolgt über HyperTransport. (Quelle: AMD) - Direct Connect Architecture 2.0
Die Opteron-6100-Prozessoren stattet AMD erstmals mit „Direct Connect Architecture 2.0“ aus. Darunter versteht AMD einen integrierten 4-Channel-Speicher-Controller für DDR3-1333-DIMMs. Außerdem besitzen die CPUs vier HyperTransport-3.0-Links. (Quelle: AMD)
Der Preisvergleich spricht bereits für ein 4-Sockel-System mit Opteron-6174-CPUs. Jedoch müssen auch die Performance und die Energieeffizienz stimmen. Im TecChannel-Testlabor vergleichen wir das Opteron-Quartett gegen Intels-Xeon-Prozessoren in Systemen mit zwei und vier Sockeln. Wir überprüfen die Performance der CPUs bei Integer- und Floating-Point-Anwendungen, Verschlüsselung, Rendering und Java-Applikationen. Außerdem messen wir die Energieeffizienz der Systeme sowie den Speicherdurchsatz und zeigen die Virtualisierungsleistung auf.