Erster ausführlicher Test: AMDs Dual-Core-Opteron

21.04.2005 von Christian Vilsbeck

AMD stellt mit dem Dual-Core-Opteron seine nächste CPU-Generation vor. Mit zwei Prozessorkernen lässt der Opteron 875 Intels Xeon-Modellen bei professionellen Workstation-Anwendungen wenig Chancen.

Das Prestige-Rennen um die erste x86-Dual-Core-CPU hat AMD gegen Intel knapp verloren - zumindest bei den Desktop-Prozessoren. AMDs neuen Dual-Core-Opterons für Server und Workstations kann Intel jedoch nichts Adäquates entgegensetzen. Die Xeons sollen erst im ersten Quartal 2006 Doppelkerne bekommen.

AMD bietet die Dual-Core-Opterons als Modelle 865, 870 und 875 für Systeme mit bis zu acht Prozessoren an. Die Opterons 265, 270 und 275 sind ab Ende Mai 2005 verfügbar und auf den Dualprozessorbetrieb beschränkt. Platz nehmen die Doppelkern-CPUs weiterhin im Socket 940. Server- und Workstation-Mainboards, die bereits zu 90-nm-Opterons kompatibel sind, können AMDs Neulinge in Betrieb nehmen. Und mit maximal 95 Watt Leistungsaufnahme bleiben die Dual-Core-Opterons im Bereich bisheriger 130-nm-Single-Core-Modelle.

Im tecCHANNEL-Testlabor tritt der Opteron 875 gegen die Single-Core-Opterons sowie Intels Xeon-DP-Modelle bei Direct3D-, OpenGL- und Rendering-Applikationen an. Professionelle Software wie 3ds max, AutoCAD und Maya fordert neben den Prozessoren auch die Workstation-Grafikkarten voll. Hier zeigt sich, welche Kombination am besten harmoniert.

Außerdem müssen sich die Workstation-CPUs im Dualprozessorbetrieb beweisen. Bei zwei Opteron-875-CPUs sind dann vier "echte" Kerne im Einsatz. Zwei Xeon-CPUs weisen zwar auch vier Cores aus, zwei davon sind durch Hyper-Threading aber nur "virtuell" vorhanden.

Details zum Dual-Core-Opteron

AMD bietet die Dual-Core-Opteron-CPUs als Modelle 865, 870 und 875 für 8-Wege-Systeme an. Für Server und Workstations mit maximal zwei CPUs gibt es ab Ende Mai 2005 die Modelle 265, 270 und 275. Die Prozessoren für den Socket 940 arbeiten mit Taktfrequenzen von 1,8 (x65), 2,0 (x70) und 2,2 GHz (x75). Jeder Prozessorkern besitzt bei den Dual-Core-Opterons einen 1 MByte großen L2-Cache.

Die Kommunikation zwischen den CPUs sowie zur Peripherie übernehmen HyperTransport-Schnittstellen mit 1000 MHz Taktfrequenz. Als Architekturerweiterungen spendiert AMD dem Dual-Core-Opteron neben dem SSE3-Befehlssatz eine verbesserte Hardware-Prefetch-Logik. Damit will AMD Page-Crossing-Zustände optimieren und DRAM-Page-Konflikte minimieren. Zusätzlich kann der Dual-Core-Opteron mit vier Write Combining Buffers aufwarten. Beim Speicher adressieren die CPUs unverändert Dual-Channel-DDR400-Module in gepufferter Ausführung.

Die Fertigung der Doppelkern-Opterons erfolgt in einem 90-nm-Prozess mit SOI-Technik. AMD spezifiziert die Dualisten mit 95 Watt TDP bei einer Core-Spannung von 1,35 Volt. Zum Vergleich: Die 130-nm-Single-Core-Opterons stehen mit 89 Watt im Datenblatt. Durch den 90-nm-Prozess bleibt die Die-Größe der Dual-Core-Opterons mit 193 mm² ebenfalls auf dem Niveau aktueller 130-nm-Opterons. Die Transistoranzahl steigt dagegen von 106 auf zirka 233 Millionen.

In der Tabelle haben wir für Sie alle Opteron-Modelle zusammengefasst.

Die Tabelle zeigt die Opteron-Modellpalette mit ihrer tatsächlichen Taktfrequenz.
Prozessor	Taktfrequenz [MHz]	Architektur	Multiprocessing

Opteron 140	1400	Single-Core	nein
Opteron 140 EE	1400	Single-Core	nein
Opteron 142	1600	Single-Core	nein
Opteron 144	1800	Single-Core	nein
Opteron 146	2000	Single-Core	nein
Opteron 146 HE	2000	Single-Core	nein
Opteron 148	2200	Single-Core	nein
Opteron 150	2400	Single-Core	nein
Opteron 152	2600	Single-Core	nein


Opteron 240	1400	Single-Core	2 CPUs
Opteron 240 EE	1400	Single-Core	2 CPUs
Opteron 242	1600	Single-Core	2 CPUs
Opteron 244	1800	Single-Core	2 CPUs
Opteron 246	2000	Single-Core	2 CPUs
Opteron 246 HE	2000	Single-Core	2 CPUs
Opteron 248	2200	Single-Core	2 CPUs
Opteron 250	2400	Single-Core	2 CPUs
Opteron 252	2600	Single-Core	2 CPUs
Opteron 265	1800	Dual-Core	2 CPUs
Opteron 270	2000	Dual-Core	2 CPUs
Opteron 275	2200	Dual-Core	2 CPUs


Opteron 840	1400	Single-Core	8 CPUs
Opteron 840 EE	1400	Single-Core	8 CPUs
Opteron 842	1600	Single-Core	8 CPUs
Opteron 844	1800	Single-Core	8 CPUs
Opteron 846	2000	Single-Core	8 CPUs
Opteron 846 HE	2000	Single-Core	8 CPUs
Opteron 848	2200	Single-Core	8 CPUs
Opteron 850	2400	Single-Core	8 CPUs
Opteron 852	2600	Single-Core	8 CPUs
Opteron 865	1800	Dual-Core	8 CPUs
Opteron 870	2000	Dual-Core	8 CPUs
Opteron 875	2200	Dual-Core	8 CPUs

Ausführliche Grundlagen über die AMD64-Architektur des Opteron können Sie ebenfalls bei tecCHANNEL nachlesen.

Raytracing: Lightwave 3D

Das 3D-Programm Lightwave 3D 7.5 von NewTek ist für den Pentium 4 und Xeon optimiert. Laut NewTek betrifft das speziell den SSE2-Befehlssatz. Neben Intel-CPUs werden auch die AMD-Prozessoren besonders unterstützt. NewTek selbst hat die Athlon-Prozessoren für Lightwave 3D bereits im März 2001 zertifiziert. Von der SSE2-Optimierung in Lightwave 3D sollten auch die Opteron-CPUs profitieren.

Rendering: Cinema 4D

Mit dem CINEBENCH 2003 stellt Maxon seine aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 2003 basiert auf Cinema 4D Release 8 und führt wieder Shading- und Raytracing-Tests durch. Die aktuelle Version unterstützt nun SSE2 sowie Intels Hyper-Threading-Technologie. Intel selbst unterstützte Maxon bei der Optimierung von Cinema 4D.

Der Raytracing-Test von CINEBENCH 2003 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle.

Der Leistungstest OpenGL-HW von CINEBENCH 2003 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten. Cinema 4D übermittelt der Grafikkarte lediglich die Position der Lichtquellen sowie die Geometrie. Dual-Processing wird dabei nicht genutzt.

Beim Leistungstest OpenGL-SW übernimmt Cinema 4D zusätzlich die Berechnung der Beleuchtung. Hier geht die FPU-Performance des Prozessors sowie die Speicherbandbreite noch stärker ein. Dual-Processing wird nicht unterstützt.

AutoCAD 2005: AUGI Gauge

Die Autodesk User Group International stellt ihren Mitgliedern mit AUGI Gauge eine Benchmark-Suite für AutoCAD zur Verfügung. Mit AUGI Gauge lässt sich die Performance von AutoCAD im Zusammenspiel mit verschiedenen Betriebssystemen und Hardware-Plattformen ermitteln.

Die AUGI-Gauge-Version 16.1 unterstützt AutoCAD 2002, 2004 und 2005. Bei unserem Test der Workstation-CPUs verwenden wir AutoCAD 2005. AUGI Gauge führt mit dem Real World Test und Synthetic Test zwei verschiedene Szenarien durch. In beiden Fällen gibt der Benchmark die insgesamt benötigte Zeit als Ergebnis aus.

Bei allen Tests aktivieren wir über die AutoCAD-Kommandozeile mit dem Befehl whipthread=3 das Multiprocessing für Redraw- und Regeneration-Operationen. Die Workstation-Grafikkarten NVIDIA Quadro FX nutzen bei den Benchmarks jeweils AutoCADs Heidi-OpenGL-Treiber. NVIDIAs POWERdraft-Treiber zur Beschleunigung von AutoCAD unterstützt in der aktuellen Version 15.06.06 kein AutoCAD 2005.

Der Real World Test von AUGI Gauge simuliert typische AutoCAD-Aktivitäten: Laden/Speichern von Dateien, Objekt-Selektion, Editieren und Anzeigen ausgeführter Befehle anhand einer Vielzahl von Grafiken.

Im Synthetic Test von AUGI Gauge erfolgen spezielle Kommandos wie beispielsweise das Erzeugen eines Objekts und das Verändern von 3D-Darstellungen. Bei diesem Testblock beginnt der Benchmark mit einer leeren Zeichnung.

Laut Autodesk profitiert AutoCAD von einem zweiten Prozessor in einer "Single Session" mit zirka zwei bis vier Prozent höherer Performance. AUGI Gauge fordert bei seinen Tests den Single-drawing Mode. Aktiviert man bei AutoCAD die Verwendung mehrerer Fenster gleichzeitig, so sollte der Vorteil von Multiprocessing deutlich steigen.

AutoCAD 2005: CADALYST

Der CADALYST Systems Benchmark 2001 erlaubt den Vergleich der AutoCAD-Performance auf verschiedenen Systemen. Das Analyse-Tool unterstützt Autodesks AutoCAD bis zur Version 2004. Das für unsere Workstation-Benchmarks verwendete AutoCAD 2005 arbeitet ebenfalls mit CADALYST 2001 zusammen, wird offiziell aber noch nicht unterstützt.

Bei allen CADALYST-Tests aktivieren wir über die AutoCAD-Kommandozeile mit dem Befehl whipthread=3 das Multiprocessing für Redraw- und Regeneration-Operationen. Die Workstation-Grafikkarten NVIDIA Quadro FX nutzen bei den Benchmarks jeweils AutoCADs Heidi-OpenGL-Treiber. NVIDIAs POWERdraft-Treiber zur Beschleunigung von AutoCAD unterstützt in der aktuellen Version 15.06.06 kein AutoCAD 2005.

CADALYST Systems Benchmark 2001 analysiert die AutoCAD-Performance in vier Bereichen: Wireframe, Gouraud Shade, Non-graphics und 2D Graphics. Zusätzlich bildet der Benchmark einen Index für die Gesamt-Performance.

Laut Autodesk profitiert AutoCAD von einem zweiten Prozessor in einer "Single Session" durchschnittlich mit zirka zwei bis vier Prozent höherer Performance. Der CADALYST Systems Benchmark 2001 fordert bei seinen Tests den Single-drawing Mode. Aktiviert man bei AutoCAD die Verwendung mehrerer Fenster gleichzeitig, so sollte der Vorteil von Multiprocessing deutlich steigen.

SPECapc: 3ds max 5

3D Studio Max 5 von Discreet/Autodesk ist eine professionelle Software für 3D-Modellierung, Animation und Rendering. Um die Leistungsfähigkeit von 3D Studio Max auf verschiedenen Hardware-Plattformen standardisiert testen zu können, gibt es vom Benchmark-Konsortium SPEC das Benchmark-Paket SPECapc for 3ds max 5. Die umfangreichen Tests von SPECapc spiegeln die typischen Berechnungen bei der Erstellung von Animationen wider.

Neben der Gesamt-Performance wird die CPU- und Grafikleistung getrennt bewertet und aufgelistet. Die Prozessorleistung wird aus zehn Einzelergebnissen ermittelt, die Grafik-Performance ergibt sich aus 25 individuellen Tests.

Bei der Bewertung der Grafikleistung nützt der Benchmark die OpenGL-Beschleunigung der Grafikkarte voll aus. Die Performance der Quadro-FX-Grafikkarten wird durch NVIDIAs MAXtreme-Treiber V4 für 3ds max 5 zusätzlich gesteigert. Der Vorteil von Dual-Processing fließt in das Ergebnis nicht ein.

SPECapc: 3ds max 6

Discreet/Autodesk bietet die 3D-Modelling-, Animations- und Rendering-Software 3ds max aktuell als Version 6 an. Seit Juni 2004 gibt es von SPEC mit SPECapc for 3ds max 6 ein Tool zum Ermitteln der Leistungsfähigkeit dieser Software auf verschiedenen Hardware-Plattformen. SPECapc for 3dsmax 6 ermittelt die Performance anhand typischer und praxisrelevanter Workloads. Hierzu zählen Funktionen wie wireframe modeling, shading, texturing, lighting, blending, inverse kinematics, object creation, scene creation, particle tracing, animation und rendering.

Die Gesamt-Performance ermittelt SPECapc for 3ds max 6 mit einer Gewichtung von 20 Prozent für das rendering und 80 Prozent für die grafiklastigen interactive tests. Beide Einzelwertungen gibt der Benchmark getrennt aus.

Bei den Render-Vorgängen nutzt 3ds max 6 Multiprocessing voll aus. Intels Hyper-Threading-Technologie sowie ein zweiter Prozessor wirken somit beschleunigend.

Bei der Bewertung der Grafikleistung mit den interactive tests nützt der Benchmark die OpenGL-Beschleunigung der Grafikkarte voll aus. Die Performance der Quadro-FX-Grafikkarten wird durch NVIDIAs MAXtreme-Treiber V6 für 3ds max 6 zusätzlich gesteigert. Der Vorteil von Dual-Processing fließt in das Ergebnis nicht ein.

SPECapc: Maya 6

Maya von Alias ist die mit einem Oscar ausgezeichnete, professionelle Software für 3D-Modelling, Animation und Rendering. Maya unterstützt den gesamten Produktions-Workflow und bietet mit seinem fortschrittlichen Feature-Set umfassende Werkzeuge für die Erzeugung kreativer, digitaler Inhalte.

Um die Performance von Maya 6 auf verschiedenen Hardware-Plattformen zu bestimmen, entwickelte Alias in Kooperation mit dem SPEC-Benchmark-Konsortium die Test-Suite SPECapc for Maya. Mit vier verschiedenen Szenarios bewertet der Benchmark die Grafikleistung, die Prozessor- und I/O-Performance. Jedes der vier Szenarien - Werwolf, menschliche Hand, Insekt, Tintenfisch - wird gerendert und in fünf verschiedenen Modi dargestellt: Wireframe, Gouraud-shaded, Textur, Textur mit überzogenem Drahtmodell und selektierte Textur.

SPECapc for Maya ermittelt die Gesamt-Performance mit einer Gewichtung aus 70 Prozent Grafikleistung, 20 Prozent CPU- und 10 Prozent I/O-Performance.

SPECviewperf 7.1.1

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 7.1.1 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Besonders die Anwendung Lightscape Viewset (light-06) nützt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.

Alle Einzelergebnisse des SPECviewperf 7.1.1 finden Sie in der Tabelle:

SPECviewperf 7.1.1
CPU	3dsmax-02[fps]	drv-09 [fps]	dx-08 [fps]	light-06 [fps]	proe-02 [fps]	ugs-03 [fps]
Höhere Werte sind besser.
Opteron 248 DDR400	25,9	169,4	136,2	29,8	44,8	54,7
Opteron 875 DDR400	26,25	174,4	139,0	30,5	45,5	54,9
Xeon 3,60 GHz 1M L2 DDR2-400	31,9	173,8	160,3	40,1	47,8	54,7
Xeon 3,60 GHz 2M L2 DDR2-400	32,0	181,0	161,4	40,4	48,1	54,7

Direct3D: 3ds max 6

Discreet/Autodesk bietet die 3D-Modelling-, Animations- und Rendering-Software 3ds max aktuell als Version 6 an. Seit Juni 2004 gibt es von SPEC mit SPECapc for 3ds max 6 ein Tool zum Ermitteln der Leistungsfähigkeit dieser Software auf verschiedenen Hardware-Plattformen. SPECaps for 3dsmax 6 ermittelt die Performance anhand typischer und praxisrelevanter Workloads. Hierzu zählen Funktionen wie wireframe modeling, shading, texturing, lighting, blending, inverse kinematics, object creation, scene creation, particle tracing, animation und rendering.

Bei der Grafikkarten-Unterstützung erlaubt 3ds max 6 die Wahl zwischen Software-, OpenGL- und Direct3D-Beschleunigung. Die Einbindung zusätzlicher Treiber wie NVIDIAs MAXtreme für Quadro-Grafikkarten ist ebenfalls möglich. Um die Direct3D-Performance zu testen, wählen wir die DirectX-9.0-Beschleunigung.

Direct3D: 3DMark03

Die Direct3D-Performance ermitteln wir unter anderem mit 3DMark03 von Futuremark. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei anspruchsvollen 3D-Anwendungen.

Die 3D-Tests von 3DMark03 setzen sich aus vier Szenen zusammen: "Wings of Fury" setzt auf DirectX 7 und repräsentiert Lowend-Grafikanwendungen. Die beiden Tests "Alpha Squadron" und "Troll's Lair" nutzen DirectX-8-Features und sind auf Mainstream-Grafikkarten zugeschnitten. Der Test "Nature II" setzt DirectX 9 voraus und soll Highend-Grafikkarten ausreizen. Der AGP- und der Speicherbus werden bei 3DMark03 durch große Mengen an Texturen stark belastet. Den Vorteil von Multiprocessing nützt der Direct3D-Benchmark dabei nicht aus.

SPECint_base2000

Wir setzen die SPEC-CPU2000-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 8.0 und MS Visual Studio.NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie die von beiden Firmen offiziell gemeldeten Integer-Resultate zeigen. Unsere verwendeten CPU2000-Config-Files können Sie im Artikel Test: Pentium XE 840 einsehen.

Der SPECint_base2000-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

SPECint_base2000: Official Run
Prozessor	Opteron 248	Opteron 875	Xeon 3,60 GHz 1M L2	Xeon 3,60 GHz 2M L2
Alle Angaben in Punkten. Höhere Werte sind besser. Bedeutung der Compiler-Optionen: -QxW = optimiert für Pentium 4/Xeon mit SSE2-Erweiterung und lauffähig auf dem Opteron. -QxP = optimiert für den Pentium 4/Xeon mit SSE3-Erweiterung.
Taktfrequenz	2,2 GHz	2,2 GHz	3,6 GHz	3,6 GHz
Sockel	940	940	604	604
Core	AMD64	AMD64	Nocona	Irwindale
Speichertyp	DDR400 CL2.5	DDR400 CL2.5	DDR2-400 CL3	DDR2-400 CL3
Chipsatz	NF Prof.	NF Prof.	E7525	E7525
Compiler	-QxW	-QxW	-QxP	-QxP
Test
164.gzip	1181	1208	1166	1164
175.vpr	1212	1244	935	1162
176.gcc	1139	1167	1864	2010
181.mcf	1097	1095	858	1291
186.crafty	1558	1581	1310	1321
197.parser	1383	1423	1322	1451
252.eon	1657	1723	1540	1535
253.perlbmk	1484	1497	1667	1711
254.gap	1530	1576	1831	1855
255.vortex	2160	2216	2438	2648
256.bzip2	1190	1213	1060	1260
300.twolf	1499	1537	1325	1789
Gesamt	1398	1429	1382	1552

Im folgenden Diagramm finden Sie das Gesamtergebnis des SPEC-CPU2000-Integer-Benchmarks der Prozessoren nochmals übersichtlich im grafischen Vergleich:

SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECint_rate_base2000 beim Opteron 248 mit einer Kopie, beim Opteron 875 (Dual-Core) und Xeon (Hyper-Threading) mit zwei Kopien. Sind jeweils zwei Prozessoren im Einsatz, so verdoppelt sich die Anzahl der Kopien - beispielsweise vier Kopien bei zwei Opteron 875. Bei diesem Test wird der Vorteil von Hyper-Threading und Dual-Core ausgenutzt. Bei Single-Thread-Prozessoren wie dem Opteron 248 führen SPECint_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

SPECfp_base2000

Wir setzen die SPEC-CPU2000-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 8.0 und MS Visual Studio sowie Intel Fortran 8.0 für alle Fließkomma-Tests. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie die von beiden Firmen offiziell gemeldeten FP-Resultate zeigen. Unsere verwendeten CPU2000-Config-Files können Sie im Artikel Test: Pentium XE 840 einsehen.

Der SPECfp_base2000-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

AMDs Opteron 875 beherrscht wie die Xeons SSE3. Die Intel-Compiler verweigern aber mit eingestellter SSE3-Optimierung -QxP die Zusammenarbeit mit der AMD-CPU. Wir testen den Opteron 875 mit dem Compiler-Switch -QxW mit SSE2-Unterstützung.

SPECfp_base2000: Official Run
Prozessor	Opteron 248	Opteron 875	Xeon 3,60 GHz 1M L2	Xeon 3,60 GHz 2M L2
Alle Angaben in Punkten. Höhere Werte sind besser. Bedeutung der Compiler-Optionen: -QxW = optimiert für Pentium 4/Xeon mit SSE2-Erweiterung und lauffähig auf dem Opteron. -QxP = optimiert für den Pentium 4/Xeon mit SSE3-Erweiterung.
Taktfrequenz	2,2 GHz	2,2 GHz	3,6 GHz	3,6 GHz
Sockel	940	940	604	604
Core	AMD64	AMD64	Nocona	Irwindale
Speichertyp	DDR400 CL2.5	DDR400 CL2.5	DDR2-400 CL3	DDR2-400 CL3
Chipsatz	NF Prof.	NF Prof.	E7525	E7525
Compiler	-QxW	-QxW	-QxP	-QxP
Test
168.wupwise	1487	1604	2221	2259
171.swim	2034	2139	1877	1960
172.mgrid	1097	1172	1276	1331
173.applu	1140	1277	1250	1299
177.mesa	1606	1632	1571	1553
178.galgel	1970	2104	2172	3115
179.art	1766	1698	835	2414
183.equake	1392	1522	1579	1752
187.facerec	1682	1815	1793	1877
188.ammp	1114	1157	935	1264
189.lucas	1631	1824	1663	1751
191.fma3d	1299	1355	1342	1370
200.sixtrack	579	597	642	647
301.apsi	1272	1287	966	1161
Gesamt	1375	1450	1354	1592

Im folgenden Diagramm finden Sie das Gesamtergebnis des SPEC-CPU2000-Integer-Benchmarks übersichtlich im grafischen Vergleich:

SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECfp_rate_base2000 beim Opteron 248 mit einer Kopie, beim Opteron 875 (Dual-Core) und den Xeons (Hyper-Threading) mit zwei Kopien. Sind jeweils zwei Prozessoren im Einsatz, so verdoppelt sich die Anzahl der Kopien - beispielsweise vier Kopien bei zwei Opteron 875. Bei diesem Test wird der Vorteil von Hyper-Threading und Dual-Core ausgenützt. Bei Single-Thread-Prozessoren wie dem Opteron 248 führen SPECfp_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

32-Bit-Transfer

Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load-/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.

64-Bit-Transfer

Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.

128-Bit-Transfer

Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.

Listenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 21. April 2005 die letzten Änderungen. Intels Preisliste wurde ebenfalls am 20. März 2005 aktualisiert.

OEM-Preise im Vergleich
Modell	Taktfrequenz [MHz]	Preis [US-Dollar]
Alle Preise in US-Dollar, bezogen auf eine Abnahmemenge von 1000 Stück. Stand: AMD-Preisliste vom 21. April 2005, Intel-Preisliste vom 20. März 2005.
Opteron 1xx
Opteron 140	1400	163
Opteron 140 EE	1400	278
Opteron 142	1600	163
Opteron 144	1800	178
Opteron 146	2000	218
Opteron 146 HE	2000	278
Opteron 148	2200	278
Opteron 148 HE	2200	637
Opteron 150	2400	417
Opteron 152	2600	637


Opteron 2xx
Opteron 240	1400	163
Opteron 240 EE	1400	455
Opteron 242	1600	163
Opteron 244	1800	209
Opteron 246	2000	316
Opteron 246 HE	2000	455
Opteron 248	2200	455
Opteron 248 HE	2200	851
Opteron 250	2400	690
Opteron 252	2600	851
Opteron 265	1800	851
Opteron 270	2000	1051
Opteron 275	2200	1299


Opteron 8xx
Opteron 840	1400	698
Opteron 840 EE	1400	873
Opteron 842	1600	698
Opteron 844	1800	698
Opteron 846	2000	698
Opteron 846 HE	2000	873
Opteron 848	2200	873
Opteron 848 HE	2200	1514
Opteron 850	2400	1165
Opteron 852	2600	1514
Opteron 865	1800	1514
Opteron 870	2000	2149
Opteron 875	2200	2649


Xeon Irwindale
Xeon FSB800	3000	316
Xeon FSB800	3200	455
Xeon FSB800	3400	690
Xeon FSB800	3600	851


Xeon Nocona
Xeon FSB800 LV	2800	259
Xeon FSB800	2800	198
Xeon FSB800	3000	256
Xeon FSB800	3200	316
Xeon FSB800	3400	455
Xeon FSB800	3600	690

Die 1000er Preise in den Tabellen sind auch ein Anhaltspunkt für die deutschen/europäischen Endkundenpreise in Euro. Unter Berücksichtigung der Mehrwertsteuer und einer geringen Händlermarge ergibt sich annähernd der Endkundenpreis. Nachfolgend finden Sie einen Link zu preiswerten Anbietern.

tecCHANNEL Preisvergleich & Shop
Produkte	Info-Link

Prozessoren	Preise & Händler

Fazit

Im Workstation-Segment zählt im Endeffekt nur eines - pure Performance. Und AMD setzt mit den neuen Dual-Core-Opterons hier eindrucksvoll den Maßstab. Bisher wechselten sich die Topmodelle von AMD und Intel munter an der Spitze ab, sowohl in der 1- als auch in der 2-Wege-Konfiguration. Doch jetzt müssen sich zwei 3,60-GHz-Xeons bereits mit einem Dual-Core-Opteron um die Plätze streiten. Nimmt ein zweiter Opteron 875 im System Platz, so ist die Konkurrenz bei multithreaded-programmierten Anwendungen chancenlos.

Beim AMD-internen Vergleich setzt sich ein Opteron 875 - und somit auch der künftige Opteron 275 - gegen zwei Opteron 248 gut in Szene. Hier profitiert die Dual-Core-CPU von den Verbesserungen an der Prefetch-Logik und am Speicher-Controller. Auch beim "Feature-Count" bieten die neuen Dual-Core-Opterons mindestens die Fülle der Xeon-Modelle. So gibt es neben der 64-Bit-Erweiterung, dem Schutz vor Buffer Overflows sowie Energiesparfunktionen nun den SSE3-Befehlssatz. Und beim Energieverbrauch ist der Dual-Core-Opteron mit 95 Watt TDP gegenüber den Single-Core-Xeons mit 110 Watt sehr gut aufgestellt.

Noch ein Wort zu den Preisen: Ein Opteron 275 mit 2,2 GHz kostet mit 1299 US-Dollar fast das Dreifache eines Opteron 248 mit ebenfalls 2,2 GHz Taktfrequenz. Es wäre aber unfair, die Preise direkt zu vergleichen. So gibt es mit zwei 275er Dual-Core-Opterons die Performance eines 4-Wege-Systems mit vier 848er Single-Core-Opterons. Diese 4P-Systeme sind deutlich teurer als ein/e Server/Workstation mit zwei CPU-Sockeln. Außerdem kosten zwei Opteron 275 mit 2598 US-Dollar weniger als vier Opteron 848 für insgesamt 3492 US-Dollar. So relativieren sich die auf den ersten Blick hoch anmutenden Preise der Dual-Core-Opterons. (cvi)

Testkonfiguration

Alle CPUs mussten den Benchmark-Parcours im Single- und Dualprozessor-Betrieb durchlaufen. Die Xeons haben wir jeweils mit aktiviertem Hyper-Threading getestet. Das Betriebssystem Windows XP Professional SP1a arbeitete bei allen Tests mit dem Multiprozessor-Kernel.

Für den Test der Opteron-CPUs von AMD verwenden wir ein Tyan K8WE mit NVIDIAs nForce-Professional-Chipsatz. Über ihren integrierten Memory-Controller greifen die CPUs auf Dual-Channel-DDR400-SDRAM mit CL 2.5 zurück. Die verwendeten Kingston-Module sind dabei gepuffert ausgeführt. Grafikkarten stellt das Tyan-Mainboard zwei PCI-Express-x16-Steckplätze zur Verfügung.

Irwindale- und Nocona-CPUs nehmen in einem Supermicro X6DA8-G2 Platz. Das Workstation-Mainboard für zwei Prozessoren verwendet Intels E7525-Chipsatz "Tumwater" und unterstützt DDR2-400-SDRAM in einer Dual-Channel-Konfiguration. Bei den Speichermodulen setzen wir auf Registered DIMMs PC2-3200R von Infineon mit einer CAS-Latency von 3. Für die Grafikkarte bietet das Mainboard einen PCI-Express-x16-Steckplatz.

Um die gleiche Testkonfigurationen zu gewährleisten, stehen den Prozessoren jeweils 2 GByte Arbeitsspeicher zur Verfügung. Einheit herrschte auch beim Massenspeicher, der sich aus Ultra320-SCSI-Festplatten mit 10.000 U/min aufbaut. Anschluss finden die Laufwerke an Adaptecs 2200S SCSI-RAID-Controller mit 64 MByte Cache.

Für Workstations ist die Performance bei grafikintensiven Anwendungen von entscheidender Bedeutung. Wir setzen bei unseren Benchmarks auf die OpenGL-zertifizierte Highend-Workstation-Grafikkarte NVIDIA Quadro FX 3400. Die PCI-Express-Grafikkarte verfügt über 256 MByte GDDR3-Speicher mit 900 MHz Taktfrequenz (per DDR) und über ein 256-Bit-Speicher-Interface. Die Quadro FX 3400 basiert auf dem NV45GL-Chip, der mit 350 MHz Core-Taktfrequenz arbeitet.