Erster ausführlicher Test: AMDs Dual-Core-Opteron

21.04.2005 von Christian Vilsbeck
AMD stellt mit dem Dual-Core-Opteron seine nächste CPU-Generation vor. Mit zwei Prozessorkernen lässt der Opteron 875 Intels Xeon-Modellen bei professionellen Workstation-Anwendungen wenig Chancen.

Das Prestige-Rennen um die erste x86-Dual-Core-CPU hat AMD gegen Intel knapp verloren - zumindest bei den Desktop-Prozessoren. AMDs neuen Dual-Core-Opterons für Server und Workstations kann Intel jedoch nichts Adäquates entgegensetzen. Die Xeons sollen erst im ersten Quartal 2006 Doppelkerne bekommen.

AMD bietet die Dual-Core-Opterons als Modelle 865, 870 und 875 für Systeme mit bis zu acht Prozessoren an. Die Opterons 265, 270 und 275 sind ab Ende Mai 2005 verfügbar und auf den Dualprozessorbetrieb beschränkt. Platz nehmen die Doppelkern-CPUs weiterhin im Socket 940. Server- und Workstation-Mainboards, die bereits zu 90-nm-Opterons kompatibel sind, können AMDs Neulinge in Betrieb nehmen. Und mit maximal 95 Watt Leistungsaufnahme bleiben die Dual-Core-Opterons im Bereich bisheriger 130-nm-Single-Core-Modelle.

Im tecCHANNEL-Testlabor tritt der Opteron 875 gegen die Single-Core-Opterons sowie Intels Xeon-DP-Modelle bei Direct3D-, OpenGL- und Rendering-Applikationen an. Professionelle Software wie 3ds max, AutoCAD und Maya fordert neben den Prozessoren auch die Workstation-Grafikkarten voll. Hier zeigt sich, welche Kombination am besten harmoniert.

Außerdem müssen sich die Workstation-CPUs im Dualprozessorbetrieb beweisen. Bei zwei Opteron-875-CPUs sind dann vier "echte" Kerne im Einsatz. Zwei Xeon-CPUs weisen zwar auch vier Cores aus, zwei davon sind durch Hyper-Threading aber nur "virtuell" vorhanden.

Details zum Dual-Core-Opteron

AMD bietet die Dual-Core-Opteron-CPUs als Modelle 865, 870 und 875 für 8-Wege-Systeme an. Für Server und Workstations mit maximal zwei CPUs gibt es ab Ende Mai 2005 die Modelle 265, 270 und 275. Die Prozessoren für den Socket 940 arbeiten mit Taktfrequenzen von 1,8 (x65), 2,0 (x70) und 2,2 GHz (x75). Jeder Prozessorkern besitzt bei den Dual-Core-Opterons einen 1 MByte großen L2-Cache.

Die Kommunikation zwischen den CPUs sowie zur Peripherie übernehmen HyperTransport-Schnittstellen mit 1000 MHz Taktfrequenz. Als Architekturerweiterungen spendiert AMD dem Dual-Core-Opteron neben dem SSE3-Befehlssatz eine verbesserte Hardware-Prefetch-Logik. Damit will AMD Page-Crossing-Zustände optimieren und DRAM-Page-Konflikte minimieren. Zusätzlich kann der Dual-Core-Opteron mit vier Write Combining Buffers aufwarten. Beim Speicher adressieren die CPUs unverändert Dual-Channel-DDR400-Module in gepufferter Ausführung.

Die Fertigung der Doppelkern-Opterons erfolgt in einem 90-nm-Prozess mit SOI-Technik. AMD spezifiziert die Dualisten mit 95 Watt TDP bei einer Core-Spannung von 1,35 Volt. Zum Vergleich: Die 130-nm-Single-Core-Opterons stehen mit 89 Watt im Datenblatt. Durch den 90-nm-Prozess bleibt die Die-Größe der Dual-Core-Opterons mit 193 mm² ebenfalls auf dem Niveau aktueller 130-nm-Opterons. Die Transistoranzahl steigt dagegen von 106 auf zirka 233 Millionen.

In der Tabelle haben wir für Sie alle Opteron-Modelle zusammengefasst.

Die Tabelle zeigt die Opteron-Modellpalette mit ihrer tatsächlichen Taktfrequenz.

Prozessor

Taktfrequenz [MHz]

Architektur

Multiprocessing

Opteron 140

1400

Single-Core

nein

Opteron 140 EE

1400

Single-Core

nein

Opteron 142

1600

Single-Core

nein

Opteron 144

1800

Single-Core

nein

Opteron 146

2000

Single-Core

nein

Opteron 146 HE

2000

Single-Core

nein

Opteron 148

2200

Single-Core

nein

Opteron 150

2400

Single-Core

nein

Opteron 152

2600

Single-Core

nein

Opteron 240

1400

Single-Core

2 CPUs

Opteron 240 EE

1400

Single-Core

2 CPUs

Opteron 242

1600

Single-Core

2 CPUs

Opteron 244

1800

Single-Core

2 CPUs

Opteron 246

2000

Single-Core

2 CPUs

Opteron 246 HE

2000

Single-Core

2 CPUs

Opteron 248

2200

Single-Core

2 CPUs

Opteron 250

2400

Single-Core

2 CPUs

Opteron 252

2600

Single-Core

2 CPUs

Opteron 265

1800

Dual-Core

2 CPUs

Opteron 270

2000

Dual-Core

2 CPUs

Opteron 275

2200

Dual-Core

2 CPUs

Opteron 840

1400

Single-Core

8 CPUs

Opteron 840 EE

1400

Single-Core

8 CPUs

Opteron 842

1600

Single-Core

8 CPUs

Opteron 844

1800

Single-Core

8 CPUs

Opteron 846

2000

Single-Core

8 CPUs

Opteron 846 HE

2000

Single-Core

8 CPUs

Opteron 848

2200

Single-Core

8 CPUs

Opteron 850

2400

Single-Core

8 CPUs

Opteron 852

2600

Single-Core

8 CPUs

Opteron 865

1800

Dual-Core

8 CPUs

Opteron 870

2000

Dual-Core

8 CPUs

Opteron 875

2200

Dual-Core

8 CPUs

Ausführliche Grundlagen über die AMD64-Architektur des Opteron können Sie ebenfalls bei tecCHANNEL nachlesen.

Raytracing: Lightwave 3D

Das 3D-Programm Lightwave 3D 7.5 von NewTek ist für den Pentium 4 und Xeon optimiert. Laut NewTek betrifft das speziell den SSE2-Befehlssatz. Neben Intel-CPUs werden auch die AMD-Prozessoren besonders unterstützt. NewTek selbst hat die Athlon-Prozessoren für Lightwave 3D bereits im März 2001 zertifiziert. Von der SSE2-Optimierung in Lightwave 3D sollten auch die Opteron-CPUs profitieren.

Rendering: Cinema 4D

Mit dem CINEBENCH 2003 stellt Maxon seine aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 2003 basiert auf Cinema 4D Release 8 und führt wieder Shading- und Raytracing-Tests durch. Die aktuelle Version unterstützt nun SSE2 sowie Intels Hyper-Threading-Technologie. Intel selbst unterstützte Maxon bei der Optimierung von Cinema 4D.

Der Raytracing-Test von CINEBENCH 2003 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle.

Der Leistungstest OpenGL-HW von CINEBENCH 2003 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten. Cinema 4D übermittelt der Grafikkarte lediglich die Position der Lichtquellen sowie die Geometrie. Dual-Processing wird dabei nicht genutzt.

Beim Leistungstest OpenGL-SW übernimmt Cinema 4D zusätzlich die Berechnung der Beleuchtung. Hier geht die FPU-Performance des Prozessors sowie die Speicherbandbreite noch stärker ein. Dual-Processing wird nicht unterstützt.

AutoCAD 2005: AUGI Gauge

Die Autodesk User Group International stellt ihren Mitgliedern mit AUGI Gauge eine Benchmark-Suite für AutoCAD zur Verfügung. Mit AUGI Gauge lässt sich die Performance von AutoCAD im Zusammenspiel mit verschiedenen Betriebssystemen und Hardware-Plattformen ermitteln.

Die AUGI-Gauge-Version 16.1 unterstützt AutoCAD 2002, 2004 und 2005. Bei unserem Test der Workstation-CPUs verwenden wir AutoCAD 2005. AUGI Gauge führt mit dem Real World Test und Synthetic Test zwei verschiedene Szenarien durch. In beiden Fällen gibt der Benchmark die insgesamt benötigte Zeit als Ergebnis aus.

Bei allen Tests aktivieren wir über die AutoCAD-Kommandozeile mit dem Befehl whipthread=3 das Multiprocessing für Redraw- und Regeneration-Operationen. Die Workstation-Grafikkarten NVIDIA Quadro FX nutzen bei den Benchmarks jeweils AutoCADs Heidi-OpenGL-Treiber. NVIDIAs POWERdraft-Treiber zur Beschleunigung von AutoCAD unterstützt in der aktuellen Version 15.06.06 kein AutoCAD 2005.

Der Real World Test von AUGI Gauge simuliert typische AutoCAD-Aktivitäten: Laden/Speichern von Dateien, Objekt-Selektion, Editieren und Anzeigen ausgeführter Befehle anhand einer Vielzahl von Grafiken.

Im Synthetic Test von AUGI Gauge erfolgen spezielle Kommandos wie beispielsweise das Erzeugen eines Objekts und das Verändern von 3D-Darstellungen. Bei diesem Testblock beginnt der Benchmark mit einer leeren Zeichnung.

Laut Autodesk profitiert AutoCAD von einem zweiten Prozessor in einer "Single Session" mit zirka zwei bis vier Prozent höherer Performance. AUGI Gauge fordert bei seinen Tests den Single-drawing Mode. Aktiviert man bei AutoCAD die Verwendung mehrerer Fenster gleichzeitig, so sollte der Vorteil von Multiprocessing deutlich steigen.

AutoCAD 2005: CADALYST

Der CADALYST Systems Benchmark 2001 erlaubt den Vergleich der AutoCAD-Performance auf verschiedenen Systemen. Das Analyse-Tool unterstützt Autodesks AutoCAD bis zur Version 2004. Das für unsere Workstation-Benchmarks verwendete AutoCAD 2005 arbeitet ebenfalls mit CADALYST 2001 zusammen, wird offiziell aber noch nicht unterstützt.

Bei allen CADALYST-Tests aktivieren wir über die AutoCAD-Kommandozeile mit dem Befehl whipthread=3 das Multiprocessing für Redraw- und Regeneration-Operationen. Die Workstation-Grafikkarten NVIDIA Quadro FX nutzen bei den Benchmarks jeweils AutoCADs Heidi-OpenGL-Treiber. NVIDIAs POWERdraft-Treiber zur Beschleunigung von AutoCAD unterstützt in der aktuellen Version 15.06.06 kein AutoCAD 2005.

CADALYST Systems Benchmark 2001 analysiert die AutoCAD-Performance in vier Bereichen: Wireframe, Gouraud Shade, Non-graphics und 2D Graphics. Zusätzlich bildet der Benchmark einen Index für die Gesamt-Performance.

Laut Autodesk profitiert AutoCAD von einem zweiten Prozessor in einer "Single Session" durchschnittlich mit zirka zwei bis vier Prozent höherer Performance. Der CADALYST Systems Benchmark 2001 fordert bei seinen Tests den Single-drawing Mode. Aktiviert man bei AutoCAD die Verwendung mehrerer Fenster gleichzeitig, so sollte der Vorteil von Multiprocessing deutlich steigen.

SPECapc: 3ds max 5

3D Studio Max 5 von Discreet/Autodesk ist eine professionelle Software für 3D-Modellierung, Animation und Rendering. Um die Leistungsfähigkeit von 3D Studio Max auf verschiedenen Hardware-Plattformen standardisiert testen zu können, gibt es vom Benchmark-Konsortium SPEC das Benchmark-Paket SPECapc for 3ds max 5. Die umfangreichen Tests von SPECapc spiegeln die typischen Berechnungen bei der Erstellung von Animationen wider.

Neben der Gesamt-Performance wird die CPU- und Grafikleistung getrennt bewertet und aufgelistet. Die Prozessorleistung wird aus zehn Einzelergebnissen ermittelt, die Grafik-Performance ergibt sich aus 25 individuellen Tests.

Bei der Bewertung der Grafikleistung nützt der Benchmark die OpenGL-Beschleunigung der Grafikkarte voll aus. Die Performance der Quadro-FX-Grafikkarten wird durch NVIDIAs MAXtreme-Treiber V4 für 3ds max 5 zusätzlich gesteigert. Der Vorteil von Dual-Processing fließt in das Ergebnis nicht ein.

SPECapc: 3ds max 6

Discreet/Autodesk bietet die 3D-Modelling-, Animations- und Rendering-Software 3ds max aktuell als Version 6 an. Seit Juni 2004 gibt es von SPEC mit SPECapc for 3ds max 6 ein Tool zum Ermitteln der Leistungsfähigkeit dieser Software auf verschiedenen Hardware-Plattformen. SPECapc for 3dsmax 6 ermittelt die Performance anhand typischer und praxisrelevanter Workloads. Hierzu zählen Funktionen wie wireframe modeling, shading, texturing, lighting, blending, inverse kinematics, object creation, scene creation, particle tracing, animation und rendering.

Die Gesamt-Performance ermittelt SPECapc for 3ds max 6 mit einer Gewichtung von 20 Prozent für das rendering und 80 Prozent für die grafiklastigen interactive tests. Beide Einzelwertungen gibt der Benchmark getrennt aus.

Bei den Render-Vorgängen nutzt 3ds max 6 Multiprocessing voll aus. Intels Hyper-Threading-Technologie sowie ein zweiter Prozessor wirken somit beschleunigend.

Bei der Bewertung der Grafikleistung mit den interactive tests nützt der Benchmark die OpenGL-Beschleunigung der Grafikkarte voll aus. Die Performance der Quadro-FX-Grafikkarten wird durch NVIDIAs MAXtreme-Treiber V6 für 3ds max 6 zusätzlich gesteigert. Der Vorteil von Dual-Processing fließt in das Ergebnis nicht ein.

SPECapc: Maya 6

Maya von Alias ist die mit einem Oscar ausgezeichnete, professionelle Software für 3D-Modelling, Animation und Rendering. Maya unterstützt den gesamten Produktions-Workflow und bietet mit seinem fortschrittlichen Feature-Set umfassende Werkzeuge für die Erzeugung kreativer, digitaler Inhalte.

Um die Performance von Maya 6 auf verschiedenen Hardware-Plattformen zu bestimmen, entwickelte Alias in Kooperation mit dem SPEC-Benchmark-Konsortium die Test-Suite SPECapc for Maya. Mit vier verschiedenen Szenarios bewertet der Benchmark die Grafikleistung, die Prozessor- und I/O-Performance. Jedes der vier Szenarien - Werwolf, menschliche Hand, Insekt, Tintenfisch - wird gerendert und in fünf verschiedenen Modi dargestellt: Wireframe, Gouraud-shaded, Textur, Textur mit überzogenem Drahtmodell und selektierte Textur.

SPECapc for Maya ermittelt die Gesamt-Performance mit einer Gewichtung aus 70 Prozent Grafikleistung, 20 Prozent CPU- und 10 Prozent I/O-Performance.

SPECviewperf 7.1.1

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 7.1.1 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Besonders die Anwendung Lightscape Viewset (light-06) nützt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.

Alle Einzelergebnisse des SPECviewperf 7.1.1 finden Sie in der Tabelle:

SPECviewperf 7.1.1

CPU

3dsmax-02[fps]

drv-09 [fps]

dx-08 [fps]

light-06 [fps]

proe-02 [fps]

ugs-03 [fps]

Höhere Werte sind besser.

Opteron 248 DDR400

25,9

169,4

136,2

29,8

44,8

54,7

Opteron 875 DDR400

26,25

174,4

139,0

30,5

45,5

54,9

Xeon 3,60 GHz 1M L2 DDR2-400

31,9

173,8

160,3

40,1

47,8

54,7

Xeon 3,60 GHz 2M L2 DDR2-400

32,0

181,0

161,4

40,4

48,1

54,7

Direct3D: 3ds max 6

Discreet/Autodesk bietet die 3D-Modelling-, Animations- und Rendering-Software 3ds max aktuell als Version 6 an. Seit Juni 2004 gibt es von SPEC mit SPECapc for 3ds max 6 ein Tool zum Ermitteln der Leistungsfähigkeit dieser Software auf verschiedenen Hardware-Plattformen. SPECaps for 3dsmax 6 ermittelt die Performance anhand typischer und praxisrelevanter Workloads. Hierzu zählen Funktionen wie wireframe modeling, shading, texturing, lighting, blending, inverse kinematics, object creation, scene creation, particle tracing, animation und rendering.

Bei der Grafikkarten-Unterstützung erlaubt 3ds max 6 die Wahl zwischen Software-, OpenGL- und Direct3D-Beschleunigung. Die Einbindung zusätzlicher Treiber wie NVIDIAs MAXtreme für Quadro-Grafikkarten ist ebenfalls möglich. Um die Direct3D-Performance zu testen, wählen wir die DirectX-9.0-Beschleunigung.

Direct3D: 3DMark03

Die Direct3D-Performance ermitteln wir unter anderem mit 3DMark03 von Futuremark. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei anspruchsvollen 3D-Anwendungen.

Die 3D-Tests von 3DMark03 setzen sich aus vier Szenen zusammen: "Wings of Fury" setzt auf DirectX 7 und repräsentiert Lowend-Grafikanwendungen. Die beiden Tests "Alpha Squadron" und "Troll's Lair" nutzen DirectX-8-Features und sind auf Mainstream-Grafikkarten zugeschnitten. Der Test "Nature II" setzt DirectX 9 voraus und soll Highend-Grafikkarten ausreizen. Der AGP- und der Speicherbus werden bei 3DMark03 durch große Mengen an Texturen stark belastet. Den Vorteil von Multiprocessing nützt der Direct3D-Benchmark dabei nicht aus.

SPECint_base2000

Wir setzen die SPEC-CPU2000-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 8.0 und MS Visual Studio.NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie die von beiden Firmen offiziell gemeldeten Integer-Resultate zeigen. Unsere verwendeten CPU2000-Config-Files können Sie im Artikel Test: Pentium XE 840 einsehen.

Der SPECint_base2000-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

SPECint_base2000: Official Run

Prozessor

Opteron 248

Opteron 875

Xeon 3,60 GHz 1M L2

Xeon 3,60 GHz 2M L2

Alle Angaben in Punkten. Höhere Werte sind besser. Bedeutung der Compiler-Optionen: -QxW = optimiert für Pentium 4/Xeon mit SSE2-Erweiterung und lauffähig auf dem Opteron. -QxP = optimiert für den Pentium 4/Xeon mit SSE3-Erweiterung.

Taktfrequenz

2,2 GHz

2,2 GHz

3,6 GHz

3,6 GHz

Sockel

940

940

604

604

Core

AMD64

AMD64

Nocona

Irwindale

Speichertyp

DDR400 CL2.5

DDR400 CL2.5

DDR2-400 CL3

DDR2-400 CL3

Chipsatz

NF Prof.

NF Prof.

E7525

E7525

Compiler

-QxW

-QxW

-QxP

-QxP

Test

164.gzip

1181

1208

1166

1164

175.vpr

1212

1244

935

1162

176.gcc

1139

1167

1864

2010

181.mcf

1097

1095

858

1291

186.crafty

1558

1581

1310

1321

197.parser

1383

1423

1322

1451

252.eon

1657

1723

1540

1535

253.perlbmk

1484

1497

1667

1711

254.gap

1530

1576

1831

1855

255.vortex

2160

2216

2438

2648

256.bzip2

1190

1213

1060

1260

300.twolf

1499

1537

1325

1789

Gesamt

1398

1429

1382

1552

Im folgenden Diagramm finden Sie das Gesamtergebnis des SPEC-CPU2000-Integer-Benchmarks der Prozessoren nochmals übersichtlich im grafischen Vergleich:

SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECint_rate_base2000 beim Opteron 248 mit einer Kopie, beim Opteron 875 (Dual-Core) und Xeon (Hyper-Threading) mit zwei Kopien. Sind jeweils zwei Prozessoren im Einsatz, so verdoppelt sich die Anzahl der Kopien - beispielsweise vier Kopien bei zwei Opteron 875. Bei diesem Test wird der Vorteil von Hyper-Threading und Dual-Core ausgenutzt. Bei Single-Thread-Prozessoren wie dem Opteron 248 führen SPECint_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

SPECfp_base2000

Wir setzen die SPEC-CPU2000-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 8.0 und MS Visual Studio sowie Intel Fortran 8.0 für alle Fließkomma-Tests. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie die von beiden Firmen offiziell gemeldeten FP-Resultate zeigen. Unsere verwendeten CPU2000-Config-Files können Sie im Artikel Test: Pentium XE 840 einsehen.

Der SPECfp_base2000-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

AMDs Opteron 875 beherrscht wie die Xeons SSE3. Die Intel-Compiler verweigern aber mit eingestellter SSE3-Optimierung -QxP die Zusammenarbeit mit der AMD-CPU. Wir testen den Opteron 875 mit dem Compiler-Switch -QxW mit SSE2-Unterstützung.

SPECfp_base2000: Official Run

Prozessor

Opteron 248

Opteron 875

Xeon 3,60 GHz 1M L2

Xeon 3,60 GHz 2M L2

Alle Angaben in Punkten. Höhere Werte sind besser. Bedeutung der Compiler-Optionen: -QxW = optimiert für Pentium 4/Xeon mit SSE2-Erweiterung und lauffähig auf dem Opteron. -QxP = optimiert für den Pentium 4/Xeon mit SSE3-Erweiterung.

Taktfrequenz

2,2 GHz

2,2 GHz

3,6 GHz

3,6 GHz

Sockel

940

940

604

604

Core

AMD64

AMD64

Nocona

Irwindale

Speichertyp

DDR400 CL2.5

DDR400 CL2.5

DDR2-400 CL3

DDR2-400 CL3

Chipsatz

NF Prof.

NF Prof.

E7525

E7525

Compiler

-QxW

-QxW

-QxP

-QxP

Test

168.wupwise

1487

1604

2221

2259

171.swim

2034

2139

1877

1960

172.mgrid

1097

1172

1276

1331

173.applu

1140

1277

1250

1299

177.mesa

1606

1632

1571

1553

178.galgel

1970

2104

2172

3115

179.art

1766

1698

835

2414

183.equake

1392

1522

1579

1752

187.facerec

1682

1815

1793

1877

188.ammp

1114

1157

935

1264

189.lucas

1631

1824

1663

1751

191.fma3d

1299

1355

1342

1370

200.sixtrack

579

597

642

647

301.apsi

1272

1287

966

1161

Gesamt

1375

1450

1354

1592

Im folgenden Diagramm finden Sie das Gesamtergebnis des SPEC-CPU2000-Integer-Benchmarks übersichtlich im grafischen Vergleich:

SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECfp_rate_base2000 beim Opteron 248 mit einer Kopie, beim Opteron 875 (Dual-Core) und den Xeons (Hyper-Threading) mit zwei Kopien. Sind jeweils zwei Prozessoren im Einsatz, so verdoppelt sich die Anzahl der Kopien - beispielsweise vier Kopien bei zwei Opteron 875. Bei diesem Test wird der Vorteil von Hyper-Threading und Dual-Core ausgenützt. Bei Single-Thread-Prozessoren wie dem Opteron 248 führen SPECfp_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

32-Bit-Transfer

Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load-/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.

64-Bit-Transfer

Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.

128-Bit-Transfer

Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.

Listenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 21. April 2005 die letzten Änderungen. Intels Preisliste wurde ebenfalls am 20. März 2005 aktualisiert.

OEM-Preise im Vergleich

Modell

Taktfrequenz [MHz]

Preis [US-Dollar]

Alle Preise in US-Dollar, bezogen auf eine Abnahmemenge von 1000 Stück. Stand: AMD-Preisliste vom 21. April 2005, Intel-Preisliste vom 20. März 2005.

Opteron 1xx

Opteron 140

1400

163

Opteron 140 EE

1400

278

Opteron 142

1600

163

Opteron 144

1800

178

Opteron 146

2000

218

Opteron 146 HE

2000

278

Opteron 148

2200

278

Opteron 148 HE

2200

637

Opteron 150

2400

417

Opteron 152

2600

637

Opteron 2xx

Opteron 240

1400

163

Opteron 240 EE

1400

455

Opteron 242

1600

163

Opteron 244

1800

209

Opteron 246

2000

316

Opteron 246 HE

2000

455

Opteron 248

2200

455

Opteron 248 HE

2200

851

Opteron 250

2400

690

Opteron 252

2600

851

Opteron 265

1800

851

Opteron 270

2000

1051

Opteron 275

2200

1299

Opteron 8xx

Opteron 840

1400

698

Opteron 840 EE

1400

873

Opteron 842

1600

698

Opteron 844

1800

698

Opteron 846

2000

698

Opteron 846 HE

2000

873

Opteron 848

2200

873

Opteron 848 HE

2200

1514

Opteron 850

2400

1165

Opteron 852

2600

1514

Opteron 865

1800

1514

Opteron 870

2000

2149

Opteron 875

2200

2649

Xeon Irwindale

Xeon FSB800

3000

316

Xeon FSB800

3200

455

Xeon FSB800

3400

690

Xeon FSB800

3600

851

Xeon Nocona

Xeon FSB800 LV

2800

259

Xeon FSB800

2800

198

Xeon FSB800

3000

256

Xeon FSB800

3200

316

Xeon FSB800

3400

455

Xeon FSB800

3600

690

Die 1000er Preise in den Tabellen sind auch ein Anhaltspunkt für die deutschen/europäischen Endkundenpreise in Euro. Unter Berücksichtigung der Mehrwertsteuer und einer geringen Händlermarge ergibt sich annähernd der Endkundenpreis. Nachfolgend finden Sie einen Link zu preiswerten Anbietern.

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise & Händler

Fazit

Im Workstation-Segment zählt im Endeffekt nur eines - pure Performance. Und AMD setzt mit den neuen Dual-Core-Opterons hier eindrucksvoll den Maßstab. Bisher wechselten sich die Topmodelle von AMD und Intel munter an der Spitze ab, sowohl in der 1- als auch in der 2-Wege-Konfiguration. Doch jetzt müssen sich zwei 3,60-GHz-Xeons bereits mit einem Dual-Core-Opteron um die Plätze streiten. Nimmt ein zweiter Opteron 875 im System Platz, so ist die Konkurrenz bei multithreaded-programmierten Anwendungen chancenlos.

Beim AMD-internen Vergleich setzt sich ein Opteron 875 - und somit auch der künftige Opteron 275 - gegen zwei Opteron 248 gut in Szene. Hier profitiert die Dual-Core-CPU von den Verbesserungen an der Prefetch-Logik und am Speicher-Controller. Auch beim "Feature-Count" bieten die neuen Dual-Core-Opterons mindestens die Fülle der Xeon-Modelle. So gibt es neben der 64-Bit-Erweiterung, dem Schutz vor Buffer Overflows sowie Energiesparfunktionen nun den SSE3-Befehlssatz. Und beim Energieverbrauch ist der Dual-Core-Opteron mit 95 Watt TDP gegenüber den Single-Core-Xeons mit 110 Watt sehr gut aufgestellt.

Noch ein Wort zu den Preisen: Ein Opteron 275 mit 2,2 GHz kostet mit 1299 US-Dollar fast das Dreifache eines Opteron 248 mit ebenfalls 2,2 GHz Taktfrequenz. Es wäre aber unfair, die Preise direkt zu vergleichen. So gibt es mit zwei 275er Dual-Core-Opterons die Performance eines 4-Wege-Systems mit vier 848er Single-Core-Opterons. Diese 4P-Systeme sind deutlich teurer als ein/e Server/Workstation mit zwei CPU-Sockeln. Außerdem kosten zwei Opteron 275 mit 2598 US-Dollar weniger als vier Opteron 848 für insgesamt 3492 US-Dollar. So relativieren sich die auf den ersten Blick hoch anmutenden Preise der Dual-Core-Opterons. (cvi)

Testkonfiguration

Alle CPUs mussten den Benchmark-Parcours im Single- und Dualprozessor-Betrieb durchlaufen. Die Xeons haben wir jeweils mit aktiviertem Hyper-Threading getestet. Das Betriebssystem Windows XP Professional SP1a arbeitete bei allen Tests mit dem Multiprozessor-Kernel.

Für den Test der Opteron-CPUs von AMD verwenden wir ein Tyan K8WE mit NVIDIAs nForce-Professional-Chipsatz. Über ihren integrierten Memory-Controller greifen die CPUs auf Dual-Channel-DDR400-SDRAM mit CL 2.5 zurück. Die verwendeten Kingston-Module sind dabei gepuffert ausgeführt. Grafikkarten stellt das Tyan-Mainboard zwei PCI-Express-x16-Steckplätze zur Verfügung.

Irwindale- und Nocona-CPUs nehmen in einem Supermicro X6DA8-G2 Platz. Das Workstation-Mainboard für zwei Prozessoren verwendet Intels E7525-Chipsatz "Tumwater" und unterstützt DDR2-400-SDRAM in einer Dual-Channel-Konfiguration. Bei den Speichermodulen setzen wir auf Registered DIMMs PC2-3200R von Infineon mit einer CAS-Latency von 3. Für die Grafikkarte bietet das Mainboard einen PCI-Express-x16-Steckplatz.

Um die gleiche Testkonfigurationen zu gewährleisten, stehen den Prozessoren jeweils 2 GByte Arbeitsspeicher zur Verfügung. Einheit herrschte auch beim Massenspeicher, der sich aus Ultra320-SCSI-Festplatten mit 10.000 U/min aufbaut. Anschluss finden die Laufwerke an Adaptecs 2200S SCSI-RAID-Controller mit 64 MByte Cache.

Für Workstations ist die Performance bei grafikintensiven Anwendungen von entscheidender Bedeutung. Wir setzen bei unseren Benchmarks auf die OpenGL-zertifizierte Highend-Workstation-Grafikkarte NVIDIA Quadro FX 3400. Die PCI-Express-Grafikkarte verfügt über 256 MByte GDDR3-Speicher mit 900 MHz Taktfrequenz (per DDR) und über ein 256-Bit-Speicher-Interface. Die Quadro FX 3400 basiert auf dem NV45GL-Chip, der mit 350 MHz Core-Taktfrequenz arbeitet.