Erster Test: Die neue Athlon-64-Generation

23.05.2006 von Christian Vilsbeck
AMD stellt seine nächste Athlon-64-Generation für den neuen Socket AM2 vor. Die Dual-Core-Modelle steuern nun DDR2-800-Speicher an. Außerdem steigt die Taktfrequenz der Doppelkerner auf 2,8 GHz. Ist AMD für Intels Angriff gerüstet?

Schlecht war es ja nicht; seit drei Jahren konnte man bei einem neuen Athlon 64 seinen alten DDR400-Speicher weiter verwenden. Vor allem beim Wechsel von einem Single-Core-Modell auf einen Athlon 64 X2 mit Dual-Core-Technologie musste nicht zusätzlich in den Speicher investiert werden.

Doch jetzt hält AMD den Zeitpunkt für gekommen, auf die „moderne“ DDR2-Speichertechnologie zu wechseln. Die Performance und die Preise für DDR2-Module stimmen nun, so AMD. Zusammen mit dem neuen Socket AM2 erhalten der Sempron 64, Athlon 64, Athlon 64 X2 und Athlon 64 FX einen integrierten DDR2-Speicher-Controller. Zusätzlich spendiert AMD seinen neuen Prozessoren die Virtualisierungs-Technologie Pacifica. An der Taktfrequenz dreht AMD auch, aber nur ein bisschen.

Eine Auffrischung der AMD64-Prozessoren war auf jeden Fall notwendig, denn Intel hat mit dem Pentium D 960 und Pentium Extreme Edition 965 zum Athlon 64 X2 4800+ und FX-60 aufgeschlossen. Und im Juli 2006 will Intel seine neue Desktop-CPU „Conroe“ mit Core-Architektur vorstellen…

Diesen Angriff soll AMDs neues Top-Modell Athlon 64 FX-62 für den Socket AM2 abwehren. Der Dual-Core-Prozessor arbeitet mit 2,8 GHz Taktfrequenz – 200 MHz mehr als der FX-60 – und steuert DDR2-800-DIMMs an. In der Theorie sollte vor allem der neue Speicher für deutlich mehr Durchsatz gegenüber den bisherigen DDR400-Riegeln sorgen. Doch mit den neuen DDR2-800-Modulen geht der Vorteil der kurzen Latenzzeiten flöten. Hier trumpfte bei AMD64-CPUs bisher die Kombination des integrierten Speicher-Controllers und DDR400-SDRAM mit ihren flinken Zugriffen auf.

In unserem Test müssen der Athlon 64 FX-62 sowie die ebenfalls neuen AM2-Modelle Athlon 64 X2 4000+ und 4800+ ihre Leistungsfähigkeit unter Beweis stellen. Wie groß fällt der Vorteil gegenüber den DDR400-Athlons aus? Und ist AMDs neue Athlon-Generation auch für Intels Core 2 Duo „Conroe“ gerüstet? Das Fazit fällt eindeutig aus.

Socket-AM2-Modelle im Überblick

AMD stellt mit dem Socket AM2 von allen Desktop-Prozessor-Serien eine neue Generation vor. Den Sempron 64, Athlon 64, Athlon 64 X2 und Athlon 64 FX stattet AMD mit einem DDR2-Speicher-Controller aus. Die Dual-Core-Modelle Athlon 64 X2 und FX steuern bis 800 MHz schnelle DDR2-Module an. Der Sempron 64 und Athlon 64 muss sich mit Speichergeschwindigkeiten von 400, 533 oder 667 MHz zufrieden geben.

Allen Socket-AM2-Prozessoren gemein ist ein 1000-MHz-HyperTransport-Bus. Damit lässt AMD die Transferfrequenz gegenüber den bisherigen Socket-939-CPUs unverändert. Auch die Modell-Nummern der AM2-Modelle ändern sich gegenüber den Socket-939-CPUs nicht – bei gleicher Taktfrequenz und Cache-Ausstattung. So arbeitet der Athlon 64 X2 4800+ für den Socket AM2 wie der bisherige Socket-939-4800er mit 2,4 GHz Taktfrequenz und ebenfalls je 1024 KByte L2-Cache pro Core. Als neues Top-Modell der Athlon-64-X2-Serie mit Dual-Core-Technologie fungiert der 5000+. Die CPU arbeitet mit 2,6 GHz Taktfrequenz und greift auf 512 KByte L2-Cache (pro Core) zurück.

Als neuen Highend-Desktop-Prozessor stellt AMD den Athlon 64 FX-62 vor. Die Taktfrequenz des Dual-Core-Prozessors hebt der Hersteller auf 2,8 GHz an. Dabei darf jeder Kern auf einen 1 MByte großen L2-Cache zurückgreifen. Die Socket-AM2-CPU spezifiziert AMD mit einem TDP-Wert von 125 Watt. Die Athlon-64-X2-Modelle 3800+ bis 5000+ sind mit 89 Watt TDP etwas genügsamer. Zusätzlich bietet AMD noch besonders sparsame AM2-Modelle mit 35 und 65 Watt TDP an. Diese CPUs arbeiten mit niedrigerer Core-Spannung.

Eine Übersicht aller neuen Socket-AM2-Prozessoren mit den wichtigsten Spezifikationen finden Sie in der Tabelle:

AMD Socket-AM2-Modelle im Überblick

Prozessor

Taktfrequenz

L2-Cache

TDP

Core-Spannung

Athlon 64 FX-62

2,8 GHz

2 x 1024 KByte

125 Watt

1,35-1,40 V

Athlon 64 X2 5000+

2,6 GHz

2 x 512 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 4800+

2,4 GHz

2 x 1024 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 4800+ EE

2,4 GHz

2 x 1024 KByte

65 Watt

1,20-1,25 V

Athlon 64 X2 4600+

2,4 GHz

2 x 512 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 4600+ EE

2,4 GHz

2 x 512 KByte

65 Watt

1,20-1,25 V

Athlon 64 X2 4400+

2,2 GHz

2 x 1024 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 4400+ EE

2,2 GHz

2 x 1024 KByte

65 Watt

1,20-1,25 V

Athlon 64 X2 4200+

2,2 GHz

2 x 512 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 4200+ EE

2,2 GHz

2 x 512 KByte

65 Watt

1,20-1,25 V

Athlon 64 X2 4000+

2,0 GHz

2 x 1024 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 4000+ EE

2,0 GHz

2 x 1024 KByte

65 Watt

1,20-1,25 V

Athlon 64 X2 3800+

2,0 GHz

2 x 512 KByte

89 Watt

1,30-1,35 V

Athlon 64 X2 3800+ EE

2,0 GHz

2 x 512 KByte

65 Watt

1,20-1,25 V

Athlon 64 X2 3800+ EE SFF

2,0 GHz

2 x 512 KByte

35 Watt

1,025-1,075 V

Athlon 64 3800+

2,4 GHz

512 KByte

62 Watt

1,35-1,40 V

Athlon 64 3500+

2,2 GHz

512 KByte

62 Watt

1,35-1,40 V

Athlon 64 3500+ EE

2,2 GHz

512 KByte

35 Watt

1,20-1,25 V

Athlon 64 3200+

2,0 GHz

512 KByte

62 Watt

1,35-1,40 V

Athlon 64 3000+

1,8 GHz

512 KByte

62 Watt

1,35-1,40 V

Sempron 64 3600+

2,0 GHz

256 KByte

62 Watt

1,35-1,40 V

Sempron 64 3500+

2,0 GHz

128 KByte

62 Watt

1,35-1,40 V

Sempron 64 3500+ EE

2,0 GHz

128 KByte

35 Watt

1,20-1,25 V

Sempron 64 3400+

1,8 GHz

256 KByte

62 Watt

1,35-1,40 V

Sempron 64 3400+ EE

1,8 GHz

256 KByte

35 Watt

1,20-1,25 V

Sempron 64 3200+

1,8 GHz

128 KByte

62 Watt

1,35-1,40 V

Sempron 64 3200+ EE

1,8 GHz

128 KByte

35 Watt

1,20-1,25 V

Sempron 64 3000+

1,6 GHz

256 KByte

62 Watt

1,35-1,40 V

Sempron 64 3000+ EE

1,6 GHz

256 KByte

35 Watt

1,20-1,25 V

Sempron 64 2800+

1,6 GHz

128 KByte

62 Watt

1,35-1,40 V

SYSmark2004 SE

Mit dem Benchmark-Paket SYSmark2004 SE bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Die Second Edition verwendet wieder 17 Anwendungen und arbeitet wahlweise mit den Windows XP in der 32- und 64-Bit-Edition zusammen. SYSmark2004 SE öffnet mehrere Programme gleichzeitig und lässt die Applikationen auch im Hintergrund arbeiten. Somit profitieren Dual-Core-CPUs von dem zweiten Prozessorkern. Auch der Vorteil von Intels Hyper-Threading-Technologie sollte beim SYSmark2004 SE zum Tragen kommen.

Neben einem Gesamtwert für die Systemleistung bietet SYSmark2004 SE detaillierte Ergebnisse in den Kategorien Office Productivity und Internet Content Creation an.

SYSmark2004 SE: Internet Content Creation

Im Workload Internet Content Creation von SYSmark2004 SE sind Prozessoren mit schnellen FPUs im Vorteil. Die Anwendungen im diesem Testblock unterstützen zudem in hohem Maße SSE2 und Multiprocessing. Zu den Applikationen des Workloads Internet Content Creation zählen Macromedia Dreamweaver und Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 und Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 sowie McAfee VirusScan 7.0.1.

SYSmark2004 SE: Office Productivity

Der Workload Office Productivity in SYSmark2004 SE verwendet insgesamt zehn verschiedene Applikationen. Hierzu zählen Microsofts Word, Excel, PowerPoint, Access und Outlook in der Version 2002, McAfee VirusScan 7.0, ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 sowie der Internet Explorer 6.0.

SPECint_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intels C++ 9.1 und Fortran 9.1 sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.

Der SPECint_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks im Vergleich:

SPECint_base2000: Official Run

Prozessor

Athlon 64 X2 4800+

Athlon 64 X2 4800+

Athlon 64 FX-60

Athlon 64 FX-62

Taktfrequenz

2,4 GHz

2,4 GHz

2,6 GHz

2,8 GHz

Sockel

S939

AM2

S939

AM2

Core

Toledo

Windsor

Toledo

Windsor

Speichertyp

DDR400

DDR2-800

DDR400

DDR2-800

Chipsatz

NF4

NF5

NF4

NF5

Compiler

Intel

Intel

Intel

Intel

Test

164.gzip

1300

1302

1397

1508

175.vpr

1363

1312

1454

1474

176.gcc

1297

1297

1397

1496

181.mcf

1198

1075

1220

1115

186.crafty

1806

1805

1949

2109

197.parser

1433

1404

1538

1604

252.eon

2160

2177

2340

2512

253.perlbmk

1788

1826

1921

2131

254.gap

1776

1769

1910

2038

255.vortex

2448

2395

2606

2718

256.bzip2

1386

1332

1476

1492

300.twolf

1661

1614

1790

1844

Gesamt

1597

1567

1707

1782

SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECint_rate_base2000 beim Athlon 64 mit einer Kopie, beim Athlon 64 X2 sowie FX-60/62 (Dual-Core), Pentium 4 (Hyper-Threading), Pentium D (Dual-Core) mit zwei Kopien sowie beim Pentium Extreme Edition 965 (Dual-Core + Hyper-Threading) mit vier Kopien. Bei diesem Test wird der Vorteil von Hyper-Threading und Dual-Core ausgenutzt. Bei Singlethread-Prozessoren wie dem Athlon 64 führen SPECint_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

SPECfp_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.1 und MS Visual Studio 2005 .NET sowie Intel Fortran 9.1 für alle Fließkommatests. Bei den AMD-Prozessoren testen wir die Floating-Point-Performance zusätzlich mit den PGI-6.0-Compilern. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.

Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks im Vergleich:

SPECfp_base2000: Official Run

Prozessor

Athlon 64 X2 4800+

Athlon 64 X2 4800+

Athlon 64 FX-60

Athlon 64 FX-62

Athlon 64 FX-62

Taktfrequenz

2,4 GHz

2,4 GHz

2,6 GHz

2,8 GHz

2,8 GHz

Sockel

S939

AM2

S939

AM2

AM2

Core

Toledo

Windsor

Toledo

Windsor

Windsor

Speichertyp

DDR400

DDR2-800

DDR400

DDR2-800

DDR2-800

Chipsatz

NF4

NF5

NF4

NF5

NF5

Compiler

PGI

PGI

PGI

PGI

Intel

Test

168.wupwise

2571

2596

2726

2922

2658

171.swim

2397

1986

2445

2080

2349

172.mgrid

1524

1462

1622

1632

1473

173.applu

1437

1326

1493

1412

1224

177.mesa

1108

1114

1197

1286

1997

178.galgel

2755

2606

2906

2866

2361

179.art

1788

1865

1830

1999

2059

183.equake

1496

1469

1562

1607

1711

187.facerec

1887

1899

2004

2123

2089

188.ammp

1178

1146

1259

1282

1355

189.lucas

1873

1711

1941

1810

1906

191.fma3d

1501

1459

1588

1628

1695

200.sixtrack

729

728

789

847

756

301.apsi

1426

1400

1525

1587

1496

Gesamt

1599

1545

1686

1707

1717

In der Tabelle sehen Sie in den zwei rechten Spalten die Einzelwerte von SPECfp_base2000 beim Athlon 64 FX-62 mit PGI- und Intel-Compiler. Während sich das Gesamtergebnis nur um 0,6 Prozent unterscheidet, zeigen sich bei den 14 Einzeltests teilweise drastische Performance-Unterschiede.

SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECfp_rate_base2000 beim Athlon 64 mit einer Kopie, beim Athlon 64 X2 sowie FX-60/62 (Dual-Core), Pentium 4 (Hyper-Threading), Pentium D (Dual-Core) mit zwei Kopien sowie beim Pentium Extreme Edition 965 (Dual-Core + Hyper-Threading) mit vier Kopien. Bei diesem Test wird der Vorteil von Hyper-Threading und Dual-Core ausgenutzt. Bei Singlethread-Prozessoren wie dem Athlon 64 führen SPECfp_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

Linux 64 Bit: Linpack

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben. Linpack löst komplexe lineare Gleichungssysteme.

Unter SUSE Linux 10.1 64-Bit-Edition setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Athlon-64-Prozessoren mit SSE3 arbeiten mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen und nutzen die Befehlserweierung.

Bei unseren Tests löst Linpack bis zu 10.000 Gleichungssysteme. Damit benötigt der Benchmark maximal 763 GByte Arbeitsspeicher. Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Analyse: SunGard Adaptiv Credit Risk

SunGards Adaptiv Credit Risk 2.5 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Dual-Core-Prozessoren optimal. SunGard arbeitet überwiegend mit Integer-Operationen.

Enkodieren: iTunes 6

Apples iTunes 6 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Nur beim MP3-Enkodieren nutzt iTunes 6 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Der Pentium Extreme Edition 965 zieht aus seinen vier „virtuellen“ Kernen (Dual-Core + Hyper-Threading) keinen Nutzen. Das MP3-Encoding von iTunes arbeitet nur zwei Threads. Die Verteilung der zwei Threads von Windows auf die vier Kerne (wechselweise) bedingt zusätzlichen Overhead. Deshalb arbeitet ein Pentium D 960 (Dual-Core, kein Hyper-Threading) trotz geringerer Taktfrequenz hier schneller.

Rendering: 3ds Max 8

Discreet/Autodesk bietet mit 3ds Max 8 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 8 Multiprocessing voll aus. Die Dual-Core- und Hyper-Threading-Technologien wirken somit beschleunigend.

Die verwendeten Render-Szenen basieren auf der Benchmark-Suite SPECapc for 3ds Max 7 von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle.

Rendering: CINEBENCH 9.5

Mit dem CINEBENCH 9.5 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 9.5 basiert auf Cinema 4D Release 9.5 und führt wieder Shading- und Raytracing-Tests durch.

Der Raytracing-Test von CINEBENCH 9.5 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen.

Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 9.5 wenig - der Test läuft überwiegend in den ersten beiden Cache-Stufen ab.

OpenGL: CINEBENCH 9.5

Der Leistungstest OpenGL-HW von CINEBENCH 9.5 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.

Beim Leistungstest OpenGL-SW übernimmt die Cinema-4D-Engine zusätzlich die Berechnung der Beleuchtung.

OpenGL: SPECviewperf 9

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 9 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Highend-Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Lightscape, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualzation Mockup und UGS NX.

Besonders die Anwendung Lightscape Viewset (light-08) nutzt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.

Die Einzelergebnisse der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist. Während bei light-08 beispielsweise Athlon 64 FX-62 führt, harmoniert bei Maya-basierenden Test maya-02 Intels Extreme Edition wesentlich besser mit der Grafikkarte.

Alle Einzelergebnisse des SPECviewperf 9 finden Sie in der Tabelle:

SPECviewperf 9

Prozessor

3dsmax-04

catia-02

ensight-03

light-08

maya-02

proe-04

sw-02

tcvis-01

ugnx01

Alle Ergebnisse in fps. Höhere Werte sind besser.

Athlon 64 4000+ S939

9,78

10,81

9,84

9,85

10,97

6,34

12,33

8,64

2,94

Athlon 64 X2 4000+ AM2

8,75

9,79

9,39

8,62

9,75

5,94

11,75

8,34

2,87

Athlon 64 X2 4800+ S939

10,05

11,14

10,10

10,12

10,99

6,39

12,32

8,78

2,89

Athlon 64 X2 4800+ AM2

10,25

11,45

10,25

10,31

11,37

6,54

12,65

8,96

2,98

Athlon 64 FX-60 S939

10,62

11,78

10,42

10,90

11,75

6,65

12,64

9,02

2,92

Athlon 64 FX-62 AM2

11,52

12,80

11,03

11,96

12,88

7,08

13,43

9,45

3,06

Pentium 4 670

10,48

11,75

11,48

10,80

14,35

7,59

15,81

8,77

4,13

Pentium D 920

8,05

9,01

10,14

8,24

11,42

6,19

13,34

7,56

3,80

Pentium D 960

9,81

11,00

11,16

10,10

13,28

7,29

15,31

8,53

4,10

Pentium XE 965

10,48

11,73

11,56

10,75

14,60

7,91

16,27

8,91

4,26

DirectX: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

3Dmark06 bietet erstmals Unterstützung für Dual-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

32-Bit-Transfer

Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.

64-Bit-Transfer

Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.

128-Bit-Transfer

Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 23. Mai 2006 die letzten Änderungen. Intels Preisliste wurde am 01. Mai 2006 aktualisiert. Zusätzlich haben wir für Sie die typischen Straßenpreise der Prozessoren in der Tabelle aufgeführt (Stand: 23. Mai 2006).

OEM-Preise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Alle Listenpreise in US-Dollar, bezogen auf eine Abnahmemenge von 1000 Stück. Bei den Straßenpreisen handelt es sich um typische Preise, diese können je nach Anbieter schwanken. Stand: AMD-Preisliste vom 23.05.2006, Intel-Preisliste vom 01.05.2006

Socket 939

Athlon 64 3500+ S939

2200 / 1000

189

135

Athlon 64 X2 3800+ S939

2400 / 1000

303

270

Athlon 64 4000+ S939

2400 / 1000

--

270

Athlon 64 X2 4200+ S939

2200 / 1000

365

335

Athlon 64 X2 4400+ S939

2200 / 1000

470

440

Athlon 64 X2 4600+ S939

2400 / 1000

558

530

Athlon 64 X2 4800+ S939

2400 / 1000

645

625

Athlon 64 FX-57 S939

2800 / 1000

827

800

Athlon 64 FX-60 S939

2600 / 1000

1031

950

Socket AM2

Athlon 64 FX-62

2800 / 1000

1031

1180

Athlon 64 X2 5000+

2600 / 1000

696

680

Athlon 64 X2 4800+

2400 / 1000

645

640

Athlon 64 X2 4800+ EE

2400 / 1000

671

--

Athlon 64 X2 4600+

2400 / 1000

558

--

Athlon 64 X2 4600+ EE

2400 / 1000

601

--

Athlon 64 X2 4400+

2200 / 1000

470

460

Athlon 64 X2 4400+ EE

2200 / 1000

514

--

Athlon 64 X2 4200+

2200 / 1000

365

355

Athlon 64 X2 4200+ EE

2200 / 1000

417

--

Athlon 64 X2 4000+

2000 / 1000

328

320

Athlon 64 X2 4000+ EE

2000 / 1000

353

--

Athlon 64 X2 3800+

2000 / 1000

303

300

Athlon 64 X2 3800+ EE

2000 / 1000

323

--

Athlon 64 X2 3800+ EE SFF

2000 / 1000

364

--

Athlon 64 3800+

2400 / 1000

290

280

Athlon 64 3500+

2200 / 1000

189

200

Athlon 64 3500+ EE

2200 / 1000

231

--

Athlon 64 3200+

2000 / 1000

138

--

Athlon 64 3000+

1800 / 1000

105

--

LGA775

Pentium XE 955 LGA775 (65 nm)

3467 / 1066

999

940

Pentium XE 965 LGA775 (65 nm)

3733 / 1066

999

990

Pentium 4 651

3400 / 800

273

270

Pentium 4 661

3600 / 800

401

400

Pentium 4 670

3800 / 800

605

620

Pentium D 820

2800 / 800

209

165

Pentium D 830

3000 / 800

316

210

Pentium D 840

3200 / 800

423

450

Pentium D 920 (65 nm)

2800 / 800

209

190

Pentium D 930 (65 nm)

3000 / 800

209

200

Pentium D 940 (65 nm)

3200 / 800

241

240

Pentium D 950 (65 nm)

3400 / 800

316

320

Pentium D 960 (65 nm)

3400 / 800

523

540

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Wie waren doch alle enttäuscht, als Intel Mitte 2004 die DDR2-Speichertechnologie bei seinen Chipsätzen einführte, und die CPUs mit den hochmodernen DIMM-Riegeln nicht schneller wurden.

Jetzt stellt AMD seine neuen Athlon-64-Prozessoren mit DDR2-800-Speicher-Controller für den Socket AM2 vor – und die Performance enttäuscht ebenfalls. Beim Schritt von DDR400 auf die theoretisch doppelt so schnellen DDR2-800-Module änderte sich an der Leistungsfähigkeit der CPUs wenig. Manchmal arbeiten die AM2-Athlons ein paar Prozent schneller, dann wieder entsprechend langsamer als die Socket-939-Pendants mit DDR400. Dies hängt sehr von der Art der Speicherzugriffe der Applikation an.

So verpufft der Bandbreitenvorteil in der Praxis meist durch die höheren Latenzzeiten der DDR2-DIMMs. Bei DDR2-800-Speicher verstreichen vier Taktzyklen zwischen dem Anlegen der Spaltenadresse und dem Bereitliegen der Daten am Ausgang – DDR400 erledigt das in zwei Taktzyklen. Erschwerend kommt hinzu, dass wir für beim Socket-AM2-Mainboard bereits das von AMD empfohlene sehr aggressive Speicher-Timing von 4-4-4-12 eingestellt haben. Laut Spezifikation arbeitet DDR2-800-SDRAM aber mit einer CAS-Latency von 5 Taktzyklen. Bei dieser Konfiguration verlieren die CPUs durchschnittlich ein Prozent Performance bei speicherlastigen Applikationen.

Erfreulicher bei den neuen Athlon-64-Modellen für den Socket AM2 sind dagegen zusätzliche Features wie die Virtualisierungs-Technologie Pacifica. Auch die Preise bleiben auf dem Niveau der Vorgänger. Und erstaunlicherweise drückt AMD die TDP-Werte bei speziellen „Energy Efficient Processors“ auf sparsame 35 beziehungsweise 65 Watt. Dabei fertigt der Hersteller die CPUs wie bisher im 90-nm-Prozess.

Ein weiterhin schluckfreudiges 125-Watt-Top-Modell gibt es aber mit dem neuen Athlon 64 FX-62. Die Dual-Core-CPU hat mit einer auf 2,8 GHz gesteigerten Taktfrequenz Intels Pentium Extreme Edition 965 wieder überwiegend im Griff. Doch während die AMD-CPU ein Frischling ist, wird die NetBurst-basierende Extreme Edition bald überflüssig sein. Im Juli 2006 stellt Intel die neuen Core-2-Duo-Prozessoren vor. Mehr Performance bei deutlich niedrigerem Energiebedarf wird versprochen. Dann wird AMD seine lange Führungsposition im Kampf um die Performance-Krone abgeben müssen. (cvi)

Ab 17:00 können Sie bei tecCHANNEL einen ausführlichen Test von Intels „Woodcrest“ mit der neuen Core-Architektur lesen – mit eindeutigem Ergebnis.

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows XP Professional SP2 durchgeführt. Für den Linux-Test verwenden wir SUSE Linux 10.1 in der x86_64-Edition.

AMDs Athlon-64-Modelle für den Socket AM2 testen wir in einem Asus M2N32-SLI Deluxe mit nForce-590-SLI-Chipsatz. Der CPU steht Dual-Channel-DDR2-800-SDRAM mit CL4 von Corsair zur Verfügung. AMDs Socket-939-Prozessoren arbeiten in einem MSI K8N Diamond Plus mit NVIDIAs nForce 4 SLI. Der Chipsatz unterstützt HyperTransport-Taktfrequenzen bis 1000 MHz sowie PCI Express. Auf dem MSI-Mainboard können die AMD64-CPUs auf DualDDR400-SDRAM CL2 zurückgreifen.

Socket-AM2-Plattform: Das Asus M2N32-SLI Deluxe verwendet als Chipsatz NVIDIAs nFORCE 590 SLI. Beim Speicher steuert das Board DualChannel-DDR2-800-SDRAM an.

Intels Pentium Extreme Edition 965, die Pentium-D-900-Modelle sowie der Pentium 4 670 nehmen in einem Intel-Desktop-Board D975XBX Platz. Das Mainboard verwendet den 975X-Chipsatz. Als Arbeitsspeicher steht jeweils DDR2-667-SDRAM mit CL4 in einer Dual-Channel-Konfiguration zur Verfügung.

LGA775-Plattform: Das D975XBX von Intel setzt auf den 975X-Express-Chipsatz. Neben DDR2-667-SDRAM unterstützt das Mainboard FSB800- und FSB1066-Prozessoren.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer ATI Radeon X1900XTX in der PCI-Express-x16-Variante bestückt. Der Grafikkarte mit 512 MByte Grafikspeicher standen der Catalyst-Treiber 6.4 sowie DirectX 9.0c zur Seite. Einheit herrschte auch beim Arbeitsspeicher mit jeweils 1 GByte und den Massenspeichern - die Serial-ATA-II-Festplatte Maxtor MaxLine III mit 250 GByte Kapazität.