Quad-Core-Test: Neuer Core 2 Extreme QX6850 mit FSB1333

16.07.2007 von Christian Vilsbeck
Intel beschleunigt seine Quad-Core-Serie mit dem neuen Core 2 Extreme QX6850. Das 3,0-GHz-Topmodell arbeitet mit einer auf 1333 MHz angehobenen FSB-Taktfrequenz. Damit setzt die CPU für Single- und Multi-Thread-Anwendungen den Maßstab.

Im Juni stellte Intel bereits einen Core 2 Duo mit FSB1333 vor. Jetzt dürfen beim neuen Top-Modell, dem Quad-Core-Prozessor Core 2 Extreme QX6850, ebenfalls alle Kerne über einen schnelleren Prozessorbus ihre Daten austauschen.

Bei vier Kernen sollten Intels Core-Prozessoren von der FSB-Beschleunigung gut profitieren. Denn besonders bei sehr speicherintensiven Anwendungen beginnt der von allen Kernen gemeinsam genutzte Prozessorbus bereits zu limitieren. Mit der Anhebung von 1066 auf 1333 MHz erhöht Intel die Busbandbreite um 25 Prozent, die Performance der Quad-Core-CPUs dürfte bei Multi-Thread-Anwendungen mit viel Speicherverkehr damit besser skalieren.

Core 2 Extreme QX6850: Der Quad-Core-Prozessor mit 3,00 GHz Taktfrequenz setzt sich aus zwei Dual-Core-Dies zusammen. Die FSB1333-CPU für den Sockel LGA775 verfügt über insgesamt 8 MByte L2-Cache.

Etwas mehr Taktfrequenz gibt es beim neuen Core 2 Extreme QX6850 im Vergleich zum Vorgänger QX6800 ebenfalls. Mit der FSB-Anhebung steigt der Arbeitstakt von 2,93 auf 3,00 GHz – immerhin 2,4 Prozent mehr. Unverändert bleibt der maximale Energiebedarf von 130 Watt. Auch die übrigen Features sind altbekannt: zwei im 65-nm-Verfahren produzierte Dual-Core-Dies mit je 4 MByte L2-Cache sind in einem LGA775-Gehäuse eingebettet.

Im TecChannel-Testlabor muss der Core 2 Extreme QX6850 gegen die hauseigenen Quad-Core-Modelle von Intel und die Dual-Core-CPUs von AMD antreten. Dabei beeindruckt der Testkandidat durch einen klaren Start-Ziel-Sieg.

SYSmark2004 SE

Mit dem Benchmark-Paket SYSmark2004 SE bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Die Second Edition verwendet wieder 17 Anwendungen und arbeitet wahlweise mit den Windows XP in der 32- und 64-Bit-Edition zusammen. SYSmark2004 SE öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.

Neben einem Gesamtwert für die Systemleistung bietet SYSmark2004 SE detaillierte Ergebnisse in den Kategorien Office Productivity und Internet Content Creation an.

Gesamtwertung: Der Mix aus zwei Prozent höherer Taktfrequenz und dem schnelleren FSB1333 bewirkt eine vier Prozent höhere Systemleistung beim Core 2 Extreme QX6850 – gegenüber dem QX6800. Der schnellste Athlon 64 X2 6000+ ist hoffnungslos unterlegen.

SYSmark2004 SE: Internet Content Creation

Im Workload Internet Content Creation von SYSmark2004 SE sind Prozessoren mit schnellen FPUs im Vorteil. Die Anwendungen im diesem Testblock unterstützen zudem in hohem Maße SSE2 und Multiprocessing. Zu den Applikationen des Workloads Internet Content Creation zählen Macromedia Dreamweaver und Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 und Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 sowie McAfee VirusScan 7.0.1.

Internet Content Creation: In diesem Szenario dominieren SMP-fähige Anwendungen wie 3ds max und Photoshop. Der FSB1333 sorgt beim Quad-Core-Modell QX6850 (gegenüber QX6800) für merklich mehr Performance als beim Doppelkerner Core 2 Duo E6750 (im Vegleich zum E6700).

SYSmark2004 SE: Office Productivity

Der Workload Office Productivity in SYSmark2004 SE verwendet insgesamt zehn verschiedene Applikationen. Hierzu zählen Microsofts Word, Excel, PowerPoint, Access und Outlook in der Version 2002, McAfee VirusScan 7.0, ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 sowie der Internet Explorer 6.0.

Office Productivity: Büroarbeiten erledigt der Core 2 Extreme QX6850 gut drei Prozent flinker als das FSB1066-Modell – auch durch seine zwei Prozent höhere Taktfrequenz.

SPECint_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intels C++ 9.1 und Fortran 9.1 sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.

Der SPECint_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

SPECint_base2000: Intels Core-2-Modelle deklassieren weiterhin die restliche x86-Welt. Der Single-Thread-Integer-Test ist nicht sehr speicherintensiv. Der schnellere FSB1333 des Core 2 Extreme QX6850 erwirkt deshalb kaum einen Nutzen. Seinen Geschwindigkeitsvorteil gegenüber dem 2,93-GHz-QX6800 schöpft der QX6850 aus der höheren Taktfrequenz von 3,0 GHz.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks im Vergleich:

SPECint_base2000: Official Run

Prozessor

Athlon 64 X2 5200+

Athlon 64 X2 6000+

Core 2 XE QX6800

Core 2 XE QX6850

Taktfrequenz

2,6 GHz

3,0 GHz

2,93 GHz

3,00 GHz

Sockel

AM2

AM2

LGA775

LGA775

Core

Windsor

Windsor

Kentsfield

Kentsfield

Speichertyp

DDR2-800

DDR2-800

DDR2-800

DDR2-800

Chipsatz

NF5

NF5

975X

P35

Compiler

Intel

Intel

Intel

Intel

Test

164.gzip

1402

1632

1812

1859

175.vpr

1372

1525

2340

2333

176.gcc

1390

1616

3357

3438

181.mcf

1039

1197

5239

5196

186.crafty

1959

2304

2714

2756

197.parser

1495

1735

2290

2335

252.eon

2360

2716

3829

3925

253.perlbmk

1924

2217

3332

3373

254.gap

1896

2133

3084

3200

255.vortex

2520

2867

4889

4923

256.bzip2

1388

1553

2353

2389

300.twolf

1743

1950

3369 

3381

Gesamt

1657

1895

3072

3117

SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECint_rate_base2000 beim Athlon 64 X2/FX sowie Athlon X2 BE (Dual-Core), Core 2 Duo/Extreme mit zwei Kopien sowie beim Core 2 Quad Q6600 und Extreme QX6700/6800/6850 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von mehreren Kernen ausgenutzt.

SPECint_rate_base2000: Die Speicherauslastung hält sich bei den Integer-Tests in Grenzen. Von seinem FSB1333 profitiert der Core 2 Extreme QX6850 deshalb nur mit zirka eins bis zwei Prozent mehr Performance – im Vergleich zum QX6800.

SPECfp_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.1 und MS Visual Studio 2005 .NET sowie Intel Fortran 9.1 für alle Fließkommatests. Bei den AMD-Prozessoren testen wir die Floating-Point-Performance zusätzlich mit den PGI-6.0-Compilern. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.

Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

SPECfp_base2000: Die Fließkommatests benötigen schon mehr Speicher als die Integer-Berechnungen. Der Core 2 Extreme QX6850 zieht dem FSB1066-Modell QX6800 immerhin um vier Prozent mehr Performance davon. In besonders speicherintensiven Einzelapplikationen wie die Flachwasser-Simulation 171.swim arbeitet die FSB1333-CPU 12 Prozent schneller.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks im Vergleich:

SPECfp_base2000: Official Run

Prozessor

Athlon 64 X2 5200+

Athlon 64 X2 6000+

Core 2 XE QX6800

Core 2 XE QX6850

Taktfrequenz

2,6 GHz

3,0 GHz

2,93 GHz

3,00 GHz

Sockel

AM2

AM2

LGA775

LGA775

Core

Windsor

Windsor

Kentsfield

Kentsfield

Speichertyp

DDR2-800

DDR2-800

DDR2-800

DDR2-800

Chipsatz

NF5

NF5

975X

P35

Compiler

PGI

PGI

Intel

Intel

Test

168.wupwise

2723

3059

4652

4794

171.swim

1941

2084

2972

3340

172.mgrid

1520

1757

1877

1950

173.applu

1310

1565

2259

2479

177.mesa

1195

1406

2876

2944

178.galgel

2674

3113

7046

7225

179.art

1853

2013

10171

10413

183.equake

1500

1627

3138

3193

187.facerec

1981

2250

3046

3101

188.ammp

1194

1351

2180

2231

189.lucas

1686

1795

2837

2979

191.fma3d

1520

1785

2153

2275

200.sixtrack

788

913

1177

1203

301.apsi

1479

1673

1982

1976

Gesamt

1590

1800

2939

3053

SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECfp_rate_base2000 beim Athlon 64 X2/FX sowie Athlon X2 BE (Dual-Core), Core 2 Duo/Extreme mit zwei Kopien sowie beim Core 2 Quad Q6600 und Extreme QX6700/6800/6850 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von mehreren Kernen ausgenutzt.

SPECfp_rate_base2000: Der Benchmark benötigt viel Speicher, Intels Core 2 Extreme QX6850 arbeitet mit acht Prozent höherer Performance gegenüber dem FSB1066-Modell QX6800. Zieht man die zwei Prozent höhere Taktfrequenz des QX6850 (3,0 statt 2,93 GHz) ab, so erwirkt der FSB1333 zirka sechs Prozent mehr Geschwindigkeit. Bei der Einzelapplikation 179.art (Bilderkennung) aus der Suite arbeitet der QX6850 sogar 16 Prozent schneller.

Linux 64 Bit: Linpack

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben. Linpack löst komplexe lineare Gleichungssysteme.

Unter SUSE Linux 10.1 64-Bit-Edition setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Athlon-64-Prozessoren mit SSE3 arbeiten mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen und nutzen die Befehlserweiterung.

Bei unseren Tests löst Linpack bis zu 10.000 Gleichungssysteme. Damit benötigt der Benchmark maximal 763 GByte Arbeitsspeicher. Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Bandbreitenvorteil: Intels Core-2-Prozessoren liegen durch ihre bessere SSE-Performance geschlossen an der Spitze. Der neue Core 2 Extreme QX6850 setzt seinen FSB1333 in fünf Prozent mehr Performance um – gegenüber dem QX6800 mit FSB1066. Die restlichen zwei Prozent sind auf die höhere Taktfrequenz des QX6850 zurückzuführen (3,0 statt 2,93 GHz).

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 2.5 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Dual-Core-Prozessoren optimal. SunGard arbeitet überwiegend mit Integer-Operationen.

Schnelle Kalkulation: Die Speicher-Performance und somit auch die Geschwindigkeit des Prozessorbusses spielen eine untergeordnete Rolle. Der Core 2 Extreme QX6850 zieht keinen Profit aus seinem schnelleren FSB1333. Seine etwas höhere Taktfrequenz (3,0 GHz) hievt den QX6850 trotzdem an die Spitze vor dem QX6800 mit 2,93 GHz und FSB1066.

Audio-Enkodieren: iTunes 6

Apples iTunes 6 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Nur beim MP3-Enkodieren nutzt iTunes 6 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Vertont: Weil iTunes nur zwei Threads beim Enkodieren nutzt, profitieren Intels Quad-Core-Modelle nicht von ihren vier Kernen. Durch den zusätzlichen Overhead, den Windows durch das wechselweise Verteilen der zwei Threads zwischen den vier Cores verursacht, enkodiert der QX6700 und QX6800 sogar etwas langsamer als die mit gleicher Taktfrequenz arbeitenden E6700 beziehungsweise X6800. Der neue Core 2 Extreme QX6850 setzt sich durch seine höhere Taktfrequenz an die Spitze, der FSB1333 erwirkt keinen Vorteil.

Video-Enkodieren: iTunes 6

Mit Apples iTunes 6 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 128 KBit/s und einer „mobilen“ Auflösung von 320 x 176 Bildpunkten. Dieses Video-Format ist für Apples iPod-Player optimiert. iTunes 6 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.

Kurzfilm: Beim Wandeln setzt sich der Core 2 Extreme QX6850 durch seine Taktfrequenz von 3,0 GHz an die Spitze. Wie beim Audio-Enkodieren nutzt iTunes nur zwei Threads – die Quad-Cores sind deshalb nicht schneller als die Dual-Core-Varianten, entscheidend ist die Taktfrequenz. Der FSB1333 erwirkt nur einen minimalen Vorteil, wie der Vergleich der 2,66-GHz-Modelle Core 2 Duo E6700 (FSB1066) und E6750 (FSB1333) zeigt.

Rendering: 3ds Max 8

Discreet/Autodesk bietet mit 3ds Max 8 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 8 Multiprocessing voll aus. Die Dual- und Quad-Core- sowie Hyper-Threading-Technologien wirken somit beschleunigend.

Die verwendeten Render-Szenen basieren auf der Benchmark-Suite SPECapc for 3ds Max 7 von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle.

Szene Radiosity: Rendering zählt zur Paradedisziplin für Multicore-Prozessoren. Die Quad-Core-Modelle von Intel liegen einsam an der Spitze.
Szene Underwater: Jetzt überholt der Athlon 64 X2 6000+ Intels Core 2 Duo E6700. Es wird deutlich, dass die Render-Performance der Prozessoren vom Workload - und somit der Cache-Größe und der Speicheranbindung - abhängig ist.

Rendering: CINEBENCH 9.5

Mit dem CINEBENCH 9.5 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 9.5 basiert auf Cinema 4D Release 9.5 und führt wieder Shading- und Raytracing-Tests durch.

Der Raytracing-Test von CINEBENCH 9.5 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen.

Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 9.5 wenig - der Test läuft überwiegend in den ersten beiden Cache-Stufen ab.

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet - Multicore nutzt hier nichts. Der Core 2 Extreme QX6850 setzt sich durch seine Taktfrequenz von 3,0 GHz an die Spitze. Die L2-Cache-Größe ist hier nicht entscheidend, bereits 512 KByte reichen zum Puffern der Render-Daten aus.
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren – physikalischen und virtuellen – Prozessorkerne. Intels Quad-Core-Modelle deklassieren das restliche Feld. Der Core 2 Extreme QX6850 setzt seine zwei Prozent höhere Taktfrequenz gegenüber dem QX6800 effektiv um. Der schnellere FSB1333 nutzt hier kaum etwas.

Rendering & Enkodieren

In einem Multitask-Szenario führen wir das Rendering von CINEBENCH 9.5 bei einer konstanten Hintergrundlast durch. Diese realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File. Das Enkodieren erfolgt in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.

Beim Render-Vorgang nutzt CINEBENCH 9.5 alle zur Verfügung stehende Prozessorkerne. In der Tabelle sehen Sie, wie stark die Render-Performance einbricht, wenn eine konstante Hintergrundlast arbeitet.

Rendering & Enkodieren

Prozessor

CINEBENCH 1 Thread

CINEBENCH alle Threads

CINEBENCH alle Threads + LAME

Performance-Einbruch

Alle CINEBENCH-Ergebnisse in Punkten. Höhere Werte sind besser.

Athlon 64 FX-62

412

759

406

-46,5 %

Athlon 64 X2 5200+

384

706

386

-45,3 %

Athlon 64 X2 6000+

449

837

433

-48,3 %

Core 2 Duo E6400

356

663

341

-48,6 %

Core 2 Duo E6700

445

831

427

-48,6 %

Core 2 Duo E6750

450

836

438

-47,6 %

Core 2 Q6600

394

1276

995

-22,0 %

Core 2 XE QX6700

436

1417

1090

-23,1 %

Core 2 XE QX6800

481

1549

1209

-21,9 %

Core 2 XE QX6850

492

1595

1222

-23,4 %

Bei allen Dual-Core-CPUs bricht die Rendering-Performance um zirka 45 bis 49 Prozent ein, wenn LAME im Hintergrund enkodiert. Intels Quad-Core-Prozessoren rendern dagegen nur 22 bis 23 Prozent langsamer.

OpenGL: CINEBENCH 9.5

Der Leistungstest OpenGL-HW von CINEBENCH 9.5 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.

Eine Liga: Cinema 4D - und somit der Prozessor - übermittelt der Grafikkarte lediglich die Position der Lichtquellen sowie die Geometrie. Multicore erwirkt keinen Vorteil. Intels neuer Core 2 Extreme QX6850 kann sich vom FSB1066-Pendant nur marginal absetzen.

Beim Leistungstest OpenGL-SW übernimmt die Cinema-4D-Engine zusätzlich die Berechnung der Beleuchtung.

Lichtschalter: Jetzt muss der Prozessor zusätzliche Rechenarbeit übernehmen. Der grafikintensive Test zieht aus der Multicore-Technologie keinen Nutzen. Intels Core 2 Duo E6750 arbeitet durch seinen FSB1333 hier zwei Prozent schneller als das FSB1066-Modell. Beim FSB1333-Quad-Core-Modell Core 2 Extreme QX6850 wird dieser Vorteil durch das Thread-Switching zwischen vier Kernen größtenteils aufgebraucht. Die CPU ist nur ein Prozent flinker als der QX6800 mit FSB1066 – trotz zwei Prozent höherer Taktfrequenz.

OpenGL: SPECviewperf 9

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 9 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Highend-Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Lightscape, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualization Mockup und UGS NX.

Besonders die Anwendung Lightscape Viewset (light-08) nutzt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.

light-08: Multicore nutzt hier nichts. Der Core 2 Extreme QX6850 entlockt mit zwei Prozent höherer Taktfrequenz der Grafikkarte eine vier Prozent höhere Framerate. Der schnellere FSB1333 gegenüber dem 2,93-GHz-Modell QX6800 mit FSB1066 zeigt Wirkung.

Die Einzelergebnisse von SPECviewperf 9 in der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist:

SPECviewperf 9

Prozessor

3dsmax-04

catia-02

ensight-03

light-08

maya-02

proe-04

sw-01

ugnx-01

tcvis-01

Alle Ergebnisse in fps. Höhere Werte sind besser.

Athlon 64 X2 6000+ AM2

11,90

14,01

12,43

12,75

13,64

9,31

18,42

10,31

5,01

Core 2 Duo E6700 DDR2-800

12,48

14,52

12,49

13,18

17,87

9,21

18,73

10,15

4,51

Core 2 Duo E6750 DDR2-800

12,72

14,55

12,79

13,78

18,53

9,23

18,86

10,52

4,51

Core 2 Quad Q6600 DDR2-800

11,95

13,76

12,09

12,10

16,76

8,84

18,19

9,88

4,46

Core 2 XE QX6700 DDR2-800

12,45

14,51

12,43

13,16

17,81

9,19

18,71

10,09

4,51

Core 2 XE X6800 DDR2-800

12,66

14,98

12,82

14,32

18,92

9,51

19,05

10,34

4,51

Core 2 XE QX6800 DDR2-800

12,64

14,95

12,73

14,23

18,83

9,43

18,86

10,27

4,46

Core 2 XE QX6850 DDR2-800

12,68

15,04

12,99

14,86

19,15

9,63

19,05

10,55

4,52

OpenGL & Enkodieren

In einem zweiten Multitask-Szenario überprüfen wir den Einbruch der Framerate des OpenGL-3D-Spiels Quake 4, wenn im Hintergrund MP3s erstellt werden. Das Enkodieren realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File - in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.

Quake 4 unterstützt durch ein aktivierbares SMP bereits Dual-Core-Prozessoren. In der Tabelle sehen Sie den Unterschied in der Framerate ohne und mit SMP-Aktivierung bei Quake 4. Bei aktiver LAME-Hintergrundlast lassen wir Quake 4 mit eingeschaltetem SMP laufen.

Rendering & Enkodieren

Prozessor

Quake 4 SMP off [fps]

Quake 4 SMP on [fps]

Quake 4 SMP on + LAME [fps]

Performance-Einbruch

Quake 4: Medium Quality, Auflösung 1024x768, AA off

Athlon 64 X2 6000+

82

115

102

-11,3 %

Core 2 Duo E6400

83

116

104

-10,3 %

Core 2 Duo E6700

99

126

113

-10,3 %

Core 2 Duo E6750

103

127

119

-6,3 %

Core 2 Quad Q6600

91

124

124

0 %

Core 2 XE QX6800

104

128

128

0 %

Core 2 XE QX6850

107

129

129

0 %

Bei parallel arbeitenden Programmen mit abwechselnden Speicherzugriffen zeigt sich der Vorteil schneller Prozessorbusse. Intels Core 2 Duo E6750 mit FSB1333 lässt deshalb die Framerate von Quake 4 weniger sinken als der E6700 mit FSB1066.

Während aber die Dual-Core-Prozessoren mit Hintergrundlast um zirka 6 bis 11 Prozent in der Framerate einbrechen, bleibt die Quake-4-Performance des Core 2 Quad Q6600 und Extreme QX6800/6850 konstant. Weil Quake nur von einem zweiten Prozessorkern profitiert, stehen bei den Quad-Core-Modellen zwei weitere Kerne anderen Applikationen voll zur Verfügung. Das Single-Thread-LAME-Enkodieren im Hintergrund wirkt sich bei den Vierkern-CPUs auf die Framerate somit nicht negativ aus.

DirectX: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

Gesamtwertung: Der Vorteil der Multicore-Technologie fließt in das Ergebnis ein. Wenig überraschend liegen auch diesmal die Core-2-Topmodelle in Führung.

3Dmark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

CPU-Test: Ohne Hilfe der Grafikkarte bleibt der Core 2 Extreme QX6850 an der Spitze. Die FSB-Geschwindigkeit spielt hier eine untergeordnete Rolle, wie auch der Vergleich der 1,8-GHz-Modelle Core 2 Duo E4300 (FSB800) und T5600 (FSB667) zeigt.

32-Bit-Transfer

Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.

Core 2 Extreme QX6850 (3,00 GHz) FSB1333 DualDDR2-800 CL4: Im Cache ermöglicht die CPU maximal 22.610 MByte/s (Store). Die Bandbreite des DDR2-800-Speichers liegt bei 5765 MByte/s. Im Zusammenspiel mit dem FSB1333 und dem P35-Chipsatz erreicht der QX6850 eine 17 Prozent höhere Speicherbandbreite als der QX6800.
Core 2 Extreme QX6800 (2,93 GHz) FSB1066 DualDDR2-800 CL4: Die Core-CPU erreicht im Cache mit 22.112 MByte/s erwartungsgemäß das gleiche Niveau wie der E6750. Aus dem DDR2-800-Speicher holt die FSB1066-CPU und der 975X-Chipsatz bei 32-Bit-Zugriffen mit 4928 MByte/s (Store) jedoch deutlich weniger heraus.

64-Bit-Transfer

Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.

Core 2 Extreme QX6850 (3,00 GHz) FSB1333 DualDDR2-800 CL4: Im L1-Cache sind maximal 22.884 MByte/s möglich. Im Speicher erreicht die LGA775-CPU bei 64-Bit-Kommandos mit 5898 MByte/s (Load) überraschend weniger Durchsatz als das FSB1066-Pendant. Entscheidend sind hier die unterschiedlichen Chipsätze P35 und 975X. Bei Store-Vorgängen arbeitet der QX6850 aber 22 Prozent schneller im Speicher.
Core 2 Extreme QX6800 (2,93 GHz) FSB1066 DualDDR2-800 CL4: Jetzt erreicht der L1-Cache-Durchsatz 22.378 MByte/s. Im Speicher transferiert der Core-Prozessor 6813 MByte/s (Load).

128-Bit-Transfer

Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.

Core 2 Extreme QX6850 (3,00 GHz) FSB1333 DualDDR2-800 CL4: Der Cache erlaubt eine Transferrate von 45.761 MByte/s. Im Speicher sind 5926 MByte/s (Load) möglich – dies ist weniger als beim QX6800 mit 975X-Chipsatz. Bei Store-Vorgängen holt die FSB1333-CPU mit 3341 MByte/s aber 22 Prozent mehr Performance aus dem Speicher.
Core 2 Extreme QX6800 (2,93 GHz) FSB1066 DualDDR2-800 CL4: Im L1-Cache erreicht die CPU maximal 44.751 MByte/s. Im Speicher liegt die Bandbreite bei 7143 MByte/s (Load, 8-MByte-Blöcke).

Energieverbrauch

AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.

Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte, Soundkarte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows im „Leerlauf“ ohne aktivierten Energiesparmodus:

Regungslos: Intels Core 2 Extreme QX6850 benötigt in Kombination mit dem neuen FSB1333-Mainbord (Intel P35-Chipsatz) etwas mehr Energie als der mit gleichem TDP-Wert (130 Watt) spezifizierte QX6800 im 975X-Mainboard.

Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD PowerNow! (Cool’n’Quiet) zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:

Sparfüchse: Aktiviert man bei AMD PowerNow!, so arbeitet der Athlon 64 X2 6000+ mit 1000 MHz Taktfrequenz und deutlich genügsamer. Bei den Intel-CPUs sinkt der Energiebedarf im Leerlauf mit SpeedStep nur marginal, weil bei den Prozessoren bereits andere Powersave-Technologien greifen. SpeedStep hilf bei den Intel-CPUs Energie zu sparen, wenn die Prozessorauslastung im „mittleren“ Bereich liegt.

Sind die Prozessoren, der Speicher sowie die Grafikkarte unter hoher Last, so steigt der Energiebedarf der Plattformen auf folgende Werte:

Full Power: Unter voller Last minimieren sich die Unterschiede zwischen den 130-Watt-Quad-Core-Modellen Core 2 Extreme QX6800 und QX6850.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 09. Juli 2007 die letzten Änderungen. Intels Preisliste wurde am 09. Mai 2007 aktualisiert. Die neuen Core 2 Duo E6750 und Core 2 Extreme QX6850 sind in der Liste noch nicht aufgeführt.

OEM- und Straßenpreise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Socket AM2

Athlon 64 X2 6000+

3000 / 1000

178

160

Athlon 64 X2 5600+

2800 / 1000

157

145

Athlon 64 X2 5200+

2600 / 1000

136

125

Athlon 64 X2 5000+

2600 / 1000

125

110

Athlon 64 X2 5000+ 65 nm

2600 / 1000

125

115

Athlon 64 X2 4800+ 65 nm

2500 / 1000

115

105

Athlon 64 X2 4400+ 65 nm

2300 / 1000

94

75

Athlon 64 X2 4200+

2200 / 1000

83

75

Athlon 64 X2 4000+ 65 nm

2100 / 1000

73

65

LGA775

Core 2 Extreme QX6850

3000 / 1333

999

1000

Core 2 Extreme QX6800

2930 / 1066

1199

1160

Core 2 Extreme QX6700

2670 / 1066

999

920

Core 2 Extreme X6800

2930 / 1066

999

910

Core 2 Quad Q6600

2400 / 1066

530

340

Core 2 Duo E6750

2670 / 1333

183

180

Core 2 Duo E6700

2670 / 1066

316

295

Core 2 Duo E6600

2400 / 1066

224

210

Core 2 Duo E6400

2130 / 1066

183

160

Core 2 Duo E6300

1860 / 1066

163

150

Core 2 Duo E4400

2000 / 800

133

120

Core 2 Duo E4300

1800 / 800

113

105

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Intel markiert mit dem neuen Core 2 Extreme QX6850 in allen Benchmarks einsam die Spitze. Durch seine hohe Taktfrequenz von 3,0 GHz arbeitet der Quad-Core-Prozessor sogar in Single-Thread-Anwendungen flinker als das Dual-Core-Topodell Core 2 Extreme X6800 mit 2,93 GHz.

Intels bisheriger Quad-Core-Spitzenreiter Core 2 Extreme QX6800 arbeitet ebenfalls mit 2,93 GHz. Der neue QX6850 setzt seine zwei Prozent höhere Taktfrequenz von 3,0 GHz in Kombination mit der von 1066 auf 1333 MHz gesteigerten FSB-Geschwindigkeit in durchschnittlich vier Prozent Performance-Gewinn um. Bei sehr speicherintensiven Multi-Thread-Applikationen steigt die Rechenleistung durch den FSB1333 um bis zu 16 Prozent.

Die hohe Rechenleistung der Extreme Edition lässt sich Intel wie gewohnt mit zirka 1000 Euro bezahlen. Ab dem 22. Juli 2007 ist der QX6850 laut Hersteller verfügbar. Doch selbst gegen das FSB1333-Dual-Core-Modell Core 2 Duo E6750 für 180 Euro hat AMDs schnellster Desktop-Prozessor Athlon 64 X2 6000+ wenig Chancen. Bei den diskutierten Unterschieden in der Performance handelt es sich allerdings um „Nörgeln auf hohem Niveau“. Denn auch an der Rechengeschwindigkeit des 3,0-GHz-Athlons gibt es wenig zu bemäkeln.

Um wieder deutlich konkurrenzfähiger zu werden, ist bei AMD der baldige Wechsel auf die K10-Architektur notwendig. Im August 2007 gehen aber erst die Opteron-K10-Prozessoren an den Start. Für die Desktop-CPUs Phenom hat AMD noch keinen konkreten Launch-Termin bekannt gegeben – der Hersteller gibt weiterhin das zweite Halbjahr 2007 an. (cvi)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows XP Professional SP2 durchgeführt. Für den Linux-Test verwenden wir SUSE Linux 10.1 in der x86_64-Edition.

Den neuen Core 2 Extreme QX6850 und Core 2 Duo E6750 testen wir in Intels FSB1333-Mainboard DP35DP mit P35-Express-Chipsatz. Die übrigen Core-2-Duo-Modelle sowie der Core 2 Quad Q6600 und Extreme QX6700/6800 nehmen in einem Intel D975XBX2 mit 975X-Chipsatz Platz. Als Arbeitsspeicher steht jeweils DDR2-800-SDRAM mit CL4 in einer Dual-Channel-Konfiguration zur Verfügung.

LGA775-Plattform: Das D975XBX2 von Intel setzt auf den 975X-Express-Chipsatz. Das Mainboard unterstützt die Core-2-CPUs sowie die Quad-Core-Versionen.

Der Core 2 Duo T5600 arbeitet in einem AOpen i975Xa-YDG mit Intels 975X-Express-Chipsatz und Socket 479M.

Mobile-Plattform: Das AOpen i975Xa-YDG mit Socket 479M setzt auf Intels 975X Express Chipsatz. Beim Speicher steuert das Board DualChannel-DDR2-667-SDRAM an.

AMDs Athlon-Modelle für den Socket AM2 testen wir in einem Asus M2N32-SLI Deluxe mit nForce-590-SLI-Chipsatz. Der CPU steht Dual-Channel-DDR2-800-SDRAM mit CL4 von Corsair zur Verfügung.

Socket-AM2-Plattform: Das Asus M2N32-SLI Deluxe verwendet als Chipsatz NVIDIAs nFORCE 590 SLI. Beim Speicher steuert das Board DualChannel-DDR2-800-SDRAM an.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer ATI Radeon X1900XTX in der PCI-Express-x16-Variante bestückt. Der Grafikkarte mit 512 MByte Grafikspeicher standen der Catalyst-Treiber 6.4 sowie DirectX 9.0c zur Seite. Einheit herrschte auch beim Arbeitsspeicher mit jeweils 1 GByte und den Massenspeichern - die Serial-ATA-II-Festplatte Maxtor MaxLine III mit 250 GByte Kapazität.