Intel 45-nm-Quad-Core mit Penryn-Architektur

Test: Core 2 Extreme QX9650 mit Penryn-Architektur

29.10.2007 von Christian Vilsbeck
Mit der 45-nm-Penryn-Architektur verbessert Intel seine Core-2-Prozessoren. Mit 3 GHz Taktfrequenz, 12 MByte Cache, der SSE4-Erweiterung und zahlreichen neuen Features giert der neue Core 2 Extreme QX9650 nach neuen Herausforderern.

Ab dem 12. November 2007 gibt es ihn offiziell: Intels neuen Core 2 Extreme QX9650. Mit dem Desktop-Prozessor führt Intel seine neue Prozessor-Generation „Penryn“ mit 45 nm Strukturbreite ein. Das neue Quad-Core-Topmodell arbeitet mit 3,0 GHz Taktfrequenz und einem FSB1333 im bekannten LGA775-Gehäuse.

Soweit gleicht die unter dem Code-Namen „Yorkfield“ bekannte CPU dem 65-nm-Vorgänger Core 2 Extreme QX6850. Allerdings führt Intel mit seiner 45-nm-Generation zahlreiche Architekturerweiterungen ein. Für einen deutlichen Performance-Schub sollen beispielsweise die 47 neuen SSE4-Befehle und Feintuning wie „Super Shuffle“ und „Fast Radix-16“ sorgen.

Core 2 Extreme QX9650: Der 45-nm-Quad-Core-Prozessor für den Sockel LGA775 arbeitet mit 3,0 GHz Taktfrequenz. Insgesamt verfügt die CPU über 12 MByte L2-Cache – pro Dual-Core-Die sind es 6 MByte.

Mehr Cache gibt es für den Core 2 Extreme QX9650 ebenfalls. Insgesamt stehen dem Quad-Core-Prozessor statt 8 nun 12 MByte L2-Cache zur Verfügung. Die Assoziativität der zweiten Pufferstufe erhöht Intel von 16- auf 24-fach, damit der Cache optimaler ausgenutzt wird. Den Yorkfield fertigt Intel weiterhin im Multi-Chip-Verfahren mit zwei Dual-Core-Dies.

Wie bei Intels Extreme Editions üblich besitzt auch der Core 2 Extreme QX9650 keinen festen Multiplier – übertakten ist erwünscht. Der SSE4-Prozessor wird von Intels P35- und X38-Chipsätzen offiziell unterstützt. Unverändert bleibt die theoretisch maximale Energieaufnahme mit spezifizierten 130 Watt TDP.

Adäquate Gegner für den Core 2 Extreme QX9650 sind kaum auszumachen. Von AMD tritt das aktuelle Spitzenmodell Athlon 64 X2 6400+ mit 3,2 GHz an. Spannend ist somit die Frage, welchen Leistungssprung die neuen Features des 45-nm-Yorkfield gegenüber dem Core 2 Extreme QX6850 ermöglichen.

SYSmark2004 SE

Mit dem Benchmark-Paket SYSmark2004 SE bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Die Second Edition verwendet wieder 17 Anwendungen und arbeitet wahlweise mit den Windows XP in der 32- und 64-Bit-Edition zusammen. SYSmark2004 SE öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.

Neben einem Gesamtwert für die Systemleistung bietet SYSmark2004 SE detaillierte Ergebnisse in den Kategorien Office Productivity und Internet Content Creation an.

Gesamtwertung: Die Architekturerweiterungen wie der größere L2-Cache sorgen beim Core 2 Extreme QX9650 für eine fünf Prozent höhere Systemleistung – bei unveränderter Taktfrequenz gegenüber dem QX6850. Der schnellste Athlon 64 X2 6400+ ist hoffnungslos unterlegen.

SYSmark2004 SE: Internet Content Creation

Im Workload Internet Content Creation von SYSmark2004 SE sind Prozessoren mit schnellen FPUs im Vorteil. Die Anwendungen im diesem Testblock unterstützen zudem in hohem Maße SSE2 und Multiprocessing. Zu den Applikationen des Workloads Internet Content Creation zählen Macromedia Dreamweaver und Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 und Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 sowie McAfee VirusScan 7.0.1.

Internet Content Creation: In diesem Szenario dominieren SMP-fähige Anwendungen wie 3ds max und Photoshop. Die Penryn-Architektur beschleunigt die neue 3,0-GHz-Extreme-Edition um fünf Prozent gegenüber dem 65-nm-Modell QX6850.

SYSmark2004 SE: Office Productivity

Der Workload Office Productivity in SYSmark2004 SE verwendet insgesamt zehn verschiedene Applikationen. Hierzu zählen Microsofts Word, Excel, PowerPoint, Access und Outlook in der Version 2002, McAfee VirusScan 7.0, ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 sowie der Internet Explorer 6.0.

Office Productivity: Büroarbeiten erledigen die Athlon-Modelle deutlich unproduktiver.

SPECint_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intels C++ 9.1 und Fortran 9.1 sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.

Der SPECint_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

SPECint_base2000: Der Single-Thread-Integer-Test ist nicht sehr speicherintensiv. Der Core 2 Extreme QX9650 profitiert hauptsächlich vom Architektur-Tuning wie dem Fast Radix-16 Divider.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks im Vergleich:

SPECint_base2000: Official Run

Prozessor

Athlon 64 X2 6400+

Core 2 XE QX6850

Core 2 XE QX9650

Taktfrequenz

3,2 GHz

3,00 GHz

3,00 GHz

Sockel

AM2

LGA775

LGA775

Core

Windsor

Kentsfield

Yorkfield

Speichertyp

DDR2-800

DDR2-800

DDR2-800

Chipsatz

NF5

P35

X38

Compiler

Intel

Intel

Intel

Test

164.gzip

1738

1859

1805

175.vpr

1632

2333

2481

176.gcc

1714

3438

3574

181.mcf

1307

5196

6512

186.crafty

2413

2756

2763

197.parser

1841

2335

2412

252.eon

2891

3925

4519

253.perlbmk

2357

3373

3449

254.gap

2325

3200

3247

255.vortex

3069

4923

5257

256.bzip2

1661

2389

2465

300.twolf

2098

3381

3736

Gesamt

2026

3117

3306

Offizielle Ergebnisse von CPU2000 werden seit dem 24.02.2007 vom SPEC-Konsortium nicht mehr publiziert. Seit August 2006 gibt es den Nachfolger CPU2006. Eine Test des Core 2 Extreme QX9650 mit CPU2006 finden Sie zum offiziellen Launch der CPU am 12. November 2007 bei TecChannel.

SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECint_rate_base2000 beim Athlon 64 X2 sowie Athlon X2 BE (Dual-Core), Core 2 Duo/Extreme mit zwei Kopien sowie beim Core 2 Quad Q6600 und Extreme QX6700/6800/6850/9650 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von mehreren Kernen ausgenutzt.

SPECint_rate_base2000: Der Core 2 Extreme QX9650 profitiert hier hauptsächlich von seinem größerem L2-Cache sowie dem Architektur-Tuning wie dem FastRadix-16 Divider. Der Speicherbedarf ist bei dem Ganzzahlen-Benchmark im bei multiplen Kopien schon etwas höher als beim Single-Thread-Test. Deshalb setzt sich die 45-nm-Version vom QX6850 mit einer 11 Prozent höheren Performance ab.

Offizielle Ergebnisse von CPU2000 werden seit dem 24.02.2007 vom SPEC-Konsortium nicht mehr publiziert. Seit August 2006 gibt es den Nachfolger CPU2006. Eine Test des Core 2 Extreme QX9650 mit CPU2006 finden Sie zum offiziellen Launch der CPU am 12. November 2007 bei TecChannel.

SPECfp_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.1 und MS Visual Studio 2005 .NET sowie Intel Fortran 9.1 für alle Fließkommatests. Bei den AMD-Prozessoren testen wir die Floating-Point-Performance zusätzlich mit den PGI-6.0-Compilern. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.

Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

SPECfp_base2000: Die Fließkommatests benötigen schon mehr Speicher als die Integer-Berechnungen. Der Core 2 Extreme QX9650 mit seinem größeren L2-Cache zieht dem 65-nm-Modell QX6850 immerhin um acht Prozent mehr Performance davon.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks im Vergleich:

SPECfp_base2000: Official Run

Prozessor

Athlon 64 X2 6400+

Core 2 XE QX6850

Core 2 XE QX9650

Taktfrequenz

3,2 GHz

3,00 GHz

3,00 GHz

Sockel

AM2

LGA775

LGA775

Core

Windsor

Kentsfield

Yorkfield

Speichertyp

DDR2-800

DDR2-800

DDR2-800

Chipsatz

NF5

P35

X38

Compiler

PGI

Intel

Intel

Test

168.wupwise

3285

4794

5120

171.swim

2262

3340

3616

172.mgrid

1891

1950

1985

173.applu

1685

2479

2787

177.mesa

1480

2944

3079

178.galgel

3339

7225

7216

179.art

2189

10413

10433

183.equake

1760

3193

3594

187.facerec

2415

3101

3496

188.ammp

1452

2231

2823

189.lucas

1942

2979

3116

191.fma3d

1917

2275

2610

200.sixtrack

970

1203

1218

301.apsi

1770

1976

2231

Gesamt

1932

3053

3306

Offizielle Ergebnisse von CPU2000 werden seit dem 24.02.2007 vom SPEC-Konsortium nicht mehr publiziert. Seit August 2006 gibt es den Nachfolger CPU2006. Eine Test des Core 2 Extreme QX9650 mit CPU2006 finden Sie zum offiziellen Launch der CPU am 12. November 2007 bei TecChannel.

SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECfp_rate_base2000 beim Athlon 64 X2 sowie Athlon X2 BE (Dual-Core), Core 2 Duo/Extreme mit zwei Kopien sowie beim Core 2 Quad Q6600 und Extreme QX6700/6800/6850/9650 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von mehreren Kernen ausgenutzt.

SPECfp_rate_base2000: Der Benchmark benötigt viel Speicher, Intels Core 2 Extreme QX9650 arbeitet mit 18 Prozent höherer Performance gegenüber dem QX6850. Neben dem größerem 12-MByte-L2-Cache profitiert die neue 45-nm-CPU auch von Architekturerweiterungen wie Super Shuffle.

Offizielle Ergebnisse von CPU2000 werden seit dem 24.02.2007 vom SPEC-Konsortium nicht mehr publiziert. Seit August 2006 gibt es den Nachfolger CPU2006. Eine Test des Core 2 Extreme QX9650 mit CPU2006 finden Sie zum offiziellen Launch der CPU am 12. November 2007 bei TecChannel.

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 2.5 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Dual-Core-Prozessoren optimal. SunGard arbeitet überwiegend mit Integer-Operationen.

Schnelle Kalkulation: Die Speicher-Performance und die Geschwindigkeit des Prozessorbusses spielen eine untergeordnete Rolle. Auch die Cache-Größe von 8 MByte beim Core 2 Extreme QX6850 reicht aus. Der neue QX9650 arbeitet durch seinen Archtekturfeinschliff wie Fast Radix-16 fünf Prozent flinker als das 65-nm-Pendant.

Audio-Enkodieren: iTunes 6

Apples iTunes 6 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Nur beim MP3-Enkodieren nutzt iTunes 6 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Vertont: Weil iTunes nur zwei Threads beim Enkodieren nutzt, profitieren Intels Quad-Core-Modelle nicht von ihren vier Kernen. Durch den zusätzlichen Overhead, den Windows durch das wechselweise Verteilen der zwei Threads zwischen den vier Cores verursacht, enkodiert der QX6700 und QX6800 sogar etwas langsamer als die mit gleicher Taktfrequenz arbeitenden E6700 beziehungsweise X6800. Der neue Core 2 Extreme QX9650 kann aus seinen Architekturerweiterungen gegenüber dem 65-nm-QX6850 keinen Vorteil ziehen.

Video-Enkodieren: iTunes 6

Mit Apples iTunes 6 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 128 KBit/s und einer „mobilen“ Auflösung von 320 x 176 Bildpunkten. Dieses Video-Format ist für Apples iPod-Player optimiert. iTunes 6 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.

Kurzfilm: Beim Wandeln setzt sich der Core 2 Extreme QX9650 durch seine Architekturerweiterungen wie dem größeren Cache an die Spitze. Wie beim Audio-Enkodieren nutzt iTunes nur zwei Threads. Ein schnellerer FSB erwirkt nur einen minimalen Vorteil, wie der Vergleich der 2,66-GHz-Modelle Core 2 Duo E6700 (FSB1066) und E6750 (FSB1333) zeigt.

Rendering: 3ds Max 8

Discreet/Autodesk bietet mit 3ds Max 8 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 8 Multiprocessing voll aus. Die Dual- und Quad-Core- sowie Hyper-Threading-Technologien wirken somit beschleunigend.

Die verwendeten Render-Szenen basieren auf der Benchmark-Suite SPECapc for 3ds Max 7 von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle.

Szene Radiosity: Rendering zählt zur Paradedisziplin für Multicore-Prozessoren. Der 45-nm-Yorkfield berechnet die Szene 14 Prozent schneller als die 65-nm-Version Core 2 Extreme QX6850. Architekturerweitungen wie Super Shuffle für SSE-Daten sorgen für das Geschwindigkeitsplus.
Szene Underwater: Jetzt arbeitet der Core 2 Extreme QX9650 „nur noch“ acht Prozent schneller als der QX6850. Es wird deutlich, dass die Render-Performance der Prozessoren vom Workload - und somit der Cache-Größe - abhängig ist.

Rendering: CINEBENCH 9.5

Mit dem CINEBENCH 9.5 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 9.5 basiert auf Cinema 4D Release 9.5 und führt wieder Shading- und Raytracing-Tests durch.

Der Raytracing-Test von CINEBENCH 9.5 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen.

Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 9.5 wenig - der Test läuft überwiegend in den ersten beiden Cache-Stufen ab.

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet - Multicore nutzt hier nichts. Der 45-nm-Extreme QX9650 arbeitet 12 Prozent schneller als der 65-nm-QX6850 (beide 3,0 GHz und FSB1333). Verantwortlich zeigt die Super Shuffle Funktion, die SSE-Instruktionen ohne Änderungen an der Software beschleunigt.
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren – physikalischen und virtuellen – Prozessorkerne. Intels Quad-Core-Modelle deklassieren das restliche Feld. Der Core 2 Extreme QX9650 setzt seine Architekturerweiterungen in eine 9 Prozent höhere Performance gegenüber dem QX6850 um. Der größere L2-Cache bringt hier nichts.

Rendering & Enkodieren

In einem Multitask-Szenario führen wir das Rendering von CINEBENCH 9.5 bei einer konstanten Hintergrundlast durch. Diese realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File. Das Enkodieren erfolgt in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.

Beim Render-Vorgang nutzt CINEBENCH 9.5 alle zur Verfügung stehende Prozessorkerne. In der Tabelle sehen Sie, wie stark die Render-Performance einbricht, wenn eine konstante Hintergrundlast arbeitet.

Rendering & Enkodieren

Prozessor

CINEBENCH 1 Thread

CINEBENCH alle Threads

CINEBENCH alle Threads + LAME

Performance-Einbruch

Alle CINEBENCH-Ergebnisse in Punkten. Höhere Werte sind besser.

Athlon 64 X2 5200+

384

706

386

-45,3 %

Athlon 64 X2 6000+

449

837

433

-48,3 %

Athlon 64 X2 6400+

466

860

472

-45,1 %

Core 2 Duo E6700

445

831

427

-48,6 %

Core 2 Duo E6750

450

836

438

-47,6 %

Core 2 Q6600

394

1276

995

-22,0 %

Core 2 XE QX6850

492

1595

1222

-23,4 %

Core 2 XE QX9650

553

1740

1371

-21,2 %

Bei allen Dual-Core-CPUs bricht die Rendering-Performance um zirka 45 bis 49 Prozent ein, wenn LAME im Hintergrund enkodiert. Intels Quad-Core-Prozessoren rendern dagegen nur 22 bis 23 Prozent langsamer.

OpenGL: CINEBENCH 9.5

Der Leistungstest OpenGL-HW von CINEBENCH 9.5 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.

Eine Liga: Cinema 4D - und somit der Prozessor - übermittelt der Grafikkarte lediglich die Position der Lichtquellen sowie die Geometrie. Multicore erwirkt keinen Vorteil. Intels neuer Core 2 Extreme QX9650 profitiert von seinem größerem Cache und dem Architekturfeinschliff – gegenüber dem 65-nm-QX6850 gibt es 14 Prozent mehr Performance.

Beim Leistungstest OpenGL-SW übernimmt die Cinema-4D-Engine zusätzlich die Berechnung der Beleuchtung.

Lichtschalter: Jetzt muss der Prozessor zusätzliche Rechenarbeit übernehmen. Der grafikintensive Test zieht aus der Multicore-Technologie keinen Nutzen. Intels Core 2 Extreme QX9650 beschleunigt die Anwendung gegenüber dem 3,0-GHz-65-nm-Pendant um erstaunliche 23 Prozent.

OpenGL: SPECviewperf 9

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 9 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Highend-Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Lightscape, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualization Mockup und UGS NX.

Besonders die Anwendung Lightscape Viewset (light-08) nutzt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.

light-08: Multicore nutzt hier nichts. Der Core 2 Extreme QX9650 entlockt der Grafikkarte eine drei Prozent höhere Framerate gegenüber dem QX6850. Je nach 3D-Anwendung ermöglicht der Yorkfield-Prozessor aber bis zu 27 Prozent höhere Frameraten -wie bei UGS VisMockup (siehe Tabelle tcvis-01).

Die Einzelergebnisse von SPECviewperf 9 in der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist:

SPECviewperf 9

Prozessor

3dsmax-04

catia-02

ensight-03

light-08

maya-02

proe-04

sw-01

ugnx-01

tcvis-01

Alle Ergebnisse in fps. Höhere Werte sind besser.

Athlon 64 X2 6000+ AM2

11,90

14,01

12,43

12,75

13,64

9,31

18,42

10,31

5,01

Athlon 64 X2 6400+ AM2

12,35

14,65

12,86

13,62

14,65

9,86

19,61

10,68

5,21

Core 2 Duo E6700 DDR2-800

12,48

14,52

12,49

13,18

17,87

9,21

18,73

10,15

4,51

Core 2 Duo E6750 DDR2-800

12,72

14,55

12,79

13,78

18,53

9,23

18,86

10,52

4,51

Core 2 Quad Q6600 DDR2-800

11,95

13,76

12,09

12,10

16,76

8,84

18,19

9,88

4,46

Core 2 XE X6800 DDR2-800

12,66

14,98

12,82

14,32

18,92

9,51

19,05

10,34

4,51

Core 2 XE QX6800 DDR2-800

12,64

14,95

12,73

14,23

18,83

9,43

18,86

10,27

4,46

Core 2 XE QX6850 DDR2-800

12,68

15,04

12,99

14,86

19,15

9,63

19,05

10,55

4,52

Core 2 XE QX9650 DDR2-800

12,72

15,45

13,65

15,35

20,57

11,15

23,04

10,94

5,72

OpenGL & Enkodieren

In einem zweiten Multitask-Szenario überprüfen wir den Einbruch der Framerate des OpenGL-3D-Spiels Quake 4, wenn im Hintergrund MP3s erstellt werden. Das Enkodieren realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File - in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.

Quake 4 unterstützt durch ein aktivierbares SMP bereits Dual-Core-Prozessoren. In der Tabelle sehen Sie den Unterschied in der Framerate ohne und mit SMP-Aktivierung bei Quake 4. Bei aktiver LAME-Hintergrundlast lassen wir Quake 4 mit eingeschaltetem SMP laufen.

Rendering & Enkodieren

Prozessor

Quake 4 SMP off [fps]

Quake 4 SMP on [fps]

Quake 4 SMP on + LAME [fps]

Performance-Einbruch

Quake 4: Medium Quality, Auflösung 1024x768, AA off

Athlon 64 X2 6000+

82

115

102

-11,3 %

Athlon 64 X2 6400+

88

119

106

-10,9 %

Core 2 Duo E6400

83

116

104

-10,3 %

Core 2 Duo E6700

99

126

113

-10,3 %

Core 2 Duo E6750

103

127

119

-6,3 %

Core 2 Quad Q6600

91

124

124

0 %

Core 2 XE QX6800

104

128

128

0 %

Core 2 XE QX6850

107

129

129

0 %

Core 2 XE QX9650

115

132

132

0 %

Bei parallel arbeitenden Programmen mit abwechselnden Speicherzugriffen zeigt sich der Vorteil schneller Prozessorbusse. Intels Core 2 Duo E6750 mit FSB1333 lässt deshalb die Framerate von Quake 4 weniger sinken als der E6700 mit FSB1066.

Während aber die Dual-Core-Prozessoren mit Hintergrundlast um zirka 6 bis 11 Prozent in der Framerate einbrechen, bleibt die Quake-4-Performance des Core 2 Quad Q6600 und Extreme QX6800/6850/9650 konstant. Weil Quake nur von einem zweiten Prozessorkern profitiert, stehen bei den Quad-Core-Modellen zwei weitere Kerne anderen Applikationen voll zur Verfügung. Das Single-Thread-LAME-Enkodieren im Hintergrund wirkt sich bei den Vierkern-CPUs auf die Framerate somit nicht negativ aus.

DirectX: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

Gesamtwertung: Der Vorteil der Multicore-Technologie fließt in das Ergebnis ein. Die Grafikkarte arbeitet bei diesem Test „auf Anschlag“. Der Vorteil der Penryn-Architektur schlägt sich deshalb nur marginal in höheren Frameraten nieder.

3Dmark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

CPU-Test: Ohne Hilfe der Grafikkarte spurtet der Core 2 Extreme QX9650 dem 65-nm-QX6850 um sechs Prozent mehr Performance davon.

Energieverbrauch

AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.

Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte, Soundkarte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows im „Leerlauf“ ohne aktivierten Energiesparmodus:

Regungslos: Läuft nur der Windows-Desktop ohne CPU-Belastung, so spart der 45-nm-Extreme 22 Watt gegenüber den Core 2 Extreme QX6850 ein. Beide 3,0-GHz-Quad-Core-CPUs sind mit 130 Watt TDP spezifiziert.

Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD PowerNow! (Cool’n’Quiet) zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:

Sparfüchse: Aktiviert man bei AMD PowerNow!, so arbeitet der Athlon 64 X2 6400+ mit 1000 MHz Taktfrequenz und deutlich genügsamer. Bei den Intel-CPUs sinkt der Energiebedarf im Leerlauf mit SpeedStep nur marginal, weil bei den Prozessoren bereits andere Powersave-Technologien greifen. SpeedStep hilf bei den Intel-CPUs Energie zu sparen, wenn die Prozessorauslastung im „mittleren“ Bereich liegt.

Sind die Prozessoren, der Speicher sowie die Grafikkarte unter hoher Last, so steigt der Energiebedarf der Plattformen auf folgende Werte:

Full Power: Unter Volllast benötigt die Intel-Plattform mit dem Core 2 Extreme QX9650 satte 53 Watt weniger Energie als mit dem 65-nm-Modell QX6850. Die 45-nm-Quad-Core-CPU bleibt vom spezifizierten TDP-Wert von 130 Watt deutlich weiter entfernt als der 65-nm-QX6850.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 08. Oktober 2007 die letzten Änderungen. Intels Preisliste wurde am 05. September 2007 aktualisiert. Der neue Core 2 Extreme QX9650 wird erst zum offiziellen Launch am 12. November 2007 in den Listen geführt.

OEM- und Straßenpreise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Socket AM2

Athlon 64 X2 6400+ Black Edition

3200 / 1000

220

190

Athlon 64 X2 6000+

3000 / 1000

167

140

Athlon 64 X2 5600+

2800 / 1000

146

120

Athlon 64 X2 5200+

2600 / 1000

125

105

Athlon 64 X2 5000+ Black Edition

2600 / 1000

136

125

Athlon 64 X2 5000+ 65 nm

2600 / 1000

115

100

Athlon 64 X2 4800+ 65 nm

2500 / 1000

104

90

Athlon 64 X2 4400+ 65 nm

2300 / 1000

89

75

Athlon 64 X2 4200+

2200 / 1000

78

75

Athlon 64 X2 4000+ 65 nm

2100 / 1000

68

60

LGA775

Core 2 Extreme QX9650

3000 / 1333

999

noch nicht verfügbar

Core 2 Extreme QX6850

3000 / 1333

999

900

Core 2 Extreme QX6800

2930 / 1066

999

900

Core 2 Extreme QX6700

2670 / 1066

999

900

Core 2 Extreme X6800

2930 / 1066

999

850

Core 2 Quad Q6700

2670 / 1066

530

500

Core 2 Quad Q6600

2400 / 1066

266

245

Core 2 Duo E6850

3000 / 1333

266

240

Core 2 Duo E6750

2670 / 1333

183

165

Core 2 Duo E6700

2670 / 1066

316

285

Core 2 Duo E6600

2400 / 1066

224

205

Core 2 Duo E6550

2330 / 1333

163

150

Core 2 Duo E6400

2130 / 1066

183

160

Core 2 Duo E6300

1860 / 1066

163

150

Core 2 Duo E4400

2000 / 800

113

105

Core 2 Duo E4300

1800 / 800

113

100

TecChannel Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Intel demonstriert mit seiner nächsten Desktop-CPU-Generation „Yorkfield“ schon vor dem offiziellen Launch, dass sich die Performance der ohnehin schnellen Core-2-Prozessoren nochmals deutlich steigern lässt.

Bei fast allen Anwendungen arbeitet der Core 2 Extreme QX9650 mit 3,0 GHz Taktfrequenz zwischen fünf und teilweise über 20 Prozent schneller als das 65-nm-Pendant QX6850. Die SSE4-Erweiterung ist bei diesen Performance-Steigerungen noch nicht berücksichtigt. Der von 8 auf 12 MByte vergrößerte L2-Cache sorgt bei speicherintensiven Applikationen einerseits für einige Prozentpunkte mehr Geschwindigkeit. Architekturfeinschliff wie das neue Super Shuffle und Fast Radix-16 beschleunigen aber auch wenig speicherlastige Applikationen wie unsere Rendering-Benchmarks um über 10 Prozent.

Zudem bieten die 45-nm-Prozessoren mit ihrer SSE4-Erweiterung bei künftigen optimierten Anwendungen weiteres Geschwindigkeitspotenzial. DivX-Enkodieren soll mit SSE4 laut Intel 63 Prozent mehr Performance ermöglichen. Auch in der Taktfrequenz lässt sich Intel noch Luft nach oben. Und obwohl der Core 2 Extreme QX9850 wie sein 65-nm-Vorgänger mit 130 Watt TDP spezifiziert ist, arbeitet die CPU deutlich sparsamer. Bereits im „Leerlauf“ spart der Yorkfield gegenüber dem Core 2 Extreme QX6850 über 20 Watt, unter Vollast mehr als 50 Watt.

Zum offiziellen Launch des Core 2 Extreme QX9650 am 12. November 2007 bieten wir Ihnen auf TecChannel neue Benchmark-Analysen der Penryn-Architektur an. Konkurrenz gibt es für den 45-nm-Prozessor derzeit nicht. Spannend wird es aber im November wieder, denn AMDs Phenom mit K10-Quad-Core-Architektur geht dann an den Start. (cvi)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows XP Professional SP2 durchgeführt.

Intels Core 2 Extreme QX9650 nimmt in einem Asus Formula Maximus mit X38-Express-Chipsatz Platz. Den Core 2 Extreme QX6850 und Core 2 Duo E6750 testen wir in Intels FSB1333-Mainboard DP35DP mit P35-Express-Chipsatz. Die übrigen Core-2-Duo-Modelle sowie der Core 2 Quad Q6600 und Extreme QX6700/6800 nehmen in einem Intel D975XBX2 mit 975X-Chipsatz Platz. Als Arbeitsspeicher steht jeweils DDR2-800-SDRAM mit CL4 in einer Dual-Channel-Konfiguration zur Verfügung.

AMDs Athlon-Modelle für den Socket AM2 testen wir in einem Asus M2N32-SLI Deluxe mit nForce-590-SLI-Chipsatz. Der CPU steht Dual-Channel-DDR2-800-SDRAM mit CL4 von Corsair zur Verfügung.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer ATI Radeon X1900XTX in der PCI-Express-x16-Variante bestückt. Der Grafikkarte mit 512 MByte Grafikspeicher standen der Catalyst-Treiber 6.4 sowie DirectX 9.0c zur Seite. Einheit herrschte auch beim Arbeitsspeicher mit jeweils 1 GByte und den Massenspeichern - die Serial-ATA-II-Festplatte Maxtor MaxLine III mit 250 GByte Kapazität.