Anfang November 2006 stellte Intel mit dem Core 2 Extreme QX6700 seinen ersten Quad-Core-Prozessor für Desktop-PCs vor. Der Preis des Vierkerners liegt auf dem bekannten „Extreme-Niveau“ von knapp 1000 Euro. Viel Geld, aber die entsprechende Rechenleistung entlohnt. Immerhin rechnet ein Desktop-PC mit dem QX6700 so schnell wie bisherige Workstations mit zwei Dual-Core-Prozessoren.
Noch im Laufe des Januar 2007 legt Intel mit dem neuen Core 2 Quad Q6600 eine günstigere Quad-Core-Variante nach. „Günstig“ ist natürlich relativ, denn 851 US-Dollar Listenpreis sind immer noch eine Menge Geld. Beim Q6600er schraubt Intel dafür die Taktfrequenz etwas runter: 2,40 GHz bei unveränderter FSB-Geschwindigkeit von 1066 MHz.
Die Cache-Dimensionierung des aus zwei Siliziumplättchen Marke "Core 2 Duo" gefertigten Core 2 Quad Q6600 bleibt unangetastet. Entsprechend verfügt die CPU über insgesamt 8 MByte L2-Cache. Jeweils zwei Kerne pro Die nutzen 4 MByte gemeinsam.
Dank der reduzierten Taktfrequenz begnügt sich der 2,40-GHz-Vierkerner allerdings mit weniger Energie. Der CPU-Lüfter muss nur noch für 105 Watt statt der 130 Watt beim Core 2 Extreme QX6700 spezifiziert sein. Die 2,40-GHz-Dual-Core-Variante Core 2 Duo E6600 konsumiert zum Vergleich 65 Watt im Maximum. Der Aufschlag hält sich für eine Kernverdopplung bei gleicher Taktfrequenz noch in Grenzen.
Im tecCHANNEL-Testlabor tritt der neue Core 2 Quad Q6600 gegen den Core 2 Extreme QX6700 und die Dual-Core-Modelle von AMD und Intel an. Bei multithreaded programmierten Anwendungen und Multitask-Szenarien bietet Intels neuer Quad-Core-Prozessor selbst mit seiner reduzierten Taktfrequenz eine beeindruckende Performance.
SYSmark2004 SE
Mit dem Benchmark-Paket SYSmark2004 SE bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Die Second Edition verwendet wieder 17 Anwendungen und arbeitet wahlweise mit den Windows XP in der 32- und 64-Bit-Edition zusammen. SYSmark2004 SE öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.
Neben einem Gesamtwert für die Systemleistung bietet SYSmark2004 SE detaillierte Ergebnisse in den Kategorien Office Productivity und Internet Content Creation an.
SYSmark2004 SE: Internet Content Creation
Im Workload Internet Content Creation von SYSmark2004 SE sind Prozessoren mit schnellen FPUs im Vorteil. Die Anwendungen im diesem Testblock unterstützen zudem in hohem Maße SSE2 und Multiprocessing. Zu den Applikationen des Workloads Internet Content Creation zählen Macromedia Dreamweaver und Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 und Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 sowie McAfee VirusScan 7.0.1.
SYSmark2004 SE: Office Productivity
Der Workload Office Productivity in SYSmark2004 SE verwendet insgesamt zehn verschiedene Applikationen. Hierzu zählen Microsofts Word, Excel, PowerPoint, Access und Outlook in der Version 2002, McAfee VirusScan 7.0, ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 sowie der Internet Explorer 6.0.
SPECint_base2000
Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intels C++ 9.1 und Fortran 9.1 sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.
Der SPECint_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.
In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks im Vergleich:
Prozessor |
Core 2 Quad Q6600 |
Core 2 XE QX6700 |
Core 2 Duo E6700 |
Core 2 XE X6800 |
---|---|---|---|---|
Taktfrequenz |
2,40 GHz |
2,66 GHz |
2,66 GHz |
2,93 GHz |
Sockel |
LGA775 |
LGA775 |
LGA775 |
LGA775 |
Core |
Kentsfield |
Kentsfield |
Conroe |
Conroe |
Speichertyp |
DDR2-800 |
DDR2-800 |
DDR2-800 |
DDR2-800 |
Chipsatz |
975X |
975X |
975X |
975X |
Compiler |
Intel |
Intel |
Intel |
Intel |
Test |
||||
164.gzip |
1491 |
1652 |
1653 |
1817 |
175.vpr |
1961 |
2153 |
2152 |
2349 |
176.gcc |
2787 |
3077 |
3076 |
3367 |
181.mcf |
4530 |
4896 |
4902 |
5253 |
186.crafty |
2221 |
2468 |
2467 |
2722 |
197.parser |
1886 |
2090 |
2089 |
2297 |
252.eon |
3138 |
3488 |
3487 |
3811 |
253.perlbmk |
2720 |
3092 |
3111 |
3384 |
254.gap |
2604 |
2848 |
2854 |
3093 |
255.vortex |
4111 |
4499 |
4504 |
4909 |
256.bzip2 |
1931 |
2111 |
2149 |
2362 |
300.twolf |
2752 |
3062 |
3056 |
3365 |
Gesamt |
2549 |
2814 |
2820 |
3082 |
SPECint_rate_base2000
Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.
So läuft SPECint_rate_base2000 beim Athlon 64 mit einer Kopie, beim Athlon 64 X2 sowie FX-60/62 (Dual-Core), Core 2 Duo/Extreme, Core Duo, Pentium 4 (Hyper-Threading), Pentium D (Dual-Core) mit zwei Kopien sowie beim Pentium Extreme Edition 965 (Dual-Core + Hyper-Threading) und Core 2 Quad Q6600 und Extreme QX6700 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von Hyper-Threading und mehreren Kernen ausgenutzt. Bei Singlethread-Prozessoren wie dem Athlon 64 führen SPECint_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.
SPECfp_base2000
Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.1 und MS Visual Studio 2005 .NET sowie Intel Fortran 9.1 für alle Fließkommatests. Bei den AMD-Prozessoren testen wir die Floating-Point-Performance zusätzlich mit den PGI-6.0-Compilern. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.
Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.
In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks im Vergleich:
Prozessor |
Core 2 Quad Q6600 |
Core 2 XE QX6700 |
Core 2 Duo E6700 |
Core 2 XE X6800 |
---|---|---|---|---|
Taktfrequenz |
2,40 GHz |
2,66 GHz |
2,66 GHz |
2,93 GHz |
Sockel |
LGA775 |
LGA775 |
LGA775 |
LGA775 |
Core |
Kentsfield |
Kentsfield |
Conroe |
Conroe |
Speichertyp |
DDR2-800 |
DDR2-800 |
DDR2-800 |
DDR2-800 |
Chipsatz |
975X |
975X |
975X |
975X |
Compiler |
Intel |
Intel |
Intel |
Intel |
Test |
||||
168.wupwise |
4240 |
4458 |
4477 |
4680 |
171.swim |
2934 |
2961 |
3002 |
3022 |
172.mgrid |
1596 |
1740 |
1747 |
1885 |
173.applu |
2099 |
2193 |
2227 |
2301 |
177.mesa |
2366 |
2620 |
2627 |
2885 |
178.galgel |
5787 |
6420 |
6418 |
7046 |
179.art |
8308 |
9224 |
9229 |
10221 |
183.equake |
2927 |
3055 |
3055 |
3149 |
187.facerec |
2575 |
2818 |
2836 |
3079 |
188.ammp |
1806 |
1993 |
1995 |
2181 |
189.lucas |
2584 |
2726 |
2786 |
2897 |
191.fma3d |
1896 |
2032 |
2041 |
2167 |
200.sixtrack |
963 |
1070 |
1069 |
1175 |
301.apsi |
1686 |
1837 |
1830 |
1975 |
Gesamt |
2558 |
2756 |
2770 |
2958 |
SPECfp_rate_base2000
Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.
So läuft SPECfp_rate_base2000 beim Athlon 64 mit einer Kopie, beim Athlon 64 X2 sowie FX-60/62 (Dual-Core), Core 2 Duo/Extreme, Core Duo, Pentium 4 (Hyper-Threading), Pentium D (Dual-Core) mit zwei Kopien sowie beim Pentium Extreme Edition 965 (Dual-Core + Hyper-Threading) und Core 2 Quad Q6600 und Extreme QX6700 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von Hyper-Threading und mehreren Kernen ausgenutzt. Bei Singlethread-Prozessoren wie dem Athlon 64 führen SPECfp_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.
Linux 64 Bit: Linpack
Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben. Linpack löst komplexe lineare Gleichungssysteme.
Unter SUSE Linux 10.1 64-Bit-Edition setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Athlon-64-Prozessoren mit SSE3 arbeiten mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen und nutzen die Befehlserweiterung.
Bei unseren Tests löst Linpack bis zu 10.000 Gleichungssysteme. Damit benötigt der Benchmark maximal 763 GByte Arbeitsspeicher. Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.
Analyse: SunGard ACR
SunGards Adaptiv Credit Risk 2.5 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.
SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Dual-Core-Prozessoren optimal. SunGard arbeitet überwiegend mit Integer-Operationen.
Audio-Enkodieren: iTunes 6
Apples iTunes 6 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Nur beim MP3-Enkodieren nutzt iTunes 6 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus.
Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.
Der Pentium Extreme Edition 965 zieht aus seinen vier „virtuellen“ Kernen (Dual-Core + Hyper-Threading) ebenfalls keinen Nutzen. Deshalb arbeitet ein Pentium D 960 (Dual-Core, kein Hyper-Threading) trotz geringerer Taktfrequenz hier schneller.
Video-Enkodieren: iTunes 6
Mit Apples iTunes 6 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 128 KBit/s und einer „mobilen“ Auflösung von 320 x 176 Bildpunkten. Dieses Video-Format ist für Apples iPod-Player optimiert. iTunes 6 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.
Rendering: 3ds Max 8
Discreet/Autodesk bietet mit 3ds Max 8 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 8 Multiprocessing voll aus. Die Dual- und Quad-Core- sowie Hyper-Threading-Technologien wirken somit beschleunigend.
Die verwendeten Render-Szenen basieren auf der Benchmark-Suite SPECapc for 3ds Max 7 von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle.
Rendering: CINEBENCH 9.5
Mit dem CINEBENCH 9.5 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 9.5 basiert auf Cinema 4D Release 9.5 und führt wieder Shading- und Raytracing-Tests durch.
Der Raytracing-Test von CINEBENCH 9.5 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen.
Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 9.5 wenig - der Test läuft überwiegend in den ersten beiden Cache-Stufen ab.
Rendering & Enkodieren
In einem Multitask-Szenario führen wir das Rendering von CINEBENCH 9.5 bei einer konstanten Hintergrundlast durch. Diese realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File. Das Enkodieren erfolgt in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.
Beim Render-Vorgang nutzt CINEBENCH 9.5 alle zur Verfügung stehende Prozessorkerne. In der Tabelle sehen Sie, wie stark die Render-Performance einbricht, wenn eine konstante Hintergrundlast arbeitet.
Prozessor |
CINEBENCH 1 Thread |
CINEBENCH alle Threads |
CINEBENCH alle Threads + LAME |
Performance-Einbruch |
---|---|---|---|---|
Alle CINEBENCH-Ergebnisse in Punkten. Höhere Werte sind besser. | ||||
Athlon 64 FX-60 S939 |
380 |
707 |
383 |
-45,8 % |
Athlon 64 FX-62 |
412 |
759 |
406 |
-46,5 % |
Athlon 64 X2 4000+ |
295 |
552 |
296 |
-46,4 % |
Athlon 64 X2 4600+ EE |
353 |
651 |
346 |
-46,9 % |
Athlon 64 X2 4800+ |
354 |
656 |
353 |
-46,2 % |
Athlon 64 X2 4800+ S939 |
354 |
655 |
350 |
-46,6 % |
Athlon 64 X2 5000+ |
381 |
707 |
386 |
-45,4 % |
Athlon 64 X2 5200+ |
384 |
706 |
386 |
-45,3 % |
Core 2 Duo E6400 |
356 |
663 |
341 |
-48,6 % |
Core 2 Duo E6700 |
445 |
831 |
427 |
-48,6 % |
Core 2 Q6600 |
394 |
1276 |
995 |
-22,0 % |
Core 2 XE QX6700 |
436 |
1417 |
1090 |
-23,1 % |
Core 2 XE X6800 |
491 |
908 |
472 |
-48,0 % |
Core Duo T2600 |
325 |
604 |
315 |
-47,8 % |
Pentium 4 670 |
322 |
378 |
204 |
-46,0 % |
Pentium D 920 |
239 |
439 |
233 |
-46,9 % |
Pentium D 960 |
305 |
557 |
304 |
-45,4 % |
Pentium XE 965 |
318 |
652 |
526 |
-19,3 % |
Bei allen Dual-Core-CPUs bricht die Rendering-Performance um zirka 45 bis 48 Prozent ein, wenn LAME im Hintergrund enkodiert. Die Quad-Core-Prozessoren Core 2 Quad Q6600 und Extreme QX6700 rendern dagegen nur 22 bis 23 Prozent langsamer. Intels Pentium Extreme 965 reduziert seine Render-Performance mit 19 Prozent noch geringer. Die Dual-Core-CPU präsentiert sich dem Betriebssystem durch sein Hyper-Threading ebenfalls als Vierkerner. Während beim QX6700 das Enkodieren aber mit voller Performance erfolgt, arbeitet LAME beim Pentium XE 965 deutlich langsamer – die Priorität der Rechenleistung liegt bei CINEBENCH.
OpenGL: CINEBENCH 9.5
Der Leistungstest OpenGL-HW von CINEBENCH 9.5 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.
Beim Leistungstest OpenGL-SW übernimmt die Cinema-4D-Engine zusätzlich die Berechnung der Beleuchtung.
OpenGL: SPECviewperf 9
Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 9 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Highend-Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Lightscape, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualzation Mockup und UGS NX.
Besonders die Anwendung Lightscape Viewset (light-08) nutzt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.
Die Einzelergebnisse der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist. Während bei light-08 beispielsweise Athlon 64 FX-62 vor dem Pentium XE 965 liegt, harmoniert beim Maya-basierenden Test maya-02 Intels Extreme Edition wesentlich besser mit der Grafikkarte als der FX-62. Die Core-2-CPUs dagegen bei fast allen Applikationen unangefochten vorne.
Alle Einzelergebnisse des SPECviewperf 9 finden Sie in der Tabelle:
Prozessor |
3dsmax-04 |
catia-02 |
ensight-03 |
light-08 |
maya-02 |
proe-04 |
sw-01 |
ugnx-01 |
tcvis-01 |
---|---|---|---|---|---|---|---|---|---|
Alle Ergebnisse in fps. Höhere Werte sind besser. | |||||||||
Athlon 64 4000+ S939 |
9,78 |
10,81 |
9,84 |
9,85 |
10,97 |
6,34 |
12,33 |
8,64 |
2,94 |
Athlon 64 X2 4000+ AM2 |
8,75 |
9,79 |
9,39 |
8,62 |
9,75 |
5,94 |
11,75 |
8,34 |
2,87 |
Athlon 64 X2 4800+ S939 |
10,05 |
11,14 |
10,10 |
10,12 |
10,99 |
6,39 |
12,32 |
8,78 |
2,89 |
Athlon 64 X2 4800+ AM2 |
10,25 |
11,45 |
10,25 |
10,31 |
11,37 |
6,54 |
12,65 |
8,96 |
2,98 |
Athlon 64 FX-60 S939 |
10,62 |
11,78 |
10,42 |
10,90 |
11,75 |
6,65 |
12,64 |
9,02 |
2,92 |
Athlon 64 FX-62 AM2 |
11,52 |
12,80 |
11,03 |
11,96 |
12,88 |
7,08 |
13,43 |
9,45 |
3,06 |
Core 2 Duo E6700 DDR2-800 |
12,48 |
14,52 |
12,49 |
13,18 |
17,87 |
9,21 |
18,73 |
10,15 |
4,51 |
Core 2 Quad Q6600 DDR2-800 |
11,95 |
13,76 |
12,09 |
12,10 |
16,76 |
8,84 |
18,19 |
9,88 |
4,46 |
Core 2 XE QX6700 DDR2-800 |
12,45 |
14,51 |
12,43 |
13,16 |
17,81 |
9,19 |
18,71 |
10,09 |
4,51 |
Core 2 XE X6800 DDR2-800 |
12,66 |
14,98 |
12,82 |
14,32 |
18,92 |
9,51 |
19,05 |
10,34 |
4,51 |
Core Duo T2600 |
9,56 |
10,74 |
10,56 |
9,29 |
12,59 |
7,05 |
14,62 |
7,46 |
3,76 |
Pentium 4 670 |
10,48 |
11,75 |
11,48 |
10,80 |
14,35 |
7,59 |
15,81 |
8,77 |
4,13 |
Pentium D 920 |
8,05 |
9,01 |
10,14 |
8,24 |
11,42 |
6,19 |
13,34 |
7,56 |
3,80 |
Pentium D 960 |
9,81 |
11,00 |
11,16 |
10,10 |
13,28 |
7,29 |
15,31 |
8,53 |
4,10 |
Pentium XE 965 |
10,48 |
11,73 |
11,56 |
10,75 |
14,60 |
7,91 |
16,27 |
8,91 |
4,26 |
OpenGL & Enkodieren
In einem zweiten Multitask-Szenario überprüfen wir den Einbruch der Framerate des OpenGL-3D-Spiels Quake 4, wenn im Hintergrund MP3s erstellt werden. Das Enkodieren realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File - in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.
Quake 4 unterstützt durch ein aktivierbares SMP bereits Dual-Core-Prozessoren. In der Tabelle sehen Sie den Unterschied in der Framerate ohne und mit SMP-Aktivierung bei Quake 4. Bei aktiver LAME-Hintergrundlast lassen wir Quake 4 mit eingeschaltetem SMP laufen.
Prozessor |
Quake 4 SMP off [fps] |
Quake 4 SMP on [fps] |
Quake 4 SMP on + LAME [fps] |
Performance-Einbruch |
---|---|---|---|---|
Quake 4: Medium Quality, Auflösung 1280x1024, AA off | ||||
Athlon 64 X2 4600+ EE |
70 |
104 |
89 |
-14,4 % |
Athlon 64 X2 5000+ |
71 |
105 |
92 |
-12,4 % |
Athlon 64 X2 5200+ |
74 |
108 |
94 |
-13,0 % |
Core 2 Duo E6400 |
83 |
116 |
104 |
-10,3 % |
Core 2 Duo E6700 |
99 |
126 |
113 |
-10,3 % |
Core 2 Quad Q6600 |
91 |
124 |
124 |
0 % |
Core 2 XE QX6700 |
97 |
126 |
126 |
0 % |
Während die Dual-Core-Prozessoren mit Hintergrundlast um zirka 10 bis 14 Prozent in der Framerate einbrechen, bleibt die Quake-4-Performance des Core 2 Quad Q6600 und Extreme QX6700 konstant. Weil Quake nur von einem zweiten Prozessorkern profitiert, stehen bei den Quad-Core-Modellen zwei weitere Kerne anderen Applikationen voll zur Verfügung. Das Single-Thread-LAME-Enkodieren im Hintergrund wirkt sich beim Core 2 Extreme QX6700 auf die Framerate somit nicht negativ aus.
DirectX: 3DMark06
Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.
3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.
3Dmark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.
32-Bit-Transfer
Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.
64-Bit-Transfer
Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.
128-Bit-Transfer
Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.
Energieverbrauch
AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.
Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte, Soundkarte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.
Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows im „Leerlauf“ ohne aktivierten Energiesparmodus:
Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD PowerNow! (Cool’n’Quiet) zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:
Sind die Prozessoren, der Speicher sowie die Grafikkarte unter hoher Last, so steigt der Energiebedarf der Plattformen auf folgende Werte:
Listen- & Straßenpreise
Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 05. Dezember 2006 die letzten Änderungen. Intels Preisliste wurde am 24. Dezember 2006 aktualisiert.
Modell |
Taktfrequenz /FSB [MHz] |
Listenpreis [US-Dollar] |
Straßenpreis [Euro] |
---|---|---|---|
Socket 939 |
|||
Athlon 64 3200+ S939 |
2000 / 1000 |
81 |
60 |
Athlon 64 3500+ S939 |
2200 / 1000 |
91 |
70 |
Athlon 64 3800+ S939 |
2400 / 1000 |
108 |
80 |
Athlon 64 X2 4200+ S939 |
2200 / 1000 |
187 |
175 |
Athlon 64 X2 4600+ S939 |
2400 / 1000 |
240 |
230 |
Socket AM2 |
|||
Athlon 64 FX-62 |
2800 / 1000 |
713 |
700 |
Athlon 64 X2 5200+ |
2600 / 1000 |
403 |
280 |
Athlon 64 X2 5000+ |
2600 / 1000 |
301 |
245 |
Athlon 64 X2 5000+ EE 65 nm |
2600 / 1000 |
301 |
k.A. |
Athlon 64 X2 4800+ EE 65 nm |
2500 / 1000 |
271 |
k.A. |
Athlon 64 X2 4600+ |
2400 / 1000 |
240 |
195 |
Athlon 64 X2 4600+ EE |
2400 / 1000 |
240 |
200 |
Athlon 64 X2 4400+ EE 65 nm |
2300 / 1000 |
214 |
k.A. |
Athlon 64 X2 4200+ |
2200 / 1000 |
187 |
140 |
Athlon 64 X2 4200+ EE |
2200 / 1000 |
187 |
140 |
Athlon 64 X2 4000+ EE 65 nm |
2100 / 1000 |
169 |
k.A. |
Athlon 64 X2 3800+ |
2000 / 1000 |
152 |
110 |
Athlon 64 X2 3800+ EE |
2000 / 1000 |
152 |
110 |
Athlon 64 X2 3800+ EE SFF |
2000 / 1000 |
k.A. |
k.A. |
Athlon 64 3800+ |
2400 / 1000 |
108 |
100 |
Athlon 64 3500+ |
2200 / 1000 |
91 |
80 |
Athlon 64 3500+ EE SFF |
2200 / 1000 |
k.A. |
k.A. |
Athlon 64 3200+ |
2000 / 1000 |
81 |
70 |
LGA775 |
|||
Core 2 Extreme QX6700 |
2670 / 1066 |
999 |
965 |
Core 2 Extreme X6800 |
2930 / 1066 |
999 |
960 |
Core 2 Quad Q6600 |
2400 / 1066 |
851 |
k.A. |
Core 2 Duo E6700 |
2670 / 1066 |
530 |
485 |
Core 2 Duo E6600 |
2400 / 1066 |
316 |
300 |
Core 2 Duo E6400 |
2130 / 1066 |
224 |
210 |
Core 2 Duo E6300 |
1860 / 1066 |
183 |
170 |
Pentium D 945 (kein VT) |
3400 / 800 |
163 |
155 |
Pentium D 925 (kein VT) |
3000 / 800 |
133 |
125 |
Pentium D 915 (kein VT) |
2800 / 800 |
113 |
110 |
Pentium D 820 |
2800 / 800 |
93 |
90 |
Produkte |
Info-Link |
---|---|
Prozessoren |
Fazit
Der Performance-Gewinn vom Dual-Core zum Quad-Core erreicht bei Anwendungen wie Rendering und Simulationen bis zu 94 Prozent. Mehr ist bei multi-thread-optimierten Anwendungen aufgrund des Amdahl-Gesetzes kaum möglich. Dieses Ergebnis war allerdings zu erwarten, 2-Sockel-Systeme skalieren beim Einsatz einer zweiten Dual-Core-CPU ähnlich.
Der neue Core 2 Quad Q6600 arbeitet bei 10 Prozent geringerer Taktfrequenz meist nur einige Prozent langsamer als der Core 2 Extreme QX6700 – besonders bei speicherintensiven Applikationen. Und obwohl der neue Vierkerner „nur“ mit 2,40 GHz Taktfrequenz arbeitet, zieht er selbst einem zweikernigen Core 2 Extreme X6800 mit 2,93 GHz bei multithreaded agierenden Applikationen mit bis zu 56 Prozent mehr Rechenleistung davon.
Natürlich bleibt wieder einmal die Frage nach den Applikationen, die bereits vier Threads nutzen. Apples iTunes verwendet beim Erstellen von MP3s beispielsweise nur zwei Threads. Ähnlich verhält es sich bei mancher Software zum Enkodieren/Dekodieren von Videos. Andererseits gibt es natürlich bereits genügend Anwendungen, die die Vorteile eines Quad-Core-Prozessors voll ausnutzen. Der Trend geht, auch bei 3D-Spielen, klar in Richtung vieler paralleler Threads.
Außerdem gibt es die Multitasking-Szenarios mit vielen parallel arbeitenden Anwendungen. Ob und wie es in der Praxis vorkommt, dass gleichzeitig MP3s erstellt, Sendungen vom DVB-T-Tuner aufgenommen werden und parallel noch ein Spiel läuft, mag sich jeder selbst fragen. Im Business-Einsatz sind parallel agierende Anwendungen wie E-Mail-Client, Virenscanner, Word, Excel und diversen Browser-Fenstern bereits üblich. Fakt ist dabei, je mehr Cores vorhanden sind und je mehr Multi-thread-Anwendungen und Multi-Task-Szenarien zum Einsatz kommen, desto flinker und mit besseren Antwortzeiten geht es mit einem Quad-Core-Prozessor vonstatten.
So kann in einem Quad-Core-System beispielsweise iTunes (2 Threads) im Hintergrund MP3 erstellen und ein Webcast im Browser laufen (1 Thread), die Rechenkraft eines weiterer Kerns steht anderen Anwendungen trotzdem voll zur Verfügung. In den seltener werden Single-Thread-Anwendungen arbeitet der Core 2 Quad Q6600 aufgrund seiner geringeren Taktfrequenz natürlich etwas langsamer als die Dual-Core-Modelle. Doch selbst bei den 2,40 GHz des Q6600 bietet Intels Core-Architektur deutlich mehr Rechenleistung als die Konkurrenz. (cvi)
Testkonfiguration
Wir haben die Benchmarks unter dem Betriebssystem Windows XP Professional SP2 durchgeführt. Für den Linux-Test verwenden wir SUSE Linux 10.1 in der x86_64-Edition.
Intels Core 2 Duo E6700, Core 2 Extreme X6800, Pentium Extreme Edition 965, die Pentium-D-900-Modelle sowie der Pentium 4 670 nehmen in einem Intel-Desktop-Board D975XBX Platz. Den Core 2 Quad Q6600 und Extreme QX6700 testeten wir in der neuen Board-Revision D975XBX2. Die Mainboards verwenden den 975X-Chipsatz. Als Arbeitsspeicher steht jeweils DDR2-667-SDRAM mit CL4 in einer Dual-Channel-Konfiguration zur Verfügung. Die Core-2-Modelle haben wir mit DDR2-800-Speicher (CL4) getestet.
Der Core Duo T2600 arbeitet in einem AOpen i975Xa-YDG mit Intels 975X-Express-Chipsatz und Socket 479M.
AMDs Athlon-64-Modelle für den Socket AM2 testen wir in einem Asus M2N32-SLI Deluxe mit nForce-590-SLI-Chipsatz. Der CPU steht Dual-Channel-DDR2-800-SDRAM mit CL4 von Corsair zur Verfügung. AMDs Socket-939-Prozessoren arbeiten in einem MSI K8N Diamond Plus mit NVIDIAs nForce 4 SLI. Der Chipsatz unterstützt HyperTransport-Taktfrequenzen bis 1000 MHz sowie PCI Express. Auf dem MSI-Mainboard können die AMD64-CPUs auf DualDDR400-SDRAM CL2 zurückgreifen.
Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer ATI Radeon X1900XTX in der PCI-Express-x16-Variante bestückt. Der Grafikkarte mit 512 MByte Grafikspeicher standen der Catalyst-Treiber 6.4 sowie DirectX 9.0c zur Seite. Einheit herrschte auch beim Arbeitsspeicher mit jeweils 1 GByte und den Massenspeichern - die Serial-ATA-II-Festplatte Maxtor MaxLine III mit 250 GByte Kapazität.