Optimale Desktop-Performance mit acht 3,2-GHz-Kernen

Test: Intel Skulltrail mit zwei Core 2 Extreme QX9775

04.02.2008 von Christian Vilsbeck
Zwei 45-nm-Quad-Core-Prozessoren mit Penryn-Architektur sowie vier GPUs bilden Intels neue Skulltrail-Plattform für PC-Enthusiasten. Mit der Rechenpower der neuen 3,2-GHz-Quad-Core-Prozessoren mit ihren acht Kernen düpiert Intel den Quad-Core-Phenom von AMD nach Belieben.

Mangel an Performance lässt sich Intels Core-2-Prozessoren nicht vorwerfen. Mit den Quad-Core-Modellen düpiert Intel die vierkernigen Phenoms von AMD nach Belieben. Selbst das mehr als ein Jahr alte Quad-Core-Einstiegsmodell ist einem Phenom 9900 ebenbürtig – das künftige AMD-Topmodell gibt es zudem erst im zweiten Quartal 2008. Zusätzlich stolpert AMD durch den TLB-Bug noch über sich selbst.

Jetzt setzt Intel mit einer Plattform für PC-Enthusiasten noch einen drauf. „Skulltrail“ unterstützt zwei 45-nm-Quad-Core-Prozessoren mit Penryn-Architektur sowie vier GPUs. Das Konzept klingt bekannt: AMD stellte im November 2006 die 4x4 Enthusiast Plattform vor. Die von wenig Erfolg gekrönte 2-Sockel-Lösung war in Europa jedoch nie erhältlich. Der Preis war viel zu hoch, die Performance mit zwei Athlon 64 FX reichte nicht, um einem Core-2-basierenden Quad-Core-Prozessor das Wasser zu reichen.

Core 2 Extreme QX9775: Der 45-nm-Quad-Core-Prozessor für den Sockel LGA771 arbeitet mit 3,2 GHz Taktfrequenz und einem FSB1600. Den vier Kernen der Xeon-basierenden CPU stehen insgesamt 12 MByte L2-Cache zur Verfügung.

Günstig wird auch Intels Skulltrail-Lösung nicht. Die Mitte Februar 2008 offiziell geplante Vorstellung der Plattform setzt sich aus folgenden Komponenten zusammen: Intel Desktop Board D5400XS mit zwei LGA771-Sockeln, zwei Core 2 Extreme QX9775 mit 3,2 GHz Taktfrequenz und FSB1600, FB-DIMM-Speicher mit DDR2-800 sowie eine Grafikbestückung mit bis zu zwei Dual-GPU-Karten.

Skulltrail basiert auf Intels Server-Plattform „Stoakley“ und lässt sich auch mit Xeon-5400-Prozessoren betreiben. Entsprechend verwendet das Enthusiast-Desktop-Mainboard den Intel 5400 Chipsatz mit vier FB-DIMM-Channels. Mehr als vier Module – eines pro Kanal – nimmt das D5400XS-Mainboard allerdings nicht auf. Die für Skulltrail vorgesehenen Core 2 Extreme QX9775 unterscheiden sich von den Xeons durch den frei wählbaren Multiplier.

Skulltrail: Die Highend-Desktop-Plattform mit zwei 45-nm-Quad-Core-Prozessoren, FB-DIMM-Speicher und SLI-Grafikkarten basiert auf den Stoakley-Server-Komponenten.

Im TecChannel-Testlabor untersuchen wir Intels Skulltrail mit den zwei Core 2 Extreme QX9775 und seinen Konkurrenten auf ihre Leistungsfähigkeit. Unter Windows Vista setzen wir von Profianwendungen wie 3ds Max 2008 über das weit verbreitete iTunes 7.5 bis hin zum DirectX-10-Spiel Crysis einen modernen Applikationsmix ein. Die Linux-Distribution CentOS 5 fordert zudem die 64-Bit-Performance der CPUs bei wissenschaftlichen Berechnungen.

Die Ergebnisse unseres Benchmark-Parcours belegen eindeutig, ob und wann acht Prozessorkerne in einem Desktop-PC Sinn ergeben.

SYSmark2007: Overall

Mit dem Benchmark-Paket SYSmark2007 Preview bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Wie bei der Vorgängerversion SYSmark 2004 SE kommen 17 Anwendungen zum Einsatz, deren Zusammensetzung hat sich allerdings geändert. Der neue Benchmark enthält vier Workload-Szenarios: E-Learning, Office Productivity, Video Creation und 3D-Modeling.

SYSmark2007 Preview öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.

Neben den Geschwindigkeitswerten für die Szenarios gibt SYSmark2007 einen daraus resultierenden Gesamtwert für die Systemperformance aus.

Gesamtwertung: Die Szenarien von SYSmark2007 profitieren vom zweiten Quad-Core-Prozessor des Skulltrail-Systems nicht. Der ebenfalls mit 3,2 GHz Taktfrequenz und FSB1600 arbeitende Core 2 Extreme QX9770 arbeitet hier sogar knapp schneller. Der zusätzliche Overhead für Thread-Handling und -Switching bei 8 Kernen wiegt den Vorteil einzelner Programme, die alle Kerne nutzen, auf.

SYSmark2007: Office Productivity

Der Workload Office Productivity von SYSmark2007 Preview erstellt Datenanalysen mit gebräuchlichen Office-Applikationen. Kommunikation, Projekt-Management und Datei-Operationen komplettieren das Szenario.

Folgende Applikationen setzt SYSmark2007 Preview ein: Microsoft Excel 2003, Outlook 2003, PowerPoint 2003, Word 2003 und Project 2003 sowie WinZip 10.0.

Office Productivity: Bei typischen Office-Applikationen reichen vier Kerne vollkommen aus. Der zweite Prozessor von Skulltrail sorgt durch das zusätzliche Thread-Handling und -Switching der vier weiteren Kerne für einen bremsenden Overhead.

SYSmark2007: E-Learning

Im Workload E-Learning führt SYSmark2007 Preview Applikationen aus dem Umfeld von Online-Schulungen durch. Eine Vielzahl von Bildern, Videos und Audio-Content werden über eine Website als Schulungsmaterial präsentiert. SYSmark2007 Preview nutzt folgende Programme: Adobe Illustrator CS2 und Photoshop CS2, Macromedia Flash 8 und Microsoft PowerPoint 2003.

E-Learning: In diesem Szenario skaliert die Performance mehr mit der Taktfrequenz als mit der Kernanzahl. Das 8-Core-System Skulltrail muss dem alleine arbeitenden Core 2 Extreme QX9770 wieder den Vortritt lassen. Die Phenoms halten sich bescheiden im Hintergrund.

SYSmark2007: Video Creation & 3D-Modeling

Der Workload Video Creation in SYSmark2007 Preview verwendet insgesamt fünf verschiedene Applikationen. Hierzu zählen Adobe After Effects 7, Illustrator CS2 und Photoshop CS2, Microsoft Windows Media Encoder 9 Series sowie Sony Vegas 7.

Das Szenario erzeugt ein Video unter Verwendung von Spezialeffekten und Bildern verschiedener Quellen. Der Content wird für Online-Streaming und als High-Resolution-Material produziert.

Video Creation: Bei den Intel-CPUs sorgt schnellerer Speicher für deutlich mehr Performance. Den beiden Spitzenreitern steht jeweils die gleiche theoretische Speicherbandbreite von 25,6 GByte/s (1000er-Basis) zur Verfügung. Der Applikationsmix nutzt allerdings die acht Kerne von Skulltrail nur ungenügend aus.

Im Workload 3D-Modeling wird mit AutoDesk 3ds Max 8 und SketchUp 5 eine Animation sowie eine photorealistische Darstellung eines Gebäudes erstellt.

3D-Modeling: Die Programme nutzen bei einigen zu bewältigenden Arbeitsschritten die acht Kerne von Skulltrail aus. Insgesamt profitiert das Szenario nur bedingt von dem zweiten Core 2 Extreme QX9775.

PCMark Vantage: Overall

Futuremarks PCMark Vantage wurde speziell für Windows Vista entwickelt. Das Analysetool ermittelt die Gesamtleistung eines Systems. Multi-Core-Prozessoren, Speicher, Grafikkarte und das Storage-Subsystem werden in verschiedenen Szenarios beansprucht und getestet. Neben einem Gesamtwert für die System-Performance stellt PCMark Vantage Geschwindigkeitsangaben der einzelnen Szenarios Memories, TV and Movies, Gaming, Music, Communications, Productivity und HDD zur Verfügung.

Gesamtwertung: Wie beim SYSmark2007 profitiert Skulltrail in der System-Performance, ermittelt aus einem Applikationsmix, von dem zweiten Prozessor nicht.

PCMark Vantage: Communications & Productivity

Im Szenario Communications von PCMark Vantage wird die Leistungsfähigkeit des Systems bei typischen Kommunikationsanwendungen ermittelt. Hierzu zählen E-Mail, Verschlüsselung und entpacken von Dateien, Audio Transcoding für VoIP oder Darstellung von grafischen Content im Browser.

PCMark Vantage nutzt beim Szenario Communications bis zu drei parallel arbeitende Tasks. Multi-Core-Prozessoren profitieren von ihren Kernen.

Communications: Zwar arbeiten die Programme parallel, die einzelnen Anwendungen nutzen aber kein massives Multithreading. Skulltrail kann seine acht Kerne in diesem Szenario deshalb nicht gewinnbringend einsetzen.

Beim Szenario Productivity Suite führt PCMark Vantage typische Standardaufgaben am PC durch. Hierzu zählt das Laden von Applikationen, Texte editieren, suchen in Datenbanken, E-Mail-Verwaltung oder das Öffnen von Websites mit dem Internet Explorer 7 in separaten Tabs.

PCMark Vantage nutzt auch beim Szenario Productivity Suite bis zu drei parallel arbeitende Tasks. Multi-Core-Prozessoren profitieren von ihren Kernen.

Productivity Suite: Für typische Büroarbeiten ist Intels Skulltrail-Plattform einfach nicht gemacht. Zu viel Rechenpower bleibt ungenutzt.

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 3.0 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal. SunGard rechnet überwiegend mit Integer-Operationen. Speicherzugriffe halten sich bei Adaptiv Credit Risk in Grenzen.

Schnelle Vorhersagen: Bei der Multithread-optimierten Monte-Carlo-Simulation arbeitet Skulltrail 84 Prozent schneller als der Core 2 Extreme QX9770. Hier wird das Potenzial von Intels Enthusiast-Desktop-Plattform gezeigt.

Rendering: 3ds Max 2008

Autodesk bietet mit 3ds Max 2008 eine professionelle Software für 3D-Modeling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 2008 Multiprocessing voll aus.

Die gewählten Render-Szenen „Space Flyby“ und „Underwater Escape“ basieren auf der Benchmark-Suite SPECapc for 3ds Max von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle, die OpenGL/DirectX-basierenden Tests der SPECapc-Suite verwenden wir nicht.

Szene „Space Flyby“: Mit zwei 3,2-GHz-Quad-Core-CPUs arbeitet Skulltrail 53 Prozent schneller als der Core 2 Extreme QX9770. Die Speicher-Performance ist hier nebensächlich, wie der Phenom 9600 und Core 2 Extreme QX9650 mit unterschiedlichen DIMMs zeigen.
Szene „Underwater Escape“: Bei diesem Render-Workload arbeitet Skulltrail mit zwei Core 2 Extreme QX9775 74 Prozent schneller als die LGA775-Version Core 2 Extreme QX9770.

Rendering: CINEBENCH 10

Mit dem CINEBENCH 10 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 10 basiert auf Cinema 4D Release 10 und führt wieder Rendering-Tests durch. Maxon bietet CINEBENCH 10 als 32- und 64-Bit-Version zum Download an.

Beim Render-Test wird eine photorealistische 3D-Szene mit Hilfe des Cinema-4D-Raytracers berechnet. Die Szene enthält unter anderem Lichtquellen, Schatteneffekte sowie Multi-Level-Reflektionen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte keine Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 10 wenig – der Test läuft überwiegend in den Cache-Stufen ab.

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core nutzt hier nichts. Durch das Thread-Switching von Windows über alle acht Kerne arbeitet das „One CPU Rendering“ mit Skulltrail sogar langsamer als der Core 2 Extreme QX9770 (vier Kerne). Windows ordnet den Render-Vorgang nicht explizit einem Kern zu (manuelles Einstellen ist möglich).
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. Skulltrail mit zwei Core 2 Extreme QX9775 zieht dem LGA775-Pendant QX9770 (X38-Mainboard) mit 58 Prozent höherer Performance davon.

Audio-Enkodieren: iTunes 7.5

Apples iTunes 7.5 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Beim MP3-Enkodieren nutzt iTunes 7.5 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus. Quad-Core-CPUs profitieren von ihren zusätzlichen Kernen nicht.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Vertont: Weil iTunes nur zwei Threads beim Enkodieren nutzt, profitieren die Quad-Core-Modelle sowie Skulltrail nicht von ihren zusätzlichen Kernen.

Video-Enkodieren: iTunes 7.5

Mit Apples iTunes 7.5 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 124 KBit/s und einer „mobilen“ Auflösung von 640 x 352 Bildpunkten. Dieses Video-Format ist für Apples iPod Touch und iPhone optimiert. iTunes 7.5 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.

Kurzfilm: Wie beim Audio-Enkodieren nutzt iTunes nur zwei Threads. Skulltrail ist sein zusätzlicher Prozessor selbst im Weg. Die zwei Threads beim Video-Enkodieren verteilt Windows wechselweise auf alle acht Kerne von Skulltrail. Dadurch entsteht mehr Overhead als beim Switch zwischen vier Kernen (beim Core 2 Extreme QX9770).

OpenGL: SPECviewperf 10

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 10 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualization Mockup und UGS NX.

Besonders die Anwendung Pro/ENGINEER (proe-04) stresst die Grafikkarte. Das dargestellte Modell im Workload besteht aus 3,9 bis 5,9 Millionen Eckpunkten. Jeder schattierte Frame des Modells beinhaltet mehr als 100 MByte an Status- und Vertex-Informationen.

Pro/ENGINEER: Multi-Core nutzt hier nichts. Deswegen zeigt sich das übliche Bild. Skulltrail mit acht Kernen verursacht durch das von Windows vollzogene Thread-Switching zwischen den Cores zusätzlichen bremsenden Overhead.

Die Einzelergebnisse von SPECviewperf 10 in der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist:

SPECviewperf 10

Prozessor

3dsmax-04

catia-02

ensight-03

maya-02

proe-04

sw-01

tcvis-01

ugnx-01

Athlon 64 X2 6400+ DDR2-800

10,8

7,5

13,5

20,6

8,8

14,0

3,9

4,6

Phenom 9600 DDR2-800

11,2

7,4

13,6

20,7

10,1

9,9

2,4

4,0

Phenom 9600 DDR2-1066

11,2

7,5

13,8

21,7

10,3

9,9

2,4

4,2

Phenom 9900 DDR2-1066

11,8

7,8

14,9

21,8

10,4

10,1

2,4

4,2

Core 2 Duo E6750 DDR3-1333

14,5

14,3

15,0

31,2

12,6

19,8

4,6

4,3

Core 2 Quad Q6600 DDR3-1066

12,0

7,6

15,0

21,8

10,5

11,2

2,7

4,2

Core 2 XE QX9650 DDR2-800

15,3

10,5

16,9

26,6

13,0

11,5

3,3

4,3

Core 2 XE QX9650 DDR3-1333

15,4

8,7

16,8

27,3

13,0

12,3

3,2

4,3

Core 2 XE QX9770 DDR3-1600

15,9

10,0

16,8

27,3

13,1

12,6

3,2

4,3

2x Core 2 XE QX9775 FB-DDR2-800

12,2

9,3

14,1

23,4

12,3

10,8

2,6

4,3

DirectX 9: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

Gesamtwertung: Der Vorteil der Multi-Core-Technologie fließt in das Ergebnis ein. Skulltrail mit den zwei Core 2 Extreme QX9775 setzt sich deshalb an die Spitze.

3DMark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

CPU-Test: Ohne Hilfe der Grafikkarte distanziert sich die 2-Sockel-Plattform Skulltrail mit 23 Prozent höherer Performance im Vergleich zum LGA775-Pendant. Die Performance von vier (eine CPU) auf acht Kerne (zwei CPUs) skaliert weniger gut als beim Schritt von einer Dual- auf eine Quad-Core-CPU.

Crysis: 800 x 600 Low Quality

Das 3D-Spiel Crysis von Crytek unterstützt DirectX 10 und stellt hohe Anforderungen an die Hardware. Die komplexen grafischen Elemente der Spieleszenen sowie die Physik-Engine beanspruchen die Grafikkarte und den Prozessor besonders stark. Cryteks eingesetzte CryEngine 2 unterstützt Multi-Core-CPUs. In parallelen Threads führt Crysis Berechnungen für Audio- und Physikeffekte, das Partikelsystem sowie dem Daten-Streaming oder der KI durch.

Die Frameraten von Crysis mit den verschiedenen Prozessoren ermitteln wir bei einer Grafikauflösung von 800 x 600 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „low“. Als Szenario verwenden wir das in Crysis mitgelieferte Testskript „Benchmark_CPU.bat“. Die Grafikkarte wird nicht voll gefordert.

Minimale Framerate: Die vielen Kerne „behindern“ sich hier gegenseitig. Skulltrail arbeitet deutlich langsamer als der Core 2 Extreme QX9770. Auch der Doppelkerner Core-2-Duo E6750 ist trotz geringer Taktfrequenz schneller als der Core 2 Extreme QX9650 mit vier Kernen. Beim an der Spitze liegenden QX9770 fruchtet der FSB1600 in Verbindung mit DDR3-1600 – Skulltrail zieht dagegen aus dem FSB1600 und den vier FB-DIMM-Channels keinen Nutzen.
Mittlere Framerate: Jetzt sortieren sich die Core-2-Prozessoren entsprechend ihrer Taktfrequenz ein. Nur Skulltrail fällt aus der Reihe. Die acht Kerne erzeugen zu viel Overhead. Außerdem scheint bei Skulltrail die Kombination des 5400er-Chipsatzes mit FB-DIMMs für Grafikapplikationen weniger performant zu sein als der X38-Chipsatz mit DDR3-Speicher.
Maximale Framerate: Die Reihenfolge bleibt unverändert. Skulltrail mit zwei Core 2 Extreme QX9775 kann sich nur im Mittelfeld platzieren. Die Rechenpower der acht Kerne liegt weitgehend brach. Das von Windows verursachte Thread-Switching zwischen den Kernen wirkt sogar bremsend.

Crysis: 1024 x 768 Medium Quality

Jetzt ermitteln wir die Frameraten von Crysis mit den verschiedenen Prozessoren bei einer Grafikauflösung von 1024 x 768 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „medium“. Als Szenario verwenden wir das in Crysis mitgelieferte Testskript „Benchmark_CPU.bat“. Die Grafikkarte wird bereits stark belastet.

Minimale Framerate: Überraschend bricht die Framerate beim Athlon 64 X2 6400+ am wenigsten ein. Schneller Speicher bringt bei den CPUs hier einen deutlichen Schub, wie besonders am Phenom zu sehen ist. Trotz allem belegen die K10-Prozessoren nur die hinteren Positionen.
Mittlere Framerate: Die CPUs sortieren sich auch bei der 1024er-Auflösung wieder ihrer Taktfrequenz entsprechend ein – sauber getrennt nach Hersteller. Eine Ausnahme bildet wieder Skulltrail mit seinen zwei Quad-Core-Prozessoren.
Maximale Framerate: Hier wird die Grafikkarte wieder am wenigsten gefordert. Die Rechenkraft der Prozessoren und ihre Speicheranbindung erhält bei der maximalen Framerate mehr Gewichtung. Dass allerdings bereits zwei Kerne ausreichen, zeigt die gute Position der 2,67-GHz-CPU Core 2 Duo E6750. Das 8-Core-System Skulltrail erzeugt wiederum zu viel Overhead.

Crysis: 1280 x 1024 High Quality

Welche Frameraten die Prozessoren bei Crysis bei einer Grafikauflösung von 1280 x 1024 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „high“ ermöglichen, ermitteln wir wieder mit dem Testskript „Benchmark_CPU.bat“. Die Grafikkarte arbeitet bei dieser Einstellung unter Volllast.

Minimale Framerate: Die Grafikkarte arbeitet bei diesem Test voll „auf Anschlag“.
Mittlere Framerate: Die Unterschiede zwischen den CPUs minimieren sich bei der durchschnittlichen Bildwiederholrate. Skulltrail hinkt in der Grafik-Performance allerdings hinterher.
Maximale Framerate: Die Grafikkarte ist bei dieser Auflösung und hohen Darstellungsqualität deutlich die limitierende Komponente.

SSE-Performance: Linpack 64 Bit

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter CentOS 5 Linux 64 Bit setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Prozessoren mit SSE3 arbeiten unter Linux mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen.

Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000 und 15.000 Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und zirka 1,6 GByte Arbeitsspeicher (15.000 Gleichungssysteme). Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Matrizenkünstler: Linpack fordert alle acht Kerne von Skulltrail. Entsprechend liegt das 2-Sockel-System mit 60 Prozent höherer Performance im Vergleich zum Zweitplatzierten in Führung.

Energieverbrauch: Leerlauf

AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.

Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows Vista im „Leerlauf“ ohne aktivierten Energiesparmodus:

Regungslos: Die zwei Core 2 Extreme QX9775 mit je 150 Watt TDP sowie die vier FB-DIMMs der Skulltrail-Plattform fordern ihren Tribut beim Energiebedarf. Dass der Core 2 Extreme QX9650 mit DDR3-1333 deutlich sparsamer ist als mit DDR2-800, liegt vor allem an den unterschiedlichen X38-Mainboards.

Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD Cool’n’Quiet zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:

Sparfüchse: Bei den Intel-CPUs sinkt der Energiebedarf im Leerlauf mit SpeedStep nur marginal, weil bei den Prozessoren bereits andere Powersave-Technologien greifen. SpeedStep hilft bei den Intel-CPUs Energie zu sparen, wenn die Prozessorauslastung im „mittleren“ Bereich liegt. Der Phenom 9600 arbeitet bei 2,3 GHz Taktfrequenz mit einer Core-Spannung von 1,25 V. Im Stromsparmodus reduziert Cool’n’Quiet 2.0 den Arbeitstakt auf 1,15 GHz bei einer Core-Spannung von 1,05 V. Damit spart die CPU zirka 14 Watt. Der Phenom 9900 spart sogar 31 Watt, bei Ausgangswerten von 2,6 GHz Taktfrequenz, 1,3 V Core-Spannung und einem TDP-Wert von 140 Watt.

Energieverbrauch: Volllast

Der Energieverbrauch der Plattformen steigt auf die Werte im Diagramm, wenn alle Kerne der Prozessoren unter voller Last arbeiten. Die Grafikkarte wird beim verwendeten Lasttest mit SunGard ACR nicht beansprucht.

Lasttest ohne Grafik: Arbeiten alle acht Kerne von Skulltrail auf Anschlag, so benötigt das System bereits 154 Watt mehr Energie als das Core-2-Extreme-QX9770-System.

Wird zusätzlich die Grafikkarte GeForce 8800 GTS über das DirectX-10-Spiel Crysis stark gefordert, so erhöht sich der Energiebedarf der Plattformen auf folgende Werte:

Lasttest mit Grafik: Trotz stromhungriger Grafikkarte reduziert Skulltrail seinen Energiebedarf – meist sind nur ein bis zwei CPU-Kerne voll ausgelastet. Bei den Dual- und Quad-Core-Systemen steigt dagegen überwiegend der Stromhunger.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 07. Januar 2008 die letzten Änderungen. Intels Preisliste wurde am 20. Januar 2008 aktualisiert.

Preise für die Skulltrail-Plattform sowie den Core 2 Extreme QX9775 hat Intel noch nicht veröffentlicht – sie werden bis Mitte Februar 2008 erwartet.

OEM- und Straßenpreise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Socket AM2+

Phenom 9900

2600

k.A.

k.A.

Phenom 9600 Black Edition

2300

251

220

Phenom 9600

2300

251

220

Phenom 9500

2200

209

180

Socket AM2

Athlon 64 X2 6400+ Black Edition

3200

178

160

Athlon 64 X2 6000+

3000

167

130

Athlon 64 X2 5600+

2800

146

115

Athlon 64 X2 5200+

2600

125

105

Athlon 64 X2 5000+ Black Edition

2600

104

100

Athlon 64 X2 5000+ 65 nm

2600

104

95

Athlon 64 X2 4800+ 65 nm

2500

89

80

Athlon 64 X2 4400+ 65 nm

2300

78

70

Athlon 64 X2 4200+

2200

68

65

Athlon 64 X2 4000+ 65 nm

2100

68

55

LGA775

Core 2 Extreme QX9770

3200 / 1600

k.A.

1200

Core 2 Extreme QX9650

3000 / 1333

999

900

Core 2 Extreme QX6850

3000 / 1333

999

860

Core 2 Extreme QX6800

2930 / 1066

999

860

Core 2 Quad Q9550

2830 / 1333

530

470

Core 2 Quad Q9450

2670 / 1333

316

280

Core 2 Quad Q9300

2500 / 1333

266

240

Core 2 Quad Q6700

2670 / 1066

530

460

Core 2 Quad Q6600

2400 / 1066

266

220

Core 2 Duo E8500

3160 / 1333

266

265

Core 2 Duo E8400

3000 / 1333

183

185

Core 2 Duo E8200

2670 / 1333

163

170

Core 2 Duo E8190

2670 / 1333

163

k.A.

Core 2 Duo E6850

3000 / 1333

266

235

Core 2 Duo E6750

2670 / 1333

183

160

Core 2 Duo E6700

2670 / 1066

316

280

Core 2 Duo E6600

2400 / 1066

224

205

Core 2 Duo E6550

2330 / 1333

163

140

Core 2 Duo E6400

2130 / 1066

183

140

Core 2 Duo E6300

1860 / 1066

163

150

Core 2 Duo E4400

2000 / 800

113

100

TecChannel Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Skulltrail ist ein teures Prestigeobjekt für PC-Enthusiasten mit lockerer Geldbörse. Denn beim Gros der verfügbaren Software für Desktop-PCs reicht ein Core 2 Extreme QX9770 mit DDR3-Speicher mehr als aus und erzielt meist höhere Performance.

Für typische Office-Anwendungen ist Skulltrail natürlich völlig überdimensioniert. Dabei handelt es sich aber auch nicht um das primäre Einsatzgebiet der 2-Sockel-Desktop-Plattform. Doch selbst bei scheinbar für ein 8-Core-System prädestinierten Aufgaben wie Audio-/Videobearbeitung oder Rendering gilt es auf die Softwarewahl zu achten. So nutzt beispielsweise iTunes zur Audio-/Videowandlung nur zwei Threads – unverständlich, denn die Mac-Version nutzt mehr.

Auch bei aktuellen 3D-Spielen ist ein zweiter Prozessor noch überflüssig. Selbst eine Quad-Core-CPU kann seine Vorteile gegenüber Zweikernern nicht zeigen. Anders natürlich, wenn parallele Tasks wie Enkodieren zusätzlich arbeiten. Doch selbst dann werden in Desktop-PC-Szenarien acht Kerne wie bei Skulltrail fast nie gefordert.

Das Potenzial von Skulltrail verkommt in einem Desktop-PC somit meist zum brachliegenden Luxusgut. Wer mit einer Anschaffung trotzdem liebäugelt und die Rechenleistung benötigt, sollte vorher abklären, ob seine Software auch massives Multithreading unterstützt.

Wegen zu fürchtender Konkurrenz könnte Intel auf Skulltrail allerdings verzichten. AMDs Phenom-Prozessoren kämpfen mit Intels ein Jahr altem Quad-Core-Einstiegsmodell um die Plätze. (cvi)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows Vista Business in der 32-Bit-Version durchgeführt. Für den Linux-Test verwenden wir CentOS 5 in der x86_64-Edition.

Der Test der beiden Core 2 Extreme QX9775 erfolgt in dem 2-Sockel-Mainboard Intel D5400XS mit 5400er Chipsatz. Das Skulltrail-Mainboard steuert vier FB-DIMM-Channels mit DDR2-800-Speicher in einer CL5-Konfiguration an.

LGA771-Plattform: Das Skulltrail-Mainboard Intel D5400XS unterstützt FSB1600-CPUs sowie vier FB-DIMM-Channels mit DDR2-800.

Dem Core 2 Extreme QX9770 will Intel im ersten Quartal den FSB1600/DDR3-1600-Chipsatz X48 Express zur Seite stellen. Mainboards mit X48-Chipsatz konnte uns Intel noch nicht zur Verfügung stellen. Als Testplattform dient uns deshalb das Asus P5E3 Deluxe mit X38-Express-Chipsatz. Neben dem offiziellen FSB1333-Support lässt der Chipsatz den FSB1600-Betrieb zu. Diese „Übertaktung“ wird von Intel als Testumgebung für die FSB1600-CPU empfohlen. Neben dem offiziellen DDR3-1333-Support des X38-Chipsatzes erlaubt das Asus-Mainboard auch den Betrieb mit DDR3-1600-DIMMs.

LGA775-Plattform: Das P5E3 Deluxe von Asus setzt auf Intels X38-Express-Chipsatz. Das Mainboard unterstützt neben FSB1333 und DDR3-1333-Speicher. Sowohl der Prozessorbus als auch der Speicher lassen auch mit 1600 MHz betreiben.

Alle anderen Core-2-Prozessoren nehmen ebenfalls im Asus P5E3 Deluxe Platz. Den FSB1333-Modellen Core 2 Duo E6750 und Core 2 Extreme QX9650 steht als Arbeitsspeicher jeweils 2 GByte DDR3-1333-SDRAM mit CL7 in einer Dual-Channel-Konfiguration zur Verfügung. Die FSB1066-CPU Core 2 Quad Q6600 steuert den DDR3-Speicher von OCZ mit 1066 MHz an. Den Core 2 Extreme QX9650 testen wir zusätzlich im X38-Mainboard Asus Maximus Formula. Das LGA775-Board steuert DDR2-800-Speicher mit CL5 an. Damit können wir die Performance-Unterschiede von DDR2-800 zu DDR3-1333 ermitteln.

Socket-AM2+-Plattform: Das Gigabyte GA-MA790FX-DQ6 verwendet als Chipsatz AMDs 790FX. Beim Speicher steuert das Board Dual-Channel-DDR2-1066-SDRAM an.

AMDs Phenom 9900 und 9600 für den Socket AM2+ testen wir in einem Gigabyte GA-MA790FX-DQ6 mit AMD 790FX Chipsatz. Der CPU stehen 2 GByte Dual-Channel DDR2-1066-Speicher mit CL5 von takeMS zur Verfügung. Über den im Phenom integrierten Speicher-Controller konfigurieren wir die DIMMs für unsere Tests jeweils mit 800 und 1066 MHz. Dem Athlon 64 X2 6400+ steht ebenfalls das Gigabyte-Mainboard zur Verfügung. Die Socket-AM2-CPU arbeitet im GA-MA790FX-DQ6 mit HT-2.0-Geschwindgkeit und steuert die Speicherriegel von takeMS als DDR2-800-DIMMs an. Das Mainboard arbeitet mit dem BIOS (F2H) vom 1.11.2007 und bietet noch keine Unterstützung für das TLB-Problem. Somit ist gewährleistet, dass die CPU mit maximaler Performance läuft.

DDR2-Speicher: Die Mach2-Series von takeMS erlaubt Speichergeschwindigkeiten bis 1066 MHz.
DDR3-Speicher: Die Platinum Series von OCZ ermöglicht DDR3-Taktfrequenzen von 1066, 1333 und 1600 MHz.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer Zotac GeForce 8800GTS bestückt. Der DirectX-10-Grafikkarte mit 320 MByte Grafikspeicher stand der ForceWare-Treiber Release 163.69 zur Seite.

Referenzgrafik: Zotacs GeForce 8800GTS arbeitet mit 570 MHz Core-Taktfrequenz und steuert 320 MByte GDDR3 an.

Einheit herrschte auch beim 620-Watt-Netzteil Enermax Liberty ELT620AWT und den Massenspeichern – die Serial-ATA-II-Festplatte Seagate Barracuda 7200.10 mit 250 GByte Kapazität.