Schnellste Desktop-Quad-Core-CPU von AMD

Test: AMD Phenom 9900 mit 2,6 GHz

21.12.2007 von Bernhard Haluschak und Christian Vilsbeck
Test des AMD Phenom für Desktop-PCs. Ob der 2,6 GHz schnelle AMD Phenom mit nativem K10-Quad-Core, neuer Cache-Hierarchie und vielen Architektur-Features diesmal gegen Intels Core-2-CPUs bestehen kann, zeigt der AMD Phemon im Test.

Der in die Jahre gekommene Dual-Core-Prozessor Athlon 64 X2 unterliegt dem Core-2-Duo in fast allen Bereichen hoffnungslos. Und gegen die Quad-Core-Modelle von Intel sehen AMDs Doppelkerner mit K8-Core in Multitask-Umgebungen sowie bei multithreaded programmierten Anwendungen kein Land mehr.

Eine neue Architektur und vor allem ein Quad-Core-Prozessor für Desktop-PCs waren für AMD längst überfällig. Mit der neuen Phenom-9000-Serie will der Hersteller nun endlich wieder mehr als nur konkurrenzfähige CPUs im Angebot haben. So vereint die K10-Architektur des Phenom vier Kerne auf einem Siliziumplättchen. Außerdem peppt AMD seinen Prozessor mit zahlreichen Architekturerweiterungen auf.

AMD Phenom 9900: Der 65-nm-Quad-Core-Prozessor für den Sockel AM2+ arbeitet mit 2,6 GHz Taktfrequenz. Alle vier Kerne sind auf einem Siliziumplättchen vereint.

Schwachstellen der K8-Mikroarchitektur des Athlon 64 X2 merzt AMD beim Phenom gezielt aus. So erhält die neue Desktop-CPU-Generation eine deutliche Verbesserung bei der SSE-Befehlsverarbeitung. Auch die Cache-Struktur optimierte AMD mit einem zusätzlichen L3-Cache. Und der weiterhin integrierte Dual-Channel-Speicher-Controller steuert schnelleres DDR2-1066-SDRAM an.

Die Interaktion mit der Grafikkarte erfolgt nun über HyperTransport 3.0 mit verdoppelter Bandbreite. Und für geizigen Umgang mit der Energie soll Cool’n’Quiet 2.0 sorgen. Jeder der vier Kerne kann mit voneinander unabhängiger Taktfrequenz arbeiten.

Die Summe der Neuerungen klingt in der Theorie vielversprechend. Doch bereits beim ersten Test des 2,3 GHz schnellen Phenoms 9600 konnte dieser gegen Intels Quad-Core-Prozessoren nicht bestehen. Nun legt AMD in kurzer Zeit mit dem Phenom 9900 nach.

Im TecChannel-Testlabor untersuchen wir AMDs Phenom 9900 und seinen Konkurrenten auf ihre Leistungsfähigkeit. Unter Windows Vista setzen wir von Profianwendungen wie 3ds Max 2008 über das weit verbreitete iTunes 7.5 bis hin zum DirectX-10-Spiel Crysis einen modernen Applikationsmix ein.

Die Ergebnisse unseres Benchmark-Parcours und Energiemessungen belegen detailliert den Leistungsstand des neuen Phenom-Prozessors 9900. Zusätzlich informieren wir Sie über den im Barcelona-Kern entdeckten TLB-Bug. Darüber hinaus erfahren Sie, ob die neue AMD-CPU Intels Vormachtstellung gefährden kann.

Details zum Phenom

Mit der Phenom-9000-Serie bietet AMD seine ersten auf der K10-Architektur basierenden Desktop-Prozessoren an. Der native Quad-Core-Chip des Phenom besitzt pro Kern einen dedizierten 128 KByte fassenden L1-Cache - je 64 KByte für Daten und Befehle – sowie den 512 KByte großen L2-Cache. Alle vier Kerne greifen zusätzlich auf einen 2 MByte großen gemeinsam nutzbaren L3-Cache zurück. Die Daten-Cache-Bandbreite verdoppelte AMD beim Phenom gegenüber der K8-AMD64-Generation mit 2 x 128 Bit Loads pro Taktzyklus.

Stufenplan: AMDs Phenom arbeitet mit einer dreistufigen Cache-Struktur. Den 2 MByte großen L3-Cache müssen sich alle vier Kerne teilen. (Quelle: AMD).

Beim Athlon 64 X2 ist der SSE-Pfad nur 64 Bit breit. Dadurch muss die K8-CPU einen 128-Bit-SSE-Befehl in zwei 64-Bit-Happen aufteilen. Der K10-Core des Phenom liest laut AMD dagegen zwei 128-Bit-SSE-Befehle pro Taktzyklus ein. Damit erlaubt ein Phenom-Kern bis zu vier Floating-Point-Operationen in doppelter Präzision pro Taktzyklus.

Neue SSE4a-Befehle (EXTRQ, INSERTQ, MOVNTSD und MOVNTSS) sowie Erweiterungen für die Bit-Manipulation (LZCNT und POPCNT) implementiert AMD ebenfalls. Damit will AMD die bisher geringere SSE-Performance gegenüber den Intel-Prozessoren wettmachen.

Als Steckplatz nutzt der Phenom den neuen Socket AM2+ mit HyperTransport 3.0. Bei einer Taktfrequenz von 3,6 GHz erlaubt die Phenom-9000-Serie damit eine Busbandbreite von 14,4 GByte/s. Die mit 2,0 GHz operierende HyperTransport-2.0-Schnittstelle des Athlon 64 X2 ermöglicht theoretische Bandbreiten von 8,0 GByte/s.

Nativer Quad-Core: AMDs K10-Architektur vereint vier Prozessorkerne auf einem Siliziumplättchen. Im unteren Bereich des Bildes sehen Sie den für alle Cores gemeinsamen 2 MByte großen L3-Cache. (Quelle: AMD)

Durch Cool’n’Quiet 2.0 können alle vier Kerne des Phenom mit voneinander unabhängiger Taktfrequenz arbeiten. Die Core-Spannung orientiert sich jeweils am Kern mit der aktuell höchsten Taktfrequenz. Die integrierte Northbridge der Phenom-Prozessoren darf unabhängig von den Kernen mit einer eigenen Spannung arbeiten. Die hierfür notwendige „Split Power Plane“ ist in Mainboards mit Socket AM2+ zwingend. Der Phenom arbeitet laut AMD auch in Socket-AM2-Boards, dann aber mit geringerer HyperTransport-Geschwindigkeit und mit weniger Powermanagement-Features.

Alle Phenom-Prozessoren fertigt AMD in seinem 65-nm-Prozess. Auf dem 283 mm² großen Siliziumplättchen breiten sich 463 Millionen Transistoren aus.

Modelle und Taktfrequenzen

AMD bietet die Quad-Core-Prozessoren der Phenom-9000-Serie zum Start mit zwei Modellen an. Als Einstiegsversion fungiert der Phenom 9500 mit 2,2 GHz Taktfrequenz. Beim Phenom 9600 hebt AMD den Arbeitstakt auf 2,3 GHz an. Das ursprünglich zum Launch ebenfalls vorgesehene Topmodell Phenom 9700 mit 2,4 GHz Taktfrequenz strich AMD kurzfristig aus dem Programm. Zusammen mit dem jetzt von uns getesteten Modell Phenom 9900 mit 2,6 GHz sollen die CPUs laut AMD im ersten Quartal 2008 auf den Markt kommen.

Alle Phenom-9000-Modelle setzen auf den Socket AM2+ mit HyperTransport 3.0. Der serielle Prozessorbus arbeitet jeweils mit 3,6 GHz Taktfrequenz. Beim Phenom steuert der integrierte Dual-Channel-Speicher-Controller unverändert ungepufferte DDR2-DIMMs an. Allerdings beherrschen die CPUs nun Speichergeschwindigkeiten bis 1066 MHz.

Modellpalette: Zum Start am 19. November 2007 waren zwei Phenom-9000-Modelle mit 2,2 und 2,3 GHz Taktfrequenz am Start.

AMD gibt für den Phenom 9500 und 9600 einen TDP-Wert von 95 Watt an. Beim später zu erwartenden 2,4-GHz-Modell Phenom 9700 steigt der Wert auf 125 Watt. Damit liegt das 2,4-Quad-Core-Modell auf dem gleichen thermischen Theoriewert wie AMDs schnellste Dual-Core-CPU Athlon 64 X2 6400+ mit 3,2 GHz und 90 nm Strukturbreite. Dagegen legt der Hersteller beim 2,6 GHz schnellen Phenom 9900 noch ein wenig drauf. Der Prozessor besitzt einem TDP-Wert von 140 Watt. Dieser hohe Wert spiegelt sich in unseren Energiemessungen wider und scheint unserer Meinung nicht ganz zeitgemäß zu sein.

Voraussichtlich im ersten Quartal 2008 will AMD die Phenom-FX-80-Serie vorstellen. Die CPUs für die 2-Sockel-Enthusiast-Plattform setzen auf den Socket 1207FX+ und bieten ebenfalls HyperTransport-3.0-Unterstützung. Im ersten Quartal 2008 folgt auch die Phenom-8000-Serie mit Triple-Core für den Socket AM2+. Sukzessive stellt AMD dann K10-basierende Dual-Core-Prozessoren als neue Athlon-6000-Serie vor. Single-Core-Modelle mit K10-Architektur wird AMD als Athlon-1000-Serie lancieren.

Laut AMD will das Unternehmen bis Mitte 2008 Phenom-CPUs mit bis zu 3,0 GHz Taktfrequenz anbieten.

TLB-Fehler in Barcelona-Prozessoren

Aufgrund eines Fehlers im sogenannten Translation Lookaside Buffer (TLB) hat AMD am 6. Dezember 2007 die Massenproduktion des Quad-Core-Opterons auf unbestimmte Zeit verschoben. Die Probleme mit dem Bug im K10-Opteron betreffen auch die Desktop-Prozessoren Phenom. So wurde der ursprünglich geplante Phenom 9700 mit 2,4 GHz Taktfrequenz kurz vor dem Launch der Serie in das erste Quartal 2008 verlegt. Auch die von uns getesteten Phenom 9900 und 9600 sollen fehlerfrei als B3-Stepping erst im ersten Quartal 2008 erhältlich sein.

Der TLB-Bug soll alle K10-Prozessoren mit dem B2-Stepping betreffen und läuft in den technischen Dokumentationen unter der Bezeichnung Erratum 298. Dabei soll es besonders bei hoher CPU-Auslastung zu Fehlern im L3-Cache des Prozessors kommen, die ein Systemabsturz verursachen können. Bei welchen Anwendungen diese besonders häufig geschieht, ist noch nicht vollständig geklärt.

Die Lösung des Problems ist ein BIOS-Update der entsprechenden Plattformen. Allerdings soll diese Problemlösung je nach Anwendung Performanceverluste von bis zu 10 Prozent nach sich ziehen. Detaillierte Informationen sind seitens AMD noch nicht bekannt gegeben worden. Wer deshalb auf Nummer sicher gehen will, sollte bis zum nächsten Jahr warten und sich dann eine fehlerfreie CPU mit B3-Stepping kaufen.

In einem Interview bei unserer Schwesterpublikation ChannelPartner erläutert Giuseppe Amato, Technical Director Sales und Marketing EMEA bei AMD, die Auswirkungen des Barcelona-Fehlers.

SYSmark2007: Overall

Mit dem Benchmark-Paket SYSmark2007 Preview bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Wie bei der Vorgängerversion SYSmark 2004 SE kommen 17 Anwendungen zum Einsatz, deren Zusammensetzung hat sich allerdings geändert. Der neue Benchmark enthält vier Workload-Szenarios: E-Learning, Office Productivity, Video Creation und 3D-Modeling.

SYSmark2007 Preview öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.

Neben den Geschwindigkeitswerten für die Szenarios gibt SYSmark2007 einen daraus resultierenden Gesamtwert für die Systemperformance aus.

Gesamtwertung: Die Systemleistung des Phenom 9900 ist nicht zufriedenstellend. Zwar kann der Phenom 9900 gegenüber dem 9600 11 Punkte zulegen, aber Intels Core-2-Prozessoren bleiben für AMD dennoch weit entfernt.

SYSmark2007: Office Productivity

Der Workload Office Productivity von SYSmark2007 Preview erstellt Datenanalysen mit gebräuchlichen Office-Applikationen. Kommunikation, Projekt-Management und Datei-Operationen komplettieren das Szenario.

Folgende Applikationen setzt SYSmark2007 Preview ein: Microsoft Excel 2003, Outlook 2003, PowerPoint 2003, Word 2003 und Project 2003 sowie WinZip 10.0.

Office Productivity: Der Phenom 9900 und der 9600 erzielen gegenüber dem Athlon 64 X2 6400+ mit 1200 beziehungsweise 900 MHz weniger Taktfrequenz zwar eine respektable Leistung. Den Produktivitätsvergleich mit Intels Core-2-Prozessoren verlieren die neuen K10-Prozessoren aber deutlich.

SYSmark2007: E-Learning

Im Workload E-Learning führt SYSmark2007 Preview Applikationen aus dem Umfeld von Online-Schulungen durch. Eine Vielzahl von Bildern, Videos und Audio-Content werden über eine Website als Schulungsmaterial präsentiert. SYSmark2007 Preview nutzt folgende Programme: Adobe Illustrator CS2 und Photoshop CS2, Macromedia Flash 8 und Microsoft PowerPoint 2003.

E-Learning: In diesem Szenario skaliert die Performance mehr mit der Taktfrequenz als mit der Kernanzahl. Auch hier düpiert der Core-2-Quad Q6600 (2,4 GHz) – der Hauptkonkurrent – den Phenom 9900 (2,6 GHz).

SYSmark2007: Video Creation & 3D Modeling

Der Workload Video Creation in SYSmark2007 Preview verwendet insgesamt fünf verschiedene Applikationen. Hierzu zählen Adobe After Effects 7, Illustrator CS2 und Photoshop CS2, Microsoft Windows Media Encoder 9 Series sowie Sony Vegas 7.

Das Szenario erzeugt ein Video unter Verwendung von Spezialeffekten und Bildern verschiedener Quellen. Der Content wird für Online-Streaming und als High-Resolution-Material produziert.

Video Creation: In diesem Szenario dominieren SMP-fähige Anwendungen. Der Phenom 9600 setzt sich erstmals von den Doppelkernen Athlon 64 X2 6400+ und Core 2 Duo E6750 ab. Und der Phenom 9900 liegt knapp vor dem Core 2 Quad Q6600. Höhere Taktfrequenzen sorgen nur für ein bescheidenes Leistungsplus. Bei den Intel-CPUs sorgt schnellerer Speicher für mehr Performance – der Core 2 Extreme QX9650 fällt mit DDR2-800-Mainboard deutlich zurück.

Im Workload 3D Modeling wird mit AutoDesk 3ds Max 8 und SketchUp 5 eine Animation sowie eine photorealistische Darstellung eines Gebäudes erstellt.

3D Modeling: Der Phenom 9600 bildet wieder das Schlusslicht. Die Kernverdoppelung und die Architekturerweiterungen können den Taktfrequenznachteil nicht kompensieren. Dagegen schließt der Phenom 9900 mit 2,6 GHz Taktfrequenz zum Intels Core 2 Quad Q6600 auf.

PCMark Vantage: Overall

Futuremarks PCMark Vantage wurde speziell für Windows Vista entwickelt. Das Analysetool ermittelt die Gesamtleistung eines Systems. Multi-Core-Prozessoren, Speicher, Grafikkarte und das Storage-Subsystem werden in verschiedenen Szenarios beansprucht und getestet. Den Gesamtwert für die System-Performance stellt PCMark Vantage aus den einzelnen Szenarios Memories, TV and Movies, Gaming, Music, Communications, Productivity und HDD zusammen.

Gesamtwertung: AMDs Phenom 9900 übertrifft das Leistungsniveau von Intels Core-2-Quad Q6600 deutlich. Auch vom Core-2-Duo E6750 kann sich der neue Phenom klar absetzen.

PCMark Vantage: Communications & Productivity

Im Szenario Communications von PCMark Vantage wird die Leistungsfähigkeit des Systems bei typischen Kommunikationsanwendungen ermittelt. Hierzu zählen E-Mail, Verschlüsselung und entpacken von Dateien, Audio Transcoding für VoIP oder Darstellung von grafischen Content im Browser.

PCMark Vantage nutzt beim Szenario Communications bis zu drei parallel arbeitende Tasks. Multi-Core-Prozessoren profitieren von ihren Kernen.

Communications: Während sich AMDs Phenom 9900 zum Core 2 XE QX9650 vorarbeitet, liefern sich der Phenom 9600 und der Core 2 Quad Q6600 ein Kopf-an-Kopf-Rennen. Die beiden Phenom-Prozessoren liegen in punkto Leistung etwa 10 Prozent auseinander.

Beim Szenario Productivity Suite führt PCMark Vantage typische Standardaufgaben am PC durch. Hierzu zählt das Laden von Applikationen, Texte editieren, suchen in Datenbanken, E-Mail-Verwaltung oder das Öffnen von Websites mit dem Internet Explorer 7 in separaten Tabs.

PCMark Vantage nutzt auch beim Szenario Productivity Suite bis zu drei parallel arbeitende Tasks. Multi-Core-Prozessoren profitieren von ihren Kernen.

Productivity Suite: Die Quad-Core-Prozessoren sind hier im Vorteil. AMDs Phenom 9900 kann das Leistungsniveau des Core-2-Quad Q6600 übertrumpfen, der Phenom 9600 schafft das nicht. Immerhin schlägt der Athlon 64 X2 6400+ ausnahmsweise mal knapp den Core-2-Duo E6750.

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 3.0 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal. SunGard rechnet überwiegend mit Integer-Operationen. Speicherzugriffe halten sich bei Adaptiv Credit Risk in Grenzen.

Schnelle Vorhersagen: Der 2,6-GHz-Phenom 9900 analysiert zirka 13 Prozent schneller als das 2,3-GHz-Pendant 9600. Da die Performance des SunGard sehr gut mit der Taktfrequenzen skaliert, liegt der 2,4 GHz Core-2-Quad Q6600 zwischen den beiden Phenom-CPUs.

Rendering: 3ds Max 2008

Autodesk bietet mit 3ds Max 2008 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 2008 Multiprocessing voll aus.

Die gewählten Render-Szenen „Space Flyby“ und „Underwater Escape“ basieren auf der Benchmark-Suite SPECapc for 3ds Max von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle, die OpenGL/DirectX-basierenden Tests der SPECapc-Suite verwenden wir nicht.

Szene „Space Flyby“: AMDs Phenom 9900 arbeitet 4 Prozent langsamer als der preislich günstigere Core-2-Quad Q6600. Die Speicher-Performance ist hier nebensächlich, wie der Phenom 9600 und Core-2-Extreme QX9650 mit unterschiedlichen DIMMs zeigen.
Szene „Underwater Escape“: Bei diesem Render-Workload arbeitet der Phenom 9900 16 Prozent langsamer als der Core-2-Quad Q6600. Die Puffergrößen von 512 KByte L2-Cache pro Kern und 2 MByte shared L3-Cache reichen jetzt nicht mehr ganz aus. Beim Core-2-Quad sind mit 8 MByte L2-Cache noch Reserven vorhanden.

Rendering: CINEBENCH 10

Mit dem CINEBENCH 10 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 10 basiert auf Cinema 4D Release 10 und führt wieder Rendering-Tests durch. Maxon bietet CINEBENCH 10 als 32- und 64-Bit-Version zum Download an.

Beim Render-Test wird eine photorealistische 3D-Szene mit Hilfe des Cinema-4D-Raytracers berechnet. Die Szene enthält unter anderem Lichtquellen, Schatteneffekte sowie Multi-Level-Reflektionen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte keine Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 10 wenig - der Test läuft überwiegend in den Cache-Stufen ab.

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core nutzt hier nichts. AMDs K10-Kern des Phenom arbeitet hier deutlich langsamer als der vom Core-2-Quad Q6600.
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. Im Quad-Core-Vergleich muss der Phenom 9900 den langsamsten Intel-Vierkerner Core-2-Quad Q6600 mit einer zirka 4 Prozent höheren Performance ziehen lassen.

Audio-Enkodieren: iTunes 7.5

Apples iTunes 7.5 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Beim MP3-Enkodieren nutzt iTunes 7.5 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus. Quad-Core-CPUs profitieren von ihren zusätzlichen Kernen nicht.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Vertont: Weil iTunes nur zwei Threads beim Enkodieren nutzt, profitieren die Quad-Core-Modelle nicht von ihren vier Kernen. Der Phenom 9900 hinkt trotz höherer Taktfrequenz dem Core-2-Quad Q6600 deutlich hinterher.

Video-Enkodieren: iTunes 7.5

Mit Apples iTunes 7.5 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 124 KBit/s und einer „mobilen“ Auflösung von 640 x 352 Bildpunkten. Dieses Video-Format ist für Apples iPod Touch und iPhone optimiert. iTunes 7.5 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.

Kurzfilm: Wie beim Audio-Enkodieren nutzt iTunes nur zwei Threads. Der Phenom 9900 belegt deshalb weiterhin nur den Platz hinter dem Core-2-Quad Q6600 und der Phenom 9600 bildet das Schlusslicht.

OpenGL: SPECviewperf 10

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 10 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualization Mockup und UGS NX.

Besonders die Anwendung Pro/ENGINEER (proe-04) stresst die Grafikkarte. Das dargestellte Modell im Workload besteht aus 3,9 bis 5,9 Millionen Eckpunkten. Jeder schattierte Frame des Modells beinhaltet mehr als 100 MByte an Status- und Vertex-Informationen.

Pro/ENGINEER: Multi-Core nutzt hier nichts. Der Phenom 9900 und 9600 entlocken der Grafikkarte eine zirka 17 Prozent höhere Framerate gegenüber dem Athlon 64 X2 6400+. Allerdings bleiben die Core-2-Modelle in Führung – doch nur knapp.

Die Einzelergebnisse von SPECviewperf 10 in der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist:

SPECviewperf 10

Prozessor

3dsmax-04

catia-02

ensight-03

maya-02

proe-04

sw-01

tcvis-01

ugnx-01

Athlon 64 X2 6400+ DDR2-800

10,8

7,5

13,5

20,6

8,8

14,0

3,9

4,6

Phenom 9600 DDR2-800

11,2

7,4

13,6

20,7

10,1

9,9

2,4

4,0

Phenom 9600 DDR2-1066

11,2

7,5

13,8

21,7

10,3

9,9

2,4

4,2

Phenom 9900 DDR2-1066

11,8

7,8

14,9

21,8

10,4

10,1

2,4

4,2

Core 2 Duo E6750 DDR3-1333

14,5

14,3

15,0

31,2

12,6

19,8

4,6

4,3

Core 2 Quad Q6600 DDR3-1066

12,0

7,6

15,0

21,8

10,5

11,2

2,7

4,2

Core 2 XE QX9650 DDR2-800

15,3

10,5

16,9

26,6

13,0

11,5

3,3

4,3

Core 2 XE QX9650 DDR3-1333

15,4

8,7

16,8

27,3

13,0

12,3

3,2

4,3

Obwohl je nach Applikation die Prozessoren die Grafikkarte unterschiedlich gut unterstützen, bleibt AMDs Phenom 9900 hin und wieder hinter seinem Hauptkonkurrenten Core-2-Quad Q6600 zurück – er ist nur in dem catia-02-Benchmark schneller.

DirectX 9: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

Gesamtwertung: Der Vorteil der Multi-Core-Technologie fließt in das Ergebnis ein. AMDs Phenom 9900 überholt die Dual-Core-Prozessoren und ist sogar ebenbürtig mit der vierkernigen Intel-CPU Q6600.

3Dmark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

CPU-Test: Ohne Hilfe der Grafikkarte distanzieren sich die Quad-Core-Modelle deutlich von den Doppelkernern. Der Phenom 9600 beißt sich am fast ein Jahr alten Core-2-Quad Q6600 die Zähne aus. Dagegen zieht der höher getaktete Phenom 9900 an der Intel-CPU vorbei. Der Core-2-Extreme QX9650 profitiert von DDR3-1333 mit 5 Prozent höherer Performance gegenüber DDR2-800-Speicher.

Crysis: 800 x 600 Low Quality

Das 3D-Spiel Crysis von Crytek unterstützt DirectX 10 und stellt hohe Anforderungen an die Hardware. Die komplexen grafischen Elemente der Spieleszenen sowie die Physik-Engine beanspruchen die Grafikkarte und den Prozessor besonders stark. Cryteks eingesetzte CryEngine 2 unterstützt Multi-Core-CPUs. In parallelen Threads führt Crysis Berechnungen für Audio- und Physikeffekte, das Partikelsystem sowie dem Daten-Streaming oder der KI durch.

Die Frameraten von Crysis mit den verschiedenen Prozessoren ermitteln wir bei einer Grafikauflösung von 800 x 600 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „low“. Als Szenario verwenden wir das in Crysis mitgelieferte Testskript „Benchmark_CPU.bat“. Die Grafikkarte wird nicht voll gefordert.

Minimale Framerate: Die vielen Kerne „behindern“ sich hier gegenseitig. Der Doppelkerner Core-2-Duo E6750 ist trotz geringer Taktfrequenz schneller als der Core-2-Extreme QX9650 mit vier Kernen. Die Phenom-Prozessoren liegen abgeschlagen am Ende.
Mittlere Framerate: Jetzt sortieren sich die Core-2-Prozessoren entsprechend ihrer Taktfrequenz ein. Die Phenoms hinken hinterher.
Maximale Framerate: Der Core-2-Extreme QX9650 erreicht mit DDR3-1333 eine 6 Prozent höhere Framerate gegenüber DDR2-800. Unverändert liegen die Phenoms am Ende des Feldes.

Crysis: 1024 x 768 Medium Quality

Jetzt ermitteln wir die Frameraten von Crysis mit den verschiedenen Prozessoren bei einer Grafikauflösung von 1024 x 768 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „medium“. Als Szenario verwenden wir das in Crysis mitgelieferte Testskript „Benchmark_CPU.bat“. Die Grafikkarte wird bereits stark belastet.

Minimale Framerate: Überraschend bricht die Framerate beim Athlon 64 X2 6400+ am wenigsten ein. Schneller Speicher bringt bei den CPUs hier einen deutlichen Schub, wie besonders am Phenom zu sehen ist. Trotz allem belegen die K10-Prozessoren nur die hinteren Positionen.
Mittlere Framerate: Die CPUs sortieren sich auch bei der 1024er-Auflösung wieder ihrer Taktfrequenz entsprechend ein – sauber getrennt nach Hersteller.
Maximale Framerate: Hier wird die Grafikkarte wieder am wenigsten gefordert. Die Rechenkraft der Prozessoren und ihre Speicheranbindung erhält bei der maximalen Framerate mehr Gewichtung.

Crysis: 1280 x 1024 High Quality

Welche Frameraten die Prozessoren bei Crysis bei einer Grafikauflösung von 1280 x 1024 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „high“ ermöglichen, ermitteln wir wieder mit dem Testskript „Benchmark_CPU.bat“. Die Grafikkarte arbeitet bei dieser Einstellung unter Volllast.

Minimale Framerate: Die Grafikkarte arbeitet bei diesem Test voll „auf Anschlag“.
Mittlere Framerate: Die Unterschiede zwischen den CPUs minimieren sich bei der durchschnittlichen Bildwiederholrate. Die Phenom-Architektur profitiert jetzt etwas von ihrer Quad-Core-Technologie und zieht am Athlon 64 X2 6400+ vorbei.
Maximale Framerate: Die Grafikkarte ist bei dieser Auflösung und hohen Darstellungsqualität deutlich die limitierende Komponente.

Energieverbrauch: Leerlauf

AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.

Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows Vista im „Leerlauf“ ohne aktivierten Energiesparmodus:

Regungslos: Trotz geringerem TDP-Wert von 95 Watt benötigen die vier 65-nm-Kerne des Phenom 9600 etwas mehr Energie als die 125-Watt-TDP-CPU Athlon 64 X2 6400+. Dagegen beweist der Phenom 9900 durch die höchste Leistungsaufnahme, dass sein TDP-Wert bei 140 Watt liegt. Dass der Core-2-Extreme QX9650 mit DDR3-1333 deutlich sparsamer ist als mit DDR2-800, liegt vor allem an den unterschiedlichen X38-Mainboards.

Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD Cool’n’Quiet zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:

Sparfüchse: Der Phenom 9600 arbeitet bei 2,3 GHz Taktfrequenz mit einer Core-Spannung von 1,25 V. Im Stromsparmodus reduziert Cool’n’Quiet 2.0 den Arbeitstakt auf 1,15 GHz bei einer Core-Spannung von 1,05 V. Damit spart die CPU zirka 14 Watt. Ebenso reguliert der Phenom 9900 seinen Leistungshunger, allerdings bei Ausgangswerten wie 2,6 GHz Taktfrequenz, 1,3 V Core-Spannung und einem TDP-Wert von 140 Watt. Sehr deutlich fällt die Einsparung beim Athlon 64 X2 6400+ aus. Bei den Intel-CPUs sinkt der Energiebedarf im Leerlauf mit SpeedStep nur marginal, weil bei den Prozessoren bereits andere Powersave-Technologien greifen. SpeedStep hilf bei den Intel-CPUs Energie zu sparen, wenn die Prozessorauslastung im „mittleren“ Bereich liegt.

Energieverbrauch: Volllast

Der Energieverbrauch der Plattformen steigt auf die Werte im Diagramm, wenn alle Kerne der Prozessoren unter voller Last arbeiten. Die Grafikkarte wird beim verwendeten Lasttest mit SunGard ACR nicht beansprucht.

Lasttest ohne Grafik: Unter Volllast macht sich die geringere TDP des Phenom 9600 im Vergleich zum Athlon 64 X2 6400+ bemerkbar. Die Intel-X38-Plattform mit den Core-2-Modellen benötigt deutlich weniger Energie als das AMD-System mit 790FX-Chipsatz. Dafür demonstriert der Phenom 9900 eindrucksvoll, dass er mit 140 Watt den höchsten TDP-Wert des Feldes hat.

Wird zusätzlich die Grafikkarte GeForce 8800 GTS über das DirectX-10-Spiel Crysis stark gefordert, so erhöht sich der Energiebedarf der Plattformen auf folgende Werte:

Lasttest mit Grafik: Die AMD-Plattform benötigt mit dem Phenom deutlich mehr Energie als die Core-2-Modelle mit dem X38-Mainboard. Für den Phenom 9900 gibt AMD einen TDP-Wert von 140 Watt an. Dagegen begnügt sich der Phenom 9600 mit nur 95 Watt.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 19. Dezember 2007 die letzten Änderungen. Intels Preisliste wurde am 5. September 2007 aktualisiert.

OEM- und Straßenpreise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Socket AM2+

Phenom 9900

2600

k.A.

k.A.

Phenom 9600 Black Edition

2300

283

250

Phenom 9600

2300

283

250

Phenom 9500

2200

251

230

Socket AM2

Athlon 64 X2 6400+ Black Edition

3200

220

165

Athlon 64 X2 6000+

3000

167

140

Athlon 64 X2 5600+

2800

146

120

Athlon 64 X2 5200+

2600

125

105

Athlon 64 X2 5000+ Black Edition

2600

136

125

Athlon 64 X2 5000+ 65 nm

2600

115

100

Athlon 64 X2 4800+ 65 nm

2500

104

90

Athlon 64 X2 4400+ 65 nm

2300

89

75

Athlon 64 X2 4200+

2200

78

75

Athlon 64 X2 4000+ 65 nm

2100

68

60

LGA775

Core 2 Extreme QX9650

3000 / 1333

999

940

Core 2 Extreme QX6850

3000 / 1333

999

885

Core 2 Extreme QX6800

2930 / 1066

999

885

Core 2 Extreme QX6700

2670 / 1066

999

860

Core 2 Extreme X6800

2930 / 1066

999

840

Core 2 Quad Q6700

2670 / 1066

530

480

Core 2 Quad Q6600

2400 / 1066

266

225

Core 2 Duo E6850

3000 / 1333

266

235

Core 2 Duo E6750

2670 / 1333

183

160

Core 2 Duo E6700

2670 / 1066

316

280

Core 2 Duo E6600

2400 / 1066

224

205

Core 2 Duo E6550

2330 / 1333

163

140

Core 2 Duo E6400

2130 / 1066

183

140

Core 2 Duo E6300

1860 / 1066

163

150

Core 2 Duo E4400

2000 / 800

113

100

Core 2 Duo E4300

1800 / 800

113

100

TecChannel Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Wie bereits beim Phenom 9600 fällt das Fazit des Phenom 9900 ernüchternd aus. AMDs zweiter Quad-Core-Prozessor für Desktop-PCs schafft es nicht, dem vom Hersteller selbst auserwählten Hauptkonkurrenten Intel Core-2-Quad Q6600 eindeutig zu schlagen. Allerdings kommt der neue AMD-Prozessor dem Intel-Kontrahenten ein Stück näher als der Phenom 9600.

Dabei handelt es sich beim günstigeren Intel-Prozessor um die fast ein Jahr alte Einstiegsversion bei den Quad-Core-Modellen. Die Ablösung mit den noch schnelleren 45-nm-Penryn-Versionen steht im vierkernigen Einstiegsbereich kurz bevor. Das bereits erhältliche 45-nm-Topmodell Core 2 Extreme QX9650 zeigt, welches Leistungsvermögen, Energiespar- und Taktfrequenzpotenzial in der Intel-45-nm-Architektur steckt.

Hier liegt AMDs größtes Problem – die Taktfrequenz. Nicht ohne Grund wurde das für den Launch ebenfalls geplante 2,4-GHz-Modell Phenom 9700 kurzerhand auf das erste Quartal 2008 verschoben, und auch unser Testkandidat Phenom 9900 mit 2,6 GHz Taktfrequenz wird kaum früher auf dem Markt zu haben sein. Wann aber konkret und zu welchem Preis der Phenom 9900 zu haben sein wird, konnte uns AMD nicht sagen.

Kommen kein intensives Multitasking oder multithreaded-optimierte Anwendungen zum Einsatz, so zieht dem Phenom 9600 beziehungsweise Phenom 9900 selbst der günstigere Vorgänger Athlon 64 X2 6400+ mit 3,2 GHz teilweise davon. Sicherlich, der Phenom 9900 ist im Vergleich zum Phenom 9600 deutlich schneller, aber für eine konkurrenzfähige Desktop-CPU fällt die Leistung gegenüber den Intel-CPUs immer noch zu gering aus. Darüber hinaus ist der spezifizierte TDP-Wert von 140 Watt beim Phenom 9900 enorm hoch, dagegen begnügt sich der Phenom 9600 mit 95 Watt.

Ein weiteres Manko ist der TLB-Bug im B2-Stepping aller Phenom-CPUs. Dieser soll unter „bestimmten“ Umständen zur Instabilität der Systemplattform führen. Mit einem entsprechenden BIOS-Update soll das Problem gelöst sein. Allerdings sind Performance-Einbußen bei einigen Anwendungen von bis zu 10 Prozent nicht auszuschließen. Überarbeitete Prozessoren mit B3-Stepping sollen diesen Bug nicht mehr besitzen und ab Q1 verfügbar sein.

AMD hat angekündigt, die Taktfrequenz des Phenom bis Mitte 2008 auf 3,0 GHz zu steigern. Notwendig wären die 3,0 GHz jetzt. Denn: Der schnellste Phenom verliert gegen den langsamsten Core-2-Quad. (cvi/hal)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows Vista Business in der 32-Bit-Version durchgeführt.

Socket-AM2+-Plattform: Das Gigabyte GA-MA790FX-DQ6 verwendet als Chipsatz AMDs 790FX. Beim Speicher steuert das Board Dual-Channel-DDR2-1066-SDRAM an.

AMDs Phenom 9900 und 9600 für den Socket AM2+ testen wir in einem Gigabyte GA-MA790FX-DQ6 mit AMD 790FX Chipsatz. Der CPU stehen 2 GByte Dual-Channel DDR2-1066-Speicher mit CL5 von takeMS zur Verfügung. Über den im Phenom integrierten Speicher-Controller konfigurieren wir die DIMMs für unsere Tests jeweils mit 800 und 1066 MHz. Dem Athlon 64 X2 6400+ steht ebenfalls das Gigabyte-Mainboard zur Verfügung. Die Socket-AM2-CPU arbeitet im GA-MA790FX-DQ6 mit HT-2.0-Geschwindgkeit und steuert die Speicherriegel von takeMS als DDR2-800-DIMMs an. Das Mainboard arbeitet mit dem BIOS (F2H) vom 1.11.2007 und bietet noch keine Unterstützung für das TLB-Problem. Somit ist gewährleistet, dass die CPU mit maximaler Performance läuft.

LGA775-Plattform: Das P5E3 Deluxe von Asus setzt auf Intels X38-Express-Chipsatz. Das Mainboard unterstützt DDR3-1333-Speicher in einer Dual-Channel-Konfiguration.

Intels Core-2-Prozessoren nehmen im Asus P5E3 Deluxe mit X38-Express-Chipsatz Platz. Den FSB1333-Modellen Core 2 Duo E6750 und Core 2 Extreme QX9650 steht als Arbeitsspeicher jeweils 2 GByte DDR3-1333-SDRAM mit CL7 in einer Dual-Channel-Konfiguration zur Verfügung. Die FSB1066-CPU Core 2 Quad Q6600 steuert den DDR3-Speicher von OCZ mit 1066 MHz an. Den Core 2 Extreme QX9650 testen wir zusätzlich im X38-Mainboard Asus Maximus Formula. Das LGA775-Board steuert DDR2-800-Speicher mit CL5 an. Damit können wir die Performance-Unterschiede von DDR2-800 zu DDR3-1333 ermitteln.

DDR2-Speicher: Die Mach2-Series von takeMS erlaubt Speichergeschwindigkeiten bis 1066 MHz.
DDR3-Speicher: Die Platinum Series von OCZ ermöglicht DDR3-Taktfrequenzen von 1066, 1333 und 1600 MHz.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer Zotac GeForce 8800GTS bestückt. Der DirectX-10-Grafikkarte mit 320 MByte Grafikspeicher stand der ForceWare-Treiber Release 163.69 zur Seite.

Referenzgrafik: Zotacs GeForce 8800GTS arbeitet mit 570 MHz Core-Taktfrequenz und steuert 320 MByte GDDR3 an.

Einheit herrschte auch beim 620-Watt-Netzteil Enermax Liberty ELT620AWT und den Massenspeichern – die Serial-ATA-II-Festplatte Seagate Barracuda 7200.10 mit 250 GByte Kapazität.