Lange ist her bei AMD mit einem wirklich neuen Prozessor… Doch jetzt gibt es mit Bulldozer den Nachfolger der 2007 eingeführten K10-Architektur der aktuellen Opteron- und Phenom-Prozessoren. Im Prinzip stellt Bulldozer jedoch den ersten neuen Architekturansatz seit den 2003 eingeführten K8-CPUs Opteron 200/800 und Athlon 64 dar.
Die Richtung, die AMD mit Bulldozer einschlägt, sei durch die Analyse der typischen Workloads vorgegeben. Mehr als 80 Prozent aller Programme nutzen laut AMD Integer-Befehle. Floating Point werde nur zu 20 Prozent aller Rechenoperationen genutzt. Und deshalb hat AMD die Bulldozer-Architektur insbesondere auf eine hohe Performance bei Ganzzahlenberechnungen ausgelegt. Gerade im Server-Umfeld trifft diese Einschätzung auch zu. So sagt auch AMD selbst, Bulldozer sei primär für den Einsatz in Servern optimiert. Noch im vierten Quartal 2011 soll es den Opteron 4200 Valencia und Opteron 6200 Interlagos geben.
Doch jetzt gibt es mit der AMD FX-Serie zuerst Desktop-Prozessoren mit Bulldozer-Architektur. Die unter dem Codenamen "Zambezi" bekannten CPUs gibt es mit vier, sechs und acht Kernen. Unser getestetes Topmodell AMD FX-8150 bezeichnet AMD als den weltweit ersten 8-Core-Desktop-Prozessor. Doch aus acht Kernen werden je nach Workload schnell nur vier. Denn Bulldozer unterscheidet sich von "klassischen" Multi-Core-Designs, wo jeder Kern seine eigenen Funktionseinheiten besitzt.
Auch lässt sich Bulldozer nicht mit Intels Hyper-Threading-Verfahren vergleichen, wo zwei virtuelle Kerne in einem Core alle Funktionseinheiten besser auslasten sollen. Während somit bei Hyper-Threading zwei Threads in einen Core "gezwungen" werden, gibt es bei Bulldozer einen dedizierten Core für beide Threads - allerdings nur bei Integerberechnungen. AMD integriert in einem "Bulldozer-Kern", der jetzt die Bezeichnung Modul besitzt, zwei Integer-Cores. Während die Fetch- und Decoder-Unit beide Kerne gemeinsam nutzen, besitzt jeder Integer-Core aber einen eigenen Scheduler sowie einen L1-Daten-Cache. Bei Fließkommaberechnungen sieht es anders aus. So landen die Floating-Point-Operationen nach der gemeinsam pro Modul genutzten Fetch- und Dekoder-Stufe in einem FP-Scheduler. Die Floating-Point-Einheiten sind im Gegensatz zu Integer aber nicht in zwei "Kerne" aufgespalten. Alle Rechen-Units nutzen dann gemeinsam den nachgeschalteten L2-Cache, der beim AMD FX-8150 eine Größe von 8 MByte besitzt.
Der 8-Core-Prozessor AMD FX-8150 besteht somit aus vier Modulen. Oder besser gesagt aus acht Integer- und vier Floating-Point-Kernen. Durch das Bulldozer-Design wird laut AMD auch weniger Energie benötigt, weil es weniger "brachliegende Units" wie bei einem richtigen Dual-Core-Design gibt. Floating Point werde eh nur zu 20 Prozent aller Rechenoperationen genutzt. Ziel von Bulldozer ist laut AMD auch, bei ähnlicher Siliziumfläche, Taktfrequenz und TDP die Anzahl der parallel zu verarbeitenden Threads zu erhöhen; und somit die Energieeffizienz.
Overclocking: FX-Serie zum Übertakten
Verwunderlich ist die Tatsache, wie sehr AMD beim FX jetzt auf die Übertaktungsmöglichkeiten hinweist. Einige Enthusiasten werden den Prozessor sicherlich in der Frequenz hochtreiben, doch eigentlich sollte eine neue Architektur auch innerhalb der Spezifikation schnell genug sein. Außerdem interessiert mehr die Energieeffizienz, nicht nur die pure Rechenleistung. Doch beim FX verliert AMD darüber kaum Worte…
Umso spannender ist der Vergleich des neuen AMD FX-8150 mit seinen Vorgängern Phenom II X4 und Phenom II X6 sowie insbesondere mit Intels Core i5-2500K und Core i7-2600K. Bei einem von AMD bezifferten Preis von 245 US-Dollar liegt der FX-8150 nämlich genau zwischen den beiden erwähnten Intel-CPUs.
AMD FX-Serie: Neue Features im Detail
AMD bietet seine FX-Serie mit vier (FX-4100), sechs (FX-6100) und acht Kernen (FX-8100) an. Entsprechend sind somit zwei, drei beziehungsweise vier Module implementiert. Ein FX-8150 mit vier Modulen ist somit laut AMD ein 8-Core-Prozessor, auch wenn es sich nur um Integer-Kerne handelt. Das Betriebssystem identifiziert den FX-8150 ebenfalls mit acht Kernen.
Auf einem Bulldozer-Modul besitzt jede Integer-Unit einen dedizierten 16 KByte fassenden L1-Cache für Daten. Der im Frontend des Moduls platzierte L1-Befehlspuffer hat eine Größe von 64 KByte. AMD spendiert pro Modul zudem einen 2 MByte großen Shared L2-Cache, den beide Integer-Einheiten und die Floating-Point-Unit gemeinsam nutzen. Bei der AMD FX-8100-Serie mit vier Modulen besitzt der Prozessor somit insgesamt 128 KByte L1-Cache für Daten, einen 256 KByte L1-Befehlspuffer sowie 8 MByte L2-Cache. Desweitern integriert AMD bei jedem FX-Prozessor noch einen 8 MByte fassenden L3-Cache. Summiert können die FX-8100er Topmodelle auf über 16 MByte Cache zurückgreifen. Alle Module integriert AMD bei den FX-Prozessoren jeweils auf dem gleichen 32-nm-Siliziumplättchen.
Neben Verfeinerungen in den Fetch Units und den Sprungvorhersagen wartet die Bulldozer-Architektur mit den Befehlssätzen SSE 4.1, SSE 4.2 sowie AES und AVX auf. Damit unterstützt der AMD FX wieder alle aktuellen Erweiterungen von Intels Core-Prozessoren der zweiten Generation. Zusätzlich erweitert AMD den AVX-Befehlssatz um die Befehle FMA4 und XOP. Ein Bulldozer-Modul kann im Gegensatz zur K10-Architektur (Athlon II, Phenom II) auch vier statt nur drei Befehle pro Taktzyklus dekodieren.
AM3+, DDR3-1866 und Max Turbo CORE
AMDs FX-Serie nimmt im neuen Socket AM3+ Platz. Wirklich neu ist der Steckplatz allerdings nicht, denn er ist abwärtskompatibel zum Socket AM3 des bisherigen Athlon II und Phenom II.
Laut AMD sind vorhandene Socket-AM3-Mainboards nicht kompatibel zur FX-Serie. Trotz identischer Pin-Belegung ist der Socket AM3+ für höhere Spitzenströme ausgelegt, die durch Max Turbo CORE beim FX kurzfristig zustande kommen können. Außerdem garantiert AM3+ höhere Ströme für schnelleres DRAM. Zudem ist der Steckplatz für HyperTransport-Geschwindigkeiten von bis zu 5,2 GT/s ausgelegt. Einige Hersteller von Socket-AM3-Mainboards geben für ihre Produkte allerdings eine Kompatibilität zur FX-Serie an. Primär muss das Mainboard somit bereits für die höheren möglichen Lastspitzen ausgelegt sein.
Durch die identische Pin-Belegung setzt der FX wieder auf einen Speicher-Controller für Dual-Channel-DDR3-DIMMs. Allerdings unterstützen die FX-Prozessoren nun Speichergeschwindigkeiten von bis zu 1866 MHz. Beim Chipsatz für die FX-Serie und Mainboards mit Socket AM3+ präferiert AMD die bereits bekannte 9-Series, wie den 990FX.
AMD führte mit dem Phenom II X6 erstmals Turbo CORE ein. Die Technologie erhöht bei den Hexa-Core-Phenoms automatisch die Taktfrequenz von drei Kernen, wenn mindestens drei Kerne gleichzeitig im Idle-Mode sind. Wie bei Intel Turbo-Technologie bleibt man bei AMD innerhalb der TDP-Grenzen der Prozessoren. Sind mehr als drei Kerne unter Last, so bleibt es bei der Grundtaktfrequenz.
Bei der FX-Serie verfeinerte AMD Turbo CORE. So arbeitet beispielsweise das neue Topmodell FX-8150 mit einer Grundtaktfrequenz von 3,6 GHz. Durch Turbo CORE können nun aber auch alle acht Kerne mit bis zu 3,9 GHz takten - solange der Multithread-Workload den Prozessor nicht über die TDP-Grenze treibt. Workloads unterscheiden sich oft erheblich im Energiebedarf der CPU, selbst bei Multithread-Optimierung.
Sind Workloads aktiv, die nicht multithread-optimiert sind, so schickt Turbo CORE die Hälfte der Kerne in den Energiesparmodus C6 "schlafen". Die übrigen Kerne können dann mittels Max Turbo CORE über die Turbo-Frequenz hinaus arbeiten. Beim FX-8150 dürfen vier Kerne dann mit bis zu 4,2 GHz takten.
Modellüberblick: Alle AMD FX-Prozessoren
Zur offiziellen Vorstellung der AMD FX-Serie "Zambezi" gibt es die drei Modell FX-6100, FX-8120 und FX-8150. Der FX-6100 besteht aus drei Modulen und besitzt somit sechs Kerne, wie die erste Zahl in der Modellnummer zeigt. Der Prozessor arbeitet mit 3,3 GHz Grundtaktfrequenz und kann via Turbo CORE alle sechs Kerne auf bis zu 3,6 GHz übertakten. Sind nur drei Kerne aktiv, so ermöglicht Max Turbo CORE bis zu 3,9 GHz Taktfrequenz. Durch die Verwendung von drei Modulen besitzt der FX-6100 einen L2-Cache von 6 MByte.
Mit dem FX-8120 und FX-8150 bietet AMD zwei 8-Core-Prozessoren an. Der 8120er mit 3,1 GHz Grundtaktfrequenz kann alle Kerne auf 3,4 GHz hochtreiben und vier Cores auf bis zu 4,0 GHz. Beim Topmodell FX-8150 mit 3,6 GHz Basistakt sind 3,9 GHz für alle und 4,2 GHz für vier Kerne möglich. Beide Octa-Core-CPUs besitzen durch vier Module insgesamt 8 MByte L2-Cache.
Alle neuen FX-Prozessoren haben auf dem 32-nm-Siliziumplättchen einen 8 MByte fassenden L3-Cache integriert. Die TDP des FX-6100 spezifiziert AMD mit 95 Watt, die 8100er Modelle sind mit 125 Watt angegeben. Zu einem späteren Zeitpunkt wird AMD die weiteren Zambezi-Prozessoren FX-4100 (4 Cores / 3,6 GHz Basis / 95 W), FX-B4150 (4 Core / 3,8 GHz Basis / 95 W), FX-4170 (4 Core / 4,2 GHz Basis / 125 W) und FX-8100 (8 Core / 2,8 GHz Basis / 95 W) vorstellen. Außerdem soll es dann einen FX-8120 mit 95 statt 125 Watt TDP geben.
AMD ermöglicht bei allen FX-Prozessoren das Übertakten durch freie Multiplier. Laut AMD soll ein FX-8150 mit Luftkühlung und Max Turbo CORE statt 4,2 bis zu 5,0 GHz durch Hochsetzen der Multiplier erreichen. Mit Wasserkühlung seien bis zu 5,2 GHz möglich. So bietet AMD den FX auch als Boxed-Version inklusive Wasserkühlung an.
In der folgenden Tabelle haben wir die Merkmale aller FX-Prozessoren zusammengefasst:
Modell |
Grundtaktfrequenz |
Turbo CORE |
Max Turbo CORE |
Anzahl Kerne |
Module |
L2-Cache |
L3-Cache |
TDP |
Speicher |
HT-Takt |
Strukturbreite |
Preis in US-Dollar |
---|---|---|---|---|---|---|---|---|---|---|---|---|
FX-8150 |
3,6 GHz |
3,9 GHz |
4,2 GHz |
8 |
4 |
8 MByte |
8 MByte |
125 W |
DDR3-1866 |
2,2 GHz |
32 nm |
245 |
FX-8120 |
3,1 GHz |
3,4 GHz |
4,0 GHz |
8 |
4 |
8 MByte |
8 MByte |
95 / 125 W |
DDR3-1866 |
2,2 GHz |
32 nm |
205 |
FX-8100 |
2,8 GHz |
3,1 GHz |
3,7 GHz |
8 |
4 |
8 MByte |
8 MByte |
95 W |
DDR3-1866 |
2,0 GHz |
32 nm |
k.A. |
FX-6100 |
3,3 GHz |
3,6 GHz |
3,9 GHz |
6 |
3 |
6 MByte |
8 MByte |
95 W |
DDR3-1866 |
2,0 GHz |
32 nm |
175 |
FX-4170 |
4,2 GHz |
-- |
4,3 GHz |
4 |
2 |
4 MByte |
8 MByte |
125 W |
DDR3-1866 |
2,2 GHz |
32 nm |
k.A. |
FX-B4150 |
3,8 GHz |
3,9 GHz |
4,0 GHz |
4 |
2 |
4 MByte |
8 MByte |
95 W |
DDR3-1866 |
2,2 GHz |
32 nm |
k.A. |
FX-4100 |
3,6 GHz |
3,7 GHz |
3,8 GHz |
4 |
2 |
4 MByte |
8 MByte |
95 W |
DDR3-1866 |
2,0 GHz |
32 nm |
k.A. |
Benchmark-Analyse
Geschwindigkeit: AMD hat bereits bei der Präsentation der Bulldozer-Architektur zur ISSCC im Februar 2011 angegeben, dass ein Modul (zwei Integer-Cores plus eine FP-Unit) zirka 80 Prozent der Performance zweier herkömmlicher Kerne bieten soll - allerdings bei geringerem Energiebedarf und weniger Siliziumfläche. Die damalige schwer einzuschätzende Aussage bestätigen nun unsere Testergebnisse.
Bei typischen Office-Anwendungen und im Alltagsbetrieb arbeitet der FX-8150 zirka sieben bis zehn Prozent langsamer als ein Phenom II X4 980 (Quad-Core / 3,8 GHz). Das doch enttäuschende Ergebnis zeigt sich sowohl beim SYSmark2007 als auch beim PCMark Vantage. Die Workloads sind dabei nicht Multithread-optimiert, spiegeln aber typische Alltagsarbeiten wieder. Intels Core i5-2500K, den AMD als Hauptkonkurrenten für den FX-8150 nennt, zieht dem Bulldozer bereits um eine 27 Prozent höhere Systemleistung (SYSmark2007) davon.
Das für eine komplett neue Architektur ernüchternde Ergebnis zeigt sich auch bei den Tests der Single-Thread-Performance. Beim Rendering mit CINEBENCH 11.5 werden viele Fließkommaberechnungen verwendet (ohne SSE-Optimierung). Im Single-Thread-Test erreicht der FX-8150 trotz 4,2 GHz Taktfrequenz (Max Turbo CORE) nur 93 Prozent der Performance eines Phenom II X4 980 (3,7 GHz). Bei dem älteren CINEBENCH 10 schafft der FX-8150 sogar nur 89 Prozent. Ein Core i5-2500K arbeitet beim Single-Thread-Rendering zirka 45 bis 62 Prozent schneller. Auch bei iTunes, wo beim Audio- und Video-Konvertieren nur 2 Threads genutzt werden, liegt der FX-8150 ähnlich zurück.
Werden beim Rendering alle Kerne ausgenutzt, so sieht es für den 8-Core-Prozessor FX-8150 schon besser aus. Bei CINEBENCH 11.5 zieht der Bulldozer dem Phenom II X4 980 mit 43 Prozent höherer Performance davon. Bei 3ds Max 2010 enteilt der FX-8150 dem Quad-Core-Phenom noch um 31 Prozent. Auch gegenüber dem Hexa-Core-Prozessor Phenom II X6 1100T (3,3 GHz) arbeitet der FX-8150 noch 7 Prozent (CINEBENCH 11.5) beziehungsweise 14 Prozent (3ds max 2010) schneller. Im Vergleich zum vierkernigen Core i5-2500K sieht es schon wieder nicht so gut aus: Die Intel-CPU ist bei 3ds max 2010 zirka 12 Prozent schneller. Immerhin ist es bei CINEBENCH 11.5 anders herum. Ein Core i7-2600K (Quad-Core + Hyper-Threading) lässt dem Bulldozer allerdings nirgends eine Chance.
Was die Bulldozer-Architektur zu leisten vermag, zeigt sich, wenn nur Integer-Operationen zum Einsatz kommen. Bei der hoch Multithread-optimierten Finanzsimulation SunGard, die auf C# basiert, arbeitet der FX-8150-Prozessor 50 Prozent schneller als der Phenom II X4 980 und noch 15 Prozent flinker als der Phenom II X6 1100T. Ein Core i5-2500K schafft allerdings mit vier Kernen die Rechenleistung des 8-Core-Bulldozers.
Energieeffizienz: AMD stuft den FX-8150 unverändert zu einem Phenom II X4 980 und Phenom II X6 1100T mit 125 Watt TDP ein. Wenig überraschend benötigt die Socket-AM3+-Plattform unter hoher Rechenlast mit 238 Watt aber etwas mehr Energie als ein Phenom II X6 1100T (229 Watt). Turbo CORE nutzt beim FX-8150 selbst bei Auslastung aller Kerne die TDP-Grenze besser aus. Immerhin arbeitet die Bulldozer-CPU gleichzeitig bis zu 14 Prozent schneller.
Im Vergleich zum ebenfalls im 32-nm-Verfahren produzierten Core i5-2500K sieht die Energieeffizienz des FX-8150 allerdings vernichtend schlecht aus. Die LGA1155-Plattform konsumiert unter voller Rechenlast mit dem Core i5-2500K nur 131 Watt - bei durchschnittlich ähnlicher Performance. Zumindest im Leerlauf zeigt sich der FX-8150 zusammen mit der FX990-Plattform mit 88 Watt relativ genügsam. Ein Core i5-2500K begnügt sich im Idle-Modus mit der LGA1155-Plattform allerdings mit nur 71 Watt.
Fazit
Die Erwartungen an den FX-Prozessor mit der Bulldozer-Architektur waren groß. Die Enttäuschung über das Leistungsvermögen und die Energieeffizienz des getesteten 8-Core-Prozessors AMD FX-8150 ist allerdings ebenso groß.
So kommt der von AMD auffällig gelegte Fokus auf die Übertaktungsfähigkeiten des FX-Prozessors mit Rekordwerten wohl nicht von ungefähr: Im "normalen" Betrieb ist der FX-8150 in den meisten Anwendungen und Szenarien bereits einem Core i5-2500K unterlegen, von der Energieeffizienz ganz zu schweigen. Selbst ein günstigerer Phenom II X6 1100T ist dem Bulldozer bei typischen Workloads meist ebenbürtig. Und eine 15 Prozent höhere Performance bei Multithread-optimierten Programmen ist für eine 8-Kern-CPU mit neuer Architektur gegenüber dem Hexa-Core-Vorgänger auch kein Ruhmesblatt - insbesondere, weil der FX-8150 unter Last nicht sparsamer agiert.
Natürlich beherrscht Bulldozer als moderne Architektur die Befehlssatzerweiterungen SSE 4.2, AES und AVX. Nutzt Software diese aus, so bietet der FX-8150 zumindest gegenüber den Phenom-II-CPUs deutliche Vorteile. Ein Core i5-2500K besitzt die Erweiterungen ja ebenfalls. Unerwähnt blieb bisher noch, dass der etwas günstigere Core i5-2500K zusätzlich über eine integrierte Grafik-Engine verfügt.
Alles in allem spricht spricht sehr wenig für AMDs FX-8150: Intels Core i5-2500K ist günstiger, insgesamt schneller und deutlich sparsamer. Und ebenfalls übertaktbar, falls das von Interesse sein sollte. Bleibt für AMD zu hoffen, dass die Bulldozer-Architektur in Form des Opteron 6200 Interlagos im Server-Einsatz einen deutlich besseren Eindruck hinterlassen wird. (cvi)