Test: AMD Thunderbird

25.06.2000 von Michael Eckert
Intel konnte dem Pentium III mit integriertem L2-Cache einen weiteren Leistungsschub verpassen. Nun ist AMD auch mit dem Athlon so weit. Wir haben getestet, um wie viel schneller die unter dem Codenamen Thunderbird entwickelte CPU tatsächlich ist.

Taktfrequenz ist nicht alles. Trotz prinzipiell überlegener Architektur verlor der Athlon mit steigender Taktfrequenz Boden an den Pentium III, weil dieser bereits mit einem integrierten, mit voller Taktfrequenz arbeitenden L2-Cache ausgestattet ist. Mit dem Thunderbird schickt sich AMD erneut an, den alten Vorsprung im Wettrennen mit Intel wieder herzustellen.

Bei den immer schnelleren CPUs wird zunehmend der Arbeitsspeicher zum Flaschenhals. Mit PC133-SDRAM hat sich in dieser Hinsicht schon einiges verbessert, aber trotzdem ist ein schneller L2-Cache als Puffer sehr wichtig. Bei den alten Pentium-III- und Athlon-Modellen sitzt der L2-Cache auf der CPU-Platine. Dort arbeitet er zwar mit höherem Takt als der Arbeitsspeicher, aber nicht mit der vollen Core-Frequenz. In der Regel wird der L2-Cache dann mit der halben oder ein drittel der Core-Taktfrequenz betrieben. Noch höhere Taktfrequenzen lassen sich auf den Platinen physikalisch kaum in den Griff bekommen. Außerdem sind schnelle Cache-Bausteine sehr teuer.

Als Lösung bietet sich die Integration des L2-Caches auf dem Prozessor-Die an, die aber erst mit einer Fertigungstechnologie von 0,18 Mikron rentabel ist, in der sowohl der Pentium III als auch der Thunderbird hergestellt werden.

Die neuen CPUs von AMD wurden zwar unter dem Codenamen Thunderbird entwickelt, in den Handel werden sie aber unter dem Namen Athlon kommen. Laut AMD soll es keine Zusatzbezeichnung zur Kennzeichnung der Thunderbirds geben. Lediglich für PC-Systeme ist ein Aufkleber mit dem Hinweis "Performance-Enhancing Cache Memory" angedacht.

Zum Start soll der neue Athlon mit Taktfrequenzen zwischen 750 MHz und 1000 MHz zu haben sein. Wir haben die langsamste und die schnellste Version des Thunderbird getestet.

Socket A / Preise

Eine CPU-Platine macht bei einem integrierten L2-Cache keinen Sinn mehr, denn sie wird nur als "Träger" für die externen Cache-Bausteine benötigt. Wie schon Intel, kehrt damit auch AMD mit den Thunderbirds zum Sockel zurück.

Der Socket A hat 462 Pins und ist bei AMD klar als der Steckplatz der Zukunft definiert - der Slot A wird immer unwichtiger, wie das nachfolgende Bild beweist.

AMD fertigt den neuen Athlon zunächst noch parallel für den Socket A und den Slot A. Der Thunderbird für den Slot A wird aber im Handel nicht zu sehen sein. Er soll zunächst nur an ausgewählte OEMs gehen, weil AMD Probleme mit älteren Slot-A-Mainbords auf Basis des KX-Chipsets von VIA vermeiden will. Anlässlich der Computex in Taipeh nannte AMD folgende Preise (OEM-Preise für 1000er-Stückzahlen):

Athlon Thunderbird: OEM-Preise

MHz

Preise in US-Dollar

Stand: 5.6.2000

1 GHz

990 $

950

759 $

900

589 $

850

507 $

800

359 $

750

319 $

L2-Cache: Theorie

Der 256 KByte große L2-Cache sitzt beim Thunderbird direkt auf dem Die. Er arbeitet mit voller Core-Taktfrequenz und ist 16fach assoziativ. Bei den bisherigen Athlon-Modellen mit externem L2-Cache war er nur 2fach assoziativ, dafür aber 512 KByte groß. Ausführliche Informationen zu Assoziativ-Caches finden Sie im tecChannel-Beitrag Prozessorgrundlagen im Abschnitt Cache-Grundlagen.

Am L1-Cache hat AMD dagegen nichts geändert, denn er ist nach wie vor 2fach assoziativ und 128 KByte groß - je 64 KByte für Befehle und Daten.

Um die Produktionsausbeute zu verbessern, sitzen auf dem Die redundante Cache-Lines, die bei der Produktion als Ersatz für defekte Speicherzellen im Cache-Array zugeschaltet werden können.

Beim Thunderbird beansprucht der neue L2-Cache rund 20 Prozent der Die-Fläche, die nun 120 mm² groß ist und 37 Millionen Transistoren beherbergt. Beim alten Athlon für den Slot A waren es nur 22 Millionen Transistoren auf dem Die.

L2-Cache: Praxis

Unsere Messungen mit unserem Lowlevel-Programm tecMEM zeigen wie erwartet auch keine Änderungen bei der Speichertransferrate und der Kurvenform des L1-Caches (linker Teil der Transferkurve). Beim L2-Cache fällt die deutlich höhere Transferrate von 2505 MByte/s beim Lesen und 1324 MByte/s beim Schreiben auf, die durch den höheren Cache-Takt möglich sind. Auch dass die Kurve bei 384 KByte absackt, ist kein Wunder: 64 KByte L1-Daten-Cache plus 256 KByte L2-Cache macht 384 KByte.

Im Vergleich zu den alten Athlon-Modellen hat sich durch die L2-Cache-Integration die Latency von 21 auf elf Taktzyklen verringert. Allerdings gibt AMD nicht an, ob es sich bei dem Vergleichsobjekt um einen mit halber (bis 700 MHz) oder ein drittel der Core-Frequenz angekoppelten L2-Cache handelt.

Der durch die höhere Assoziativität bewirkte bessere Hit-Rate lässt sich mit Lowlevel-Benchmarks kaum praxisnah testen. Die Vorteile des neuen L2-Caches zeigen aber die Anwendungs-Benchmarks auf den nächsten Seiten deutlich.

2D-Benchmarks: Windows 98

Die Performance bei Standard-Anwendungen ist auch bei Prozessoren immer noch am wichtigsten. Dazu gehören nicht nur Programme wie Winword und Excel, sondern auch MPEG-Encoder, 3D- und Sound-Software. Die Prozessorhersteller stürzen sich begeistert auf den Spielebereich, weil es dort immer noch mehr Bedarf an Rechenpower gibt. Auch das Internet wurde als potenzieller Schrittmotor für schnellere Prozessoren erkannt, auch wenn die Praxis zeigt, dass beim Surfen im Internet SSE oder 3DNow! nicht unbedingt erforderlich sind.

Die klassischen 2D-Anwendungen profitieren fast ausschließlich von der Integer-Performance einer CPU. Allerdings wird auch die Zahl der Sound- und Grafikprogramme immer größer, die wie Spiele eine schnelle FPU oder Befehlserweiterungen wie MMX, SSE oder 3DNow! bevorzugen. Wir überprüfen die Leistungsfähigkeit der Prozessoren mit dem Benchmark-Paket SYSMark98, das ein Mix aus den angesprochenen Programmen ist.

Bei gleicher Speicherausstattung mit PC100-SDRAM übertrifft der Thunderbird 1000 den Athlon 1000 um 6,1 Prozent. Mit PC133-SDRAM legen die neuen Modelle sogar um 9,1 Prozent zu.

2D-Benchmarks: Windows NT 4.0

Mit der Positionierung des Athlon im Highend- und später auch im Server- und Workstation-Bereich ist auch unter Windows NT Performance gefragt. Die AMD-CPUs vor dem Athlon waren in dieser Hinsicht zu schwach und zu sehr auf Windows 95/98 optimiert. Das Benchmark-Diagramm beweist, dass die Texaner ihre Hausaufgaben gemacht haben.

Mit PC100-SDRAM ist der Thunderbird 4,1 Prozent schneller als ein gleich hoch getakteter Athlon alter Bauart. Mit PC133-SDRAM liegt der Thunderbird mit 6,4 Prozent vorne.

3D-Benchmarks: 3DMark99 Max Pro

Der 3D-Benchmark 3DMark99 Max Pro reizt auch die Fähigkeiten der 3D-Befehlserweiterungen SSE von Intel und 3DNow! von AMD aus. Er ist eine gute Vergleichsmöglichkeit für die FPU-Performance und den 3D-Befehlssatz. Wir verwenden den Benchmark ohne die zusätzliche Athlon-DLL von AMD. Die Optimierung für 3DNow! entspricht somit der für die K6-3-Reihe. Das ist näher an der Praxis, weil die aktuellen 3D-Spiele auch noch nicht für den Athlon optimiert sind. Der Pentium III wird von 3DMark99 Max Pro dagegen schon standardmäßig erkannt. Das Gesamtergebnis von 3DMark99 Max Pro hängt stark von der Grafikkarte ab. Da wir bei diesem Test aber immer die gleiche Erweiterung verwendet haben, sind verfälschende Einflüsse ausgeschlossen.

3D-Spiele: Quake 3 Arena

Die immer aufwendigeren 3D-Spiele fordern von der Hardware die meiste Leistung. Besonders ist dabei die FPU-Performance gefragt. Die Grafikkarte wirkt sich teilweise schon bremsend aus und grundsätzlich ist bei diesen Tests zu beachten, wie dicht die CPUs beieinander liegen. Dass beispielsweise der Pentium III 1000 "nur" 109,4 fps erreicht und hinter dem Thunderbird 1000 mit 110,5 fps liegt, ist in der Praxis nicht zu bemerken. Auch die Streuung des Benchmarks ist hierbei zu beachten.

3D-Spiele: Unreal

Unreal fordert von Prozessor und Grafikkarte viel Leistung. Von Vorteil ist bei diesem Spiele-Benchmark außerdem, dass man das Rendering der Grafikeffekte auch weit gehend dem PC-Prozessor alleine übertragen kann. Die Performance der Grafikkarte ist dann nicht mehr so wichtig.

Beim Unreal-Test mit Grafikkartenunterstützung kann sich der Pentium III 1000 mit DRDRAM an die Spitze setzen. Gegen eine PC133-Konfiguration gewinnen der Athlon und die Thunderbirds bei vergleichbarer Taktfrequenz sogar mit PC100-SDRAM.

Wenn der PC-Prozessor der Grafikkarte das Rendering abnimmt, ist nicht nur CPU-Power sondern auch eine hohe Speicher-Performance gefragt. Hier bietet DRDRAM deutliche Vorteile.

Fazit

Ähnlich wie der Pentium III können auch die neuen Athlon-Modelle alias Thunderbird durch den integrierten Cache mehr Leistung herausholen. Bis zu neun Prozent bringt die höhere Cache-Taktfrequenz in Verbindung mit der Neuorganisation des Caches, obwohl er nur halb so groß ist. Damit ist der Athlon nun wieder klar der schnellste Prozessor für PCs, wenn man eine vergleichbare Testplattform mit PC133-SDRAM verwendet. Bei den wichtigen Anwendungs-Benchmarks ist der neue Athlon sogar schneller als der Pentium III mit DRDRAM.

Das verwendete Referenz-Mainboard von VIA ist noch nicht am Ende seiner Möglichkeiten angelangt und sicher nicht die Ursache für die guten Benchmark-Werte des Thunderbird. Immerhin sind die Speichertransferwerte ähnlich wie bei den derzeit schnellsten KX133-Serienboards. Trotzdem versprechen wir uns vom kommenden Socket-A-Chipsatz von AMD einen weiteren Leistungsschub für den Thunderbird.

VIA KT-Chipsatz

Der Test eines Thunderbird für den Socket A ist derzeit nur in Verbindung mit einem auf dem KT-Chipsatz von VIA basierten Mainboard möglich. AMD schickte uns einen kompletten PC, aber das darin verwendete Mainboard kam ohne Dokumentation. Eine Messung mit dem Logic Analyzer am PCI-Bus zeigte, dass dieser nur mit 25 statt 33 MHz arbeitete, was die neue CPU bei den Praxis-Benchmarks unnötig gebremst hätte. Wir haben daher das KT-Referenzboard VT5276D von VIA als Testplattform für den Thunderbird verwendet.

Die Push-Pull-Treiber des Thunderbird erfordern ein speziell angepasstes Chipset. Der Apollo KT 133 basiert auf dem KX-Chipset von VIA für den Slot A und ist deshalb kompatibel zu den verschiedenen Southbridge-Bausteinen der 82Cxxx-Serie.

Die Southbridge VIA VT82C686A kommt auch beim P6-Chipsatz VIA Apollo Pro 133 A und beim VIA Apollo KX 133 zum Einsatz. Auch das Innenleben der Athlon-Northbridges sollen dem des P6-Pendannts ähneln - die notwendige Anpassung des FSB an den E2K-Bus des Athlon natürlich ausgenommen. Die Tabellen zeigen die Unterschiede zwischen AMDs Irongate, dem VIA Apollo KX133 und dem VIA Apollo Pro 133 A.

Der Apollo KT133 ist VIAs zweiter Chipsatz für den E2K-Bus des AMD Athlon. Er besteht aus zwei Bausteinen: Die Northbridge VT 8363 beinhaltet neben dem CPU-Interface auch den AGP-, PCI- und Memory Controller. Als Southbridge kommt der Baustein VIA VT82C686A zum Einsatz. In ihm sind zwei seriellen und eine parallele Schnittstelle sowie der Floppy Controller integriert. Weiterhin finden sich vier USB-Ports und 2 UltraDMA/66-fähige EIDE-Schnittstellen.

Zum Aufbau eines Mainboards werden mit dem Apollo KX133 nur noch wenige niedrig integrierte Bauteile benötigt. Das Chipsatzduo bietet serienmäßig bereits Sound- und Modemfunktionalität. Zusammen mit einem preiswerten Digital/Analogwandler hat man schon eine Soundkarte und ein Modem auf dem Board integriert.

Chipset-Vergleich: Northbridge

Chipset

VIA Apollo KT133

VIA Apollo KX133

AMD Irongate

Bezeichnung

VIA VT82C693A

VIA VT82C693A

AMD 751

CPU-Steckplatz

Socket A

Slot A

Slot A

FSB-Takt (MHz)

100 DDR

100 DDR

100 DDR

Speichertakt

66, 100, 133

66, 100, 133

100

max. Speicher (MByte)

2048

2048

768

Speichertyp

SDRAM, VC-SDRAM

SDRAM, VC-SDRAM

SDRAM

max. DIMM-Zahl

4

4

3

AGP

4x

4x

2x

Chipset-Vergleich: Southbridge

Bezeichnung

VIA VT82C686A

AMD 756

UDMA66

Ja

Ja

USB-Ports

4

2

AC97 Audio/Modem

Ja

Nein

System-Monitoring

Ja

Nein

I/O-Funktionen

Ja

Nein

Uhr

Ja

Nein

Tastatur-Controller

Ja

Nein

Speicher-Benchmarks

Der Schwachpunkt des VIA Apollo KX133 war die geringe Speicherperformance, die die Mainboards bei allen Benchmarks ausbremste. Der Chipsatz konnte zu Anfang aus PC133-SDRAM nicht die Leistung herausholen, die AMDs Irongate schon mit PC100-SDRAM erreichte. Das ist ein Grund, warum wir die Athlon-Modelle für den Slot A bisher mit einem Irongate-Mainboard getestet haben. Einige Chipset-Steppings und BIOS-Versionen weiter ist die Situation besser geworden.

Beim VIA Apollo KT133 ist das Speicherinterface nicht deutlich besser als beim KX133, wie die Tabelle zeigt. Der Vorsprung des Thunderbird ist also nicht auf das verwendete Mainboard VT5276D zurückzuführen.

Speicherperformance mit Athlon 1000

Operation

VIA Apollo KT133 PC100-SDRAM

VIA Apollo KT133 PC133-SDRAM

VIA Apollo KX133 PC133-SDRAM

AMD Irongate PC100-SDRAM

Legende: Das KX-Mainboard ist ein Asus K7V, der Irongate sitzt auf einem AMD Fester und das VIA-Board VT5276D arbeitet mit dem KT133.

Write (MByte/s)

175

203

242

197

Read (MByte/s)

270

320

312

295

Move (MByte/s)

302

304

331

364

Testkonfiguration

Wir testen alle Prozessoren in einer exakt festgelegten Testumgebung. Für die verwendete Software gilt:

Die Praxistests mit dem Anwendungs-Benchmark Bapco SYSmark98 erfolgen in einer Auflösung von 1024x768 Punkten und 32-Bit-Farbtiefe. tecChannel testet unter Windows 98 SE und Windows NT 4.0 SP5.

Mit dem Benchmark 3DMark99 Max Pro prüfen wir die 3D-Performance bei 800x600 Punkten,16-Bit-Farbtiefe und Triple Frame Buffer (Voreinstellungen des Programms).

Bei Unreal ist die Bildrate nach mindestens drei Zyklen mit der Option timedemo 1 angegeben. Das 3D-Spiel arbeitet dabei mit 800x600 Bildpunkten und 16-Bit-Farbtiefe mit Hardware- oder Software-Rendering (Startoption -nohard).

Bei der Demoversion von Quake 3 Arena verwenden wir für die Grafik die Voreinstellung Normal, was 640x480 Punkten und der Default-Farbtiefe entspricht. Der Benchmark wird über die Konsole mit dem Aufruf timedemo 1, gefolgt von demo q3 demo2 gestartet.

Bei allen 3D- und Spieletests ist die V-Synchronisation abgeschaltet.

Testkonfiguration: Athlon

Komponente

Daten

Mainboard 1

AMD FESTER B3

Serien-Nr.

090799FL0047

Firmware

aftb00-9 23.11.99

Sonstiges

Slot A

Mainboard 2

VIA VT5276D

Serien-Nr.

---

Firmware

Evaluation

Sonstiges

Socket A

RAM

Centon Eelectronics 128MB PC100 CAS=2

Serien-Nr.

118426

Firmware

---

Sonstiges

PC100 / SEC KM48S8030BT-GH

Soundkarte

TerraTec XLerate Pro

Serien-Nr.

1293900011399

Firmware

---

Sonstiges

Rev. C / 4.06.2016 / 13.03.1999

Netzwerkkarte

3Com Fast Etherlink 3C905B-TX

Serien-Nr.

6TQ2E9F5E9

Firmware

Hardware-Ver.: 048

Sonstiges

Rev. A / 4.10.2222 / 05.05.1999

Grafikkarte

Guillemot Maxi Gamer Xentor 32

Serien-Nr.

905381151072

Firmware

V2.05.13

Sonstiges

Detonator 5.16

SCSI-Controller 1

Adaptec AHA-2940U2W

Serien-Nr.

BF0A8110E48

Firmware

V.2.01.0

Sonstiges

Rev. A

SCSI-Controller 2

Adaptec AHA-2940UW Pro

Serien-Nr.

BC0B90904KF

Firmware

V.2.11.0

Sonstiges

Treiber v2.21A

Festplatte

Quantum ATLAS IV 9 WLS

Serien-Nr.

369919430210

Firmware

0808

Sonstiges

8,7GB REV 01-D

DVD-ROM

Pioneer DVD-303S-A

Serien-Nr.

TGT0059424WL

Firmware

1.09

Sonstiges

---

Netzteil

Channel Well Technology ATX-230

Serien-Nr.

540299070594

Firmware

---

Sonstiges

230 W

Tastatur

Cherry RS 6000 M

Serien-Nr.

G 0064322 4 L28 3 I

Firmware

---

Sonstiges

---

Maus

Logitech M-S35

Serien-Nr.

LZA84352020

Firmware

---

Sonstiges

3-Tasten

Testkonfiguration: Intel CPUs, AMD K6-3

Komponente

Daten

Mainboard 1

TyanTrinity ATX S1598S

Serien-Nr.

TA9021810199

Firmware

v1.04a 052199

Sonstiges

Super Socket 7

Mainboard 2

TyanTsunami ATX S1846SL

Serien-Nr.

TY8503210175

Firmware

v1.16a 0312991430

Sonstiges

Slot 1

Mainboard 3

TyanTrinity 400 S1854SLA

Serien-Nr.

9933810059

Firmware

v1.05

Sonstiges

Slot 1 /S370

Mainboard 4

Siemens D-1127

Serien-Nr.

01365039

Firmware

v1.02

Sonstiges

Slot 1

RAM 1

SEC KM48S8030AT

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte SDRAM PC100 CAS=2

RAM 2

128MB PC133

Serien-Nr.

241197

Firmware

---

Sonstiges

128 MByte SDRAM PC133 CAS=3

RAM 3

Samsung KMMR18R88AC1-RK8

Serien-Nr.

9938

Firmware

---

Sonstiges

128MByte DRDRAM 800-45 100 8d ECC

Soundkarte

TerraTec XLerate Pro

Serien-Nr.

1293900011590

Firmware

---

Sonstiges

Rev. C / 4.06.2016 / 13.03.1999

Netzwerkkarte

3Com Fast Etherlink 3C905B-TX

Serien-Nr.

6TQ2E9F603

Firmware

Hardware-Ver.: 048

Sonstiges

Rev. A / 4.10.2222 / 05.05.1999

Grafikkarte

Guillemot Maxi Gamer Xentor 32

Serien-Nr.

905381151072

Firmware

V2.05.13

Sonstiges

Detonator 3.68

SCSI-Controller 1

Adaptec AHA-2940U2W

Serien-Nr.

BF0A8110EJG

Firmware

V.2.01.0

Sonstiges

Rev. A

SCSI-Controller 2

Adaptec AHA-2940UW Pro

Serien-Nr.

BC0B90905QN

Firmware

V.2.11.0

Sonstiges

V2.21A

Festplatte

Quantum ATLAS IV 9 WLS

Serien-Nr.

369919430210

Firmware

0808

Sonstiges

8,7GB REV 01-D

DVD-ROM

Pioneer DVD-303S-A

Serien-Nr.

TGT0059423WL

Firmware

1.09

Sonstiges

---

Netzteil

Channel Well Technology ATX-230

Serien-Nr.

540299070595

Firmware

---

Sonstiges

230 W

Tastatur

Cherry RS 6000 M

Serien-Nr.

G 0064318 4 L28 3 I

Firmware

---

Sonstiges

---

Maus

Logitech M-S35

Serien-Nr.

LZA84352013

Firmware

---

Sonstiges

3-Tasten