Pentium 4 2400 vs. Athlon XP

02.04.2002 von Michael Eckert
Intel erhöht die Taktfrequenz wieder um einen Schritt von 2,2 auf 2,4 GHz. AMD muss vorerst passen, denn der Athlon XP mit Palomino-Core ist ausgereizt. Zieht Intel jetzt an AMD vorbei?

Bei gleicher Taktfrequenz leistet der Athlon XP mehr als ein Pentium 4. Intel verbucht mit 2,4 GHz aber einen deutlichen Vorsprung bei der Taktfrequenz. Mit dem Athlon XP 2100+ gibt sich AMD zwar bei der Model Number 2100 offiziell geschlagen, das Performance-Rating ist jedoch konservativ gewählt. Und das "+" im Namen soll andeuten, dass der Athlon XP mehr leistet, als seine Model Number vorgibt. Aber auch die Einschätzung von AMD attestiert dem Athlon XP eine Performance weit unterhalb des neuen Pentium 4.

Wir haben 18 Prozessoren der Oberklasse für Sie getestet. Außerdem finden Sie als Vergleich die schnellsten "kleinen" PC-Prozessoren Duron 1300 und Celeron 1300, die teilweise den teureren CPUs das Leben schwer machen.

Athlon Model Number

Die Model Number erinnert fatal an das Performance-Rating (PR) aus den Tagen des AMD K5. Der war damals schon bei gleicher Taktfrequenz schneller als Intels Pentium. Und wie heute machte Intel das einfach durch höhere Taktfrequenz wett. Die gewählten Benchmark-Programme für das PR waren allerdings einseitig zu Ungunsten von Intel ausgewählt und sehr Integer-lastig. Dies brachte das Performance-Rating schnell in Verruf, so dass es schließlich in der Versenkung verschwand.

Mit der Model Number ist das alles anders und viel besser - verspricht AMD. Das aktuelle Statement von AMD zur Model Number lautet: "...sie spiegelt die Leistungsfähigkeit des Athlon XP bei allen wichtigen Benchmarks wider...". Das lässt Luft für "weniger wichtige" Benchmarks, bei denen eine andere CPU schneller sein könnte.

Model Number und Taktfrequenz

Prozessor

Taktfrequenz

Die Tabelle zeigt die Athlon-XP-Modellpalette mit ihrer tatsächlichen Taktfrequenz.

Athlon XP 1500+

1333 MHz

Athlon XP 1600+

1400 MHz

Athlon XP 1700+

1467 MHz

Athlon XP 1800+

1533 MHz

Athlon XP 1900+

1600 MHz

Athlon XP 2000+

1667 MHz

Athlon XP 2100+

1733 MHz

Details zum Athlon XP

Äußerlich unterscheidet sich der Athlon XP durch das braune OPGA-Gehäuse von den bisherigen Sockel-Athlons. Technisch ist der XP mit dem MP identisch, denn er basiert auf dem Palomino-Core. Bei diesem wiederum handelt es sich um eine Weiterentwicklung des Thunderbird-Core, der letzten wirklichen Neuerung bei AMD. Das Feintuning am Palomino-Core schlägt sich sichtbar in der Die-Größe nieder: Das Siliziumplättchen ist von 120 mm^2 beim Athlon Thunderbird auf 128 mm^2 gewachsen. Im Vergleich zum in 0,18 Mikron gefertigten Pentium 4 ist AMDs jüngster Sprößling immer noch klein.

Die Fertigung des Athlon XP erfolgt derzeit noch in einem 0,18-Mikron-Prozess. Die Core-Spannung bleibt mit 1,75 V unverändert. Dank Sockel-A-Kompatibilität laufen Athlon-XP-Prozessoren in älteren Socket-A-Mainboards - ein neues BIOS ist allerdings zwingend erforderlich. Nur so wird auch 3DNow! Professional unterstützt, hinter dem sich neben dem bekannten 3DNow!-Befehlssatz 52 weitere Multimedia-Befehle verstecken. Sie entsprechen dem kompletten SSE-Befehlssatz des Pentium III, dessen Integration durch das erneuerte Lizenzabkommen mit Intel möglich war. Die SSE2-Erweiterungen des Pentium 4 bietet der Athlon XP aber nicht.

Änderungen gab es beim Cache-Management. Über ein verbessertes spekulatives Data Prefetch per Hardware holt sich der Athlon XP vorausschauend komplette Cache Lines (64 Bytes) in den 256 KByte großen L2-Cache. Besonders Applikationen mit großen Daten-Arrays sollen davon profitieren. Zusätzlich optimierte AMD die TLBs: Der L1-Data-TLB wurde von 32 auf 40 Einträge vergrößert, der L2-Instruction- und Data-TLB nutzen jetzt eine exklusive Architektur, so dass es zwischen den Cache-Hierarchien nicht mehr zu Dubletten kommt. Ferner lassen sich die TLB-Einträge spekulativ erneuern. Die Summe der Neuerungen fasst AMD unter dem Marketing-Namen Quantispeed für die komplette Mikroarchitektur zusammen.

Details zum Pentium 4

Der Pentium 4 mit Northwood-Core startet ab 2000 MHz, lediglich im OEM-Geschäft soll es auch Varianten ab 1,6 GHZ geben. Damit es nicht zu Verwechslungen mit dem bisherigen Pentium 4 mit Willamette-Core kommt, trägt der 2-GHz-Northwood den Zusatz "A" - offiziell hört er also auf den Namen Pentium 4 2000A. Beim Pentium 4 ab 2200 GHz entfällt das "A" dagegen wieder, denn den Willamette-Pentium-4 soll es für so hohe Frequenzen nicht mehr geben.

Durch die Fertigung in 0,13-Mikron-Technologie ist der Northwood weniger stromhungrig und das Design verträgt höhere Taktfrequenzen. Hauptänderung gegenüber dem Willamette-Core sind die auf 512 KByte verdoppelten L2-Caches für Daten und Befehle. Über weiteres Feintuning - sofern erfolgt - schweigt sich Intel aus. Detaillierte Informationen über die NetBurst-Architektur des Pentium 4 finden Sie hier. Die Transistorzahl erhöhte sich infolge des größeren L2-Caches von 42 auf 55 Millionen. Dank der kleineren Strukturbreite wurde das Northwood-Die dennoch kleiner. Es misst nun 146 mm^2 im Vergleich zu 217 mm^2 beim Willamette.

Die Pentium-4-Prozessoren produziert Intel parallel für zwei Sockeltypen. Im neueren Socket 478 gibt es den Prozessor mit Willamette-Core jedoch erst ab 1,5 GHz Taktfrequenz, während die mit Northwood-Core ausschließlich dafür bestimmt sind. Das deutlich geschrumpfte Socket-478-Gehäuse nennt Intel FC-PGA2, den Socket 478 dagegen offiziell mPGA478B oder µPGA478B.

Der Socket 478 ist elektrisch und mechanisch inkompatibel zum bisherigen Socket 423 des Pentium 4. Durch die Änderungen will Intel eine bessere Stromversorgung und damit Spielraum für Taktfrequenzen bis über 3 GHz schaffen sowie die Kühlung vereinfachen. Dies scheint auch erforderlich zu sein: Für den Pentium 4 2000 gibt Intel einen TDP-Wert von 75,3 Watt an. Der Pentium 4 2200 kommt dank 0,13 µm-Strukturbreite nur auf 49,8 Watt, was für den Northwood-Core in Sachen Leistungsaufnahme und Kühlung ausreichend Raum für weit höhere Taktfrequenzen schafft.

Preise

Wie die vergangenen Quartale zeigten, werden Preissenkungen des Konkurrenten prompt mit eigenen Nachlässen beantwortet. Der neue Pentium 4 kostet mit 562 US-Dollar zunächst soviel wie die niedriger getaktetere Variante mit 2,2 GHz. In der Vergangenheit senkte Intel bei ähnlich interessanten Konstellationen innerhalb kurzer Zeit dann die Preise der anderen CPUs, um die übliche Rangfolge herzustellen. Offensichtlich sind 562 US-Dollar aber im Moment die maximale Obergrenze. Bei AMD ergänzt der Athlon XP2100+ die Produktpalette oben mit einem Preis von 420 US-Dollar. Die restlichen Preise ändern sich nicht.

OEM-Preise im Vergleich

Rating / Taktfrequenz [MHz]

Athlon XP

Pentium 4

Pentium 4

Alle Preise in US-Dollar, bezogen auf eine Abnahmemenge von 1000 Stück. Stand: AMD-Preisliste vom 13.03.02, Intel-Preisliste vom 03.03.02

Core

Palomino

Willamette

Northwood

2400

--

--

562

2200

--

--

562

2100

420

--

--

2000

339

342

364

1900

231

241

--

1800

188

193

--

1700

157

163

--

1600

130

133

--

Die 1000er-Preise in der Tabelle darf man auch als Richtlinie für die deutschen/europäischen Endkundenpreise betrachten. Unter Berücksichtigung der Mehrwertsteuer und einer Händlermarge ergibt sich annähernd dieses Preisgefüge. Allerdings tauchen bei AMD immer wieder Grauimporte auf, die unter dem Listenpreis gehandelt werden.

Benchmark-Hinweise

Zur besseren Unterscheidung kennzeichnen wir die neu getesteten CPUs und ihre Konkurrenz in den Benchmark-Diagrammen auf den nächsten Seiten farblich.

Den AMD Athlon XP 2100+ haben wir grün hervorgehoben. Der Pentium 4 2400 macht mit einem blauen Balken auf sich aufmerksam.

Alle getesteten Prozessoren sind Socket-Modelle, die gemäß ihren technischen Spezifikationen betrieben werden. Auch der Speicher und die restlichen Komponenten sind nicht übertaktet, sondern arbeiten exakt nach den Vorgaben.

2D-Benchmarks: Windows 98

Im täglichen Einsatz ist die Performance bei Standardanwendungen am wichtigsten. Dazu gehören nicht nur Programme wie Word und Excel, sondern auch MPEG-Encoder, 3D-, Video- und Sound-Software. Die Leistungsfähigkeit der Prozessoren überprüfen wir mit dem Benchmark-Paket SYSmark2000, das ein Mix aus den genannten Programmen ist.

Die klassischen 2D-Anwendungen profitieren fast ausschließlich von der Integer-Performance einer CPU. Umso enttäuschender ist die Leistung der Pentium-4-Prozessoren mit ihrer Rapid Execution Engine: Die ALUs takten mit der doppelten Core-Frequenz, beim Pentium 4 also mit bis zu 4 GHz.

Immer größer wird auch die Zahl der Sound- und Grafikprogramme, die wie Spiele eine schnelle FPU oder Befehlserweiterungen wie MMX, SSE oder 3DNow! bevorzugen. SSE2 wird von SYSmark2000 nicht unterstützt.

Auch mit den Programmen von 1998 kann man heute noch sehr gut arbeiten. Nicht jeder hat das Geld für das Update auf die neueste Version eines Software-Pakets übrig und macht jeden Modetrend mit. Damit auch die Performance bei älteren Programmen nicht unter den Tisch fällt, verwenden wir außerdem den älteren SYSmark98.

SYSmark98 bietet außerdem den Vorteil, dass er weder 3DNow! noch SSE oder gar SSE2 kennt. Die Programme sind auch nicht in anderer Weise für den Pentium 4 oder Athlon optimiert. SYSmark98 zeigt daher gut, wie die neuen Prozessoren ohne jegliche Unterstützung seitens der Programmierer - oder besser, deren Compiler - zurechtkommen.

2D-Benchmarks: Windows 2000

Windows NT und der Nachfolger Windows 2000 sind mit Abstand die beliebtesten Betriebssysteme in Firmen und bei professionellen Anwendern.

Für den Test unter Windows 2000 haben wir SYSmark2000 eingesetzt.

Zwar sind die einzelnen Anwendungsprogramme von SYSmark2000 auch unter Windows 2000 nicht für SSE2 optimiert, aber der Pentium 4 kann hier im Vergleich zum Test unter Windows 98 etwas Boden gut machen.

2D-Benchmarks: Windows XP

Windows XP soll nach Microsofts Willen in Zukunft das einzige Windows sein. Wir testen mit Windows XP Professional. Die Leistungsfähigkeit der CPUs unter Microsofts neuem Betriebssystem prüfen wir mit SYSmark2001.

Dieses Benchmark-Paket bietet weit weniger Einblick in seine Arbeitsweise, als die bisherigen SYSmark-Versionen. Aufgelistet werden lediglich 3 Werte: Office Productivity, Internet Content Creation und als Gesamtergebnis der Mittelwert aus beiden.

Office Productivity gibt die Geschwindigkeit an mit Microsoft Office 2000, Netscape Communicator 6.0, Dragon NaturallySpeaking Preferred v.5, WinZip 8.0 und McAfee VirusScan 5.13.

Internet Content Creation soll die Performance repräsentieren mit Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0, Macromedia Dreamweaver 4 und Macromedia Flash 5.

Aus welchen Werten sich die beiden Teilergebnisse errechnen, bleibt das Geheimnis der BAPCo. SYSmark2001 soll auch das parallele Arbeiten mit mehreren Programmen gleichzeitig simulieren. So arbeitet im Vordergrund eine Office-Applikation, während im Hintergrund der Virenscanner auf die Suche geht. Der Tester hat so keinen Überblick, welches Programm einer CPU nun besonders zu schaffen macht. Im Falle des Athlon XP ist das laut AMD die von SYSmark2001 verwendete Version des Media Encoders. Der geht partout davon aus, dass ein Athlon grundsätzlich nichts mit SSE-Kommandos anfangen kann. Der Athlon XP kann deshalb die Vorteile seiner neuen Multimedia-Befehle nicht ins Spiel bringen.

Von AMD gibt es zwar einen Patch, um dieses Benchmark-Problem zu beheben, aber der hat nicht den Segen der BAPCo, wie man dort gegenüber tecCHANNEL bestätigte. tecCHANNEL verwendet Benchmarks strikt nach den Vorgaben der Hersteller, weshalb wir auf den AMD-Patch vorerst verzichten. AMD selbst hält das übrigens bei der Ermittlung seiner Model Number bisher ebenso.

Raytracing: Cinema 4D XL

Cinema 4D XL von Maxon ist ein professionelles 3D-Modelling- und Animationswerkzeug. Eigens für Performance-Tests entwickelte Maxon den Cinebench 2000. Er basiert auf Cinema 4D XL und führt Shading- und Raytracing-Tests durch.

Beim Raytracing-Leistungstest fordert Cinebench 2000 besonders die FPU des Prozessors. Der Benchmark verwendet eine Szene, die stark von Anti-Aliasing, Schatten, Transparenzen und Spiegelungen Gebrauch macht.

Der Shading-Test mit OpenGL-Unterstützung wird natürlich von der verwendeten Grafikkarte beeinflusst. Auf Grund der kleinen berechneten Szene ist der Einfluss allerdings nicht so stark wie bei 3D-Spielen. Beim Raytracing hat die Grafikkarte so gut wie keinen Anteil mehr am Ergebnis. Selbst bei der Darstellung des kleinen Bildes bremst sie nicht.

Raytracing: Lightwave 3D

Das 3D-Programm Lightwave 3D 7b von NewTek ist für den Pentium 4 optimiert. Laut NewTek betrifft das speziell den SSE2-Befehlssatz. Neben Intel-CPUs werden auch die AMD-Prozessoren besonders unterstützt. NewTek selbst hat die Athlon-Prozessoren für Lightwave 3D bereits im März 2001 zertifiziert.

SPEC CPU2000

Wir benutzen als zusätzliches Analyse-Instrument die Benchmark-Suite SPEC CPU2000 unter Windows 2000. Das Benchmark-Paket verwendet Ganzzahlen- und Fließkomma-Programme und wird mit den Source-Codes geliefert. Es handelt sich hierbei nicht um Lowlevel-Benchmarks, sondern um Software, die realitätsnahe Aufgabenstellungen bearbeitet. Vor jedem Testlauf ist Programm für Programm zu kompilieren, was durch die Wahl der entsprechenden Parameter hervorragende Möglichkeiten zum Test einzelner CPU-Funktionsgruppen eröffnet.

Im SPEC-Komitee sitzen alle Prozessorhersteller, die im Workstation- und Server-Bereich das Sagen haben - auch einige große PC-Hersteller sind dabei. Die SPEC regelt den Gebrauch ihrer Benchmarks genau und gibt exakt vor, in welcher Form die Ergebnisse an die Organisation zu melden sind. So müssen die verwendeten Compiler und die restliche Hard- und Software spätestens ein halbes Jahr nach dem Test für jedermann zu kaufen sein.

Die von den Herstellern eingereichten Ergebnisse werden auf der offiziellen CPU2000-Result-Seite veröffentlicht. Das schafft in der Theorie vergleichbare und faire Testbedingungen.

Einfluss der Compiler-Switches

In der Praxis kompiliert jeder Hersteller die SPEC-Programme mit eigenen Parametern und selbst gewählten Compilern. Immerhin herrscht beispielsweise zwischen Intel und AMD Einigkeit, dass wohl Intel C++ 5.0 mit MS Visual Studio (für die Libraries) zusammen mit der MicroQuill Smartheap-Library die beste Voraussetzung für gute Integer-Benchmark-Resultate sind. Soll die FPU besonders gut zur Geltung kommen, setzen beide Kontrahenten auch noch Intel Fortran 5.0 ein. AMD nimmt zusätzlich Compaq Visual Fortran 6.5A in Anspruch.

Damit ist das Dilemma der SPEC-Ergebnisse bereits detailliert erläutert: Jeder kann den SPEC-Benchmark optimieren, er muss es nur dokumentieren. Dazu darf er so viele Compiler einsetzen, wie er will. Allerdings ist zwischen dem Base-Rating und den Peek-Ergebnissen zu unterscheiden. Die 26 Programme des CPU2000-Pakets müssen in der Base-Wertung mit den gleichen Compiler-Parametern erzeugt werden. Das gilt jeweils für 12 Integer- und die 14 Fließkomma-Programme. Beim Peek-Rating dürfen sich die Hersteller richtig austoben und jedes Programm speziell tunen.

Sowohl nach den Regeln des Peek- als auch des Base-Ratings lassen sich Programme erzeugen, die nur auf dem gerade getesteten Prozessor laufen. Beispielsweise bringt ein Compiler-Lauf mit Intel C++ und der Option -QxW sehr schnellen Code zu Stande, der aber ausschließlich auf dem Pentium 4 läuft. Ein Pentium III oder gar ein Athlon müssen mit der so präparierten Software passen.

Wir haben für diesen Test die jeweils besten Einstellungen für den Pentium 4 (-QxW) und den Athlon XP (-QxK) gewählt. Zum Vergleich haben wir den Pentium 4 2000A auch mit der QxK-Option getestet. Der Artikel zum Test von Athlon XP 1900+ und Pentium 4 2000 zeigt, wie sich die beiden CPUs bei den weiteren Compiler-Switches verhalten.

Ergebnisse: SPECint_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie deshalb mit dem geringeren Aufwand für das Base-Rating. Dazu verwenden wir Intel C++ 5.0 und MS Visual Studio für alle Integer-Tests - schließlich sind sich Intel und AMD ja ob deren Qualitäten einig, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.

Intel hat uns mit dem Northwood eine neue Compiler-Version geschickt, die wir für unsere SPEC-Tests aber noch nicht verwenden konnten. Sie soll den Pentium 4 noch besser unterstützen. Entsprechende Testläufe holen wir nach.

SPECint_base2000: Official Run

Prozessor

P 4 2000

P 4 2000A

P 4 2000A

P4 2200

P 4 2000A

P4 2200

Athlon XP 2000+

Alle Angaben in Punkten. Höhere Werte sind besser. Bedeutung der Compiler-Optionen: -QxK = optimiert für Pentium III, lauffähig auch mit Pentium 4, Athlon XP und Duron ab 1 GHz; -QxW = optimiert für Pentium 4 und zur Zeit nur damit lauffähig.

Speichertyp

PC800

PC800

PC800

PC800

PC266

PC266

PC266

Mainboard

Intel D850MD

Intel D850MD

Intel D850MD

Intel D850MD

Intel D845BG

Intel D845BG

Epox EP-8KHA+

Compiler

-QxW

-QxK

-QxW

-QxW

-QxW

-QxW

-QxK

Test

164.gzip

704

734

763

836

744

820

842

175.vpr

360

435

438

461

403

421

460

176.gcc

680

861

871

921

757

791

474

181.mcf

510

549

551

558

423

425

332

186.crafty

639

679

677

742

677

742

959

197.parser

580

665

674

723

654

699

595

252.eon

880

824

881

969

881

968

1171

253.perlbmk

857

890

895

976

901

977

981

254.gap

885

935

936

1005

876

938

789

255.vortex

1003

1162

1170

1260

1153

1245

1119

256.bzip2

501

562

563

597

504

529

557

300.twolf

406

484

510

530

465

479

450

Gesamt

637

704

716

765

669

712

674

Der Pentium 4 2200 mit RDRAM setzt sich vom Rest des Testfeldes ab. Vergleicht man allerdings den Pentium 4 2000A und den Athlon XP 2000+ mit PC266-Speicher, dann liegt die AMD-CPU mit ihrem schnellen Mainboard vorne.

Ergebnisse: SPECfp_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie deshalb mit dem geringeren Aufwand für das Base-Rating. Dazu verwenden wir Intel C++ 5.0 und MS Visual Studio sowie Intel Fortran für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.

Intel hat uns mit dem Northwood eine neue Compiler-Version geschickt, die wir für unsere SPEC-Tests aber noch nicht verwenden konnten. Sie soll den Pentium 4 noch besser unterstützen. Entsprechende Testläufe holen wir nach.

SPECfp_base2000: Official Run

Prozessor

P 4 2000

P 4 2000A

P 4 2000A

P4 2200

P4 2000A

P4 2200

Athlon XP 2000+

Alle Angaben in Punkten. Höhere Werte sind besser. Bedeutung der Compiler-Optionen: -QxK = optimiert für Pentium III, lauffähig auch mit Pentium 4, Athlon XP und Duron ab 1 GHz; -QxW = optimiert für Pentium 4 und zur Zeit nur damit lauffähig

Speichertyp

PC800

PC800

PC800

PC800

PC266

PC266

PC266

Mainboard

Intel D850MD

Intel D850MD

Intel D850MD

Intel D850MD

Intel D845BG

Intel D845BG

Epox EP-8KHA+

Compiler

-QxW

-QxK

-QxW

-QxW

-QxW

-QxW

-QxK

Test

168.wupwise

969

898

1003

1068

961

1017

893

171.swim

1279

1319

1294

1299

813

812

831

172.mgrid

682

567

698

734

530

536

530

173.applu

767

770

773

803

611

623

553

177.mesa

741

732

747

821

733

801

919

178.galgel

632

622

667

698

543

563

511

179.art

538

536

536

540

365

365

425

183.equake

771

774

783

799

672

681

463

187.facerec

580

623

629

677

603

647

568

188.ammp

414

467

485

505

434

448

481

189.lucas

904

923

914

956

717

734

608

191.fma3d

541

564

575

617

530

563

603

200.sixtrack

340

333

341

374

340

373

423

301.apsi

498

544

549

577

453

471

475

Gesamt

652

655

679

713

570

592

572

Der Pentium 4 2200 gewinnt mit beiden Speichertypen. Allerdings kommt er mit dem D845BG vergleichsweise schlecht zurecht und büßt im Vergleich zur RDRAM-Konfiguration beim Gesamtergebnis 17 Prozent ein. Der früher in einem Board mit SiS645 getestete Pentium 4 1500 verlor durch das PC266-DDR-SDRAM nur knapp acht Prozent an Performance. Offensichtlich ist das Intel D845BG nicht die erste Wahl für Tests mit der SPEC-Suite, deren FP-Teil sehr stark von der Speicher-Performance profitiert. Dem Athlon XP bringt das neue Epox-Mainboard auf Basis des VIA Apollo KT266A zusätzliche Performance - er schlägt den Pentium 4 2000A mit PC266-DDR-SDRAM knapp.

Zusammenfassung: SPEC CPU2000

Bei den SPEC-Benchmarks sieht der Athlon XP nicht so gut aus wie beispielsweise bei den SYSmark-Tests. Das liegt einerseits daran, dass dem Pentium 4 mit der Wahl der optimalen Compiler-Option seine SSE2-Kommandos zugute kommen. Andererseits ist bei Teilen der SPEC-Suite hohe Speicherperformance gefragt und hier hilft das RDRAM der Intel-CPU zusätzlich. Auch die Wahl des richtigen Mainboards spielt eine Rolle, wie die Ergebnisse des Athlon XP zeigen. Trotz des gleichen Speichermoduls ergaben sich zwischen zwei DDR-Mainboards mit SiS645 und i845D erhebliche Performance-Unterschiede, wie der Pentium 4 beweist. Das Intel D845BG ist in dieser Hinsicht offenbar auch keine gute Wahl.

Die früheren Ergebnisse mit SPEC CPU2000 demonstrieren, dass bei "falscher" Optimierung seitens der Software-Hersteller entweder der Athlon XP oder der Pentium 4 das Nachsehen hat. Es genügt schlicht, ein Programm per Compiler-Optionen für den Pentium 4 oder Athlon XP zu optimieren, um die jeweils andere CPU schlechter aussehen zu lassen. Ein Schelm ist, wer dabei an vergangene Zeiten denkt, als Intel die Entwicklung von MMX-Software subventionierte, um den Pentium MMX zu pushen. Jetzt genügt der Hinweis auf die Compiler-Option -QaXW, und schon ist der Pentium 4 deutlich im Vorteil. Und das ist für Intel sicher einfacher und billiger, als seinerzeit die Unterstützung der Software-Industrie in Sachen MMX. Natürlich könnte auch AMD alles in die Waagschale werfen, um die Software-Partner davon zu überzeugen, man möge doch mit -QaxK kompilieren.

Der goldene Mittelweg, nämlich für jede CPU optimale Optionen zu verwenden und sie beim Start des Programms entsprechend zu aktivieren, bleibt den Programmierern natürlich auch. Aber ob dafür bei der Software-Entwicklung Zeit und Muße ist, wird die Zukunft zeigen.

SSE-Software

Mit dem Pentium III führte Intel den SSE-Befehlssatz ein. Der Pentium 4 verwendet mit SSE2 die zweite und erweiterte Version dieser Multimedia-Instructions. Mittlerweile bieten auch der Duron ab 1 GHz und der Athlon XP/MP eine SSE-Unterstützung und sind damit "kompatibel" zum Pentium III.

Als Intel den Pentium 4 der Öffentlichkeit vorstellte, empfahl man auch einige Programme, die die neuen Fähigkeiten der CPU besonders gut zur Geltung bringen sollten. Die im Benchmarkpaket "Pentium 4 Processor Application Launcher 2.0" zusammengefasste Software besteht aus den in der Tabelle aufgeführten Einzelprogrammen. Außerdem ist die Spieldemo Incoming Force dabei. Dieses Programm bereitet dem Benchmark beim Pentium 4 2000A und Pentium 2200 jedoch Probleme. Bei der Berechnung der Punktzahl meldete der Benchmark, dass das Resultat kleiner oder gleich Null sei. Incoming Firces selbst lief jedoch einwandfrei mit diesen CPUs - aber offensichtlich zu schnell für den Auswertungsalgorithmus des Benchmarks.

Natürlich machte der Pentium 4 damals beim großen Produkt-Launch mit diesen Programmen eine besonders gute Figur und der Athlon kam nicht so gut weg - was nicht wirklich überraschte. Nachdem aber auch der Athlon XP mit SSE-Kommandos dienen kann, ist es nur fair, die Software aus dem Pentium 4 Processor Application Launcher 2.0 auch mit dieser CPU zu testen.

Die folgende Tabelle listet die Programme und die Benchmark-Ergebnisse auf.

SSE-optimierte Software

Prozessor

P4 2000

P4 2200

P4 2200

P42200

Athlon 1400C

Athlon XP 2100+

Alle Zahlenangaben in Benchmark-Punkten. Höhere Werte sind besser.

Speichertyp

PC800

PC266

PC800

PC266

PC266

PC266

Mainboard

Intel D850MD

Intel D845GB

Intel D850MD

Intel D850MD

Asus A7V

EPoX EP-8KHA+

Test

eJay MP3 Plus 1.3

162

205

187

205

147

184

Ligos GoMotion Video Decoder

166

118

197

118

114

200

Magnitrax v1.02x

179

182

183

182

42

258

Naturally Speaking Pref 4.0

175

166

172

166

137

166

Premiere with Ligos

149

160

162

160

104

166

VideoStudio 4.0

149

172

151

172

72

109

Windows Media Encoder 7.0

147

192

196

192

110

147

Der Athlon XP 2000+ erreicht im Durchschnitt in etwa die Performance des Pentium 4 2000A mit RDRAM und kommt fast an den 2200er mit DDR-Speicher heran. Der Athlon XP 2100+ überflügelt nun den Pentium 4 in dieser Konfiguration und erreicht fast das Niveau der RDRAM-Testplattform. Das SSE-Benchmark-Paket zeigt auch, wo der XP durch die SSE-Kommandos im Vergleich zu den bisherigen Athlon-Modellen besonders deutlich zulegt: Magnitrax, Premiere und Video Studio.

Dass die SSE-Optimierung nicht immer gut gelungen ist und/oder viel bringt, zeigen eJay MP3 Plus 1.3 und Naturally Speaking, bei denen schon der Athlon 1400 extrem schnell ist. Der Athlon XP baut diese Stärke weiter aus.

SSE2-Software

Was bringt SSE2 wirklich? Bei kommerziellen Programmen kennt man in den meisten Fällen nicht den Grad der Optimierung für diesen Befehlssatz. Das SSE-Paket auf der vorangegangenen Seite ist ein Beispiel dafür. Bei Freeware-Programmen mit Source-Code ist das dagegen leicht feststellbar. Wir verwenden den MP3-Encoder GoGo, den Sie hier kostenlos downloaden können. Er basiert auf dem verbreiteten Lame-Encoder, ist jedoch weiter optimiert. GoGo ist auch in dem kommerziellen Produkt Magix MP3 Maker enthalten. Interessant ist das Programm auch, weil wir von Intel eine für den Pentium 4 optimierte SSE2-Version erhielten, die auf dem frei erhältlichen GoGo 239b basiert - damit ist sichergestellt, dass diese Version wirklich sehr gut für den Pentium 4 optimiert ist. Als Vergleich dient die Version 239b, die MMX, 3DNow! und SSE, jedoch nicht SSE2 unterstützt. Als dritte Variante haben wir noch die Alpha-Version 3.08 des Encoders verwendet, die auch über SSE2-Support verfügt. Mit diesen drei Programmen lässt sich das Leistungsvermögen von SSE2 sicher ausloten.

Die ursprüngliche Encoder-Variante bringt mit DDR-SDRAM bessere Performance als mit RDRAM. Ohne SSE2 zeigt der Pentium 4 seine bekannten Schwächen. Intel gleicht Sie schlicht mit höherer Taktfrequenz aus.

Der Pentium 4 2200 mit PC800-RDRAM ist mit der von Intel optimierten Encoder-Version um 37 Prozent schneller, mit PC266-Speicher sind es rund 27 Prozent.

GoGo3.08alpha ist eine weitere Variante des Encoders, die jedoch nicht von Intel stammt. Der Programmierer hat aber mit dem Know-how von Intel ganze Arbeit geleistet und das Programm weiter optimiert. Ein interessantes Detail: Während der Athlon XP 2000+ bei Intels Version um 19 Prozent langsamer ist als beispielsweise der Pentium 4 2000, sind es bei der Alpha-Version nur 7,5 Prozent. Offensichtlich hat sich hier jemand die Mühe gemacht, den Programmcode nicht einseitig zu optimieren. Auch dem Celeron 1300 kommt das zugute, denn er schließt dichter zum Athlon XP 1900+ auf. Die Leistung der kleinen CPU ist hier sowieso bemerkenswert, denn mit nur 1,3 GHz Taktfrequenz und einem FSB-Takt von nur 100 MHz liegt sie gut im Rennen. Da der Speichertyp kaum noch eine Rolle spielt, scheint ein Großteil der Arbeit im Cache erledigt zu werden.

3D-Benchmarks: 3DMark

Die Hersteller der Prozessoren begeistern sich für die Performance im Spielebereich. Denn hier gibt es weiterhin steigenden Bedarf an Rechenpower. Selbst das Internet wird als potenzieller Schrittmacher für schnellere Prozessoren betrachtet, wenn auch die Praxis zeigt, dass beim Surfen im Internet SSE oder 3DNow! gar nicht erforderlich sind.

Die 3D-Performance haben wir unter anderem mit den Benchmarks 3DMark99 Max Pro, 3DMark2000 und 3DMark2001 Pro von MadOnion getestet. Durch die umfangreichen 3D-Tests und die detaillierte Aufbereitung der Einzelresultate bieten die Benchmarks einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei anspruchsvollen 3D-Anwendungen. Unter anderem werden der AGP- und der Speicherbus stark belastet.

3DMark99 Max Pro ist weder für den Athlon noch für den Pentium 4 optimiert. Er unterstützt aber SSE für den Pentium III und 3DNow! für den K6. Wir testen mit den Voreinstellungen des Programms.

Beim 3DMark2000 hat MadOnion Unterstützung für den Athlon (3DNow!) und Pentium III (SSE) eingebaut. Wir testen mit der Voreinstellung "D3D Hardware T&L".

Die aktuelle Version des Benchmarks unterstützt laut Madonion MMX, SSE, SSE2, 3DNow! und Extended 3DNow!. Wir setzen 3DMark2001 Pro mit den Benchmark-Startwerten des Programms ein - also mit 1024 x 768 Punkten bei 32-Bit Farbtiefe und Pure D3D Hardware T&L ein. Bitte beachten Sie, dass die Hardware-Konfiguration unserer neuen Testplattform von den bisherigen Tests abweicht - dies betrifft vor allem die Grafikkarte.

Unreal mit Softrendering

Unreal ist ein Spiel, das mittlerweile in die Jahre gekommen ist. Allerdings bietet es mit der Option "softrender" eine interessante Funktion. Hierbei wird die 3D-Beschleunigung der Grafikkarte ausgeschaltet und der PC-Prozessor macht die Arbeit. Unreal belastet dabei auch den Arbeitsspeicher des PCs stark.

In der Praxis wird zwar kein Mensch freiwillig auf die Unterstützung der Grafikkarte verzichten, beim Testen ist diese Variante aber sehr willkommen, weil damit ein potentieller Bremsklotz entfällt. Auch dass Unreal schon etwas älter ist, ist hier nicht störend, sondern förderlich. Das Spiel kommt den CPUs nicht mit Multimedia-Ergänzungen a la 3DNow! oder SSE entgegen, sondern verlangt alles von der FPU - ähnlich wie konservativ programmierte 3D-Software im Profibereich. Wir führen Unreal mit Softrendering deshalb nicht unter der Rubrik "3D-Spiele" sondern betrachten es als "3D-Benchmark".

SPECviewperf

Als Extratest haben wir uns den Vergleich mit dem OpenGL-Benchmark SPECviewperf 6.1.2 der SPECopc gegönnt. Schließlich sehen sowohl Intel als auch AMD ihre Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket besteht aus sechs verschiedenen Tests. Schnell mussten wir erkennen, dass selbst die GeForce3 mit einem Teil der Programme überfordert ist, denn es ergaben sich zwischen den CPUs keine oder kaum Unterschiede. Die besten Resultate erzielten wir mit dem Test Light-04, mit dem die GeForce3-Grafikkarte noch zurecht kam.

3D-Spiele: Unreal Tournament

Unreal Tournament (Retail Version mit Patch 420) eignet sich gut als 3D-Benchmark. Das Spiel bietet viele Effekte und belastet besonders die PC-CPU. Außerdem verlangt es vom Grafikkarten- und Systemspeicher eine hohe Speicherbandbreite. Es unterstützt Direct3D, OpenGL sowie GLide und Metal (S3). Wir setzen Unreal Tournament unter Direct3D ein.

3D-Spiele: Expendable

Expendable ist ein reines Direct3D-Spiel. Es bietet komplexe Lichteffekte und Texturen. Das Spiel profitiert deutlich von der Performance des PC-Speichers.

Expendable zeigt schon beim Start, dass der Hersteller den Programmcode für den 3DNow!-Befehlssatz des AMD K6-2 optimiert hat. Davon profitiert auch der Athlon in all seinen Varianten.

3D-Spiele: Quake III Arena

Das 3D-Spiel Quake III Arena V1.17 Retail Version benutzt OpenGL. Wir testen in der Einstellung Normal mit Sound und der Demo2. Die bisher verwendeten Tests mit höherer Auflösung haben wir zwar durchgeführt, aber die Grafikkarte bremste zu stark. Zwischen den schnellen CPUs zeigen sich so keine Unterschiede mehr und eine Bewertung der Testergebnisse erübrigt sich.

Fazit

Mit 2,4 GHz Taktfrequenz ist der Pentium 4 in vielen Disziplinen schneller als der Athlon XP. Generell gilt aber immer noch: Solange SSE2 außen vor bleibt, ist der Athlon XP bei vergleichbarer Konfiguration bei den wichtigen Benchmarks vor dem Pentium 4 am Ziel. Unterstützt die Software jedoch den Pentium 4 per SSE2 optimal, dann zieht Intels CPU davon. Ein Mainboard mit RDRAM erweist sich in diesen Fällen auf Grund der höheren Speicherbandbreite als weiterer Vorteil. Die Kombination von SSE2, RDRAM und hoher Taktfrequenz macht dem Athlon XP das Leben schwer.

Was allerdings bleibt, ist ein deutlicher Kostenvorteil für den Athlon XP: Die schnellste Variante kostet im Handel beispielsweise bei Alternate 369 Euro (Stand: 2.4.2002). Für diesen Preis gibt es von Intel nur einen Pentium 4 1900 - und den schlägt der Athlon XP 2100+ haushoch.

Ob der Trend nun tatsächlich in Richtung SSE2-Software geht, darüber muss man nicht mehr streiten. AMD hat sich entschlossen, den Multimedia-Befehlssatz in Zukunft zu unterstützen, wir berichteten. Spätestens ab 2003 und mit den Hammer-CPUs ist SSE2 dann Standard.

Bei gleicher Taktfrequenz lassen sich die schnellsten Varianten von Athlon XP und Pentium 4 nicht mehr direkt miteinander messen. Der Northwood beginnt erst bei 2 GHz, der schnellste Athlon XP arbeitet aber nur mit 1733 MHz. Die Model Number ist auch für die Tester der einzige Ansatz für "vergleichbare" Testbedingungen. Aber selbst hier ist AMD nun deutlich ins Hintertreffen geraten.

In Sachen Taktfrequenz ist der Athlon XP mit 0,18 µm Strukturbreite jetzt ausgereizt. Erst der noch für die erste Jahreshälfte 2002 angekündigte und mit 0,13 µm hergestellte nächste Athlon-Core (Codename Thoroughbred) ist gut für deutlich mehr MHz. Wie Athlon Brand Manager Mark de Frere im tecCHANNEL-Gespräch sagte, wird der Thoroughbred-Athlon-XP keine Architekturverbesserungen gegenüber dem Palomino-Modell aufweisen. Der neue Core führt also ausschließlich zu höheren Taktfrequenzen beim Athlon XP. Intel will aber noch in der ersten Jahreshälfte den FSB des Pentium 4 auf 533 MHz erhöhen. Das dürfte zu einer messbaren Performance-Steigerung führen und das CPU-Rennen noch interessanter machen. (mec)

Testkonfiguration: Software

Wir testen alle Prozessoren in einer exakt festgelegten Testumgebung.

Für die verwendete Software gilt:

Die Praxistests mit den Anwendungs-Benchmarks BAPCo SYSmark98 und SYSmark2000 erfolgen in einer Auflösung von 1024 x 768 Punkten und 32 Bit Farbtiefe. tecCHANNEL testet unter Windows 98 SE und Windows 2000 SP1.

Bei allen 3D- und Spieletests ist die V-Synchronisation abgeschaltet. Die AGP-Aperture-Size ist auf 128 MByte eingestellt.

Mit den Benchmarks 3DMark99 Max Pro und 3DMark2000 von MadOnion prüfen wir die 3D-Performance bei 800 x 600 und 1024 x 768 Punkten mit den Voreinstellungen des Programms.

Bei Quake III Arena V1.17 Retail Version verwenden wir für die Grafik die Voreinstellungen Normal und High Quality. Während des Tests variieren wir nur noch Auflösung und Farbtiefe. Die entsprechenden Angaben finden Sie bei den Benchmark-Diagrammen.

Bei Unreal Patch 2.26 ist die Bildrate nach mindestens drei Zyklen mit der Benchmark-Option timedemo 1 angegeben. Das 3D-Spiel arbeitet dabei mit Software-Rendering (Startoption -nohard).

Weitere Details können Sie der Tabelle entnehmen. Eine detaillierte Auflistung der verwendeten Hardware-Komponenten finden Sie auf den nachfolgenden Seiten.

Spiel

Eingabemodus

Parameter

Expendable Retail Version

Setup

Use Low Resolution Movies: Off; Use Vertical Sync.: Off; Start mit: go.exe -timedemo

Quake III Arena V1.17 Retail Version

Command Line

Konsole: timedemo 1; Start: im Menü Demo: DEMO001 und DEMO002

Unreal Tournament Retail Version Patch 420

Menü undCommand Line

TimeDemo Statistics: On; Options Preferences Video: Details: High; Min. Desired Framerate: 0; Eingabe: demoplay utbench

Unreal Retail Version Patch 226

Command Line

Konsole: timedemo 1 Wert nach drei Durchläufen Software-Rendering: Aufruf mit -nohard

GoGo 239b

Command Line

gogo239b -b 128 -v 0 -m s -emp n

GoGo 239 Intel

Command Line

gogo239 -b 128 -v 0 -m s -emp n

GoGo 308alpha

Command Line

gogo308a -b 128 -v 0 -q 1 -m s -emp n

Testkonfiguration: AMD-Prozessoren

Komponente

Daten

Mainboard 1

Asus A7V

Serien-Nr.

08Z7121850

BIOS

10005B

Sonstiges

Socket A, VIA Apollo KT133

Mainboard 2

DFI AK76-SN

Serien-Nr.

--

BIOS

02/08/2001

Sonstiges

Socket A, AMD 761

Mainboard 3

Tyan Thunder K7

Serien-Nr.

--

BIOS

05/25/2001

Sonstiges

Dual-Socket-A, AMD-760MP

Mainboard 4

EPOX EP-8KTA3+

Serien-Nr.

912054

BIOS

06/14/2001

Sonstiges

Socket A, VIA Apollo KT133A

Mainboard 5

GigaByte GA-7DX

Serien-Nr.

--

BIOS

F5d

Sonstiges

Socket A, AMD 761

RAM 1

MemorySolution BD 128MB

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte PC133-SDRAM CL2

RAM 2

MemorySolution BD 128MB

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte PC133-SDRAM CL2

RAM 3

Corsair 256

Serien-Nr.

---

Firmware

---

Sonstiges

256 MByte DDR266-SDRAM CL2

Grafikkarte 1

Creative Labs 3D Blaster GeForce2 GTS

Serien-Nr.

TGB0010020050812

Firmware

2.15.03.01.07

Sonstiges

AGP, 32 MByte DDR-SDRAM, Detonator 6.31

Grafikkarte 2

MSI StarForce 822, GeForce3

Serien-Nr.

--

Firmware

--

Sonstiges

AGP, 64 MByte DDR-SDRAM, Detonator 23.11

SCSI-Controller

Adaptec AHA-2940UW Pro

Serien-Nr.

BC0B90905QN

Firmware

v2.11.0

Sonstiges

Rev. C

Festplatte

Quantum ATLAS IV 9 WLS

Serien-Nr.

369918630925

Firmware

0808

Sonstiges

REV 01-D, 8,7 GByte

DVD-ROM

Pioneer DVD-303S-A

Serien-Nr.

TGT0059424WL

Firmware

1.09

Sonstiges

---

Sound-Karte

TerraTec XLerate Pro

Serien-Nr.

1293900011399

Firmware

---

Sonstiges

Rev. C / 4.06.2016 / 13.03.1999

Netzwerkkarte

Realtek RTL8139B 10/100 Ethernet

Serien-Nr.

1562912232539

Firmware

--

Sonstiges

Rev: 1.2

Netzteil

Channel Well Technology ATX-230

Serien-Nr.

540299070594

Firmware

---

Sonstiges

230 W

Diskettenlaufwerk

TEAC FD-235HF

Serien-Nr.

B210033

Firmware

---

Sonstiges

---

Tastatur

Cherry RS 6000 M

Serien-Nr.

G 0064318 4 L28 3 I

Firmware

---

Sonstiges

---

Maus

Logitech M-S35

Serien-Nr.

LZA84352013

Firmware

---

Sonstiges

3 Tasten

Testkonfiguration: Intel- und VIA-Prozessoren

Komponente

Daten

Mainboard 1

TyanTrinity 400 S1854SLA

Serien-Nr.

TY0972122061

BIOS

v1.07

Sonstiges

Rev. H, Slot 1 /S370, PC133-SDRAM

Mainboard 2

Intel D850GB

Serien-Nr.

--

BIOS

GB85010A.86A.0048.P07

Sonstiges

Socket 423, RDRAM

Mainboard 3

Intel D815EPEA2

Serien-Nr.

BLE212000865 AA A52399-802

BIOS

EA81520A.86A.0017.P11

Sonstiges

Socket S370

Mainboard 4

Intel D815EFV

Serien-Nr.

--

BIOS

--

Sonstiges

Socket S370, PC133-SDRAM

Mainboard 5

Intel D850MD

Serien-Nr.

--

BIOS

--

Sonstiges

Socket 478, RDRAM

Mainboard 6

Intel D845BG

Serien-Nr.

--

BIOS

--

Sonstiges

Socket 478, DDR-SDRAM

RAM 1

MemorySolution BD 128MB

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte PC133-SDRAM CL2

RAM 2

MemorySolution BD 128MB

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte PC133-SDRAM CL2

RAM 3

Infineon HYR186420G-845

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte PC800-RDRAM 800-45

RAM 4

Infineon HYR186420G-845

Serien-Nr.

---

Firmware

---

Sonstiges

128 MByte PC800-RDRAM 800-45

Grafikkarte 1

Creative Labs 3D Blaster GeForce2 GTS

Serien-Nr.

TGB0010020050818

Firmware

2.15.03.01.07

Sonstiges

AGP, 32MByte DDR-SDRAM, Detonator 6.31

Grafikkarte 2

MSI StarForce 822, GeForce3

Serien-Nr.

--

Firmware

--

Sonstiges

AGP, 64 MByte DDR-SDRAM, Detonator 23.11

SCSI-Controller

Adaptec AHA-2940UW Pro

Serien-Nr.

BC0B90904KF

Firmware

v2.11.0

Sonstiges

Rev. C

Festplatte

Quantum ATLAS IV 9 WLS

Serien-Nr.

369924434631

Firmware

0909

Sonstiges

REV 01-E, 8,7 GByte

DVD-ROM

Pioneer DVD-303S-A

Serien-Nr.

TGT0059423WL

Firmware

1.09

Sonstiges

---

Sound-Karte

TerraTec XLerate Pro

Serien-Nr.

1293900011590

Firmware

---

Sonstiges

Rev. C / 4.06.2016 / 13.03.1999

Netzwerkkarte

Realtek RTL8139B 10/100 Ethernet

Serien-Nr.

1562912232546

Firmware

--

Sonstiges

Rev: 1.2

Netzteil

Channel Well Technology ATX-230

Serien-Nr.

540299070594

Firmware

---

Sonstiges

230 W

Diskettenlaufwerk

TEAC FD-235HF

Serien-Nr.

E081321

Firmware

---

Sonstiges

---

Tastatur

Cherry RS 6000 M

Serien-Nr.

G 0064322 4 L28 3 I

Firmware

---

Sonstiges

---

Maus

Logitech M-S35

Serien-Nr.

LZA84352020

Firmware

---

Sonstiges

3 Tasten