Test: PC1066-RDRAM vs. DDR400-SDRAM

13.05.2002 von Christian Vilsbeck
PC800-RDRAM ist seit über zwei Jahren auf dem Markt. Jetzt kommt mit PC1066 ein schnellerer Nachfolger. Doch hat Rambus noch eine Chance gegen das ebenfalls geliftete DDR-SDRAM mit 400 MHz?

Seit Intel mit den i845-Chipsätzen DDR-SDRAM unterstützt, wurde es immer stiller um die bis dahin für den Pentium 4 favorisierte Speichertechnologie der Firma Rambus. RDRAM verkam vom "Massenspeicher" der Pentium-4-Boards zum Nischenspeicher. Kein Wunder, bietet DDR-SDRAM zu deutlich günstigeren Preisen eine vergleichbare Performance.

Jetzt gibt es erste RDRAM-Module mit einer Taktfrequenz von 1066 MHz (per DDR). Gegenüber PC800-RIMMs mit 800 MHz Speichertakt entspricht dies einer Steigerung von 33 Prozent. Deutlich verringert hat sich auch die Zugriffszeit der neuen Module: 32 ns (PC1066) statt 45 ns (PC800). Gerade Anwendungen, die häufig auf unterschiedliche Speicherbereiche zugreifen, profitieren von geringen Latenzzeiten. Hier ist DDR-SDRAM deutlich im Vorteil: die Zugriffszeit beträgt bei DDR400 nur 5 ns.

Intel i850-Mainboards mit Dual-Channel-Speicher-Interface erreichen mit PC800-RDRAM eine Bandbreite von 2,98 GByte/s. Seit dem 6. Mai 2002 gibt es von Intel den i850E-Chipsatz. Neu gegenüber dem Vorgänger ist der 533-MHz-FSB für den Pentium 4 sowie die "inoffizielle" Unterstützung von PC1066-Speicher. Der Dual-Channel-Chipsatz ermöglicht damit eine Speicherbandbreite von 3,97 GByte/s.

Pentium-4-Prozessoren mit 533-MHz-FSB müssten also von PC1066 profitieren. Bei diesem FSB-Takt erhöht sich der Durchsatz zwischen CPU und Chipsatz ebenfalls auf 3,97 GByte/s. In Kombination mit DDR400-Speicher blieb der Performance-Zuwachs durch den höheren FSB bescheiden, wie ein früherer Test bereits zeigte. DDR400 besitzt ein Bandbreite von 2,98 GByte/s und reizt den 533-MHz-FSB nicht aus.

Liegt hier die Chance von PC1066-RDRAM? Kann es sich in Kombination mit 533-MHz-FSB-Pentium-4-Prozessoren deutlich von DDR-SDRAM absetzen? Unsere Benchmarks geben die Antwort.

Benchmark-Vorbetrachtung

Alle Tests mit PC800- und PC1066-Speicher führten wir mit dem Intel Desktop-Mainboard D850EMV2 mit i850E-Chipsatz durch. Der Dual-Channel-RDRAM-Chipsatz entspricht bis auf den 533-MHZ-FSB dem Vorgänger i850, dessen Details Sie hier nachlesen können.

Intels i850E arbeitet laut Datenblatt nur mit PC800-Speicher zusammen, unterstützt inoffiziell aber auch PC1066-RIMMs. Intel hat den neuen Speicher für einen offiziellen Chipsatz-Support nicht ausgiebig genug verifiziert, so der Hersteller. Den Mainboard-Herstellern bleibe es laut Intel selbst überlassen, PC1066 zu unterstützen. Bislang war so viel Freiraum bei Intel unüblich. Selbst Intels D850EMV2-Mainboard läuft mit PC1066-RDRAM, zeigt beim ersten Booten aber einen Warnhinweis.

Alle Speichertests mit PC800 und PC1066 haben wir mit Pentium-4-Prozessoren bei 2,4 GHz Taktfrequenz durchgeführt - jeweils mit 400 und 533 MHz FSB. Für die vergleichenden Tests von DDR-SDRAM-Speicher verwendeten wir ein Referenz-Mainboard von SiS mit dem Pentium-4-Chipsatz SiS645DX. Der Chipsatz für PC266- und PC333-DDR-SDRAM kann in der von uns getesteten Version zusätzlich mit DDR400-Speicher (PC400) arbeiten. SiS stellt zu diesem Zweck ein speziell angepasstes BIOS für das Mainboard zur Verfügung. Als Prozessor kam ebenfalls Pentium 4 mit 2,4 GHz Taktfrequenz (FSB 400 und 533) zum Einsatz. Einen separaten Test von DDR400-SDRAM finden Sie hier.

Alle Tests der verschiedenen Speichertypen und -geschwindigkeiten haben wir mit 256 MByte Arbeitsspeicher durchgeführt.

PC1066 nur bei FSB 533

Die Flexibilität von Intels i850E-Chipsatz bezüglich PC1066-Speicher ist sehr eingeschränkt. Vom hohen Speichertakt profitieren nur Pentium-4-Prozessoren mit einem FSB-Takt von 533 MHz. Speicher und Prozessorbus laufen in dieser Kombination mit einem synchronen Takt (1066 MHz Speichertakt per DDR).

Den asynchronen Betrieb von Pentium-4-Prozessoren mit 400 MHz FSB und 1066 MHz Speichertakt unterstützt der i850E-Chipsatz dagegen nicht. PC1066-RDRAM läuft bei einem 400-MHz-FSB ebenfalls nur mit 400 MHz Taktfrequenz (800 MHz per DDR).

Zur Überprüfung der jeweiligen Taktfrequenz von Prozessorbus und Speicher haben wir unser Digital-Oszilloskop LeCroy LC564A verwendet. Nur bei Pentium-4-Prozessoren mit 533 MHz FSB konnten wir einen Speichertakt von 533 MHz bei PC1066-RIMMs messen. Beim Wechsel auf einen Pentium 4 mit 400 MHz FSB laufen die PC1066-Module nur mit 400 MHz.

Inzwischen bestätigte Hans-Jürgen Werner, zuständig für Presse- und Öffentlichkeitsarbeit bei Intel Deutschland, die Messergebnisse von tecCHANNEL. Der Chipsatz i850E arbeitet bei 400 MHz FSB maximal mit einem Speichertakt von 400 MHz, auch wenn PC1066-Speicher eingesetzt wird.

In unseren Benchmarks finden Sie die Kombination aus PC1066-Speicher und 533-MHz-FSB-Pentium-4-Prozessoren trotzdem, um den Vorteil der geringeren Zugriffszeit von 32 ns des PC1066-Modul im 800-MHz-Betrieb zu verifizieren (statt 45 ns bei PC800-RIMMs).

tecMEM-Werte

Der neue PC1066-Speicher ermöglicht mit zwei Rambus-Kanälen eine maximale Bandbreite von 4,2 GByte. Bei Rechnung mit der Basis 1024 beläuft sich der Wert auf 3,97 GByte/s. Gegenüber PC800-RIMMs mit 2,98 GByte/s Bandbreite entspricht das einer Steigerung von 33 Prozent.

Soweit die Theorie. Die tatsächliche Speicher-Performance überprüfen wir mit unserem Benchmark tecMEM. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Hier zeigt sich, wie viel von der theoretischen Durchsatzsteigerung übrig bleibt. Eine detaillierte Beschreibung von tecMEM sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite finden Sie hier.

Speicher-Performance

Speicher

Load 32 [MByte/s]

Store 32 [MByte/s]

Move 32 [MByte/s]

Store 64 [MByte/s]

Load 128 [MByte/s]

Store 128 [MByte/s]

Höhere Werte sind besser. Alle Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz und unserem Benchmark-Programm tecMEM unter Windows XP durchgeführt.

PC1066 FSB533

1716

951

938

983

2867

985

PC1066 FSB400

1469

765

783

795

2254

794

PC800 FSB533

1571

787

774

798

2446

799

PC800 FSB400

1409

722

732

740

2284

741

DDR400 FSB533

1751

1023

859

846

2647

853

DDR400 FSB400

1609

917

838

835

2455

843

DDR333 FSB533

1679

875

760

757

2354

755

DDR333 FSB400

1558

789

724

709

2272

708

In der Praxis erreicht PC1066-RDRAM maximal einen 23 Prozent höheren Datendurchsatz als PC800 - allerdings nur bei Pentium-4-Prozessoren mit 533 MHz FSB. Vergleicht man PC1066 mit PC800 bei einem FSB-Takt von 400 MHz, so fällt die Steigerung mit maximal sieben Prozent deutlich niedriger aus.

Die Erklärung ist einfach: Bei einem 400-MHz-FSB taktet der i850E-Chipsatz den PC1066-Speicher ebenfalls mit 400 MHz (800 MHz per DDR). Einen asynchronen Betrieb unterstützt der Chipsatz in dieser Kombination nicht. Die sieben Prozent Mehrleistung resultieren aus der geringeren Zugriffszeit des PC1066-Moduls mit 32 ns. Handelsübliche PC800-Speicher besitzen eine Zugriffszeit von 45 ns.

Im Vergleich zu DDR400 kann sich PC1066 vor allem bei längeren Blockzugriffen wie den 128-Bit-Befehlen behaupten. Bei kürzeren Blöcken (32-Bit-Zugriffe) macht sich die langsamere Zugriffszeit von RDRAM negativ bemerkbar, hier behält DDR-SDRAM die Oberhand.

Vergleicht man beide Speicher bei einem FSB-Takt von 400 MHz, so ist DDR400 in allen Disziplinen schneller.

Transferkurven

Ob der Intel i850E-Chipsatz den Pentium-4-Prozessor und den Speicher optimal unterstützt, zeigen die Transferkurven unseres Benchmarks tecMEM bei 32-Bit-Kommandos. Hier prüft das Programm mit Load-, Store und Move-Befehlen, wie schnell der Chipsatz Daten zwischen CPU und Hauptspeicher transferieren kann.

Die zwei Transferkurven zeigen den i850E-Chipsatz mit einem Pentium 4 2,4 GHz und 533-MHz-FSB in Aktion. Der Kurvenverlauf bis 8 KByte große Blöcke zeigt den Durchsatz des L1-Caches, bis zu einer Blockgröße von 512 KByte ist der L2-Cache in Aktion. Erst ab der 512-KByte-Grenze beginnt der Hauptspeicher seine Arbeit. Bei den 32-Bit-Befehlen kann der PC1066-Speicher maximal einen 21 Prozent höheren Datendurchsatz gegenüber PC800 für sich verbuchen.

System-Performance

Im täglichen Einsatz ist die Performance bei Standardanwendungen am wichtigsten. Die Leistungsfähigkeit des Systems überprüfen wir unter Windows XP Professional mit SYSmark2001. Das Benchmark-Paket besteht aus 14 Einzelprogrammen und deckt gleichzeitig eventuelle Stabilitätsschwächen auf.

SYSmark2001 listet neben der Gesamt-Performance die Einzelergebnisse für die Kategorien Office Productivity und Internet Content Creation auf.

Office Productivity gibt die Geschwindigkeit an mit Microsoft Office 2000, Netscape Communicator 6.0, Dragon NaturallySpeaking Preferred v.5, WinZip 8.0 und McAfee VirusScan 5.13.

Internet Content Creation soll die Performance repräsentieren mit Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0, Macromedia Dreamweaver 4 und Macromedia Flash 5.

Viewperf 6.1.2

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 6.1.2 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Stellvertretend wählen wir die vier aussagekräftigsten aus, die den Speicher- und den Grafikbus stark fordern.

Besonders der Test DX-06 erlaubt Rückschlüsse auf die Speicher-Performance der einzelnen Testkandidaten.

Alle Einzelergebnisse des SPECviewperf 6.1.2 finden Sie in der nachfolgenden Tabelle.

SPECviewperf 6.1.2

Speicher

DRV-07 [fps]

DX-06 [fps]

Light04 [fps]

MedMCAD-01 [fps]

Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

PC1066 FSB533

28,6

40,2

11,3

34,8

PC1066 FSB400

28,4

37,6

10,5

34,7

PC800 FSB533

28,4

38,4

10,7

34,8

PC800 FSB400

28,3

37,4

10,4

34,7

DDR400 FSB533

27,8

39,4

10,7

33,8

DDR400 FSB400

27,2

38,7

10,1

33,4

DDR333 CL2.5 FSB533

25,8

38,4

10,4

33,0

DDR333 CL2.5 FSB400

25,9

38,1

10,5

32,8

Indy3D

Den im professionellen Umfeld wichtigen Bereich Animation/Simulation deckt der OpenGL-basierende Benchmark Indy3D von Sense8 ab. Hier spielen nicht nur die Grafikleistung, sondern auch Rechen- und Speicher-Performance eine wesentliche Rolle. Das gute Zusammenwirken hängt in erheblichem Maße vom eingesetzten Chipsatz ab.

Unreal Tournament OpenGL

Zur Analyse der OpenGL-Performance verwenden wir zusätzlich den Spiele-Benchmark Unreal Tournament. Er ist gut geeignet, um die Leistungsfähigkeit der Chipsätze für den Grafikbereich - bevorzugt OpenGL-Anwendungen - auszuloten. Dabei sind Haupt- und Grafikspeicher stark gefordert.

SPEC CPU2000: Integer

Als von der Industrie anerkanntes Analysetool verwenden wir zusätzlich die Benchmark Suite SPEC CPU2000 von SPEC. Unter Ausschluss der Grafikkartenleistung prüft das Programmpaket die Leistungsfähigkeit der CPU und des Hauptspeichers. Dabei benutzt es praxisnahe Aufgabenstellungen mit großen Datenmengen für Ganzzahlen- und Fließkomma-Anwendungen.

SPECint_base2000: Official Run

Test

PC800 FSB400

PC800 FSB533

PC1066 FSB400

PC1066 FSB533

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

164.gzip

905

909

906

922

175.vpr

486

517

501

563

176.gcc

959

1007

971

1087

181.mcf

571

618

588

728

186.crafty

817

818

820

824

197.parser

828

856

839

893

252.eon

1119

1117

1119

1116

253.perlbm

1039

1052

1045

1066

254.gap

1022

1052

1031

1090

255.vortex

1306

1355

1322

1442

256.bzip2

651

683

664

726

300.twolf

549

590

566

646

Gesamt

818

848

830

895

Stellvertretend für ein Programm aus der Integer-Suite SPECint_base2000 wählen wir für die Analyse des Speicherbusses die Anwendung 176.gcc. Diese Applikation ist in erster Linie vom Systemspeicher abhängig, der Prozessor mit seinem jeweiligen L1- und L2-Cache spielt nur eine untergeordnete Rolle. Das 176.gcc-Programm profitiert bei 533 MHz FSB-Takt von PC1066-Speicher mit acht Prozent schnellerer Berechnung im Vergleich zu PC800.

Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Integer-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.

SPEC CPU2000: Floating Point

Für Fließkomma-Programme eignet sich die Anwendung 171.swim gut für die Beurteilung des Speicher-Controllers. Hier kann PC1066-Speicher einen Vorteil von 23 Prozent gegenüber PC800-RDRAM für sich verbuchen (bei FSB 533). Besonders die 128-Bit-Befehle der SSE-Einheit profitieren von der hohen Speicherbandbreite.

Insgesamt profitieren die Fließkomma-Programme mehr von der höheren Speicherbandbreite als Integer-basierende Anwendungen.

SPECfp_base2000: Official Run

Test

PC800 FSB400

PC800 FSB533

PC1066 FSB400

PC1066 FSB533

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

168.wupwis

1115

1155

1127

1224

171.swim

1317

1411

1350

1739

172.mgrid

771

825

787

899

173.applu

856

917

872

1025

177.mesa

984

992

986

1001

178.galgel

1039

1103

1053

1210

179.art

549

583

556

722

183.equake

826

890

846

1022

187.facerec

1037

1089

1055

1149

188.ammp

516

551

531

607

189.lucas

1053

1130

1076

1246

191.fma3d

743

767

748

814

200.sixtrac

437

438

438

441

301.apsi

632

662

643

722

Gesamt

810

852

822

936

Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Floating-Point-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.

3DMark2001

Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.

Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 Pro von MadOnion. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der einzelnen Chipsätze bei anspruchsvollen 3D-Anwendungen. Unter anderem werden der AGP- und der Speicherbus durch große Mengen an Texturen stark belastet.

Unreal Tournament Direct3D

Wenn es darum geht, den Speicherbus auszureizen, eignet sich der Spiele-Benchmark Unreal Tournament mit Direct3D-Unterstützung gut. Hier sollte eine hohe Speicher-Performance von Vorteil sein.

Unreal Tournament verwendet mit der Option "Software Rendering" keine 3D-Beschleunigung der Grafikkarte. Damit übernimmt der PC-Prozessor die grafischen Berechnungen, der Hauptspeicher wird stark belastet.

Fazit

Unser Test zeigt, dass PC1066-RDRAM nur in Pentium-4-Systemen mit 533-MHz-FSB Sinn macht. Das Leistungsplus gegenüber PC800-Speicher beträgt hier durchschnittlich zehn Prozent, in speziellen Fällen sogar bis zu 23 Prozent.

Die Kombination aus Pentium-4-Prozessor mit 533-MHz-FSB und PC1066-RDRAM setzt sich in der Mehrzahl der Benchmarks an die Spitze vor DDR400-SDRAM.

Anders sieht das Bild bei einem FSB-Takt von 400 MHz aus. Der i850E-Chipsatz bremst das schnelle PC1066-RDRAM aus und kann den Speicher nur mit 800 MHz betreiben. Der Performance-Unterschied zwischen PC800- und PC1066-Modulen liegt aber dennoch bei durchschnittlich drei Prozent - im Maximum bei sieben Prozent. Hier profitiert der PC1066-Speicher trotz "Untertaktung" von seiner geringeren Zugriffszeit (32 ns statt 45 ns von PC800-Modulen).

Umgekehrte Vorzeichen also bei einem FSB-Takt von 400 MHz: DDR400-Speicher ist fast immer schneller als PC800/PC1066-RDRAM. Die Bandbreite von DDR400 mit 2,98 GByte/s übersteigt noch nicht die des FSB. Ein höherer FSB-Takt bringt bei DDR400 im Gegensatz zu PC1066 somit wenig. In der Northbridge gepufferte kleine Datenmengen können dann zwar schneller zur CPU transferiert werden, lange Blockzugriffe auf den Speicher relativieren hier aber den Vorteil des 533-MHz-FSBs.

Einen ausführlichen Test von DDR400-Speicher können Sie hier nachlesen. (cvi)

Testkonfiguration

Komponente

Daten

CPU 1

Pentium 4 2400 MHz Northwood

Sockel

Socket 478

FSB

400 MHz

CPU 2

Pentium 4 2400 MHz Northwood

Sockel

Socket 478

FSB

533 MHz

Grafikkarte

Leadtek WinFast GeForce3 TD

Grafikchip

NVIDIA GeForce3

Grafikspeicher

64 MByte DDR-SDRAM

BIOS

04.32.2001

Treiber

Detonator 23.11

Platine

Rev: B

Mainboard 1

Intel D850EMV2

Typ

Socket 478

Chipsatz

i850E

BIOS

MV85010A.86A.0025.P10.0203282158

Mainboard 2

SiS SS51B

Typ

Socket 478

Chipsatz

SiS645DX

BIOS

PhoenixBIOS 4.0 Release 6.0 02/06/02

RAM 1

Samsung MR16R0828BN1-CN9

Kapazität

128 MByte

Typ

PC1066-32

Chips

--

RAM 2

MR16R0828BN1-CK8

Kapazität

128 MByte

Typ

PC800-45

Chips

--

RAM 3

Samsung M368L3313DTL-CB4

Kapazität

256 MByte

Typ

PC400 CAS=2,5

Chips

Samsung K4H280838D-TCB4

Soundkarte

Creative SoundBlaster PCI128

Soundchip

Creative EMU10k1

Schnittstelle

PCI 5V

Treiber

5.12.1.2065

Platine

2999 / CT4810

Netzwerkkarte

Level One FNC-0107TX (Realtek)

Typ

10/100Base Fast Ethernet

Chip

RTL8139B

Schnittstelle

PCI 5V

Treiber

5.397.823.2001

Platine

keine Angabe

SCSI-Controller

Adaptec AHA-2940UW Pro (Adaptec)

SCSI-Interface

UltraWide

Schnittstelle

PCI 5V

BIOS

V2.11.0

Treiber

V3.60

Platine

Revision C

Festplatte 1

Quantum Atlas 10K II (Quantum)

Modell

TY184L

Kapazität

18,4 GByte

Firmware

SDA40

Schnittstelle

UW-SCSI

CD-ROM-Laufwerk

LITE-ON LTN-382

Geschwindigkeit

40x

Firmware

keine Angabe

Schnittstelle

EIDE-UltraATA/33

Diskettenlaufwerk

Teac FD-235HF

Kapazität

1,44 MByte

Netzteil

Delta Electronics

Modell

DPS-300KB-1A

Ausgangsleistung

300 Watt

Format

ATX

Tastatur

Cherry RS 6000 M

Schnittstelle

PS/2

Maus

Logitech M-S35

Schnittstelle

PS/2