Test: Pentium 4 mit RIMM-4200-Speicher

25.07.2002 von Christian Vilsbeck
Man nehme zwei PC1066-RIMMs und vereine sie zu einem Modul. RIMM 4200 nennt sich der neue Highspeed-Speicher von Rambus. Doch steigt durch das Two-in-one-Konzept auch die Performance?

Pentium-4-Systeme mit RDRAM-Speicher haben ein Problem: Die Dual-Channel-Mainboards mit Intels i850/E-Chipsatz müssen immer paarweise mit RIMMs bestückt werden. Und zwei Speichermodule sind teurer als ein Modul der gleichen Kapazität. Die Mainboards kosten auf Grund dieser Doppelbestückung ebenfalls mehr, da die doppelte Anzahl von Modulsockeln notwendig ist. Somit benötigt man mehr Platz auf dem Board und ein aufwendigeres Layout - noch höhere Kosten sind die Folge.

Diese Faktoren sowie das deutlich billigere, aber nicht langsamere DDR-SDRAM lassen RDRAM-Speicher immer mehr ins Abseits driften. Mit dem neuen Konzept der RIMM-4200-Module will Rambus entgegensteuern. Ein Modul genügt als Basisbestückung. Soll diese erweitert werden, steckt man einfach noch eines dazu. Das RIMM-4200-Konzept setzt auf vorhandene Dual-RDRAM-Chipsätze wie Intels i850E - spezielle Versionen sind nicht notwendig.

Hersteller für die RIMM-4200-Module haben sich bereits gefunden: Elpida und Samsung. Ein erstes Mainboard ist mit dem Asus P4T533 ebenfalls verfügbar. tecCHANNEL hat es zusammen mit dem RIMM-4200-Speicher getestet und den anderen Speichertechnologien gegenübergestellt.

Details zum RIMM 4200

Der Name RIMM 4200 offenbart die Bandbreite des Speichermoduls mit 4200 MByte/s (1000er Basis). Dies entspricht dem Durchsatz von zwei RDRAM-Kanälen mit PC1066-Speicher. Beim RIMM-4200-Modul sind somit im Prinzip nur zwei RDRAM-Kanäle auf einer Platine integriert. Die Taktfrequenz des RIMM-4200-Speichers beträgt 1066 MHz.

Statt der üblichen 184 Pins der 16-Bit-breiten Standard-RIMMs benötigt das RIMM 4200 eine Modulplatine mit 232 Pins. Die Datenbreite des neuen Moduls beträgt bei Addition der beiden RDRAM-Kanäle nun 32 Bit. Die Abmessungen ändern sich durch die erhöhte Pinzahl aber nicht. Der bislang in der Modulmitte von Pins unbelegte Platinenbereich wird beim RIMM 4200 genutzt. Dadurch bleiben auch der Pinabstand sowie die Kontaktflächen gleich. Der RIMM-4200-Standard entstammt einer Gemeinschaftsentwicklung von Samsung, ASUSTeK, Kingston, Tyco Electronics und Rambus.

RIMM-4200-Module vereinfachen mit einer eingebauten Channel-Terminierung auch das Mainboard-Design, so Steven Woo, Principal Engineer bei Rambus im Gespräch mit tecCHANNEL. Die Terminierung auf dem Mainboard entfällt. Maximal zwei Steckplätze für RIMM-4200-Module sind auf entsprechenden Boards möglich. Wird nur ein RIMM 4200 verwendet, dann benötigt der zweite Sockel nach wie vor ein C-RIMM. Neu an den nun CT-RIMMs bezeichneten Dummy-Platinen ist die eingebaute Terminierung.

Neben den RIMM-4200-Modulen gibt es noch die Variante RIMM 3200. Der 32-Bit-Speicher taktet mit 800-MHz-RDRAMs und erlaubt eine Bandbreite von 3200 MByte/s (1000er Basis).

Benchmark-Vorbetrachtung

Für RIMM-4200-Module gibt es das P4T533 von Asus. Das Mainboard verwendet Intels i850E-Chipsatz und diente uns als Testplattform für den neuen Speicher.

Alle Tests mit PC800- und PC1066-Speicher führten wir mit dem Intel Desktop-Mainboard D850EMV2 mit i850E-Chipsatz durch. Der Dual-Channel-RDRAM-Chipsatz entspricht bis auf den 533-MHz-FSB dem Vorgänger i850. Näheres dazu können Sie hier nachlesen.

Intels i850E arbeitet laut Datenblatt nur mit PC800-Speicher zusammen, unterstützt inoffiziell aber auch PC1066-RIMMs. Für einen offiziellen Chipsatz-Support wurde der neue Speicher nicht ausgiebig genug verifiziert, so Intel. Den Mainboard-Herstellern bleibe es laut Intel selbst überlassen, PC1066 zu unterstützen.

Alle Speichertests mit RIMM 4200, PC800 und PC1066 haben wir mit Pentium-4-Prozessoren bei 2,4 GHz Taktfrequenz durchgeführt. Für die vergleichenden Tests von DDR-SDRAM-Speicher verwendeten wir ein Referenz-Mainboard von SiS mit dem Pentium-4-Chipsatz SiS645DX. Der Chipsatz für PC266- und PC333-DDR-SDRAM kann in der von uns getesteten Version zusätzlich mit DDR400-Speicher (PC400) arbeiten. SiS stellt zu diesem Zweck ein speziell angepasstes BIOS für das Mainboard zur Verfügung. Als Prozessor kam ebenfalls der Pentium 4 mit 2,4 GHz Taktfrequenz (FSB 400 und 533 MHz) zum Einsatz.

Alle Tests der verschiedenen Speichertypen und -geschwindigkeiten haben wir mit 256 MByte Arbeitsspeicher durchgeführt.

RIMM 4200 nur bei FSB 533

Die Flexibilität von Intels i850E-Chipsatz bezüglich PC1066- beziehungsweise RIMM-4200-Speicher ist sehr eingeschränkt. Vom hohen Speichertakt profitieren nur Pentium-4-Prozessoren mit einem FSB-Takt von 533 MHz. Speicher und Prozessorbus laufen in dieser Kombination mit einem synchronen Takt (1066 MHz Speichertakt per DDR).

Den asynchronen Betrieb von Pentium-4-Prozessoren mit 400 MHz FSB und 1066 MHz Speichertakt unterstützt der i850E-Chipsatz dagegen nicht. PC1066-RDRAM läuft bei einem 400-MHz-FSB ebenfalls nur mit 400 MHz Taktfrequenz (800 MHz per DDR). Ein RIMM-4200-Modul arbeitet bei einem 400-MHz-FSB somit mit der Geschwindigkeit eines RIMM 3200.

Zur Überprüfung der jeweiligen Taktfrequenz von Prozessorbus und Speicher haben wir unser Digital-Oszilloskop LeCroy LC564A verwendet. Nur bei Pentium-4-Prozessoren mit 533 MHz FSB konnten wir einen Speichertakt von 533 MHz bei PC1066-RIMMs messen. Beim Wechsel auf einen Pentium 4 mit 400 MHz FSB laufen die PC1066-Module nur mit 400 MHz.

Hans-Jürgen Werner, zuständig für Presse- und Öffentlichkeitsarbeit bei Intel Deutschland, bestätigte die Messergebnisse von tecCHANNEL. Der Chipsatz i850E arbeitet bei 400 MHz FSB maximal mit einem Speichertakt von 400 MHz, auch wenn PC1066-Speicher eingesetzt wird.

tecMEM-Werte

Der neue RIMM-4200-Speicher ermöglicht eine maximale Bandbreite von 4,2 GByte. Bei Rechnung mit der Basis 1024 beläuft sich der Wert auf 3,97 GByte/s. Dies entspricht dem Wert von zwei Rambus-Kanälen mit PC1066-RIMMs.

Soweit die Theorie. Die tatsächliche Speicher-Performance überprüfen wir mit unserem Benchmark tecMEM. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Eine detaillierte Beschreibung von tecMEM sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite Pro finden Sie hier.

Speicher-Performance

Speicher

Load 32 [MByte/s]

Store 32 [MByte/s]

Move 32 [MByte/s]

Store 64 [MByte/s]

Load 128 [MByte/s]

Store 128 [MByte/s]

Höhere Werte sind besser. Alle Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz und unserem Benchmark-Programm tecMEM unter Windows XP durchgeführt.

RIMM 4200 FSB533

1748

942

940

988

2875

993

PC1066 FSB533

1716

951

938

983

2867

985

PC800 FSB533

1571

787

774

798

2446

799

PC800 FSB400

1409

722

732

740

2284

741

DDR400 FSB533

1751

1023

859

846

2647

853

DDR400 FSB400

1609

917

838

835

2455

843

DDR333 FSB533

1679

875

760

757

2354

755

DDR333 FSB400

1558

789

724

709

2272

708

RIMM 4200 und PC1066 liegen wie erwartet auf gleich hohem Niveau. Beide Speicher nutzen 1066-MHz-RDRAMs mit 32 ns Zugriffszeit. Die geringfügig besseren Werte des RIMM-4200-Systems sind durch unterschiedliche Speicher-Timings des Asus- (RIMM 4200) und Intel-Mainboards (PC1066) verursacht.

Im Vergleich zu DDR400 kann sich RIMM 4200 / PC1066 vor allem bei längeren Blockzugriffen wie den 128-Bit-Befehlen behaupten. Bei kürzeren Blöcken (32-Bit-Zugriffe) macht sich die langsamere Zugriffszeit von RDRAM negativ bemerkbar, hier behält DDR-SDRAM die Oberhand.

Transferkurven

Ob der Intel i850E-Chipsatz den Pentium-4-Prozessor und den RIMM-4200-Speicher optimal unterstützt, zeigen die Transferkurven unseres Benchmarks tecMEM bei 32-Bit-Kommandos. Hier prüft das Programm mit Load-, Store und Move-Befehlen, wie schnell der Chipsatz Daten zwischen CPU und Hauptspeicher transferieren kann.

Die beiden Transferkurven zeigen den i850E-Chipsatz mit einem Pentium 4 mit 2,4 GHz und 533-MHz-FSB in Aktion. Der Kurvenverlauf bis zu 8 KByte großen Blöcken zeigt den Durchsatz des L1-Caches, bis zu einer Blockgröße von 512 KByte ist der L2-Cache in Aktion. Erst ab der 512-KByte-Grenze beginnt der Hauptspeicher seine Arbeit. Bei den 32-Bit-Befehlen kann der RIMM-4200-Speicher maximal einen 21 Prozent höheren Datendurchsatz gegenüber PC800 (Dual-Channel) für sich verbuchen.

System-Performance

Im täglichen Einsatz ist die Performance bei Standardanwendungen am wichtigsten. Die Leistungsfähigkeit des Systems überprüfen wir unter Windows XP Professional mit SYSmark2001. Das Benchmark-Paket besteht aus 14 Einzelprogrammen und deckt gleichzeitig eventuelle Stabilitätsschwächen auf.

SYSmark2001 listet neben der Gesamt-Performance die Einzelergebnisse für die Kategorien Office Productivity und Internet Content Creation auf.

Office Productivity gibt die Geschwindigkeit mit Microsoft Office 2000, Netscape Communicator 6.0, Dragon NaturallySpeaking Preferred v.5, WinZip 8.0 und McAfee VirusScan 5.13 an.

Internet Content Creation soll die Performance repräsentieren mit Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0, Macromedia Dreamweaver 4 und Macromedia Flash 5.

Viewperf 6.1.2

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 6.1.2 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Stellvertretend wählen wir die vier aussagekräftigsten aus, die den Speicher- und den Grafikbus stark fordern.

Besonders der Test DX-06 erlaubt Rückschlüsse auf die Speicher-Performance der einzelnen Testkandidaten.

Alle Einzelergebnisse des SPECviewperf 6.1.2 finden Sie in der nachfolgenden Tabelle.

SPECviewperf 6.1.2

Speicher

DRV-07 [fps]

DX-06 [fps]

Light04 [fps]

MedMCAD-01 [fps]

Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

RIMM 4200 FSB533

28,4

40,5

11,4

34,8

PC1066 FSB533

28,6

40,2

11,3

34,8

PC800 FSB533

28,4

38,4

10,7

34,8

PC800 FSB400

28,3

37,4

10,4

34,7

DDR400 FSB533

27,8

39,4

10,7

33,8

DDR400 FSB400

27,2

38,7

10,1

33,4

DDR333 CL2.5 FSB533

25,8

38,4

10,4

33,0

DDR333 CL2.5 FSB400

25,9

38,1

10,5

32,8

Unreal Tournament OpenGL

Zur Analyse der OpenGL-Performance verwenden wir zusätzlich den Spiele-Benchmark Unreal Tournament. Er ist gut geeignet, um die Leistungsfähigkeit der Chipsätze für den Grafikbereich - bevorzugt OpenGL-Anwendungen - auszuloten. Dabei sind Haupt- und Grafikspeicher stark gefordert.

SPEC CPU2000: Integer

Als von der Industrie anerkanntes Analysetool verwenden wir zusätzlich die Benchmark Suite SPEC CPU2000 von SPEC. Unter Ausschluss der Grafikkartenleistung prüft das Programmpaket die Leistungsfähigkeit der CPU und des Hauptspeichers. Dabei benutzt es praxisnahe Aufgabenstellungen mit großen Datenmengen für Ganzzahlen- und Fließkomma-Anwendungen.

SPECint_base2000: Official Run

Test

PC800 FSB400

PC800 FSB533

PC1066 FSB533

RIMM 4200 FSB533

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

164.gzip

905

909

922

924

175.vpr

486

517

563

580

176.gcc

959

1007

1087

1101

181.mcf

571

618

728

749

186.crafty

817

818

824

834

197.parser

828

856

893

910

252.eon

1119

1117

1116

1127

253.perlbm

1039

1052

1066

1066

254.gap

1022

1052

1090

1101

255.vortex

1306

1355

1442

1462

256.bzip2

651

683

726

744

300.twolf

549

590

646

670

Gesamt

818

848

895

910

Stellvertretend für ein Programm aus der Integer-Suite SPECint_base2000 wählen wir für die Analyse des Speicherbusses die Anwendung 176.gcc. Diese Applikation ist in erster Linie vom Systemspeicher abhängig, der Prozessor mit seinem jeweiligen L1- und L2-Cache spielt nur eine untergeordnete Rolle. Das 176.gcc-Programm profitiert bei 533 MHz FSB-Takt von RIMM-4200-Speicher mit neun Prozent schnellerer Berechnung im Vergleich zu PC800.

Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Integer-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.

SPEC CPU2000: Floating Point

Für Fließkomma-Programme eignet sich die Anwendung 171.swim gut für die Beurteilung des Speicher-Controllers. Hier kann RIMM-4200-Speicher einen Vorteil von 24 Prozent gegenüber PC800-RDRAM für sich verbuchen (bei FSB 533). Besonders die 128-Bit-Befehle der SSE-Einheit profitieren von der hohen Speicherbandbreite.

Insgesamt profitieren die Fließkomma-Programme mehr von der höheren Speicherbandbreite als Integer-basierende Anwendungen.

SPECfp_base2000: Official Run

Test

PC800 FSB400

PC800 FSB533

PC1066 FSB533

RIMM 4200 FSB533

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

168.wupwis

1115

1155

1224

1247

171.swim

1317

1411

1739

1753

172.mgrid

771

825

899

915

173.applu

856

917

1025

1045

177.mesa

984

992

1001

1013

178.galgel

1039

1103

1210

1236

179.art

549

583

722

737

183.equake

826

890

1022

1052

187.facerec

1037

1089

1149

1162

188.ammp

516

551

607

625

189.lucas

1053

1130

1246

1268

191.fma3d

743

767

814

824

200.sixtrac

437

438

441

447

301.apsi

632

662

722

736

Gesamt

810

852

936

953

Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Floating-Point-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.

3DMark2001

Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.

Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 Pro von MadOnion. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der einzelnen Chipsätze bei anspruchsvollen 3D-Anwendungen. Unter anderem werden der AGP- und der Speicherbus durch große Mengen an Texturen stark belastet.

Unreal Tournament Direct3D

Wenn es darum geht, den Speicherbus auszureizen, eignet sich der Spiele-Benchmark Unreal Tournament mit Direct3D-Unterstützung gut. Hier sollte eine hohe Speicher-Performance von Vorteil sein.

Unreal Tournament verwendet mit der Option "Software Rendering" keine 3D-Beschleunigung der Grafikkarte. Damit übernimmt der PC-Prozessor die grafischen Berechnungen, der Hauptspeicher wird stark belastet.

Fazit

RIMM-4200-Speicher und PC1066-RIMMs sind wie erwartet gleich schnell - beide verwenden 1066-MHz-RDRAMs mit 32 ns Zugriffszeit. Auch beim Chipsatz Intel i850E sowie der Speicherbandbreite gibt es keinen Unterschied. Das Leistungsplus des neuen 32-Bit-Speichers gegenüber PC1066 liegt am Asus P4T533-Mainboard mit seinen schnelleren Speicher-Timings. Die Zusammenfassung zweier RDRAM-Kanäle auf einem Modul bringt somit keine Nachteile mit sich.

Gegenüber PC800-Speicher bewirkt RIMM 4200 eine durchschnittlich zehn Prozent höhere Leistung, in speziellen Fällen sogar bis zu 24 Prozent. Pentium-4-Prozessoren mit 533-MHz-FSB setzen sich mit RIMM 4200 beziehungsweise PC1066-RDRAM in der Mehrzahl der Benchmarks an die Spitze vor DDR400-SDRAM.

Mit dem neuen Two-in-one-Konzept der RIMM-3200/4200-Module könnte Rambus sich vor allem im High-End-Bereich weiter etablieren. Das Handling des Speichers hat sich vereinfacht. Erste Endkundenpreise für 256-MByte-RIMM-4200 liegen bei zirka 270 Euro. Das ist im Vergleich zu zwei 128-MByte-PC1066-RIMMs für insgesamt 200 Euro noch zu teuer. Der Erfolg der 32-Bit-RIMMs hängt auch davon ab, ob Intel nach dem i850E einen weiteren RDRAM-Chipsatz für den Pentium 4 plant - Gerüchte gibt es zumindest. Zwar hat SiS die Lizenzen für Pentium-4-RDRAM-Chipsätze erworben, in Produkte wurden sie aber noch nicht umgesetzt.

Einen ausführlichen Test von DDR400-Speicher können Sie hier nachlesen. Details zum RIMM-3200-Speicher finden Sie in diesem Beta-Test. (cvi)

Testkonfiguration

Komponente

Daten

CPU 1

Pentium 4 2400 MHz Northwood

Sockel

Socket 478

FSB

400 MHz

CPU 2

Pentium 4 2400 MHz Northwood

Sockel

Socket 478

FSB

533 MHz

Grafikkarte

Leadtek WinFast GeForce3 TD

Grafikchip

NVIDIA GeForce3

Grafikspeicher

64 MByte DDR-SDRAM

BIOS

04.32.2001

Treiber

Detonator 23.11

Platine

Rev: B

Mainboard 1

Intel D850EMV2

Typ

Socket 478

Chipsatz

i850E

BIOS

MV85010A.86A.0025.P10.0203282158

Mainboard 2

SiS SS51B

Typ

Socket 478

Chipsatz

SiS645DX

BIOS

PhoenixBIOS 4.0 Release 6.0 02/06/02

Mainboard 3

Asus P4T533

Typ

Socket 478

Chipsatz

i850E

BIOS

Award Medallion BIOS v6.0 05/16/2002

RAM 1

Samsung MR16R0828BN1-CN9

Kapazität

128 MByte

Typ

PC1066-32

Chips

--

RAM 2

MR16R0828BN1-CK8

Kapazität

128 MByte

Typ

PC800-45

Chips

--

RAM 3

Samsung M368L3313DTL-CB4

Kapazität

256 MByte

Typ

PC400 CAS=2,5

Chips

Samsung K4H280838D-TCB4

RAM 4

Samsung MD18R162GAF0-CN9

Kapazität

512 MByte

Typ

RIMM 4200-32

Chips

--

Soundkarte

Creative SoundBlaster PCI128

Soundchip

Creative EMU10k1

Schnittstelle

PCI 5V

Treiber

5.12.1.2065

Platine

2999 / CT4810

Netzwerkkarte

Level One FNC-0107TX (Realtek)

Typ

10/100Base Fast Ethernet

Chip

RTL8139B

Schnittstelle

PCI 5V

Treiber

5.397.823.2001

Platine

keine Angabe

SCSI-Controller

Adaptec AHA-2940UW Pro (Adaptec)

SCSI-Interface

UltraWide

Schnittstelle

PCI 5V

BIOS

V2.11.0

Treiber

V3.60

Platine

Revision C

Festplatte 1

Quantum Atlas 10K II (Quantum)

Modell

TY184L

Kapazität

18,4 GByte

Firmware

SDA40

Schnittstelle

UW-SCSI

CD-ROM-Laufwerk

LITE-ON LTN-382

Geschwindigkeit

40x

Firmware

keine Angabe

Schnittstelle

EIDE-UltraATA/33

Diskettenlaufwerk

Teac FD-235HF

Kapazität

1,44 MByte

Netzteil

Delta Electronics

Modell

DPS-300KB-1A

Ausgangsleistung

300 Watt

Format

ATX

Tastatur

Cherry RS 6000 M

Schnittstelle

PS/2

Maus

Logitech M-S35

Schnittstelle

PS/2