Pentium-4-Systeme mit RDRAM-Speicher haben ein Problem: Die Dual-Channel-Mainboards mit Intels i850/E-Chipsatz müssen immer paarweise mit RIMMs bestückt werden. Und zwei Speichermodule sind teurer als ein Modul der gleichen Kapazität. Die Mainboards kosten auf Grund dieser Doppelbestückung ebenfalls mehr, da die doppelte Anzahl von Modulsockeln notwendig ist. Somit benötigt man mehr Platz auf dem Board und ein aufwendigeres Layout - noch höhere Kosten sind die Folge.
Diese Faktoren sowie das deutlich billigere, aber nicht langsamere DDR-SDRAM lassen RDRAM-Speicher immer mehr ins Abseits driften. Mit dem neuen Konzept der RIMM-4200-Module will Rambus entgegensteuern. Ein Modul genügt als Basisbestückung. Soll diese erweitert werden, steckt man einfach noch eines dazu. Das RIMM-4200-Konzept setzt auf vorhandene Dual-RDRAM-Chipsätze wie Intels i850E - spezielle Versionen sind nicht notwendig.
Hersteller für die RIMM-4200-Module haben sich bereits gefunden: Elpida und Samsung. Ein erstes Mainboard ist mit dem Asus P4T533 ebenfalls verfügbar. tecCHANNEL hat es zusammen mit dem RIMM-4200-Speicher getestet und den anderen Speichertechnologien gegenübergestellt.
Details zum RIMM 4200
Der Name RIMM 4200 offenbart die Bandbreite des Speichermoduls mit 4200 MByte/s (1000er Basis). Dies entspricht dem Durchsatz von zwei RDRAM-Kanälen mit PC1066-Speicher. Beim RIMM-4200-Modul sind somit im Prinzip nur zwei RDRAM-Kanäle auf einer Platine integriert. Die Taktfrequenz des RIMM-4200-Speichers beträgt 1066 MHz.
Statt der üblichen 184 Pins der 16-Bit-breiten Standard-RIMMs benötigt das RIMM 4200 eine Modulplatine mit 232 Pins. Die Datenbreite des neuen Moduls beträgt bei Addition der beiden RDRAM-Kanäle nun 32 Bit. Die Abmessungen ändern sich durch die erhöhte Pinzahl aber nicht. Der bislang in der Modulmitte von Pins unbelegte Platinenbereich wird beim RIMM 4200 genutzt. Dadurch bleiben auch der Pinabstand sowie die Kontaktflächen gleich. Der RIMM-4200-Standard entstammt einer Gemeinschaftsentwicklung von Samsung, ASUSTeK, Kingston, Tyco Electronics und Rambus.
RIMM-4200-Module vereinfachen mit einer eingebauten Channel-Terminierung auch das Mainboard-Design, so Steven Woo, Principal Engineer bei Rambus im Gespräch mit tecCHANNEL. Die Terminierung auf dem Mainboard entfällt. Maximal zwei Steckplätze für RIMM-4200-Module sind auf entsprechenden Boards möglich. Wird nur ein RIMM 4200 verwendet, dann benötigt der zweite Sockel nach wie vor ein C-RIMM. Neu an den nun CT-RIMMs bezeichneten Dummy-Platinen ist die eingebaute Terminierung.
Neben den RIMM-4200-Modulen gibt es noch die Variante RIMM 3200. Der 32-Bit-Speicher taktet mit 800-MHz-RDRAMs und erlaubt eine Bandbreite von 3200 MByte/s (1000er Basis).
Benchmark-Vorbetrachtung
Für RIMM-4200-Module gibt es das P4T533 von Asus. Das Mainboard verwendet Intels i850E-Chipsatz und diente uns als Testplattform für den neuen Speicher.
Alle Tests mit PC800- und PC1066-Speicher führten wir mit dem Intel Desktop-Mainboard D850EMV2 mit i850E-Chipsatz durch. Der Dual-Channel-RDRAM-Chipsatz entspricht bis auf den 533-MHz-FSB dem Vorgänger i850. Näheres dazu können Sie hier nachlesen.
Intels i850E arbeitet laut Datenblatt nur mit PC800-Speicher zusammen, unterstützt inoffiziell aber auch PC1066-RIMMs. Für einen offiziellen Chipsatz-Support wurde der neue Speicher nicht ausgiebig genug verifiziert, so Intel. Den Mainboard-Herstellern bleibe es laut Intel selbst überlassen, PC1066 zu unterstützen.
Alle Speichertests mit RIMM 4200, PC800 und PC1066 haben wir mit Pentium-4-Prozessoren bei 2,4 GHz Taktfrequenz durchgeführt. Für die vergleichenden Tests von DDR-SDRAM-Speicher verwendeten wir ein Referenz-Mainboard von SiS mit dem Pentium-4-Chipsatz SiS645DX. Der Chipsatz für PC266- und PC333-DDR-SDRAM kann in der von uns getesteten Version zusätzlich mit DDR400-Speicher (PC400) arbeiten. SiS stellt zu diesem Zweck ein speziell angepasstes BIOS für das Mainboard zur Verfügung. Als Prozessor kam ebenfalls der Pentium 4 mit 2,4 GHz Taktfrequenz (FSB 400 und 533 MHz) zum Einsatz.
Alle Tests der verschiedenen Speichertypen und -geschwindigkeiten haben wir mit 256 MByte Arbeitsspeicher durchgeführt.
RIMM 4200 nur bei FSB 533
Die Flexibilität von Intels i850E-Chipsatz bezüglich PC1066- beziehungsweise RIMM-4200-Speicher ist sehr eingeschränkt. Vom hohen Speichertakt profitieren nur Pentium-4-Prozessoren mit einem FSB-Takt von 533 MHz. Speicher und Prozessorbus laufen in dieser Kombination mit einem synchronen Takt (1066 MHz Speichertakt per DDR).
Den asynchronen Betrieb von Pentium-4-Prozessoren mit 400 MHz FSB und 1066 MHz Speichertakt unterstützt der i850E-Chipsatz dagegen nicht. PC1066-RDRAM läuft bei einem 400-MHz-FSB ebenfalls nur mit 400 MHz Taktfrequenz (800 MHz per DDR). Ein RIMM-4200-Modul arbeitet bei einem 400-MHz-FSB somit mit der Geschwindigkeit eines RIMM 3200.
Zur Überprüfung der jeweiligen Taktfrequenz von Prozessorbus und Speicher haben wir unser Digital-Oszilloskop LeCroy LC564A verwendet. Nur bei Pentium-4-Prozessoren mit 533 MHz FSB konnten wir einen Speichertakt von 533 MHz bei PC1066-RIMMs messen. Beim Wechsel auf einen Pentium 4 mit 400 MHz FSB laufen die PC1066-Module nur mit 400 MHz.
Hans-Jürgen Werner, zuständig für Presse- und Öffentlichkeitsarbeit bei Intel Deutschland, bestätigte die Messergebnisse von tecCHANNEL. Der Chipsatz i850E arbeitet bei 400 MHz FSB maximal mit einem Speichertakt von 400 MHz, auch wenn PC1066-Speicher eingesetzt wird.
tecMEM-Werte
Der neue RIMM-4200-Speicher ermöglicht eine maximale Bandbreite von 4,2 GByte. Bei Rechnung mit der Basis 1024 beläuft sich der Wert auf 3,97 GByte/s. Dies entspricht dem Wert von zwei Rambus-Kanälen mit PC1066-RIMMs.
Soweit die Theorie. Die tatsächliche Speicher-Performance überprüfen wir mit unserem Benchmark tecMEM. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Eine detaillierte Beschreibung von tecMEM sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite Pro finden Sie hier.
Speicher | Load 32 [MByte/s] | Store 32 [MByte/s] | Move 32 [MByte/s] | Store 64 [MByte/s] | Load 128 [MByte/s] | Store 128 [MByte/s] |
---|---|---|---|---|---|---|
Höhere Werte sind besser. Alle Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz und unserem Benchmark-Programm tecMEM unter Windows XP durchgeführt. | ||||||
RIMM 4200 FSB533 | 1748 | 942 | 940 | 988 | 2875 | 993 |
PC1066 FSB533 | 1716 | 951 | 938 | 983 | 2867 | 985 |
PC800 FSB533 | 1571 | 787 | 774 | 798 | 2446 | 799 |
PC800 FSB400 | 1409 | 722 | 732 | 740 | 2284 | 741 |
DDR400 FSB533 | 1751 | 1023 | 859 | 846 | 2647 | 853 |
DDR400 FSB400 | 1609 | 917 | 838 | 835 | 2455 | 843 |
DDR333 FSB533 | 1679 | 875 | 760 | 757 | 2354 | 755 |
DDR333 FSB400 | 1558 | 789 | 724 | 709 | 2272 | 708 |
RIMM 4200 und PC1066 liegen wie erwartet auf gleich hohem Niveau. Beide Speicher nutzen 1066-MHz-RDRAMs mit 32 ns Zugriffszeit. Die geringfügig besseren Werte des RIMM-4200-Systems sind durch unterschiedliche Speicher-Timings des Asus- (RIMM 4200) und Intel-Mainboards (PC1066) verursacht.
Im Vergleich zu DDR400 kann sich RIMM 4200 / PC1066 vor allem bei längeren Blockzugriffen wie den 128-Bit-Befehlen behaupten. Bei kürzeren Blöcken (32-Bit-Zugriffe) macht sich die langsamere Zugriffszeit von RDRAM negativ bemerkbar, hier behält DDR-SDRAM die Oberhand.
Transferkurven
Ob der Intel i850E-Chipsatz den Pentium-4-Prozessor und den RIMM-4200-Speicher optimal unterstützt, zeigen die Transferkurven unseres Benchmarks tecMEM bei 32-Bit-Kommandos. Hier prüft das Programm mit Load-, Store und Move-Befehlen, wie schnell der Chipsatz Daten zwischen CPU und Hauptspeicher transferieren kann.
Die beiden Transferkurven zeigen den i850E-Chipsatz mit einem Pentium 4 mit 2,4 GHz und 533-MHz-FSB in Aktion. Der Kurvenverlauf bis zu 8 KByte großen Blöcken zeigt den Durchsatz des L1-Caches, bis zu einer Blockgröße von 512 KByte ist der L2-Cache in Aktion. Erst ab der 512-KByte-Grenze beginnt der Hauptspeicher seine Arbeit. Bei den 32-Bit-Befehlen kann der RIMM-4200-Speicher maximal einen 21 Prozent höheren Datendurchsatz gegenüber PC800 (Dual-Channel) für sich verbuchen.
System-Performance
Im täglichen Einsatz ist die Performance bei Standardanwendungen am wichtigsten. Die Leistungsfähigkeit des Systems überprüfen wir unter Windows XP Professional mit SYSmark2001. Das Benchmark-Paket besteht aus 14 Einzelprogrammen und deckt gleichzeitig eventuelle Stabilitätsschwächen auf.
SYSmark2001 listet neben der Gesamt-Performance die Einzelergebnisse für die Kategorien Office Productivity und Internet Content Creation auf.
Office Productivity gibt die Geschwindigkeit mit Microsoft Office 2000, Netscape Communicator 6.0, Dragon NaturallySpeaking Preferred v.5, WinZip 8.0 und McAfee VirusScan 5.13 an.
Internet Content Creation soll die Performance repräsentieren mit Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0, Macromedia Dreamweaver 4 und Macromedia Flash 5.
Viewperf 6.1.2
Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 6.1.2 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Stellvertretend wählen wir die vier aussagekräftigsten aus, die den Speicher- und den Grafikbus stark fordern.
Besonders der Test DX-06 erlaubt Rückschlüsse auf die Speicher-Performance der einzelnen Testkandidaten.
Alle Einzelergebnisse des SPECviewperf 6.1.2 finden Sie in der nachfolgenden Tabelle.
Speicher | DRV-07 [fps] | DX-06 [fps] | Light04 [fps] | MedMCAD-01 [fps] |
---|---|---|---|---|
Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt. | ||||
RIMM 4200 FSB533 | 28,4 | 40,5 | 11,4 | 34,8 |
PC1066 FSB533 | 28,6 | 40,2 | 11,3 | 34,8 |
PC800 FSB533 | 28,4 | 38,4 | 10,7 | 34,8 |
PC800 FSB400 | 28,3 | 37,4 | 10,4 | 34,7 |
DDR400 FSB533 | 27,8 | 39,4 | 10,7 | 33,8 |
DDR400 FSB400 | 27,2 | 38,7 | 10,1 | 33,4 |
DDR333 CL2.5 FSB533 | 25,8 | 38,4 | 10,4 | 33,0 |
DDR333 CL2.5 FSB400 | 25,9 | 38,1 | 10,5 | 32,8 |
Unreal Tournament OpenGL
Zur Analyse der OpenGL-Performance verwenden wir zusätzlich den Spiele-Benchmark Unreal Tournament. Er ist gut geeignet, um die Leistungsfähigkeit der Chipsätze für den Grafikbereich - bevorzugt OpenGL-Anwendungen - auszuloten. Dabei sind Haupt- und Grafikspeicher stark gefordert.
SPEC CPU2000: Integer
Als von der Industrie anerkanntes Analysetool verwenden wir zusätzlich die Benchmark Suite SPEC CPU2000 von SPEC. Unter Ausschluss der Grafikkartenleistung prüft das Programmpaket die Leistungsfähigkeit der CPU und des Hauptspeichers. Dabei benutzt es praxisnahe Aufgabenstellungen mit großen Datenmengen für Ganzzahlen- und Fließkomma-Anwendungen.
Test | PC800 FSB400 | PC800 FSB533 | PC1066 FSB533 | RIMM 4200 FSB533 |
---|---|---|---|---|
Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt. | ||||
164.gzip | 905 | 909 | 922 | 924 |
175.vpr | 486 | 517 | 563 | 580 |
176.gcc | 959 | 1007 | 1087 | 1101 |
181.mcf | 571 | 618 | 728 | 749 |
186.crafty | 817 | 818 | 824 | 834 |
197.parser | 828 | 856 | 893 | 910 |
252.eon | 1119 | 1117 | 1116 | 1127 |
253.perlbm | 1039 | 1052 | 1066 | 1066 |
254.gap | 1022 | 1052 | 1090 | 1101 |
255.vortex | 1306 | 1355 | 1442 | 1462 |
256.bzip2 | 651 | 683 | 726 | 744 |
300.twolf | 549 | 590 | 646 | 670 |
Gesamt | 818 | 848 | 895 | 910 |
Stellvertretend für ein Programm aus der Integer-Suite SPECint_base2000 wählen wir für die Analyse des Speicherbusses die Anwendung 176.gcc. Diese Applikation ist in erster Linie vom Systemspeicher abhängig, der Prozessor mit seinem jeweiligen L1- und L2-Cache spielt nur eine untergeordnete Rolle. Das 176.gcc-Programm profitiert bei 533 MHz FSB-Takt von RIMM-4200-Speicher mit neun Prozent schnellerer Berechnung im Vergleich zu PC800.
Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Integer-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.
SPEC CPU2000: Floating Point
Für Fließkomma-Programme eignet sich die Anwendung 171.swim gut für die Beurteilung des Speicher-Controllers. Hier kann RIMM-4200-Speicher einen Vorteil von 24 Prozent gegenüber PC800-RDRAM für sich verbuchen (bei FSB 533). Besonders die 128-Bit-Befehle der SSE-Einheit profitieren von der hohen Speicherbandbreite.
Insgesamt profitieren die Fließkomma-Programme mehr von der höheren Speicherbandbreite als Integer-basierende Anwendungen.
Test | PC800 FSB400 | PC800 FSB533 | PC1066 FSB533 | RIMM 4200 FSB533 |
---|---|---|---|---|
Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt. | ||||
168.wupwis | 1115 | 1155 | 1224 | 1247 |
171.swim | 1317 | 1411 | 1739 | 1753 |
172.mgrid | 771 | 825 | 899 | 915 |
173.applu | 856 | 917 | 1025 | 1045 |
177.mesa | 984 | 992 | 1001 | 1013 |
178.galgel | 1039 | 1103 | 1210 | 1236 |
179.art | 549 | 583 | 722 | 737 |
183.equake | 826 | 890 | 1022 | 1052 |
187.facerec | 1037 | 1089 | 1149 | 1162 |
188.ammp | 516 | 551 | 607 | 625 |
189.lucas | 1053 | 1130 | 1246 | 1268 |
191.fma3d | 743 | 767 | 814 | 824 |
200.sixtrac | 437 | 438 | 441 | 447 |
301.apsi | 632 | 662 | 722 | 736 |
Gesamt | 810 | 852 | 936 | 953 |
Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Floating-Point-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.
3DMark2001
Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.
Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 Pro von MadOnion. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der einzelnen Chipsätze bei anspruchsvollen 3D-Anwendungen. Unter anderem werden der AGP- und der Speicherbus durch große Mengen an Texturen stark belastet.
Unreal Tournament Direct3D
Wenn es darum geht, den Speicherbus auszureizen, eignet sich der Spiele-Benchmark Unreal Tournament mit Direct3D-Unterstützung gut. Hier sollte eine hohe Speicher-Performance von Vorteil sein.
Unreal Tournament verwendet mit der Option "Software Rendering" keine 3D-Beschleunigung der Grafikkarte. Damit übernimmt der PC-Prozessor die grafischen Berechnungen, der Hauptspeicher wird stark belastet.
Fazit
RIMM-4200-Speicher und PC1066-RIMMs sind wie erwartet gleich schnell - beide verwenden 1066-MHz-RDRAMs mit 32 ns Zugriffszeit. Auch beim Chipsatz Intel i850E sowie der Speicherbandbreite gibt es keinen Unterschied. Das Leistungsplus des neuen 32-Bit-Speichers gegenüber PC1066 liegt am Asus P4T533-Mainboard mit seinen schnelleren Speicher-Timings. Die Zusammenfassung zweier RDRAM-Kanäle auf einem Modul bringt somit keine Nachteile mit sich.
Gegenüber PC800-Speicher bewirkt RIMM 4200 eine durchschnittlich zehn Prozent höhere Leistung, in speziellen Fällen sogar bis zu 24 Prozent. Pentium-4-Prozessoren mit 533-MHz-FSB setzen sich mit RIMM 4200 beziehungsweise PC1066-RDRAM in der Mehrzahl der Benchmarks an die Spitze vor DDR400-SDRAM.
Mit dem neuen Two-in-one-Konzept der RIMM-3200/4200-Module könnte Rambus sich vor allem im High-End-Bereich weiter etablieren. Das Handling des Speichers hat sich vereinfacht. Erste Endkundenpreise für 256-MByte-RIMM-4200 liegen bei zirka 270 Euro. Das ist im Vergleich zu zwei 128-MByte-PC1066-RIMMs für insgesamt 200 Euro noch zu teuer. Der Erfolg der 32-Bit-RIMMs hängt auch davon ab, ob Intel nach dem i850E einen weiteren RDRAM-Chipsatz für den Pentium 4 plant - Gerüchte gibt es zumindest. Zwar hat SiS die Lizenzen für Pentium-4-RDRAM-Chipsätze erworben, in Produkte wurden sie aber noch nicht umgesetzt.
Einen ausführlichen Test von DDR400-Speicher können Sie hier nachlesen. Details zum RIMM-3200-Speicher finden Sie in diesem Beta-Test. (cvi)
Testkonfiguration
Komponente | Daten |
---|---|
| |
CPU 1 | Pentium 4 2400 MHz Northwood |
Sockel | Socket 478 |
FSB | 400 MHz |
CPU 2 | Pentium 4 2400 MHz Northwood |
Sockel | Socket 478 |
FSB | 533 MHz |
Grafikkarte | Leadtek WinFast GeForce3 TD |
Grafikchip | NVIDIA GeForce3 |
Grafikspeicher | 64 MByte DDR-SDRAM |
BIOS | 04.32.2001 |
Treiber | Detonator 23.11 |
Platine | Rev: B |
Mainboard 1 | Intel D850EMV2 |
Typ | Socket 478 |
Chipsatz | i850E |
BIOS | MV85010A.86A.0025.P10.0203282158 |
Mainboard 2 | SiS SS51B |
Typ | Socket 478 |
Chipsatz | SiS645DX |
BIOS | PhoenixBIOS 4.0 Release 6.0 02/06/02 |
Mainboard 3 | Asus P4T533 |
Typ | Socket 478 |
Chipsatz | i850E |
BIOS | Award Medallion BIOS v6.0 05/16/2002 |
RAM 1 | Samsung MR16R0828BN1-CN9 |
Kapazität | 128 MByte |
Typ | PC1066-32 |
Chips | -- |
RAM 2 | MR16R0828BN1-CK8 |
Kapazität | 128 MByte |
Typ | PC800-45 |
Chips | -- |
RAM 3 | Samsung M368L3313DTL-CB4 |
Kapazität | 256 MByte |
Typ | PC400 CAS=2,5 |
Chips | Samsung K4H280838D-TCB4 |
RAM 4 | Samsung MD18R162GAF0-CN9 |
Kapazität | 512 MByte |
Typ | RIMM 4200-32 |
Chips | -- |
Soundkarte | Creative SoundBlaster PCI128 |
Soundchip | Creative EMU10k1 |
Schnittstelle | PCI 5V |
Treiber | 5.12.1.2065 |
Platine | 2999 / CT4810 |
Netzwerkkarte | Level One FNC-0107TX (Realtek) |
Typ | 10/100Base Fast Ethernet |
Chip | RTL8139B |
Schnittstelle | PCI 5V |
Treiber | 5.397.823.2001 |
Platine | keine Angabe |
SCSI-Controller | Adaptec AHA-2940UW Pro (Adaptec) |
SCSI-Interface | UltraWide |
Schnittstelle | PCI 5V |
BIOS | V2.11.0 |
Treiber | V3.60 |
Platine | Revision C |
Festplatte 1 | Quantum Atlas 10K II (Quantum) |
Modell | TY184L |
Kapazität | 18,4 GByte |
Firmware | SDA40 |
Schnittstelle | UW-SCSI |
CD-ROM-Laufwerk | LITE-ON LTN-382 |
Geschwindigkeit | 40x |
Firmware | keine Angabe |
Schnittstelle | EIDE-UltraATA/33 |
Diskettenlaufwerk | Teac FD-235HF |
Kapazität | 1,44 MByte |
Netzteil | Delta Electronics |
Modell | DPS-300KB-1A |
Ausgangsleistung | 300 Watt |
Format | ATX |
Tastatur | Cherry RS 6000 M |
Schnittstelle | PS/2 |
Maus | Logitech M-S35 |
Schnittstelle | PS/2 |