Seit Intel mit den i845-Chipsätzen DDR-SDRAM unterstützt, wurde es immer stiller um die bis dahin für den Pentium 4 favorisierte Speichertechnologie der Firma Rambus. RDRAM verkam vom "Massenspeicher" der Pentium-4-Boards zum Nischenspeicher. Kein Wunder, bietet DDR-SDRAM zu deutlich günstigeren Preisen eine vergleichbare Performance.
Jetzt gibt es erste RDRAM-Module mit einer Taktfrequenz von 1066 MHz (per DDR). Gegenüber PC800-RIMMs mit 800 MHz Speichertakt entspricht dies einer Steigerung von 33 Prozent. Deutlich verringert hat sich auch die Zugriffszeit der neuen Module: 32 ns (PC1066) statt 45 ns (PC800). Gerade Anwendungen, die häufig auf unterschiedliche Speicherbereiche zugreifen, profitieren von geringen Latenzzeiten. Hier ist DDR-SDRAM deutlich im Vorteil: die Zugriffszeit beträgt bei DDR400 nur 5 ns.
Intel i850-Mainboards mit Dual-Channel-Speicher-Interface erreichen mit PC800-RDRAM eine Bandbreite von 2,98 GByte/s. Seit dem 6. Mai 2002 gibt es von Intel den i850E-Chipsatz. Neu gegenüber dem Vorgänger ist der 533-MHz-FSB für den Pentium 4 sowie die "inoffizielle" Unterstützung von PC1066-Speicher. Der Dual-Channel-Chipsatz ermöglicht damit eine Speicherbandbreite von 3,97 GByte/s.
Pentium-4-Prozessoren mit 533-MHz-FSB müssten also von PC1066 profitieren. Bei diesem FSB-Takt erhöht sich der Durchsatz zwischen CPU und Chipsatz ebenfalls auf 3,97 GByte/s. In Kombination mit DDR400-Speicher blieb der Performance-Zuwachs durch den höheren FSB bescheiden, wie ein früherer Test bereits zeigte. DDR400 besitzt ein Bandbreite von 2,98 GByte/s und reizt den 533-MHz-FSB nicht aus.
Liegt hier die Chance von PC1066-RDRAM? Kann es sich in Kombination mit 533-MHz-FSB-Pentium-4-Prozessoren deutlich von DDR-SDRAM absetzen? Unsere Benchmarks geben die Antwort.
Benchmark-Vorbetrachtung
Alle Tests mit PC800- und PC1066-Speicher führten wir mit dem Intel Desktop-Mainboard D850EMV2 mit i850E-Chipsatz durch. Der Dual-Channel-RDRAM-Chipsatz entspricht bis auf den 533-MHZ-FSB dem Vorgänger i850, dessen Details Sie hier nachlesen können.
Intels i850E arbeitet laut Datenblatt nur mit PC800-Speicher zusammen, unterstützt inoffiziell aber auch PC1066-RIMMs. Intel hat den neuen Speicher für einen offiziellen Chipsatz-Support nicht ausgiebig genug verifiziert, so der Hersteller. Den Mainboard-Herstellern bleibe es laut Intel selbst überlassen, PC1066 zu unterstützen. Bislang war so viel Freiraum bei Intel unüblich. Selbst Intels D850EMV2-Mainboard läuft mit PC1066-RDRAM, zeigt beim ersten Booten aber einen Warnhinweis.
Alle Speichertests mit PC800 und PC1066 haben wir mit Pentium-4-Prozessoren bei 2,4 GHz Taktfrequenz durchgeführt - jeweils mit 400 und 533 MHz FSB. Für die vergleichenden Tests von DDR-SDRAM-Speicher verwendeten wir ein Referenz-Mainboard von SiS mit dem Pentium-4-Chipsatz SiS645DX. Der Chipsatz für PC266- und PC333-DDR-SDRAM kann in der von uns getesteten Version zusätzlich mit DDR400-Speicher (PC400) arbeiten. SiS stellt zu diesem Zweck ein speziell angepasstes BIOS für das Mainboard zur Verfügung. Als Prozessor kam ebenfalls Pentium 4 mit 2,4 GHz Taktfrequenz (FSB 400 und 533) zum Einsatz. Einen separaten Test von DDR400-SDRAM finden Sie hier.
Alle Tests der verschiedenen Speichertypen und -geschwindigkeiten haben wir mit 256 MByte Arbeitsspeicher durchgeführt.
PC1066 nur bei FSB 533
Die Flexibilität von Intels i850E-Chipsatz bezüglich PC1066-Speicher ist sehr eingeschränkt. Vom hohen Speichertakt profitieren nur Pentium-4-Prozessoren mit einem FSB-Takt von 533 MHz. Speicher und Prozessorbus laufen in dieser Kombination mit einem synchronen Takt (1066 MHz Speichertakt per DDR).
Den asynchronen Betrieb von Pentium-4-Prozessoren mit 400 MHz FSB und 1066 MHz Speichertakt unterstützt der i850E-Chipsatz dagegen nicht. PC1066-RDRAM läuft bei einem 400-MHz-FSB ebenfalls nur mit 400 MHz Taktfrequenz (800 MHz per DDR).
Zur Überprüfung der jeweiligen Taktfrequenz von Prozessorbus und Speicher haben wir unser Digital-Oszilloskop LeCroy LC564A verwendet. Nur bei Pentium-4-Prozessoren mit 533 MHz FSB konnten wir einen Speichertakt von 533 MHz bei PC1066-RIMMs messen. Beim Wechsel auf einen Pentium 4 mit 400 MHz FSB laufen die PC1066-Module nur mit 400 MHz.
Inzwischen bestätigte Hans-Jürgen Werner, zuständig für Presse- und Öffentlichkeitsarbeit bei Intel Deutschland, die Messergebnisse von tecCHANNEL. Der Chipsatz i850E arbeitet bei 400 MHz FSB maximal mit einem Speichertakt von 400 MHz, auch wenn PC1066-Speicher eingesetzt wird.
In unseren Benchmarks finden Sie die Kombination aus PC1066-Speicher und 533-MHz-FSB-Pentium-4-Prozessoren trotzdem, um den Vorteil der geringeren Zugriffszeit von 32 ns des PC1066-Modul im 800-MHz-Betrieb zu verifizieren (statt 45 ns bei PC800-RIMMs).
tecMEM-Werte
Der neue PC1066-Speicher ermöglicht mit zwei Rambus-Kanälen eine maximale Bandbreite von 4,2 GByte. Bei Rechnung mit der Basis 1024 beläuft sich der Wert auf 3,97 GByte/s. Gegenüber PC800-RIMMs mit 2,98 GByte/s Bandbreite entspricht das einer Steigerung von 33 Prozent.
Soweit die Theorie. Die tatsächliche Speicher-Performance überprüfen wir mit unserem Benchmark tecMEM. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Hier zeigt sich, wie viel von der theoretischen Durchsatzsteigerung übrig bleibt. Eine detaillierte Beschreibung von tecMEM sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite finden Sie hier.
Speicher | Load 32 [MByte/s] | Store 32 [MByte/s] | Move 32 [MByte/s] | Store 64 [MByte/s] | Load 128 [MByte/s] | Store 128 [MByte/s] |
---|---|---|---|---|---|---|
Höhere Werte sind besser. Alle Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz und unserem Benchmark-Programm tecMEM unter Windows XP durchgeführt. | ||||||
PC1066 FSB533 | 1716 | 951 | 938 | 983 | 2867 | 985 |
PC1066 FSB400 | 1469 | 765 | 783 | 795 | 2254 | 794 |
PC800 FSB533 | 1571 | 787 | 774 | 798 | 2446 | 799 |
PC800 FSB400 | 1409 | 722 | 732 | 740 | 2284 | 741 |
DDR400 FSB533 | 1751 | 1023 | 859 | 846 | 2647 | 853 |
DDR400 FSB400 | 1609 | 917 | 838 | 835 | 2455 | 843 |
DDR333 FSB533 | 1679 | 875 | 760 | 757 | 2354 | 755 |
DDR333 FSB400 | 1558 | 789 | 724 | 709 | 2272 | 708 |
In der Praxis erreicht PC1066-RDRAM maximal einen 23 Prozent höheren Datendurchsatz als PC800 - allerdings nur bei Pentium-4-Prozessoren mit 533 MHz FSB. Vergleicht man PC1066 mit PC800 bei einem FSB-Takt von 400 MHz, so fällt die Steigerung mit maximal sieben Prozent deutlich niedriger aus.
Die Erklärung ist einfach: Bei einem 400-MHz-FSB taktet der i850E-Chipsatz den PC1066-Speicher ebenfalls mit 400 MHz (800 MHz per DDR). Einen asynchronen Betrieb unterstützt der Chipsatz in dieser Kombination nicht. Die sieben Prozent Mehrleistung resultieren aus der geringeren Zugriffszeit des PC1066-Moduls mit 32 ns. Handelsübliche PC800-Speicher besitzen eine Zugriffszeit von 45 ns.
Im Vergleich zu DDR400 kann sich PC1066 vor allem bei längeren Blockzugriffen wie den 128-Bit-Befehlen behaupten. Bei kürzeren Blöcken (32-Bit-Zugriffe) macht sich die langsamere Zugriffszeit von RDRAM negativ bemerkbar, hier behält DDR-SDRAM die Oberhand.
Vergleicht man beide Speicher bei einem FSB-Takt von 400 MHz, so ist DDR400 in allen Disziplinen schneller.
Transferkurven
Ob der Intel i850E-Chipsatz den Pentium-4-Prozessor und den Speicher optimal unterstützt, zeigen die Transferkurven unseres Benchmarks tecMEM bei 32-Bit-Kommandos. Hier prüft das Programm mit Load-, Store und Move-Befehlen, wie schnell der Chipsatz Daten zwischen CPU und Hauptspeicher transferieren kann.
Die zwei Transferkurven zeigen den i850E-Chipsatz mit einem Pentium 4 2,4 GHz und 533-MHz-FSB in Aktion. Der Kurvenverlauf bis 8 KByte große Blöcke zeigt den Durchsatz des L1-Caches, bis zu einer Blockgröße von 512 KByte ist der L2-Cache in Aktion. Erst ab der 512-KByte-Grenze beginnt der Hauptspeicher seine Arbeit. Bei den 32-Bit-Befehlen kann der PC1066-Speicher maximal einen 21 Prozent höheren Datendurchsatz gegenüber PC800 für sich verbuchen.
System-Performance
Im täglichen Einsatz ist die Performance bei Standardanwendungen am wichtigsten. Die Leistungsfähigkeit des Systems überprüfen wir unter Windows XP Professional mit SYSmark2001. Das Benchmark-Paket besteht aus 14 Einzelprogrammen und deckt gleichzeitig eventuelle Stabilitätsschwächen auf.
SYSmark2001 listet neben der Gesamt-Performance die Einzelergebnisse für die Kategorien Office Productivity und Internet Content Creation auf.
Office Productivity gibt die Geschwindigkeit an mit Microsoft Office 2000, Netscape Communicator 6.0, Dragon NaturallySpeaking Preferred v.5, WinZip 8.0 und McAfee VirusScan 5.13.
Internet Content Creation soll die Performance repräsentieren mit Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0, Macromedia Dreamweaver 4 und Macromedia Flash 5.
Viewperf 6.1.2
Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 6.1.2 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Stellvertretend wählen wir die vier aussagekräftigsten aus, die den Speicher- und den Grafikbus stark fordern.
Besonders der Test DX-06 erlaubt Rückschlüsse auf die Speicher-Performance der einzelnen Testkandidaten.
Alle Einzelergebnisse des SPECviewperf 6.1.2 finden Sie in der nachfolgenden Tabelle.
Speicher | DRV-07 [fps] | DX-06 [fps] | Light04 [fps] | MedMCAD-01 [fps] |
---|---|---|---|---|
Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt. | ||||
PC1066 FSB533 | 28,6 | 40,2 | 11,3 | 34,8 |
PC1066 FSB400 | 28,4 | 37,6 | 10,5 | 34,7 |
PC800 FSB533 | 28,4 | 38,4 | 10,7 | 34,8 |
PC800 FSB400 | 28,3 | 37,4 | 10,4 | 34,7 |
DDR400 FSB533 | 27,8 | 39,4 | 10,7 | 33,8 |
DDR400 FSB400 | 27,2 | 38,7 | 10,1 | 33,4 |
DDR333 CL2.5 FSB533 | 25,8 | 38,4 | 10,4 | 33,0 |
DDR333 CL2.5 FSB400 | 25,9 | 38,1 | 10,5 | 32,8 |
Indy3D
Den im professionellen Umfeld wichtigen Bereich Animation/Simulation deckt der OpenGL-basierende Benchmark Indy3D von Sense8 ab. Hier spielen nicht nur die Grafikleistung, sondern auch Rechen- und Speicher-Performance eine wesentliche Rolle. Das gute Zusammenwirken hängt in erheblichem Maße vom eingesetzten Chipsatz ab.
Unreal Tournament OpenGL
Zur Analyse der OpenGL-Performance verwenden wir zusätzlich den Spiele-Benchmark Unreal Tournament. Er ist gut geeignet, um die Leistungsfähigkeit der Chipsätze für den Grafikbereich - bevorzugt OpenGL-Anwendungen - auszuloten. Dabei sind Haupt- und Grafikspeicher stark gefordert.
SPEC CPU2000: Integer
Als von der Industrie anerkanntes Analysetool verwenden wir zusätzlich die Benchmark Suite SPEC CPU2000 von SPEC. Unter Ausschluss der Grafikkartenleistung prüft das Programmpaket die Leistungsfähigkeit der CPU und des Hauptspeichers. Dabei benutzt es praxisnahe Aufgabenstellungen mit großen Datenmengen für Ganzzahlen- und Fließkomma-Anwendungen.
Test | PC800 FSB400 | PC800 FSB533 | PC1066 FSB400 | PC1066 FSB533 |
---|---|---|---|---|
Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt. | ||||
164.gzip | 905 | 909 | 906 | 922 |
175.vpr | 486 | 517 | 501 | 563 |
176.gcc | 959 | 1007 | 971 | 1087 |
181.mcf | 571 | 618 | 588 | 728 |
186.crafty | 817 | 818 | 820 | 824 |
197.parser | 828 | 856 | 839 | 893 |
252.eon | 1119 | 1117 | 1119 | 1116 |
253.perlbm | 1039 | 1052 | 1045 | 1066 |
254.gap | 1022 | 1052 | 1031 | 1090 |
255.vortex | 1306 | 1355 | 1322 | 1442 |
256.bzip2 | 651 | 683 | 664 | 726 |
300.twolf | 549 | 590 | 566 | 646 |
Gesamt | 818 | 848 | 830 | 895 |
Stellvertretend für ein Programm aus der Integer-Suite SPECint_base2000 wählen wir für die Analyse des Speicherbusses die Anwendung 176.gcc. Diese Applikation ist in erster Linie vom Systemspeicher abhängig, der Prozessor mit seinem jeweiligen L1- und L2-Cache spielt nur eine untergeordnete Rolle. Das 176.gcc-Programm profitiert bei 533 MHz FSB-Takt von PC1066-Speicher mit acht Prozent schnellerer Berechnung im Vergleich zu PC800.
Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Integer-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.
SPEC CPU2000: Floating Point
Für Fließkomma-Programme eignet sich die Anwendung 171.swim gut für die Beurteilung des Speicher-Controllers. Hier kann PC1066-Speicher einen Vorteil von 23 Prozent gegenüber PC800-RDRAM für sich verbuchen (bei FSB 533). Besonders die 128-Bit-Befehle der SSE-Einheit profitieren von der hohen Speicherbandbreite.
Insgesamt profitieren die Fließkomma-Programme mehr von der höheren Speicherbandbreite als Integer-basierende Anwendungen.
Test | PC800 FSB400 | PC800 FSB533 | PC1066 FSB400 | PC1066 FSB533 |
---|---|---|---|---|
Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt. | ||||
168.wupwis | 1115 | 1155 | 1127 | 1224 |
171.swim | 1317 | 1411 | 1350 | 1739 |
172.mgrid | 771 | 825 | 787 | 899 |
173.applu | 856 | 917 | 872 | 1025 |
177.mesa | 984 | 992 | 986 | 1001 |
178.galgel | 1039 | 1103 | 1053 | 1210 |
179.art | 549 | 583 | 556 | 722 |
183.equake | 826 | 890 | 846 | 1022 |
187.facerec | 1037 | 1089 | 1055 | 1149 |
188.ammp | 516 | 551 | 531 | 607 |
189.lucas | 1053 | 1130 | 1076 | 1246 |
191.fma3d | 743 | 767 | 748 | 814 |
200.sixtrac | 437 | 438 | 438 | 441 |
301.apsi | 632 | 662 | 643 | 722 |
Gesamt | 810 | 852 | 822 | 936 |
Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Floating-Point-Benchmarks von RDRAM und DDR-SDRAM im grafischen Vergleich.
3DMark2001
Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.
Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 Pro von MadOnion. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der einzelnen Chipsätze bei anspruchsvollen 3D-Anwendungen. Unter anderem werden der AGP- und der Speicherbus durch große Mengen an Texturen stark belastet.
Unreal Tournament Direct3D
Wenn es darum geht, den Speicherbus auszureizen, eignet sich der Spiele-Benchmark Unreal Tournament mit Direct3D-Unterstützung gut. Hier sollte eine hohe Speicher-Performance von Vorteil sein.
Unreal Tournament verwendet mit der Option "Software Rendering" keine 3D-Beschleunigung der Grafikkarte. Damit übernimmt der PC-Prozessor die grafischen Berechnungen, der Hauptspeicher wird stark belastet.
Fazit
Unser Test zeigt, dass PC1066-RDRAM nur in Pentium-4-Systemen mit 533-MHz-FSB Sinn macht. Das Leistungsplus gegenüber PC800-Speicher beträgt hier durchschnittlich zehn Prozent, in speziellen Fällen sogar bis zu 23 Prozent.
Die Kombination aus Pentium-4-Prozessor mit 533-MHz-FSB und PC1066-RDRAM setzt sich in der Mehrzahl der Benchmarks an die Spitze vor DDR400-SDRAM.
Anders sieht das Bild bei einem FSB-Takt von 400 MHz aus. Der i850E-Chipsatz bremst das schnelle PC1066-RDRAM aus und kann den Speicher nur mit 800 MHz betreiben. Der Performance-Unterschied zwischen PC800- und PC1066-Modulen liegt aber dennoch bei durchschnittlich drei Prozent - im Maximum bei sieben Prozent. Hier profitiert der PC1066-Speicher trotz "Untertaktung" von seiner geringeren Zugriffszeit (32 ns statt 45 ns von PC800-Modulen).
Umgekehrte Vorzeichen also bei einem FSB-Takt von 400 MHz: DDR400-Speicher ist fast immer schneller als PC800/PC1066-RDRAM. Die Bandbreite von DDR400 mit 2,98 GByte/s übersteigt noch nicht die des FSB. Ein höherer FSB-Takt bringt bei DDR400 im Gegensatz zu PC1066 somit wenig. In der Northbridge gepufferte kleine Datenmengen können dann zwar schneller zur CPU transferiert werden, lange Blockzugriffe auf den Speicher relativieren hier aber den Vorteil des 533-MHz-FSBs.
Einen ausführlichen Test von DDR400-Speicher können Sie hier nachlesen. (cvi)
Testkonfiguration
Komponente | Daten |
---|---|
| |
CPU 1 | Pentium 4 2400 MHz Northwood |
Sockel | Socket 478 |
FSB | 400 MHz |
CPU 2 | Pentium 4 2400 MHz Northwood |
Sockel | Socket 478 |
FSB | 533 MHz |
Grafikkarte | Leadtek WinFast GeForce3 TD |
Grafikchip | NVIDIA GeForce3 |
Grafikspeicher | 64 MByte DDR-SDRAM |
BIOS | 04.32.2001 |
Treiber | Detonator 23.11 |
Platine | Rev: B |
Mainboard 1 | Intel D850EMV2 |
Typ | Socket 478 |
Chipsatz | i850E |
BIOS | MV85010A.86A.0025.P10.0203282158 |
Mainboard 2 | SiS SS51B |
Typ | Socket 478 |
Chipsatz | SiS645DX |
BIOS | PhoenixBIOS 4.0 Release 6.0 02/06/02 |
RAM 1 | Samsung MR16R0828BN1-CN9 |
Kapazität | 128 MByte |
Typ | PC1066-32 |
Chips | -- |
RAM 2 | MR16R0828BN1-CK8 |
Kapazität | 128 MByte |
Typ | PC800-45 |
Chips | -- |
RAM 3 | Samsung M368L3313DTL-CB4 |
Kapazität | 256 MByte |
Typ | PC400 CAS=2,5 |
Chips | Samsung K4H280838D-TCB4 |
Soundkarte | Creative SoundBlaster PCI128 |
Soundchip | Creative EMU10k1 |
Schnittstelle | PCI 5V |
Treiber | 5.12.1.2065 |
Platine | 2999 / CT4810 |
Netzwerkkarte | Level One FNC-0107TX (Realtek) |
Typ | 10/100Base Fast Ethernet |
Chip | RTL8139B |
Schnittstelle | PCI 5V |
Treiber | 5.397.823.2001 |
Platine | keine Angabe |
SCSI-Controller | Adaptec AHA-2940UW Pro (Adaptec) |
SCSI-Interface | UltraWide |
Schnittstelle | PCI 5V |
BIOS | V2.11.0 |
Treiber | V3.60 |
Platine | Revision C |
Festplatte 1 | Quantum Atlas 10K II (Quantum) |
Modell | TY184L |
Kapazität | 18,4 GByte |
Firmware | SDA40 |
Schnittstelle | UW-SCSI |
CD-ROM-Laufwerk | LITE-ON LTN-382 |
Geschwindigkeit | 40x |
Firmware | keine Angabe |
Schnittstelle | EIDE-UltraATA/33 |
Diskettenlaufwerk | Teac FD-235HF |
Kapazität | 1,44 MByte |
Netzteil | Delta Electronics |
Modell | DPS-300KB-1A |
Ausgangsleistung | 300 Watt |
Format | ATX |
Tastatur | Cherry RS 6000 M |
Schnittstelle | PS/2 |
Maus | Logitech M-S35 |
Schnittstelle | PS/2 |