Test: DDR400-SDRAM & 533 MHz FSB

29.01.2002 von Christian Vilsbeck
DDR333-Speicher ist kaum auf dem Markt, schon gibt es erste Muster von DDR400-SDRAM. tecCHANNEL hat die Highspeed-Module getestet. Lohnt es sich zu warten?

Auf der CeBIT 2002 waren Mainboards für DDR400-Speicher bereits zu sehen. Sowohl SiS mit dem SiS648 als auch VIA mit dem KT400 führten lauffähige Muster von DDR400-Chipsätzen vor.

Ungewöhnlich rasch werben die Hersteller für ihre nächste Produktgeneration. Gibt es Mainboards für DDR333-Speicher doch erst seit wenigen Monaten zu kaufen.

Erstaunlich ist der Schritt zu DDR400 allemal. Laut Aussagen führender Speicherhersteller soll die nächste Geschwindigkeitsstufe nach DDR333 am besten gleich mit dem DDR-II-Standard realisiert werden. Zu kritisch sei die Signalqualität bereits bei DDR333-Speicher. So existiert auch noch keine Spezifikation für DDR400-Module. Laut dem Standardisierungsgremium JEDEC ist noch ungewiss, ob es eine Spezifikation für DDR400  überhaupt geben wird.

Umso überraschender ist das aggressive Vorgehen von Samsung. Der Speicherhersteller schickt bereits Testsamples von DDR400-Modulen an seine Evaluierungspartner. Zwei 256-MByte-DDR400-DIMMs erreichten auch unser Testlabor. Unsere Tests zeigen, ob ein Warten auf den schnellen DDR-SDRAM-Speicher überhaupt lohnt.

Benchmark-Vorbetrachtung

Für die Tests von DDR400-Speicher verwendeten wir ein Referenz-Mainboard von SiS mit dem Pentium-4-Chipsatz SiS645DX. Der Chipsatz für PC266- und PC333-DDR-SDRAM kann in der von uns getesteten Version zusätzlich mit DDR400-Speicher (PC400) arbeiten. SiS stellt zu diesem Zweck ein speziell angepasstes BIOS für das Mainboard zur Verfügung.

Das SiS-Mainboard erlaubt somit sehr gut den direkten Vergleich der verschiedenen Speichergeschwindigkeiten. Der DDR400-Speicher von Samsung arbeitet bei 400 MHz mit einer CAS-Latency von 2,5 Takten. Bei einem Speichertakt von 333 MHz genügt dem Samsung-Modul sogar eine Latency von 2,0. Bislang verfügbare DDR333-Module benötigen noch eine CAS-Latency von 2,5 Takten. Alle Tests der verschiedenen Speichergeschwindigkeiten haben wir mit 256 MByte Arbeitsspeicher durchgeführt.

Der SiS645DX-Chipsatz entspricht prinzipiell dem von uns bereits getesteten SiS645, dessen Details Sie hier finden. Neu an der DX-Version ist die Unterstützung von 533 MHz Taktfrequenz für den FSB. Damit ist der Chipsatz bereits für Intels künftige Pentium-4-Prozessoren gerüstet.

Alle Speicher-Benchmarks haben wir mit einem Pentium-4-Prozessor bei 2,4 GHz Taktfrequenz durchgeführt. Zusätzlich überprüfen wir, ob die Bandbreite von DDR400 bei einem Prozessor-FSB-Takt von 533 MHz zusätzliche Vorteile erwirkt. Zu diesem Zweck übertakteten wir einen Pentium 4 1,80A GHz, der beispielsweise bei Alternate im Angebot ist. Pentium-4-Prozessoren verfügen über einen festen Multiplier. Um eine 2,4-GHz-CPU mit 533 MHz FSB zu "generieren", verwendeten wir einen Pentium 4 mit 1,8A GHz Taktfrequenz. Bei Erhöhung des FSB-Taktes von 400 auf 533 MHz steigt durch den festen Multiplier der CPU-Takt auf 2,4 GHz. Die erforderliche Kühlung gewährleisteten wir durch spezielle Lüfter.

Mainboards mit dem SiS645DX sind im Handel bereits verfügbar. Ob die Serien-Boards im BIOS allerdings Overclock-Optionen für DDR400-Speicher bieten, obliegt den jeweiligen Herstellern.

tecMEM-Werte

Mit dem neuen DDR400-Speicher ist eine maximale Bandbreite von 3,2 GByte möglich. Bei Rechnung mit der Basis 1024 beläuft sich der Wert auf 2,98 GByte/s. Gegenüber DDR333-DIMMs mit 2,48 GByte/s Bandbreite entspricht das einer Steigerung von 20 Prozent. Der theoretische Performance-Gewinn fällt somit niedriger aus, als beim Schritt von DDR266 auf DDR333 - hier erhöht sich die Bandbreite um 25 Prozent.

Soweit die Theorie. Die tatsächliche Speicher-Performance überprüfen wir mit unserem Benchmark tecMEM. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Hier zeigt sich, wie viel von der theoretischen Durchsatzsteigerung übrig bleibt. Eine detaillierte Beschreibung von tecMEM sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite finden Sie hier.

Speicher-Performance

Speicher

Load 32 [MByte/s]

Store 32 [MByte/s]

Move 32 [MByte/s]

Store 64 [MByte/s]

Load 128 [MByte/s]

Store 128 [MByte/s]

Höhere Werte sind besser. Alle Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz und unserem Benchmark-Programm tecMEM unter Windows XP durchgeführt.

DDR400 CL2.5

1609

917

838

835

2455

843

DDR333 CL2.0

1559

804

725

714

2273

711

DDR333 CL2.5

1558

789

724

709

2272

708

DDR266 CL2.0

1465

674

588

574

1918

574

Die Ergebnisse der Speicheranalyse liegen nahe an der Theorie: DDR400 kann bei längeren Blockzugriffen wie dem 128-Bit-Schreibbefehl einen 19 Prozent höheren Durchsatz erwirken. Auch beim Schritt von DDR266 auf DDR333 erlaubt der SiS645DX-Chipsatz im Maximum einen 23 Prozent höheren Durchsatz. Ob DDR333-Speicher die Daten allerdings nach einer Verzögerung von 2 oder 2,5 Taktzyklen ausgibt, wirkt sich beim tecMEM-Benchmark kaum aus, weil das Programm Performance-optimiert mit großen zusammenhängenden Datenblöcken arbeitet.

In der folgenden Tabelle sehen Sie die Änderung des Speicherdurchsatzes, wenn die FSB-Taktfrequenz des Pentium-4-Prozessors von 400 auf 533 MHz angehoben wird. Bei Store-32-Befehlen bewirkt es eine 12 Prozent höhere Speicher-Performance. Im Durchschnitt erhöht sich der Speicherdurchsatz um knapp sechs Prozent.

Unterschied Speicher-Performance bei FSB-Takt von 400/533 MHz

Speicher

Load 32 [MByte/s]

Store 32 [MByte/s]

Move 32 [MByte/s]

Store 64 [MByte/s]

Load 128 [MByte/s]

Store 128 [MByte/s]

Höhere Werte sind besser. Alle Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz und unserem Benchmark-Programm tecMEM unter Windows XP durchgeführt.

DDR400 FSB533

1751

1023

859

846

2647

853

DDR400 FSB400

1609

917

838

835

2455

843

Transferkurven

Ob der SiS645DX-Chipsatz den Pentium-4-Prozessor und den Speicher optimal unterstützt, zeigen die Transferkurven unseres Benchmarks tecMEM bei 32-Bit-Kommandos. Hier prüft das Programm mit Load-, Store und Move-Befehlen, wie schnell der Chipsatz Daten zwischen CPU und Hauptspeicher transferieren kann.

Die zwei Transferkurven zeigen den SiS645DX-Chipsatz mit einem Pentium 4 2,4 GHz in Aktion. Der Kurvenverlauf zeigt bis zu einer Blockgröße von 8 KByte den Durchsatz des L1-Caches, bis zu einer Blockgröße von 512 KByte ist der L2-Cache in Aktion. Erst ab der 512-KByte-Grenze beginnt der Hauptspeicher seine Arbeit. Bei den 32-Bit-Befehlen kann der DDR400-Speicher maximal einen 16 Prozent höheren Datendurchsatz für sich verbuchen.

System-Performance

Im täglichen Einsatz ist die Performance bei Standardanwendungen am wichtigsten. Die Leistungsfähigkeit des Systems überprüfen wir unter Windows XP Professional mit SYSmark2001. Das Benchmark-Paket besteht aus 14 Einzelprogrammen und deckt gleichzeitig eventuelle Stabilitätsschwächen auf.

SYSmark2001 listet neben der Gesamt-Performance die Einzelergebnisse für die Kategorien Office Productivity und Internet Content Creation auf.

Office Productivity gibt die Geschwindigkeit an mit Microsoft Office 2000, Netscape Communicator 6.0, Dragon NaturallySpeaking Preferred v.5, WinZip 8.0 und McAfee VirusScan 5.13.

Internet Content Creation soll die Performance repräsentieren mit Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0, Macromedia Dreamweaver 4 und Macromedia Flash 5.

Viewperf 6.1.2

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem SPECviewperf 6.1.2 der SPECopc. Das CAD-Paket beinhaltet sechs verschiedene Tests. Stellvertretend wählen wir die vier aussagekräftigsten aus, die den Speicher- und den Grafikbus stark fordern.

Besonders der Test DRV-07 erlaubt Rückschlüsse auf die Speicher-Performance der einzelnen Testkandidaten.

Alle Einzelergebnisse des SPECviewperf 6.1.2 finden Sie in der nachfolgenden Tabelle.

SPECviewperf 6.1.2

Speicher

DRV-07 [fps]

DX-06 [fps]

Light04 [fps]

MedMCAD-01 [fps]

Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

DDR400 CL2.5 FSB533

27,8

39,4

10,7

33,8

DDR400 CL2.5 FSB400

27,2

38,7

10,1

33,4

DDR333 CL2.5 FSB533

25,8

38,4

10,4

33,0

DDR333 CL2.5 FSB400

25,9

38,1

10,5

32,8

DDR266 CL2.0 FSB533

23,2

35,9

9,8

31,3

DDR266 CL2.0 FSB400

22,8

36,2

9,8

30,8

Indy3D

Den im professionellen Umfeld wichtigen Bereich Animation/Simulation deckt der OpenGL-basierende Benchmark Indy3D von Sense8 ab. Hier spielen nicht nur die Grafikleistung, sondern auch Rechen- und Speicher-Performance eine wesentliche Rolle. Das gute Zusammenwirken hängt in erheblichem Maße vom eingesetzten Chipsatz ab.

Unreal Tournament OpenGL

Zur Analyse der OpenGL-Performance verwenden wir zusätzlich den Spiele-Benchmark Unreal Tournament. Er ist gut geeignet, um die Leistungsfähigkeit der Chipsätze für den Grafikbereich - bevorzugt OpenGL-Anwendungen - auszuloten. Dabei sind Haupt- und Grafikspeicher stark gefordert.

SPEC CPU2000: Integer

Als von der Industrie anerkanntes Analysetool verwenden wir zusätzlich die Benchmark Suite SPEC CPU2000 von SPEC. Unter Ausschluss der Grafikkartenleistung prüft das Programmpaket die Leistungsfähigkeit der CPU und des Hauptspeichers. Dabei benutzt es praxisnahe Aufgabenstellungen mit großen Datenmengen für Ganzzahlen- und Fließkomma-Anwendungen.

SPECint_base2000: Official Run

Test

DDR266 CL2.0 FSB400

DDR333 CL2.5 FSB400

DDR400 CL2.5 FSB400

DDR400 CL2.5 FSB533

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

164.gzip

907

915

928

923

175.vpr

445

477

503

524

176.gcc

867

920

965

1016

181.mcf

463

535

589

626

186.crafty

824

827

832

829

197.parser

804

836

857

878

252.eon

1134

1132

1134

1129

253.perlbm

1046

1058

1060

1047

254.gap

967

1003

1039

1058

255.vortex

1271

1322

1373

1396

256.bzip2

593

635

664

685

300.twolf

502

545

573

607

Gesamt

774

812

840

861

Stellvertretend für ein Programm aus der Integer-Suite SPECint_base2000 wählen wir für die Analyse des Speicherbusses die Anwendung 176.gcc. Diese Applikation ist in erster Linie vom Systemspeicher abhängig, der Prozessor mit seinem jeweiligen L1- und L2-Cache spielt nur eine untergeordnete Rolle. Das 176.gcc-Programms mit seinen Code-optimierten Daten profitiert von DDR400-Speicher mit fünf Prozent schnellerer Berechnung im Vergleich zu DDR333. Die Anhebung des FSB von 400 auf 533 MHz beschleunigt die Integer-Berechnungen um weitere fünf Prozent.

SPEC CPU2000: Floating Point

Für Fließkomma-Programme eignet sich die Anwendung 171.swim gut für die Beurteilung des Speicher-Controllers. Hier kann DDR400-Speicher einen Vorteil von 13 Prozent gegenüber 333-MHz-DDR-SDRAM für sich verbuchen. Besonders die 128-Bit-Befehle der SSE-Einheit profitieren von der hohen Speicherbandbreite. Die Anhebung der FSB-Taktfrequenz von 400 auf 533 MHz bewirkt bei der 171.swim-Anwendung nochmals eine 7 Prozent schnellere Abarbeitung der Fließkomma-Berechnungen.

Insgesamt profitieren die Fließkomma-Programme besser von der höheren Speicherbandbreite als Integer-basierende Anwendungen.

SPECfp_base2000: Official Run

Test

DDR266 CL2.0 FSB400

DDR333 CL2.5 FSB400

DDR400 CL2.5 FSB400

DDR400 CL2.5 FSB533

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 2,4 GHz Taktfrequenz unter Windows XP durchgeführt.

168.wupwis

1082

1134

1165

1219

171.swim

950

1124

1271

1359

172.mgrid

622

713

788

839

173.applu

703

793

861

919

177.mesa

971

982

993

999

178.galgel

904

994

1061

1123

179.art

397

480

551

583

183.equake

713

806

874

935

187.facerec

997

1060

1111

1141

188.ammp

468

511

540

567

189.lucas

868

970

1045

1102

191.fma3d

675

721

754

777

200.sixtrac

440

442

445

444

301.apsi

543

595

634

656

Gesamt

704

773

825

863

3DMark2001

Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.

Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 Pro von MadOnion. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit der einzelnen Chipsätze bei anspruchsvollen 3D-Anwendungen. Unter anderem werden der AGP- und der Speicherbus durch große Mengen an Texturen stark belastet.

Unreal Tournament Direct3D

Wenn es darum geht, den Speicherbus auszureizen, eignet sich der Spiele-Benchmark Unreal Tournament mit Direct3D-Unterstützung gut. Hier sollte eine hohe Speicher-Performance von Vorteil sein.

Unreal Tournament verwendet mit der Option "Software Rendering" keine 3D-Beschleunigung der Grafikkarte. Damit übernimmt der PC-Prozessor die grafischen Berechnungen, der Hauptspeicher wird stark belastet.

Fazit

Zweifelsohne sorgt DDR400-Speicher für einen zusätzlichen Geschwindigkeitsschub. Das Leistungsplus gegenüber DDR333-DIMMs bleibt mit durchschnittlich zwei Prozent aber gering. Nur in sehr speziellen Fällen sind Performance-Steigerungen von bis zu 19 Prozent möglich. Kein überraschendes Ergebnis, ein ähnlicher Unterschied war schon zwischen DDR266- und DDR333-Speicher zu messen.

Der Erfolg von DDR400-SDRAM bleibt zum jetzigen Zeitpunkt allerdings mehr als fraglich. Zum einen gibt es noch keine Spezifikationen für die Highspeed-Module und die JEDEC  überlegt, ob solche überhaupt verabschiedet werden. Zum anderen gibt es von Speicherherstellern wie Infineon und Micron Bedenken wegen der kritischen Signalqualität bei der hohen Taktfrequenz von 400 MHz (per DDR).

Überrascht waren wir allerdings von der Stabilität unseres Testsystems. Alle Benchmarks mit dem DDR400-Modul von Samsung liefen ohne Absturz durch. Hier hatten wir mit ähnlichen Schwierigkeiten wie bei den Tests erster DDR333-Mainboards gerechnet.

Die Anhebung der FSB-Taktfrequenz des Pentium 4 von 400 auf 533 MHz erwirkt im Durchschnitt nur eine zwei Prozent höhere Performance, was daran liegt, dass das DDR-Speicher-Interface immer noch zu langsam ist. DDR400 und Intels 400-MHz-FSB besitzen eine Bandbreite von je 2,98 GByte/s. Bei einem FSB-Takt von 533 MHz erhöht sich der Durchsatz zwischen CPU und Chipsatz auf 3,97 GByte/s. In der Northbridge gepufferte kleine Datenmengen können zwar schneller zur CPU transferiert werden, lange Blockzugriffe auf den Speicher relativieren aber den Vorteil des 533-MHz-FSBs.

Deutlichere Auswirkungen von Intels 533-MHz-FSB erwarten wir bei den künftigen i850E-Mainboards mit Dual-Channel-Speicher-Interface für 1066-MHz-RDRAM. Dann erreicht auch der Speicher wieder die Bandbreite des 533-MHz-FSBs.

Bei allen Benchmark-Ergebnissen ist zu beachten, dass es sich hier noch um Vorserien-Produkte sowie einen auf 533-MHz-FSB übertakteten Pentium 4 handelt. Bei finalen Chipsätzen mit offizieller Unterstützung von DDR400-Speicher sind durch Optimierungen noch Performance-Steigerungen zu erwarten. Weitere ausführlichere Benchmarks zum Thema FSB533 konnten wir nicht durchführen, weil der übertaktete 1,8-GHz-Pentium-4-Prozessor zu instabil lief. (cvi)

Testkonfiguration

Komponente

Daten

CPU 1

Pentium 4 2400 MHz Northwood

Sockel

Socket 478

FSB

400 MHz

CPU 2

Pentium 4 1800A MHz Northwood

Sockel

Socket 478

FSB

400 MHz

Grafikkarte

Leadtek WinFast GeForce3 TD

Grafikchip

NVIDIA GeForce3

Grafikspeicher

64 MByte DDR-SDRAM

BIOS

04.32.2001

Treiber

Detonator 23.11

Platine

Rev: B

Mainboard

SiS SS51B

Typ

Socket 478

Chipsatz

SiS645DX

BIOS

PhoenixBIOS 4.0 Release 6.0 02/06/02

RAM

Samsung M368L3313DTL-CB4

Kapazität

256 MByte

Typ

PC400 CAS=2,5

Chips

Samsung K4H280838D-TCB4

Soundkarte

Creative SoundBlaster PCI128

Soundchip

Creative EMU10k1

Schnittstelle

PCI 5V

Treiber

5.12.1.2065

Platine

2999 / CT4810

Netzwerkkarte

Level One FNC-0107TX (Realtek)

Typ

10/100Base Fast Ethernet

Chip

RTL8139B

Schnittstelle

PCI 5V

Treiber

5.397.823.2001

Platine

keine Angabe

SCSI-Controller

Adaptec AHA-2940UW Pro (Adaptec)

SCSI-Interface

UltraWide

Schnittstelle

PCI 5V

BIOS

V2.11.0

Treiber

V3.60

Platine

Revision C

Festplatte 1

Quantum Atlas 10K II (Quantum)

Modell

TY184L

Kapazität

18,4 GByte

Firmware

SDA40

Schnittstelle

UW-SCSI

CD-ROM-Laufwerk

LITE-ON LTN-382

Geschwindigkeit

40x

Firmware

keine Angabe

Schnittstelle

EIDE-UltraATA/33

Diskettenlaufwerk

Teac FD-235HF

Kapazität

1,44 MByte

Netzteil

Delta Electronics

Modell

DPS-300KB-1A

Ausgangsleistung

300 Watt

Format

ATX

Tastatur

Cherry RS 6000 M

Schnittstelle

PS/2

Maus

Logitech M-S35

Schnittstelle

PS/2