Kein Gewinn: DDR2-SDRAM im Test

30.06.2004 von Bernhard  Haluschak
Die neue DDR2-Speichergeneration mit aktuell 533 MHz suggeriert eine deutlich höhere Geschwindigkeit im Vergleich zum bisherigen DDR-SDRAM mit 400 MHz. Doch in der Praxis bringt das teure DDR2 keinen Leistungsgewinn.

Am 19. Juni 2004 stellte Intel mit dem 915G/P und dem 925X die ersten Chipsätze für DDR2-SDRAM vor. Der neue Speicher arbeitet dabei mit einer Taktfrequenz von 400 und 533 MHz.

Der Vorgänger DDR-SDRAM ist mit einem Takt von 400 MHz am Ende seiner physikalischen Möglichkeiten angelangt, um ein einwandfreies Funktionieren zu gewährleisten. Dem gegenüber verfügt DDR2 mit Technologien wie On-Die-Terminierung (ODT) und Off Chip Driver Calibration (OCD) über mehr Ausbaupotenzial für die Zukunft. Ein Manko von DDR2 ist allerdings, dass es bei gleicher Taktfrequenz wie DDR-Speicher nicht mit einer höheren Performance aufwarten kann. Erst bei einer höheren Taktung von 533 MHz zeigt DDR2-Speicher einen Leistungsgewinn - in der Theorie. Denn durch gleichzeitig steigende Latenzzeit (CAS Latency 4) wird die Performance des Speichers gebremst.

Im tecCHANNEL-Testlabor mussten die DDR- und die DDR2-Speichertechnologie im direkten Vergleich gegeneinander antreten. Dem DDR400-SDRAM steht ein Intel 875P-Mainboard, dem DDR2-400/533-Speicher ein entsprechendes 925X-Mainboard zur Verfügung. Zusätzlich haben wir auf einem Combo-Board für DDR/DDR2-Module mit 915P-Chipsatz die Speichertypen einem Leistungsvergleich unterzogen.

DDR-SDRAM: Grundlagen

Als Nachfolger von DDR333-SDRAM hat sich DDR400-Speicher durchgesetzt, dessen Ablösung wiederum im Laufe des Jahres durch DDR2-SDRAM stattfindet. Chip-Hersteller wie Intel, VIA, SiS und NVIDIA haben entsprechende Chipsätze für diese Speichertechnologie parat. Die Standards für DDR333-SDRAM verabschiedete das JEDEC-Gremium in den JESD-79-Spezifikationen im Mai 2002. Die Geburtswehen von DDR400 begannen mit der CeBIT 2002, auf der VIA und SiS die ersten Chipsätze für diesen Speichertyp zeigten. Erster Anbieter von DDR400-SDRAM-Chips war Samsung. Doch für die ersten Speichermodule existierten keine offiziellen Spezifikationen seitens der JEDEC, sodass jeder Speicherhersteller seine eigenen technischen Standards für DDR400-Speicher festlegte. Kompatibilitätsprobleme waren nicht auszuschließen.

Nachdem sich Intel im September 2002 noch klar gegen DDR400-Speicher ausgesprochen hat, vollzog das Unternehmen im Frühjahr 2003 eine Kehrtwende: Die Chipsätze Canterwood und Springdale bieten Dual-Channel-DDR400-Support. Intel präsentierte sogar eigene DDR400-Spezifikationen, die Kompatibilität und ein sicheres Funktionieren des Speichers gewährleisten sollen. Die Intel-Spezifikation Revision 0.996 war beispielsweise auf den 12. März 2003 datiert. Seit Ende März 2003 liegt die finale DDR400-Spezifikation des JEDEC-Gremiums vor. Zu den wesentlichen Neuerungen von DDR400- gegenüber DDR333-Speicher zählen ein strafferes Signal-Timing, veränderte Betriebsspannungs-Parameter und eine verbesserte Signalqualität auf den Leitungen.

DDR-SDRAM im Detail

DDR-SDRAM basiert in seiner Core-Technologie auf normalem SDRAM und nutzt intern vier unabhängige Bänke. Durch den Datentransfer bei beiden Flanken des Taktsignals sind Laufzeitverzögerungen sehr kritisch. DDR-SDRAM verwendet deshalb für die Synchronisierung des Datentransfers nicht nur den normalen Systemtakt, sondern ein zusätzliches bidirektionales Strobe-Signal DQS. Das parallel zu den Daten laufende Signal dient dem Chipsatz und dem Speicher als Referenz für die Gültigkeit der Daten auf dem Bus. Der grundlegende Nutzen von DQS ist, dass damit Highspeed-Datentransfers möglich werden. Dies geschieht durch die Reduzierung von Zugriffszeit. Außerdem ist durch das Strobe-Signal ein leichtes Abdriften des Bustaktes zwischen Chipsatz und Speicher unproblematisch.

Um das exakte Timing zwischen Daten-Strobe-Signal DQS und Daten zu ermöglichen, müssen die Anschlüsse die gleichen physikalischen Bedingungen wie Leiterbahnlänge und -kapazität vorfinden. Änderungen der Übertragungsparameter durch Temperatur- oder Spannungsschwankungen wirken sich auf DQS und die Daten gleichermaßen aus. Damit ist sichergestellt, dass es während eines Datentransfers zwischen Chipsatz und Speicher keine Timing-Probleme gibt. Ein stabiler Highspeed-Betrieb ist durch diese Zusatzkontrolle sicherer als durch die Synchronisation mit dem globalen Systemtakt.

Bei einem Lesebefehl generiert und steuert das DDR-SDRAM das bidirektionale Strobe-Signal und zeigt dem Chipsatz mit der steigenden und fallenden Flanke die gültigen Daten an. Umgekehrt verhält es sich bei einem Schreibvorgang. Jetzt generiert und steuert der Chipsatz das Strobe-Signal und zeigt damit dem Speicher die Gültigkeit der einzulesenden Daten mit beiden Flanken an.

DDR2-Speicher: Grundlagen

Bei der DDR2-Speichertechnologie handelt es sich um eine Weiterentwicklung des aktuellen DDR-SDRAM-Standards. Zu Beginn sind DDR2-400-, DDR2-533-Speichermodule erhältlich. Bis Ende 2004 soll DDR2-667-SDRAM folgen. Die theoretischen Speicherbandbreiten liegen bei 2,98, 3,97 und 4,97 GByte/s.

DDR2 überträgt Daten unverändert zu DDR-SDRAM mit steigender und fallender Taktflanke. Mit dem 4-Bit-Prefetch erreichen die DDR2-Module gegenüber den herkömmlichen DDR-Speichern bei gleicher interner Taktfrequenz die doppelte externe Bandbreite. So haben DDR400 und DDR2-400 mit 2,98 GByte/s die gleiche Speicherbandbreite, allerdings arbeitet DDR400 mit einer Core-Frequenz von 200 MHz und DDR2-400 nur mit 100 MHz. Die externe Busfrequenz beträgt bei beiden Speichertypen 200 MHz.

DDR2-Speicherchips benötigen eine Spannung von 1,8 V, statt 2,5/2,6 V bei DDR. Da die Core-Spannung quadratisch in die Leistungsaufnahme eingeht, halbiert sich der Energieverbrauch von DDR2- gegenüber DDR-Speicher.

DDR2-Speicher: Technologie

Die Signalqualität auf den Datenleitungen von DDR2-Bausteinen soll sich durch eine On-Die-Terminierung gegenüber DDR-Chips verbessern. Das garantiert eine erhöhte Stabilität während des Betriebs. Zusätzlich verwendet DDR2 die "Off Chip Driver Calibration" (OCD). Diese Technik gewährleistet, dass die Treiberschaltungen der Speicherzellen Lastschwankungen dynamisch ausgleichen und somit Signalfehler vermieden werden. Darüber hinaus steigert die Posted-CAS-Funktion - eine Befehlssteuermethode - die Effizienz bei der Übertragung von Daten über den Speicherbus.

Die finalen Spezifikationen für DDR2-Speicher hat die JEDEC im September 2003 in dem Dokument JESD-79-2 veröffentlicht. Alle namhaften Chipsatz-Hersteller haben bereits auf der CeBIT 2004 ihre DDR2-Chipsätze gezeigt. VIAs Entwicklung heißt Apollo PT890 und ist mit einem Dual-Channel-DDR2-Controller ausgestattet, ebenso wie der SiS656 von SiS. Intel stellte im Juni 2004 die Chipsätze 915G/P und 925X mit DDR2-Speichertechnologie für Desktop-Anwendungen unter den Codenamen "Grantsdale" und "Alderwood" vor. Für Workstations mit Xeon-Prozessoren bietet Intel den E7525 "Tumwater" an. Intels erster Server-Chipsatz mit DDR2-Unterstützung soll im dritten Quartal 2004 debütieren. Auch für mobile Rechner entwickelt Intel unter dem Codenamen "Alviso" einen DDR2-Chipsatz.

Speichertechnologien im Vergleich

In der folgenden Tabelle finden Sie die aktuellen und zukünftigen Speichermodule und deren wichtigste Kenndaten im Überblick.

Speichertechniken im Überblick

Speicher- Typ

Bandbreite, Basis: 1000 (GByte/s)

Bandbreite, Basis: 1024 (GByte/s)

Busbreite (Bit)

Frequenz (MHz)

Spannung (V)

Modultyp

Dual-Channel bezieht sich nicht auf das Modul, sondern auf den verwendeten Speicher-Controller.

DDR400

3,2

2,98

64

200

2,6

DIMM / PC3200

DDR400 Dual-Channel

6,4

5,96

2x 64

200

2,6

DIMM / PC3200

DDR2-400

3,2

2,98

64

200

1,8

DIMM / PC2-3200

DDR2-400 Dual-Channel

6,4

5,96

2x 64

200

1,8

DIMM / PC2-3200

DDR2-533

4,3

3,97

64

266

1,8

DIMM / PC2-4300

DDR2-533 Dual-Channel

8,5

7,95

2x 64

266

1,8

DIMM / PC2-4300

DDR2-667

5,3

4,97

64

333

1,8

DIMM / PC2-5300

DDR2-667 Dual-Channel

10,7

9,93

2x 64

333

1,8

DIMM / PC2-5300

Benchmark-Vorbetrachtung

Als Testkandidat für den DDR2-Speicher diente ein 925X-Mainboard von Intel. Wir haben alle Benchmarks mit einem Pentium 4 550 (Prescott) bei 3,40 GHz Taktfrequenz und einem FSB von 800 MHz laufen lassen. Für die Tests von DDR400-Speicher verwendeten wir ein Intel 875P-Mainboard.

Mit dem Mainboard MSI 915P-Combo (Bios: V1.2/17.06.2004) ermittelten wir die Performance des 915P-Chipsatzes in Verbindung mit DDR2- und Standard-DDR-Speicher. Das Board erlaubt wahlweise den Betrieb mit DDR- oder DDR2-Speicher.

Bei unseren Tests verweigerte das Mainboard bei einigen DDR400-Speichermodulen allerdings den korrekten Betrieb. Statt mit 400 MHz arbeitete der Speicher nur mit 333 MHz. Zu den betroffenen Modulen zählen: Corsair TwinX CMX512 3200LL KM3205 v1.2, Corsair TwinX CMX256A 3200LLPT KM3206v1.1 und Kingmax 265 MB DDR-400 MPXB62D-68KX3. Laut Hersteller MSI soll ein Bios-Update dieses Manko beheben.

Bei allen Tests war das Hyper-Threading aktiviert. Weiterführende Informationen zur Hyper-Threading-Technologie finden Sie in dem Artikel Hyper-Threading im Detail. Alle Tests der verschiedenen Chipsätze haben wir jeweils mit 2 x 512 GByte Arbeitsspeicher durchgeführt. Für die Grafikausgabe sorgte eine GeForce-6800-GT-Karte von NVIDIA (AGP-8x- und PCI-Express-x16-Version).

tecMem-Werte

Der 925X- Chipsatz mit DDR2-533 und Dual-Channel-Memory-Controller ermöglicht eine maximale Speicherbandbreite von 7,95 GByte/s. Mit DDR2-400 sind noch 5,96 GByte/s möglich. Diesen Wert erreicht auch Dual-DDR400-Speicher zusammen mit dem 875P-Chipsatz. Allerdings muss man die höhere Latenzzeit des DDR2- gegenüber dem Standard-DDR-Speicher berücksichtigen. Somit dürfte der Performance-Vorsprung von DDR2-533 CL4 gegenüber DDR400 CL2 marginal ausfallen.

Soweit die Theorie. Die tatsächliche Speicher-Performance überprüfen wir mit unserem Benchmark tecMem. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann. Hier zeigt sich, wie viel von der theoretischen Durchsatzsteigerung übrig bleibt. Eine detaillierte Beschreibung von tecMem sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite finden Sie hier.

Speicher-Performance

System

Load 32 [MByte/s]

Store 32 [MByte/s]

Move 32 [MByte/s]

Load 64 [MByte/s]

Store 64 [MByte/s]

Load 128 [MByte/s]

Store 128 [MByte/s]

Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 3,40 GHz Taktfrequenz FSB800 und unserem Benchmark-Programm tecMem unter Windows XP durchgeführt.

925X-Dual- DDR2-533 CL4

2876

2094

2509

4176

2495

4862

2505

925X-Dual- DDR2-400 CL3

2967

1834

2119

4178

2148

4854

2139

875P-Dual- DDR400 CL2

2998

1901

1772

4260

1786

5006

1793

875P-Dual- DDR400 CL3

2895

1847

1714

4256

1719

4938

1730

Der DDR2-533 Speicher punktet gegenüber DDR2-400-Memory besonders bei Store- und Move-Operationen. Hier beträgt die Leistungs-Differenz bis zu 18 Prozent. Im Vergleich zum Standard-DDR400-CL3-Speicher baut der DDR2-533-CL4 seinen Vorsprung auf bis zu 45 Prozent bei Store-128-Befehlen aus. Allerdings muss sich DDR2-533-CL4 bei Load-Operationen durch die höhere Latenzzeit gegenüber DDR400 mit CL3 und CL2 geschlagen geben.

Wie sich diese Speicherergebnisse auf die Performance von Anwendungen auswirken, zeigen unsere Praxis-Benchmarks.

Transferkurven

Ob die Chipsätze den Pentium-4-Prozessor und den Speicher optimal unterstützen, zeigen die Transferkurven unseres Benchmarks tecMem. Hier prüft das Programm mit Load-, Store- und Move-Befehlen, wie schnell der Chipsatz Daten zwischen CPU und Hauptspeicher transferieren kann. Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die ein System erreichen kann.

Die vier Speicher-Transferkurven zeigen die Chipsätze 925X und 875P mit einem Pentium 4 550 beziehungsweise einem Pentium 4 3,40E GHz bei 800 MHz FSB-Taktfrequenz und entsprechendem Speicher in Aktion. Bis zu einer Blockgröße von 16 KByte zeigt der Kurvenverlauf den Durchsatz des L1-Cache, bis 512 KByte ist der L2-Cache in Aktion. Erst ab der 1-MByte-Grenze beginnt der Hauptspeicher seine Arbeit.

SPEC CPU2000: Integer

Als von der Industrie anerkanntes Analysetool verwenden wir zusätzlich die Benchmark-Suite SPEC CPU2000 von SPEC. Unter Ausschluss der Grafikkartenleistung prüft das Programmpaket die Leistungsfähigkeit der CPU und des Hauptspeichers. Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 7.1 und MS Visual Studio für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.

SPECint_base2000: Official Run

Test

925X-Dual- DDR2-533 CL4

925X-Dual- DDR2-400 CL3

875P-Dual- DDR400 CL2

875P-Dual- DDR400 CL3

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 (Prescott) bei 3,40 GHz Taktfrequenz unter Windows XP durchgeführt.

164.gzip

1073

1070

1082

1082

175.vpr

983

966

985

974

176.gcc

1783

1767

1788

1780

181.mcf

1092

1021

1082

1050

186.crafty

1240

1240

1241

1241

197.parser

1255

1248

1256

1253

252.eon

1382

1384

1395

1395

253.perlbm

1565

1612

1593

1559

254.gap

1732

1759

1769

1770

255.vortex

2164

2158

2206

2203

256.bzip2

1059

1039

1059

1046

300.twolf

1181

1169

1187

1184

Gesamt

1336

1327

1345

1335

Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Integer-Benchmarks der Chipsätze im grafischen Vergleich.

SPEC CPU2000: Floating Point

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 7.1 und MS Visual Studio sowie Intel Fortran 7.1 für alle Fließkomma-Tests. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.

SPECfp_base2000: Official Run

Test

925X-Dual- DDR2-533 CL4

925X-Dual- DDR2-400 CL3

875P-Dual- DDR400 CL2

875P-Dual- DDR400 CL3

Alle Angaben in Punkten. Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 (Prescott) bei 3,40 GHz Taktfrequenz unter Windows XP durchgeführt.

168.wupw

1791

1889

1893

1888

171.swim

2538

2142

2019

1871

172.mgrid

1355

1335

1344

1331

173.applu

1551

1431

1421

1378

177.mesa

1342

1340

1342

1342

178.galge

2472

2392

2465

2451

179.art

1366

1200

1305

1274

183.equake

1700

1587

1660

1627

187.facer

1947

1876

1917

1906

188.amm

1090

1070

1095

1084

189.lucas

2175

1963

1891

1768

191.fma3

1439

1390

1420

1410

200.sixtra

593

594

597

597

301.apsi

1277

1218

1215

1187

Gesamt

1524

1453

1467

1438

Im folgenden Diagramm finden Sie den Gesamtwert des SPEC-CPU2000-Floating-Point-Benchmarks der Chipsätze im grafischen Vergleich.

SYSmark2004

Mit dem Benchmark-Paket SYSmark2004 bietet BAPCo den Nachfolger von SYSmark2002 an. Die Suite verwendet 17 aktualisierte Anwendungen und merzt Kritikpunkte des Vorgängers aus. So öffnet SYSmark2004 nicht nur mehrere Programme gleichzeitig, sondern lässt die Applikationen auch im Hintergrund arbeiten.

Beim SYSmark2004 legt BAPCo offen, wie die Ergebnisse der einzelnen Applikationen prozentual in das Gesamtergebnis einfließen. Neben einem Gesamtwert für die Systemleistung bietet SYSmark2004 detaillierte Ergebnisse in den Kategorien Office Productivity und Internet Content Creation an.

Der Workload Office Productivity in SYSmark2004 verwendet insgesamt zehn verschiedene Applikationen. Hierzu zählen Microsoft Word, Excel, PowerPoint, Access und Outlook in der Version 2002, McAfee VirusScan 7.0, ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 sowie der Internet Explorer 6.0.

Zu den Applikationen des Workloads Internet Content Creation zählen Macromedia Dreamweaver und Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 und Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 sowie McAfee VirusScan 7.0.

Neben einem Gesamtwert für die Office- und Internet-Performance erstellt SYSmark2004 zusätzlich die Kategorien Communications, Document Creation und Data Analysis, 2D Creation, 3D Creation und Web Publication. Hier fasst SYSmark2004 wieder jeweils verschiedene Szenarien zusammen.

Subkategorien der SYSmark2004-Performance

System

Communications

Document Creation

Data Analysis

2D Creation

3D Creation

Web Publication

Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 3,40 GHz Taktfrequenz unter Windows XP durchgeführt.

925X-Dual- DDR2-533 CL4

181

195

171

232

219

199

925X-Dual- DDR2-400 CL3

180

192

166

231

219

198

875P-Dual- DDR400 CL2

185

197

170

232

218

198

875P-Dual- DDR400 CL3

183

196

170

230

217

195

CINEBENCH 2003

Mit dem CINEBENCH 2003 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 2003 basiert auf Cinema 4D Release 8 und führt wieder Shading- und Raytracing-Tests durch. Die aktuelle Version unterstützt nun SSE2 sowie Intels Hyper-Threading-Technologie. Intel selbst unterstützte Maxon bei der Optimierung von Cinema 4D.

Der Raytracing-Test von CINEBENCH 2003 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle.

Der Leistungstest OpenGL-HW von CINEBENCH 2003 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.

Beim Leistungstest OpenGL-SW übernimmt Cinema 4D zusätzlich die Berechnung der Beleuchtung.

SPECapc

3D Studio Max 5 von Discreet/Autodesk ist eine professionelle Software für 3D-Modellierung, Animation und Rendering. Um die Leistungsfähigkeit von 3D Studio Max auf verschiedenen Hardware-Plattformen standardisiert testen zu können, gibt es vom Benchmark-Konsortium SPEC das Benchmark-Paket SPECapc for 3ds max 5. Die umfangreichen Tests von SPECapc spiegeln die typischen Berechnungen bei der Erstellung von Animationen wider. Dabei wird die CPU- und Grafikleistung getrennt bewertet und aufgelistet.

Bei der Bewertung der Grafikleistung nutzt der Benchmark die OpenGL-Beschleunigung der Grafikkarte voll aus.

GLmark

GLmark 1.1p von Vulpine ist ein weiterer OpenGL-Benchmark. Er erlaubt dank seiner ausführlichen Benchmark-Statistik einen detaillierten Vergleich der verschiedenen CPUs. Wir testen mit den optimalen Einstellungen für die verwendete Hardware und denen für die höchste Darstellungsqualität.

3DMark2001

Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.

Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 SE Pro von Futuremark. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit von Prozessoren und Chipsätzen bei anspruchsvollen 3D-Anwendungen.

3DMark03

Mit dem 3DMark03 präsentiert die in Futuremark umbenannte MadOnion.com den Nachfolger von 3DMark2001. Die Spieletests von 3DMark03 setzen sich aus vier Szenen zusammen: "Wings of Fury" setzt auf DirectX 7 und repräsentiert Lowend-Grafikanwendungen. Die beiden Tests "Alpha Squadron" und "Troll's Lair" nutzen DirectX-8-Features und sind auf Mainstream-Grafikkarten zugeschnitten. Der Test "Nature II" setzt DirectX 9 voraus und soll Highend-Grafikkarten ausreizen. Der AGP- und der PCI-Express-Bus sowie das Speicher-Interface werden beim 3DMark03 durch große Mengen an Texturen stark belastet.

Combo-Board mit DDR2- und DDR-Speicher

Die Speicher-Performance überprüfen wir mit unserem Benchmark tecMem. Er erlaubt eine getrennte Analyse von Load-, Store- und Move-Operationen. Hier zeigt sich, wie viel von der theoretischen Durchsatzsteigerung übrig bleibt. Eine detaillierte Beschreibung von tecMem sowie einen Download-Link zu unserer tecCHANNEL Benchmark Suite finden Sie hier.

Speicher-Performance

System

Load 32 [MByte/s]

Store 32 [MByte/s]

Move 32 [MByte/s]

Load 64 [MByte/s]

Store 64 [MByte/s]

Load 128 [MByte/s]

Store 128 [MByte/s]

Höhere Werte sind besser. Die Tests wurden mit einem Pentium 4 bei 3,40 GHz Taktfrequenz FSB800 und unserem Benchmark-Programm tecMem unter Windows XP durchgeführt.

915P Combo DDR2-533 CL4

2872

2121

1977

4007

2011

4691

2012

915P Combo DDR2-400 CL4

2837

1635

1708

3875

1737

4510

1739

915P Combo DDR2-400 CL3

2931

1842

1888

4025

1895

4688

1906

915P Combo DDR400 CL3

2937

1827

1922

4021

1893

4690

1931

915P Combo DDR400 CL2

2968

1831

1944

4191

1983

4863

1977

Bei identischen Hardware-Voraussetzungen kann der DDR2-533-Speicher sein Leistungspotenzial besonders bei Store- und Move-Befehlen unter Beweis stellen. Die Performance-Differenz beträgt bis zu 15 Prozent (Store 32) gegenüber DDR2-400 CL3 und bis zu 16 Prozent (Store 32) bei DDR400 CL2. Bei 32/64-Bit-Load-Operationen unterliegt der vermeintlich schnelle DDR2-533-Speicher dagegen dem DDR400-CL2-SDRAM um bis zu 5 Prozent. Die höhere Bandbreite des DDR2-533-Speichers kommt gegenüber einer kürzeren Latenzzeit nicht zum Zuge.

Beim direkten Vergleich des DDR400- und des DDR2-400-Speichers mit gleichen Bandbreiten und Latenzzeiten sieht man sehr deutlich, dass eine Performance-Differenz zwischen diesen beiden Technologien nahezu nicht existiert.

Wie sich diese Speicherergebnisse auf die Performance von Anwendungen auswirken, zeigen die folgenden Praxis-Benchmarks.

3DMark2001

Gerade im 3D-Bereich verlangt der Anwender immer mehr Rechenleistung. Um dieses Ziel zu erreichen, müssen die eingesetzten Komponenten optimal aufeinander abgestimmt sein. Dazu zählen Prozessor, Speicher, Grafikkarte und der verwendete Chipsatz. Da große Mengen an Daten anfallen, können das Speicher- oder Grafik-Interface schnell ihr Bandbreiten-Limit erreichen und das System empfindlich bremsen.

Die 3D-Performance ermitteln wir unter anderem mit 3DMark2001 SE Pro von Futuremark. Durch die umfangreichen 3D-Tests bietet der Benchmark einen guten Anhaltspunkt für die Leistungsfähigkeit von Prozessoren und Chipsätzen bei anspruchsvollen 3D-Anwendungen.

3DMark03

Mit dem 3DMark03 präsentiert die in Futuremark umbenannte MadOnion.com den Nachfolger von 3DMark2001. Die Spieletests von 3DMark03 setzen sich aus vier Szenen zusammen: "Wings of Fury" setzt auf DirectX 7 und repräsentiert Lowend-Grafikanwendungen. Die beiden Tests "Alpha Squadron" und "Troll's Lair" nutzen DirectX-8-Features und sind auf Mainstream-Grafikkarten zugeschnitten. Der Test "Nature II" setzt DirectX 9 voraus und soll Highend-Grafikkarten ausreizen. Der AGP- und der PCI-Express-Bus sowie das Speicher-Interface werden beim 3DMark03 durch große Mengen an Texturen stark belastet.

CINEBENCH 2003

Mit dem CINEBENCH 2003 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 2003 basiert auf Cinema 4D Release 8 und führt wieder Shading- und Raytracing-Tests durch. Die aktuelle Version unterstützt nun SSE2 sowie Intels Hyper-Threading-Technologie. Intel selbst unterstützte Maxon bei der Optimierung von Cinema 4D.

Der Raytracing-Test von CINEBENCH 2003 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle.

Der Leistungstest OpenGL-HW von CINEBENCH 2003 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.

Beim Leistungstest OpenGL-SW übernimmt Cinema 4D zusätzlich die Berechnung der Beleuchtung.

Fazit

Für den Käufer bietet DDR2-Speicher gegenüber DDR-SDRAM bei gleicher Taktfrequenz vorerst keinen erkennbaren Mehrwert. Die Speicherbandbreite ist bei DDR400 und bei DDR2-400 mit 5,96 GByte/s identisch. Vergleicht man beide Speicher bei einer Latenzzeit von CL3, so verbucht der DDR-Speicher in der Gesamtperformance einen geringen Vorteil. Erst mit dem Einsatz von DDR2-533-CL4-Speicher kann der 925X-Chipsatz davonziehen. Kommt aber DDR400-SDRAM in der Highspeed-Variante mit CL2 beim 875P-Chipsatz zum Einsatz, entwickelt sich zwischen den beiden Kontrahenten ein Kopf-an-Kopf-Rennen.

Die Ergebnisse auf dem DDR/DDR2-Combo-Board bestätigen, dass DDR400- und DDR2-400-Speicher mit identischen Latenzzeiten etwa gleich schnell sind. Zusätzlich belegen unsere Tests, dass die hohe Latenzzeit des DDR2-533-Speichers (CL4) die 33 Prozent höhere Taktfrequenz gegenüber dem DDR400-Speicher mit CL2 nahezu egalisiert. Erst der Vergleich von DDR2-553 CL4 und DDR400 CL3 lässt einen messbaren Performancevorteil der neuen Speichertechnologie erkennen.

Die Vorteile der DDR2-Speichertechnologie liegen nicht unbedingt in der Performance, sondern in der technologischen Flexibilität. Denn durch die geringere Leistungsaufnahme ist DDR2-SDRAM gut für den mobilen Einsatz geeignet. Für den Desktop-Bereich bringt dieser Vorteil wenig. Zusätzlich kann beim DDR2-Speicher die Frequenzschraube weiter nach oben gedreht werden. Technologien wie ODT oder OCD sollen dabei für hohe Signalqualität und Stabilität sorgen.

Preislich gesehen liegen die Kosten eines DDR2-533-CL4- und eines DDR400-CL2-Speichers auf gleich hohem Niveau von zirka 150 Euro für ein 512-MByte-Modul. Ein DDR400-Modul mit CL3 ist bereits für 100 Euro zu haben. (hal)

Testkonfiguration

Wir testen alle Prozessoren in einer exakt festgelegten Testumgebung. In der folgenden Übersicht finden sie alle von uns für den Test verwendeten Komponenten.

Komponente

Daten

CPU 1

Intel Pentium 4 3,40E GHz (Prescott)

Sockel

Socket 478

FSB

800 MHz

CPU 2

Intel Pentium 4 550/3,40 GHz (Prescott)

Sockel

Socket LGA775

FSB

800 MHz

Grafikkarte 1

MSI GeForce 6800 GT

Grafikchip

GeForce 6800 GT

Grafikspeicher

256 MByte GDDR3-SDRAM

BIOS

--

Schnittstelle

AGP 8x

Treiber

61.34

Grafikkarte 2

NVIDIA GeForce 6800 GT

Grafikchip

GeForce 6800 GT

Grafikspeicher

256 MByte GDDR3-SDRAM

BIOS

--

Schnittstelle

x16 PCI Express

Treiber

61.34

Mainboard 1

Intel D925XCV

Typ

Socket LGA775

Chipsatz

Intel 925X mit ICH6R

BIOS

BIOS: CV92510A.86A.0159

Mainboard 2

Intel Desktop D875PBZ

Typ

Socket 478

Chipsatz

875P mit ICH5/R

BIOS

BIOS: BZ87510A.86A.0084

Mainboard 3

MSI 915P Combo

Typ

Socket 478

Chipsatz

Intel 915P mit ICH6R

BIOS

V1.2 / 17.06.2004

RAM 1

Corsair

Kapazität

2x 512 MByte

Typ

DDR400 CL2,0 (2-2-2)

RAM 2

Corsair

Kapazität

2x 512 MByte

Typ

DDR2-533 CL4 (4-4-4)

RAM 3

MDT

Kapazität

2x 512 MByte

Typ

DDR400 CL2 (2-2-2)

RAM 4

Corsair

Kapazität

2x 512 MByte

Typ

DDR2-400 CL3 (3-3-3)

RAM 5

Corsair

Kapazität

2x 512 MByte

Typ

DDR2-400 CL4 (4-4-4)

Sound-Karte

Creative SoundBlaster Live! Value

Sound-Chip

Creative EMU10k1

Schnittstelle

PCI5V

Treiber

5.1.2535.0

Platine

CT4670

Netzwerkkarte

Level One FNC-0107TX (Realtek)

Typ

10/100Base Fast Ethernet

Chip

RTL8139B

Schnittstelle

PCI 5V

Treiber

5.396.530.2001

Platine

keine Angabe

SCSI-Controller

Adaptec AHA-2940UW Pro

Festplatte

Seagate ST336705LW SCSI

CD-ROM-Laufwerk

LITE-ON LTN-382

Geschwindigkeit

40x

Firmware

keine Angabe

Schnittstelle

EIDE-UltraATA/33

Diskettenlaufwerk

Teac FD-235HF

Kapazität

1,44 MByte

Netzteil

ENERMAX

Modell

EG365P-VE

Ausgangsleistung

365 Watt

Format

ATX

Tastatur

Cherry RS 6000 M

Schnittstelle

PS/2

Maus

Logitech M-S35

Schnittstelle

PS/2