Exklusiv: Erster Test! Intel Dempsey jetzt mit 3,46 GHz

24.11.2005 von Christian Vilsbeck
Intels „Dempsey“ mit 65-nm-Dual-Core setzt auf eine völlig neue Plattform. Erstmals gibt es zwei Prozessorbusse sowie FB-DIMM-Speicher. tecCHANNEL testete das 3,46-GHz-Topmodell schon vor dem offiziellen Launch.

Im ersten Quartal 2006 startet Intel eine wahre Produktoffensive: Pentium M „Yonah“ bei Notebooks, Pentium D 900 „Presler“ für Desktops und der Xeon 5000 „Dempsey“ für Server/Workstations. Alle neuen Prozessoren arbeiten mit der Dual-Core-Technologie und sind in einem 65-nm-Prozess gefertigt. Doch nur beim Xeon 5000 „Dempsey“ ändert sich die Plattform radikal.

Der Xeon 5000 geht zusammen mit der Bensley-Plattform für Server sowie Glidewell für Workstations an den Start. Jede CPU erhält einen separaten, 1066 MHz schnellen Prozessorbus. Damit merzt Intel einen Kritikpunkt der bisherigen Lösungen aus, bei denen sich zwei CPUs einen FSB800 teilen müssen. Besonders in speicherintensiven Anwendungen sollten Engpässe auf dem Bus passé sein.

Nach unserem ersten Vorabtest von 3,20-GHz-Dempseys in der Intel-Fab D1D in Hillsboro, Oregon, erreichte nun eine neue Bensley-Validation-Plattform mit zwei 3,46-GHz-Dempseys das tecCHANNEL-Labor. Wir zeigen die Leistungsfähigkeit der künftigen Xeon-5000-Topmodelle im Vergleich zu den aktuellen Xeon- und Opteron-Modellen.

Für ordentlichen Speicherdurchsatz sollen vier FB-DIMM-Channels mit DDR2-533 sorgen. Damit sind theoretische 17 GByte/s Bandbreite möglich. Unser Speicherexperte Bernhard Haluschak analysiert die FB-DIMM-Technologie der Bensley-Plattform. Lesen Sie bei tecCHANNEL in Kürze einen gesonderten Test über die Performance der FB-DIMMs.

Alle Details über den Xeon 5000 „Dempsey“ sowie die neuen Plattformen finden Sie bei tecCHANNEL im Artikel Alles neu: Intels Xeon-Plattform Bensley & Glidewell.

CPU2000: SPECint_base2000

Wir setzen die SPEC-Benchmarks unter Windows Server 2003 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität zu den verschiedenen CPUs.

Der SPECint_base2000-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks der wichtigsten Prozessoren im Vergleich:

SPECint_base2000: Official Run

Prozessor

Opteron 254

Opteron 280

Xeon 5070

Xeon 3,60 GHz 2M

Taktfrequenz

2,8 GHz

2,4 GHz

3,46 GHz

3,60 GHz

Sockel

S940

S940

LGA771

S604

Core

AMD64

AMD64

Dempey

Irwindale

Speichertyp

Reg. DDR400 CL3

Reg. DDR400 CL3

FB-DDR2-533 CL4

DDR2-400 CL3

Chipsatz

NF Prof.

NF Prof.

Blackford

E7525

Compiler

-QxW

-QxW

-fast

-fast

Test

164.gzip

1548

1333

1181

1188

175.vpr

1531

1365

1111

1178

176.gcc

1450

1261

1968

2019

181.mcf

1234

1183

1801

1799

186.crafty

1988

1718

1270

1332

197.parser

1754

1539

1430

1473

252.eon

2491

2143

2161

2244

253.perlbmk

2061

1788

1861

1899

254.gap

2026

1771

1833

1918

255.vortex

2738

2410

2569

2775

256.bzip2

1451

1290

1207

1291

300.twolf

1890

1665

1746

1834

Gesamt

1800

1585

1624

1688

CPU2000: SPECint_rate_base2000

Wir setzen die SPEC-CPU2000-Benchmarks unter Windows Server 2003 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität zu den verschiedenen CPUs.

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

Optimierte Herstellerangaben: SPECint_rate_base2000

Die Prozessorhersteller sowie die Anbieter von Servern, Workstations und PCs veröffentlichen auf der SPEC-Website ihre eigenen, hoch optimierten Ergebnisse des CPU2000-Benchmarks. Dabei sind teilweise mehrere Compiler sowie spezielle, auf die CPUs abgestimmte Bibliotheken im Einsatz.

Die SPECint_rate_base2000-Werte der Hersteller zeigen die maximale Integer-Leistungsfähigkeit der Prozessoren in einer Multitask-Umgebung.

CPU2000: SPECfp_base2000

Wir setzen die SPEC-Benchmarks unter Windows Server 2003 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio sowie Intel Fortran 9.0 für alle Fließkommatests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität zu den verschiedenen CPUs.

Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

AMDs Opteron-Prozessoren beherrschen wie die Intel-CPUs SSE3. Die Intel-Compiler verweigern aber mit eingestellter SSE3-Optimierung -QxP/fast die Zusammenarbeit mit den AMD-CPUs. Wir testen die AMD64-Prozessoren mit dem Compiler-Switch -QxW mit SSE2-Unterstützung.

Zwar lässt sich die Prozessorabfrage bei den Intel-Compilern per Patch „umgehen“, doch nach den strengen SPEC-Regeln dürfen nur Ergebnisse mit offiziell verfügbarerer Hard-/Software publiziert werden. So unterstützt Intel dieses „umgehen“ der CPU-Abfrage bei seinen Compilern nicht, wie der Hersteller mitteilt.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks der wichtigsten Prozessoren im Vergleich:

SPECfp_base2000: Official Run

Prozessor

Opteron 254

Opteron 280

Xeon 5070

Xeon 3,60 GHz 2M

Taktfrequenz

2,8 GHz

2,4 GHz

3,46 GHz

3,60 GHz

Sockel

S940

S940

LGA771

S604

Core

AMD64

AMD64

Dempey

Irwindale

Speichertyp

Reg. DDR400 CL3

Reg. DDR400 CL3

FB-DDR2-533 CL4

DDR2-400 CL3

Chipsatz

NF Prof.

NF Prof.

Blackford

E7525

Compiler

-QxW

-QxW

-fast

-fast

Test

168.wupwise

2177

1928

2574

2559

171.swim

2353

2239

2592

2034

172.mgrid

1520

1344

1511

1457

173.applu

1320

1215

1545

1465

177.mesa

2065

1785

1487

1571

178.galgel

2567

2326

3558

3591

179.art

1900

1811

3949

4172

183.equake

1754

1636

2105

2076

187.facerec

2071

1847

1552

1861

188.ammp

1332

1190

1136

1237

189.lucas

1971

1877

1694

1796

191.fma3d

1655

1491

1454

1436

200.sixtrack

748

645

687

714

301.apsi

1524

1351

1213

1209

Gesamt

1712

1551

1748

1762

Bei der sehr speicherintensiven Flachwasser-Simulation 171.swim zur Berechnung finiter Wasserelemente profitiert der Dempsey-Prozessor von den vier FB-DIMM-Channels. Hier liest die CPU in einem 1335 x 1335 großen Daten-Array eine Vielzahl von Datenblöcken im Burst-Modus aus dem Speicher. Hohe Latenzzeiten fallen hier kaum ins Gewicht, es zählt die Speicherbandbreite. Der 3,46-GHz-Dempsey arbeitet bei 171.swim um 27 Prozent schneller als der 3,60-GHz-Xeon. Die vier Channels bieten mit theoretischen 17 GByte/s mehr als die doppelte Speicherbandbreite im Vergleich zur Dual-Channel-DDR2-533-Lösung des Irwindale-Xeons.

CPU2000: SPECfp_rate_base2000

Wir setzen die SPEC-CPU2000-Benchmarks unter Windows Server 2003 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio .NET sowie Intel Fortran 9.0 für alle Fließkommatests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität zu den verschiedenen CPUs.

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

Zusätzlich haben wir das Xeon-3,60-GHz-2M-Doppelpack mit ausgeschaltetem Hyper-Threading getestet. Jetzt steigt der SPECfp_rate_base2000-Wert von 26,8 auf 31,0 Punkte. Das Deaktivieren von Hyper-Threading führt in diesem Fall zu einer Performance-Steigerung von 16 Prozent. Bei der Bensley-Validation-Plattform lässt sich Hyper-Threading im BIOS noch nicht deaktivieren. Dadurch ließ sich der Wert ohne HT nicht ermitteln. Geht man auch beim Dempsey von 16 Prozent Steigerung aus, so müsste ohne HT ein SPECfp_rate_base2000-Wert von 63 Punkten erreichbar sein.

Optimierte Herstellerangaben: SPECfp_rate_base2000

Die Prozessorhersteller sowie die Anbieter von Servern, Workstations und PCs veröffentlichen auf SPEC.org ihre eigenen, hoch optimierten Ergebnisse des CPU2000-Benchmarks. Dabei sind teilweise mehrere Compiler sowie spezielle, auf die CPUs abgestimmte Bibliotheken im Einsatz.

Die SPECfp_rate_base2000-Werte der Hersteller zeigen die maximale Floating-Point-Leistungsfähigkeit der Prozessoren in einer Multitask-Umgebung.

Linux 64 Bit: Integer-Performance

Die modulare Benchmark-Suite SysBench für Linux ist multithreaded konzipiert. Neben dem Test von Datenbanken eignet sich SysBench zur Überprüfung der Integer-Performance der Prozessoren, des Speicherdurchsatzes oder der Scheduler-Performance des Betriebssystems.

Beim CPU-Test von SysBench berechnet der Benchmark die Primzahlen bis zu einer wählbaren Obergrenze. In unserem Fall lassen wir alle Primzahlen bis 100.000 berechnen. Als Ergebnis übergibt SysBench die benötigte Zeit. Die Berechnung der Primzahlen erfolgt mit 64-Bit-Integer-Operationen.

Die Thread-Anzahl ist beim CPU-Test von SysBench konfigurierbar. Wir führen den Benchmark mit einem und acht Threads durch. Damit wird der Vorteil sichtbar, den Hyper-Threading, Dual-Core oder ein zweiter Prozessor erwirken. Die Anzahl der Threads sollte bei diesem Test mindestens der Anzahl – virtueller – Prozessoren besitzen. Bei diesem CPU-Test spielen die Cache-Größen sowie die Speicherbandbreite eine untergeordnete Rolle.

Linux 64 Bit: Floating-Point-Performance

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter SUSE Linux 64-Bit-Edition setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Opteron-Prozessoren mit SSE3 arbeiten mit der Intel-kompilierten Linpack-Version ebenfalls problemlos zusammen.

Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000, 15.000, 18.000 und 22.000 Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und zirka 3,6 GByte Arbeitsspeicher (22.000 Gleichungssysteme). Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Die Tabelle zeigt die erreichten GFlops bei den jeweils zu lösenden Gleichungssystemen. Mit zunehmender Gleichungsgröße – und somit Arbeitsspeicherbedarf – steigt die GFlops-Leistung bis zu einem Peak-Wert leicht an.

Am Ende der Tabelle finden Sie zwei Xeon 3,60 GHz 2M L2 mit deaktiviertem Hyper-Threading. Das Doppelpack ist ohne HT mit maximal 12,49 GFlops zirka 28 Prozent schneller. Bei diesem Test wirkt Hyper-Threading stark bremsend. Bei Intels Dempsey-System ließ sich Hyper-Threading im BIOS nicht deaktivieren. Auch beim Mainboard des Paxville DP führte das Deaktivieren von HT zu einer Fehlfunktion.

Linpack 2.1.2 64-Bit-Version für Linux

Prozessor

problem size = 5000 [GFlops]

problem size = 10000 [GFlops]

problem size = 15000 [GFlops]

Problem size = 18000 [GFlops]

problem size = 20000 [GFlops]

problem size = 22000 [GFlops]

2 x Opteron 280

11,88

12,95

13,21

13,26

13,35

13,32

2 x Opteron 254

7,40

7,79

7,97

8,12

8,19

8,20

2 x Dempsey 3,20 GHz

16,07

17,11

17,47

17,68

17,53

17,49

2 x Dempsey 3,46 GHz

16,88

18,64

19,17

19,36

19,40

19,55

2 x Xeon 2,80 GHz Dual-Core

11,68

13,29

14,27

14,56

14,63

14,65

2 x Xeon 3,60 GHz 2M L2

8,54

9,25

9,60

9,73

9,77

9,78

2 x Xeon 3,60 GHz
1M L2

8,11

8,70

9,00

9,06

8,99

8,63

2 x Xeon 3,60 GHz HT off
2M L2

10,42

11,64

12,15

12,35

12,49

12,45

Analyse: SunGard Adaptiv Credit Risk

SunGards Adaptiv Credit Risk ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library AMCL verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal.

Datenbank: MySQL

Die Datenbank MySQL liefert seine eigene Benchmark-Suite. Das integrierte sql-bench stresst mit einer Vielzahl an Operationen die Open-Source-Datenbank. Unterschiedliche Datenmanipulationen aus insert, update, delete sowie Zugriffsmessungen via select in Verbindung mit count und distinct laufen gegen die Datenbank. Verbindungsaufbau, Tabellen anlegen, löschen und verändern sind ebenfalls enthalten.

Zum Einsatz kam die in SUSE Linux 10.0 64-Bit enthaltene Datenbank MySQL 4.1.13 in der x86_64-Version. Für den Test der Prozessoren wurden an der Datenbank keine Veränderungen oder Tunings vorgenommen.

Der Benchmark sql-bench von MySQL arbeitet singlethreaded und nutzt somit die Vorteile von Hyper-Threading, Dual-Core oder einem zweiten Prozessor nicht aus.

Rendering: Cinema 4D

CINEBENCH 2003 basiert auf Cinema 4D Release 8 von Maxon und führt Shading- und Raytracing-Tests durch. Die aktuelle Version unterstützt SSE2 sowie Multiprocessing und Intels Hyper-Threading-Technologie.

Der Raytracing-Test von CINEBENCH 2003 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle.

Rendering: 3ds max 7

Discreet/Autodesk bietet mit 3ds max 7 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds max 7 Multiprocessing voll aus. Die Dual-Core- und Hyper-Threading-Technologien wirken somit beschleunigend.

Raytracing: POV-Ray 3.7

Das Raytracing-Programm POV-Ray ist ein frei erhältliches Open-Source-Tool zum kreieren von 3D-Grafiken. Den „Persistence of Vision Raytracer“ gibt es in der Version 3.7. Beta 9 mit optimiertem Thread-Handling. Die Beta-Version wartet außerdem mit einer SSE2-optimierten Rendering-Engine auf.

Cache/Speicher: 32-Bit-Transfer

Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro unter Windows Server 2003. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load-/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.

Achtung: Für die Dempsey-Evaluation-Plattform gibt es von Intel noch keinen speziellen Chipsatz-Treiber. Windows Server 2003 arbeitete mit Standard-Microsoft-Treibern. Mit optimierten Blackford-/Greencreek-Treibern sollte der Speicherdurchsatz steigen.

Cache/Speicher: 64-Bit-Transfer

Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.

Achtung: Für die Dempsey-Evaluation-Plattform gibt es von Intel noch keinen speziellen Chipsatz-Treiber. Windows Server 2003 arbeitete mit Standard-Microsoft-Treibern. Mit optimierten Blackford-/Greencreek-Treibern sollte der Speicherdurchsatz steigen.

Cache/Speicher: 128-Bit-Transfer

Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.

Achtung: Für die Dempsey-Evaluation-Plattform gibt es von Intel noch keinen speziellen Chipsatz-Treiber. Windows Server 2003 arbeitete mit Standard-Microsoft-Treibern. Mit optimierten Blackford-/Greencreek-Treibern sollte der Speicherdurchsatz steigen.

Fazit

Performance-Wunder sind von den Dempsey-Xeons natürlich nicht zu erwarten. Die CPUs basieren auf der bekannten NetBurst-Architektur, geschrumpft auf 65 nm Strukturbreite.

Überwiegend im Cache arbeitende Applikationen wie Rendering oder die Monte-Carlo-Simulation beschleunigen die Dempseys gegenüber den 2,80-GHz-Paxville-DP-Xeons somit auf Grund der höheren Taktfrequenz. Immerhin, einsam an der Spitze liegende Dual-Core-Opterons sind mit den Dempseys bei diesen Programmen passé.

Ihr Potenzial zeigt die neue Bensley-/Glidewell-Plattform bei sehr speicherlastigen Anwendungen. Programme wie SPECrate erfahren mit der neuen Plattform eine ordentliche Beschleunigung. Zudem sollten die Speicher-Transferraten durch angepasste Treiber noch optimierbar sein.

Der erste Performance-Eindruck von Intels nächster Xeon-Plattform überzeugt jedenfalls. Jetzt müssen die Dempsey-CPUs ihre Leistungsfähigkeit noch in Bereichen wie der Virtualisierung unter Beweis stellen. Hier ist die bisherige Xeon-E7500-Plattform den Opterons deutlich unterlegen.

Besonders bei Multi-User-Workloads mit massiver Speicheraktivität wie VMwares ESX Server sind die Opterons mit ihrer hohen Speicher- und Busbandbreite der Intel-Lösung überlegen. Es wird spannend, ob die Bensley-Plattform mit dem Dual-Independent-Bus sowie den vier FB-DIMM-Channels hier punktet. Entsprechende Tests sind in unserem Testlabor in Vorbereitung.

Den Launch der Bensley-/Glidewell-Plattform plant Intel im ersten Quartal 2006. Bis dahin wird auch AMD seine Opteron-Prozessoren weiterentwickelt haben. Beispielsweise steht der Wechsel auf DDR2-Speicher sowie die Integration der Virtualisierungs- und Security-Technologie Pacifica auf der Opteron-Roadmap. Der Wettbewerb um die schnellste und beste Lösung geht also weiter… (cvi)

Testplattform Dempsey-CPUs Socket LGA771

Die 3,46-GHz-Dempsey-Prozessoren testen wir in einer Bensley-Validation-Plattform. Zum Launch im ersten Quartal 2006 werden die CPUs die Modellbezeichnung Xeon 5070 erhalten. Der 3,46-GHz-Xeon besitzt pro Core einen zwei MByte großen L2-Cache.

Die beiden Xeon 5070 nehmen in einem Evaluation-Mainboard mit der Bezeichnung „Bridgeport“ Platz. Das Board setzt auf den Blackford-Chipsatz für Server. Beide CPUs arbeiten mit einem 1066 MHz schnellen FSB. Über vier FB-DIMM-Channels steuert der Chipsatz insgesamt acht 512-MByte-Module vom Typ Micron MT9HFT6472FY-53EA2E2 an. Die FB-DIMMs setzen DDR2-533-SDRAMs mit CL4 ein.

Bei der Grafikkarte setzt das Bridgeport-Mainboard auf eine integrierte ATI RAGE XL. Alle verwendeten Benchmarks sind von der Grafik-Performance unabhängig. Als Betriebssystem verwenden wir Windows Server 2003 SP1 in der 32-Bit-Version sowie SUSE Linux 10.0 in der 64-Bit-Version. Spezielle Chipsatz-Treiber sind für die Windows-Installation nicht verfügbar.

Hyper-Threading ist bei allen Tests der Dempsey-Prozessoren aktiviert. Ein Deaktivieren ist über das Bridgeport-BIOS Version 50 nicht möglich.

Die 3,20-GHz-Dempseys testeten wir in den Performance Labs der Intel-Fab in Portland. Als Plattform stand uns dort ein Evaluation-Mainboard mit der Bezeichnung „Hoodsport“ zur Verfügung. Das Board setzt auf den Greencreek-Chipsatz für Workstations. Die Speicherbestückung war identisch mit dem Bridgeport-Server-Mainboard der 3,46-GHz-Dempseys.

Testplattform Xeons Socket 604 & Opterons

Die 3,60-GHz-Xeons „Irwindale“ (2M L2-Cache) und „Nocona“ (1M L2-Cache) nehmen in einem Supermicro X6DA8-G2 Platz. Das Mainboard für zwei Prozessoren verwendet Intels E7525-Chipsatz und unterstützt DDR2-400-SDRAM in einer Dual-Channel-Konfiguration. Bei den Speichermodulen setzen wir auf Registered DIMMs PC2-3200R von Infineon mit einer CAS-Latency von 3.

Der Xeon 2,80 GHz „Paxville DP“ mit Dual-Core-Technologie arbeitet in einem Supermicro X6DHR-3G2 mit E7520-Chipsatz. Das Board ist für den Betrieb mit der Dual-Core-CPU angepasst und verzichtet auf eine PCI-Express-Grafik-Schnittstelle.

Für den Test der Opteron-CPUs von AMD verwenden wir ein Tyan K8WE mit NVIDIAs nForce-Professional-Chipsatz. Über ihren integrierten Memory-Controller greifen die CPUs auf Dual-Channel-DDR400-SDRAM mit CL3 zurück. Die verwendeten Corsair-Module sind dabei gepuffert ausgeführt.

Um die gleiche Testkonfiguration zu gewährleisten, stehen den Prozessoren jeweils 4 GByte Arbeitsspeicher zur Verfügung.