Exklusiv: Erster Test! Intel Dempsey jetzt mit 3,46 GHz
CPU2000: SPECfp_base2000
Wir setzen die SPEC-Benchmarks unter Windows Server 2003 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio sowie Intel Fortran 9.0 für alle Fließkommatests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität zu den verschiedenen CPUs.
Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading und Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.
AMDs Opteron-Prozessoren beherrschen wie die Intel-CPUs SSE3. Die Intel-Compiler verweigern aber mit eingestellter SSE3-Optimierung -QxP/fast die Zusammenarbeit mit den AMD-CPUs. Wir testen die AMD64-Prozessoren mit dem Compiler-Switch -QxW mit SSE2-Unterstützung.
Zwar lässt sich die Prozessorabfrage bei den Intel-Compilern per Patch „umgehen“, doch nach den strengen SPEC-Regeln dürfen nur Ergebnisse mit offiziell verfügbarerer Hard-/Software publiziert werden. So unterstützt Intel dieses „umgehen“ der CPU-Abfrage bei seinen Compilern nicht, wie der Hersteller mitteilt.
In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks der wichtigsten Prozessoren im Vergleich:
Prozessor | Opteron 254 | Opteron 280 | Xeon 5070 | Xeon 3,60 GHz 2M |
---|---|---|---|---|
Taktfrequenz | 2,8 GHz | 2,4 GHz | 3,46 GHz | 3,60 GHz |
Sockel | S940 | S940 | LGA771 | S604 |
Core | AMD64 | AMD64 | Dempey | Irwindale |
Speichertyp | Reg. DDR400 CL3 | Reg. DDR400 CL3 | FB-DDR2-533 CL4 | DDR2-400 CL3 |
Chipsatz | NF Prof. | NF Prof. | Blackford | E7525 |
Compiler | -QxW | -QxW | -fast | -fast |
Test | ||||
168.wupwise | 2177 | 1928 | 2574 | 2559 |
171.swim | 2353 | 2239 | 2592 | 2034 |
172.mgrid | 1520 | 1344 | 1511 | 1457 |
173.applu | 1320 | 1215 | 1545 | 1465 |
177.mesa | 2065 | 1785 | 1487 | 1571 |
178.galgel | 2567 | 2326 | 3558 | 3591 |
179.art | 1900 | 1811 | 3949 | 4172 |
183.equake | 1754 | 1636 | 2105 | 2076 |
187.facerec | 2071 | 1847 | 1552 | 1861 |
188.ammp | 1332 | 1190 | 1136 | 1237 |
189.lucas | 1971 | 1877 | 1694 | 1796 |
191.fma3d | 1655 | 1491 | 1454 | 1436 |
200.sixtrack | 748 | 645 | 687 | 714 |
301.apsi | 1524 | 1351 | 1213 | 1209 |
Gesamt | 1712 | 1551 | 1748 | 1762 |
Bei der sehr speicherintensiven Flachwasser-Simulation 171.swim zur Berechnung finiter Wasserelemente profitiert der Dempsey-Prozessor von den vier FB-DIMM-Channels. Hier liest die CPU in einem 1335 x 1335 großen Daten-Array eine Vielzahl von Datenblöcken im Burst-Modus aus dem Speicher. Hohe Latenzzeiten fallen hier kaum ins Gewicht, es zählt die Speicherbandbreite. Der 3,46-GHz-Dempsey arbeitet bei 171.swim um 27 Prozent schneller als der 3,60-GHz-Xeon. Die vier Channels bieten mit theoretischen 17 GByte/s mehr als die doppelte Speicherbandbreite im Vergleich zur Dual-Channel-DDR2-533-Lösung des Irwindale-Xeons.