Jetzt mit 64 Bit: Pentium 4 660 & 3,73 GHz XE im Test

Ergebnisse: SSE2 vs. SSE3

Die Intel-Compiler C++ 8.1 und Fortran 8.1 erlauben optimierte Einstellungen für den Pentium 4 Prescott. Mit der Compiler-Option -fast (entspricht -QxP plus weiterer Optimierungen) wird spezieller SSE3-optimierter Code erzeugt, der nur auf Prescott-CPUs lauffähig ist.

Zusätzlich kompilieren wir für den Prescott die SPEC-Programme mit den 8.1er Compilern mit der Option -QxN. Mit -QxN erzeugen die Compiler speziell optimierten Code für den Pentium 4 und dessen SSE2-Unterstützung. Durch den Vergleich beider Compiler-Optionen ermitteln wir beim Pentium 4 Prescott den direkten Vorteil von SSE3.

In der SPEC-CPU2000-Benchmark-Suite machen laut Intel drei Floating-Point-Anwendungen starken Gebrauch von komplexen arithmetischen Funktionen. Von den 13 neuen Befehlen der SSE3-Erweiterung dienen fünf zum Beschleunigen komplexer Arithmetik: addsubps, addsubpd, movsldup, movshdup und movddup. Details zu diesen Befehlen finden Sie in unserem Grundlagen-Artikel zum Prescott.

Bei der SPEC-CPU2000-Benchmark-Suite nutzen die 8.1er Compiler diese SSE3-Befehle für die Anwendungen 168.wupwise, 189.lucas und 187.facerec. Das mit Fortran erstellten 168.wupwise führt Berechnungen aus dem Bereich der Quanten-Chromodynamik durch. Dabei kommen komplexe Matrix-Multiplikationen zum Einsatz. Während die Anwendung 189.lucas Mersenne-Primzahlen ermittelt, führt 187.facerec eine Bildbearbeitung zur Gesichtserkennung durch. Beide Anwendungen verwenden Fast-Fourier-Transformationen.

Die Tabelle zeigt die SPEC-CPU2000-Floating-Point-Ergebnisse des Pentium 4 570J mit den Compiler-Optionen -QxN und -fast im Vergleich.

SPEC-CPU2000-Floating-Point-Ergebnisse mit SSE2 (-QxN) und SSE3 (-fast)

Prozessor

Pentium 4 570J

Pentium 4 570J

Optionen: -QxN = optimiert für Pentium 4, lauffähig auf Pentium 4 Prescott. -fast = optimiert für den Pentium 4 Prescott.

Core

Prescott

Prescott

Compiler

V8.1

V8.1

Option

-QxN (SSE2)

-fast (SSE3)

Test

168.wupwise

2230

2912

187.facerec

1991

2021

189.lucas

2233

2261

Im Fall der Anwendung 168.wupwise erwirkt die SSE3-Erweiterung des Pentium 4 570J einen Performance-Vorteil von 31 Prozent. Diese Steigerung übertrifft sogar die Angabe von Intel, das bei dieser Anwendung eine 10 bis 15 Prozent höhere Performance durch SSE3 angibt. Bei den ebenfalls von Intel genannten Anwendungen 187.facerec und 189.lucas bleibt der Vorteil durch SSE3 aber im Bereich von einem bis zwei Prozent.