Hyper-Threading und integrierter Speicher-Controller

Test: Intel Core i7 mit Nehalem-Quad-Core

SSE-Performance: Linpack 64 Bit

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter CentOS 5 Linux 64 Bit setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Prozessoren mit SSE3 arbeiten unter Linux mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen.

Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000 und 15.000 Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und zirka 1,6 GByte Arbeitsspeicher (15.000 Gleichungssysteme). Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Matrizenkünstler: Die für Multi-Threading optimierte Anwendung lastet die Kerne der Prozessoren sehr stark aus. Hyper-Threading erwirkt beim Core i7 deshalb keinen zusätzlichen Vorteil.
Matrizenkünstler: Die für Multi-Threading optimierte Anwendung lastet die Kerne der Prozessoren sehr stark aus. Hyper-Threading erwirkt beim Core i7 deshalb keinen zusätzlichen Vorteil.