AMD-K10-Gegner: Intels 45-nm-Penryn-CPUs mit SSE4

Super Shuffle & Fast Radix-16

Die Super Shuffle Engine wird beim Formatieren von Daten bei SSE-Instruktionen benötigt, wie beispielsweise Packing/Unpacking oder Shifts. Super Shuffle kann eine 128-Bit-Operation in einem Taktzyklus durchführen. Anpassungen der Software sind für die Funktion von Super Shuffle nicht notwendig.

Super Shuffle: Werden zwei SSE-Daten mit einer Schiebefunktion verknüpft, so soll Super Shuffle für die doppelte Performance sorgen. (Quelle: Intel)
Super Shuffle: Werden zwei SSE-Daten mit einer Schiebefunktion verknüpft, so soll Super Shuffle für die doppelte Performance sorgen. (Quelle: Intel)

Intels Super Shuffle soll bei den bisherigen SSE-Befehlssätzen und den neuen SSE4-Instruktionen beschleunigend wirken. Super Shuffle verdoppelt die Geschwindigkeit der meisten Schiebefunktionen von SSE-Daten laut Intel durch weniger notwendige Taktzyklen.

Flink: Die meisten Schiebefunktionen erledigt Penryn mit Super Shuffle in einem Taktzyklus. (Quelle: Intel)
Flink: Die meisten Schiebefunktionen erledigt Penryn mit Super Shuffle in einem Taktzyklus. (Quelle: Intel)

Der Fast Radix-16 Divider ist ein schneller Teiler, mit dem nun vier statt zwei Bits pro Taktzyklus berechnet werden können. Vor allem beim Wurzelziehen will Intel damit mehr als die doppelte Performance erreichen. Im Durchschnitt ermöglicht Fast Radix-16 laut Intel beim Teilen von Ganz- als auch Fließkommazahlen die doppelte Geschwindigkeit wie die aktuelle Core-Mikroarchitektur.

Schneller Teiler: Der Fast Radix-16 Divider der Penryn-Architektur soll die Teilgeschwindigkeit im Durchschnitt verdoppeln. (Quelle: Intel)
Schneller Teiler: Der Fast Radix-16 Divider der Penryn-Architektur soll die Teilgeschwindigkeit im Durchschnitt verdoppeln. (Quelle: Intel)