Neue Generation Haswell mit AVX2-Befehlssatz

CPU-Test: Intel Core i7-4770K bringt mehr Leistung

01.06.2013 von Christian Vilsbeck
Intel schwenkt mit der 4. Generation von Core-Prozessoren auf die neue Mikroarchitektur Haswell um. Desktop-CPUs wie der Core i7-4770K warten mit mehr Performance, besserer Grafik-Leistung und dem erweiterten Befehlssatz AVX2 auf.

Mit "Haswell" bringt Intel wieder eine neue Mikroarchitektur an den Start. Der Vorgänger "Ivy Bridge" ist seit April 2012 in den Serien Core i3, Core i5 und Core i7 in Desktop-PCs und Notebooks im Einsatz. Haswell rollt Intel ebenfalls wieder über sein komplettes Produktportfolio aus, von Ultrabooks bis hin zu Servern. So hat Intel bereits im April den Xeon E3 v3 mit Haswell-Architektur angekündigt.

Für den Einsatz in Business-PCs und Heimrechnern geht Intel mit den neuen Serien Core i5-4500, Core i5-4600 und Core i7-4700 an den Start. Von den 13 Desktop-Prozessoren der drei Modellreihen sind bis auf eine Ausnahme alle mit Quad-Core-Technologie ausgestattet. Die Core-i7-Prozessoren verfügen zusätzlich über Hyper-Threading. Während beim letzten Architekturwechsel von Sandy Bridge auf Ivy Bridge die Strukturbreite von 32 auf 22 nm reduzierte, bleibt Intel mit Haswell auf der 22-nm-Fertigungstechnologie mit 3D-Transistoren. Wie inzwischen von Intel gewohnt, gibt es durch das Tick-Tock-Modell im Jahresrhythmus eine neue Architektur oder einen Die-Shrink.

Core i7-4770K: Der Quad-Core-Prozessor mit Haswell-Architektur arbeitet mit 3,5 GHz Basistaktfrequenz, per Turbo sind maximal 3,9 GHz möglich. Neben 8 MByte L3-Cache ist auch die integrierte Grafik-Engine HD 4600 auf dem 22-nm-Die integriert.

Mit den neuen Desktop-Prozessoren der vierten Core-Generation führt Intel auch eine neue Plattform ein. Abwärtskompatibilität zu den Mainboards mit LGA1155-Sockel der Vorgänger-CPUs gibt es nicht. Die Serien Core i5-4500, Core i5-4600 und Core i7-4700 benötigen den neuen Sockel 1150. Mit dem Steckplatz wechselt Intel auch den Chipsatz. Die neue "Intel 8 Series" gibt es in den Varianten Z87, H87 und H81 für Consumer-PCs sowie in den speziell für Business-PCs zugeschnittenen Modellen Q87, Q85 und B85. Im Vergleich zu den bisherigen Chipsätzen der 7er Serie hat sich die Anzahl der USB-3.0- und SATA-6-Gb/s-Ports erhöht. Außerdem gibt es eine überarbeitete Version von Intels Rapid Storage Technologie sowie reduzierte TDP-Werte.

Der Fokus der neuen Haswell-CPUs liegt bei den Desktop-Prozessoren einerseits auf einer höheren Rechenleistung und Grafik-Performance, aber auch auf der weiter verbesserten Energieeffizienz. Mit Haswell sollen auch noch kleinere und schmalere Formfaktoren bei PCs möglich werden, beispielsweise in den All-in-One-Systemen. Beim neuen Topmodell Core i7-4770K der Haswell-basierenden Desktop-CPUs bleibt es im Vergleich zum Vorgänger Core i7-3770K bei vier Kernen. Auch die Grundtaktfrequenz von 3,5 GHz sowie die per Turbo 2.0 möglichen 3,9 GHz sind identisch. Beim Speicher steuert die Haswell-CPU weiterhin DDR3-1600-DIMMs in einer Dual-Channel-Konfiguration an.

Für mehr Performance sorgt beim Core i7-4770K aber die verbesserte Mikroarchitektur von Haswell mit Features wie dem neuen Befehlssatz AVX2. In den nachfolgenden Benchmark-Diagrammen sowie in der Analyse sehen Sie die Leistungsfähigkeit des Core i7-4770K im Vergleich zum Vorgänger Core i7-3770K und anderen Konkurrenten:

Neue Features der Haswell-Mikroarchitektur

Intel integriert bei den Desktop-Prozessoren mit Haswell-Architektur wie schon bei den Vorgängern mit Ivy-Bridge-Design die CPU-Kerne und die Grafik-Engine auf einem gemeinsamen Siliziumplättchen. Die Mikroarchitektur von Haswell lässt die grundlegenden Pipelines (einzelne Schritte bei der Befehlsabarbeitung) unverändert. Verbessert wurden aber unter anderem die Sprungvorhersagen. Haswell besitzt im Vergleich zu Ivy Bridge auch ein größeres Fassungsvermögen für seine Out-of-Order-Struktur. Beim Out-of-Order-Prinzip werden die Befehle für die optimierte Abarbeitung im Prozessor umsortiert. Das Out-of-Order-Prinzip wird auch bei allen Core-Prozessoren oder AMDs x86-Architekturen verwendet. Haswell kann laut Intel mehr Befehle nach dem Out-of-Order-Prinzip verarbeiten und besitzt die dafür notwendigen Strukturen.

Die Haswell-Architektur besitzt die neue Befehlssatzerweiterung AVX2. Gegenüber den AVX-Instruktionen, die auch die Vorgängerarchitekturen Sandy Bridge und Ivy Bridge beherrschen, sorgt AVX2 mit seinen 256-Bit-Vektoren für den doppelten Durchsatz - sowohl bei einfacher als auch doppelter Präzision. Die neuen AVX2-Befehle sollen unter anderem für eine höhere Performance im HPC-Bereich, bei Audio und Video sowie der Verschlüsselung sorgen. Insbesondere die im AVX2 integrierten neuen FMA-Befehle (Fused Multiply-Add) sollen für einen Geschwindigkeitsschub sorgen.

Eine weitere Architekturneuheit von Haswell ist die TSX-Erweiterung "Transactional Synchronization Extensions". Die Technologie ist ein neuer Ansatz um die Performance von parallelen Threads beim Zugriff auf einen gemeinsamen Speicher zu beschleunigen. Normalerweise werden Locks verwendet, um den parallelen Zugriff auf einen gemeinsamen Speicher zu synchronisieren. Die Lock-basierende Synchronisation ist oft komplex und bremst die Performance. TSX nutzt eine sogenannte "atomare" und "isolierte" Ausführung von Tasks. Ein alternativer Kontrollmechanismus für die Koheränz der Daten soll Deadlocks verhindern und die parallele Programmierung laut Intel stark vereinfachen. Die TSX-Erweiterung sorgt aber nur in Multi-CPU-Umgebungen für Vorteile.

An der Ringstruktur ändert Intel nichts: Wie schon bei Sandy Bridge und Ivy Bridge sind die einzelnen Cores und die Grafik-Engine an den gemeinsamen Last-Level-Cache (LLC) angebunden sind. In einem unidirektionalen Ringbus im LLC lassen sich die Daten transportieren und gemeinsam nutzen.

Überblick: Core i5-4500, i5-4600 und i7-4700

Zum Start der Haswell-Architektur stellt Intel insgesamt elf neue Desktop-Prozessoren für den Sockel LGA1550 mit Quad-Core vor. Eine spezielle Variante im BGA-Gehäuse sowie ein Dual-Core-Modell gibt es ebenfalls. Die "4" in der vierstelligen Modellnummer kennzeichnet die neuen Modelle der vierten Core-Generation. Zusätzlich gibt es noch sogenannte "K", "S" und "T" Modelle. Bei den beiden K-Varianten Core i5-4670K und Core i7-4770K handelt es ich um Prozessoren mit frei wählbaren Multipliern, die besonders für experimentierfreudige Anwender interessant sind.

Die S-Modelle ähneln sehr den normalen Varianten, besitzen aber eine geringere Grundtaktfrequenz sowie einen niedrigeren TDP-Wert. Beispielsweise ist der Core i7-4770S mit einer Grundtaktfrequenz von 3,1 GHz und einer maximaler Turbo-Frequenz von 3,9 GHz spezifiziert - bei einem TDP-Wert von 65 Watt. Der "normale" Core i7-4770 schafft im Turbo-Mode ebenfalls 3,9 GHz, hat aber 3,4 GHz Grundtaktfrequenz und 84 Watt TDP. Bei den T-Modellen handelt es sich um spezielle Low-Power-Varianten, die mit 35 oder 45 Watt TDP spezifiziert sind.

Flurplan: Die Prozessorkerne und die Grafik-Engine sind auf einem Siliziumplättchen vereint. Der L3-Cache, auch Last Level Cache genannt, steht den CPU-Kernen sowie der Grafik zur Verfügung.
Foto: Intel

Intel lässt bei den neuen Core-Prozessoren der vierten Generation die Cache-Größen unverändert zu den Ivy-Bridge-CPUs; allerdings hat sich die Bandbreite der Caches verdoppelt. Jedem Kern steht bei Haswell 64 KByte L1-Cache, aufgesplittet in je 32 KByte für Daten und Befehle, sowie ein 256 KByte fassender L2-Cache zur Verfügung. Der von den vier Prozessorkernen gemeinsam genutzte L3-Cache (Last Level Cache) besitzt eine Größe von 6 (Core i5-4xxx) oder 8 MByte (Core i7-47xx). Die Core-Prozessoren der Haswell-Generation steuern weiterhin zwei DDR3-Speicher-Channels mit 1600 MHz Taktfrequenz an. Der Hauptunterschied zwischen den Serien Core i5-4xxx und Core i7-47xx ist das zusätzliche Hyper-Threading bei den i7-CPUs.

Alle vorgestellten Haswell-Prozessoren für den Sockel LGA1150 verfügen über die integrierte Grafik-Engine Intel HD Graphics 4600. Der Basistakt der Engines beträgt 650 MHz, maximal sind durch den Turbo Mode bis zu 1250 MHz möglich. Laut Intel liefert die HD Graphics 4600 im neuen Core i7-4770K bis zu 75 Prozent mehr 3D-Performance als der Vorgänger Core i7-3770K mit seiner HD Graphics 4000. Die schnelleren Grafik-Varianten mit der Bezeichnung Iris sind überwiegend den mobilen Haswell-CPUs vorbehalten. Hier verspricht Intel mehr als die doppelte Grafikleistung im Vergleich zu den Ivy-Bridge-Prozessoren.

In der folgenden Tabelle haben wir die Merkmale aller neu vorgestellten Core i5- und i7-Desktop-Prozessoren der vierten Generation für den Sockel LGA1150 zusammengefasst:

Intel LGA1150-Desktop-Prozessoren der vierten Core-Generation

Modell

Takt

Turbo Mode CPU

Kerne

HT

Last Level Cache

TDP

Turbo Mode Grafik

Grafik-Engine

Preis

Core i5-4570

3,2 GHz

3,6 GHz

4

nein

6 MByte

84 Watt

1150 MHz

HD 4600

192 $

Core i5-4570S

2,9 GHz

3,6 GHz

4

nein

6 MByte

65 Watt

1150 MHz

HD 4600

192 $

Core i5-4670

3,4 GHz

3,8 GHz

4

nein

6 MByte

84 Watt

1200 MHz

HD 4600

213 $

Core i5-4670K

3,4 GHz

3,8 GHz

4

nein

6 MByte

84 Watt

1200 MHz

HD 4600

242 $

Core i5-4670S

3,1 GHz

3,8 GHz

4

nein

6 MByte

65 Watt

1200 MHz

HD 4600

213 $

Core i5-4670T

2,3 GHz

3,3 GHz

4

nein

6 MByte

45 Watt

1200 MHz

HD 4600

213 $

Core i7-4765T

2,0 GHz

3,0 GHz

4

ja

8 MByte

35 Watt

1200 MHz

HD 4600

303 $

Core i7-4770

3,4 GHz

3,9 GHz

4

ja

8 MByte

84 Watt

1200 MHz

HD 4600

303 $

Core i7-4770K

3,5 GHz

3,9 GHz

4

ja

8 MByte

84 Watt

1250 MHz

HD 4600

339 $

Core i7-4770S

3,1 GHz

3,9 GHz

4

ja

8 MByte

65 Watt

1200 MHz

HD 4600

303 $

Core i7-4770T

2,5 GHz

3,7 GHz

4

ja

8 MByte

45 Watt

1200 MHz

HD 4600

303 $

Rechenleistung & AVX2

Der neue Quad-Core-Prozessor Core i7-4770K setzt sich bei typischen Office-Anwendungen und im Alltagsbetrieb an die Spitze im Vergleichsfeld. Gegenüber dem ebenfalls mit 3,5 GHz Basistakt und identischen Cache-Größen arbeitenden Vorgänger Core i7-3770K schafft der Haswell-Prozessor eine vier bis sechs Prozent höhere Systemleistung - ermittelt mit SYSmark2007 und PCMark Vantage. Verantwortlich zeichnen die Architekturverbesserungen von Haswell, wie schnellere Caches, bessere Sprungvorhersagen und ein vergrößertes Out-of-Order-Fenster. In bestimmten Workloads wie "Productivity" von PCMark Vantage steigt die Performance auch um 13 Prozent.

Bei multithread-optimierten Programmen, die wenig Speicherbedarf haben und der Workload in den Cache der CPUs passt, arbeitet der Core i7-4770K zirka fünf bis acht Prozent schneller als der mit gleichen Basis-/Turbotakt spezifizierte Core i7-3770K.

Die erwähnten Leistungssteigerungen erreicht der Haswell-Prozessor mit Standard-Software, die nicht den neuen Befehlssatz AVX2 nutzen.

Vergleich: SSE 4.2, AVX und AVX2

Um den Vorteil der neuen AVX2-Befehlssatzerweiterung zu analysieren, verwenden wir zwei hochoptimierte Linpack-Versionen unter Windows 8 64 Bit. Die mit Intels Math Kernel Library 10.3 Update 7 kompilierte Variante nutzt AVX, die Version 11.0 Update 3 unterstützt AVX2. Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in GFlops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack arbeitet multithread-optimiert und lastet die CPU-Kerne extrem aus. Bei diesem Benchmark rechnet Intels Core i7-4770K mit deaktiviertem Hyper-Threading schneller. Linpack lässt mit der Math Kernel Library kaum Ressourcen in den Funktionseinheiten der CPUs frei, die für Hyper-Threading notwendig wären. Bei eingeschaltetem Hyper-Threading arbeitet der Core i7 rund zwei Prozent langsamer.

Core i7-4770K: AVX2-Performance

Befehlssatz

GFlops

Plus an Performance

AVX / Linkpack 10.3.7

108,4

--

AVX2 / Linpack 11.0.3

177,8

+64 Prozent

Verwendet der Core i7-4770K statt AVX den neuen AVX2-Befehlssatz, so steigt die Performance um 64 Prozent. Eine ähnliche Steigerung der Rechenleistung mit 59 Prozent schafft der Core i7-4770K auch beim Schritt von SSE4.2 auf AVX. Dies lässt sich mit Linpack 10.3.7 unter Windows 7 sehr einfach überprüfen. Ist das Service Pack 1 nicht installiert, so ist nur SSE4.2 aktiv. Windows benötigt für die AVX-Unterstützung das SP1. Die Performance steigt entsprechend von 56,4 auf 89,6 GFLOPS.

3D-Performance & Energieeffizienz

Die HD Graphics 4600 des Core i7-4770K ist eine weiterentwickelte Version der beim Core i7-3770K integrierten HD Graphics 4000. Intels neue Iris Graphics kommt in den neuen LGA1150-Haswell-CPUs nicht zum Einsatz und ist hauptsächlich bei den mobilen Prozessoren zu finden. Die Haswell-Grafik-Engine unterstützt DirectX 11.1, OpenGL 4.0 sowie OpenCL 1.2. Außerdem verfügt die HD Graphics 4600 über einen verbesserten Quick-Sync-Encoder.

Die 3D-Performance der Intel HD Graphics 4600 ist allerdings mit einer PCI-Express-Grafikkarte wie unserer verwendeten GeForce GTX285 schwer vergleichbar. Deshalb stellen wir der Intel HD Graphics 4600 zusätzlich die 3D-Performance der in den CPUs Core i7-3770K, Core i7-2700K und AMD A8-3850 integrierten Grafik-Engines gegenüber:

3D-Performance Grafik-Engines

Prozessor / Grafik

Cryis 800x600 Low Quality

Cryis 1280x1024 High Quality

3DMark Vantage - GPU

SPECviewperf 10 - Szene proe-04

Core i7-4770K / GeForce GTX285

230 fps

68 fps

13501 Punkte

21,7 fps

Core i7-4770K / int. HD 4600

111 fps

17 fps

4397 Punkte

14,0 fps

Core i7-3770K / int. HD 4000

72 fps

15 fps

3381 Punke

10,4 fps

Core i7-2700K / int. HD 3000

68 fps

10 fps

1779 Punkte

4,9 fps

A8-3850 / int. Radeon HD 6550D

105 fps

16 fps

3210 Punkte

11,4 fps

Die Grafik-Performance hat sich bei der HD 4600 im Core i7-4770K gegenüber der HD 4000 im Core i7-3770K um bis zu 55 Prozent erhöht. Damit ist Intels neue DirectX-11-Grafik-Engine sehr konkurrenzfähig im Vergleich zur Radeon HD 6550D, die AMD im A8-3850 integriert.

Energieeffizienz

Im Leerlauf benötigt die neue LGA1150-Plattform (Intel DZ87KL-75K, GeForce GTX285, 2 x DIMMs, Seagate Barracuda 7200.12) mit dem Core i7-4770K zirka 74 Watt. Der Vorgänger Core i7-3770K mit 7 Series Chipsatz (Asus P8Z77-V Mainboard) konsumiert noch 83 Watt. Wird die externe Grafikkarte ausgebaut und jeweils die in der CPU integrierte Intel-HD-Engine verwendet, so sinkt der Energiebedarf auf 40 Watt beim Core i7-4770K und 51 Watt beim Core i7-3770K. Einen großen Anteil an dem sparsameren Betrieb hat auch der neue Chipsatz, der laut Intel weniger Energie benötigt.

Unter Rechenlast (Multithread-Rendering CINEBENCH) erhöht sich der Energiebedarf des Core i7-4770K-Systems auf 124 Watt (interne Grafik verwendet). Der Core i7-3770K ist unter gleichen Bedingungen mit 109 Watt etwas genügsamer. Intel stuft den neuen Core i7-4770K mit 84 Watt TDP auch höher ein als den 3770er mit 77 Watt TDP. Das Bild dreht sich, wenn die interne Grafik der CPUs stark belastet wird: Jetzt ist das Core-i7-4770K-System mit 96 Watt genügsamer als der Vorgänger mit 107 Watt. Dass der Energiebedarf bei der Grafik-lastigen Applikation (Crysis) geringer ist als beim Rendering, zeigt die geringe Auslastung der CPU-Kerne.

Eine in der Praxis kaum vorkommende Auslastung der CPU-Kerne und des Arbeitsspeichers findet beim hochoptimierten Linpack-Benchmark statt (Grafik wird nicht verwendet). Beim Test mit AVX-Unterstützung benötigt das Core-i7-4770K-System bis zu 165 Watt. Wird AVX2 genutzt so steigt der Energiebedarf auf bis zu 175 Watt. Hier zeigt sich eine große Diskrepanz zum bereits sehr rechenintensiven Rendering, wo aber die DIMMs kaum belastet werden und auch die SSE/AVX-Units brach liegen. Insbesondere durch die notwendige zusätzliche Energie bei AVX2-Berechnungen besitzt der Core i7-4770K wohl eine höhere TDP-Einstufung als der mit identischen Taktfrequenzen und Cache-Größen arbeitende Core i7-3770K.

Fazit

Intels Core i7-4770K der vierten Core-Generation arbeitet mit seiner neuen Haswell-Architektur erwartungsgemäß wieder etwas schneller. Gegenüber den mit identischer Taktfrequenz, Cache-Dimensionierung und DDR3-1600-DIMMs arbeitenden Vorgänger Core i7-3770K erreicht die Haswell-CPU rund vier bis 13 Prozent mehr Performance.

Nutzt eine Applikation den neuen AVX2-Befehlssatz der Haswell-Architektur, so gibt es ein Plus an Rechenleistung von 64 Prozent. Wie bei jedem neuen Befehlssatz - beispielsweise SSE4.2, AVX oder AES - wird es aber dauern, bis neue Software-Releases Gebrauch von AVX2 machen.

Intel spendiert allen neu vorgestellten Core-Prozessoren für den ebenfalls neuen Sockel LGA1150 die überarbeitete integrierte HD Graphics 4600. Gegenüber der in den Ivy-Bridge-basierenden Vorgängern verwendeten HD Graphics 4000 ermöglicht Haswell eine bis zu 55 Prozent höhere 3D-Performance. Intels DirectX-11-Grafik gibt sich sehr konkurrenzfähig im Vergleich zu anderen integrierten Grafiklösungen wie der Radeon HD 6550D im AMDs A8-3850.

In Desktop-PCs sind die neuen Haswell-Prozessoren im Leerlauf und bei Grafik-lastigen Applikationen sparsamer. Unter hoher Rechenlast - insbesondere wenn AVX2 verwendet wird - benötigen CPUs wie der Core i7-4770K aber etwas mehr Energie als der vergleichbare Vorgänger.

Intel ist mit Haswell eine konsequente Weiterentwicklung der bereits überzeugenden Core-Prozessoren mit Ivy-Bridge-Architektur gelungen. Bei anzuschaffenden Systemen lassen sich CPUs wie der Core i7-4770K klar empfehlen. Sind die schon sehr effizienten Vorgänger im Einsatz, so lohnt eine Neuanschaffung im Desktop-Segment aber nicht. (cvi)