Mehr Performance durch automatisches Übertakten

Test: Intels Turbo-Technologie bei Core-i7-Prozessoren

04.11.2008 von Christian Vilsbeck
Intels Core i7 mit Nehalem-Architektur beschleunigt mit der Turbo-Technologie Anwendungen, die nicht alle Prozessorkerne ausnutzen. Die Quad-Core-CPU erhöht automatisch die Taktfrequenz der einzelnen Kerne. Unser Test zeigt, wie effizient der Turbo Mode beim Intel Core i7 funktioniert.

Quad-Core-Prozessoren haben gegenüber Doppelkern-CPUs oft den Nachteil einer geringeren Taktfrequenz. Bei Single- oder Dual-Thread-Anwendungen sind Prozessoren mit zwei Kernen durch ihre höhere Taktfrequenz somit im Vorteil. Nur bei Multi-Thread-optimierten Programmen spielen die Quad-Cores ihre Stärken aus.

Doch Taktfrequenz ist bei den Quad-Core-Prozessoren der neuen Core-i7-Serie durch die Turbo-Technologie nicht mehr länger eine feste Größe. So spricht man bei den neuen Desktop-CPUs am besten von einer Grundtaktfrequenz. Das Einsteigermodell Core i7 920 arbeitet mit 2,67 GHz. Beim Core i7 940 erhöht Intel den Arbeitstakt auf 2,93 GHz, das Top-Modell Core i7 965 Extreme erledigt seine Berechnungen mit 3,20 GHz.

Mit diesen Taktfrequenzen arbeiten die Core-i7-Prozessoren nur dann, wenn die Turbo-Technologie deaktiviert ist. In den BIOS-Einstellungen der Mainboards findet sich die entsprechende Turbo-Option zum Ein- oder Ausschalten. Ist die Turbo-Technologie aktiviert, so schaltet der Core i7 je nach Anwendung einen oder zwei Gänge hoch.

Turbo Mode: Soll der Core i7 die Turbo-Technologie nutzen, so muss im BIOS der Übertaktungsmodus aktiviert werden. Bei Intels DX58SO-Mainboard wird diese Option als „Dynamic Speed Technology“ bezeichnet.

Der Core i7 erlaubt durch die Turbo-Technologie ein automatisches Übertakten, je nach den gerade laufenden Anwendungen. Lastet ein Programm beispielsweise nur einen Prozessorkern aus, so erhöht der Turbo Mode die Taktfrequenz um zwei „Speed Bins“. Durch die von Intel definierten 133 MHz für einen Speed Bin bearbeitet der Core i7 920 einen Single-Thread mit 2,93 GHz. Sind zwei oder drei Kerne aktiv am Arbeiten, so dürfen diese mit einem Speed Bin höher takten.

Nur wenn alle Kerne extrem ausgelastet sind, bleibt es bei einer Taktfrequenz von 2,67 GHz. Doch selbst wenn das Betriebssystem eine 100-prozentige CPU-Auslastung anzeigt, gibt es abhängig von der Anwendung noch deutliche Unterschiede. Je nachdem, welche Integer- oder Floating-Point-Ausführungseinheiten des Core i7 gefordert werden, ist der Stromverbrauch selbst bei 100 Prozent Auslastung sehr unterschiedlich. Reicht die CPU also nicht an den von Intel definierten Maximalwert heran, so dürfen selbst vier Kerne des Core i7 920 unter Last mit einem Speed Bin höher – also 2,80 GHz – arbeiten.

Hochgetaktet: Links im Bild ist der Turbo Mode des Core i7 920 deaktiviert – die CPU arbeitet mit 2,67 GHz. In der Bildmitte erhöht der Turbo Mode die Taktfrequenz um einen Speed Bin auf 2,80 GHz. Bei einem Single-Thread-Programm steigt der Arbeitstakt auf 2,93 GHz, wie im Bild rechts zu sehen ist.

Intel spezifiziert den Energiebedarf seiner Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um das theoretische Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Bei der Turbo-Technologie wird der spezifizierte TDP-Wert der Core-i7-Modelle von 130 Watt zu keinem Zeitpunkt überschritten. Allerdings lotet die Turbo-Technologie die Grenze der TDP-Einstufung des Prozessors aus.

Im TecChannel-Testlabor zeigen wir die Auswirkungen der Turbo-Technologie auf die Performance und die Energieaufnahme des Core-i7-Prozessors. Wir testen den Core i7 920 bei Single-, Dual- und Multi-Thread-Anwendungen jeweils mit und ohne aktivierte Turbo-Technologie. Außerdem überprüfen wir den Einfluss von Hyper-Threading auf den Turbo-Mode.

Thread-Handling in der Praxis

Die Turbo-Theorie mit einen, zwei, drei oder vier sauber ausgelasteten Kernen hört sich plausibel an. In der Praxis gestaltet sich die nach Kernen abgestufte Auslastung allerdings schwierig. Denn die Betriebssysteme weisen einen Thread nicht einem bestimmten Kern dediziert zu. Oft wird ein Single-Thread wechselweise von allen vorhandenen Kernen abgearbeitet.

Noch komplexer wird es, wenn beim Core i7 Hyper-Threading aktiviert ist. Nur ein Kern des Quad-Core-Prozessors arbeitet also selbst bei einer Dual-Thread-Anwendung unter voller Last. Die übrigen drei Kerne „schlafen“ – theoretisch. Die Betriebssysteme weisen eine Anwendung, die zwei Threads nutzt, nicht dediziert einem physikalischen Kern zu. Dieser physikalische Kern könnte durch Hyper-Threading den Dual-Thread alleine abarbeiten. Allerdings wäre dies auch langsamer als die Aufteilung auf zwei „echte“ Kerne. In der Praxis wird ein Dual-Thread also im Wechsel von verschiedenen physikalischen Kernen abgearbeitet.

Dieses vom Betriebssystem verursachte Thread-Switching kann je nach Anwendung ein paar Prozent Performance kosten. Zwar gibt es beim Taskmanager von Windows Vista die Möglichkeit, Prozessen über „Set Affinity“ eine bestimmte Anzahl von Kernen zuzuweisen. Automatisch sind jedem Prozess, egal ob single- oder multithreaded, alle verfügbaren Kerne zugeordnet. Entsprechend kann Windows die einzelnen Prozesse jedem Kern zuweisen. Um das Thread-Switching einer Single-Thread-Anwendung zu verhindern, lässt sich manuell nur eine CPU zuordnen.

Processor Affinity: Im Taskmanager von Windows lassen sich jedem Prozess (per Rechtsklick) die ausführenden CPUs zuordnen.

Wird beim Core i7 allerdings ein Single-Thread wie Rendering mit Set Affinity beispielsweise “CPU0” zugewiesen, so sinkt die Performance um bis zu drei Prozent. Liefe allein der Rendering-Thread auf CPU0, würde die Rechengeschwindigkeit steigen. Jedoch lässt Windows trotz Bindung des Rendering-Threads an CPU0 alle anderen Dienste weiterhin wechselweise auf allen CPUs laufen – auch auf CPU0. Durch diese Unterbrechungen des Rendering-Threads sinkt die Performance stärker, als wenn Windows den Thread zu den Kernen wechselt, wo gerade weniger Dienste aktiv sind.

„Set Affinity“ erwirkt aber bis zu zehn Prozent mehr Performance, wenn der Prozessor von verschiedenen Threads voll ausgelastet wird. Arbeiten beispielsweise auf einem Quad-Core-Prozessor (CPU0 bis CPU3) vier unabhängige Threads jeweils unter voller Last, so ermöglicht die Thread-Zuweisung diesen Geschwindigkeitsschub.

Ist beim Core i7 ein Single-Thread einem Kern zugewiesen, so arbeitet dieser mit zwei „Speed Bins“ höher. Allerdings selbst ohne „Set Affinity“ – der Thread wechselt zwischen den Kernen – funktioniert der Turbo Mode. Der Core, auf dem der Single-Thread gerade arbeitet, übertaktet um zwei Speed Bins. Wechselt der Thread auf einen anderen Kern, so wird hier der Turbo Mode aktiv. Voraussetzung ist, dass keine weiteren Threads mit höherer CPU-Auslastung aktiv sind. Ansonsten würde der Single-Thread nur mit einem Speed Bin höher abgearbeitet werden.

Single-Thread: CINEBENCH 10

Mit dem CINEBENCH 10 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 10 basiert auf Cinema 4D Release 10 und führt Rendering-Tests durch. Maxon bietet CINEBENCH 10 als 32- und 64-Bit-Version zum Download an.

Beim Render-Test wird eine fotorealistische 3D-Szene mithilfe des Cinema-4D-Raytracers berechnet. Der FPU-lastige Test lässt sich wahlweise im Single- oder Multi-Thread-Verfahren durchführen. Beim Single-Thread-Test wird nur ein Prozessorkern für die Berechnung verwendet. Die Turbo-Technologie des Core i7 sollte bei einem aktiven Kern die Taktfrequenz um zwei „Speed Bins“ erhöhen.

Ein aktiver Thread: Der Core i7 erhöht die Taktfrequenz um zwei Speed Bins von 2,67 auf 2,93 GHz. Entsprechend erledigt der Prozessor das Rendering mit aktivem Turbo Mode um circa neun Prozent schneller. Hyper-Threading wirkt beim Core i7 durch zusätzlichen Thread-Switching-Overhead über acht statt nur vier Kerne minimal bremsend.

Wird mit „Set Affinity“ dem Single-Thread-Rendering nur eine CPU (CPU0 bis CPU7 bei aktivem Hyper-Threading vorhanden) zugewiesen, so sinkt die Performance um knapp drei Prozent, obwohl der Core i7 920 mit 2,93 GHz Taktfrequenz arbeitet. Liefe nur der Rendering-Thread alleine auf CPU0, würde die Rechengeschwindigkeit steigen. Allerdings lässt Windows trotz Bindung des Rendering-Threads an CPU0 alle anderen Dienste weiterhin wechselweise auf allen CPUs laufen – auch auf CPU0. Durch diese Unterbrechungen des Rendering-Threads sinkt die Performance stärker, als wenn Windows den Thread zu den Kernen wechselt, wo weniger Dienste aktiv sind.

Performance/Watt: Single-Thread

Im ersten Diagramm vergleichen wir den maximalen Energieverbrauch (Peak) des Core i7 920 bei CINEBENCH 10. Das Rendering wird nur mit einem Thread durchgeführt:

Energieverbrauch: Der Turbo Mode fordert durch die Erhöhung um zwei Speed Bins von 2,67 auf 2,93 GHz 15 (HT aus) beziehungsweise 18 Watt (HT ein) mehr Energie. Der Core i7 920 steigert die Kernspannung von 1,078 V bei 2,67 GHz auf 1,207 V bei 2,93 GHz.

Das folgende Diagramm stellt die erzielte relative Performance pro Watt des Core-i7-Systems bei CINEBENCH 10 gegenüber:

Performance pro Watt: Die höhere Performance erzielt der Turbo Mode des Core i7 920 durch einen höheren Energiebedarf. Entsprechend bleibt die Energieeffizienz des Core-i7-Systems mit und ohne Turbo-Technologie fast unverändert.

Dual-Thread: iTunes 7.5

Apples iTunes 7.5 ermöglicht das Enkodieren verschiedener Audio-Formate. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um.

Um die Enkodier-Performance der CPU zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die von uns durchgeführte MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 Kbit/s.

Beim MP3-Enkodieren nutzt iTunes 7.5 zwei Threads. Bei zwei aktiven Kernen erhöht die Turbo-Technologie des Core i7 die Taktfrequenz um einen Speed Bin. Der Core i7 920 sollte mit einer von 2,67 auf 2,80 GHz gesteigerten Taktfrequenz arbeiten.

Eine Oktave höher: Die Turbo-Technologie beschleunigt das Enkodieren unabhängig von Hyper-Threading um zirka fünf Prozent. Dies entspricht bei zwei arbeitenden Kernen der prozentualen Taktfrequenzerhöhung. Hyper-Threading wirkt beim Core i7 durch zusätzlichen Thread-Switching-Overhead bremsend.

Performance/Watt: Dual-Thread

Im ersten Diagramm vergleichen wir den maximalen Energieverbrauch (Peak) des Core i7 920 beim Enkodieren mit iTunes. Die MP3-Erstellung führt iTunes mit zwei Threads durch:

Energieverbrauch: Der Core i7 920 benötigt durch die Erhöhung um einen Speed Bin von 2,67 auf 2,80 GHz zirka 10 Watt mehr Energie. Die Core-Spannung erhöht sich von 1,078 V bei 2,67 GHz auf 1,148 V bei 2,80 GHz.

Das folgende Diagramm stellt die erzielte relative Performance pro Watt des Core-i7-Systems beim Enkodieren gegenüber:

Performance pro Watt: Die Energieeffizienz des Core-i7-Systems bleibt mit und ohne Turbo-Technologie unverändert. Ist Hyper-Threading aktiv, so verschlechtert sich jedoch die Effizienz um circa acht Prozent. Bei nur zwei aktiven Threads nutzt HT bei vier Kernen noch nichts. Allerdings benötigen die für HT aktiven Schaltungen zusätzlichen Strom.

Multi-Thread: CINEBENCH 10

Mit dem CINEBENCH 10 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 10 basiert auf Cinema 4D Release 10 und führt wieder Rendering-Tests durch. Maxon bietet CINEBENCH 10 als 32- und 64-Bit-Version zum Download an.

Beim Render-Test wird eine fotorealistische 3D-Szene mithilfe des Cinema-4D-Raytracers berechnet. Der FPU-lastige Test lässt sich wahlweise im Single- oder Multi-Thread-Verfahren durchführen. Beim Multi-Thread-Test werden alle zur Verfügung stehenden Prozessorkerne für die Berechnung verwendet. Die Turbo-Technologie des Core i7 sollte bei hoher Aktivität aller Kerne die Taktfrequenz um einen Speed Bin erhöhen, wenn die CPU ihr spezifiziertes Energielimit nicht überschreitet.

Volllast: Obwohl das Rendering alle Kerne fordert, erhöht der Turbo Mode die Taktfrequenz um einen Speed Bin von 2,67 auf 2,80 GHz. Entsprechend klappt das Rendering mit der Turbo-Technologie um ungefähr fünf Prozent schneller. Aktives Hyper-Threading erwirkt beim Core i7 circa 14 Prozent mehr Geschwindigkeit.

Performance/Watt: Multi-Thread

Im ersten Diagramm vergleichen wir den maximalen Energieverbrauch (Peak) des Core i7 920 bei CINEBENCH 10. Das Rendering wird mit allen zur Verfügung stehenden CPU-Kernen durchgeführt:

Energieverbrauch: Arbeiten alle Kerne mit einem Speed Bin höher (Turbo ein), so benötigt der Core i7 920 über 20 Watt mehr an Energie. Auch Hyper-Threading sorgt für eine um circa 25 Watt höhere Energieaufnahme. Während der Turbo Mode für fünf Prozent mehr Performance sorgt, beschleunigt Hyper-Threading um 14 Prozent.

Das folgende Diagramm stellt die erzielte relative Performance pro Watt des Core-i7-Systems bei CINEBENCH 10 gegenüber:

Performance pro Watt: Die beste Energieeffizienz wird mit aktivem Hyper-Threading und ausgeschaltetem Turbo Mode erreicht. Wird der Turbo Mode eingeschalten, so sinkt die Energieeffizienz um drei Prozent.

Thread-Mix: SYSmark2007

Das Benchmark-Paket SYSmark2007 Preview von BAPCo dient zur Ermittlung der Systemleistung. Der Benchmark enthält vier Workload-Szenarios: E-Learning, Office Productivity, Video Creation und 3D-Modelling.

SYSmark2007 Preview öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Der Core i7 ist je nach Szenario wechselweise von einem bis hin zu allen Kernen ausgelastet. Damit sollte sich die Turbo-Technologie gut in Szene setzen können.

Neben dem Core i7 920 mit 2,67 GHz testen wir zusätzlich den Core i7 965 Extreme, jeweils mit und ohne aktivem Turbo Mode. Hyper-Threading ist bei allen SYSmark2007-Tetsts aktiv (Betriebssystem sieht acht CPUs).

Gesamtwertung: Sowohl der Core i7 920 als auch der 965 Extreme arbeiten mit Turbo Mode um jeweils sechs Prozent schneller.

Ein Speed Bin von 133 MHz bedeutet beim Core i7 920 mit 2,67 GHz Grundtaktfrequenz eine Übertaktung von 4,9 Prozent. Mit zwei Speed Bins erhöht sich die Taktfrequenz um 9,7 Prozent gegenüber dem Grundtakt. Die Systemleistung des Core i7 920 steigt mit aktiviertem Turbo Mode um circa sechs Prozent. Damit zeigt sich, dass die CPU meistens mit 2,80 GHz arbeitet (ein Speed Bin bei 2, 3 und 4 aktiven Cores) und des Öfteren bei Single-Threads auf 2,93 GHz Arbeitstakt (zwei Speed Bins) erhöht.

Beim Core i7 965 Extreme mit 3,2 GHz Grundtakt verhält es sich ähnlich. Die CPU klettert bei einem zusätzlichen Speed Bin auf 3,33 GHz (zwei, drei und vier aktive Cores) und bei nur einem aktiven Kern auf 3,46 GHz Taktfrequenz.

Energieverbrauch: Leerlauf

Wir messen stets den Energieverbrauch der kompletten Plattform – ohne Monitor. Damit lassen sich praxisnahe Aussagen darüber treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Neben dem Energiebedarf bei den verschiedenen Applikationen messen wir den Systemverbrauch unter Windows Vista im „Leerlauf“.

Regungslos: Läuft nur der Windows-Desktop ohne CPU-Belastung, so wirkt sich der Turbo Mode auf den Energiebedarf nur verschwindend gering aus.

Fazit

Beim neuen Core i7 kompensiert Intel mit der Turbo-Technologie den Nachteil eines Quad-Core-Prozessors. Die vielen, noch immer vorhandenen Single-Thread-Programme beschleunigt der Turbo Mode durch die Übertaktung eines Kernes mit circa neun Prozent. Statt der Grundtaktfrequenz von 2,67 GHz arbeitet der Core i7 920 dann mit 2,93 GHz. Das Verfahren der Beschleunigung von Single-Thread-Anwendungen funktioniert unter Windows sehr gut.

Eine Multi-Thread-Anwendung, die alle vier Kerne des Core i7 bis zum Limit hin auslastet, ist schwer zu finden. Entsprechend arbeitete der Core i7 bei allen von uns getesteten Multi-Thread-Programmen auch bei vier aktiven Cores immer mit einem Speed Bin höher. Bei einer Taktfrequenz von 2,80 GHz liefert der Core i7 920 ungefähr fünf Prozent mehr Performance als beim Grundtakt.

Jetzt kann man sich natürlich fragen: Warum arbeitet der Core i7 920 nicht gleich mit 2,80 GHz Grundtaktfrequenz? Hier bleibt es aber Intel überlassen, wie die Spezifikationen seiner angebotenen Core-i7-Modelle eingestuft werden. Bei im BIOS aktiviertem Turbo Mode wird die CPU laut Intel jedenfalls ohne Gefahr innerhalb der Spezifikation betrieben. Die Energieeffizienz des Core i7 bleibt durch den Turbo Mode praktisch unverändert. Für die höhere Performance wird eben entsprechend auch mehr Energie benötigt.

Wer gerne den Prozessor außerhalb der Spezifikation übertakten will, wird am Core i7 965 Extreme seine Freude haben. Bei dem Highend-Prozessor lassen sich die Multiplier für ein, zwei, drei und vier aktive Cores zusätzlich individuell einstellen. (cvi)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows Vista Business in der 32-Bit-Version durchgeführt.

Die Core-i7-Prozessoren mit dem Sockel LGA1366 testen wir in dem Intel-Desktop-Mainboard DX58SO. Der Prozessor steuert über seine drei Speicher-Channels jeweils ein DDR3-1066-DIMM mit CL7 an. Insgesamt stehen den Core-i7-CPUs 3 GByte Arbeitsspeicher zur Verfügung.

LGA1366-Plattform: Das Intel DX58SO verwendet den neuen X58-Express-Chipsatz mit QuickPath-Interconnect. Das Board steuert über drei Channels vier DDR3-1066-DIMMs an. Ein Channel nimmt zwei DIMMs auf, die übrigen jeweils einen Speicherriegel.

Für die Grafikausgabe zeichnet die Zotac GeForce 8800GTS verantwortlich. Der DirectX-10-Grafikkarte mit 320 MByte Grafikspeicher stand der ForceWare-Treiber Release 163.69 zur Seite. Energie stellt das 620-Watt-Netzteil Enermax Liberty ELT620AWT zur Verfügung. Als Massenspeicher dient die Serial-ATA-II-Festplatte Seagate Barracuda 7200.10 mit 250 GByte Kapazität.