Intel: Dual-Core-Premiere bei Xeons

10.10.2005
Der„Paxville DP“ ist Intels erster Dual-Core-Xeon. Wir nennen schon jetzt alle wichtigen Neuerungen und erste Performance-Werte. Außerdem erfahren Sie bereits Details und die Taktfrequenzen sowie Cache-Größen des Nachfolgers „Dempsey“ und der ersten POWER-Optimized-CPU „Woodcrest“.

Ursprünglich sollte Intels Dual-Core-Premiere bei den Xeon-Prozessoren im ersten Quartal 2006 mit „Dempsey“ erfolgen - dann gleich zusammen mit der komplett neuen Plattform „Bensley“. Doch mit dem Xeon „Paxville DP“ gibt es bereits jetzt eine Dual-Core-CPU für aktuelle 2-Wege-Xeon-Plattformen. Intel kündigte im August 2005 ein Vorziehen der Dual-Core-Pläne bei den Xeons an.

Der Erfolg von AMDs Opteron mit Dual-Core-Technologie dürfte am „Kreieren“ des Paxville DP nicht unbeteiligt gewesen sein. So setzt der mit 2,80 GHz arbeitende Dual-Core-Xeon auf die bereits vorhandene Lindenhurst-Plattform mit dem E7520-Chipsatz. Die bekannten Einschränkungen wie ein gemeinsamer FSB für beide CPUs bleiben.

Mehr Performance ist mit der Bensley-Plattform zu erwarten: Die künftigen Dual-Core-Xeons „Dempsey“ arbeiten mit deutlich höherer Taktfrequenz, es gibt zwei unabhängige Prozessorbusse und es stehen vier FB-DIMM-Channels parat. Außerdem erhält man neue Technologien wie die I/O Acceleration Technology oder Vanderpool gratis dazu.

Und während Intel die Features der Bensley-Plattform bereits offen kommuniziert, hüllt sich der Hersteller über die CPU- und FSB-Taktfrequenzen, die Cache-Größen sowie Prozessornummern des Xeon „Dempsey“ noch in Schweigen.

Eine tecCHANNEL vorliegende aktuelle Prozessor-Roadmap gibt diese Details jedoch preis. Intel versorgt die Industrie frühzeitig mit detaillierten Informationen über geplante Neuerscheinungen. Bei verschiedenen Mainboard-Herstellern können wir jedoch immer vorab diese Roadmaps einsehen.

Darin finden sich auch neue Details zum Low-Power-Xeon „Sossaman“, der auf dem Mobile-Core „Yonah“ basiert und Anfang 2006 auf den Markt kommen soll. Außerdem stehen in der Roadmap bereits die Taktfrequenz und Cache-Größe des Xeon „Woodcrest“ – Intels erste CPU mit der Next Generation POWER-Optimized Microarchitecture.

Einen ausführlichen Test von Intels erstem Dual-Core-Xeon „Paxville DP“ liefern wir Ihnen, sobald Samples das tecCHANNEL-Testlabor erreichen. Erste Eindrücke über die Leistungsfähigkeit des Dual-Core-Xeons ermöglichen von Intel ermittelte Performance-Werte. Der Hersteller teilte tecCHANNEL die Benchmark-Ergebnisse während eines Besuches in der Intel-Fab in Oregon mit.

Xeon „Paxville DP“

Intels erster Dual-Core-Prozessor der Xeon-Serie mit Code-Namen „Paxville DP“ wird parallel zu den Single-Core-Xeons angeboten. Dieser sogenannte „Premium Dual-Core Xeon“ für 2-Sockel-Systeme nutzt den aktuellen Xeon-DP-Server-Chipsatz E7520. Mit dem Paxville DP will Intel den Early Adopters möglichst schnell Dual-Core-Xeons anbieten.

Ein Upgrade vorhandener Lindenhurst-Plattformen mit dem Paxville DP ist durch erforderliche Änderungen am Routing der Mainboard-Leitungen in der Regel nicht möglich. Hier hängt es von den Server-Anbietern ab, ob die verwendeten Mainboards schon frühzeitig für den Paxville DP vorbereitet wurden.

Den Paxville DP bietet Intel ausschließlich mit einer Taktfrequenz von 2,80 GHz an. Dies entspricht der „Einsteiger-Taktfrequenz“ der Xeon-Irwindale-Modelle mit Single-Core. Jeder Prozessorkern des Paxville DP greift auf einen separaten 2 MByte großen L2-Cache zurück. Insgesamt stehen dem Xeon 2,80 GHz somit 4 MByte L2-Cache zur Verfügung. Die Irwindale-Xeons mit Taktfrequenzen von 2,80 bis 3,80 GHz besitzen eine 2 MByte große zweite Pufferstufe. Die Größe des L1-Daten-Cache ist allen Modellen mit 16 KByte gemein.

Intels Paxville DP setzt sich im Prinzip aus zwei Irwindale-Cores zusammen. Beide Kerne sind wie beim Pentium D auf einem Silizium-Die vereint. Der Prozessorbus der Socket-604-CPU arbeitet unverändert mit 800 MHz.

Die Fertigung des Xeon 2,80 GHz „Paxville DP“ erfolgt im 90-nm-Prozess. Zu den weiteren Features der CPUs zählen die XD-Technologie zum Schutz vor Buffer Overflows sowie die 64-Bit-Erweiterung EM64T. Durch die zusätzliche Hyper-Threading-Technologie gibt sich der Paxville DP nach außen als 4-Wege-CPU zu erkennen. Die Virtualisierungstechnologie Vanderpool ist bei Intels erstem Dual-Core-Xeon noch nicht integriert.

Den Preis des Xeon 2,80 GHz mit Dual-Core-Technologie legt Intel bei einer Abnahmemenge von 1000 Stück auf 1043 US-Dollar fest. Zum Vergleich: Das Top-Modell Xeon 3,80 GHz mit Single-Core steht mit 851 US-Dollar in der Preisliste.

Paxville DP: SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten mehrere Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems. Bei SPECint_rate_base2000 wird der Vorteil von Dual-Core und einem zweiten Prozessor voll ausgenutzt.

Die Ergebnisse der 3,60-GHz-Xeons und Opterons wurden im tecCHANNEL-Testlabor ermittelt. Der SPECint_rate_base2000-Wert des 2,80-GHz-Dual-Core-Xeons (blauer Balken) stammt von Intel selbst.

Der von Intel angegebene SPECint_rate_base2000-Wert wurde mit deaktiviertem Hyper-Threading ermittelt. Bei unseren Tests mit dem 3,60-GHz-Xeon-Irwindale-Doppelpack sinkt der SPECint_rate_base2000-Wert von 38,6 auf 37,8 Punkten. Hyper-Threading führt somit zu zwei Prozent mehr Performance.

Paxville DP: SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems. Bei SPECfp_rate_base2000 wird der Vorteil von Dual-Core und einem zweiten Prozessor voll ausgenutzt.

Die Ergebnisse der 3,60-GHz-Xeons und Opterons wurden im tecCHANNEL-Testlabor ermittelt. Der SPECfp_rate_base2000-Wert des 2,80-GHz-Dual-Core-Xeons (blauer Balken) stammt von Intel selbst.

Der von Intel angegebene SPECfp_rate_base2000-Wert wurde mit deaktiviertem Hyper-Threading ermittelt. Bei unseren Tests mit dem 3,60-GHz-Xeon-Irwindale-Doppelpack steigt der SPECfp_rate_base2000-Wert ohne HT von 26,8 auf 31,0 Punkten. Das Deaktivieren von Hyper-Threading führt in diesem Fall zu einer Performance-Steigerung von 16 Prozent.

Die Floating-Point-Units des Xeons sind bei diesem Benchmark bereits extrem ausgelastet. Freie Ressourcen in den FPU-Units gibt es beim SPECfp_rate_base2000 kaum. Die Virtualisierung des Xeons in zwei CPUs durch Hyper-Threading führt somit zu zusätzlichen Overhead, der in diesem Fall bremsend wirkt.

Paxville DP: Linpack

Der Linpack-Benchmark wurde in den 70er Jahren ursprünglich für Supercomputer entwickelt. Bis heute dient Linpack aber als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter Linux 64 Bit setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Opteron-Prozessoren mit SSE3 arbeiten mit der Intel-kompilierten Linpack-Version ebenfalls problemlos zusammen.

Das Ergebnis des Xeon 2,80 GHz „Paxville DP“ (blauer Balken) stammt aus den Intel-Testlaboren. Der Hersteller verwendet ebenfalls Linpack 2.1.2 in der 64-Bit-Version unter Linux.

Die Floating-Point-Units des Xeons sind wie bei SPECfp_rate_base2000 hier extrem ausgelastet. Freie Ressourcen in den FPU-Units gibt es beim Linpack kaum. Die Virtualisierung des Xeons in zwei CPUs durch Hyper-Threading führt somit zu zusätzlichen Overhead, der in diesem Fall wieder bremsend wirkt.

Xeon 5000 „Dempsey“ mit 3,46 GHz

Im ersten Quartal 2006 stellt Intel den Dual-Core-Xeon „Dempsey“ für Systeme mit zwei Prozessoren vor. Jeder Core erhält beim Dempsey ein eigenes Siliziumplättchen. Dieses Multichip-Design verwendet Intel auch beim Pentium-D-Nachfolger “Presler“. Die Fertigung von Dempsey erfolgt mit einer Strukturbreite von 65 nm.

Beide Kerne von Intels Dempsey-Xeon verfügen über einen 2 MByte großen L2-Cache. Intel wird die Dual-Core-CPU laut Roadmap mit den Taktfrequenzen 2,50, 2,66, 2,83, 3,00, 3,20 und 3,46 GHz anbieten. Die Dempsey-CPUs von 2,50 bis 3,00 GHz arbeiten mit einem 667 MHz schnellen Prozessorbus. Den Modellen mit 3,20 und 3,46 GHz spendiert Intel eine FSB-Taktfrequenz von 1066 MHz.

Die Xeons für 2-Wege-Systeme (zwei Sockel) sind mit der Einführung von „Dempsey“ durch 5000er Nummern zu identifizieren. So erhält beispielsweise der 2,50-GHz-Dempsey die Bezeichnung Xeon 5020. Das Topmodell mit 3,46 GHz Taktfrequenz wird als Xeon 5070 debütieren. In der Tabelle finden Sie die Dempsey-CPUs für 2-Sockel-Systeme im Überblick.

Intels Xeon-5000-Modelle „Dempsey“ im Überblick

Prozessor

Taktfrequenz

FSB

TDP

SpeedStep

Xeon 5070

3,46 GHz

1066 MHz

130 W

Ja

Xeon 5060

3,20 GHz

1066 MHz

130 W

Nein

Xeon 5050

3,00 GHz

667 MHz

95 W

Ja

Xeon 5040

2,83 GHz

667 MHz

95 W

Ja

Xeon 5030

2,66 GHz

667 MHz

95 W

Ja

Xeon 5020

2,50 GHz

667 MHz

95 W

Ja

MV Xeon 5063

3,20 GHz

1066 MHz

95 W

Nein

Bei den 3,20-GHz-Modellen bietet Intel den Xeon 5060 mit 130 Watt TDP sowie den „Mid-Voltage“ Xeon 5063 mit 95 Watt TDP an. Beide CPUs müssen auf SpeedStep zum dynamischen Senken der Taktfrequenz und Core-Spannung verzichten.

Zu den Features aller Xeon-5000-Modelle zählen die 64-Bit-Erweiterung EM64T, die XD-Technologie zum erweiterten Schutz vor Buffer Overflows sowie Hyper-Threading. Außerdem beherrschen die Dempsey-Prozessoren die Virtualisierungstechnologie Vanderpool. Mit Dempsey schwenkt Intel vom bisherigen Xeon-Steckplatz Socket 604 zudem auf den neuen LGA771 um.

Die Preise der Dempsey-Xeons reichen bei einer Abnahmemenge 1000 Stück von 209 US-Dollar für den Xeon 5020 bis 851 US-Dollar für das Top-Modell Xeon 5070.

Neue Plattform „Bensley“ für Xeon 5000

Zusammen mit den Xeon-5000-Modellen „Dempsey“ stellt Intel im ersten Quartal 2006 eine neue Plattform für 2-Wege-Systeme vor. Die neue Plattform „Bensley“ für Server (Glidewell als Workstation-Version) bietet als Besonderheit für jede CPU einen eigenen Prozessorbus. Nach Intels Angaben erhöht sich dadurch die aktuelle FSB800-Bandbreite von 6,4 GByte/s der Lindenhurst-Plattform auf insgesamt 17 GByte/s (1000er Basis) durch zwei FSF1066.

Des Weiteren unterstützt die neue Bensley-Plattform mit dem zugehörigen Blackford-Chipsatz FB-DIMMs. Der Speicher-Controller von Blackford steuert vier FB-DIMM-Channels mit DDR2-533-SDRAM an. Damit erreicht Intel eine Speicher-Bandbreite von 17 GByte/s (1000er Basis). Der E7520-Chipsatz der Lindenhurst-Plattform bietet mit seinem Dual-Channel-DDR2-400-Controller eine Bandbreite von 6,4 GByte/s.

Deutlich größer fällt beim Blackford-Chipsatz mit 64 GByte auch der adressierbare Speicherraum aus. Die Lindenhurst-Plattform verwaltet maximal 16 GByte Arbeitsspeicher.

Zusätzliche Features der Bensley-Plattform sind die Active-Management-Technologie iAMT, Virtualisierung sowie die I/O-Acceleration-Technologie. Neu bei der Bensley-Plattform ist zudem eine RAID6-Funktionalität.

Xeon „Sossaman“ mit 2,0 GHz

Für den Ultra-Dense-Bereich bei Servern führt Intel ebenfalls im ersten Quartal 2006 mit dem „Sossaman“ eine Mobile-Architektur bei Xeon-Prozessoren ein. Der „Sossaman“ basiert auf Intels nächster Centrino-CPU-Generation mit Code-Namen Yonah. So löst im ersten Quartal 2006 der im 65-nm-Verfahren hergestellte Dual-Core-Prozessor Yonah den aktuellen Pentium M „Dothan“ ab.

Der Sossaman-Xeon nutzt somit den Yonah-Core, allerdings passt ihn Intel für den Betrieb in Blade- und Rack-Servern an. In erster Linie erhält Sossaman Erweiterungen für den 2-Sockel-Betrieb. Der 667-MHz-FSB verfügt neben Anpassungen für den E7520-Xeon-Server-Chipsatz „Lindenhurst“ ein erweitertes Protokoll zur Bus-Arbitration.

Ein weiteres Unterscheidungsmerkmal zum Yonah ist die 36 Bit breite physikalische Speicher-Adressierung. Damit kann der Sossaman-Xeon bis zu 64 GByte Arbeitsspeicher adressieren. Die 64-Bit-Befehlserweiterung EM64T unterstützt Sossaman aber nicht. Hyper-Threading beherrscht die CPU ebenfalls nicht. Ob Intel beim Sossaman die Virtualisierungstechnologie Vanderpool integriert, ist laut unserer Roadmap noch in Diskussion.

Die Taktfrequenz des Xeon „Sossaman“ legt der Hersteller auf 2,0 GHz fest. Intel stattet den Sossaman mit einem so genannten „Smart Cache“ aus. Beide Cores nutzen den 2 MByte großen L2-Cache gemeinsam. Der Vorteil von einem Shared Cache ist unter anderem eine bessere Auslastung. Arbeitet beispielsweise nur ein Core, so steht diesem der gesamte Cache zur Verfügung. Bei der Dempsey-Architektur besitzt dagegen jeder Core seinen eigenen L2-Cache. Die Cache-Auslastung ist bei dieser CPU ineffektiver, wenn nicht beide Cores unter Last sind.

Den TDP-Wert des Low-Voltage-Xeons spezifiziert Intel mit 31 Watt. Laut der tecCHANNEL vorliegenden Roadmap soll der LV Xeon 2,0 GHz bei einer Abnahmemenge von 1000 Stück zum Debüt 519 US-Dollar kosten.

Xeon „Woodcrest“ mit 2,93 GHz

Im zweiten Halbjahr 2006 stellt Intel erste CPUs mit der „Next Generation POWER-Optimized Architecture“ vor. Die neue x86-Architektur verbindet Technologien der NetBurst- und Pentium-M-Prozessoren.

Dabei kommt die POWER-Optimized Microarchitecture in allen Segmenten zum Einsatz. Für Notebooks steht der Yonah-Nachfolger mit Code-Namen „Merom“ auf dem Plan. Als Desktop-Pendant wird Intel den Presler-Nachfolger „Conroe“ vorstellen. Bei den Xeons integriert Intel im Dempsey-Nachfolger „Woodcrest“ die neue Architektur. Bei allen Modellen setzt Intel auf eine Dual-Core-Technologie.

Den Woodcrest-Xeon wird es laut der uns vorliegenden Roadmap zum Debüt mit einer Taktfrequenz von 2,93 GHz geben. Zum Vergleich: Der schnellste aktuelle Pentium M arbeitet mit 2,26 GHz Taktfrequenz, den Nachfolger Yonah wird es mit 2,33 GHz geben.

Beim Woodcrest greifen beide Kerne auf einen gemeinsamen 4 MByte großen L2-Cache zurück. Die Fertigung des Next-Generation-Xeons erfolgt mit einer Strukturbreite von 65 nm. Den TDP-Wert des Woodcrest spezifiziert Intel mit maximal 80 Watt.

Die FSB-Taktfrequenz ist in unserer Roadmap noch nicht definiert. Durch die Bensley-Plattform als Basis für den Woodcrest liegt sie voraussichtlich aber bei 1066 MHz. Features wie die 64-Bit-Erweiterung EM64T, die XD-Technologie zum erweiterten Schutz vor Buffer Overflows, Vanderpool für die Virtualisierung sowie Speedstep zum dynamischen Senken der Taktfrequenz und Core-Spannung zählen zum Standard-Repertoire. Die Hyper-Threading-Technologie gibt es beim Woodcrest dagegen nicht.

Weitere Details über Intels neue Architektur lesen Sie bei tecCHANNEL im Artikel Das Ende des Pentium 4: Intels nächste CPU-Generation.

Fazit

Normalerweise ist bei Server-/Workstation-Prozessoren die Frequenz der Neuvorstellungen deutlich niedriger als bei Desktop-CPUs. Doch bei Intels Xeons geht es jetzt Schlag auf Schlag: Den Anfang macht der Paxville DP, im nächsten Quartal folgen bereits der Sossaman und Dempsey, weiter geht es im zweiten Halbjahr 2006 mit dem Woodcrest.

Warum diese Eile? Auch wenn es Intel natürlich anders sieht, im Server-Segement hat AMD Marktanteile hinzu gewonnen. Hier will jemand möglichst schnell und mit Nachdruck gegensteuern. Und dass Intel AMD mit seinem Dual-Core-Opterons ernst nimmt, zeigt das vorgezogene Dual-Core-Debüt bei den Xeons mit dem Paxville DP.

Denn wie unsere Tests zeigen, sind die Dual-Core-Opterons den Single-Core-Xeons weit überlegen. Den deutlichen Abstand verringert der neue Xeon „Paxville DP“ wieder – die von Intel präsentierten Benchmarks deuten dies bereits an.

Leider arbeitet der Paxville DP mit vorhandenen Lindenhurst-Plattformen in den meisten Fällen nicht zusammen. Es ist eine neue Mainboard-Revision notwendig. Die CPU ist als Upgrade somit ungeeignet. Allerdings sind Prozessor-Upgrades im Server-Segment eher eine Seltenheit, somit sollte man der „Inkompatibilität“ nicht zuviel Bedeutung zumessen. Trotzdem: AMD hat hier mit dem Dual-Core-Opteron einen besseren Job gemacht.

Doch wer bei seinem nächsten Server wieder auf Intel setzen will, sollte auf das erste Quartal 2006 warten. Dann kommt die komplett neue Bensley-Plattform mit dem Xeon „Dempsey“. Neben mehr Performance als bei der „Zwischenlösung“ Paxville DP bietet die neue Plattform zusätzliche Features wie Vanderpool zur Virtualiserung und die I/O Acceleration Technology für die Beschleunigung des TCP/IP-Datenverkehrs. (cvi)