Intels Xeon-7500-Serie eignet sich für Server mit zwei, vier oder mehr Prozessoren. Die 8-Core-CPUs merzen die Schwachpunkte der Xeon-7400-Vorgängerserie mit langsamen FSB und Speicher-Controller im Chipsatz aus. Zwei pro Prozessor integrierte Speicher-Controller steuern jeweils acht DDR3-DIMM-Channels auf. Die Kommunikation zwischen den Xeon-7500-CPUs erfolgt über QuickPath-Schnittstellen. Bei Xeon-7400-Servern müssen die CPUs noch via FSB über den Chipsatz kommunizieren - ein Flaschenhals. Auch der Speicherzugriff über den Chipsatz ist im Vergleich zu modernen Architekturen "quälend" langsam.
In einem ersten Test mussten sich die Xeon-X7560-CPUs (2,26 GHz / 8 Core / 24 MByte L3-Cache) in der 2-Sockel-Konfiguration der Konkurrenz stellen. Obwohl die CPUs für Systeme mit vier oder mehr Prozessoren prädestiniert sind, positioniert Intel die 7500er Serie auch in diesem Segment. Allerdings sind in 2-Sockel-Systemen die konkurrierenden Xeon-5600-Modelle (6 Kerne) und AMDs Opteron-6100-Serie (12 Kerne) hinsichtlich Performance und Energieeffizienz den Xeon-7500-CPUs überlegen. Die Vorteile von Intels Xeon-7500-Plattform liegen abseits von Performance im massiven möglichen Speicherausbau sowie den RAS-Features.
Jetzt testen wir die Xeon-X7560-Prozessoren in ihrem eigentlichen Metier - Servern mit vier Sockeln. Bei summierten 32 Kernen sowie durch das zusätzliche Hyper-Threading insgesamt 64 Threads ist von einer sehr hohen Rechenleistung auszugehen. Als Vergleich dient die Vorgängerplattform mit vier Xeon X7460 (Hexa-Core). So können wir Ihnen die zu erwartenden Vorteile beim Wechsel auf die neue Generation zeigen.
Wir überprüfen die Performance der CPUs bei Integer- und Floating-Point-Anwendungen sowie bei Verschlüsselung, Rendering und Simulation. Die Geschwindigkeit bei Java-Applikationen wird ebenso untersucht wie die Energieeffizienz der Systeme. Außerdem messen wir den Speicherdurchsatz der Server und zeigen die Virtualisierungsleistung auf.
Derzeit befindet sich ein Dell PowerEdge R815 auf dem Weg ins TecChannel-Testlabor. Der 4-Sockel-Server ist mit AMDs Opteron-6100-Prozessoren ausgestattet. Sobald wir das System mit den 12-Core-CPUs fertig gestestet haben, finden Sie die Ergebnisse im Vergleich zum 4-fach Xeon-X7560-Server auf TecChannel.
Xeon 7500 mit Turbo und 16 Threads
Intel vereint beim neuen Xeon 7500 "Nehalem-EX" alle acht Kerne sind auf einem Siliziumplättchen. Laut Intel benötigt die Octa-Core-CPU 2,3 Milliarden Transistoren. Das Vorgängermodell Xeon X7460 mit sechs Kernen und 25 MByte Cache (9M L2-Cache, 16M Shared L3-Cache) besteht aus 1,9 Milliarden Transistoren.
Intel fertigt den Nehalem EX weiterhin im 45-nm-Prozess. Jedem der acht Kerne steht ein dedizierter 256 KByte großer L2-Cache zur Verfügung. Für alle Cores gibt es einen gemeinsamen bis zu 24 MByte (je nach Modell) fassenden L3-Cache. Intel teilt die dritte Pufferstufe in acht 3-MByte-Segmente auf, um die Bandbreite beim Zugriff zu optimieren. Damit soll ein Transfer zu den Kernen mit zirka 200 GByte/s möglich sein. Die Latenzzeit beziffert Intel mit 21 ns.
Intels 8-Core-Prozessor kann durch sein zusätzliches Hyper-Threading pro Kern insgesamt 16 Threads parallel abarbeiten. Neben den Octa-Core-Modellen gibt es die Xeon-7500-Serie auch in Varianten mit vier und sechs Kernen. So markiert der vierkernige Xeon E7520 mit 1,86 GHz Taktfrequenz den Einstieg der Serie. Am oberen Ende rangiert das Topmodell Xeon X7560 mit 2,26 GHz Taktfrequenz und Octa-Core.
Bis auf das Einstiegsmodell beherrschen die Xeon-7500-Modelle die Turbo-Technologie zum Steigern der Taktfrequenz einzelner Kerne. So kann der Xeon X7560 beispielsweise die Taktfrequenz eines Core um bis zu drei "Speed-Bins" erhöhen. Dies entspricht bei den festgelegten 133 MHz für einen Bin dann einer um 400 MHz erhöhten Taktfrequenz.
Intel stuft die Xeon-7500-Prozessoren mit TDP-Werten von 95, 105 und 130 Watt ein. Während das Topmodell Xeon X7560 mit 130 Watt spezifiziert ist, gibt es auch eine 8-Core-Low-Voltage-Variante mit 95 Watt TDP. Die Taktfrequenz dieses Xeon L7555 beträgt 1,86 GHz.
Hohe Skalierfähigkeit
Intel stattet den Xeon 7500 mit vier QuickPath-Interfaces aus. Damit lassen sich bis zu acht Xeons direkt und ohne zusätzliche Switch-Chips miteinander verbinden. Die QuickPath-Schnittstellen arbeiten pro Link mit einer Bandbreite von 4,8, 5,86 oder 6,4 GT/s (modellabhängig). Im Prozessor sind die vier QPI-Links über einen Crossbar-Router verbunden, der eine Bandbreite von 120 GByte/s erlaubt.
Als Chipsatz für die Xeon-7500-Plattform steht der neue Chipsatz Intel 7500 "Boxboro-EX" parat. Der Chipsatz ist ein I/O-Hub und ist nur noch als Brücke zwischen den QPI-Links der CPUs und den I/O-Schnittstellen zu sehen. Die Hauptfunktion von Boxboro-EX ist das Bereitstellen von PCI-Express-2.0-Schnittstellen.
Mit der Speicheransteuerung hat der Chipsatz bei der neuen Xeon-7500-Plattform nichts mehr zu tun. Jeder Xeon 7500 besitzt zwei integrierte Speicher-Controller. Jeder Controller besitzt zwei sogenannte "Scalable Memory Interfaces" SMI. Dabei handelt es sich um serielle Highspeed-Links. Die insgesamt vier SMI-Links eines Xeon 7500 steuern jeweils einen eigenen "Scalable Memory Interconnect with Buffers" SMB an. Jeder SMB kann im Dual-Channel-Mode bis zu vier Registered DDR3-DIMMs mit 800 oder 1066 MHz ansprechen. Die SMBs ersetzen bei der Xeon-7500-Plattform die FB-DIMM-Technologie der Vorgängerplattform mit Xeon-7400-CPUs. Das Memory-Subsystem eines Xeon 7500 kann somit 16 DIMMs via acht Channels ansteuern. In einer 4-Sockel-Konfiguration sind 64 Speicherriegel möglich.
RAS-Features auf RISC-Niveau
Mit der Xeon-7500-Serie bietet Intel eigenen Angaben zufolge erstmals die RAS-Features von RISC-Systemen bei x86-Servern an. Möglich machen soll dies das neue Feature "MCA Recovery" des Nehalem-EX. Mit der "Machine Check Architecture" (MCA) sollen Fehler bei CPU, Speicher und I/O entdeckt und korrigiert werden. Defekte bei diesen Komponenten sollen den Betrieb des Servers nicht stören.
Das Feature "MCA Recovery" muss von den Betriebssystemen unterstützt werden. Eine Unterstützung wird von den Anbietern entsprechender Enterprise-Betriebssysteme bereits angekündigt. Microsoft unterstützt MCA Recovery mit Windows Server 2008 R2, VMware will künftige Versionen von vSphere anpassen, Novell bereitet sein SUSE Linux Enterprise auf MCA Recovery vor und Red Hat arbeitet ebenfalls an einer entsprechenden Unterstützung.
Mit den Hochverfügbarkeits-Features sowie der hohen Skalierfähigkeit des Nehalem EX macht sich Intel zusätzliche interne Konkurrenz zum Itanium. Hier pochte Intel bisher stets auf die speziellen RAS-Features für den sicheren Betrieb von Mission-Critical-Workloads. Der Itanium sei laut Intel aber weiterhin die "ideale Lösung" für System mit mehr als acht Prozessoren und höchstem Speicherbedarf.
Alle Xeon-7500-Modelle im Überblick
In der Tabelle finden Sie alle neuen Xeon-7500-Prozessoren mit ihren technischen Daten im Überblick:
Prozessor | Grundtaktfrequenz [GHz] | QPI [GT/s] | Skalierfähigkeit (glueless) | L3-Cache | Kerne | DIMM-Support | Turbo [Speed Bins] | HT | TDP [Watt] |
---|---|---|---|---|---|---|---|---|---|
Xeon X7560 | 2,26 | 6,4 | 8 Sockets | 24 MByte | 8 | DDR3-1066 | +3 | ja | 130 |
Xeon X7550 | 2,0 | 6,4 | 8 Sockets | 18 MByte | 8 | DDR3-1066 | +3 | ja | 130 |
Xeon X7542 | 2,66 | 5,86 | 8 Sockets | 18 MByte | 6 | DDR3-1066 | +1 | nein | 130 |
Xeon E7540 | 2,0 | 6,4 | 8 Sockets | 18 MByte | 6 | DDR3-1066 | +2 | ja | 105 |
Xeon E7530 | 1,86 | 5,86 | 4 Sockets | 12 MByte | 6 | DDR3-1066 | +2 | ja | 105 |
Xeon E7520 | 1,86 | 4,8 | 4 Sockets | 18 MByte | 4 | DDR3-800 | nein | ja | 95 |
Xeon L7555 | 1,86 | 5,86 | 8 Sockets | 24 MByte | 8 | DDR3-1066 | +5 | ja | 95 |
Xeon L7545 | 1,86 | 5,86 | 8 Sockets | 18 MByte | 6 | DDR3-1066 | +5 | ja | 95 |
4-Sockel-Testsystem Intel QSSC-S4R
Intel hat zusammen mit Quanta Computer für die Xeon-7500-Serie den 4-Sockel-Server QSSC-S4R entwickelt. Das 4U-System für vier Prozessoren erlaubt bis zu 512 GByte Arbeitspeicher über 64 DIMM-Slots. Die Registered DDR3-1066-Speicherriegel nehmen in acht Hot-Swap-fähigen Riser-Karten Platz. Die in unserem System verwendeten Samsung M393B5170FH0 mit 4 GByte ergeben durch die Vollbestückung 256 GByte RAM.
Das 4-Sockel-System QSSC-S4R ist auf eine hohe Erweiterbarkeit ausgelegt. Hierfür bietet der Server zehn PCI-Express-Steckplätze, von denen vier Hot-Swap-fähig sind. Außerdem befindet sich im System noch eine zusätzliche I/O-Riser-Karte mit Baseboard Management Controller (iBMC), vier Gigabit-Ethernet-Ports, Grafik und Intel Remote Mangaement Module 3. Das Storage-Subsystem besteht aus einem LSI Logic SAS-6G-RAID-Controller sowie acht 2,5-Zoll-Einbauschächte. Ein Wunder an Energieeffizienz darf beim verwendeten Testsystem nicht erwartet werden. Der QSSC-S4R-Server ist mit vier redundant ausgelegten 850-Watt-Netzteilen auf eine hohe Ausfallsicherheit getrimmt.
Der Intel/Quanta-Server QSSC-S4R dient in der Leistungsfähigkeit auch als guter Anhaltspunkt zahlreicher darauf basierender Systeme. Beispielsweise verwendet auch Fujitsus RX600 S5 den QSSC-S4R als Basis.
Multitask Integer: SPECint_rate_base2006
Wir setzen die SPEC-Benchmarks unter Windows Server 2008/R2 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Integer-Berechnungen von SPECint_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Integer-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.
Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECint_rate_base2006 der Anzahl der Prozessorkerne des Systems. Im 4-Sockel-Xeon-X7560-Server arbeiten beispielsweise durch die insgesamt 32 Kerne sowie das zusätzliche Hyper-Threading 64 Kopien parallel. Pro Kopie ist ein Speicherbedarf von 2 GByte RAM notwendig.
Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für "Non-Intel-Processors" (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5680 und X7560 für eine optimale Vergleichbarkeit mit dem Opteron 6174 ebenfalls mit -QxO:
Compiler-Option | -fast (automatisch) | -QxO (SSE3) |
---|---|---|
4x Xeon X7560 | 473 | 440 |
2x Xeon X7560 FlexMem | 242 | 224 |
2x Xeon X5680 | 257 | 235 |
2x Opteron 6174 | -- | 193 |
Die Xeon-Prozessoren verlieren durch die Einstellung -QxO zirka sieben bis neun Prozent Performance.
Multitask Integer: SPECint_rate_base2006 optimiert
Unter Einsatz optimierter Compiler und spezieller Mathematik-Bibliotheken lassen sich für die Prozessoren die besten Ganzzahlenwerte für CPU2006 erzielen. Hier holen die Hersteller das Optimum aus ihren Systemen heraus. Die folgenden Werte sind offizielle CPU2006-Resultate, die von Server-Herstellern auf SPEC.org gemeldet sind.
Multitask Floating Point: SPECfp_rate_base2006
Wir setzen die SPEC-Benchmarks unter Windows Server 2008/R2 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Floating-Point-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Floating-Point-Berechnungen von SPECfp_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Floating-Point-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.
Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECfp_rate_base2006 der Anzahl der Prozessorkerne des Systems. Im 4-Sockel-Xeon-X7560-Server arbeiten beispielsweise durch die insgesamt 32 Kerne sowie das zusätzliche Hyper-Threading 64 Kopien parallel. Pro Kopie ist ein Speicherbedarf von 2 GByte RAM notwendig.
Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für "Non-Intel-Processors" (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5680 und X7560 für eine optimale Vergleichbarkeit mit dem Opteron 6174 ebenfalls mit -QxO:
Compiler-Option | -fast (automatisch) | -QxO (SSE3) |
---|---|---|
4x Xeon X7560 | 414 | 386 |
2x Xeon X7560 FlexMem | 213 | 207 |
2x Xeon X5680 | 219 | 176 |
2x Opteron 6174 | -- | 196 |
Die Xeon-X5680-Prozessoren (32-nm-Westmere-Architektur) verlieren durch die Einstellung -QxO mit 20 Prozent massiv Performance, wenn maximal SSE3 unterstützt wird. Beim Xeon X7560 mit 45-nm-Nehalem-Architektur beträgt der Einbruch nur drei bis sieben Prozent.
Multitask Floating Point: SPECfp_rate_base2006 optimiert
Unter Einsatz optimierter Compiler und spezieller Mathematik-Bibliotheken lassen sich für die Prozessoren die besten Fließkommawerte für CPU2006 erzielen. Hier holen die Hersteller das Optimum aus ihren Systemen heraus. Die folgenden Werte sind offizielle CPU2006-Resultate, die von Server-Herstellern auf SPEC.org gemeldet sind.
VMmark: Performance Virtualisierung
VMware bietet mit VMmark einen standardisierten Vergleich der Virtualisierungs-Performance von Plattformen. VMmark besteht aus sechs typischen Server-Workloads, die mit gängigen Tools zur Lastgenerierung erzeugt werden.
Als Ergebnis gibt VMmark einen normierten Gesamtwert aus. Je höher der VMmark-Score ist, desto besser eignet sich ein Server für die Virtualisierung. Es gilt jedoch darauf zu achten, mit wie vielen Tiles (1 Tile = 6 virtuelle Maschinen) der Wert erreicht wurde. Besitzen beispielsweise zwei Server den gleichen VMmark-Score von 40, so bietet derjenige Server mehr Virtualisierungs-Performance, der diesen Wert mit weniger Tiles erreicht. Der VMmark-Score ist deshalb immer in Verbindung mit der Tile-Anzahl angegeben.
Während der Gesamtwert somit ein Maß für die Virtualisierungs-Performance in Verbindung mit der Konsolidierungsfähigkeit eines Servers (Anzahl der Tiles) darstellt, zeigt der Vergleich der Tile-Werte die tatsächliche Performance der Applikationen.
Die folgenden Werte basieren auf offiziellen bei VMware publizierten Ergebnissen der Server-Hersteller:
Ausführliche Informationen über den Virtualisierungs-Benchmark VMware VMmark finden Sie bei TecChannel in unserem Artikel Virtualisierung: Die schnellsten Server.
STREAM: Speicherbandbreite
Der quelloffene STREAM-Benchmark ist ein weit verbreiteter Industriestandardtest zum Messen der möglichen Speicherbandbreite in einem System. Wir verwenden die 64-Bit-Windows-Binary von der University of Virginia. Die OMP-fähige STREAM-Version nutzt möglichst alle Kerne der Prozessoren aus, um den höchsten Speicherdurchsatz zu generieren.
Java Virtual Machine Performance
Mit SPECjvm2008 stellt die Standard Performance Evaluation Corporation (SPEC) einen Benchmark für die Performance von Systemen unter Java Runtime Environment (JRE) zur Verfügung. Die Evaluierungssoftware zur Ermittlung der Java-Performance wurde von SPEC in Zusammenarbeit mit AMD, Bea, Hewlett-Packard, IBM, Intel und Sun entwickelt.
Für die Performance des Systems in einer Java Virtual Machine zeigen sich neben der Wahl der Java-Engine die Prozessoren sowie die Speicherarchitektur verantwortlich. SPECjvm2008 startet eine JVM und führt einen Multithread-Workload durch. Alle Prozessorkerne eines Systems werden von SPECjvm2008 ausgenutzt.
SPECjvm2008 arbeitet mit einem Base-Run, bei dem keine speziellen Tuning-Maßnahmen durch Flags und Optimierungen erlaubt sind. Damit wird die Java-Performance der Systeme mit der installierten JVM ermittelt. Zehn verschiedene Tests wie Compilieren, Rendering, Verschlüsselung oder Komprimierung werden durchgeführt. Beim Peak-Run lassen sich für jeden Test Optimierungen für die JVM einstellen.
Wir führen SPECjvm2008 im Base-Run unter Windows Server 2008/R2 Enterprise x64 mit der JRE Bea JRockit 6 R27 in der 64-Bit-Version durch:
Maximale Java-Performance
SPECpower_ssj2008 ermittelt neben der Energieeffizienz bei 100 Prozent Prozessorauslastung auch die maximale Java-Performance des Systems. Als Java-Engine unter Windows Server 2008/R2 Enterprise x64 dient Bea JRockit in der 64-Bit-Version 6 R27.
SPECpower_ssj2008 nutzt einen anderen Workload als SPECjvm2008. Außerdem arbeiten bei SPECpower_ssj2008 nicht nur eine JVM, sondern mehrere virtuelle Java-Instanzen. Bei den getesteten Vier-Sockel-Systemen sind zwei JVMs aktiv. Jede JVM agiert multithreaded mit der Anzahl der CPU-Kerne pro Sockel. Bei diesem konfigurierbaren Setup erzielt SPECpower_ssj2008 bei Zwei-Sockel-Systemen die besten Ergebnisse.
Bei diesem Test sind die Energiesparoptionen der Prozessoren aktiv, die erreichbare Performance wird durch die Vollauslastung der CPUs allerdings nicht beeinflusst.
Energieeffizienz: Performance/Watt
Der Gesamtwert von SPECpower_ssj2008 steht für die Energieeffizienz des Systems. Der Benchmark gibt die gemittelte Performance pro Watt an, die über alle Lastzustände von zehn bis 100 Prozent gemessenen werden.
Um die Energiesparoptionen der Prozessoren zu nutzen, arbeitet Windows Server 2008/R2 Enterprise x64 mit dem Energieschema "Ausbalanciert". SpeedStep (Intel) und PowerNow! (AMD) zum dynamischen Regeln von Taktfrequenz und Core-Spannung je nach CPU-Auslastung sind bei dem SPECpower-Benchmark aktiv.
Jetzt wird bei den Energieoptionen von Windows Server 2008/R2 das Schemata "Höchstleistung" ausgewählt. Die Prozessoren arbeiten immer mit voller Taktfrequenz und Core-Spannung. Die dynamischen Powermanagement-Funktionen SpeedStep (Intel) und PowerNow! (AMD) sind beim Schemata "Höchstleistung" nicht aktiv.
Im zweiten Diagramm sehen Sie die Auswirkungen des deaktivierten CPU-Powermanagements auf die Energieeffizienz der Systeme.
Maximaler Energieverbrauch
SPECpower_ssj2008 ringt dem Testsystem im Lastzustand 100 Prozent den maximalen Energieverbrauch ab. Alle Kerne der Prozessoren sind voll ausgelastet. Die aktiven JVMs fordern zusätzlich den Arbeitsspeicher der Systeme.
Minimaler Energieverbrauch
SPECpower_ssj2008 führt neben den Lasttests zusätzlich Kalibrierungsmessungen über den Energieverbrauch bei Leerlauf durch. Dabei wird der minimale Energiebedarf des Systems ermittelt.
Im ersten Diagramm vergleichen wir den Systemverbrauch unter Windows Server 2008 Enterprise x64 mit dem Energie-Schemata "Ausbalanciert". Die Prozessoren nutzen ihre Powermanagement-Features SpeedStep (Intel) und PowerNow! (AMD) aus.
Dann wird bei den Energieoptionen von Windows Server 2008/R2 das Schemata "Höchstleistung" ausgewählt. Die dynamischen Powermanagement-Funktionen SpeedStep (Intel) und PowerNow! (AMD) sind beim Schemata "Höchstleistung" nicht aktiv. Die Auswirkungen sehen Sie im zweiten Diagramm.
Analyse: SunGard ACR
SunGards Adaptiv Credit Risk 4.0 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.
SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal. SunGard rechnet überwiegend mit Integer-Operationen. Speicherzugriffe halten sich bei Adaptiv Credit Risk in Grenzen.
Encryption/Decryption: openSSL 64 Bit
Die Leistungsfähigkeit der Prozessoren beim Verschlüsseln und Entschlüsseln von Daten unter Linux 64 Bit ermittelt das Open-Source-Programm openSSL in der 64-Bit-Version 0.9.8b. Der Code von openSSL ist single threaded programmiert. Durch den Start von multiplen Kopien summiert openSSL die Performance beim Verschlüsseln und Entschlüsseln von Daten.
Wir testen die Prozessoren bei openSSL mit dem RSA-Schlüssel und einer Schlüssellänge von 2048 Bit. Der synthetische Benchmark gibt einen guten Anhaltspunkt für die Geschwindigkeit der Prozessoren beim Verschlüsseln und Entschlüsseln von Daten. Spezielle, für die CPU-Architekturen optimierte Mathematik-Bibliotheken kommen beim mit gcc kompilierten openSSL-Benchmark nicht zum Einsatz.
Rendering: CINEBENCH 11.5 64 Bit
Mit dem CINEBENCH 11.5 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 11.5 basiert auf Cinema 4D Release 11.5 und führt Rendering-Tests durch. Maxon bietet CINEBENCH 11.5 als 32- und 64-Bit-Version zum Download an. Die Rendering-Engine von Cinemal 4D Release 11.5 unterstützt bis zu 64 Threads.
Beim Render-Test wird eine fotorealistische 3D-Szene mithilfe des Cinema-4D-Raytracers berechnet. Die Testszene enthält über 2000 Objekte mit mehr als 300.000 Polygonen, nutzt scharfe und weiche Spiegelungen, Flächenlichter und -schatten, prozedurale Shader, Kantenglättung und vieles mehr. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte keine Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 11.5 wenig - der Test läuft überwiegend in den Cache-Stufen ab.
AMD & Intel: Listenpreise Server-CPUs
In der Tabelle finden Sie die Preise der aktuellen Server-Prozessoren von AMD und Intel. Bei AMDs Preisliste gab es am 23. Juni 2010 die letzten Änderungen. Intels Preisliste wurde am 18. Juli 2010 aktualisiert.
Modell | Taktfrequenz [GHz] | Listenpreis [US-Dollar] |
---|---|---|
Intel Xeon-7500-Serie | ||
Xeon X7560 | 2,26 | 3692 |
Xeon X7550 | 2,0 | 2729 |
Xeon X7542 | 2,66 | 1980 |
Xeon E7540 | 2,0 | 1980 |
Xeon E7530 | 1,86 | 1391 |
Xeon E7520 | 1,86 | 856 |
Xeon L7555 | 1,86 | 3157 |
Xeon L7545 | 1,86 | 2087 |
Intel Xeon-7400-Serie | ||
X7460 | 2,66 | 2729 |
E7450 | 2,4 | 2301 |
E7440 | 2,4 | 1980 |
E7430 | 2,13 | 1391 |
E7420 | 2,13 | 1177 |
L7455 | 2,13 | 2729 |
L7445 | 2,13 | 1980 |
Intel Xeon-5600-Serie | ||
Xeon X5680 | 3,33 | 1663 |
Xeon X5677 | 3,46 | 1663 |
Xeon X5670 | 2,93 | 1440 |
Xeon X5667 | 3,06 | 1440 |
Xeon X5660 | 2,80 | 1219 |
Xeon X5650 | 2,66 | 996 |
Xeon E5640 | 2,66 | 774 |
Xeon E5630 | 2,53 | 551 |
Xeon E5620 | 2,40 | 387 |
Xeon L5640 | 2,26 | 996 |
Xeon L5630 | 2,13 | 551 |
Xeon L5609 | 1,86 | 440 |
AMD Opteron-6100-Serie | ||
Opteron 6176 SE | 2,3 | 1386 |
Opteron 6174 | 2,2 | 1165 |
Opteron 6172 | 2,1 | 989 |
Opteron 6168 | 1,9 | 744 |
Opteron 6164 HE | 1,7 | 744 |
Opteron 6136 | 2,4 | 744 |
Opteron 6134 | 2,3 | 523 |
Opteron 6128 | 2,0 | 266 |
Opteron 6128 HE | 2,0 | 523 |
Opteron 6124 HE | 1,8 | 455 |
AMD Opteron-4100-Serie | ||
Opteron 4184 | 2,8 | 316 |
Opteron 4180 | 2,6 | 188 |
Opteron 4176 HE | 2,4 | 377 |
Opteron 4174 HE | 2,3 | 255 |
Opteron 4170 HE | 2,1 | 174 |
Opteron 4164 EE | 1,8 | 698 |
Opteron 4162 EE | 1,8 | 316 |
Opteron 4130 | 2,6 | 125 |
Opteron 4122 | 2,2 | 99 |
Fazit
Mit vier Prozessoren im Verbund bietet Intels Xeon X7560 in allen Bereichen eine beeindruckende Performance. Trotz der insgesamt 32 Kerne und via Hyper-Threading 64 Threads skaliert die Rechenleistung beim Sprung von zwei auf vier CPUs sehr gut. Oft wird fast die doppelte Performance durch die CPU-Verdoppelung erreicht. Einbrüche etwaige Flaschenhälse in der Systemarchitektur sind nicht festzustellen.
Verantwortlich zeigen hierfür die vier QuickPath-Schnittstellen pro Prozessor. Damit kann jeder Xeon X7560 direkt mit den Nachbar-CPUs ohne Umwege kommunizieren. Zusätzlich wächst auch die Speicherbandbreite des Systems, weil jede CPU seinen eigenen Speicher-Controller besitzt. Das Erfolgskonzept von AMDs Opteron zeigt auch bei Intels neuem 4-Wege-System sehr positive Auswirkungen.
Gerade im Vergleich zur vorherigen Xeon-7400-Plattform erreicht das neue 4-Sockel-System in sehr speicherintensiven Szenarien eine mehr als dreifache Performance. Im primären Einsatzgebiet der Virtualisierungsszenarien ermöglicht der Wechsel auf die neue 4-Sockel-Generation so ebenfalls mehr als die dreifache Konsolidierungsfähigkeit im Vergleich zu Xeon-7400-Servern. Hier macht sich auch der massiv mögliche Speicherausbau der neuen Xeon-7500-Plattform mit 64 DIMMs auf 256, 512 oder gar 1024 GByte positiv bemerkbar. Vier Opteron-6100-CPUs können maximal 48 Speichermodule ansprechen.
Ein entscheidenderes Alleinstellungsmerkmal der Xeon-7500-Plattform im x86-Segment sind seine RAS-Features. Insbesondere die MCA-Technologie zum Abfangen von Hardwarefehlern besitzt RISC-Niveau. Wer auf hohe Betriebsicherheit Wert legt, für den sind Xeon-7500-Systeme auch eine deutlich günstigere Wahl als RISC-Maschinen. Ein Wunder an Energieeffizienz ist das verwendete Testsystem QSSC-S4R mit vier redundant ausgelegten 850-Watt-Netzteilen. Der Server ist auf eine hohe Ausfallsicherheit getrimmt.
Allerdings zeigen die Xeon-X7560-CPUs gegenüber den Xeon-X7460-Vorgängermodellen auch in der Performance pro Watt eine Steigerung um den Faktor zwei bis drei. Natürlich sind die 2-Sockel-Systeme mit Xeon X5680 oder Opteron 6174 nochmals deutlich effizienter, allerdings liegt der Fokus der "schlanken" Server auch nicht auf erhöhter Ausfallsicherheit. (cvi)
Testsysteme im Detail
Intels Xeon X7560 in der 2S-Konfiguration testen wir in dem 4-Sockel-Server Dell PowerEdge R810. Der 2U-Server verwendet den Intel-7500-Chipsatz und bietet insgesamt 32 DIMM-Steckplätze. Pro CPU stehen somit acht Registered DDR3-1066-DIMMs zur Verfügung. Das System kann in der Vollbestückung mit 4-GByte-Modulen auf 128 GByte RAM zurückgreifen.
AMDs Opteron 6174 "Magny-Cours" testen wir in einem 2-Sockel-Referenzsystem von AMD. Das Tower-System verwendet das AMD-Referenz-Mainboard Dinar2 mit AMD SR5690-Chipsatz. Jeder Socket-G34-CPU stehen acht DIMM-Steckplätze zur Verfügung (zwei Speicherriegel pro Channel). Beide Opteron 6174 können im Testsystem auf jeweils vier 4-GByte-Registered-DIMMs zurückgreifen. Dem System stehen somit insgesamt 32 GByte RAM zur Verfügung.
Intels Xeon X5680 "Westmere-EP" testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel ein 4 GByte Registered DIMM vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Insgesamt besitzt das System damit 24 GByte Arbeitsspeicher - 12 GByte pro CPU mit drei Channels.
Um insbesondere für die Energiemessungen möglichst gleiche Vorraussetzungen für die AMD- und Intel-Server zu ermöglichen, arbeiten in den Systemen an der SAS/SATA-Backplane jeweils zwei SATA-RAID-Edition-Festplatten. Bei den Energiemessungen achten wir darauf, die minimale Anzahl von DIMMs zu verwenden, bei der noch alle Speicher-Channels belegt sind. Unterschiede gibt es bei den Netzteilen. Der Xeon-X5680-Server bezieht seine Energie aus zwei 770-Watt-Netzteilen. Im Opteron-6174-System befindet sich ein 1200-Watt-Netzteil. Das Xeon-7500-System Dell PowerEdge R810 ist mit zwei 1100-Watt-Netzteilen ausgestattet. Der 4-Sockel-Server QSSC-S4R arbeitet dagegen mit vier 850-Watt-Netzteilen.
Als Betriebssystem setzen wir Windows Server 2008/R2 Enterprise x64 ein. Tests unter Linux erfolgen mit CentOS 5.4 in der 64-Bit-Version.