Update: AMD Quartet - Opteron 848 als Server

08.06.2004 von Jörg Luther
Mit dem 4-Wege-Opteron-System Quartet bietet AMD seit Mitte 2003 einen robusten Rackserver für den Alltagseinsatz. Mit den jüngsten Opteron-848-CPUs nachgerüstet, muss der Quartet jetzt seine Fähigkeiten erneut unter Beweis stellen.

Zwar gab AMD bereits im Juni 2003 die Verfügbarkeit der Opteron-800-Series - also seiner acht-Wege-fähigen 64-Bit-CPUs - bekannt, entsprechende Systeme ließen aber etwas auf sich warten. Dies ist um so bedauerlicher, als sich Zwei-Wege-Server im Pizzabox-Format wie der Newisys 2100 Kephri zwar hervorragend für Clustering- und Load-Balancing-Lösungen eignen, für den harten Arbeitsalltag als Workgroup- oder Departmental-Lastesel aber unter Umständen zu wenig Substanz mitbringen.

Mit einem auf den schlichten Namen "Quartet" hörenden Vier-Wege-System zeigt AMD jedoch, wie ein für den klassischen Unternehmenseinsatz aussehendes Opteron-System aussehen kann. Der Quartet präsentiert sich Server-typisch in einem robusten Edelstahl-Gehäuse im klassischen 19-Zoll/4-HE-Format. Neben den vier Prozessoren des Typs Opteron 844 mit 1,8 GHz Taktfrequenz finden darin auch bis zu vier Platten und maximal sechs Erweiterungskarten voller Baulänge Platz. Bei den dazugehörigen Steckplätzen handelt es sich um drei PCI-X-66-MHz/64-Bit-Slots, zwei Hot-Plug-fähige PCI-X-Slots in 133-MHz/64-Bit-Ausführung sowie einen Legacy-Steckplatz für 33-MHz/32-Bit-Karten.

Unser Testsystem bringt in den 16 zur Verfügung stehenden Memory-Slots 8 GByte Registered DDR-333-SDRAM mit. Für die Ansteuerung der Festplatten verfügt der Quartet über einen onboard integrierten Ultra320-SCSI-RAID-Controller (LSI 53C1030) mit zwei Kanälen. Die Backplane für die vier in Shuttles gelagerten Platten steuert ein SAF-TE-fähiger Enclosure Management Controller von Qlogic (SDR GEM318P). Wer's schlichter mag oder eine klassische Konfiguration mit getrennter Boot-Platte aufsetzen will, findet aber auch einen UDMA-133-EIDE-Port auf dem Board.

Innenleben

Das 66 Zentimeter tiefe und damit in die meisten Racks problemlos integrierbare Metallgehäuse hat AMD in zwei separate Compartments unterteilt. Sie werden jeweils durch ein von oben leicht zugängliches, mit Schnappern fixiertes Abdeckblech verschlossen. Komponentenwechsel oder das Nachrüsten von Steckkarten lassen sich so in wenigen Sekunden erledigen.

Ein schmales Abteil auf der linken Gehäuseseite nimmt die in Shuttles gelagerten Festplatten - in unserem Fall vier Seagate Cheetah 15K.3 (je 36,7 GByte, 15.000 U/min) und die dazugehörige Backplane auf. Zwei hinter der Backplane residierende Lüfter stellen die Kühlung der Platten sowie der im Anschluss an den Storage-Bereich untergebrachten PCI/PCI-X-Erweiterungskarten sicher.

Im großzügigen rechten Compartment residiert die Systemplatine mit den vier Opteron-CPUs sowie den zahlreichen Onboard-Komponenten. Vier Lüfter - zwei im Saugbetrieb an der Vorderseite, zwei im Blasbetrieb an der Rückwand - sorgen für großzügige Durchströmung des Gehäuses mit Kühlluft. Vier weitere Ventilatoren beatmen darüber hinaus nach demselben Prinzip die in Zweiergruppen platzierten Prozessoren direkt. Trotz der zahlreichen Luftschaufler - insgesamt zählen wir neun - hält sich das Betriebsgeräusch des Rechners in Grenzen.

Bedienungselemente

Auch außen am AMD Quartet gibt es einiges zu sehen - speziell an seiner Vorderseite. Linkerhand findet sich der Storage-Bereich mit den vier 3,5-Zoll-Diskshuttles sowie einem kombinierten Floppy/CD-ROM-Laufwerk im Slimline-Format. Rechts daneben residieren zugangsfreundlich die Anschlüsse für Maus und Tastatur sowie den Monitor.

Für externe Plug-and-Play-Komponenten bietet der Quartet hier zudem auch ein USB-1.1-Interface an. Im rechterhand platzierten Bedien- und Kontrollbereich finden sich versenkte Power- und Reset-Taster sowie fünf LEDs. Sie signalisieren den Betriebszustand der Stromversorgung, der Festplatten sowie der zwei Gigabit-Ethernet-Interfaces des Quartet. Bei der fünften Diode handelt es sich um eine Fault-Anzeige.

Falls diese aufleuchtet, ist vermutlich eines der beiden auf der Gehäuserückseite untergebrachten, redundanten Netzteile ausgefallen. Es kann dann im laufenden Betrieb gewechselt werden. Außer den beiden Stromversorgungen gibt es auf der Rückseite des Quartet nicht viel zu sehen. An Anschlüssen stehen der externe Kanal des Ultra320-SCSI-Controllers, eine RS232-Schnittstelle sowie vier RJ45-Ports parat. Bei zweien davon handelt es sich um die beiden Gigabit-Netzwerk-Interfaces des Quartet, dazu kommt ein weiterer 10/100-Mbit-NIC-Port. Die vierte Netzwerkbuchse soll einmal das im Moment noch nicht implementierte Management-Interface versorgen.

Update: Testumgebung

Neben den Opteron-844-CPUs, mit denen ausgestattet der Quartet bei uns eintraf, stellte uns AMD inzwischen auch vier Opteron 848 mit 2,2 GHz Taktrate zur Verfügung. Das Quartet-System erkennt und akzeptiert (anders als der bereits getestete Newisys 2100) die neuen CPUs auf Anhieb und ohne Probleme.

Als Betriebssystem dient uns bei unseren Tests United Linux 1.0 in der AMD64-Variante. Als Benchmarks verwenden wir eine Reihe von quelloffenen Testsuiten, mit denen sich die Performance unter mittleren bis hohen Systemlasten prüfen lässt.

Eine portierte Variante des bekannten Byte-Benchmarks stellt unixbench dar, aus dessen Fundus wir sechs multiprozessorfähige Tests auswählen. Aus dem Werkzeugkasten der Samba-Entwickler stammt dbench, das unter Verwendung gescripteter Netzwerkdaten den Zugriff hoher Client-Zahlen auf das Filesystem simuliert. Zur Ermittlung einiger grundlegender Bandbreitendaten setzen wir den lmbench ein. Für die Messung von Lastdaten im Multiuser-Betrieb dient die Suite VII aus den AIM-Benchmarks von SCO.

Alle Benchmarks kompilieren wir auf dem Quartet, was speziell bei den AIM-Benchmarks etwas Nacharbeit am Code erfordert, um einen fehlerfreien Ablauf zu garantieren. Des Weiteren entfernen wir aus den Suites Harddisk-spezifische Benchmarks, um die Ergebnisse besser mit jenen des nicht ganz identisch ausgestatteten Newisys 2100 vergleichen zu können. Vor jedem Testlauf starten wir die Rechner neu, um Speicher und Filesystem von etwaigen Überbleibseln des vorherigen Benchmarks zu säubern.

Update: AIM Suite VII

Als Benchmark für die Verarbeitung hoher Prozesslasten - eine natürliche Domäne jedes Servers - dient uns die AIM Suite VII von SCO. Sie arbeitet eine gemischte Arbeitslast von rund 60 Tests aus den Bereichen Arithmetik, I/O, Prozessgenerierung und Filesystem-Handling ab. Dabei misst sie die Anzahl der verarbeiteten Aufgaben pro Minute. Die festplattenspezifischen Tests der Suite haben wir dabei ausgeklammert, um die unterschiedliche Laufwerksausstattung der beiden Opteron-Systeme zu kompensieren.

"Was die Skalierbarkeit angeht, sollte der Quartet relativ gut performen", so hatte AMD-Pressesprecher Jan Gütter uns den Vier-Wege-Opteron unbescheiden angekündigt. Und dabei keineswegs zu viel versprochen, wie die Ergebnisse der AIM Suite VII zeigen.

Von Overhead-Effekten beim Einsatz der vier Prozessoren gegenüber den zwei im Vergleichssystem Newisys 2100 ist beim AMD Quartet nichts zu spüren. Der Quartet verarbeitete die gestellten Aufgaben tatsächlich doppelt so schnell wie der Zwei-Wege-Server. Während der Dual-Opteron-Rechner zudem ab etwa 250 parallelen Tasks nicht mehr an Geschwindigkeit zulegte, wies die Messkurve des Quartet an derselben Stelle immer noch nach oben.

Beim Einsatz von Opteron-846-CPUs (mit 2,0 statt 1,8 GHz getaktet) kann der Quartet gegenüber der 844er-Variante noch einmal gut fünf Prozent an Leistung zulegen. Bei Verwendung von Opteron-848-Prozessoren beträgt der Leistungsvorsprung zu 844er-CPUs rund 11 Prozent. Die höhere Taktrate lässt sich also nicht direkt in gleichermaßen höhere Performance umsetzen. Dies unterstreicht die Tatsache, dass die guten Leistungswerte der AMD64-Prozessoren hauptsächlich der geschickten HyperTransport-Architektur zu verdanken sind.

Update: unixbench

Trotz der guten Skalierung bei hohen Arbeitslasten treten aber in gewissen Bereichen durch die Verdoppelung der Prozessorenanzahl Overhead-Effekte auf. Sie zeigen sich um so deutlicher, je weniger man dem System zwischen den Kontextwechseln zu arbeiten gibt.

Bei willkürlichen Kontextwechseln, dem Aufruf einzelner Shells oder wenig parallelisierbaren Aufgaben wie Compiler-Läufen schneidet der Vier-Wege-Opteron nur wenig besser oder sogar minimal schlechter ab als der Dualprozessor-Rechner. Mit steigender Arbeitslast (mehrere parallele Shells) kann der Quartet dann seine Vorteile zunehmend ausspielen.

Bei den Leistungswerten zeigt sich kein signifikanter Unterschied zwischen dem Opteron 844 und dem 846. Beim gut 20 Prozent höher getakteten Opteron 848 dagegen schlägt sich die gut 20 Prozent höhere Taktung in geringfügig besseren Leistungen um.

Update: dbench

Aus der Feder des Samba-Entwicklers Andrew Tridgell stammt die dbench-Testsuite. Das Samba-Team benutzt sie, um das Lastverhalten des Filesystems im Allgemeinen sowie des Samba-Servers im Speziellen zu untersuchen. Für unseren Test lassen wir die Samba-spezifischen Teile der Suite außer Acht und verwenden lediglich dbench selbst. Mit gescripteten Anfragedaten aus einem echten netbench-Testlauf simuliert er den Zugriff vieler Clients auf das I/O-System. So kann man das Filesystem unter hohe Lasten setzen, ohne dazu Hunderte von Clients zu installieren.

Die Messwerte sind hier nicht direkt vergleichbar, da der Newisys lediglich mit 2 GByte Hauptspeicher bestückt war, während der Quartet mit 8 GByte operieren kann. Wesentlich interessanter als die nummerischen Werte ist hier ohnehin der Verlauf der Leistungskurve: Beim Dualprozessorsystem war relativ früh der Sättigungspunkt erreicht. Der Quartet dagegen kann bis zu 200 simulierte parallele User bedienen, bevor die Leistungskurve langsam abzuflachen beginnt. Auch der Opteron 846 bewältigt die extrem lastintensive Aufgabe nicht merklich schneller als der Opteron 844. Erst der gut 20 Prozent höher getaktete Opteron 848 zeigt - bei ansonsten grundsätzlich gleichem Verlauf der Leistungskurve - eine geringfügig bessere Performance (rund 7 Prozent).

Update: Fazit

Nachdem der Opteron bereits im Zwei-Wege-System Newisys 2100 seine Konkurrenzfähigkeit zu aktuellen Intel-Xeon-Produkten unter Beweis gestellt hat, demonstriert AMD jetzt mit dem Quartet-Server eindrucksvoll die exzellente Skalierbarkeit seiner 64-Bit-Plattform. Gleichzeitig zeigt das System auf, dass robuste und performante Server-Systeme für den Arbeitsgruppen- und Abteilungseinsatz nicht zwangsläufig ausschließlich Intels Domäne sein müssen. Dies erkennen inzwischen zunehmend auch OEMs und Distributoren.

Bislang offerierten hier zu Lande nur eine Handvoll mittlerer und kleiner Anbieter Opteron-basierte Server (Dämo, Delta Computer, FMS, ico, Kirtz, MikeRoHard, sysGen, transtec). Immerhin liefern zwei davon - Delta und MikeRoHard - auch bereits Vier-Wege-Maschinen. Seit Anfang 2004 halten sich aber auch die großen Anbieter nicht mehr vornehm zurück. Vorreiter IBM hat bereits Ende November 2003 offiziell den eServer e325 in Europa gelauncht - passenderweise an der "Wiege" des Opteron in AMDs Dresdner Fab30. Interessant an der Maschine ist vor allem das "e" vor der Modellnummer: Big Blue setzt so große Erwartungen in AMDs 64-Bit-Architektur, dass man in Armonk die Einführung einer fünften eServer-Linie beschlossen hat. Neben den x-, i-, p- und zSeries gibt es jetzt die eSeries auf Opteron-Basis - und die soll im kommenden Jahr kräftig ausgebaut werden.

Da mag die Konkurrenz nicht außen vor bleiben: Auch IBMs Erzrivale Sun hat sich bereits zum Opteron bekannt und unter dem Namen Sun Fire V20z ein leistungsfähiges Zwei-Wege-System vorgestellt, noch 2004 sollen möglicherweise Vier- und später auch Acht-Wege-Maschinen erscheinen. Hewlett-Packard offeriert Dual- und Quad-Opteron-Systeme für den Rack-Einsatz und will ab Herbst auch einen Opteron-basierten Blade-Server ausliefern. Last not least liebäugelt auch Dell, darf man AMD-Chef Hector de Ruiz glauben, schon mit AMDs 64-Bit-CPU als Server-Triebwerk. Davon gab sich de Ruiz zumindest auf dem einjährigen Produktjubiläum des Opteron überzeugt und mutmaßte, zum zweiten "Geburtstag" des Opteron im April 2005 würden wohl auch die Texaner zur Party kommen. (jlu)