Prozessortrends 2003

21.10.2002 von Christian Vilsbeck
Die CPU-Hersteller nutzen das Microprocessor Forum jährlich als Showbühne für ihre neuen Produkte und Designs. Diesmal standen Banias, Opteron und IBMs 64-Bit-Desktop-CPU im Rampenlicht.

Traditioneller Schauplatz des zum 15ten Mal ausgetragenen Microprocessor Forums ist das Fairmont Hotel, die erste Adresse in San Jose, mitten im Silicon Valley. Hier lassen es sich die Vice Presidents, Chief Technology Officers und Fellows der CPU-Firmen nicht nehmen, in meist viertelstündigen Vorträgen die Vorzüge ihrer Produkte anzupreisen. Das Publikum hört aufmerksam zu - kein Wunder bei 1698 US-Dollar Teilnahmegebühren für zwei Konferenztage.

Dabei haben einige der vorgestellten Prozessoren wirklich Beifall verdient - vor allem IBMs 64-Bit-CPU PowerPC 970 für Desktop-PCs. Ähnlich dem Hammer kann der Prozessor sowohl mit 64- als auch mit bestehender 32-Bit-Software arbeiten. Zu AMDs x86-64-Architektur gab es ebenfalls Neues: Fred Weber, Vice President und CTO von AMD, ließ mit Benchmarks vom Opteron aufhorchen. Außerdem gab er Details zur hohen Speicher-Performance von Multi-Opteron-Systemen bekannt.

Intel fehlt natürlich auch nicht. Mooly Eden, Chefentwickler des Banias, legte neue Details des Stromsparwunders offen. Und Intel-Fellow John Crawford gab einen Ausblick darauf, wie der Itanium im Jahr 2007 aussieht. VIAs neuer Nehemiah-Prozessor, den der Ober-Centaur Glenn Henry präsentierte, wird weniger mit dem Itanium konkurrieren, sondern wieder mit den Celerons. Lesen Sie auf den folgenden Seiten eine Zusammenfassung der wichtigsten Ereignisse des Microprocessor Forums 2002.

IBM PowerPC970

Der erste auf dem Microprocessor Forum vorgestellte 64-Bit-Prozessor für Desktop-PCs kam aber weder von AMD noch Intel. Mit dieser Nachricht begann das Microprocessor Forum, als IBM seinen PowerPC 970 vorstellte. Der RISC -Prozessor taktet mit 1,8 GHz und wird voraussichtlich Apples Weg in die 64-Bit-Welt ebnen. Eventuell will IBM aber auch eigene Linux-PCs mit dem PowerPC 970 ausrüsten. Im zweiten Halbjahr 2003 soll die Massenproduktion des Prozessors beginnen.

Die Basis des PowerPC 970 bildet die Power4-Architektur von IBM. Allerdings verwendet die Desktop-CPU keinen Dual-Core und verzichtet auf den L3-Cache. Aber auch so sind die Leistungsdaten des PowerPC 970 beeindruckend: Ein SPECint2000-Wert von 937 Punkten und eine Floating-Point-Performance von 1051 SPECfp2000-Punkten bringen selbst einen 1-GHz-Itanium 2 und Pentium 4 mit 2,8 GHz in Bedrängnis. Ausführliche Details zum PowerPC 970 finden Sie in dieser Meldung.

Fujitsu SPARC64 V

Selbst die zweite 64-Bit-Vorstellung auf dem Forum, Fujitsus SPARC64 V, hat zumindest bei den SPEC-Benchmarks alle Mühe mitzuhalten. Der für "Mission Critical Server" konzipierte neue SPARC-Prozessor erreicht eine Integer-Leistung von 847 und einen Fließkommawert von 1205 SPEC-Punkten. Wichtiger für sein Einsatzgebiet ist eine hohe Datenintegrität, die der SPARC64 V durch Mainframe-RAS-Technologie garantiert. So werden unter anderem die CPU-Register, die internen Datenbusse und die Ausführungseinheiten über eine Paritätsprüfung überwacht. Fujitsus SPARC64 V ist damit der erste Prozessor für UNIX-Umgebungen, der die Datenbusse überprüft.

Die Taktfrequenz der zur SPARC-V9-Architektur kompatiblen Fujitsu-CPU beträgt 1,35 GHz. Beeindruckender sind dagegen die großen Caches: je 128 KByte für Daten und Befehle sowie ein zwei MByte fassender L2-Cache. Ein 128 KByte großer Adressen-Cache für Sprungvorhersagen kann zusätzlich 16K Einträge speichern. Weitere Details zum SPARC64 V finden Sie hier.

Den SPARC64 V soll es bereits im Januar 2003 in Fujitsus eigenen PRIMEPOWER-UNIX-Servern der Serien 900, 1500 und 2500 geben.

AMD: Opteron-Performance

Der Launch des Hammer wird verschoben, den Athlon XP 2800+ gibt es erst im Januar 2003 in Stückzahlen zu kaufen, und soeben wurden deutliche Gewinneinbrüche gemeldet - mit positiven Schlagzeilen konnte AMD in letzter Zeit nicht aufwarten. Diese lieferte nun AMDs Vice President Fred Weber, als er auf dem Microprocessor Forum erstmals Benchmarks des Opteron präsentierte.

Ein mit 2,0 GHz getakteter Opteron liefert demnach bei der SPEC CPU2000 Benchmark Suite deutlich bessere Werte als die höher getakteten Pentium-4-Prozessoren. Bei gleicher Taktfrequenz von 2 GHz ist der Opteron bei Fließkommaberechnungen sogar 72 Prozent schneller. Die Benchmarks sind laut AMD unter Windows XP im 32-Bit-Mode durchgeführt worden. Im 64-Bit-Mode soll die Performance um weitere 20 Prozent steigen, fügte Weber hinzu. Weitere Details zu den Opteron-Benchmarks finden Sie in dieser Meldung.

Multi-Opteron: Speicher-Performance

Ausführlicher diskutierte AMD auf dem Microprocessor Forum die Speicher-Performance, die der Opteron in Multiprozessorsystemen liefert. Jeder Opteron verfügt mit seinen zwei DDR333-Speicherkanälen über eine lokale Speicherbandbreite von 5,3 GByte/s (1000er Basis). Sind zwei Opterons via HyperTransport miteinander verbunden, kann jede CPU auch auf den Speicher der benachbarten zugreifen. Diese von AMD als Xfire bezeichnete Speicherbandbreite beträgt zusätzlich 3,53 GByte/s. In einem Dual-Opteron-System steht jedem Prozessor somit eine Speicherbandbreite von 8,83 GByte/s zur Verfügung (lokal + XFire).

Gegenüber herkömmlichen Multiprozessorsystemen, bei denen die CPUs über einen Chipsatz miteinander verbunden sind und nur auf einen gemeinsamen Speicher Zugriff haben, sieht Fred Weber bei den Opterons einen deutlichen Performance-Vorteil. Durch die drei HyperTransport-Schnittstellen, die jeder Opteron bietet, können bis zu acht CPUs direkt miteinander verbunden werden - jeweils mit lokalem Speicher. Einen ausführlichen Artikel mit allen Details zu HyperTransport finden Sie hier.

Intel: Trend Multi-Core-CPUs

"Im Jahr 2007 werden wir Prozessoren mit 1000 Millionen Transistoren haben", verkündete Intel-Fellow John Crawford während seiner Keynote zum Microprocessor Forum. Crawford gab auch schon eine Vorstellung davon, wie dieser Prozessor aussehen wird.

Der 1000-Millionen-Transistor-Prozessor wird sich aus vier Itanium-2-Cores zusammensetzen und mit 6 GHz Taktfrequenz arbeiten. Jeder Core beherrscht zusätzlich Intels Hyper-Threading-Technologie. Die Fertigung des Quad-Core soll laut Crawford in einer 65-nm-Technologie erfolgen. Jeder aus jeweils 120 Millionen Transistoren aufgebaute Core greift dann auf einen gemeinsamen L2-Cache mit 12 bis 16 MByte Größe zu. Der Cache beansprucht mit 700 bis 950 Millionen Transistoren die größte Fläche auf dem Silizium.

Intel: Kleinere Strukturbreiten

Multi-Core-Prozessoren reduzieren laut Crawford die Komplexität künftiger CPU-Architekturen. Ein Core müsse nur mehrmals auf dem Die platziert werden, um die Performance des Prozessors erheblich zu steigern. Eine weitere einfache Methode seien größere Caches, die durch die immer kleiner werdenden Strukturbreiten leicht auf dem Die realisierbar seien. Einen Vorteil der Multi-Core-CPUs sieht Crawford auch in der Kühlung. Durch die Anordnung der Cores in verschiedene Bereiche des Die werden die "Hotspots" besser verteilt, die Wärmeabfuhr gestaltet sich einfacher.

Beim Itanium 2 steht für 2003 zunächst aber eine Vergrößerung des L3-Cache von 3 auf 6 MByte an. Die unterhalb des Itanium 2 angesiedelten Serverprozessoren Xeon MP gibt es 2002 noch mit einem über 1 MByte großen L3-Cache. Die für Dualprocessing ausgelegten Xeon DPs erhalten bis zum Jahresende noch den 533-MHz-FSB des Pentium 4.

VIA: Auf ein Neues

Glenn Henry zählt inzwischen zu den Stammgästen auf dem Microprocessor Forum. Seine von VIA aufgekaufte Prozessorschmiede Centaur Technology zeichnet unter anderem für die Entwicklung des Cyrix III und C3 verantwortlich.

Während Henry auf den letzten beiden Foren in den vergangenen Jahren noch die Frage stellte "wer eigentlich eine Gigahertz-CPU oder mehr benötige", präsentierte er diesmal selbst einen sogar mit 1,5-GHz getakteten Prozessor. Der Nehemiah soll Anfang 2003 VIAs C3-Serie ablösen.

Der Nehemiah nutzt einen C5XL-Core mit 16-stufiger Pipeline. Die wieder für den Socket 370 vorgesehene CPU verfügt über je 64 KByte große 4-Wege-L1-Caches für Daten und Befehle. Der L2-Cache wartet ebenfalls mit 64 KByte auf und ist 16fach assoziativ organisiert. Im Vergleich zum C5N-Core der aktuellen C3-Prozessoren hat sich damit nur die Organisation des L2-Cache geändert. VIA verabschiedet sich beim C5XL aber von AMDs 3DNow! und setzt auf Intels SSE-Befehlserweiterung. Gegenüber dem C5N-Core des C3-Prozessors verfügt der Nehemiah über eine schnellere Multipliziereinheit sowie viel Feintuning, wie es Glenn Henry während seiner Präsentation bezeichnete.

VIA: Nehemiah und die Zukunft

Der Nehemiah erreicht durch seine Architekturerweiterung eine bis zu 22 Prozent höhere Performance als ein C3 gleicher Taktfrequenz. Gegen einen Socket-370-Celeron muss sich der Nehemiah immer noch geschlagen geben - zumindest bei gleichem Takt. Weitere Details zu den von VIA präsentierten Benchmarks finden Sie hier.

Anfang 2003 soll es den Nehemiah zu kaufen geben, so Glenn Henrys Ausführungen zutreffen. Denn ebenso wie seine Auftritte beim Microprocessor Forum haben die Verspätungen Tradition, mit denen die angekündigten CPUs auf den Markt kommen. Bereits auf dem MPF2000 sprach Henry von einem C5X-Core mit SSE-Unterstützung. Dieser sollte Ende 2001 mit 1,2 GHz takten. Aktuell ist VIA aber bei einem 1,0-GHz-Prozessor mit C5N-Core - ohne SSE.

Ganztags arbeiten mit Banias

Im ersten Quartal 2003 sollen Notebooks mit Banias-Prozessoren auf den Markt kommen. Akkulaufzeiten von über acht Stunden sollten dann möglich sein, so Intel. Auf dem Microprocessor Forum präsentierte Banias-Erfinder Mooly Eden nun neue Details des Stromsparwunders. Während eines Gesprächs mit tecCHANNEL bestand Eden darauf, dass wir den Prozessor im Betrieb berühren. Der Banias-Prototyp wurde trotz abgenommenen Lüfters nur handwarm.

Um diese geringe Verlustleistung zu ermöglichen, hat Intel neue Architekturansätze entwickelt. So wird der 1 MByte große L2-Cache des Banias beispielsweise in 32 Segmente aufgeteilt. Eine analysierende Logik schaltet aktuell nicht benötigte Bereiche stromsparend ab. Ähnlich ergeht es dem Prozessorbus, der nur bei Bedarf mit Strom versorgt wird. Aber auch eine optimierte Befehlsausführung hilft dem Banias beim Stromsparen: Falsche Sprungvorhersagen kosten nicht nur Performance, gleichzeitig steigt durch die Befehlswiederholung die Stromaufnahme der CPU. Die Branch Prediction des Banias soll falsche Vorhersagen um 20 Prozent reduzieren und die Performance gleichzeitig um fünf Prozent steigern.

Banias: Architektur

Neu beim Banias ist auch die MicroOp-Fusion-Technologie, mit der die Instruktionen während des Programmablaufs analysiert werden. Lassen sich mehrere Operationen zusammenfassen, verschmelzen sie zu einem Befehl. Erst für die Bearbeitung in den parallelen Ausführungseinheiten werden die gebündelten Befehle wieder in die einzelnen MicroOps aufgetrennt. Effekt: Der Verwaltungsaufwand in den Schedulern und somit deren Energiebedarf sinkt.

Der Banias kommt zur Markteinführung mit 1,3 bis 1,6 GHz Taktfrequenz. Laut Insider-Informationen soll er bei einem Takt von 1,5 GHz die Performance eines Pentium 4 mit 2,0 GHz erreichen. Sollte die CPU trotz niedriger Taktfrequenz tatsächlich schneller sein als der mobile Pentium 4, so steht Intel vor einem Marketing-Problem. Wie soll man erklären, dass weniger Taktfrequenz auch weniger Performance bedeutet. Gegen AMDs Model-Number beim Athlon XP hat Intel ja eindeutig Stellung bezogen.

Detaillierte Informationen über die Architektur des Banias und dessen Plattform können Sie in diesem Report nachlesen.

Fazit

Zweifelsohne wird 2003 ein spannendes Prozessorjahr: AMDs Hammer soll es nach diversen Verzögerungen im März wohl endlich zu kaufen geben. Die auf dem Microprocessor Forum präsentierten Leistungsdaten lassen jedenfalls einiges erwarten. Sputen sollte sich AMD trotzdem, denn Intels Pentium 4 wird bis dahin mit weit über drei GHz Taktfrequenz und mit Hyper-Threading arbeiten - und Mitte 2003 folgt bereits dessen Nachfolger Prescott.

Im Mobile-Bereich warten nun alle auf den Banias. Der Prozessor lässt viel erhoffen: Performance eines höher getakteten Pentium 4 bei deutlich geringerem Stromverbrauch. Ob dies allein genügt, die deklarierten acht Stunden Akkulaufzeit zu ermöglichen, bleibt abzuwarten. Nicht von ungefähr hat Intel die "Batterie Life Initiative" ins Leben gerufen.

Für Apple-Fans wird dagegen IBMs 64-Bit-Prozessor PowerPC 970 spannend. Der 1,8-GHz-Desktop-Prozessor beherrscht ähnlich AMDs x86-64-Architektur einen nativen 32-Bit-Modus. Statements von Apple, damit den Schritt in die 64-Bit-Welt zu wagen, stehen noch aus. Wie Peter Glaskowsky, Principal Analyst des Microprocessor-Forum-Veranstalters MDR und Chefredakteur des Microprocessor Reports jedoch sagte, wäre Apple verrückt, ihn nicht zu verwenden.

Und VIAs Nehemiah-Prozessor? Warten wir erst einmal ab, ob er Anfang 2003 wirklich erscheint. (cvi)