FPF: PWRficient Multi-Core-CPU mit Virtualisierung

26.10.2005
Das Start-Up-Unternehmen P.A. Semi stellt auf dem Fall Processor Forum seine PWRficient-Architektur vor. Die CPUs basieren auf der POWER-Architektur und arbeiten mit bis zu acht Cores bei Taktfrequenzen bis 2,5 GHz.

Das Start-Up-Unternehmen P.A. Semi arbeitete seit zwei Jahren unter Geheimhaltung an der „Power-Efficient Scalable Processor Family“. Die im kalifornischen Palo Alto ansässige Firma wird von Dan Dobberpuhl geleitet, einem Ex-Alpha-Designer und Entwickler des StrongARM-Core. Weitere Schlüsselpositionen bei P.A. Semi sind von Ingenieuren besetzt, die bei der Entwicklung des Opteron, Itanium und UltraSPARC beteiligt waren.

Die auf dem Fall Processor Forum erstmals präsentierte PWRficient-Architektur basiert auf der POWER-Architektur von IBM. P.A. Semi hat von IBM eine entsprechende Lizenz erworben. Die PWRficient-Prozessoren mit dem als PA6T bezeichneten Core arbeiten sowohl im 32- als auch 64-Bit-Modus. Ihren Einsatz sollen die PWRficient-CPUs in High-Performance-Computern, Consumer-Elektronik sowie Netzwerk- und Telekommunikations-Devices finden.

Details zum PowerPC-Core

Das erste Modell aus der PWRficient-Familie ist der auf dem Prozessorforum vorgestellte PA6T-1682M. P.A. Semi integriert in der CPU zwei PA6T-Prozessorkerne, die mit einer Taktfrequenz von 2,0 GHz arbeiten.

Die Cores sind superskalar ausgelegt und arbeiten nach dem Out-of-Order-Verfahren. Dabei verarbeitet der Kern drei Instruktionen gleichzeitig. Der PA6T-Core ist mit der PowerPC-Architektur-Spezifikation 2.04 kompatibel.

P.A. Semi spendiert dem PA6T-Core für Fließkommaberechnungen eine Floating-Point- sowie eine SIMD-Vector-Unit VMX. Ein 64 Einträge fassender Scheduler verteilt die zu bearbeitenden Instruktionen an die Execution-Units. Insgesamt besitzt die Pipeline des PA6T-Cores eine Tiefe von 16 Stufen. Das Frontend der Pipeline benötigt dabei 9 Stufen, das Load-/Store-Processing sowie die Bearbeitung in den Ausführungseinheiten wird in weiteren sieben Schritten erledigt.

Hohe Integration – niedriger Energieverbrauch

Zum Puffern stehen jedem PA6T-Kern je 64 KByte L1-Cache für Befehle und Daten zur Verfügung. Den L2-Cache dimensioniert P.A. Semi beim Dual-Core-Modell PA6T-1682M auf 2 MByte. Beide Cores müssen sich die zweite Pufferstufe teilen. Die Kommunikation zwischen den Kernen übernimmt der als CONEXIUM bezeichnete kohärente Crossbar. Der Shared-L2-Cache ist ebenfalls über CONEXIUM mit den Prozessorkernen verbunden.

Der hoch integrierte PA6T-1682M besitzt zwei 64-Bit-Speicher-Controller für DDR2-533-SDRAM. Die Controller sind wie die Cores und der L2-Cache an die CONEXIUM-Crossbar angeflanscht. An die Crossbar bindet P.A. Semi das im Prozessor integrierte I/O-Subsystem ENVOI an. ENVOI kombiniert Controller für PCI-Express, Gigabit- sowie 10-Gbit-Ethernet. Beim PA6T-1682M verbaut P.A. Semi acht PCI-Express-Engines mit Unterstützung von 1, 2, 4, 8 und 16 Lanes. Für Netzwerkanbindungen stehen bei diesem Modell vier Gigabit-Ports sowie zwei 10-Gbit-Ethernet-Anschlüsse parat.

Um der zunehmenden Bedeutung virtualisierter Plattformen Rechnung zu tragen, integriert P.A. Semi bei seinen PWRficient-Prozessoren eine CPU-Virtualisierung auf Hardware-Basis. Damit bietet P.A. Semi eine ähnliche Funktionalität wie Intels Vanderpool oder AMDs Pacifica.

Die auf dem Prozessorforum präsentierte PWRficient-CPU PA6T-1682M soll sich laut P.A. Semi mit fünf Watt beim Einsatz in Mobilen Geräten im typischen Betrieb begnügen. In High-Performance-Anwendungen gibt der Hersteller 13 Watt an. Befindet sich der 1682M im Stromspar-Modus, sinkt die typische Energieaufnahme auf 1 Watt. Der PWRficient-Prozessor kann die Taktfrequenz dabei dynamisch an die benötigte Rechenleistung anpassen. Die PWRficient-CPUs benötigen nach Angaben von P.A. Semi nur ein Zehntel der Energie von vergleichbaren Mikroprozessor-Plattformen.

Bis zu 8 Cores und 8 MByte L2-Cache

Die skalierbare PWRficient-Architektur erlaubt Prozessor-Modelle mit bis zu acht Kernen. Der L2-Cache lässt sich laut P.A. Semi auf maximal 8 MByte erweitern. Beim Speicher-Controller erlaubt PWRficient bis zu vier Channels für DDR2-SDRAM.

Neben dem Dual-Core-Modell PA6T-1682M wird der PA6T-1361E zu den ersten PWRficient-Prozessoren zählen. Der 1361E besitzt nur einen 1,5-GHz-PA6T-Core und muss sich mit einer L2-Cache-Größe von 1 MByte begnügen – der durch das Single-Core-Design dem Kern allerdings exklusiv zur Verfügung steht. Gespart wird bei dem „Einsteigermodell“ auch bei der Speicheranbindung, es gibt nur einen DDR2-Controller. Vier statt acht PCI-Express-Engines und kein 10-Gbit-Ethernet sind weitere Unterscheidungsmerkmale zum Modell PA6T-1682M.

P.A. Semi teilt seine Prozessoren in drei Sockel-Klassen ein, abhängig von der Anzahl der Speicher-Controller sowie den integrierten I/O-Schnittstellen. In jeder Sockel-Klasse gibt es PWRficient-CPUs mit unterschiedlicher Performance – durch die Anzahl der Cores sowie der L2-Cache-Größe. Die drei Sockel-Klassen bezeichnet P.A. Semi mit Socket E (Entry), Socket M (Mid-Range) und Socket P (Performance). Der PA6T-1682M ist durch seine Modellendung „M“ für den Socket M vorgesehen.

Performance & Verfügbarkeit

Nach Angaben von Jim Keller, Vice President Engineering bei P.A. Semi, erreicht ein PA6T-Core mit 2,0 GHz Taktfrequenz eine Integer-Performance von über 1000 Punkten beim SPECint_base2000-Benchmark. Die Floating-Point-Performance gibt Keller mit über 2000 Punkten bei SPECfp_base2000 an. Der SPEC-CPU2000-Benchmark arbeitet single-threaded und nutzt einen zweiten Core nicht aus. Welche CPU2000-Werte Intels und AMDs Prozessoren erreichen, können Sie bei tecCHANNEL beispielsweise im Artikel Einsteiger-Dual-Core im Test: Athlon 64 X2 3800+ nachlesen.

Mit acht PA6T-Cores erreicht der PWRficient-Prozessor eine Rechenleistung von 32 GFlops bei doppelter Präzision. Bei einfacher Genauigkeit sind laut P.A. Semi 128 GFlops möglich. Die acht Kerne sollen dabei insgesamt nur zirka 50 Watt benötigen.

P.A. Semi vergleicht den PWRficient zusätzlich noch mit Intels im ersten Quartal 2006 debütierenden Low-Power-Xeon „Sossaman“. Ein Server-Blade-Element mit 2,0-GHz-PWRficient-CPU begnügt sich mit maximal 25 Watt (ohne Speicher). Mit einem 2,5-GHz-Sossama sind bis zu 73 Watt notwendig. Beim Intel-Blade-Element ist noch ein Chipsatz für I/O und Speicher notwendig – dies ist bei der PWRficient-CPU bereits integriet.

Erste Samples des Dual-Core-Prozessors PA6T-1682M soll es laut P.A. Semi im dritten Quartal 2006 geben. Das PWRficient-Design eignet sich nach Angaben der Entwickler für Taktfrequenzen bis 2,5 GHz und für bis zu acht Prozessorkerne. Ende 2007 steht dabei eine Quad-Core-Variante und noch 2008 ein Prozessor mit acht Kernen auf der Roadmap.

Die Fertigung der PWRficient-Prozessoren ist für einen 65-nm-Prozess vorgesehen. In welcher Fab die Fertigung erfolgen soll, gab P.A. Semi auf dem Fall Processor Forum noch nicht bekannt. (cvi)

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler