Was bringt AGP 4x/Pro?

04.12.2000 von Michael Eckert und Bernhard Haluschak
Grafikkartenhersteller versprechen dem Kunden durch AGP 4x deutlich mehr Geschwindigkeit. Wir haben getestet, was AGP 4x und die Pro-Erweiterung in der Praxis wirklich bringen.

Bereits im Mai 1998 verabschiedete Intel die AGP 4x-Interface-Spezifikation. Das Rezept ist einfach: Man nehme AGP 1x, übertrage die Daten mit jeder Taktflanke - und schon ist das theoretisch doppelt so schnelle AGP 2x fertig. Und was einmal funktionierte, geht auch noch ein zweites Mal. Nur hat man diesmal die Taktfrequenz auf den entsprechenden Leitungen verdoppelt.

Doch so einfach und narrensicher wie es scheint ist es offensichtlich nicht. So haben nicht nur Grafikkarten- sondern auch die Mainboardhersteller immer noch ihre Probleme mit dem neuen Grafiktransfermodus. Und der fabulöse Marketinggag mit der doppelten Geschwindigkeit zerplatzte schon bei AGP 2x in der Praxis wie eine Seifenblase.

Die Gründe für den ausgebliebenen Performance-Sprung sind bekannt. Das Konzept funktioniert nur bei Grafikkarten mit kleinem lokalem Speicher und 3D-Spielen mit riesigen Texturen. Erst wenn die Grafikkarte ständig und in großer Menge Informationen aus dem Arbeitsspeicher des PC anfordert, macht sich der schnellere Bus bemerkbar. Da aktuelle Grafikkarten aber mit 32 MByte Speicher ausgestattet sind, kommt der schnelle Bus nur selten zum Tragen.

Die zunehmende Komplexität der Grafikchips und die hohen Taktraten haben die Stromaufnahme der Karten so weit nach oben getrieben, dass der herkömmliche AGP-Port ihn nur noch mit Mühe decken kann. So entschloss sich Intel schon im April 1999 die Spezifikation zu erweitern. Es entstand das neue AGP-Pro-Interface.

Welche Vorteile AGP-4x und AGP-Pro in der Praxis bringen, lesen Sie detailliert auf den nächsten Seiten.

AGP in der Theorie

Bereits zu AGP 2x gab es viele Falschmeldungen. Die größte Verwirrung verursachte dabei die Marketingmeldung, dass die Karten mit der doppelten Taktfrequenz arbeiten würden. Tatsächlich änderte sich an der Taktfrequenz von 66 MHz gegenüber AGP 1x nichts. Das trifft auch für AGP 4x zu. An der Taktleitung CLK des AGP-Ports werden nach wie vor 66 MHz gemessen.

Das folgende Bild zeigt die Zusammenhänge des AGP-Timings. Der AGP-1x-Modus arbeitet prinzipiell wie PCI und läuft in der Outer Loop ab. Alle Timings beziehen sich auf einen einzigen AGP-Takt CLK, der mit 66 MHz arbeitet.

Die Transfermodi 2x und 4x nutzen zum eigentlichen Datentransfer die Inner Loop. Die Übertragung wird hierbei über Strobe-Signale gesteuert, die der Transmitter erzeugt (Source Synchronous). Sowohl der Transmitter als auch der Receiver sind über Latches gepuffert. Diese Flip-Flops sorgen dafür, dass die Daten und die Strobe-Signale exakt zur gleichen Zeit anliegen. Die Strobes fungieren dabei als Handshake-Leitungen, mit denen der Datentransfer zwischen Transmitter und Receiver synchronisiert wird. Der Transmitter aktiviert sie nur, wenn ein Transfer im AGP-2x- oder 4x-Modus ansteht. Das Bild unten verdeutlicht, dass die Strobe-Signale nicht als Taktleitung zu verstehen sind. Nur zu Begin eines Transfers sind bestimmte Strobe-Leitungen AD_STBx aktiviert.

Grundsätzlich ist auch in den 2x- und 4x-Modi noch die bidirektionale Outer Loop zum Austausch von Kontrollinformationen zwischen Transmitter und Receiver im Einsatz.

AGP 1x im Detail

Die Gültigkeit der Kontroll- und Datensignale im AGP-1x-Modus erfolgt ausschließlich über die positive Flanke des CLK-Signals. Dabei hat nach der AGP-2.0-Spezifikation das CLK-Timing eine Periodendauer von 15 ns, das entspricht einer Taktfrequenz von 66,67 MHz.

Vom Prinzip her ist das mit einer normalen PCI-Datenübertragung gleichzusetzen, auch werden die identischen Signalleitungen benutzt. Pro CLK-Takt kann AGP 1x vier Bytes übertragen - umgerechnet 254,3 MByte/s.

Das Timingdiagramm zeigt einen typischen Signalverlauf im AGP-1x-Modus. Es ist deutlich zu erkennen, dass nur die CLK-Leitung aktiv ist. Die gemessene Periodendauer beträgt 15 ns, das sind 66,67 MHz. Auf alle anderen Adress-Strobe- und Sideband-Strobe-Leitungen erfolgt kein Signalwechsel. Die Leitung AD_STB0, AD_STB1 und deren komplementäre Signale AD_STB0#, AD_STB1# werden für diesen Transfermodus nicht benötigt. Für das korrekte Sideband Addressing im 1x-Mode sind die SB_STB und SB_STB# inaktiv. Die Datenübernahme erfolgt ebenfalls wie bei APG 1x mit der positiven Flanke des CLK-Signals.

AGP 2x im Detail

Bei AGP 2x kommen zusätzlich zum CLK-Signal noch die Adress-Strobe-Signale AD_STB0 und AD_STB1 zum Einsatz. Diese Kontrollsignale werden aus dem CLK-Signal generiert und arbeiten ebenfalls mit einer Taktfrequenz von 66,67 MHz.

Im Gegensatz zu AGP 1x erfolgt die Datenübernahme nicht durch die positive Flanke des CLK-Signals, sondern durch die negative und positive Flanke der AD_STBx-Signale. Dadurch ergibt sich ein effektiver Wert von 133,34 MHz. Pro CLK-Takt kann der AGP-2-Modus auf diese Weise acht Bytes übertragen. Das entspricht einer Transferrate von 508,6 MByte/s.

Ein typisches Timingverhalten im AGP-2x-Modus zeigt das Bild oben. Die beiden Adress-Strobe Signale AD_STB0 und AD_STB1 arbeiten synchron mit einer Periodendauer von 15 ns, das entspricht einer Frequenz von 66,67 MHz. Die beiden komplementären Leitungen AD_STB0# und AD-STB1# sind zwar ebenfalls aktiv, haben im AGP-2x-Modus jedoch keine Bedeutung. Das Sideband Addressing verwendet im 2x-Modus nur die SB_STB-Leitung. Das Signal dieser Leitung arbeitet in diesem Modus mit einer Periodendauer von 15 ns, wobei beide Taktflanken die Datenübernahme einleiten.

AGP 4x im Detail

Im AGP-4x-Modus hat man noch die komplementären Adress-Strobe-Signale AD_STB0# und AD_STB1# hinzugefügt. Sie bilden mit den Standard-Strobe-Signalen differentielle Leitungspaare und werden wie bei AGP2x aus dem CLK-Signal generiert. Einzige Ausnahme: Alle vier Adress-Strobes arbeiten in diesem Modus tatsächlich mit einer Frequenz von 133,34 MHz.

Die Datenübernahme erfolgt jeweils mit der fallenden Flanke der AD_STBx- und der komplementären AD_STBx#-Signale. Durch diesen Trick ergibt sich ein effektiver Wert von 266,67 MHz. Es können somit sechzehn Bytes pro CLK-Takt übertragen werden. Umgerechnet kommt man auf einen Datendurchsatz von 1017,3 MByte/s.

Im Timingdiagramm ist ein AGP-4x-Modus dargestellt. Alle Adress-Strobe-Signale haben eine Periodendauer von 7,5 ns, das entspricht 133,34 MHz. Der AGP-Takt auf der CLK-Leitung bleibt unverädert bei 15 ns, umgerechnet 66,67 MHz. Der AGP-4x-Modus erfordert, dass alle Adressleitungen wie AD_STB0, AD_STB0#, AD_STB1 und AD_STB1# aktiv sind und Signalwechsel zeigen.

Auch die beiden Leitungen SB_STB und SB_STB# arbeiten beim 4x-Sideband Addressing mit doppelter CLK-Frequenz. Wie beim AGP-4x-Modus sorgt die positive Flanke des jeweiligen SB_STB-Signals für die Datenübernahme.

Das bringt AGP 4x: 3D-Spiele

Auf der Suche nach der großen Performance-Steigerung durch AGP 4x wird man zur Zeit kaum fündig. Weder Anwendungs-Benchmarks wie SYSmark2000 noch Spiele/Demos wie Unreal oder Re-Volt profitieren von der neuen Technik. Selbst mit 1280 x 1024 Punkten und 32 Bit Farbtiefe kommen nicht genug Texturen zusammen, damit große Datenmengen in den Arbeitsspeicher ausgelagert werden müssten. Mit mittlerweile 32 MByte lokalem Speicher bieten die aktuellen 4x-Grafikkarten ein dickes Polster für die Zukunft. Selbst mit 1600 x 1200 Punkten konnten wir bei der Quake-III-Arena-Demo noch keinen Performance-Unterschied ermitteln.

Die folgenden Diagramme zeigen die Frameraten der Spiele Expendable und Quake III Arena in Abhängigkeit vom AGP-Modus. Um praxisnah zu testen, haben wir eine Auflösung von 1024x768 Punkten und 32-Bit Farbtiefe gewählt. Zusätzlich vergleichen wir zwei unterschiedliche Chipsätze VIA Apollo Pro und Intel i815 auf ihre AGP-4x-Fähigkeiten.

Das bringt AGP 4x: 3DMark2000

Vom 3DMark2000 der Firma MadOnion erwarteten wir deutlichere Unterschiede. Dieses Programm ist in Punkto 3D-Grafik-Benchmarks sehr anspruchsvoll. Besonderes Augenmerk richten wir dabei auf den praxisnahen Teil mit komplexen Spielesequenzen. Um auch große Datenmengen zu erzeugen und den Arbeitsspeicher zu belasten wählten wir zum Vergleich zwei Auflösungen: 1024x768 Punkte mit 32-Bit Farbtiefe und 1280x1024 Punkte mit 32-Bit Farbtiefe. Dies sollte trotz des 32 MByte großen Speichers der Grafikkarte ausreichen, um einen Leistungsunterschied der verschiedenen AGP-Modi zu sehen.

Zum Einsatz kommen wieder die Chipsätze VIA Apollo Pro und Intel i815. So können wir offensichtliche Unterschiede bei der Nutzung der AGP-Übertragung sofort feststellen.

Das bringt AGP 4x: 3DMark2000-Texturen

Vorteile durch das schnellere 4x- AGP-Interface ergeben sich nur, wenn viele Daten aus dem Arbeitsspeicher in die Grafikkarte übertragen werden. Unter praxisnahen Spielebedingungen haben wir nur eine geringe Beschleunigung messen können.

Ein weniger praxisnaher Teil der 3DMark2000 Benchmark-Suite bestimmt die Leistung des AGP-Ports beim Transfer von Texturen. Deren Größe kann zwischen 8 und 64 MByte gewählt werden.

Da unser Intel-Referenzboard mit dem i815-Chipsatz im BIOS nur eine maximale Aperture-Size von 64 MByte zulässt, läuft 3DMark2000 darauf nicht mit 64-MByte-Texturen. Zusätzlich zu den zwei bereits verwendeten Chipsätzen haben wir noch den VIA KX133-Chipsatz für die Beurteilung der AGP-Modi eingesetzt.

AGP 4x Unterstützung in der Praxis

Hohe Performancesteigerungen versprechen Grafikkartenhersteller durch die Features AGP 4x und Sideband Addressing. Doch unser Test zeigt deutlich, das dieses Versprechen rein theoretischer Natur ist. Denn in der Praxis bringt AGP 4x mangels fehlender Anwendungen nichts.

Obwohl der AGP-Standard mit dem 4x-Transfermodus mittlerweile zwei Jahre alt ist, haben offensichtlich Chipsatz- und Grafikkartenhersteller immer noch gravierende Probleme damit. Wie sonst ist es zu erklären, dass VIA in den AGP-Treiberversionen 4.02 und aktuell 4.03 im Standard-Modus die Transferrate auf 1x drosselt und das Sideband Addressing deaktiviert. Im VIA-AGP-Treiber 4.00 waren es noch 4x mit SBA-Unterstützung. Der VIA-Turbo-Mode arbeitet wie gewohnt mit AGP 4x und SBA.

Doch auch die Grafikkartenhersteller scheinen ihre liebe Mühe mit AGP 4x und Sideband Addressing zu haben. Beispielsweise NVIDIA: Für ihren GeForce 2 GTS Grafikchip bietet sie Referenztreiber ohne SBA-Unterstützung an. Dies ermittelten wir mit einem Logic Analyzer und Softwaretools. Hier scheint NVIDIA ein Feature für die Laufstabilität der Grafikkarten geopfert zu haben.

In der folgenden Tabelle finden sie eine Auflistung einiger Referenztreiber von NVIDIA und deren AGP- und SBA-Unterstützung:

GeForce 256

GeForce 2 GTS

NVIDIA 3.68

AGP 4x mit SBA

--

NVIDIA 3.72

AGP 4x mit SBA

--

NVIDIA 3.79

AGP 4x mit SBA

--

NVIDIA 3.84

AGP 4x mit SBA

--

NVIDIA 5.08

AGP 4x mit SBA

--

NVIDIA 5.13

AGP 4x mit SBA

AGP 4x ohne SBA

NVIDIA 5.16

AGP 4x mit SBA

AGP 4x ohne SBA

NVIDIA 5.22

AGP 4x mit SBA

AGP 4x ohne SBA

NVIDIA 5.30

AGP 4x mit SBA

AGP 4x ohne SBA

Die GeForce 2 GTS unterstützt mit keinem der aufgeführten Referenztreiber das Sideband Addressing.

AGP Pro in der Theorie

Die Spezifikation für das AGP-Pro-Interface ist eine Erweiterung des herkömmlichen AGP-Interface. Sie wurde primär für den Workstation-Bereich entwickelt und stellt zusätzliche Stromleitungen für besonders leistungshungrige Grafikkarten zur Verfügung. Im Einzelnen sind das 12 Pins für Vcc12V mit einer maximalen Stromstärke von 9,2 A, 10 Pins für Vcc3,3V mit maximal 7,6 A, 18 Pins GND (Masse), 2 Pins für Steuerleitungen PRSNT# und 6 Pins für zukünftige Erweiterungen.

Nach der AGP-Spezifikation hat die Standard-AGP-Grafikkarte eine maximale Leistungsaufnahme von 25 Watt. Mit AGP Pro hat man zwei weitere Grafikkartentypen definiert. Das sind zum einen die AGP Pro50 Karte mit einer Leistungsaufnahme von 25 bis 50 Watt und zum anderen eine AGP Pro110 Karte mit einer Leistungsaufnahme von 50 bis 110 Watt. Zwei Steuerleitungen legen dabei den entsprechenden Kartentyp fest. Die folgende Tabelle zeigt die Bedeutung der Steuerleitungen:

PRSNT1#

PRSNT2#

AGP Pro Slot Konfiguration

1.

Offen

Offen

kein AGP Pro Board vorhanden

2.

Masse (GND)

Offen

50 W AGP Pro Board vorhanden

3.

Masse (GND)

Masse (GND)

110 W AGP Pro Board vorhanden

4.

Offen

Masse (GND)

Reserviert

Die maximale Leistung, die aus einer Kombination von AGP-Pro- und zusätzlichen PCI-Slots entnommen werden darf, ist auf 110 Watt begrenzt. Die untere Tabelle zeigt, welche Kombinationen möglich sind:

Unterstützte Kombinationen

AGP-Stecker (max. Last)

AGP-Pro-Stecker (max. Last)

PCI Slot1 (max. Last)

PCI Slot2 (max. Last)

Gesamtlast

1.

0 W

110 W / 12 V

0

0 W

110 W

2.

25 W

85 W / 12 V

0

0 W

110 W

3.

25 W

25 W / 3,3 V; 10 W / 12 V

25 W

25 W

110 W

4.

25 W

25 W / 3,3 V; 35 W / 12 V

25 W

0 W

110 W

Nicht unterstützte Kombinationen

AGP-Stecker (max. Last)

AGP-Pro-Stecker (max. Last)

PCI Slot1 (max. Last)

PCI Slot2 (max. Last)

Gesamtlast

1.

25 W

25 W / 3,3 V; 20 W / 12 V

25 W

25 W

120 W

2.

25 W

25 W / 3,3 V; 110 W / 12 V

25 W

25 W

210 W

Selbstverständlich sind auch andere Kombinationen zulässig. Diese dürfen die 110-Watt-Grenze nicht überschreiten.

Das bringt AGP Pro in der Praxis

Kaum hat Intel im April 1999 die AGP-Pro-Spezifikation verabschiedet, sind auch schon die ersten Mainbosrds und Grafikkarten mit dem neuen AGP-Slot auf dem Markt. In der Praxis bringt dieser neue Slot keinen Performancegewinn, da er nur mit zusätzlichen Stromleitungen für die 3,3 V und 12 V Spannungen erweitert wurde.

Den herkömmlichen AGP-Slot gibt es je nach Bedarf in drei verschiedenen Versionen: AGP 3,3 V, AGP 1,5 V und AGP Universal. Durch die AGP-Pro-Erweiterung sind zusätzliche drei Varianten dazugekommen. Das sind AGP Pro 3,3 V, AGP Pro 1,5 V und AGP Pro Universal.

Der AGP-Pro-Slot ermöglicht es, Grafikkarten mit sehr hohem Leistungsverbrauch in Systemen zu verbauen. Das sind insbesondere Spezialkarten für den Workstation-Bereich. Dabei muss das Mainboard, wie auch die Grafikkarte, mit der AGP-Pro-Erweiterung ausgestattet sein. Selbstverständlich kann man in ein Mainboard mit AGP-Pro-Slot eine Grafikkarte mit herkömmlichen AGP-Stecker einsetzen. Das ist aber wegen des Aufpreises für den AGP-Pro-Slot nicht sinnvoll.

Heutige Grafikkarten für den Massenmarkt sind leistungsmäßig so ausgelegt, dass sie im Standard-AGP-Slot einwandfrei funktionieren. AGP Pro hat zur Zeit nur einen eingeschränkten Anwendungsbereich.

Fazit

Im Moment benötigen Sie AGP 4x definitiv nicht. Anwendungen, die von der höheren Bandbreite profitieren könnten, sind so schnell nicht zu erwarten. Selbst wenn sich vereinzelte Spiele einfinden, brauchen Sie auch noch einen schnellen Arbeitsspeicher wie PC133 oder Rambus. Dieser verhindert einen Engpass bei gleichzeitigen CPU- und Grafikzugriffen.

Bei Standardprogrammen unter Windows, wie sie bei SYSmark2000 zum Einsatz kommen, bringen AGP 2x und 4x keine Performance-Steigerung. Unsere Messungen mit dem Logic Analyzer TLA704 von Tektronix zeigen, dass die Grafikkarten erst dann in den schnelleren AGP-Modus wechseln, wenn ein D3D-Spiel gestartet wird. Während des normalen Betriebs unter Windows herrscht Ruhe auf den relevanten Leitungen des AGP-Slots. Die theoretisch 1017 MByte/s große Bandbreite von AGP 4x liegt also fürs erste genauso brach wie die 508 MByte/s von AGP 2x.

Der AGP-Pro-Slot erweitert den herkömmlichen AGP-Slot nur um einige Stromversorgungsleitungen. Er bringt in punkto Performance keinen Gewinn und ist vorerst nur für Speziallösungen in Workstations sinnvoll einsetzbar. (hal)

Testkonfiguration

Die Tests haben wir hauptsächlich mit der Elsa Erazor X durchgeführt. Sie ist mit einem GeForce 256 Grafikprozessor und 32 MByte SDRAM-Speicher ausgestattet. Zur Kontrolle kamen weiterhin eine Creative LabsGeForce 256 Annihilator, Guillemot 3D Prophet, Matrox Millennium G400 Max und Elsa Erazor III Pro zum Einsatz.

Die Diagramme zeigen Ergebnisse, die wir mit dem Benchmark 3DMark2000 von MadOnion ermittelten. Die Benchmarks liefen mit einer Auflösung von 1024x768 und 1280x1024 Punkten mit je 32 Bit Farbtiefe und Triple Frame Buffer. Die V-Synchronisation ist dabei abgeschaltet.

Darüber hinaus verwenden wir aktuelle Spielebenchmarks mit Frameratenzähler. Dazu gehören Quake III Arena, Unreal Tournament, Re-Volt und Expendable. Selbstverständlich testeten wir auch mit praxisnahen Anwender-Benchmarks wie Indy3D-Simulation und -Animation. Nähere Angaben und Benchmarkeinstellungen zu diesen Programmen finden Sie in unserem tecLab-Report - unsere Testverfahren für 3D-Grafikkartentests.

Bitte beachten Sie, dass wir alle angegebenen Transferraten korrekt in MByte/s (1024 x 1024 Byte) angeben. In den Spezifikationen und in Werbematerial zu AGP werden oft höhere Werte in MB/s angegeben, die auf 1000er Basis berechnet sind.

Eine detaillierte Auflistung der Hardwarekomponenten finden Sie nachfolgend:

Komponente

Daten

Mainboard 1

Tyan Trinity 400 S1854

Serien-Nr.

TY9975315044

Firmware

Rev. 1.07 / 17.04.2000

Sonstiges

VIA Apollo Pro, Slot 1, PGA370, Rev: C

Mainboard 2

Intel Referenzboard

Serien-Nr.

S26361-D1184 B11 GS 51

Firmware

Rev. 1.00A / 31.05.2000

Sonstiges

Intel i815, PGA370

Mainboard 3

EPOX 7KXA

Serien-Nr.

0003306890

Firmware

22.05.2000

Sonstiges

Slot A, VIA KX133, Rev: 0.4

Prozessor 1

Pentium III 933

Serien-Nr.

L010A519-0174 QS82ES

Firmware

--

Sonstiges

PGA370

Prozessor 2

AMD Athlon 750

Serien-Nr.

219947066152

Firmware

--

Sonstiges

Slot A

RAM

Wichmann WorkX 265 MByte PC133

Serien-Nr.

--

Firmware

--

Sonstiges

1 x 256 MByte Modul

Grafikkarte

Elsa Erazor X -A32

Grafikchip

GeForce 256

Grafikspeicher

32 MByte SDRAM

BIOS

7.06.00

Treiber

V4.12.01.0112-0010 (NVIDIA 3.69)

Platine

4199

Soundkarte

Diamond Sonic Impact S90

Soundchip

Vortex AU8820B2

Schnittstelle

PCI 5V

Treiber

2.01.06

Platine

Revision A

Netzwerkkarte

3Com Fast Etherlink XL PCI

Typ

10/100Base Fast Ethernet

Chip

3Com 40-0483-004

Schnittstelle

PCI 5V

Treiber

3.41.50.00

Platine

Revision A

Festplatte

IBM Deskstar DJNA 351520

Kapazität

15,2 GByte

Schnittstelle

UltraDMA/66

Serien-Nr.

GLT0N209

Floppy

Teac FD-235HF

Serien-Nr.

E081317

Firmware

--

Sonstiges

3,5"

Netzteil

Channel Well Technology ATX-230

Serien-Nr.

97131035

Firmware

---

Sonstiges

230 W

Tastatur

Cherry RS 6000 M

Serien-Nr.

G 0064307 4 L28 3 1

Firmware

---

Sonstiges

---

Maus

Logitech M-S35

Serien-Nr.

LZA84352011

Firmware

---

Sonstiges

3-Tasten