Test: RADEON 9700 schlägt GeForce4

19.08.2002 von Bernhard  Haluschak und PATRICK RIFFEL, NICO HARTMANN, NICO ERNST 
ATI verweist mit dem RADEON 9700 Pro den bisherigen Spitzenreiter GeForce4 auf den zweiten Platz. Während Matrox mit dem Parhelia-512 an den hohen Erwartungen scheiterte, hält der neue ATI-Grafikchip, was er verspricht.

Grafikkarten mit NVIDIA-Chips gibt es in allen Varianten und Preisklassen, während ATI und Matrox für Einsteiger kaum etwas zu bieten hatten. ATI versucht nun, mit dem RADEON 9000 auch dort Fuß zu fassen. Der RADEON 9700 Pro ist eine Kampfansage an NVIDIAs GeForce4 Ti.

Das Angebot an Grafikkarten ist immens, und es scheint immer schwieriger zu werden, die für sich passende auszusuchen. Einfacher wird die Auswahl, wenn man sich zunächst auf einen Grafikchip festlegt. Entscheidend dafür sind die benötigten Features und Funktionen sowie die Leistung im primären Einsatzgebiet. Wer hauptsächlich mit Office-Anwendungen arbeitet und gelegentlich Spiele zur Entspannung nutzt, ist zum Beispiel mit einem NVIDIA GeForce4 Ti schlecht beraten. Er ist für den 2D-Gebrauch einfach zu teuer. Andererseits werden Spieler von aktuellen 3D-Games mit einem Matrox G550 auf Grund ihrer schwachen 3D-Performance nicht glücklich.

Wir stellen im Folgenden die neuen Grafikprozessoren RADEON 9000 und 9700 von ATI sowie den Parhelia-512 von Matrox detailliert vor. Außerdem liefern wir Ihnen die wichtigsten Fakten zu den aktuellen Chips von NVIDIA, SiS und STMicroelectronics. Neben den technischen Daten erklären wir die Besonderheiten sowie Vor- und Nachteile.

In unserer tecDaten-Tabelle lesen Sie alle wichtigen technischen Daten, Funktionen und Benchmark-Ergebnisse zu den Chips. Einen Test der älteren Grafikchips bieten wir Ihnen hier.

Am Ende des Beitrags finden Sie eine grafische Übersicht über die Leistungsfähigkeit der Chips. Diese Ergebnisse haben wir anhand von 21 ausgewählten Stellvertretern ermittelt. Die Referenzgrafikkarten müssen die Spezifikationen des Chipherstellers einhalten und eine annehmbare Signalqualität vorweisen.

Referenzkarten

Die Grafikprozessoren haben wir mit den unten stehenden Karten getestet. Zusätzlich haben wir alle relevanten Daten wie Chip-/Speichertakt, Firmware- und Treiberversion der getesteten Grafikkarten angegeben.

Die Referenzplattformen für alle Grafikkarten sind exakt definiert. Um Ihnen unsere Testkonfigurationen transparent zu machen, finden Sie im Anhang des Artikels eine detaillierte Liste der verwendeten Komponenten und Treiberversionen.

Testmuster

Grafikchip

Chiptakt/Speichertakt

Bios-Version

Treiber-Version

ATI RADEON 8500

RADEON 8500

275/275

1.009

6.13.10.6043

ATI-Referenzboard RADEON 9000 Pro

ATI RADEON 9000 Pro

275/275

BK8.0.0 VR000. 000.008.000.000. 001.001.000 f

6.13.10.6102

Sapphire RADEON 9700 Pro

ATI RADEON 9700 Pro

325/310

k.A.

7.75

Hercules 3D Prohet 4500 64 MB

KYRO II

175/175

VESA VBE 3.0

1.4.14.28

Hercules 3D Prophet FDX 8500 LE

RADEON 8500 LE

250/250

7.006

6.13.10.6043

Leadtek WinFast A250 TD

GeForce4 Ti 4400

275/275

4.25.00.22

Detonator 28.32

Matrox 550

G550

133/166

1.4.014

5.82.18.0

Matrox Parhelia-512

Parhelia-512

220/275

1.0.0.004

1.0.0.223

MSI G4MX440-VT

GeForce4 MX 440

270/200

4.25.00.24

Detonator 28.32

MSI G4MX460-VT

GeForce4 MX 460

300/275

4.17.00.24

Detonator 28.32

NVIDIA-Referenzboard GeForce4 Ti 4200

GeForce4 Ti 4200

250/250

4.25.00.25.E2

Detonator 28.32

SiS-Referenzboard Xabre 400

Xabre 400

250/250

0.70.02

3.01.00

Sparkle SP7200T6

GeForce4 Ti 4600

300/325

4.25.00.19

Detonator 28.32

Disqualifizierte Grafikkarten

In einem aufwendigen Auswahlverfahren haben wir unter 21 Grafikkarten 13 Referenzkarten ausgewählt. Sie repräsentieren die aktuellen Grafikprozessoren. Bei der Auswahl haben wir verschiedene Kriterien festgelegt, damit eine Grafikkarte als Referenz für den Chipvergleich dienen kann: Sie muss die Spezifikationen der Hersteller erfüllen und eine akzeptable Signalqualität bieten. Treffen diese Merkmale auf mehrere Boards mit dem gleichen Chip zu, entschieden wir uns für diejenigen mit der besten Performance, Verarbeitung, Ausstattung und Serviceleistung. Die Grafikkarten, die nicht Referenz geworden sind, haben wir in der folgenden Tabelle aufgelistet mit Angabe des Grundes für ihr Ausscheiden.

Grafikchip

Anbieter

Produkt

Ausscheidungsgrund

ATI RADEON 8500

Hercules

3D Prophet ALL-IN-WONDER 8500DV

Chip-/Speichertakt

NVIDIA GeForce4 MX440

ASUS

V8170DDR

Signalqualität

NVIDIA GeForce4 MX440

Sparkle

SP7100M4

Signalqualität

NVIDIA GeForce4 MX440

Leadtek

A170DDRT

Signalqualität

NVIDIA GeForce4 Ti4400

MSI

G4Ti4400-VTD

Signalqualität

NVIDIA GeForce4 Ti4400

Sparkle

SP7200T4

Signalqualität

NVIDIA GeForce4 Ti4400

Creative Labs

3D Blaster Ti4400

Signalqualität

NVIDIA GeForce4 Ti4400

ASUS

V8440

Signalqualität

NVIDIA GeForce4 Ti4600

Creative Labs

3D Blaster Ti4600

Speicher-Interface übertaktet

NVIDIA GeForce4 Ti4600

MSI

G4Ti4600-VTD

Speicher-Interface übertaktet

NVIDIA GeForce4 Ti4600

ASUS

V8460Ultra

Signalqualität

ST Microelectronics Kyro II

Videologic

Vivid!XS

nur 32 MByte Speicher

Typische Preise

In der folgenden Tabelle finden Sie alle getesteten Grafikchips alphabetisch nach Hersteller sortiert. Der Preis ist ein gemittelter Straßenpreis für eine entsprechende Karte im Fachhandel.

Preisübersicht aktueller Grafikkarten

Hersteller

Grafikchip

Speicher (MByte)

Preis (Euro)

ATI

RADEON 8500

64

284

ATI

RADEON 8500 LE

64

149

ATI

RADEON 9000

64

129

ATI

RADEON 9700 Pro

128

500

Matrox

G550

32

140

NVIDIA

GeForce4 MX 440

64

119

NVIDIA

GeForce4 MX 460

64

159

NVIDIA

GeForce4 Ti 4200

128

180

NVIDIA

GeForce4 Ti 4400

128

280

NVIDIA

GeForce4 Ti 4600

128

369

SiS

Xabre 400

64

140

STMicroelectronics

KYRO II

64

90

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Grafikkarten

Preise & Händler

Update: ATI RADEON 8500/9000

Mit dem RADEON 9000 hat ATI das Design des RADEON 8500 um die neue Funktion "Fullstream" erweitert und die Taktraten von Speicher und Grafikchip gesenkt. Fullstream soll die Wiedergabe von stark komprimierten Videos verbessern. ATI setzt hierzu die Shader der 3D-Logik ein, um die typischen MPEG-Artefakte verschwinden zu lassen.

Den überarbeiteten Chip verkauft ATI als RADEON 9000 mit einem Chip/Speichertakt von 250/200 MHz und in der Version 9000 Pro mit 275/275 MHz. Ansonsten entspricht er dem Design des RADEON 8500, der im Folgenden beschrieben ist.

ATI fertigt den Grafikchip RADEON 8500 in 0,15-µm-Technologie. Die vier Rendering-Pipelines mit je sechs Textur-Einheiten der Pixel-Tapestray-Architektur erreichen bei einem Chiptakt von 275 MHz eine Pixel-Füllrate von 1100 MPixel/s. Mit einem Speichertakt von maximal 300 MHz (600 MHz DDR) soll das 128 Bit breite Speicher-Interface eine Bandbreite von 8,9 GByte/s erreichen. Die verbesserte HyperZ-II-Funktion soll die effektive Speicherbandbreite nochmals um 25 Prozent auf 11,1 GByte/s erhöhen. Unsere Referenzkarte ATI RADEON 8500 bleibt mit 250 MHz und einer Speicherbandbreite von 8,2 GByte/s unter dem theoretischen Maximum.

Mit dem RADEON 8500 LE bietet ATI eine niedriger getaktete Variante des Grafikchips an. Hier takten Prozessor und Speicher jeweils mit 250 MHz. Dadurch beträgt die Speicherbandbreite nur noch 7,5 GByte/s. An der Architektur und den Funktionen des Chips änderte der Hersteller nichts.

Zu den Neuerungen der RADEON-8500-Architektur zählen die Smartshader-Technologie, Truform sowie Smoothvision. Letzteres ist eine Anti-Aliasing-Funktion, bei der man bis zu 16 Sampels per Pixel zur Kantenglättung benutzen kann. Wo die einzelnen Sample-Punkte innerhalb eines Pixels liegen, kann der Programmierer in einer Sample-Tabelle frei definieren und abspeichern. Voraussetzung für die Ausnutzung dieser neuen Funktionen ist DirectX 8.1 und Programme, die die neuen Funktionen einsetzen.

Zu den bereits vom RADEON bekannten Features zählen:

Smartshader

Erst mit der Einführung von DirectX 8.1 können die Hauptbestandteile der neuen RADEON-8500-Architektur, der programmierbare Vertex- und Pixel-Shader - auch Smartshader genannt - voll genutzt werden.

Der Vertex-Shader ist in der Geometrie-Pipeline untergebracht. Anhand von frei programmierbaren Anweisungen und Instruktionen kann er die ankommenden Vertex-Daten neu berechnen. Ein Vertex kann aus insgesamt 16 einzelnen Datenteilen, den so genannten Streams, bestehen. Diese enthalten zum Beispiel Orts- und Textur-Koordinaten, Lichtwerte oder Daten zur Oberflächenberechnung. Eine Vertex-Shader-Anweisung enthält maximal 128 Instruktionen. Ihr stehen zur Abarbeitung der Befehlsfolge 12 temporäre und 95 feste Datenregister zur Verfügung.

Besonders bei der aufwendigen Berechnung von Oberflächen (Procedural Deformation) und Schatten (Shadow Volumes) bringt diese Technik Vorteile.

Anders als der Vertex-Shader ist der Pixel-Shader ein Teil der Rendering-Pipeline. Er ist in der Lage, sechs unterschiedliche Texturen in einem Durchlauf zu untersuchen, um die Farbe eines Pixels festzustellen und neu zu berechnen. Dabei können die Texturen in einem dreidimensionalen Array abgespeichert werden. Eine Pixel-Shader-Anweisung fasst insgesamt 22 Instruktionen. Sechs temporäre und acht feste Datenregister helfen bei der Berechnung der Daten.

Vorteil des Pixel-Shader ist das schnelle Per-Pixel-Rendering mit vielen Lichtquellen. Darüber hinaus beschleunigt es Funktionen zur Berechnung des Lichts an Oberflächen wie das True Phong Shading, Advanced Bump Mapping und Procedural Textures.

Truform

Um die Grafik-Hardware zu entlasten, haben die Entwickler in der Vergangenheit die Zahl der Polygone in ihren Programmen reduziert, was Figuren, Gebäude und Landschaften eckig und unnatürlich aussehen lässt.

Das Problem will ATI mit seiner Truform-Technologie lösen. Die Idee ist simpel: Das ursprüngliche 3D-Modell bleibt, wie es ist, der 3D-Chip rechnet Polygone hinzu. Um das zu erreichen, bedient sich Truform der "Higher-Order-Surfaces", die Microsoft mit DirectX 8.0 eingeführt hat, und die OpenGL über Extensions ebenfalls beherrscht. Diese Oberflächen sind nicht rein aus Polygonen zusammengesetzt, sondern bestehen aus einer Kombination von Vielecken und Bezier-Kurven. Damit lassen sich auch gekrümmte Oberflächen (curved surfaces) von Objekten darstellen.

Eine Form der Higher-Order-Surfaces sind N-Patches, mit denen auch Truform arbeitet. Dabei werden die gekrümmten Oberflächen aus den Eckpunkten der Polygone errechnet. Truform verwendet dazu die Normalen, also die Richtungsvektoren des reflektierten Lichts an den Eckpunkten. Je nach Richtung und Länge dieser Vektoren lassen sich so mehr oder weniger gewölbte Oberflächen errechnen.

Auch die Beleuchtung profitiert von Higher-Order-Surfaces. Insbesondere Glanzlichter können so leichter eingesetzt werden, weil ihre Position nicht mehr fest an ein Polygon gebunden ist. Stattdessen können diese Reflexionen quasi über die gekrümmten Oberflächen gleiten.

Bei Truform leistet der 3D-Chip die Hauptarbeit, aber auch auf dem AGP-Bus spart das Verfahren Bandbreite. Grund: Es müssen nur die zusätzlichen N-Patches übertragen werden, nicht aber die kompletten Daten für die Polygone.

Neu: ATI RADEON 9700

Im Gegensatz zum RADEON 9000/Pro ist der RADEON 9700 eine komplette Neuentwicklung. Erstmals wurde der Chip (Codename R300) auf der "Computex 2002" gesichtet, damals allerdings noch in einer frühen Version.

In der Tat ist der Floppy-Stecker äußerlich die erste Neuerung, die ins Auge springt - unbestätigten Angaben zufolge soll der RADEON 9700 mit seinen 107 Millionen Transistoren in 0,15 Mikron über 42 Watt unter Last verbrauchen. Das überfordert selbst großzügig ausgelegte AGP-Schaltungen. Doch diesen enormen Transistoraufwand braucht ATI auch, um die Vielzahl neuer Funktionen im Chip unterzubringen.

256-Bit-Speicher-Interface

Entworfen hat den Grafikprozessor das von ArtX übernommene Design-Team, das auch für den Chip Flipper in Nintendos Gamecube verantwortlich war.

Wie schon die Matrox Parhelia kommt der Radeon 9700 mit einem 256 Bit breiten Speicher-Interface - Matrox konnte daraus jedoch keine sensationelle Performance ziehen. Bei ATI könnte das anders sein, denn die vier einzelnen Speicher-Controller sind unabhängig.

Über eine Switch-Logik werden die Zugriffe auf vier externe, 64 Bit breite Speicherkanäle verteilt. Für das DDR-SDRAM selbst kommen wie schon beim GeForce4 ab Modell 4400 ausschließlich Bausteine im BGA-Gehäuse zum Einsatz.

AGP 8x

Laut ATI sind die vier Speicherkanäle völlig unabhängig und können so auch gleichzeitige Schreib- und Lesezugriffe verarbeiten. Die gesamte Bandbreite soll 20 GByte/s betragen, der GeForce4 Ti 4600 kommt nur auf 10,4 GByte/s. Die Speicherausstattung des Radeon 9700 beträgt maximal 256 MByte, die ersten Karten werden jedoch nur mit 128 MByte geliefert werden. Das ist aber auch bei anspruchsvollen Anwendungen mehr als ausreichend.

Wer solche Speicherbandbreiten zur Verfügung hat, will Texturen und Geometriedaten auch schnell aufs Board bekommen. Dafür steht beim Radeon 9700 AGP 8x zur Verfügung.

Acht Pipes und DirectX-9-Shader

Gegenüber dem Radeon 8500 hat ATI beim Radeon 9700 die Zahl der Rendering-Pipelines auf acht verdoppelt. Jede dieser Pipes verfügt über eine eigene Texturierungseinheit sowie einen Pixel-Shader.

Diese Pixel-Shader beherrschen Angaben von ATI und Microsoft zufolge alle Anforderungen von DirectX 9. Da diese Grafikschnittstelle noch nicht vorgestellt wurde, sind die Informationen darüber spärlich gesät.

Die leistungsfähigen Pixel-Shader arbeiten laut ATI mit Floating-Point-Logik bei 128-Bit-Genauigkeit. Sie sollen auch ausreichen, um Echtzeitmanipulationen an Video-Streams vorzunehmen.

Videoshader

Wie schon der Radeon 9000 beherrscht auch der Radeon 9700 die Echtzeitmanipulation von Video-Streams. Das folgende Bild demonstriert das Fullstream-Feature des kleinen Bruders.

Beim Radeon 9700 soll mit dem Feature "Videoshader" nicht nur das bloße Filtern von Artefakten erreicht werden. ATI will beispielsweise Oberflächeneffekte und Bildverzerrungen am Video durch die Shader berechnen lassen. Bisher benötigt Software wie Adobes "Premiere" oder "AfterEffects" dafür Rechenzeiten von mehreren Stunden.

Zwar nannte ATI Adobe nicht explizit als Partner, der den Videoshader unterstützt. Die Kanadier befinden sich aber nach eigenen Angaben in Verhandlungen mit "mehreren Software-Herstellern". Auch wenn der Radeon 9700 primär ein 3D-Chip ist, wäre er im Bereich Video-Editing damit eine Sensation, fallen doch die sündteuren DSP-Karten für Spezialeffekte weg.

Neben den genannten Funktionen hat ATI auch seine Geometriekompression "Hyper Z" modernisiert sowie das Full-Scene-Antialiasing verbessert.

Matrox G550

Der G550 ist pinkompatibel zum Vorgänger G450 und basiert zum größten Teil auf dessen bekannter 256-Bit-Dual-Bus-Architektur. Neu bei in 0,18-µm-Technologie gefertigten Chips sind die zwei Textureinheiten pro Rendering-Pipeline. Allerdings lässt sich über die Füllrate des Grafikprozessors nur spekulieren, da Matrox die Taktfrequenz des Chips nicht preisgibt. Fest steht nur, dass Chip- und Speichertakt asynchron arbeiten.

Wie der Vorgänger kann der G550 maximal 32 MByte DDR-SDRAM/SGRAM verwalten. Der Speichertakt ist mit 166 MHz (333 MHz DDR) spezifiziert. Während die Pipeline-Architektur auf höhere Performance schließen lässt, wirkt das nur 64 Bit breite Speicher-Interface als Bremse (zum Standard gehören mittlerweile 128 Bit). Die Speicherbandbreite von 2,7 GByte/s bleibt somit zum G450 unverändert.

Weitere Features des Matrox G550 sind die neue HeadCast-Technologie und das altbekannte DualHead. Darüber hinaus hat der Chip nicht nur einen, sondern zwei integrierte TMDS-Transmitter für den Anschluss von digitalen Flatpanel-Displays über eine DVI-Schnittstelle. Ebenfalls integriert sind der primäre 360 MHz und der sekundäre 230 MHz schnelle RAMDAC sowie ein TV-Encoder. Dies spart zusätzliche externe Bauteile und Erweiterungsmodule.

Ein am primären VGA-Port angeschlossener Monitor stellt maximal eine Auflösung von 2048 x 1536 Punkten bei 32 Bit Farbtiefe und 85 Hz Bildwiederholfrequenz dar. Beim Anschluss an den sekundären Port ist eine Auflösung von 1600 x 1200 Punkten bei 32 Bit Farbtiefe und 85 Hz Bildwiederholfrequenz möglich. Digitale Flatpanels lassen sich mit einer Auflösung von 1280 x 1024 Punkten in 32 Bit Farbtiefe betreiben.

T&L-Unterstützung bietet der Matrox-Chip nicht. Der Vertex-Shader hat zwar die Fähigkeit, T&L-Beschleunigung in Hardware durchzuführen, diese bleibt aber auf die HeadCasting-Applikationen beschränkt. Zudem fehlt die Unterstützung von Texturkompressionen, dafür beherrscht der G550 das einfache Environment-Mapped-Bump-Mapping (EMBM).

DualHead-Technologie

Mit der DualHead-Technologie ist es möglich, zwei Anzeigegeräte gleichzeitig an einer Grafikkarte zu betreiben. Dazu hat Matrox zwei CRTC-Controller und zwei RAMDACs sowie einen TV-Encoder in den G550 integriert. Unabhängig voneinander können diese Bildschirmdaten aus verschiedenen Bereichen des Grafikspeichers lesen.

Der primäre CRTC-Controller ist mit einem 360 MHz schnellen integrierten RAMDAC verbunden. Er kann die Bilddaten direkt über die VGA-Schnittstelle auf einen RGB-Monitor oder über den TV-Encoder und einen Adapter auf ein TV-Gerät ausgeben. Der sekundäre CRTC-Controller mit einem 230 MHz schnellen RAMDAC sowie einer der beiden integrierten TMDS-Transmitter sind mit der DVI-I-Schnittstelle verbunden. Mit Letzterer wandelt der Matrox G550 die Bilddaten entweder ins RGB-Format für den Anschluss eines weiteren Monitors oder in ein digitales Format für Flatpanels.

Das eröffnet die Möglichkeit, zum Beispiel gleichzeitig einen DVD-Film auf dem Fernsehgerät zu sehen und auf dem Monitor weiterzuarbeiten (DVDMax-Funktion). Auch für Präsentationen ist diese Funktion von Nutzen. So kann man Bildschirmbereiche des primären Monitors auf einem sekundären Monitor oder digitalen Flatpanel im Vollbildmodus darstellen (Clone-Funktion). Auch lassen sich bestimmte Inhaltsbereiche eines Bildschirms vergrößern und auf einem zweiten anzeigen (Zoomfunktion).

Alle angeschlossenen Anzeigegeräte sind dabei individuell konfigurierbar, das heißt die Auflösungen und Bildwiederholfrequenzen sind frei wählbar. Von DualHead profitieren nicht nur Windows-9x/ME-Anwender, auch Windows-2000/XP- und Linux-Anhänger können dieses Feature nutzen.

Lange Zeit war Matrox der einzige Hersteller mit einer DualHead-Technologie. Erstmals mit NVIDIAs TwinView-Architektur beim GeForce2 MX und ATIs Multi-Display-Technologie und der HydraVision-Software bot die Konkurrenz etwas Vergleichbares, auch wenn die Leistungsfähigkeit noch nicht mithalten konnte. NVIDIA entwickelte TwinView weiter und liefert heute mit nView eine ausgereifte DualHead-Technologie für alle GeForce4-Modelle.

HeadCast-Technologie

Zu den wichtigsten Merkmalen des Matrox G550 gegenüber dem G450 zählt der Vertex-Shader. Er setzt sich aus insgesamt 256 Registern zusammen. Darüber hinaus verfügt er über ein integriertes Matrix Palette Skinning, das mit Unterstützung von DirectX 8 maximal 32 Matrizen zu Berechnungen heranziehen kann. Ein Manko dieser Technologie: Matrox nutzt sie ausschließlich für die hauseigenen Applikationen - Spiele profitieren nicht davon. Getreu den Mitbewerbern NVIDIA und ATI hat Matrox für die Architektur des G550 auch einen werbewirksamen Marketing-Namen erfunden: HeadCasting-Engine.

Dieser Name ist bei Matrox Programm. Mit der im Lieferumfang enthaltenen HeadCasting-Software kann man ein 3D-Modell seines Kopfes dreidimensional animieren. Erfasst wird dieses Bild über zwei digitale Fotos der Vorder- und Seitenansicht. Die Umrechnung übernimmt die Digimask-System-Software von Digimask.

Durch lippensynchrone Animation des Gesichts will Matrox damit für eine persönlichere Note beim Instant-Messaging, bei Präsentationen und Online-Schulungen sorgen. Dabei werden die Sprechdaten mit Hilfe der HeadFone-Software von LIPSinc in synchrone Lippenbewegungen umgewandelt.

Die spezielle Architektur des G550 berechnet den Vorgang Hardware-beschleunigt. Außerdem fallen bei dieser Technik nur wenige Geometriedaten an, die beim Online-Messaging über Datenleitungen fließen.

Matrox Parhelia-512

Matrox meldete sich im Mai 2002 mit dem Parhelia-512 im umkämpften Grafikchipmarkt zurück. Der Hersteller sieht den Chip nicht als GeForce4-Konkurrent. Er sei vielmehr eine Art technologischer Avantgardist, mit hohen Ansprüchen an die Darstellungsqualität im 2D- und 3D-Bereich. Der Hersteller nennt als Zielgruppe für diesen Grafikchip anspruchsvolle professionelle Anwender und PC-Enthusiasten. Matrox spricht mit dem DirectX-8.1/9-kompatiblen Chip von High-Fidelity-Grafik. HiFi im Grafikbereich, diese Vorgabe soll der Parhelia-512 mit diversen innovativen Technologien erreichen. Die ersten Serienkarten wird es voraussichtlich noch im Juli 2002 zu einem Preis von etwa 500 Euro geben.

Auf dem in 0,15-µm-Technologie gefertigten Parhelia-512 sitzen 80 Millionen Transistoren. Zum Vergleich: Der GeForce4 hat nur 63 Millionen Transistoren auf dem Die. Wie die Ziffern im Namenszug andeuten, setzt Matrox auf eine interne 512-Bit-Grafikbus-Architektur. Das Speicher-Interface ist 256 Bit breit und soll laut Hersteller eine maximale Speicherbandbreite von 20 GByte/s (1000er Basis) liefern. Damit ergibt sich für den maximal 256 MByte großen Grafikspeicher ein DDR-Speichertakt von 625 MHz. Unser Testmuster ist mit 128 MByte DDR-SDRAM bestückt. Der Speicher taktet mit 275 MHz (550 MHz DDR), der Grafikchip mit 220 MHz. Anders als in den White-Papers angegeben, unterstützt der Parhelia-512 laut Matrox statt AGP 8x nur AGP 4x.

Der Parhelia-512 verfügt über vier Pixel-Pipelines mit je vier Textureinheiten. Jeder dieser Quad-Textur-Units ist ein fünfstufiger Pixel-Shader (Version 1.3, DirectX 8.1) nachgeschaltet. Dieses 36-stufige Shader-Array soll dem Chip dank intelligenter Steuerungseinheit, Tiefeninformations- und Register-Caches die Berechnung komplexer Modelle mit hoher Performance in Echtzeit ermöglichen. Zusätzlich hat Matrox vier DirectX-9-kompatible Vertex-Shader (Version 2.0, DirectX 9) implementiert.

Darstellungstechnologien

Die Darstellungsqualität will der Parhelia-512 mit der 10-Bit-GigaColor-Technologie verbessern. Statt wie bisher 8 Bit Farbtiefe pro RGB-Kanal bietet der Parhelia-512 10 Bit pro Kanal. Der Chip erzeugt rund eine Milliarde Farben (30 Bit). Damit sind weichere Farbübergänge ohne Stufen-Effekte möglich. Bislang konnten Grafikkarten für PCs maximal 16,8 Millionen verschiedene Farben (24 Bit) darstellen. Der Wert von 32 Bit Farbtiefe im Grafikkartentreiber vieler Karten setzt sich aus 24 Bit für die RGB-Farbinformation und 8 Bit für den Alpha-Channel zusammen. Der Alpha-Wert gibt an, ob ein Pixel transparent, durchscheinend oder solide ist.

Mit 10 Bit Farbtiefe pro Kanal arbeiten nicht nur die Grafik-Engine und der Bildspeicher, sondern auch die zwei RAMDACs und der TV-Encoder. Vor allem bei der Gammakorrektur der einzelnen RGB-Kanäle sollen die höheren 10-Bit-Farbinformationen eine bessere Darstellungsqualität auf dem Monitor liefern. Davon profitieren professionelle Grafiker, die mit hochauflösenden Geräten wie Scannern und Digitalkameras arbeiten.

Displacement-Mapping

Das von Matrox entwickelte Hardware-Displacement-Mapping ist Bestandteil der DirectX-9-API von Microsoft und erlaubt das Rendern von hochauflösenden 3D-Strukturen auf Basis einer Vorlage, die aus einzelnen Polygonen bestehen darf. Die zusätzlichen Dreiecke, die der Chip durch Depth-Adaptive-Tessellation berechnet und in die Displacement Map einfügt, ergeben ein Höhenprofil einer 3D-Darstellung. Dieses Displaced-Mesh berechnet der Parhelia-512 in Echtzeit aus den Graustufen einer Vorlage (Map) und rendert es mit einer Texturvorlage zum finalen Bild. Anders als beim Bump-Mapping erzeugt das Displacement-Mapping eine neue Geometrie eines Körpers.

Antialiasing-Verfahren

Ein weiteres Feature des Matrox-Chips ist neben dem 4x-FSAA das 16x-Fragment-Antialiasing. Der von Matrox entwickelte Algorithmus ermöglicht eine 16fache Kantenglättung. Der Chip ermittelt zuerst die Kanten und rechnet nur mit diesen Pixeln in einem 16x-Supersampling-Modus. Die auf die Ränder beschränkte Berechnungsmethode ähnlich dem Edge-Antialiasing soll zudem die Flächen der Texturen selbst nicht verfälschen, wie bei herkömmlichen FSAA-Verfahren.

Glyph-Antialiasing

Für die Verbesserung der 2D-Textqualität ist der Parhelia-512 in der Lage, mit der Glyph-Antialiasing-Technologie Schriften Hardware-beschleunigt zu glätten und eine variable Gammakorrektur durchzuführen. Betriebssysteme wie Windows XP und 2000 erledigen diese Aufgabe in Software, allerdings mit Performance-Verlusten.

DualHead, TripleHead

Matrox hat seine patentierte DualHead-Technologie im Parhelia-512 überarbeitet. Die zwei Display-Controller versorgen zwei 400-MHz-RAMDACs, einen TV/Video-Encoder und zwei unabhängige 165-MHz-TMDS statt mit 8 Bit jetzt mit 10 Bit tiefen Datenströmen. Die beiden RAMDACs unterstützen Auflösungen von bis zu 2048 x 1536 Bildpunkten. Die zwei TMDS arbeiten im Dualbetrieb mit Auflösungen von 1920 x 1200 Punkten. Im Single-Dual-Link-Modus wird eine Auflösung von 2560 x 2049 Bildpunkten bei eingestellter Farbtiefe von je 32 Bit erreicht.

Weiterhin bietet Matrox die TripleHead-Technologie. Über einen zusätzlichen RAMDAC-Baustein kann ein weiterer Monitor angesteuert werden. Nach diesem Verfahren erreicht der Anwender über drei angeschlossene Bildschirme eine Auflösung von 3840 x 1024 Bildpunkten bei 32 Bit Farbtiefe. Der damit entstehende Panoramaeffekt (Surround-Gaming) adressiert die Gamer-Klientel, da bereits Spiele wie Quake III Arena und Flight Simulator 2002 diesen Triple-Modus unterstützen. Aber auch professionellen Grafikanwendern soll der auf diese Art erweiterte dreifache Desktop die Arbeit erleichtern.

Durch die Verwendung hochwertiger Filter verspricht Matrox eine bessere Signalqualität des VGA-Ausgangs. Filter fünfter Ordnung und ein optimiertes 8-Layer-PCB-Design sollen den Signalpegel über den gesamten Frequenzverlauf des RAMDACs konstant auf optimalen 700 mV halten und Farbverfälschungen und Schatteneffekte mindern. Hintergrundinformationen über Signalqualität von Grafikkarten erhalten Sie im Beitrag Signalqualität von Grafikkarten.

NVIDIA GeForce4

Unter dem Codenamen "NV25" entwickelte NVIDIA den GeForce4 Ti. Sein kleiner Bruder heißt GeForce4 MX ("NV17"). Das Top-Modell von NVIDIA ist der GeForce4 Ti 4600. Wie seinen Vorgänger fertigt NVIDIA den Chip im 0,15-µm-Prozess. Das Die ist mit 63 Millionen Transistoren bestückt im Gegensatz zum GeForce3 Ti mit 57 Millionen Transistoren.

GeForce4 Ti

NVIDIA bietet den GeForce4 Ti in den drei Varianten Ti 4600, Ti 4400 und Ti 4200 an: Das Spitzenmodell Ti 4600 verfügt über einen Chiptakt von 300 MHz, der Ti 4400-Chip ist mit 275 MHz getaktet und der Ti 4200 mit 250 MHz. Alle GeForce4 Ti-Karten sind mit 128 MByte DDR-SDRAM-RAM bestückt. Der Speicher arbeitet mit effektiv 650 MHz bei der Ti 4600, mit 550 MHz bei der Ti 4400 und 500 MHz bei der Ti 4200. In Verbindung mit dem 128 Bit breiten Speicherbus sind folgende Speicherbandbreiten möglich: 10,4 GByte/s mit 650-MHz-, 8,8 GByte/s mit 550-MHz- und 7,5 GByte/s mit 500-MHz-DDR-Speicher. (Alle Angaben wie GByte und MByte auf 1000er Basis.)

GeForce4 MX

Neben den Flaggschiffen stellt NVIDIA auch drei günstigere Modelle aus der MX-Reihe vor. Sie sind mit 64 MByte Speicher bestückt. Die GeForce4 MX 460 taktet mit 300 MHz und greift zu auf 550 MHz DDR-SDRAM. Mit 270 MHz Chiptakt und effektiv 400 MHz DDR-SDRAM ist die MX 440 ausgestattet. Die kleinste MX-Version 420 verfügt über SDRAM mit 166 MHz und einem Chiptakt von 250 MHz. Die meisten Anbieter konzentrieren sich auf die Produktion von MX 440-Karten.

Neuerungen des GeForce4

Nach den Neuheiten des GeForce4 muss man lange und genau suchen. Den großen Wurf in Sachen Technologie hat NVIDIA nicht gemacht, vielleicht auch gar nicht vorgehabt. Glaubt man den Gerüchten, erscheint im 4. Quartal der Nachfolger NV30. Somit ließe sich zumindest erklären, warum NVIDIA dem GeForce3 Ti ein Facelifting bescherte, hier und da erweiterte und verbesserte.

nfiniteFX II

Die nfiniteFX-Engine des GeForce3 wurde verbessert. Bisher ist in ihr jeweils ein Vertex- und ein Pixel-Prozessor integriert. Bei dem GeForce4 gesellt sich ein zweiter Vertex-Shader hinzu. Dadurch verspricht NVIDIA sich und den Kunden einen Leistungsgewinn um den Faktor 3 gegenüber einem GeForce3 bei Berechnung geometrischer Strukturen. Der programmierbare Dual-Vertex-Shader berechnet in Echtzeit grafische Spezialeffekte in 3D-Bildszenen. Er kann komplexe Charakteranimationen mit mehr als 86 Millionen Vertices (Scheitelpunkte von Polygone) pro Sekunde berechnen. Details wie Haare und Fell sollen sich damit realistischer darstellen lassen. Die Farbe und Dichte zum Beispiel des Fells wird bestimmt von einer eigenen Texture Map. Die hierfür nötige Rechenleistung übernimmt der Pixel-Shader, der ebenfalls überarbeitet wurde. Er erlaubt dem Entwickler, Pixelfunktionen wie Farbe, Licht und Transparenz individuell zu programmieren. Durch die Verbesserung soll sich die Leistung des Pixel-Shaders gegenüber dem GeForce3 um 50 Prozent erhöht haben.

Lightspeed-Memory-Architecture II

NVIDIA erweiterte auch die Lightspeed-Memory-Architecture (LMA). Sie vereint Crossbar Memory Controller, Z-Compression, Z-Occlusion Culling, Auto-Pre-Charge und Fast Z-Clear. Wirklich neu bei der GeForce4 sind nur die beiden letzten Technologien. Durch Auto-Pre-Charge wird der Zugriff auf den Grafikspeicher verkürzt. Bisher musste die GPU etwa 10 DRAM-Taktzyklen warten, bis ein Speicherbereich (Zeile) zum Bearbeiten geladen ist. In dieser Zeit können keine Daten über den Bus geschickt werden. Der GeForce4 kann den Speicher anweisen, vorab diejenigen Bereiche zu laden, die in Kürze bearbeitet werden. Dadurch braucht die GPU nur die Vorladezeit (RAS-Precharge-Time) abzuwarten (2 bis 3 Takte), bis ein Signal am DRAM-Speicher anliegt. Die Daten können nun verarbeitet werden. In einem Extra-Beitrag lesen Sie, wie DRAM im Detail funktioniert.

Fast Z-Clear

Weitere Neuheit - zumindest beim GeForce4 - ist Fast Z-Clear. ATI integrierte diese Funktion bereits in den RADEON-Karten. Fast Z-Clear beschleunigt das Löschen des Z-Buffers. Dadurch soll eine Steigerung der Framerate um bis zu 10 Prozent möglich sein.

Accuview-Technologie

Die letzte maßgebliche Änderung nahm NVIDIA beim Antialiasing vor. Die Entwickler verbesserten die Multisampling-Verfahren 2x, Quincunx und 4x. Hier wurde die Position der Subpixel (auch Pixel-Sample genannt) verlagert, so dass sich im Endeffekt genauere Farbinformationen ermitteln lassen. In die Berechnungen fließt ein, aus welchen anliegenden Pixeln die Samples berechnet werden. Die Pixel werden näher zu denjenigen Pixeln "geschoben", von denen die Informationen stammen. Letztendlich entspricht das einer besseren Gewichtung bei der Summation der Subpixel. Daraus resultieren exaktere Farbwerte der finalen Pixel. Genauere Farben führen zu einer Verminderung der Treppcheneffekte an Kanten. NVIDIA nennt die Technologie Accuview. Welchen Sinn Subpixel haben und wie sie entstehen, erklären wir im Beitrag "GeForce3 im Detail".

4XS Antialiasing

Neben dieser Verbesserung wurde das 4x-Antialiasing weiterentwickelt. Das neue Verfahren 4XS soll 50 Prozent mehr Subpixel berechnen als 4x. Aus diesen werden die Farben der finalen Pixel berechnet. Zusätzlich werden die Pixel-Samples getestet, ob sie zum berechneten Objekt gehören und das Objekt diese Subpixel deckt. Mit 4XS sollen sich noch genauere Farbabstufungen ergeben und damit für sanftere Übergänge sorgen als mit 4x. Das Verfahren kann derzeit nur bei Direct3D-Spielen angewandt werden.

SiS Xabre

Silicon Integrated Corporation (SiS) hat im Mai 2002 den Xabre 400 (SiS334) aus der SiS-330-Familie für den Mainstream-Markt vorgestellt. Der Produktname Xabre leitet sich vom englischen Wort Sabre (Säbel) ab. Das Säbelrasseln zielt klar in Richtung Konkurrenz von ATI RADEON 7500 und NVIDIA GeForce4 MX 440.

Die Leistung bezieht der in 0,15-µm-Technologie gefertigte Xabre 400 aus je 250 MHz Chip- und Speichertakt (500 MHz DDR). Der maximale Speicherausbau beträgt 128 MByte. Der 128 Bit breite Speicherbus erreicht dabei eine Speichertransferrate von 7,45 GByte/s. Weitere Produkte wie der Xabre 80, 200 und 600 folgen. Beim Xabre 200 (SiS332) ist ein Chip- und Speichertakt von je 200 MHz vorgesehen. Das High-End-Modell Xabre 600 (SiS336) arbeitet voraussichtlich mit einer Chipfrequenz von 300 MHz und einem Speichertakt von 275 MHz (550 MHz DDR).

Der Xabre 400 ist der erste Grafikchip, der AGP 8x unterstützt. Dieser AGP-3.0-Modus erreicht eine theoretische Bandbreite von 1,99 GByte/s im Gegensatz zu AGP 4x mit 0,99 GByte/s.

Chiparchitektur

Ein weiteres Novum für einen Grafikchip im Preissegment bis 150 Euro sind die vier Pixel-Pipelines mit je zwei Textureinheiten. Zusätzlich übernimmt ein Pixel-Shader der Version 1.3 mit 29 frei programmierbaren Befehlen Berechnungen von Licht- und Oberflächeneffekten bei DirectX-8-Anwendungen. Eine in Hardware implementierte T&L-Einheit ist ebenfalls vorhanden. Dafür hat SiS auf einen Vertex-Shader verzichtet. Die komplexe Verarbeitung von Geometriedaten muss der PC-Prozessor per Software erledigen.

Darüber hinaus verfügt der Xabre 400 über die von SiS betitelte Funktion: Frictionless Memory Control (FMC). Sie soll laut SiS die vorhandene Speicherbandbreite effizienter ausnutzen. Wie dieses Verfahren funktioniert, gibt der Hersteller nicht preis. Das 1x/2x/4x-Full-Scene-Antialiasing unterstützt der Xabre nach dem bekannten Oversampling-Verfahren. SiS nennt es marketingwirksam Jitter-Free Anti-Aliasing.

Double-Scene-Technologie

Um Multi-Display-Funktionalität (Double-Scene-Technologie) zu bieten, verwendet SiS einen externen Baustein (SiS301B), der über die Video-Bridge des Xabre angeschlossen wird. Dieser Zusatzchip bietet die Möglichkeit, einen zweiten Monitor, ein DVI-Display oder ein TV-Gerät anzuschließen. Der Xabre verfügt über einen MPEG 2/1-Video-Decoder mit Motion-Compensation in Hardware.

Angelehnt an die Namensgebung der NVIDIA-Detonator-Treiber nennt SiS seine Treiber Xminator XP. Sie bieten Support für die Betriebssysteme Windows 9x/Me/2000 und Windows XP. Grafikkarten mit dem Xabre 400 sollen zirka 140 Euro kosten.

STMicroelectronics Kyro II

Mit technischen Innovationen a la GeForce3/4 kann der Kyro II nicht aufwarten. Der Grafikchip basiert wie schon sein Vorgänger auf der PowerVR-Serie3-Technologie von Imagination Technology.

Neu beim Kyro II ist die Fertigung im 0,18-µm-Prozess statt vormals 0,25 µm. Durch die geringere Strukturbreite ist eine höhere Taktrate möglich. STMicroelectronics hat den Kyro II ursprünglich für eine Taktfrequenz von 166 MHz spezifiziert, lässt den Herstellern aber Spielraum nach oben. Hercules entscheidet sich bei der 3D Prophet 4500 für 175 MHz. Chip- und Speichertakt laufen synchron. Beim Vorgängermodell arbeiteten Chip und Speicher noch mit gemächlichen 115 MHz.

Seine Grafikpower bezieht der Kyro II aus zwei Rendering-Pipelines mit je einer Textureinheit. Daraus ergibt sich für den Prozessor eine theoretische Füllrate von 0,35 Gigatexel/s. Verglichen mit den 0,7 Gigatexel/s einer GeForce2 MX erscheint das zunächst wenig. Die effektive Füllrate erhöht sich laut STMicroelectronics durch die Tile-Based-Rendering-Architektur aber auf bis zu 1,4 Gigatexel/s. Der Kyro II rendert bei diesem Verfahren nur Szenen, die der Betrachter auch sehen kann. Versteckte Texturen lässt er aus.

Der Kyro II kann maximal 64 MByte SDRAM oder SGRAM verwalten. Eine Unterstützung für DDR-Speicher fehlt. Mit seinem 128 Bit breiten Speicherbus erreicht der Kyro II eine maximale Speicherbandbreite von 2,73 GByte/s. Im Treiber sind Auflösungen bis zu 2048 x 1536 Pixel durch den 270-MHz-RAMDAC möglich.

Weitere wichtige Features des Kyro-II-Chips sind: 8-Layer-Multitexturing, 32 Bit internes True-Color-Rendering, Full Scene Anti-Aliasing und Environment Bump-Mapping. T&L unterstützt der Prozessor nicht.

Der KYRO II kann theoretisch AGP 4x. Aus Kompatibilitätsgründen laufen Kyro-II-Grafikkarten per Firmware nur im AGP-2x-Modus.

Probleme im Test traten mit zahlreichen Mainboards auf. Mit dem EPoX EP-8KHA+ (VIA KT266A) lief der Kyro II nicht stabil und brachte die Testplattform bei einzelnen Benchmarks zum Absturz. Teilweise quittierte der Kyro II auch den Dienst beim Wechsel der Bildschirmauflösung von 1024 x 768 zu 1280 x 1024 und umgekehrt. Das MSI K7T266 Pro (VIA KT266) erkannte die Grafikkarte erst gar nicht. Keine Probleme gab es mit dem EpoX EP-8K3A+ (VIA KT333) und Mainboards für den Pentium 4 wie dem EPoX EP-4T2A3 (Intel i850) und dem MSI 845 Ultra (Intel i845).

Kyro, Kyro II und GeForce2 MX im Vergleich

Chip

Kyro

Kyro II

GeForce2 MX

Technologie

0,25 µm

0,18 µm

0,18 µm

Transistoren

12 Millionen

15 Millionen

k.A.

Max. Speicher

64 MByte

64 MByte

64 MByte

Speichertyp

SGRAM, SDRAM

SGRAM, SDRAM

SGRAM, SDRAM, DDR-SGRAM, DDR-SDRAM

Chiptakt

115 MHz

175 MHz

175 MHz

Speichertakt

115 MHz

175 MHz

166 MHz

Speicherbus

128 Bit

128 Bit

64/128 Bit

AGP-Mode

2x

2x

4x

Speicherbandbreite

1,8 GByte/s

2,7 GByte/s

2,6 GByte/s

Tile Based Rendering

Der Kyro II verwendet ein effektives Renderingverfahren - das Tile-Based-Rendering. Es eliminiert redundante Grafikoperationen und Speicherengpässe. Der Kyro II fasst bestimmte Gruppen von Polygonen (Tiles) in eine so genannte sichtbare Liste (Display-List) zusammen und rendert sie erst dann.

Die Vorteile des Kyro II liegen dabei auf der Hand: Auf Grund der kleinen Bildbereiche, den Tiles, kann der Prozessor Schlüsseloperationen wie das Z-Buffering, die Pixel-Berechnung und das Blending im Chip durchführen. Das heißt: Er benutzt einen kleinen On-Chip-Speicher für diese Operationen und muss nicht den externen Speicher auf der Grafikkarte verwenden. Das spart Speicherbandbreite und erhöht die 3D-Performance.

Beim Tile-Based-Rendering-Verfahren texturiert und schattiert der Grafikchip nur sichtbare Pixel, die der Betrachter auch sehen kann. Versteckte Texturen werden schon im ersten Arbeitsschritt in der Grafikpipeline eliminiert. STMicroelectronics nennt das Deferred-Texturing. Redundante Texturzugriffe auf den externen Grafikspeicher sind damit überflüssig.

Ein weiterer Vorteil des Tile-Based-Rendering ist die Skalierbarkeit des Verfahrens. So kann die Multi-Chip-Fähigkeit des Kyro II effizient genutzt werden, indem mehrere Berechnungen parallel auf verschiedenen Chips ablaufen.

Internal True Color Mode

Eine Besonderheit der Kyro-Familie ist der Internal True Color Mode. Damit sollen laut STMicroelectronics Spiele mit 16 Bit Farbauflösung besser aussehen.

Der Grafikprozessor führt intern die Farbmischoperationen aller Textur-Operationen in True-Color-Genauigkeit (Internal True Color) durch - unabhängig davon, ob eine 16- oder eine 32-Bit-Farbdarstellung gewählt wurde. Bei einem Spiel mit 16 Bit Farbtiefe wird nur die letzte Arbeitsstufe, das Schreiben in den Framebuffer, in 16 Bit Farbtiefe ausgegeben. Bei herkömmlichen Grafikchips ist das anders: Sie rendern Texturen zwar auch intern mit 32 Bit, rechnen aber nach jedem Arbeitsschritt die Textur wieder in 16 Bit Farbtiefe um. Durch dieses ständige Konvertieren der Farbtiefen sind die Qualitätsverluste höher als beim Kyro II, der die Farbtiefe nur einmal von 32 auf 16 Bit reduziert.

8-Layer-Multitexturing

Frühere Grafikprozessoren wie der GeForce2 benutzen zwei oder drei parallele Textur-Pipelines, um zwei oder drei Texturen in einem Arbeitsschritt zu verarbeiten. Dies schränkt das Multitexturing per Hardware auf die Anzahl der Pipelines ein. Wenn zum Beispiel mehr als drei Texturen verwendet werden, benutzen herkömmliche Grafikchips das Multi-Pass-Rendering. Das bedeutet: Das zu texturierende Objekt muss mehrere Durchläufe durch die Texturpipelines absolvieren.

Beim Kyro-II-Grafikchip mit 8-Layer-Multitexturing ist das anders: Das Prinzip des Kyro II basiert auf dem Tile-Based-Rendering. Zusammen mit dem 8-Layer-Multitexturing kann der Chip jeden Bildbereich, der ein Multitextur-Polygon enthält, im On-Chip-Speicher mit nur einer Pixelpipeline zum Multitextur-Bild verarbeiten. Dabei durchlaufen Teilbereiche des zu rendernden Bildes so lange eine interne Schleifenfunktion (maximal 8), bis alle benötigten Textur-Layer aufgetragen sind. Separate Textureinheiten für weitere Textur-Layer sind nicht erforderlich.

Das 8-Layer-Multitexturing-Verfahren entlastet gegenüber dem Multi-Pass-Rendering den Datenfluss zum externen Grafikspeicher und zur CPU. Denn der Kyro II schickt seine Polygondaten nur einmal zur Verarbeitung an den Grafikspeicher und den Systemprozessor. Ältere Grafikchips von NVIDIA, ATI oder 3dfx benötigen für diese Funktion mehrere Durchläufe über den Bildspeicher und die CPU. Dies reduziert insbesondere die effektive Füllrate der Chips.

Update: Performance-Vergleich

Der ATI RADEON 9700 Pro löst den GeForce4 Ti 4600 als Spitzenreiter in nahezu allen Disziplinen ab. In fast allen Benchmarks setzt sich der Chip an die Tabellenspitze. Dort, wo es nur zur Mittelklasse reicht, sollen Treiber-Updates den fehlenden Performance-Schub liefern. Mit dem GeForce4 Ti 4600 bot NVIDIA bisher den leistungsfähigsten 3D-Grafikchip an. FSAA und Auflösungen jenseits der 1024 x 768 Punkte bewältigt der Ti 4600 ohne Mühe.

Deutlich schwächer ausgestattet und weniger leistungsfähig sind GeForce4-MX-Chips. Karten mit einem GeForce4 MX 440 bringen zum Beispiel etwa ein Drittel weniger Leistung als ein Modell mit GeForce4 Ti 4600. Die Einsparung von Vertex und Pixel-Shader ist derzeit zu verschmerzen, sie wird sich aber bei zukünftigen Programmen in der Leistung deutlich bemerkbar machen.

Der RADEON 9000 ist ATIs Konkurrenz zu den GeForce4-MX-Modellen. Diesem Anspruch genügt der Chip beinahe und platziert sich leistungsmäßig zwischen MX 460 und 440.

ATI kann sich mit dem RADEON 8500 gegen die GeForce4-Chips Ti 4400 und Ti 4600 nicht durchsetzen. Die MX-Varianten schlägt er zwar bei den meisten Benchmarks, allerdings kosten Karten mit einem RADEON 8500 auch 40 Euro mehr.

SiS demonstriert mit dem Xabre 400 einen Chip, der vom Preis und von der Performance her konkurrenzfähig ist zum GeForce4 MX 440. Als sein größtes Manko erweist sich die schwache Leistung unter OpenGL.

Dem Matrox Parhelia-512 gelingt es nicht, seine technologische Überlegenheit in überragende Leistung umzusetzen. Bei vielen Tests schafft er nur Mittelmaß. Besonders ärgerlich ist die schwache OpenGL-Leistung, auf die seine vorrangig adressierten Käufer wohl am meisten Wert legen.

Weit abgeschlagen bei allen Tests liegen die Chips STM Kyro II und Matrox G550. Ihnen fehlen moderne Chipelemente wie zum Beispiel Vertex-Shader oder T&L-Einheit (Matrox G550), um mit der Leistungsfähigkeit der neuen Grafikprozessoren mitzuhalten.

Update: Fazit

ATI holt nicht nur auf, sondern überholt mit dem RADEON 9700 Pro NVIDIAs GeForce4 Ti 4600. Preislich sollen die entsprechenden Endprodukte bei knapp 500 Euro liegen. Bisher beherrschte NVIDIA den Grafikkartenmarkt, nicht zuletzt auf Grund der breiten Produktpalette. Mit dem neuen ATI-Chip werden die Karten neu gemischt.

Die Kanadier bieten mit dem RADEON 9000 eine niedriger getaktete Variante des RADEON 8500. Preislich und leistungsmäßig konkurriert Ersterer mit den GeForce4-MX-Modellen. Die GeForce4-MX-Serie wurde für den Massenmarkt entwickelt. Modelle mit GeForce4 Ti sind für Power-Gamer mit dicken Geldbeuteln konzipiert. Innerhalb beider Serien grenzt NVIDIA seine Karten in drei Stufen ab - leistungsmäßig und somit auch preislich. Insgesamt können Hersteller wie MSI, ASUS oder Leadtek bis zu sechs NVIDIA-Konfigurationen anbieten. Die Preise beginnen bei etwa 120 Euro für den GeForce4 MX 420 und hören beim GeForce4 Ti 4600 für etwa 370 Euro noch nicht auf. Je nach Ausstattung und Anbieter können noch einmal 50 Euro mehr fällig werden.

Matrox überzeugt mit seinem jüngsten Chip Parhelia-512 nicht. Zwar ist er fortschrittlich und großzügig ausgestattet, doch bleibt er in punkto Leistung hinter den GeForce4-Ti-Chips und dem ATI RADEON 8500 zurück. Die einstigen Stärken und Vorteile wie gute Signalqualität und Mehr-Monitor-Betrieb sind verpufft oder wurden von der Konkurrenz eingeholt. 500 Euro für die Karte sind schlicht überzogen.

SiS misst sich nicht mit den Schwergewichten GeForce4 Ti und Parhelia-512, sondern steuert mit dem 140 Euro teuren Xabre 400 in den Massenmarkt und damit in das Fahrwasser des GeForce4 MX. Funktional übertrifft der Xabre diesen, preislich sind beide etwa gleich auf, und in Bezug auf Leistung liegt er knapp unter dem Niveau eines GeForce4 MX 440.

Detaillierte Benchmark-Ergebnisse, technische Daten und Funktionen der Chips finden Sie in der tecDaten-Tabelle. (nha)

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Grafikkarten

Preise & Händler

Update: Benchmarks

Alle Grafikchips testen wir unter Windows XP mit DirectX 8.1. Wir verwenden aktuelle 3D- und 2D-Applikations-Benchmarks. Weiterhin messen wir die FSAA-Performance und Leistungsaufnahme.

Die 2D-Performance testen wir mit dem Applikations-Benchmark BAPco SYSmark 2001 in einer Auflösung von 1280 x 1024 Punkten und 32 Bit Farbtiefe. Er dient zur Kontrolle von Kompatibilität und Stabilität der Grafikchips.

Die 3D-Leistung bestimmen wir mit folgenden Programmen:

SPECviewperf 6.1.2 / SPEC

3DMark2001 SE Pro / MadOnion

Vulpine GLmark v1.1p / Vulpine

Quake III Arena V1.31 / id Software

Serious Sam 2 / Croteam

Comanche 4 / NovaLogic

Mit GLmark, SPECviewperf und Quake III Arena ermitteln wir die OpenGL-Leistung der Grafikchips. Die Direct3D-Performance testen wir zum einen mit dem 3D-Ego-Shooter Serious 2 und dem Flugsimulator Comanche 4 sowie zum anderen mit dem Benchmark-Paket 3DMark2001 SE. Letzteres prüft sowohl Funktionen und Features als auch die Leistung der Grafikprozessoren und -chips mit Hilfe von Spieledemos.

Die wichtigsten Leistungswerte der Chips stellen wir auf den folgenden Seiten grafisch gegenüber. Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

SPECviewperf

SPECviewperf 6.1.2 ist eine OpenGL Real-World-Benchmark-Suite. Sie nutzt Funktionen zum Modellieren von Objekten bei industriellen Anwendungen. Wir verwenden den SPECviewperf-Einzel-Benchmark AWadvs-04. Dieser beansprucht die Grafikkarte besonders.

Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

SYSmark2001

Die 2D-Leistungsfähigkeit der Grafikkarten überprüfen wir mit dem Benchmark-Paket SYSmark2001 unter Windows XP. SYSmark2001 besteht aus aktuellen Anwendungsprogrammen wie Office 2000 und aus 3D-, Video- und Sound-Software. Die Ergebnisse des ATI RADEON 9700 Pro werden zu einem späteren Zeitpunkt nachgereicht.

Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

3DMark2001 SE

Der Benchmark 3DMark2001 SE verlangt nicht nur nach Rechen- und Grafikleistung, sondern beansprucht auch den AGP-Bus und das Speicher-Interface stark. Mit ihm lässt sich zusätzlich die Leistung von Chipfunktionen wie Vertex- und Pixel-Shader prüfen.

Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

Vulpine GLmark

Vulpine GLmark ist ein OpenGL-Benchmark. Er basiert auf der Vulpine Vision Game Engine, die in zukünftigen 3D-Spielen zum Einsatz kommen soll. Beim Test muss der Grafikchip komplexe Landschaften, Gebäude und typische Spieleszenen berechnen.

Den Test führen wir bei einer Auflösung von 1024 x 768 Bildpunkten und einer Farbtiefe von 32 Bit durch. Als Einstellung wählen wir "Advanced Settings". Diese nutzen OpenGL 1.2 und erweiterte Funktionen wie Cube Mapping.

Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

Serious Sam 2

Der 3D-Ego-Shooter Serious Sam 2 basiert auf einer selbst entwickelten Game-Engine der kroatischen Spieleprogrammierer Croteam. Serious Sam 2 bietet komplexe Szenarien. Detaillierte Graslandschaften, scharenweise Gegner und vielseitige Licht- und Schatteneffekte sowie Farb- und Reflexionseffekte verlangen dem Grafikprozessor ein gehöriges Maß an Rechenleistung ab. Das Game kann sowohl die Direct3D- als auch die OpenGL-API nutzen. Zum Test der Grafikprozessoren verwenden wir Direct3D mit den Standardeinstellungen (Präferenzen: Normal), einer Auflösung von 1024 x 768 Bildpunkten und 32 Bit Farbtiefe.

Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

Quake 3 Arena

Wie SPECviewperf und Vulpine GLmark setzt Quake III Arena v1.31 ganz auf OpenGL. Dieses 3D-Spiel zeichnet sich durch eine hohe Anzahl an Polygonen und komplexe Szenarien aus. Die Anforderungen an die Hardware und besonders an die Speicherbandbreite der Grafikkarten sind bei Auflösungen ab 1024 x 768 Punkten und 32 Bit Farbtiefe sehr hoch. Zwei weitere Tests in den Auflösungen 1280 x 1024 und 1600 x 1200 Punkten zeigen die Leistungsfähigkeit der Chips.

Eine detaillierte Übersicht über alle Benchmark-Ergebnisse finden Sie in der tecDaten-Tabelle.

Leistungsaufnahme

Die Leistungsaufnahme aktueller Grafikprozessoren ist teilweise enorm hoch. Die folgenden Diagramme geben eine Übersicht.

Die Messwerte liefern einen Hinweis auf potenzielle Kompatibilitätsprobleme mit Mainboards. Je mehr Leistung eine AGP-Grafikkarte aufnimmt, desto mehr Vorsicht ist beim Einsatz in einem älteren Mainboard geboten. Die Werte des ATI RADEON 9700 Pro werden zu einem späteren Zeitpunkt nachgereicht.

Testkonfiguration: Pentium 4

Komponente

Daten

Mainboard

MSI 845 Ultra (Intel i845)

Serien-Nr.

--

Firmware

--

Sonstiges

Sockel 478

Prozessor

Pentium 4 2,4 MHz

Sockel

Sockel 478

FSB

400 MHz

RAM

Corsair PC266 256 MByte CL2,5

Serien-Nr.

--

Firmware

--

Sonstiges

2 x 256 MByte

Soundkarte

Creative SB Live! Player1024 (CT4760)

Serien-Nr.

M4760930093040

Firmware

--

Sonstiges

Rev. C / 4.06.2016 / 13.03.1999

Netzwerkkarte

3Com Fast Etherlink 3C905B-TX

Serien-Nr.

6TQ2E9F466

Firmware

Hardware-Ver.: 048

Sonstiges

Rev. A

Festplatte 1

IBM DJNA-351520

Serien-Nr.

GLT0N167

Firmware

--

Sonstiges

15,2GB

Festplatte 2

IBM DJNA-351520

Serien-Nr.

GLT0N085

Firmware

--

Sonstiges

15,2GB

DVD-ROM

Pioneer DVD-303S-A

Serien-Nr.

TET0137971WL

Firmware

1.09

Sonstiges

--

Floppy

Teac FD-235HF

Serien-Nr.

E081326

Firmware

--

Sonstiges

3,5"

Tastatur

Cherry RS 6000 M

Serien-Nr.

G0624874 1L28 4 3

Firmware

--

Sonstiges

--

Maus

Logitech M-S35

Serien-Nr.

LZA84352096

Firmware

--

Sonstiges

3 Tasten

Testkonfiguration: Athlon XP

Komponente

Daten

Mainboard

EPoX EP-8KHA+ (VIA KT266A)

Serien-Nr.

19005300961

Firmware

04.03.2002

Sonstiges

Socket A, Rev: 2.0

Prozessor

AMD Athlon XP 2100+

Serien-Nr.

AG0IA 0152RPBW F4115020034

Firmware

--

Sonstiges

AX21000MT3C

RAM

Micron PC266 256 MByte CL2,0

Serien-Nr.

MT16VDDT3264AG-26AA1

Firmware

--

Sonstiges

1 x 256 MByte, Chips: MT46V16M8-75Z

Soundkarte

TerraTec XLerate Pro

Serien-Nr.

1293900011593

Firmware

--

Sonstiges

Rev. C

Netzwerkkarte

3Com Fast Etherlink 3C905B-TX

Serien-Nr.

6TQ2E9F59D

Firmware

Hardware-Ver.: 048

Sonstiges

Rev. A

Festplatte

IBM DJNA-351520

Serien-Nr.

GLT0M316

Firmware

--

Sonstiges

15,2GB

Festplatte

IBM DJNA-351520

Serien-Nr.

GLT0N214

Firmware

--

Sonstiges

15,2GB

DVD-ROM

Toshiba DVD-ROM SD-M1502

Serien-Nr.

1541007212

Firmware

1012

Sonstiges

Ver.-Nr: 001

Floppy

Teac FD-235HF

Serien-Nr.

E081325

Firmware

--

Sonstiges

3,5"

Netzteil

SKY HAWK CTX-300WCE

Serien-Nr.

A8-95

Firmware

--

Sonstiges

300W

Tastatur

Cherry RS 6000 M

Serien-Nr.

G0624874 1L28 4 3

Firmware

--

Sonstiges

--

Maus

Logitech M-S35

Serien-Nr.

LZA84352047

Firmware

--

Sonstiges

3 Tasten

Testkonfiguration: Pentium 4 RDRAM

Komponente

Daten

Mainboard

EPoX EP-4T2A3 (Intel i850)

Serien-Nr.

4T2A3-011107000031

Firmware

08.03.2002

Sonstiges

Socket 478, Rev: 1.0

Prozessor

Pentium 4 2000MHz A

Sockel.

Sockel 478

FSB

400 MHz

RAM

Infineon Rambus 800-45 (128MB / 8 ECC)

Serien-Nr.

HYR186420G-845, HYR186420G-845

Firmware

--

Sonstiges

2 x 128 MByte

Netzwerkkarte

LevelOne FNC-0107TX

Serien-Nr.

99092303925V2

Firmware

Hardware-Ver.: 048

Sonstiges

Rev. A / 4.10.2222 / 05.05.1999

Festplatte

IBM DTLA-305020

Serien-Nr.

YEL01233

Firmware

--

Sonstiges

20,5 GByte

CD-ROM-Laufwerk

ASUS CD-S500/A 50x max

Serien-Nr.

05DG010531

Firmware

--

Sonstiges

50 x

Floppy

Teac FD-235HF

Serien-Nr.

E081317

Firmware

--

Sonstiges

3,5"

Netzteil 1

Channel Well Technology ATX-230

Serien-Nr.

97131045

Firmware

--

Sonstiges

230 W

Netzteil 2

Lanya Scienoe Computer PD-230W

Serien-Nr.

SN: 93100757

Firmware

--

Sonstiges

230 W

Tastatur

Cherry RS 6000 M

Serien-Nr.

G 0419147 4 L21 2

Firmware

--

Sonstiges

--

Maus

Logitech M-S35

Serien-Nr.

LZA84352011

Firmware

--

Sonstiges

3 Tasten