Test: Erste Kyro-II-Grafikkarte

28.03.2001 von NICO HARTMANN  und Christian Vilsbeck
Dem neuen Kyro-II-Grafikchip könnte der Durchbruch gelingen: Hercules verbaut den Pixelbeschleuniger in der 3D Prophet 4500. Doch wie gut ist die Performance? Bringt der Kyro II frischen Wind ins NVIDIA-Einerlei?

STMicroelectronics hat Mitte März den Kyro II als Nachfolger des Kyro 3D vorgestellt. Gleichzeitig wurde bekannt, dass Hercules den Chip auf der 3D Prophet 4500 einsetzt.

Den ersten Erfolg kann der neue Kyro-II-Chip damit schon im Vorfeld für sich verbuchen: Mit Hercules als Hersteller werden Kyro-II-Grafikkarten endlich auch in den Handel kommen. Genau daran scheiterte der Vorgänger Kyro 3D. Trotz guter Benchmark-Ergebnisse wagte keine der großen Grafikkartenschmieden aus dem NVIDIA-Einerlei auszubrechen.

Hercules empfiehlt für die 3D Prophet 4500 einen Verkaufspreis von 339 Mark. Für eine 64-MByte-Grafikkarte ein günstiger Preis, zudem die Straßenpreise erfahrungsgemäß noch 20 Mark unter der Empfehlung liegen. GeForce2-MX-Boards mit gleicher Speicherausstattung schlagen mit bis zu 400 Mark zu Buche. Die stark verbreiteten 32-MByte-Varianten mit GeForce2 MX gibt es schon ab 250 Mark - Tendenz fallend.

Der Kyro II muss damit schon einiges an Performance bieten, um am Stuhl des anvisierten Hauptkonkurrenten GeForce2 MX sägen zu können. Unsere Benchmarks zeigen, dass STMicroelectronics die Säge gut geschärft hat.

Der Testkandidat

Zum Test des Kyro II liegt uns die 3D Prophet 4500 von Hercules vor. Das Testmuster entspricht der finalen Verkaufsversion, die ab Mitte April zu haben ist.

Getestet wurde die 3D Prophet 4500 mit Treibern der Version 7.51. Dabei handelt es sich nach Auskunft von Hercules noch um Betatreiber. Die finalen Treiber werden für Anfang April erwartet.

Hercules bestückt die 3D Prophet 4500 mit 64 MByte SDRAM. Einen TV-Ausgang oder eine DVI-Schnittstelle bietet die Karte nicht. Die Kühlung des Kyro II erfolgt mit einem aktiven Lüfter.

Treiber-Support gewährt Hercules für Windows 95 OSR2, 98 und Me sowie Windows 2000. Für Windows NT 4.0 sind keine Treiber vorgesehen.

Neben Hercules hat auch VideoLogic eine Grafikkarte mit Kyro-II-Chip vorgestellt: Die passiv gekühlte Vivid!XS ist im Gegensatz zur 3D Prophet 4500 mit nur 32 MByte SDRAM ausgestattet, verfügt aber über einen S-Video-Ausgang. Laut VideoLogic ist die Vivid!XS ab Ende April für 349 Mark im Fachhandel erhältlich.

Technische Details Kyro II

Mit technischen Innovationen a la GeForce3 kann der Kyro II nicht aufwarten. Der Grafikchip basiert wie schon sein Vorgänger auf der PowerVR-Serie3-Technologie von Imagination Technology.

Neu beim Kyro II ist die Fertigung im 0,18-Mikron-Prozess statt vormals 0,25 Mikron. Durch die geringere Strukturbreite ist eine höhere Taktrate möglich. STMicroelectronics hat den Kyro II ursprünglich für eine Taktfrequenz von 166 MHz spezifiziert, lässt den Herstellern aber Spielraum nach oben. Hercules entscheidet sich bei der 3D Prophet 4500 für 175 MHz. Chip- und Speichertakt laufen synchron. Beim Vorgängermodell arbeiteten Chip und Speicher noch mit gemächlichen 115 MHz.

Seine Grafikpower bezieht der Kyro II aus zwei Rendering-Pipelines mit je einer Textureinheit. Daraus ergibt sich für den Prozessor eine theoretische Füllrate von 0,35 Gigatexel/s. Verglichen mit den 0,7 Gigatexel/s einer GeForce2 MX erscheint das zunächst wenig. Die effektive Füllrate erhöht sich laut STMicroelectronics durch die Tile-Based-Rendering-Architektur aber auf bis zu 1,4 Gigatexel/s. Der Kyro II rendert bei diesem Verfahren nur Szenen, die der Betrachter auch sehen kann. Versteckte Texturen lässt er aus. Details zum Tile-Based-Rendering finden Sie auf der nächsten Seite.

Der Kyro II kann maximal 64 MByte SDRAM oder SGRAM verwalten. Eine Unterstützung für DDR-Speicher fehlt. Mit seinem 128 Bit breiten Speicherbus erreicht der Kyro II eine maximale Speicherbandbreite von 2,73 GByte/s. Im Treiber sind Auflösungen bis zu 2048x1536 Pixel durch den 270-MHz-RAMDAC möglich.

Weitere wichtige Features des Kyro-II-Chips sind: 8-Layer-Multitexturing, 32 Bit internes True-Color-Rendering, Full Scene Anti-Aliasing und Environment Bump-Mapping. T&L unterstützt der Prozessor nicht. Bezüglich AGP unterstützt der Chip zwar AGP 4x, aus Kompatibilitätsgründen laufen die Kyro-II-Grafikkarten per Firmware nur im AGP-2x-Modus.

Kyro, Kyro II und GeForce2 MX im Vergleich

Chip

Kyro

Kyro II

GeForce2 MX

Technologie

0,25 µm

0,18 µm

0,18 µm

Transistoren

12 Millionen

15 Millionen

k.A.

Max. Speicher

64 MByte

64 MByte

64 MByte

Speichertyp

SGRAM, SDRAM

SGRAM, SDRAM

SDRAM, SGRAM, DDR-SDRAM, DDR-SGRAM

Chiptakt

115 MHz

175 MHz

175 MHz

Speichertakt

115 MHz

175 MHz

166 MHz

Speicherbus

128 Bit

128 Bit

64/128 Bit

AGP-Mode

2x

2x

4x

Speicherbandbreite

1,8 GByte/s

2,73 GByte/s

2,6 GByte/s

Tile Based Rendering

Der Kyro II verwendet ein effektives Renderingverfahren - das Tile-Based-Rendering. Es eliminiert redundante Grafikoperationen und Speicherengpässe. Anders als bei herkömmlichen Grafikchips fasst der Kyro II bestimmte Gruppen von Polygonen (Tiles) in eine so genannte sichtbare Liste (Display-List) zusammen und rendert sie erst dann.

Die Vorteile des Kyro II liegen dabei auf der Hand: Aufgrund der kleinen Bildbereiche, den Tiles, kann der Prozessor Schlüsseloperationen wie das Z-Buffering, die Pixel-Berechnung und das Blending im Chip durchführen. Das heißt: Er benutzt einen kleinen On-Chip-Speicher für diese Operationen und muss nicht den externen Speicher auf der Grafikkarte verwenden. Das spart Speicherbandbreite und erhöht die 3D-Performance.

Beim Tile-Based-Rendering-Verfahren texturiert und schattiert der Grafikchip nur sichtbare Pixel, die der Betrachter auch sehen kann. Versteckte Texturen werden schon im ersten Arbeitsschritt in der Grafikpipeline eliminiert. STMicroelectronics nennt das Deferred-Texturing. Redundante Texturzugriffe auf den externen Grafikspeicher sind damit überflüssig.

Ein weiterer Vorteil des Tile-Based-Rendering ist die Skalierbarkeit des Verfahrens. So kann die Multi-Chip-Fähigkeit des Kyro II effizient genutzt werden, indem mehrere Berechnungen parallel auf verschiedenen Chips ablaufen.

Internal True Color Mode

Eine Besonderheit der Kyro-Familie ist der Internal True Color Mode. Damit sollen laut STMicroelectronics Spiele mit 16 Bit Farbauflösung besser aussehen.

Der Grafikprozessor führt intern die Farbmischoperationen aller Textur-Operationen in True-Color-Genauigkeit (Internal True Color) durch - unabhängig davon, ob eine 16- oder eine 32-Bit-Farbdarstellung gewählt wurde. Bei einem Spiel mit 16 Bit Farbtiefe wird nur die letzte Arbeitsstufe, das Schreiben in den Framebuffer, in 16 Bit Farbtiefe ausgegeben. Bei herkömmlichen Grafikchips ist das anders: Sie rendern Texturen zwar auch intern mit 32 Bit, rechnen aber nach jedem Arbeitsschritt die Textur wieder in 16 Bit Farbtiefe um. Durch dieses ständige Konvertieren der Farbtiefen sind die Qualitätsverluste höher als beim Kyro II, der die Farbtiefe nur einmal von 32 auf 16 Bit reduziert.

8-Layer-Multitexturing

Herkömmliche Grafikprozessoren benutzen zwei oder drei parallele Textur-Pipelines, um zwei oder drei Texturen in einem Arbeitsschritt zu verarbeiten. Dies schränkt das Multi-Texturing per Hardware auf die Anzahl der Pipelines ein. Wenn zum Beispiel mehr als drei Texturen verwendet werden, benutzen herkömmliche Grafikchips das Multi-Pass-Rendering. Das bedeutet: Das zu texturierende Objekt muss mehrere Durchläufe durch die Texturpipelines absolvieren.

Beim Kyro-II-Grafikchip mit 8-Layer-Multitexturing ist das anders: Das Prinzip des Kyro II basiert auf dem Tile-Based-Rendering. Zusammen mit dem 8-Layer-Multitexturing kann der Chip jeden Bildbereich, der ein Multi-Textur-Polygon enthält, im On-Chip-Speicher mit nur einer Pixelpipeline zum Multi-Textur-Bild verarbeiten. Dabei durchlaufen Teilbereiche des zu rendernden Bildes solange eine interne Schleifenfunktion (maximal 8), bis alle benötigten Textur-Layer aufgetragen sind. Separate Textureinheiten für weitere Textur-Layer sind nicht erforderlich.

Das 8-Layer-Multi-Texturing-Vefahren entlastet gegenüber dem Multi-Pass-Rendering den Datenfluss zum externen Grafikspeicher und zur CPU. Denn der Kyro II schickt seine Polygondaten nur einmal zur Verarbeitung an den Grafikspeicher und den Systemprozessor. Herkömmliche Grafikchips, wie die von NVIDIA, ATI oder 3dfx benötigen für diese Funktion mehrere Durchläufe über den Bildspeicher und die CPU. Dies reduziert insbesondere die effektive Füllrate der Chips.

2D-Benchmarks

Die 2D-Leistungsfähigkeit der Grafikkarten überprüfen wir mit dem Benchmark-Paket Bapco SYSmark2000. Diese Suite besteht aus aktuellen Anwendungsprogrammen.

Die 2D-Performance allein kann heute nicht mehr das entscheidende Kriterium für den Kauf einer Grafikkarte sein. Denn die aktuellen Grafikkarten liegen hier bereits alle auf gleich hohem Leistungsniveau. Aus diesem Grund legt tecChannel.de gesteigerten Wert auf Kompatibilität und stabile Funktion der Grafikboards.

3D-Benchmarks: 3DMark2000

Die unter MadOnions 3DMark2000 ermittelten Benchmarkwerte verdeutlichen, wie gut der Hersteller Grafikkarte und Treiber jeweils auf 3D-Software abgestimmt hat. Durch speicherintensive Tests wird zusätzlich auch der AGP-Bus stark beansprucht.

3D-Benchmarks: Expendable

Expendable ist ein Direct3D-Spiel. Es bietet komplexe Lichteffekte und Texturen. Besonders bei hohen Auflösungen und Farbtiefen wird die Hardware stark belastet. Das Spiel profitiert besonders von der Performance des PC-Speichers.

3D-Benchmarks: MDK2

Wir verwenden die Demoversion des Spiels MDK2. Sie basiert auf einer eigens von Interplay entwickelten Engine und setzt nur auf OpenGL. Hohe Polygonanzahl und große Texturen stellen enorme Anforderungen an den Grafikprozessor und an die Speicherbandbreite. MDK2 unterstützt außerdem das T&L-Verfahren.

3D-Benchmarks: Quake III Arena - Teil 1

Quake III Arena setzt ganz auf OpenGL. Dieses 3D-Spiel zeichnet sich durch hohe Polygonanzahl und komplexe Szenarien aus. Die Anforderungen an die Hardware und besonders an die Speicherbandbreite der Grafikkarten sind bei Auflösungen ab 1024x768 Punkten und 32 Bit Farbtiefe sehr hoch.

3D-Benchmarks: Quake III Arena - Teil 2

Quake III Arena setzt ganz auf OpenGL. Dieses 3D-Spiel zeichnet sich durch hohe Polygonanzahl und komplexe Szenarien aus. Die Anforderungen an die Hardware und besonders an die Speicherbandbreite der Grafikkarten sind bei Auflösungen ab 1024x768 Punkten und 32 Bit Farbtiefe sehr hoch.

3D-Benchmarks: TestDrive 6

Wir verwenden die Demo-Version des Spiels Test Drive 6. Sie besitzt komplexe 3D-Spielszenarien mit großen Texturen und hoher Polygonanzahl. Das Demo profitiert besonders von einer hohen Bandbreite des Grafikspeichers. Zusätzlich unterstützt es T&L-Geometriebeschleunigung unter DirectX.

3D-Benchmarks: Unreal Tournament

Unreal Tournament bietet viele Effekte und belastet besonders die PC-CPU. Das Spiel verlangt vom Grafikkarten- und Systemspeicher eine hohe Speicherbandbreite. Es unterstützt Direct3D, OpenGL sowie GLide und Metal (S3). Wir verwenden das Spiel ausschließlich mit Direct3D.

3D-Benchmarks: Indy3D

Indy3D ist ein OpenGL-basierender, synthetischer Benchmark. Er testet die drei wichtigsten Anwendungsgebiete für Grafikkarten im Highend-Bereich für den beruflichen Einsatz: CAD-Anwendungen, Animationen und Simulationen.

Video-Benchmark: Video2000

Der Video2000-Benchmark von MadOnion ermittelt die Videoperformance und -qualität der Grafikprozessoren.

Der Performance-Test des Video2000 untersucht die Geschwindigkeit der grundlegenden Videofunktionen einer Grafikkarte und gibt sie in Form eines numerischen Wertes aus. Die Gewichtung der Einzelergebnisse erfolgt nach einem fest vorgegebenen Schlüssel. Zu den einzelnen Tests gehören: Blitter-Performance, Data-Transfer-Performance, SoftDVD Playback, CPU-Belastung und MPEG-2-Encoder-Performance.

Der Quality-Test ermittelt die Videoqualität einer Grafikkarte. Das Ergebnis ist ein numerischer Wert. Der Test erfolgt interaktiv anhand vorgegebener Testbilder und festgelegter Gewichtung der Einzelergebnisse. Dabei werden folgende Qualitätsmerkmale abgefragt: Up- und Downscaling, Colorspace Conversion (CSC), De-Interlacing und Tearing.

FSAA

Neben den aktuellen Grafikchips von 3dfx, ATI und NVIDIA unterstützt auch der Kyro II von STMicroelectronics FSAA. Einzig bei Matrox mangelt es bislang mit am Support.

Der RADEON und die GeForce-Chips arbeiten nach dem gleichen FSAA-Verfahren wie der Kyro II - dem Supersampling. Die Voodoo5 5500 benutzt dazu den T-Buffer. Der neue NVIDIA GeForce3-Prozessor arbeitet dagegen nach dem Multisampling-Verfahren.

Der Kyro II bietet drei verschiedene FSAA-Modi zum Einstellen:

Die Auswirkungen von FSAA auf die Performance finden Sie in den folgenden Tabellen. Zum Test verwenden wir das OpenGL-Spiel Quake III Arena:

Auflösung: 640x480 bei 32 Bit Farbtiefe

Quake III Arena, High Quality

ohne FSAA [fps]

2x FSAA [fps]

4x FSAA [fps]

3dfx Voodoo5 5500 SDRAM 64 MByte

82,0

77,3

43,4

ATI RADEON DDR-SDRAM 64 MByte

102,6

74,2

--

NVIDIA GeForce2 GTS DDR-SDRAM 64 MByte

106,5

58,6

--

NVIDIA GeForce2 Pro DDR-SDRAM 64 MByte

106,9

68,4

--

NVIDIA GeForce2 Ultra DDR-SDRAM 64 MByte

107,2

79,0

--

STM Kyro II SDRAM 64 MByte

97,2

89,4

60,2

Auflösung: 800x600 bei 32 Bit Farbtiefe

Quake III Arena, High Quality

ohne FSAA [fps]

2x FSAA [fps]

4x FSAA [fps]

3dfx Voodoo5 5500 SDRAM 64 MByte

81,2

53,0

25,8

ATI RADEON DDR-SDRAM 64 MByte

96,3

50,2

--

NVIDIA GeForce2 GTS DDR-SDRAM 64 MByte

103,3

38,2

--

NVIDIA GeForce2 GTS DDR-SGRAM 32 MByte

103,1

34,1

--

NVIDIA GeForce2 Pro DDR-SDRAM 64 MByte

105,1

44,7

--

NVIDIA GeForce2 Ultra DDR-SDRAM 64 MByte

106,1

52,5

--

STM Kyro II SDRAM 64 MByte

93,1

71,8

39,2

Auflösung: 1024x768 bei 32 Bit Farbtiefe

Quake III Arena, High Quality

ohne FSAA [fps]

2x FSAA [fps]

4x FSAA [fps]

3dfx Voodoo5 5500 SDRAM 64 MByte

65,8

33,2

12,4

ATI RADEON DDR-SDRAM 64 MByte

76,6

29,3

--

NVIDIA GeForce2 GTS DDR-SDRAM 64 MByte

90,2

23,8

--

NVIDIA GeForce2 Pro DDR-SDRAM 64 MByte

95,6

27,3

--

NVIDIA GeForce2 Ultra DDR-SDRAM 64 MByte

100,7

32,2

--

STM Kyro II SDRAM 64 MByte

78,3

46,3

24,1

FSAA zählt zu den großen Stärken des Kyro II. Sowohl die Chips von 3dfx, ATI und NVIDIA haben bei aktiviertem FSAA in allen Auflösungen das Nachsehen.

Fazit

Obwohl der neue Kyro II von STMicroelectronics streng genommen nur ein höher getakteter Kyro ist, überzeugt das Ergebnis. Ungeniert dringt er in Bereiche wesentlich teurerer Grafikkarten mit RADEON- und GeForce2-GTS-Chips vor.

Die Konkurrenz im gleichen Preissegment, GeForce2-MX- und RADEON-VE-Grafikkarten, haben Kyro-II-Boards fest im Griff. Hinzu kommt mit zirka 340 Mark ein Preis, der für die gebotene Performance mehr als fair ist.

Bemerkenswert ist, dass kaum Performance-Unterschiede zwischen 16 und 32 Bit Farbtiefe auffallen. Verantwortlich dafür ist der Internal True Color Mode: Bei 16 Bit Farbtiefe rechnet der Chip intern ebenfalls mit 32 Bit.

Wenig verwundert die Tatsache, dass der Kyro II selbst bei komplexer werdenden Szenen kaum einbricht: Seine effektive Tile-Based-Rendering-Architektur bearbeitet nur, was auch zu sehen ist. Versteckte Texturen bleiben außen vor: Das spart Rechenzeit und entlastet den Grafikspeicher.

Ein Highlight ist die FSAA-Unterstützung des Kyro II. Selbst dreimal so teure GeForce2-Ultra-Grafikkarten können bei aktiviertem FSAA-Modus mit der Performance des Kyro II nicht mithalten.

Negativ macht sich die fehlende Unterstützung für T&L bemerkbar. So zeigt sich ein Performance-Einbruch bei T&L-Spielen, da die System-CPU die notwendige Rechenarbeit übernehmen muss. Auch die Performance bei professionellen OpenGL-Anwendungen lässt teilweise noch zu wünschen übrig. Hier muss STMicroelectronics noch bei den Treibern nachbessern.

Zu bemängeln ist auch die fehlende Unterstützung von DirectX8. Künftige Spiele, die auf die neuen Funktionen von DirectX8 setzen, dürften mit dem Kyro II somit Performanceeinbußen erleiden. Allerdings trifft dies auch Karten mit dem GeForce2 MX und dem RADEON VE - nur der in einer anderen (Preis)-Liga spielende GeForce3 ist bereits auf DirectX8 zugeschnitten. Dass Kyro-II-Grafikkarten bislang nur AGP 2x unterstützen ist dagegen zu verschmerzen - AGP 4x bringt bei aktuellen Anwendungen definitiv keinen Vorteil.

Insgesamt ist der Kyro II ein gelungenes Produkt und Grafikkarten wie die Hercules 3D Prophet 4500 sind zu empfehlen. (cvi)