JPEG 2000: Das neue Format für Bilder

09.08.2001 von RALPH MENN 
Bei hohen Kompressionsraten gerät das JPEG-Format schnell an seine Grenzen. Der inzwischen finalisierte Nachfolger JPEG 2000 vermeidet Artefakte, bietet mehr Features und eine bessere Kompression.

Der JPEG-Standard ist in die Jahre gekommen. Gegenüber anderen Bildformaten bietet das Format zwar um bis zu 95 Prozent geringere Dateigrößen bei vollen 24 Bit Farbtiefe, es hat aber gleichzeitig unerwünschte Eigenschaften: Bei hohen Kompressionsfaktoren erzeugt das von der Joint Photographic Experts Group verabschiedete Standardformat deutlich sichtbare Artefakte.

Damit ist bei dem kommenden JPEG-2000-(j2k-)Bildformat Schluss. Es bietet um 30 Prozent höhere Kompressionsraten, so dass die blockförmigen Artefakte nun der Vergangenheit angehören. Durch die neu eingesetzte Wavelet-Kompression erscheinen die Bilder bei zu hohen Kompressionsraten lediglich schwammig oder verwischt.

Auf folgende Kriterien wurde bei JPEG 2000 besonders Wert gelegt:

Vorteile von JPEG 2000

Mit JPEG 2000 werden erstmals eine ganze Reihe wichtiger Eigenschaften zur Verfügung stehen, die man für moderne Anwendungsfälle benötigt:

Lizenz- und patentfreier Standard

Im Gegensatz zu GIFs sind alle JPEG-Formate lizenz- und patentfrei. In der Normengruppe ISO/IEC JTC l/SC 29/WG1 arbeiten etwa 80 Firmen und Universitäten aus 18 Ländern an der Definition und Entwicklung des neuen Grafikformats. Seit Anfang 2000 geht die Gruppe auch die konkrete technische Implementierung an.

Der endgültige Standard wird demnächst unter dem Namen ISO/IEC 15444-1:2000 oder ITU-I Recommendation T.800 von der ISO, der ITU oder dem JPEG-Komitee zu beziehen sein. Folgender Zeitplan informiert über bisher erreichte und geplante Teile des JPEG-2000-Standards:

Nachteile des klassischen JPEG

JPEG ist ein verlustbehaftetes (lossy) Bildformat, das durch die Reduktion von Bildinhalten den erwünschten Kompressionsfaktor erreicht. Das Kodieren des Bildes erfolgt über eine diskrete Cosinus-Transformation (DCT). Zusätzlich teilt das JPEG-Verfahren das Bild vorab in 8 x 8 Pixel große Blöcke auf. Dabei wird ein JPEG - wie im Bild gezeigt - durch ein sequenzielles Schema (Baseline) berechnet.

.

Die Verluste beim Komprimieren rühren im Wesentlichen von der Quantisierungsstufe her, in der eine mehr oder weniger radikale Zusammenfassung der in der DCT errechneten Werte geschieht. Durch die Entropiekodierung, die der in normalen Dateipackern ähnelt, werden diese Werte nachträglich verlustlos zusammengefasst. Aus diesem Grunde sind JPEG-Dateien durch Packer wie WinZip nicht mehr weiter zu verkleinern.

Weitblick verhindert Artefakte

Bedingt durch das Aufteilen des Bildes vor der Kompression in Blöcke (8 x 8 Pixel), treten an den Kanten der Blöcke störende Artefakte auf. Dieses so genannte Gibbsche Phänomen entsteht durch die Quantisierung in Verbindung mit der diskreten Cosinus-Transformation.

Auch die Anpassung an andere Farbräume als RGB erweist sich bei JPEG als schwierig: Farbverfälschungen beim Austausch zwischen Mac- und Windows-Software sind keine Seltenheit. Die schlechte Zoombarkeit von JPEG-komprimierten Bildern stellt bei vielen Anwendungen ebenfalls einen Nachteil des bisherigen Formats dar.

Als Grundlage für das neue JPEG-2000-Format wurde eine Technologie gesucht, die das Bild nicht in kleine Blöcke aufteilt, sondern in seiner Gesamtheit beschreibt. Das vom JPEG-Komitee bestimmte Verfahren auf der Basis von Wavelet-Transformationen bietet diesen Vorteil. Grundsätzlich stellt dieser Ansatz höhere Anforderungen an die Hardware, da das gesamte Bild und seine mathematische Repräsentation gleichzeitig im Speicher steht. Durch die stetig gewachsene Rechenleistung aktueller PCs stellt dies heute kein Problem mehr dar. Durch die neue Technik sind aber die beiden Formate JPEG und JPEG 2000 nicht miteinander kompatibel.

Ruhm und Ehre als Motivation

Der kommerzielle Einsatz von Wavelet-Algorithmen bei der Bildkompression war bisher immer mit Patenten und Lizenzzahlungen verknüpft. In einem vom JPEG-Komitee ausgerichteten Wettbewerb wurde unter den teilnehmenden Firmen der beste Algorithmus für die Kompression von Farb- und Graustufenbildern gesucht. Die Bedingung für die Teilnahme war, dass der Gewinner seinen Algorithmus für den allgemeinen Gebrauch ohne Lizenzgebühren freigibt. Der Lohn des Siegers besteht lediglich im Renommee, das er beispielsweise zum Vermarkten von spezialisierten Wavelet-Algorithmen nutzen kann.

Im Wettbewerb zeigten sich größtenteils nur geringe Unterschiede bei den Ergebnissen der einzelnen Algorithmen. Dennoch, kein Wavelet gleicht dem anderen. Jeder Hersteller versucht dabei einen Kompromiss zu finden zwischen Kriterien wie Speicherbedarf und CPU-Belastung sowie der eigentlichen Bild- beziehungsweise Kompressionsqualität.

And the winner is ...

Im Dezember 2000 wurde der Teil des JPEG-2000-Standards offiziell verabschiedet, in dem das gültige Kodierungsschema definiert ist. Aus dem von der ISO ausgerichteten Kompressionswettbewerb ging eine Diskrete Wavelet Transformation auf der Basis einer 9/7-Daubechie-Wavelet-Funktion für die verlustbehaftete (lossy) Kompression und eines symmetrischen 5/3-Filters für die verlustlose (lossless) Kompression als Sieger hervor.

Die Ausgangsdaten dieser Transformation werden dann mit dem von Prof. Taubman an der Universität von New South Wales entwickelten EBCOT-Verfahren (Embedded Block Coding with Optimized Truncation) in Blöcken organisiert, um so einen Datenstrom aus voneinander unabhängigen "Layern" zu erzeugen. Diese können beim Übertragen, z.B. über das Internet, eine unterschiedliche Priorität erhalten. So wird eine progressive Darstellung erreicht.

Anschließend erfolgt die eigentlich Verlust bringende Quantisierung, die sich bei JPEG 2000 so steuern lässt, dass man fest vorgegebene Kompressionsfaktoren erreicht. Beim Vorgänger JPEG waren für die Kompression nur feste Qualitätsparameter möglich.

Am Ende kommt eine arithmetische Kodierung zum Zuge, um vorhandene Redundanzen aus den Daten zu entfernen. Diese ist zwar mit Lizenzen von IBM belegt, es wird allerdings erwartet, dass IBM seine Ansprüche fallen lässt.

Hohe Kompressionsraten

Durch die Wavelet-Transformationen verschwindet die von JPEG bekannte Bildung blockförmiger Artefakte. Das Bild wird bei der Wavelet-Transformation in seiner Gesamtheit erfasst. Die Transformation ist bis auf Rundungsfehler verlustlos. Wie beim bisherigen JPEG-Verfahren stecken die Verluste in der Quantisierung, dem gruppenweisen Zusammenfassen der Wavelet-Koeffizienten.

.

Je nach Kompressionsfaktor erfolgt die Quantisierung mehr oder weniger stark und bringt vor allem bei sehr hohen Kompressionsraten Qualitätsverluste. Dem Bild fehlen dann die Anteile mit hohem Kontrast, und der Gesamteindruck des Bildes wirkt verschmiert. Je nach Vorlage und Einsatzzweck liefern aber selbst Kompressionsraten von 100:1 noch brauchbare Bilder.

Wavelet-Grundlagen

Die mathematischen Grundlagen der heutigen Wavelet-Transformationen wurden bereits in den Dreißiger Jahren erarbeitet. Der Begriff Wavelet beschreibt eine Klasse von Funktionen, deren Aussehen an eine Mischung zwischen impuls- und sinus-förmigen Funktionen erinnert. Gegenüber der Fourier-Transformation, bei der unendlich lange Sinus- und Cosinusfunktionen zur Signaldarstellung dienen, bringen die zeitlich begrenzten Funktionen für viele Anwendungen Vorteile.

.

Im Gegensatz zur Fourier-Transformation zerlegt die Wavelet-Transformation ein Bild nicht komplett in seine Frequenzkomponenten, sondern filtert es nach und nach in immer gröbere Bildstrukturen. Dies geschieht durch iteriertes Anwenden von Hoch- und Tiefpassfiltern, die "schnelle" (detailreiche) Bildelemente von den "langsamen" (gleichförmigen) Grundelementen trennen. Der Arbeitsschritt wird auch als Subband-Coding bezeichnet. Zusätzlich entfernt man bei jedem Schritt jeweils die Hälfte der Zeilen und Spalten. Dies verkleinert das Bild bei jedem Iterationsschritt jeweils um den Faktor vier. Das Bild zeigt die Abfolge von Hochpass- und Tiefpassfiltern bei der Wavelet-Transformation:

Stufenlose Kompressionsrate

Die zeitlich begrenzten Wavelet-Basisfunktionen werden so lange passend verschoben und skaliert, bis bei der Kompression das Bild in seiner Gesamtheit und in der gewünschten Detailstufe repräsentiert ist. Das Verfahren lässt sich beliebig iterieren, wodurch das stufenlose Anpassen der Kompressionsrate an die jeweilige Anwendung möglich ist.

.

Das Ergebnis der Wavelet-Transformation sind so genannte Wavelet-Koeffizienten, die das Bild direkt in verschiedenen Auflösungen als verkleinerte Kopien beschreiben. Zusätzlich enthalten die Koeffizienten noch hoch- und tiefpassgefilterte Versionen der Originalbilder (siehe Schaubild).

.

Analog zum bisherigen JPEG-Verfahren findet bei der Wavelet-Kompression noch eine verlustbehaftete Quantisierung und anschließende Entropiekodierung zur Reduktion der Datenmenge statt.

Weniger Kompression in Regions of Interest

Ein um mindestens 30 Prozent höherer Kompressionsfaktor als bei JPEG ist mit JPEG 2000 relativ sicher. In Einzelfällen sind noch stärkere Kompressionsraten möglich. Die von JPEG bekannten blockförmigen Artefakte gehören mit JPEG 2000 der Vergangenheit an. Doch bei hohen Kompressionsraten lässt die Bildschärfe nach. Zu hoch komprimierte JPEG-2000-Bilder wirken daher schwammig.

.

Um unter Umständen noch höhere Kompressionsraten zu erreichen, kennt JPEG 2000 so genannte Regions of Interest (ROI). Der Anwender definiert mit der ROI einen Bildteil, der besonders schonend komprimiert wird, und erlaubt gleichzeitig eine stärkere Kompression des restlichen Bildes (z.B. eines Hintergrunds). Die ROI bleibt auch bei hoher Kompressionsrate scharf, während die vom Anwender als unwichtig definierten Bildteile an Details verlieren.

Farbräume und inkrementeller Bildaufbau

Gegenüber dem alten JPEG-Format bietet die Farbverwaltung von JPEG 2000 erhebliche Vorteile. Sie kennt bis zu 256 Farbkanäle. Somit kann ein Bild zum Beispiel RGB und CMYK gleichzeitig unterstützen. Grundsätzlich bietet JPEG 2000 den definierten Standardfarbraum sRGB an. Zusammen mit einem entsprechenden ICC-Profil ist das Aussehen der JPEG-2000-Bilder dadurch auf jeder Rechnerplattform und jedem Ausgabegerät gleich.

Stark verbessert präsentiert sich auch die Dekompression der Bilddaten: Die inkremental progressive Dekompression ist fester Bestandteil von JPEG 2000. Das Bild wird von Anfang an komplett angezeigt, lediglich die Anzahl der Details erhöht sich mit jedem Ladeschritt für das gesamte Bild. Diese Eigenschaft bringt etliche Vorteile: Ist ein Bild nur in einer größeren Auflösung oder Qualität als benötigt vorhanden, braucht man lediglich einen Teil der Datei zu laden.

Auf diese Weise lässt sich zum Beispiel in der Druckindustrie ein Proof lokal in mittlerer Qualität bearbeiten, während die Originaldatei in höchster Qualität direkt zum Belichten geht. In beiden Fällen erfolgt ein Zugriff auf die Originaldatei, für den Proof wird jedoch nur ein Teil der Daten geladen.

Auch Vorschaubilder für Webseiten lassen sich auf diese Weise realisieren: Statt eine zweite, verkleinerte Version des Bildes zu erzeugen, wird einfach nur ein kleiner Teil der Originaldatei geladen. Ebenfalls vorgesehen ist bei JPEG 2000 das Einfügen von Metadaten wie Datum, HTML-Links, Farbkalibrierung oder ein Wasserzeichen als Kopierschutz.

Legenden und Wahrheit

Grafikanwender in aller Welt, die sich vom Format JPEG 2000 eine Revolution erwartet haben, sehen sich beim Testen der ersten Implementierungen teilweise enttäuscht. Daher ist es höchste Zeit, mit dem einen oder anderen Märchen ein für alle Mal Schluss zu machen.

JPEG 2000 stellt eine in allen Bereichen verfeinerte Version von JPEG dar, nicht mehr, aber auch nicht weniger. Der Ersatz der DCT durch die Wavelet Transformation hat zur Folge, dass sich Artefakte zwar unterbinden lassen, wer jedoch auf Kompressionsfaktoren jenseits der 100 hofft, muss lange suchen, bis er ein geeignetes Bild findet.

Fakt ist, dass man mit JPEG 2000 in der Regel um 30% besser komprimieren kann als mit dem alten JPEG. Also statt 20:1 mit 27:1 bei gleicher subjektiver Qualität. Allerdings kann die geschickte Auswahl eines Bildes auch einmal zum umgekehrten Ergebnis führen. Manche Webseiten liefern dafür gute Beispiele. Als Faustregel komprimieren Wavelets besser bei hohen Kontrasten, JPEGs besser bei Texturen. Die Lossless-Implementierung von JPEG 2000 arbeitet mit rund 2:1 etwas schlechter als der Vorgänger, was vor allem die Radiologen unter den Anwendern enttäuschen wird.

Die mathematische Komplexität der Wavelets-Kompression ist gut und gerne zehn Mal höher als die DCT von JPEG. Bei modernen PCs fällt dies nicht ins Gewicht. Probleme bereitet es vor allem Digitalkameras, da sich die Zeit zwischen zwei Aufnahmen deutlich verlängert. Hier ist ein Kompromiss zwischen Rechenleistung, Speicherbedarf und Batterieverbrauch nötig.

JPEG wird auch weiterhin eine Alternative bleiben. Denn so schlecht komprimiert es gar nicht: Im Kompressionsvergleich der ISO mit verschiedenen JPEG-2000-Implementationen hat es nicht als Letzter abgeschnitten. Zehn Jahre Feinarbeit machen sich bezahlt.

Fazit

Mit dem JPEG-2000-Format erhalten längst überfällige Features Einzug in den JPEG-Standard. Die Funktionen kommen dem Internet-Anwender genauso zugute wie den Profis der Foto- und Druckindustrie.

Den Hoffnungen der Webdesigner auf ein neues Format, das Transparenz oder Animation unterstützt, wird aber nicht Rechnung getragen. Außerdem wird die Kompatibilität zum alten JPEG-Format außen vor gelassen, was schon am Formatkürzel *.j2k ersichtlich ist. Weitere Fallen lauern in der Funktionsvielfalt des Standards. Bleibt zu hoffen, dass die großen Browser-Hersteller in diesem Fall alle Features direkt implementieren, um dem Anwender Inkompatibilitäten zu ersparen.

Dennoch gelingt JPEG 2000 mit den neuen Funktionen und der Kompression auf Wavelet-Basis ein entscheidender Schritt nach vorn - für alle Bereiche der Bildverarbeitung. (ala)

Links zu aktueller JPEG-2000-Software

Einige Hersteller und Universitäten haben bereits "dialektfreie" Codecs in Plug-ins, Active-X-Controls und SDKs implementiert. Ziel der ISO war und ist es ja, den Formatzoo der bisherigen Grafikformate zu unterbinden, der keine echte Normierung ermöglicht. Dennoch haben die Grafikspezialisten der Digital Imaging Group auch mit JPEG 2000 wieder ihre eigenen Ideen.

So reichte z.B. den Vertretern der Druckindustrie der normierte Farbraum sRGB nicht aus. Deshalb werden demnächst Extensions veröffentlicht, die das ICC-Profil als Basis zur Farbkalibration nutzen. Weitere Ergänzungen wie eine bessere Quantisierung (Trellis-Coded) sind abzuwarten.

Anbieter von SDKs, Plug-ins und Viewern

LEADTOOLS, USA

http://www.leadtools.com

AWARE, USA

http://www.aware.com

PEGASUS IMAGING, USA

http://www.pegasustools.com

ALGOVISION, Deutschland, (sehr standardnahe Implementierung),

http://www.algovision.de

LURATECH, Deutschland

http://www.luratech.de

Ecole Polytechnique Fédérale de Lausanne, Schweiz

http://jj2000.epfl.ch

IMAGE POWER, Kanada

http://www.imagepower.com/

University of New South Wales, Prof. Taubman

http://maestro.ee.unsw.edu.au

JASPER Quellcode

http://www.ece.ubc.ca

Offizielle JPEG-2000-Seite

http://www.jpeg.org