Der JPEG-Standard ist in die Jahre gekommen. Gegenüber anderen Bildformaten bietet das Format zwar um bis zu 95 Prozent geringere Dateigrößen bei vollen 24 Bit Farbtiefe, es hat aber gleichzeitig unerwünschte Eigenschaften: Bei hohen Kompressionsfaktoren erzeugt das von der Joint Photographic Experts Group verabschiedete Standardformat deutlich sichtbare Artefakte.
Damit ist bei dem kommenden JPEG-2000-(j2k-)Bildformat Schluss. Es bietet um 30 Prozent höhere Kompressionsraten, so dass die blockförmigen Artefakte nun der Vergangenheit angehören. Durch die neu eingesetzte Wavelet-Kompression erscheinen die Bilder bei zu hohen Kompressionsraten lediglich schwammig oder verwischt.
Auf folgende Kriterien wurde bei JPEG 2000 besonders Wert gelegt:
hohe subjektive und quantitative Bildqualität
hoher Kompressionsfaktor
kurze Kodier- und Dekodierzeit
niedriger Speicherbedarf bei Kompression und Dekompression
Vorteile von JPEG 2000
Mit JPEG 2000 werden erstmals eine ganze Reihe wichtiger Eigenschaften zur Verfügung stehen, die man für moderne Anwendungsfälle benötigt:
stufenloser Übergang bei der Übertragung von lossy zu lossless möglich
Definition von Regions of Interest
Einsatz so genannter Resync-Marker zum Erhöhen von Fehlertoleranz und Fehlerkorrektur, die es beim Abriß einer Datenübertragung ermöglichen, Daten "anzusetzen". Dies wird beim neuen UMTS-Standard von höchster Wichtigkeit sein
nur noch ein Dekompressionsmodus (in JPEG sind 44 definiert)
progressiver Modus verbindlich implementiert
gesteigerte Kompressionsleitung vor allem bei hohen Kompressionsraten
bis zu 256 Farbkanäle
erstmalig eine echte Farbkompressionskomponente
Unterstützung von Bildern jenseits von 64k x 64k Pixel, höherer Farbtiefe und ICC-Farbprofilen
bessere Unterstützung medizinischer Bildformate, mehr Graustufen und mehr Abstufungen
direkte Unterstützung von Wasserzeichen und Sicherheitsmerkmalen sowie Metadaten
schnellere und vereinfachte Motion-JPEG-2000-Implementierung als Videokodierung, wesentlich geringere Komplexität als MPEG
rückwärtskompatibel zu JPEG
Faxunterstützung (also Halbton, S/W)
bessere Anpassung an mobile Datenübertragung durch flexible Datenrate
Lizenz- und patentfreier Standard
Im Gegensatz zu GIFs sind alle JPEG-Formate lizenz- und patentfrei. In der Normengruppe ISO/IEC JTC l/SC 29/WG1 arbeiten etwa 80 Firmen und Universitäten aus 18 Ländern an der Definition und Entwicklung des neuen Grafikformats. Seit Anfang 2000 geht die Gruppe auch die konkrete technische Implementierung an.
Der endgültige Standard wird demnächst unter dem Namen ISO/IEC 15444-1:2000 oder ITU-I Recommendation T.800 von der ISO, der ITU oder dem JPEG-Komitee zu beziehen sein. Folgender Zeitplan informiert über bisher erreichte und geplante Teile des JPEG-2000-Standards:
Teil 1: Verabschiedung des lizenzfreien und verbindlichen Kodierungsschemas im Dezember 2000.
Teil 2: Ergänzungen des Standards. Diese können lizenzbelastet sein und sind nicht verbindlich. Erscheinungstermin des Drafts: Juli 2001
Teil 3: Motion-JPEG-2000. Erscheinungstermin des Drafts zum internationalen Standard: März 2001; geplante Verabschiedung: Ende 2001.
Teil 4: Konformitätstests bis August 2001.
Teil 5: Erscheinungstermin der Referenzsoftware: Spätsommer 2001. Quellen dazu siehe Ende dieses Artikels.
Teil 6: Ein Draft für vermischte Bildformat-Inhalte (Grafik und Text) wird im Sommer 2001 erwartet, geplanter Verabschiedungstermin 2002.
Nachteile des klassischen JPEG
JPEG ist ein verlustbehaftetes (lossy) Bildformat, das durch die Reduktion von Bildinhalten den erwünschten Kompressionsfaktor erreicht. Das Kodieren des Bildes erfolgt über eine diskrete Cosinus-Transformation (DCT). Zusätzlich teilt das JPEG-Verfahren das Bild vorab in 8 x 8 Pixel große Blöcke auf. Dabei wird ein JPEG - wie im Bild gezeigt - durch ein sequenzielles Schema (Baseline) berechnet.
.
Die Verluste beim Komprimieren rühren im Wesentlichen von der Quantisierungsstufe her, in der eine mehr oder weniger radikale Zusammenfassung der in der DCT errechneten Werte geschieht. Durch die Entropiekodierung, die der in normalen Dateipackern ähnelt, werden diese Werte nachträglich verlustlos zusammengefasst. Aus diesem Grunde sind JPEG-Dateien durch Packer wie WinZip nicht mehr weiter zu verkleinern.
Weitblick verhindert Artefakte
Bedingt durch das Aufteilen des Bildes vor der Kompression in Blöcke (8 x 8 Pixel), treten an den Kanten der Blöcke störende Artefakte auf. Dieses so genannte Gibbsche Phänomen entsteht durch die Quantisierung in Verbindung mit der diskreten Cosinus-Transformation.
Auch die Anpassung an andere Farbräume als RGB erweist sich bei JPEG als schwierig: Farbverfälschungen beim Austausch zwischen Mac- und Windows-Software sind keine Seltenheit. Die schlechte Zoombarkeit von JPEG-komprimierten Bildern stellt bei vielen Anwendungen ebenfalls einen Nachteil des bisherigen Formats dar.
Als Grundlage für das neue JPEG-2000-Format wurde eine Technologie gesucht, die das Bild nicht in kleine Blöcke aufteilt, sondern in seiner Gesamtheit beschreibt. Das vom JPEG-Komitee bestimmte Verfahren auf der Basis von Wavelet-Transformationen bietet diesen Vorteil. Grundsätzlich stellt dieser Ansatz höhere Anforderungen an die Hardware, da das gesamte Bild und seine mathematische Repräsentation gleichzeitig im Speicher steht. Durch die stetig gewachsene Rechenleistung aktueller PCs stellt dies heute kein Problem mehr dar. Durch die neue Technik sind aber die beiden Formate JPEG und JPEG 2000 nicht miteinander kompatibel.
Ruhm und Ehre als Motivation
Der kommerzielle Einsatz von Wavelet-Algorithmen bei der Bildkompression war bisher immer mit Patenten und Lizenzzahlungen verknüpft. In einem vom JPEG-Komitee ausgerichteten Wettbewerb wurde unter den teilnehmenden Firmen der beste Algorithmus für die Kompression von Farb- und Graustufenbildern gesucht. Die Bedingung für die Teilnahme war, dass der Gewinner seinen Algorithmus für den allgemeinen Gebrauch ohne Lizenzgebühren freigibt. Der Lohn des Siegers besteht lediglich im Renommee, das er beispielsweise zum Vermarkten von spezialisierten Wavelet-Algorithmen nutzen kann.
Im Wettbewerb zeigten sich größtenteils nur geringe Unterschiede bei den Ergebnissen der einzelnen Algorithmen. Dennoch, kein Wavelet gleicht dem anderen. Jeder Hersteller versucht dabei einen Kompromiss zu finden zwischen Kriterien wie Speicherbedarf und CPU-Belastung sowie der eigentlichen Bild- beziehungsweise Kompressionsqualität.
And the winner is ...
Im Dezember 2000 wurde der Teil des JPEG-2000-Standards offiziell verabschiedet, in dem das gültige Kodierungsschema definiert ist. Aus dem von der ISO ausgerichteten Kompressionswettbewerb ging eine Diskrete Wavelet Transformation auf der Basis einer 9/7-Daubechie-Wavelet-Funktion für die verlustbehaftete (lossy) Kompression und eines symmetrischen 5/3-Filters für die verlustlose (lossless) Kompression als Sieger hervor.
Die Ausgangsdaten dieser Transformation werden dann mit dem von Prof. Taubman an der Universität von New South Wales entwickelten EBCOT-Verfahren (Embedded Block Coding with Optimized Truncation) in Blöcken organisiert, um so einen Datenstrom aus voneinander unabhängigen "Layern" zu erzeugen. Diese können beim Übertragen, z.B. über das Internet, eine unterschiedliche Priorität erhalten. So wird eine progressive Darstellung erreicht.
Anschließend erfolgt die eigentlich Verlust bringende Quantisierung, die sich bei JPEG 2000 so steuern lässt, dass man fest vorgegebene Kompressionsfaktoren erreicht. Beim Vorgänger JPEG waren für die Kompression nur feste Qualitätsparameter möglich.
Am Ende kommt eine arithmetische Kodierung zum Zuge, um vorhandene Redundanzen aus den Daten zu entfernen. Diese ist zwar mit Lizenzen von IBM belegt, es wird allerdings erwartet, dass IBM seine Ansprüche fallen lässt.
Hohe Kompressionsraten
Durch die Wavelet-Transformationen verschwindet die von JPEG bekannte Bildung blockförmiger Artefakte. Das Bild wird bei der Wavelet-Transformation in seiner Gesamtheit erfasst. Die Transformation ist bis auf Rundungsfehler verlustlos. Wie beim bisherigen JPEG-Verfahren stecken die Verluste in der Quantisierung, dem gruppenweisen Zusammenfassen der Wavelet-Koeffizienten.
.
Je nach Kompressionsfaktor erfolgt die Quantisierung mehr oder weniger stark und bringt vor allem bei sehr hohen Kompressionsraten Qualitätsverluste. Dem Bild fehlen dann die Anteile mit hohem Kontrast, und der Gesamteindruck des Bildes wirkt verschmiert. Je nach Vorlage und Einsatzzweck liefern aber selbst Kompressionsraten von 100:1 noch brauchbare Bilder.
Wavelet-Grundlagen
Die mathematischen Grundlagen der heutigen Wavelet-Transformationen wurden bereits in den Dreißiger Jahren erarbeitet. Der Begriff Wavelet beschreibt eine Klasse von Funktionen, deren Aussehen an eine Mischung zwischen impuls- und sinus-förmigen Funktionen erinnert. Gegenüber der Fourier-Transformation, bei der unendlich lange Sinus- und Cosinusfunktionen zur Signaldarstellung dienen, bringen die zeitlich begrenzten Funktionen für viele Anwendungen Vorteile.
.
Im Gegensatz zur Fourier-Transformation zerlegt die Wavelet-Transformation ein Bild nicht komplett in seine Frequenzkomponenten, sondern filtert es nach und nach in immer gröbere Bildstrukturen. Dies geschieht durch iteriertes Anwenden von Hoch- und Tiefpassfiltern, die "schnelle" (detailreiche) Bildelemente von den "langsamen" (gleichförmigen) Grundelementen trennen. Der Arbeitsschritt wird auch als Subband-Coding bezeichnet. Zusätzlich entfernt man bei jedem Schritt jeweils die Hälfte der Zeilen und Spalten. Dies verkleinert das Bild bei jedem Iterationsschritt jeweils um den Faktor vier. Das Bild zeigt die Abfolge von Hochpass- und Tiefpassfiltern bei der Wavelet-Transformation:
Stufenlose Kompressionsrate
Die zeitlich begrenzten Wavelet-Basisfunktionen werden so lange passend verschoben und skaliert, bis bei der Kompression das Bild in seiner Gesamtheit und in der gewünschten Detailstufe repräsentiert ist. Das Verfahren lässt sich beliebig iterieren, wodurch das stufenlose Anpassen der Kompressionsrate an die jeweilige Anwendung möglich ist.
.
Das Ergebnis der Wavelet-Transformation sind so genannte Wavelet-Koeffizienten, die das Bild direkt in verschiedenen Auflösungen als verkleinerte Kopien beschreiben. Zusätzlich enthalten die Koeffizienten noch hoch- und tiefpassgefilterte Versionen der Originalbilder (siehe Schaubild).
.
Analog zum bisherigen JPEG-Verfahren findet bei der Wavelet-Kompression noch eine verlustbehaftete Quantisierung und anschließende Entropiekodierung zur Reduktion der Datenmenge statt.
Weniger Kompression in Regions of Interest
Ein um mindestens 30 Prozent höherer Kompressionsfaktor als bei JPEG ist mit JPEG 2000 relativ sicher. In Einzelfällen sind noch stärkere Kompressionsraten möglich. Die von JPEG bekannten blockförmigen Artefakte gehören mit JPEG 2000 der Vergangenheit an. Doch bei hohen Kompressionsraten lässt die Bildschärfe nach. Zu hoch komprimierte JPEG-2000-Bilder wirken daher schwammig.
.
Um unter Umständen noch höhere Kompressionsraten zu erreichen, kennt JPEG 2000 so genannte Regions of Interest (ROI). Der Anwender definiert mit der ROI einen Bildteil, der besonders schonend komprimiert wird, und erlaubt gleichzeitig eine stärkere Kompression des restlichen Bildes (z.B. eines Hintergrunds). Die ROI bleibt auch bei hoher Kompressionsrate scharf, während die vom Anwender als unwichtig definierten Bildteile an Details verlieren.
Farbräume und inkrementeller Bildaufbau
Gegenüber dem alten JPEG-Format bietet die Farbverwaltung von JPEG 2000 erhebliche Vorteile. Sie kennt bis zu 256 Farbkanäle. Somit kann ein Bild zum Beispiel RGB und CMYK gleichzeitig unterstützen. Grundsätzlich bietet JPEG 2000 den definierten Standardfarbraum sRGB an. Zusammen mit einem entsprechenden ICC-Profil ist das Aussehen der JPEG-2000-Bilder dadurch auf jeder Rechnerplattform und jedem Ausgabegerät gleich.
Stark verbessert präsentiert sich auch die Dekompression der Bilddaten: Die inkremental progressive Dekompression ist fester Bestandteil von JPEG 2000. Das Bild wird von Anfang an komplett angezeigt, lediglich die Anzahl der Details erhöht sich mit jedem Ladeschritt für das gesamte Bild. Diese Eigenschaft bringt etliche Vorteile: Ist ein Bild nur in einer größeren Auflösung oder Qualität als benötigt vorhanden, braucht man lediglich einen Teil der Datei zu laden.
Auf diese Weise lässt sich zum Beispiel in der Druckindustrie ein Proof lokal in mittlerer Qualität bearbeiten, während die Originaldatei in höchster Qualität direkt zum Belichten geht. In beiden Fällen erfolgt ein Zugriff auf die Originaldatei, für den Proof wird jedoch nur ein Teil der Daten geladen.
Auch Vorschaubilder für Webseiten lassen sich auf diese Weise realisieren: Statt eine zweite, verkleinerte Version des Bildes zu erzeugen, wird einfach nur ein kleiner Teil der Originaldatei geladen. Ebenfalls vorgesehen ist bei JPEG 2000 das Einfügen von Metadaten wie Datum, HTML-Links, Farbkalibrierung oder ein Wasserzeichen als Kopierschutz.
Legenden und Wahrheit
Grafikanwender in aller Welt, die sich vom Format JPEG 2000 eine Revolution erwartet haben, sehen sich beim Testen der ersten Implementierungen teilweise enttäuscht. Daher ist es höchste Zeit, mit dem einen oder anderen Märchen ein für alle Mal Schluss zu machen.
JPEG 2000 stellt eine in allen Bereichen verfeinerte Version von JPEG dar, nicht mehr, aber auch nicht weniger. Der Ersatz der DCT durch die Wavelet Transformation hat zur Folge, dass sich Artefakte zwar unterbinden lassen, wer jedoch auf Kompressionsfaktoren jenseits der 100 hofft, muss lange suchen, bis er ein geeignetes Bild findet.
Fakt ist, dass man mit JPEG 2000 in der Regel um 30% besser komprimieren kann als mit dem alten JPEG. Also statt 20:1 mit 27:1 bei gleicher subjektiver Qualität. Allerdings kann die geschickte Auswahl eines Bildes auch einmal zum umgekehrten Ergebnis führen. Manche Webseiten liefern dafür gute Beispiele. Als Faustregel komprimieren Wavelets besser bei hohen Kontrasten, JPEGs besser bei Texturen. Die Lossless-Implementierung von JPEG 2000 arbeitet mit rund 2:1 etwas schlechter als der Vorgänger, was vor allem die Radiologen unter den Anwendern enttäuschen wird.
Die mathematische Komplexität der Wavelets-Kompression ist gut und gerne zehn Mal höher als die DCT von JPEG. Bei modernen PCs fällt dies nicht ins Gewicht. Probleme bereitet es vor allem Digitalkameras, da sich die Zeit zwischen zwei Aufnahmen deutlich verlängert. Hier ist ein Kompromiss zwischen Rechenleistung, Speicherbedarf und Batterieverbrauch nötig.
JPEG wird auch weiterhin eine Alternative bleiben. Denn so schlecht komprimiert es gar nicht: Im Kompressionsvergleich der ISO mit verschiedenen JPEG-2000-Implementationen hat es nicht als Letzter abgeschnitten. Zehn Jahre Feinarbeit machen sich bezahlt.
Fazit
Mit dem JPEG-2000-Format erhalten längst überfällige Features Einzug in den JPEG-Standard. Die Funktionen kommen dem Internet-Anwender genauso zugute wie den Profis der Foto- und Druckindustrie.
Den Hoffnungen der Webdesigner auf ein neues Format, das Transparenz oder Animation unterstützt, wird aber nicht Rechnung getragen. Außerdem wird die Kompatibilität zum alten JPEG-Format außen vor gelassen, was schon am Formatkürzel *.j2k ersichtlich ist. Weitere Fallen lauern in der Funktionsvielfalt des Standards. Bleibt zu hoffen, dass die großen Browser-Hersteller in diesem Fall alle Features direkt implementieren, um dem Anwender Inkompatibilitäten zu ersparen.
Dennoch gelingt JPEG 2000 mit den neuen Funktionen und der Kompression auf Wavelet-Basis ein entscheidender Schritt nach vorn - für alle Bereiche der Bildverarbeitung. (ala)
Links zu aktueller JPEG-2000-Software
Einige Hersteller und Universitäten haben bereits "dialektfreie" Codecs in Plug-ins, Active-X-Controls und SDKs implementiert. Ziel der ISO war und ist es ja, den Formatzoo der bisherigen Grafikformate zu unterbinden, der keine echte Normierung ermöglicht. Dennoch haben die Grafikspezialisten der Digital Imaging Group auch mit JPEG 2000 wieder ihre eigenen Ideen.
So reichte z.B. den Vertretern der Druckindustrie der normierte Farbraum sRGB nicht aus. Deshalb werden demnächst Extensions veröffentlicht, die das ICC-Profil als Basis zur Farbkalibration nutzen. Weitere Ergänzungen wie eine bessere Quantisierung (Trellis-Coded) sind abzuwarten.
| |
LEADTOOLS, USA | |
---|---|
AWARE, USA | |
PEGASUS IMAGING, USA | |
ALGOVISION, Deutschland, (sehr standardnahe Implementierung), | |
LURATECH, Deutschland | |
Ecole Polytechnique Fédérale de Lausanne, Schweiz | |
IMAGE POWER, Kanada | |
University of New South Wales, Prof. Taubman | |
JASPER Quellcode | |
Offizielle JPEG-2000-Seite |