Videokompression mit MPEG

DCT und Quantisierung

Das Bild wird bei der DCT in 8x8 große Pixelblöcke aufgetrennt, die einzeln abgearbeitet werden. Jeder dieser Blöcke wird der diskreten Cosinus-Transformation unterzogen. Diese ist mit der Fourier-Transformation verwandt und wandelt die räumliche Information der Helligkeitswerte in eine Frequenz-Darstellung um. Die Umwandlung selbst ist bis auf Rundungsfehler verlustlos, bringt aber zunächst keine Reduktion der Datenmenge. Bei der Wiedergabe des Bildes erfolgt eine inverse DCT (iDCT). Die hohe Anzahl dafür nötigen transzendenten Funktionen erklärt den enormen Rechenbedarf einen DVD-Softwareplayers auf einem PC.

Bei der MPEG-Kompression ergeben sich 64 DCT-Koeffizienten für jeden 8x8-Pixelblock. Der oben links im Block stehende Koeffizient wird DC-Komponente oder Gleichanteil genannt. Je weiter man sich von ihm entfernt, desto höher werden die zugehörigen Frequenzen. Da das menschliche Auge für höhere Frequenzen weniger empfindlich ist, kann man diese Anteile je nach gewünschter Höhe des Kompressionsfaktors vernachlässigen. Diese Aufgabe kommt dem Quantisierer zu.

Quantisierung

Um die Anzahl der DCT-Koeffizienten zu verringern, wird jeder Wert durch einen zugeordneten Q(uantisierungs)-Wert dividiert und auf die nächste ganze Zahl gerundet. Die Q-Werte werden dabei Tabellen entnommen, die das JPEG Komitee anhand psycho-visueller Tests an einer Vielzahl von Personen ermittelt hat. Somit wird bei JPEGs der Kompresionsfaktor nicht direkt eingestellt, sondern es wird ein Q-Faktor gewählt, der einer bestimmten Kompression entspricht. Die tatsächlich erreichte Kompressionsfaktor bei einem gegebenen Q-Wert hängt vom Bildinhalt ab.