MP3 Grundlagen: Psychoakustik

Reduzierung der Stereo-Informationen

Die bisher gezeigten Verfahren erlauben eine Komprimierung um Faktor fünf bis sechs. Will man noch höhere Kompressionsraten erzielen, kann man zum Beispiel die Stereo-Informationen reduzieren. Der Kompressions-Algorithmus bei MPEG-Audio bietet dazu zwei Möglichkeiten: das so genannte "intensity stereo coding" und "Middle/Site (MS) stereo coding". Beide Verfahren sind unter dem Oberbegriff "Joint Stereo" zusammengefasst. Alle MPEG-Layer unterstützen "intensity stereo coding". Layer 3 beherrscht zudem noch "Middle/Site (MS) stereo coding". Bei beiden Codierverfahren ist der Ausgangspunkt wiederum die Psychoakustik. Messungen ergaben, dass das menschliche Gehör oberhalb von 2 kHz mehr auf einen zeitlichen Wechsel, als auf eine zeitlich hohe Auflösung eines Audiosignals achtet. Unkomprimiertes Stereo-Material verarbeitet das menschliche Gehör, in dem es zwischen dem linken und rechten Kanal Phasen- und Pegelunterschiede auswertet. Weiterhin bestimmt der Mensch die Richtung eines Schallereignisses in Abhängigkeit von der Frequenz. Tiefe Töne (bis etwa 80/100 Hz) sind zum Beispiel nicht zu orten. Dieses Phänomen ist uns als Subwoofer-Prinzip bekannt und kommt in Kinos zum Einsatz. Hier steht der Subwoofer meist hinter der Leinwand.

Die Wahrnehmung mittlerer Töne erfolgt auf zwei Wegen: Zum einen wertet das Nervensystem den Zeitpunkt des Eintreffens der Schallwellen am linken und rechten Ohr aus, und zum anderen bestimmt es den Lautstärkeunterschied. Hohe Frequenzen nehmen wir nur durch den Lautstärkeunterschied war. Wer sich für weiterführende Informationen interessiert, findet auf der folgende Seite der Wuppertaler Universität fundierte und ausführliche Informationen über das Hören.

"Intensity stereo" macht sich dieses Wissen folgendermaßen zu nutze: Ein Stereosignal lässt sich als ein Mittensignal (Rechts + Links) und ein Seitensignal (Links-Rechts + Rechts-Links) darstellen. MPEG-Audio-Encoder trennen nun die Stereodaten und übertragen nur noch das Seitensignal, welches weit weniger Informationen enthält.

"Middle/Site (MS) stereo coding" geht noch einen Schritt weiter. Es ist für Datenraten von weniger als 64 kbps gedacht. Der Audio-Coder kodiert einige hochfrequente Subbands zu einem Summenkanal, anstatt für alle 32 Subbands jeweils einen rechten und linken Kanal auszugeben. Zusätzlich werden noch Richtungsinformationen übertragen.

Diese Art von Codierung geschieht eigentlich nur in den sehr hohen Frequenzen, die unser Ohr kaum noch wahrnehmen kann. Dennoch: Von CD-Qualität kann nicht mehr die Rede sein. (nha)