MP3-Grundlagen: Aufbau und Funktion

Teilung des Audiosignals

Bei der MPEG-Audiokodierung überführt eine Filterbank das zu kodierende Audiosignal vom Zeit- in den Frequenzbereich. Während dieses Vorgangs wird es zunächst in 32 Frequenzbänder (Subbands) unterteilt. Bis zum Layer 2 hatten alle 32 Subbänder die gleiche Größe von 625 Hz. Seit dem Layer 3 sind die Subbänder an die Eigenschaften des menschlichen Gehörs angepasst. Hierfür sorgt ein polyphaser Filter, sprich es geschieht eine gleichzeitige Dezimierung und Filterung der Abtastwerte. Jedes Subband repräsentiert dabei einen bestimmten Ausschnitt des Frequenzspektrums.

Das in Bänder zerlegte Audiosignal bietet dem Algorithmus deutlich mehr Angriffsfläche, als das uniforme Audiosignal. Der MP3-Encoder knöpft sich jedes Subband einzeln vor und untersucht es gemäß dem Psychoakustischen Modell auf verzichtbare Frequenzen. Hierbei erfolgt eine Ermittlung der Maskierungsschwelle. Im ersten Schritt fallen die Subbänder weg, deren Pegel unterhalb dieser Verdeckungsfunktion liegt. Jedes Subband erfährt nun eine Abtastung, deren Resultat 16-Bit-große Samples sind.

Bei der Quantisierung dieser Samples entsteht der nächste Ansatzpunkt zur Datenreduktion. Jedes Sample besteht zwar aus 16 Bit, jedoch sind nicht unbedingt alle 16 nötig, um den Pegel darzustellen. So können beispielsweise die führenden Nullen eines 16-Bit-Samples entfallen. Ergibt sich bei einem Sample der Wert 0000011101010101, so stutzt der Algorithmus das Ergebnis auf 11101010101.

Um aus diesen reduzierten Angaben wieder die originalen 16 Bit rekonstruieren zu können, benötigt der Decoder zwei Angaben: den Skalierungsfaktor sowie die Bit Allocation. Der Skalierungsfaktor gibt an, an welcher Stelle die verbliebenen Bits des Samples sich im ursprünglichen Zustand befunden haben. Die Bit Allocation enthält die Information, wie viele Bits im Sample verblieben sind, da man ja nicht mehr mit einer festen Zahl von 16 Bit rechnen kann. Würde man nun diese Informationen für jedes Sample einzeln ablegen, wäre nicht viel gewonnen. Daher teilen sich je zwölf Samples diese Werte.