Zwischen den Welten

Besondere Eigenschaften der Sprache

Sprache ist eine interaktive Form der Kommunikation, die in Echtzeit stattfindet. Die herkömmliche Telefonie nutzt leitungsvermittelte Netzwerke, bei welchen die beiden Teilnehmer quasi physikalisch miteinander verbunden sind und dadurch eine hohe Qualität erreicht wird. Der Transport von Sprache über paketvermittelte Netze wie X.25, Frame Relay, ATM oder IP erfordert die Lösung einiger technischer Probleme, weil hier die Endgeräte nur mehr auf logischer Ebene miteinander verbunden sind und die dazwischen liegenden Übertragungswege mehrfach genutzt werden. Für eine hohe Qualität der Sprache sind insbesondere die folgenden Parameter verantwortlich: geringe Laufzeit von Endgerät zu Endgerät in Verbindung mit dem störenden Echo, die Signalisierung zur Steuerung der Sprachkommunikation und die Synchronisierung der beiden angeschlossenen Terminals.

Für die Laufzeit gibt es zwei Grenzwerte, die für die Praxis besonders bedeutsam sind: 30 und 150 Millisekunden. Der erste Grenzwert basiert auf der Tatsache, dass Telefonendgeräte vierdrähtig an das Telefonnetz angeschlossen sind. Innerhalb des Weitverkehrsnetzes werden jedoch nur zwei Drähte für eine Gesprächsverbindung benutzt. Die Anpassung von zwei auf vier Drähte erfolgt an beiden Enden des Netzwerks mit Hilfe einer Gabelschaltung, die auch Hybrid genannt wird. An diesem Hybrid werden die Sprachsignale reflektiert, so dass ein selbst ins Mikrofon gesprochene Wort nach einiger Zeit auch im eigenen Hörer vernommen wird. Ab einer Laufzeit von 30 Millisekunden wirkt sich dieses Echo störend auf die Konversation aus und muss deshalb mit komplexen Echokompensierern unterdrückt werden. Das funktioniert recht gut bis zu einer Laufzeit von 150 Millisekunden , ab der sich eine Konversation schwierig gestalten kann, insbesondere, wenn beide Teilnehmer versuchen, gleichzeitig zu sprechen. Für das klassische Telefonnetz wurden deshalb die Ende-zu-Ende Laufzeiten im nationalen Bereich mit 25 Millisekunden und im internationalen Bereich mit 100 Millisekunden festgelegt.

Dazu kommen noch die durch ein IP-Netz bedingten Verzögerungen für das Sprachsignal in den folgenden drei Bereichen: Paketierung im Sender, Speicherung im Netzwerk und Decodierung im Empfänger. So erklärt sich (siehe oben), dass die Ende-zu-Ende-Verzögerungen zwischen 140 und 1720 Millisekunden liegen können.

Die Verzögerungen im Sender sind abhängig von dem verwendeten Codierverfahren für die Sprache. Neben der klassischen PCM-Codierung nach dem ITU-Standard G.711 mit 64 kBit/s werden heute in der Regel unterschiedliche Kompressionsverfahren eingesetzt, die je nach Algorithmus Datenraten zwischen 5,3 und 32 kBit/s liefern. Das "Einpacken" der Sprachmuster in IP-Pakete erfolgt in einem Zwischenspeicher, der typisch 20 Oktetts zu einem Paket zusammenfasst. Um die Laufzeiten innerhalb des Netzes gering zu halten, wird für Ethernet LANs unbedingt empfohlen, Switches und Priorisierung von Datenströmen einzusetzen. Diese Geräte sollen zudem nach dem "Cut-through"-Verfahren arbeiten; das häufig verwendete "Store-and-forward"-Verfahren ist ungeeignet. Auf der Empfangsseite lässt sich die Verzögerungszeit des Synchronisierungsspeichers etwa mit geeigneten Messgeräten optimieren, welche die Laufzeitunterschiede der einzelnen Pakete erfassen können.

Wichtig für die hohe Qualität ist schließlich die effiziente Übertragung von Steuer- und Signalisierungsinformationen. Diese werden bei ISDN in einem separaten Steuerkanal übertragen. Werden die Gespräche am anderen Ende jedoch nicht am gleichen Ort terminiert, so hilft es leider nicht, die Steuerkanalsignale ebenfalls zu paketieren und von dem einen Endpunkt zum anderen zu transportieren. Dazu wird vielmehr ein geeignetes Signalisierungsprotokoll benötigt, wie es beispielsweise der ITU-Standard für Videokonferenzen im LAN H.323 bereitstellt. Da dieses Protokoll jedoch nur für die Durchführung von Videokonferenzen entwickelt wurde, fehlen die spezifischen Verfahren für die Telefonie. Diese sollen künftig mit SIP (Session Initiation Protocol), einem Vorschlag für die Signalisierung von IETF, besser bedient werden können.