Kampf der Normen

08.06.2001
Seit Mitte der neunziger Jahre arbeiten Fachleute an Verfahren, mit denen sich Sprachanwendungen auf IP-Netze abbilden lassen. Neben den Standards der International Telecommunication Union sind hier die Ansätze der Internet Engineering Task Force zu beachten, etwa das Real-Time Transport Protocol und das Session Initiation Protocol.

Von: Kai-Oliver Detken

Im Jahr 1996 verabschiedete der "Telecommunication Standardization Sector" der ITU die Empfehlung H.323. Sie sollte Multimedia-Kommunikation über lokale Netzwerke ermöglichen, vor allem den Transport von Audiodaten in Echtzeit, sowie optional den Transfer von Videos und Daten bei Punkt-zu-Punkt- und Multipoint-Konferenzen. Zwei Jahre später folgte eine zweite Version, die für alle IP-Netze ausgelegt war: vom LAN über City-Netze bis hin zum Internet. Diese neue H.323-Empfehlung berücksichtigt auch Wählverbindungen und Punkt-zu-Punkt-Verbindungen über General Switched Telecommunication Networks (GSTN), die paketvermittelte Transportverfahren wie das Point-to-Point Protocol (PPP) nutzen.

H.323 beschreibt die Komponenten und Verfahren, die zum Telefonieren über paketgestützte Netze notwendig sind. Zu den Komponenten zählen Terminals, Gateways, Gatekeeper, Multipoint-Controller und -Prozessoren (MP) sowie Multipoint Control Units (MCU). Die Mechanismen regeln unter anderem, auf welche Weise Verbindungen aufgebaut werden und sich die Kommunikation überwachen lässt. Weil dabei mehrere Protokolle mitspielen, etwa das Real-Time Transport Protocol der IETF oder ITU-Protokolle wie H.225.0 und H.245, wird H.323 auch als Protokollfamilie bezeichnet.

Das H.323-Rahmenwerk

Ein H.323-Gateway ist ein Endpunkt im Netz. Mit seiner Hilfe können über eine Zwei-Wege-Verbindung H.323-Terminals in paketbasierten Netzen mit ITU-Geräten in leitungsvermittelten Netzen "sprechen", aber auch H.323-Geräte direkt miteinander kommunizieren.

Der Gatekeeper stellt zusätzlich Dienste für die Verbindungskontrolle bereit. Sie sind über die RAS-Funktionen (Registration, Admission and Status) in H.225.0 definiert und haben folgende Aufgaben:

- Übersetzen der Alias- und Transport-Adressen;

- Zugangskontrolle;

- Bandbreitenkontrolle;

- Verbindungskontrolle;

- Gesprächsautorisierung;

- Bandbreiten-Management: Kontrolle der Anzahl der H.323-Terminals, die gleichzeitig zu einer Zone Zugang haben.

Ein Multipoint-Controller (MC) stellt Kontrollfunktionen für Konferenzen zwischen drei oder mehr Endpunkten bereit. Dazu folgendes Beispiel: Zwei Sprachterminals ohne Videounterstützung führen eine Konferenz durch; ein weiteres Terminal mit Audio- und Videofähigkeiten möchte ebenfalls daran teilnehmen. Das Multimedia-Terminal teilt dem MC mit, dass es sowohl Audio- als auch Bilddaten senden und empfangen kann. Weil die beiden anderen Terminals aber nur Audiodaten verarbeiten, legt der MC den Übertragungsmodus auf Audio fest.

Einen anderen Ansatz verfolgt die Internet Engineering Task Force (IETF) mit dem Session Initiation Protocol (SIP). Das Protokoll ist Teil einer umfassenden Multimedia-Architektur, welche die Arbeitsgruppe "Multiparty Multimedia Session Control" als Alternative zu ITU-H.323 entwickelt hat.

Als Client-Server-Protokoll ist SIP dem HTTP-Protokoll ähnlich. Anfragen und Antworten sind textbasiert und enthalten Kopffelder, die Informationen für die Verbindungs-Signalisierung transportieren. Anrufer und Angerufene erhalten eine SIP-URL, etwa anwender@host. Die Adresse besteht beispielsweise aus einem Usernamen, einem Vor- oder Nachnamen, oder aber aus einer Telefonnummer.

Bei einem Anruf lokalisiert der Anrufer zunächst den zugehörigen SIP-Server und schickt an diesen eine Anfrage. Ein Gesprächspartner kann einem SIP-Server die Kontaktadressen seiner Aufenthaltsorte dynamisch mitteilen.

Schwächen des H.323-Modells

Eines der größten Mankos der H.323-Norm ist, dass sie bereits für sich alleine genommen sehr umfangreich ist. Sie wird durch weitere Empfehlungen ergänzt, etwa für die Codierung von Audio- und Video-Informationen oder Daten. Hinzu kommen Regelungen für Zusatzdienste (H.450.x) und Sicherheit (H.235). Deshalb ist es für Hersteller sehr aufwändig, Produkte für H.323 zu entwickeln. Ein weiteres Problem ist, dass die ergänzenden Empfehlungen und Standards nicht deutlich voneinander abgegrenzt sind, so dass ähnliche Funktionen in unterschiedlichen Protokollen spezifiziert sind.

Damit nicht genug: Bauen Endpunkte ein Gespräch auf, können unterschiedliche H.323-Prozeduren ablaufen - das Standardverfahren, Fast Start oder Tunneling. Um alle zu unterstützen, sind komplizierte Implementierungsarbeiten in H.323-Terminals, Gateways, Gatekeepern und Firewalls notwendig. Außerdem müssen diese Geräte mit dynamischen Ports ausgestattet sein, was den Entwicklungsaufwand weiter in die Höhe treibt.

Soll zwischen zwei Endpunkten eine einfache Punkt-zu-Punkt-Verbindung aufgebaut werden, ohne dass ein Gatekeeper mit im Spiel ist, sind viele Round-Trips notwendig. Bei komplexeren Verbindungen über Gatekeeper und Gateways in Multipoint-Konferenzen steigt deren Zahl rapide an und verursacht zusätzliche Verzögerungen. Weitere Problempunkt sind:

- die Interoperabilität: Weil H.323 mehrere Protokolle umfasst, haben Entwickler die Möglichkeit, spezielle Funktionen hinzufügen. Die Folge ist, dass Produkte dann zwar den H.323-Empfehlungen entsprechen, jedoch nicht zwingend mit anderen H.323-Produkten zusammenarbeiten.

- Erweiterbarkeit: H.323 räumt Anwendungsentwicklern die Möglichkeit ein, zusätzliche Funktionen in Systeme zu integrieren. Allerdings sieht die Norm kein Verfahren vor, mit dessen Hilfe ein Terminal anderen Geräten mitteilen kann, über welche Erweiterungen es im Einzelnen verfügt. Hinzu kommt, dass wegen der Forderung nach Abwärtskompatibilität den Ausbaumöglichkeiten enge Grenzen gesetzt sind.

- Skalierbarkeit: Wegen der komplexen Domain-Struktur treten Probleme mit der Skalierbarkeit auf. Ein Gatekeeper mit einem bestimmten Domain-Namen muss beispielsweise nicht zwingend über eine physikalische Transportschnittstelle mit einer eigenen IP-Adresse verfügen, die im Domain Name Service (DNS) registriert ist. Das erschwert seine Lokalisierung.

- Mehrpunktkommunikation: Multipoint-Controller sind nur ein optionales Element innerhalb der H.323-Spezifikation. Deshalb lassen sich bestehende Verbindungen zwischen zwei Endpunkten nicht zu Multipoint-Konferenzen erweitern, wenn ein MC fehlt. Auch werden Multipoint-Konferenzen plötzlich beendet, wenn das einzige Terminal, das über einen MC verfügt, die Konferenz verlässt.

- Performance: Multipoint-Konferenzen können Server erheblich belasten, weil jeder Gesprächsteilnehmer eine TCP-Verbindung benötigt und die Signalisierungsnachrichten jeder Verbindung zu verarbeiten sind. Bei steigender Teilnehmerzahl ist es daher geboten, das Routing und die Signalverarbeitung der Belastung anzupassen und zu verteilen.

- Adressierung: Ursprünglich war H.323 für den Einsatz in lokalen Netzwerken gedacht. Das Konzept stößt daher an Grenzen, wenn es auf das Internet erweitert wird. Zudem arbeiten H.323-Gateways auch mit dem öffentlichen Telefonnetz zusammen, was wiederum eine Reihe von Fragen hinsichtlich der Adressierung von Endpunkten, Gatekeepern und Gateways aufwirft.

Einige der genannten Schwachpunkte lassen sich ausmerzen. Die Adressierung beispielsweise könnte mit Hilfe von Verzeichnisdiensten auf Basis des Lightweight Directory Address Protocol (LDAP) "entschärft" werden. Dazu sind jedoch zentrale Datenbanken notwendig, die Adressinformationen von Anwendern, Gatekeepern und Gateways enthalten. Ferner müssen diese Daten regelmäßig aktualisiert werden, um auch Informationen über H.323-Komponenten mit dynamischen Adressen bereitzustellen, etwa Terminals mobiler Benutzer oder Gatekeeper ohne feste IP-Adresse. Als Suchkriterien könnten Attribute wie Vor- und Nachname, Ländercode, E-Mail-Adressen oder E.164-Nummern dienen.

SIP versus H.323

Im Gegensatz zu H.323 ist SIP einfacher zu implementieren, weil wegen der Textcodierung keine aufwändigen Codegeneratoren nötig sind. Außerdem ist das Protokoll modular aufgebaut: SIP ist verantwortlich für die Gesprächssignalisierung, das Lokalisieren von Anwendern und die Registrierung. Für Dienstgüte, Verzeichniszugriffe sowie die Beschreibung von Sitzungen und Konferenzkontrollen sind dagegen weitere Protokolle zuständig. Die Modulstruktur erlaubt die Zusammenarbeit mit H.323. So kann ein Anrufer einen Gesprächspartner über SIP lokalisieren und diesem anschließend signalisieren, dass das Gespräch über H.323 stattfinden soll. Weiterhin werden bei H.323 nur zentral registrierte Audio- und Video-Codecs verwendet. Diese Beschränkung besteht bei SIP nicht.

SIP-Informationen können sowohl über TCP als auch das User Datagram Protocol (UDP) transportiert werden. Speziell UDP schont die Ressourcen der Server, weil nach Aufbau der Verbindung keine ressourcenintensiven TCP-Connections aufrechtzuerhalten sind. Ein SIP-Server empfängt eine Anfrage, führt eine Operation durch, leitet die Anfrage weiter und hat danach seine Aufgabe erfüllt. H.323-Gatekeeper, die das Routing von Gesprächen übernehmen, müssen dagegen für die Dauer des Gesprächs die Informationsströme verarbeiten und bei mehreren Teilnehmern eine Vielzahl von TCP-Verbindungen aufrechterhalten.

H.323, SIP oder RTP sind erste Schritte auf dem Weg zu einem "Echtzeit-Internet". In aktuellen Projekten arbeiten Experten bereits an Weiterentwicklungen, die vor allem ein besseres Zusammenspiel von paket- und leitungsvermittelten Netzen zum Ziel haben. Dazu sind unter anderem einheitliche Implementierungen und Gateways zu den vorhandenen Telekommunikationsnetzen erforderlich, außerdem Mechanismen für die Adressierung, das Reservieren von Ressourcen und die Sicherheit.

Darüber hinaus ist zu klären, ob das Internet in seiner jetzigen Form überhaupt für Echtzeitdienste wie Voice over IP tauglich ist. Denn bereits Standard-Anwendungen wie E-Mail, FTP, Telnet oder das World Wide Web bringen das Netz in Spitzenzeiten an den Rand seiner Kapazität. (re)

Zur Person

Kai-Oliver Detken

studierte an der Universität Bremen Informationstechnik. Gegenwärtig leitet er die Beratungsfirma Decoit und ist als Autor und Referent im IT-Umfeld tätig.