Zwei Welten wachsen zusammen

Bisher existieren in Unternehmen zwei Kommunikations-Infrastrukturen nebeneinander: Auf der einen Seite steht das lokale Netz für die Datenkommunikation, auf der anderen die TK-Nebenstellenanlage für die Sprachkommunikation. Diese Trennung wird jetzt durch neue Techniken auf der Basis des Internet-Protokolls obsolet. Das Zauberwort heißt "Voice over IP".

Von: Dr. Ralf Ebbinghaus

Historisch bedingt unterhalten die meisten Firmen und Behörden gegenwärtig zwei "Kommunikationswelten": die der Datenkommunikation und die klassische Telekommunikations-Anlage mit einer Vielzahl von Nebenstellen. Diese Trennung ist jedoch äußerst unwirtschaftlich, weil der Anwender dadurch gezwungen ist, doppeltes Know-how für den Betrieb und die Pflege der beiden Systeme vorzuhalten.

Darüber hinaus behindert diese Trennung die rasche Entwicklung neuer Applikationen, da beiden Systemen unterschiedliche Techniken zu Grunde liegen. Während das klassische Telefonnetz bei jedem Telefonat eine durchgängige Ende-zu-Ende-Verbindung mit einer reservierten Bandbreite von 64 kBit/s etabliert, wird bei der IP-Telefonie die Sprache digitalisiert, komprimiert, in IP-Datenpakete konvertiert und zusammen mit anderem IP-Verkehr über das Datennetz geführt.

Die TK-Anlage: eine herstellerspezifische Lösung

Klassische TK-Anlagen basieren auf proprietären Systemlösungen des jeweiligen Anbieters. Dadurch ist ausschließlich der Hersteller einer TK-Anlage in der Lage, Erweiterungen für Hardware und Anwendungen zu erstellen und zu vermarkten. So ist es beispielsweise in der Regel unmöglich, ein Systemtelefon eines bestimmten Herstellers an der Anlage eines anderen Herstellers zu betreiben. Auch einfachste Applikationen, wie beispielsweise das Einspielen einer Pausenmusik (Music On Hold) oder ein Anrufbeantworter, der automatisch Begrüßungstexte (Auto Attendant) aufsagt, zwingen den Anwender dazu, zusätzliche - und durchweg überteuerte - Module (Baugruppen) anzuschaffen. Selbst wenn der Benutzer nur die Melodie oder Ansagetexte ändern möchte, muss er meist auf Servicetechniker des Anlagenherstellers zurückgreifen.

Komplexere Anwendungen und Systemergänzungen, wie beispielsweise Interactive-Voice-Response-Systeme (IVR), Voice-Mail oder "Automatic Call Distribution" (ACD), sind bei den klassischen TK-Anlagen kostspielige Erweiterungen, die zudem meist mit erheblichem Zeitverzug angeboten werden.

Das Konzept der IP-PBX

Die IP-Telekommunikationsanlage (auch LAN-PBX, Soft-PBX, oder Packet-PBX) ist ein neues Konzept einer Telefonnebenstellenanlage. Dabei wird die Sprache nicht über ein separates Netz geleitet, sondern über eine integrierte Infrastruktur für Sprach- und Datenkommunikation. Die Grundlage dieser Zusammenführung ist das paketorientierte Kommunikationsprotokoll IP (Internet Protocol). Sprache wird komprimiert und in Form von IP-Paketen zeitgleich über dasselbe Netzwerk transportiert wie andere Daten. Die IP-PBX selbst ist ein Softwarepaket, das in der Regel auf einem Server des PC-Netzes läuft. Dieses Programm steuert alle Wähl- und Verbindungsvorgänge innerhalb des lokalen (und nicht-lokalen) IP-Netzes.

Das eigentlich Neue an einer IP-PBX ist die Tatsache, dass keine spezielle "Switching-Hardware" benötigt wird: Es gibt also kein Koppelfeld wie bei der klassischen TK-Anlage. Die IP-PBX stellt die Vermittlungsfunktionen einer TK-Anlage zur Verfügung, indem sie den am PC-Netz angeschlossenen IP-Telefonie-Endgeräten IP-Adressen und Rufnummern zuordnet und Verbindungsanforderungen koordiniert und steuert.

Sowohl Informationen zur Verbindungssteuerung als auch Sprach-, Fax- oder Videodaten werden in Form von IP-Paketen transportiert. Deshalb behält die IP-PBX zu jeder Zeit die Kontrolle über Verbindungen. Sie erlaubt damit die dynamische Integration von Sprach- und Datenanwendungen zu einem einheitlichen Gesamtsystem. So kann die IP-PBX Sprachinformationen erzeugen, wiedergeben oder aufnehmen, aber auch als automatisches Ansagesystem, Anrufbeantworter oder Voice-Mail arbeiten und zusätzlich "Music On Hold" einspielen, ohne dass dazu zusätzliche Hardware erforderlich ist.

Standards zur Audio-Kodierung

Um echtzeitorientierte Sprachanwendungen über das paketorientierte Internet-Protokoll abwickeln zu können, ist es notwendig, die zu übertragenden Daten zu komprimieren. Aus diesem Grund hat die ITU (International Telecommunication Union) eine Reihe von Standards verabschiedet, die abhängig von der nutzbaren Bandbreite unterschiedliche Niveaus von Sprachqualität zur Verfügung stellen. Diese Komprimierungsverfahren sind Bestandteil der Protokollfamilie H.323, zu der mehrere Codec-Standards zählen.

Der G.711-Standard bietet eine unkomprimierte Übertragung, wie sie auch bei der Musik-CD-Technik und im ISDN-Netz genutzt wird. Dieser Standard ist zwingend für alle H.323-Telefone vorgeschrieben und stellt im Prinzip die beste Qualität durch geringste Verzögerung bereit, das heißt, wenn mögliche Paketverzögerungen außer Acht gelassen werden. Setzt man zur Kodierung leistungsfähigere Signalprozessoren ein, so lassen sich bei immer noch sehr guter Sprachqualität die erforderlichen Bit-Raten bis auf 5,3 kBit/s drücken. Allerdings hat dies höhere Verzögerungszeiten (Delays) zur Folge.

Zum einen sind geringe Bandbreitenanforderungen wegen der lokalen Anschlusstechnik, etwa Modemstrecken, beim Teilnehmer wünschenswert, zum anderen, um Stauphasen im Netz zu überstehen. Denn je größer die erforderliche Bandbreite, um so höher ist bei einer vorgegebenen maximalen Bandbreite des Übertragungsweges auch die Wahrscheinlichkeit, dass Pakete mit Verzögerung oder gar nicht zugestellt werden.

Die einzelnen Codec-Typen verfügen über folgende Eigenschaften:

- G.723: geringste Bandbreite, aber sehr hohes Delay,

- G.728: geringes Delay, aber noch eine Bit-Rate von 16 kBit/s,

- G.729: mit mittlerem Delay, 8 kBit/s und G.729A, jedoch mit deutlich geringerer notwendiger Prozessorleistung.

Bedenken gegen die IP-Telefonie

Die Telefonie ist sicher eine der wichtigsten Applikationen eines Unternehmens und muss deshalb den höchsten Anforderungen in Bezug auf Qualität und Ausfallsicherheit genügen. An diesen hohen Maßstäben muss sich auch die IP-Telefonie messen lassen. Technisch gesehen ist die Sprachqualität im IP-Netz von folgenden Faktoren abhängig:

- Sprachkodierung und -kompression (Codec),

- Paketverzögerungen (Packet Delays, Latency oder Jitter) und

- Paketverlusten bei der Sprachübertragung (vor allem bei "zu später" Zustellung).

Die wichtigsten Fortschritte bei der paketorientierten Übertragung von Sprache waren in den letzten drei Jahren bei den Codecs zu verzeichnen, die mit Hilfe spezieller Algorithmen das Sprachsignal abtasten, komprimieren und anschließend in Datenpakete "verpacken". Ein weiterer Faktor ist die Paketverzögerung (Packet Delay). Sie tritt leider nicht nur innerhalb des Codecs auf, sondern auch auf der Übertragungsstrecke.

Die Ursache von Delays sind in den H.323-Endgeräten, den Routern sowie dem Gateway (soweit kein reiner IP-Anruf vorliegt) die Verarbeitungszeit der Pakete und die Zwischenspeicherung. Hohe Durchsatzleistungen und ein effizientes Speicherkonzept erlauben es, diese Einflussgröße zu minimieren. Da sich Einzelverzögerungen addieren, muss die Gesamtverzögerungszeit minimiert werden: Je mehr Router ein Sprachpaket im IP-Netz durchlaufen muss und je länger die Zwischenspeicherzeiten in den Verbindungssegmenten sind, um so stärker summieren sich die einzelnen Verzögerungszeiten.

Hinzu kommt, dass in einem Datennetz Paketverluste nie vollständig auszuschließen sind, etwa weil Übertragungsstörungen auftreten oder Router überlastet sind, so dass sie kurzfristig nicht alle hereinkommenden Pakete verarbeiten können. Bei der Übermittlung von Daten wird dieses Problem entschärft, indem gesendete Pakete zwischengespeichert und bei Verlust erneut übertragen werden können.

Dieses Verfahren ist aber für die IP-Sprachübertragung wenig tauglich. Ein Paket muss innerhalb eines bestimmten Zeitintervalls ankommen, damit der Algorithmus richtig arbeiten kann, der die Sprachdatenpakete in analoge Sprachsignale (im empfangenden H.323-Telefon oder Router) zurückverwandelt: Denn kommt ein Paket zu spät, ist es für den Codec unbrauchbar und gilt als verloren. Dieses Problem lässt sich nur in leitungsvermittelnden Netzen lösen, bei denen einer Verbindung ein reservierter Übertragungsweg zur Verfügung steht - wie das auch im klassischen Telefonnetz der Fall ist.

Nur geringe Qualitätseinbußen sind akzeptabel

Erfreulicherweise beeinträchtigen geringe Paketverluste die vom Teilnehmer wahrgenommene Qualität der Sprache nur in geringen Umfang. So sind Verlustraten von bis zu fünf Prozent kaum hörbar. Eines der wichtigsten Ziele der Voice-over-IP-Technik ist deshalb, diesen "grünen Sektor" zu erreichen - mit weniger als fünf Prozent Paketverlusten und Delays unter 200 ms.

Es ist davon auszugehen, dass selbst private Telefonnutzer eine schlechte Sprachqualität nur in Ausnahmefällen akzeptieren werden, anders als bei der GSM-Mobilfunktechnik, wo der Vorteil der Erreichbarkeit die oft schlechte Sprachqualität aufwiegt. Weil die Sprachkommunikation ein besonders kritisches Element der Geschäftswelt ist, werden Serviceprovider und Anbieter von VoIP-Systemen die "Quality of Service" (QoS) sicherstellen müssen.

Neben den Verzögerungen, die in Telefonendgeräten und VoIP-Gateways entstehen, ist das IP-Netz selbst die größte Quelle von Delays und Paketverlusten. Allerdings bietet IP selbst die Möglichkeit, den Sprachpaketdurchsatz zu verbessern. Dies tangiert eine Reihe von Protokollelementen und Verfahren, die im erweiterten IP-Standard "IP Version 6" definiert sind, sowie eine Reihe weiterer Protokolle, etwa IEEE 802.1p, 802.1Q oder das "Resource Reservation Protocol" (RSVP). Sie räumen Sprachpaketen eine höhere Priorität bei der Übertragung ein als Daten. Damit werden nicht nur Delays und Latency reduziert, sondern auch Paketverluste verhindert. Dabei ist der IP-Verkehr in öffentlichen Netzen auf der einen Seite und in Unternehmensnetzen (VPNs, LANs) auf der anderen zu unterscheiden.

IP in öffentlichen Netzen

Ein Problem in öffentlichen IP-Netzen wie dem Internet ist die Bandbreite. Etwa Mitte 1998 setzte, ausgehend von den USA, eine Entwicklung ein, die in ein bis zwei Jahren zu "Bandbreite im Überfluss" in IP-Backbones führen soll. So wird die Kapazität klassischer Weitverkehrsverbindungen durch Einsatz neuer Glasfaserstrecken um den Faktor 1000 bis 10 000 erweitert. Alleine das dürfte für IP-Sprachverbindungen, die nur eine relativ geringe Bandbreite von 8 kBit/s benötigen, mehr als ausreichend sein.

Dieser Effekt kommt bei der Telefonie über das öffentliche Internet dann voll zur Geltung, wenn der überwiegende Teil der Internet- Serviceprovider (ISP) und Carrier die neuen Techniken einsetzt. Experten erwarten, dass dies ab dem kommenden Jahr der Fall sein wird.

IP im Virtuellen Privaten Netz (VPN) und LANs

Deutlich besser ist die Situation in Unternehmen, in denen Daten und Sprache über ein spezielles Netz (Intranet) oder Virtual Private Networks (VPNs) transportiert werden. Diese Netze bewegen sich bereits heute im "grünen Bereich", was Voice over IP angeht. Die Sprachqualität unterscheidet sich in diesen IP-Netzen nicht von der im klassischen Telefonnetz.

Noch günstiger sieht es in lokalen Netzen (LANs) aus, die im Zusammenhang mit IP-PBXs die wichtigste Rolle spielen werden. Hier kommt der VoIP-Technik zugute, dass in LANs die "alten" 10-MBit/s-Ethernets durch 100-MBit/s- und mittelfristig 1-GBit/s-Netze ersetzt werden. Außerdem sind die LANs in Unternehmen durch Hubs und Switches bereits stark strukturiert. Deshalb sind selten mehr als 50 Endgeräte an einem Segment angeschlossen, die sich die zur Verfügung stehende Bandbreite teilen müssen.

Geht man von einer Maximallast von zehn Prozent der verfügbaren Bandbreite aus, die auch bei parallel ablaufendem Datenverkehr Sprachpaketen noch einen verzögerungsfreien Transport garantiert, so könnte ein 10-MBit-Ethernet bereits 100 Sprachverbindungen (vollduplex, G.723.1) oder 25 Verbindungen nach G.711 in CD-Qualität verkraften. Dabei ist das typische Nutzungsverhältnis von aktiven zu insgesamt angeschlossenen Telefonen in die Kalkulation mit einzubeziehen. Das bedeutet, erst bei 150 angeschlossenen Telefonen ist damit zu rechnen, dass 25 Sprachverbindungen gleichzeitig anfallen.

Man kann also davon ausgehen, dass eine IP-PBX im In-House-Bereich eine Qualität bieten wird, die sich mit der klassischer Telefonie messen kann.

Befürchtungen bezüglich Verfügbarkeit

Wenn heute in einem Datennetz eines Unternehmens eine Verfügbarkeit von über 95 Prozent erreicht wird, ist das für die Nutzer im Allgemeinen ein akzeptabler Wert. In der Sprachkommunikation ist die Erwartungshaltung jedoch deutlich größer. Die Anwender erwarten eine Verfügbarkeit von mindestens 99,9 Prozent. Deshalb ist ein besonderes Augenmerk auf die Verfügbarkeit und Zuverlässigkeit der IP-Telefonie innerhalb eines Unternehmens zu richten. Die Ausfallsicherheit lässt sich durch alternative Verbindungswege in ausreichendem Maße sichern. Größere Bedenken bestehen in Bezug auf die Zuverlässigkeit von Netzelementen wie Servern und IP-Telefonen, vor allem wegen der zu Grunde liegenden PC-Technik.

Eine Befürchtung ist, dass PCs nicht zuverlässig genug sind, vor allem was die Stabilität der Software angeht. Deshalb sollte der Anwender auch künftig nicht ausschließlich PC-basierende Telefone einsetzen, sondern ebenso vom Personal Computer unabhängige IP-Systeme. Zum einen ist wichtig, dass eigenständige (Stand-alone-) Geräte in Form von H.323-konformen Ethernet-Telefonen verfügbar sind. Zum anderen aber sollten auch H.323-Systeme bereitstehen, die zwar unabhängig von einem PC arbeiten können, im Normalbetrieb jedoch vom Rechner gesteuert werden und damit den vollen "Integrationsvorteil" der IP-Lösung bieten können. Diese Systeme haben dann im Prinzip die gleiche (geringe) Ausfallwahrscheinlichkeit wie klassische Telefone.

Der zweite Vorbehalt betrifft die Zuverlässigkeit der Server - in Gateways oder "Call Managern" wie einer IP-PBX. Dabei bezieht sich dieses Argument sowohl auf die Ausfallsicherheit der Hardware (Dauerbetrieb) als auch auf mögliche Schwächen der Software. Abhilfe für dieses Problem ist vergleichsweise leicht zu schaffen: Industrie-PCs bieten heute eine hohe Ausfallsicherheit, dank robuster Bauweise und den optionalen Einsatz von redundanten Komponenten wie Stromversorgung, Plattenlaufwerken oder CPUs. Watchdog-Timer, die von der PC-Hardware kontrolliert werden, überwachen darüber hinaus die korrekte Arbeitsweise der Software und sorgen beim Absturz eines Programms dafür, dass der Server automatisch wieder hochfährt.

Darüber hinaus macht dieses Argument natürlich auch den Anspruch an die Softwareentwickler deutlich, nicht nur Funktionstests, sondern vor allem auch intensive Last- und Stabilitätstests in den Vordergrund zu stellen. Bei beiden Problembereichen, also Sprachqualität und Verfügbarkeit, ist deshalb davon auszugehen, dass IP-PBX-Systeme nicht auf technische "Show-Stopper" treffen werden. Um also Sprache über ein IP-Netz zu transportieren, ist es zum einen notwendig, die Struktur des LANs zu überprüfen, zum Beispiel in Hinsicht auf die angeschlossenen PCs innerhalb eines Segmentes. Zum anderen ist im Vorfeld das Verfügbarkeitsniveau zu definieren. Daraus resultierend muss der Anwender die Hardwarekomponenten für das LAN und die IP-PBX-Installation so auswählen, dass sie in der Lage sind, die gewünschte Verfügbarkeit zu sichern.

Im zweiten Teil der Serie gehen wir auf die einzelnen Komponenten einer IP-Telefonielösung ein. (re)

Zur Person

Dr. Ralf Ebbinghaus

ist Vice President Sales and Marketing bei Swyx Communications AG in Dortmund.