Das Voice Web

06.10.2000
Zweifellos gehört dem Internet die Zukunft. Aber selbst in den USA haben immer noch 60 Prozent der Bevölkerung keinen Zugang zum "Netz der Netze", in Deutschland sind es etwa 70 Prozent. Die He-rausforderung für das E-Business lautet deshalb: Wie größere Zielgruppen erreichen? Eine Lösung ist die Verknüpfung des altbekannten Telefons mit Web-Techniken.

Von: Bert Leysen, Bernd Reder

Praktisch alle E-Business-Unternehmen gehen heute davon aus, dass die Kunden von einem Rechner aus auf ihre Sites gelangen. Damit schränken diese Firmen jedoch ihre potenzielle Zielgruppe erheblich ein. Denn nur etwa die Hälfte der Einwohner in den Industrieländern verfügt über einen PC mit Internet-Anschluss. Einen Ausweg aus diesem Dilemma könnte das Telefon eröffnen. Es hat eine Reihe von Vorteilen:

- Telefonie steht quasi weltweit zur Verfügung. Mehr als 98 Prozent der Bevölkerung besitzen ein Telefon beziehungsweise Handy. Insgesamt sind weltweit rund 1,5 Milliarden Telefone, Handys und Web-Telefone in Betrieb, während "nur" 250 Millionen PCs über einen Internet-Anschluss verfügen.

- Das Telefon ist ein und vertrautes Kommunikationsmittel und

- es zeichnet sich durch eine hohe Zuverlässigkeit aus.

Warum also nicht Telefonie und Internet miteinander kombinieren, und über ein "Voice Web" mit Hilfe von Sprachkommandos Internet-Inhalte abrufen? Anstatt mit Hilfe eines Browsers im Web zu surfen, kann der Benutzer beispielsweise sein bevorzugtes "Voice-Portal" anrufen. Dort hat er - ebenso wie vom PC aus - Zugang zu Informationen wie Reisewetter, Aktienkursen oder Nachrichten. Außerdem kann er online einkaufen - Stichwort "Mobile Commerce". Ein weiteres Anwendungsbeispiel ist der Zugang zu Online-Adressverzeichnissen: Der Nutzer kann einen Namen in einem solchen Adressbuch suchen lassen, dann das Kommando "Anrufen" eingeben und eine Verbindung zum gewünschten Partner herstellen.

Generell lassen sich für ein "Voice Web" folgende Einsatzgebiete und Geschäftsfelder definieren:

- die IT-Industrie muss die Anbieter mit der entsprechenden Ausrüstung ausstatten, etwa VoiceXML-Servern oder Datenbanken;

- integrierte Lösungen für die Kundenbetreuung (Customer Care, Customer Relationship Management), die Web-Zugriff über PC und Telefon kombinieren, werden an Bedeutung gewinnen;

- Sprachportale (Voice Portals) werden - wie oben beschrieben - dem Benutzer Informationen aller Art zur Verfügung stellen;

- "E-Transaktionen" gewinnen an Boden, angefangen vom E-Commerce über den Aktienhandel bis zu Statusabfragen (Accounts, Verbleib von Warensendungen);

- Firmen richten Unternehmens-Portale ein, die Mitarbeitern den Zugang zu Geschäftsanwendungen oder Verzeichnissen bieten und

- "persönliche Portale" entstehen, die beispielsweise Unified-Messaging-Dienste, Online-Kalender und Adressbücher bereitstellen oder den Zugriff auf private E-Mails erlauben.

Produkte und Standards für das Voice Web

Die Anbieter von Sprachtechniken und Systemplattformen arbeiten mit Standardisierungsgremien zusammen, um eine Infrastruktur für das Voice Web aufzubauen:

- Die Anbieter von Sprachtechnologien entwickeln Benutzerschnittstellen, Entwicklungs-Tools und Produkte, die Anwender anhand der Charakteristika der Sprache identifizieren. Mit Hilfe solcher "Voice Prints" sind Serviceprovider in der Lage, den Anrufer zu authentifizieren.

- Normungsgremien und Interessensgemeinschaften, wie die V-Commerce Alliance, das VoiceXML-Forum oder das W3C, treiben die Technik voran, indem sie neue Content-Modelle konzipieren, in erster Linie VoiceXML und Speech Objects.

- Die Anbieter von Hardware und Software legen ihre Produkte für den sprachgesteuerten Web-Zugang aus.

Eine zentrale Rolle im Voice Web wird VoiceXML (VOXML) spielen. Das VoiceXML-Forum legte im Frühjahr die erste Version einer entsprechenden Norm dem World Wide Web Consortium (W3C) zur Begutachtung vor. VXML basiert auf der Beschreibungssprache XML, dem Nachfolger von HTML. Für Entwickler bedeutet dies, dass sie VoiceXML-Anwendungen mit Hilfe ihrer gewohnten Web-Entwicklungswerkzeuge schreiben können. Zudem lassen sich die Applikationen auf die bereits vorhandenen Web-Server "packen" und an Backend-Datenbanksysteme anbinden. Dem World Wide Web Consortium liegt seit August der Entwurf einer Spezifikation für eine "Speech Synthesis Markup Lan-guage" vor. Er ist Teil eines Rahmenswerkes für eine Sprachschnittstelle (Speech Interface). Die Markup Language soll in Systemen eingesetzt werden, die vom Rechner erzeugte Sprachinformationen (synthetische Sprachdaten) ausgeben.

Dies ist beispielsweise relevant, wenn ein Nutzer über Telefon Informationen abrufen möchte, die in schriftlicher Form vorliegen, etwa Faxe oder E-Mails. Das Messaging-System beziehungsweise Voice Portal wandelt diese Daten in Sprachinformationen um und liest sie dem Anwender vor.

Speech Objects auf Basis von Java

Eine zweiter Ansatz stammt von der V-Commerce-Allianz. Das "V" steht in diesem Fall für "Voice". Diese Interessengruppe hat mit dem "Open Voice Framework" eine Entwicklungsumgebung für Sprachapplikationen erarbeitet. Sie basiert auf Java und ActiveX und ist damit nicht an bestimmte Betriebssysteme, Speech-Engines oder Application Programming Interfaces (APIs) gebunden. Das Kernelement des Frameworks sind "Speech Objects", also Anwendungs-Entwicklungsbausteine, die Java-Beans und ActiveX unterstützen. Speech Objects lassen sich über gängige Markup-Sprachen wie HTML oder XML ansprechen. Das Rahmenwerk enthält zusätzlich Middleware und APIs für die gängigen Web-Plattformen, Telefonsysteme und Lösungen für das Erkennen und Bearbeiten von Sprachinformationen.

Diese Arbeiten sollen dazu beitragen, dass mit dem Ausbau des Web in Richtung "Voice Web" eine neue Industrie entsteht. "Voice Web Portal Provider" werden, so zumindest die Erwartung von Herstellern und Analysten, eine ähnlich große Rolle wie "Web Portal Provider" spielen. In diesen Markt steigen neben Telekommunikationsanbietern die Betreiber von Internet-Sites oder Online-Diensten ein. Dies hat beispielsweise bereits AOL vorexerziert. Die Marktforscher der Kelsey Group erwarten jedenfalls, dass alleine in den USA im Jahr 2005 mehr als 45 Millionen Menschen Sprachportale nutzen. Die "Voice-E-Conomy" werde zu diesem Zeitpunkt ein Volumen von zwölf Milliarden Dollar erreichen; gut fünf Milliarden davon sollen auf Dienstleistungen entfallen, darunter Nutzergebühren, Produktanzeigen und den elektronischen Handel.

Zur Person

Bert Leysen ist Marketing-Manager der Intel-Tochterfirma Dialogic und dort für die Region Europa, Afrika und den Mittleren Osten zuständig.