VoiceXML macht das Telefon zum Browser

Der VoiceXML-Interpreter als Manager

Für eine funktionierende sprachbasierte Web-Applikation ist ein VoiceXML-Interpreter notwendig, der den Code ausführt und die notwendigen Systeme zur Sprachein- und -ausgabe zur Verfügung stellt. Jedes VoiceXML-Dokument beschreibt dann einen interaktiven Dialog, der von dem VoiceXML-Interpreter ausgeführt wird.

Der Grundgedanke der VoiceXML-Philosophie ist, alle Vorzüge von traditioneller Web-Entwicklung und inhaltlicher Zulieferung auf Voice-Response-Anwendungen zu übertragen und dabei Autoren von Lowlevel-Programmierung zu befreien. VoiceXML soll die Integration von Sprach- und Datendiensten ermöglichen, indem es den übliche Client-Server-Ansatz nutzt. Ein Sprachdienst ist eine Abfolge von interaktiven Dialogen zwischen einem User und einer Implementations-Plattform. Die Dialoge werden von Dokument-Servern zur Verfügung gestellt, die außerhalb der Implementations-Plattform liegen können. Ein VoiceXML-Dokument spezifiziert jeden Interaktionsdialog, der vom VoiceXML-Interpreter ausgeführt werden soll. Die Nutzereingaben beeinflussen die Dialoginterpretation. Der Dokumentserver kann mit einem anderen VoiceXML-Dokument antworten, um die Nutzersession mit einem anderen Dialog fortzusetzen.