XHTML: Es lebe der Thronfolger

24.03.2000
Mit XHTML in der Version 1.0 etabliert sich ein neuer Standard für die Beschreibung von Web-Seiten. Als Erweiterung von HTML 4 kommt als Grundlage erstmals XML zum Einsatz. Programmierer und Designer müssen die neue Sprache nicht fürchten: Schwerwiegende Syntax-Änderungen treten nicht auf.

Von: Jörn Janoschek

Die Ansprüche an das Internet und die dafür eingesetzten Technologien erhöhen sich in einem nahezu unglaublichen Tempo. Um den gestiegenen Erwartungen gerecht zu werden, müssen die eingesetzten Techniken überprüft und gegebenenfalls konsequent aktualisiert werden. Die Seitenbeschreibungssprache HTML, aktueller Standard in puncto Darstellung, wird längst nicht mehr nur für einfache Web-Seiten eingesetzt, sondern ermöglicht es den Anwendern, komplette Applikationen und Anwendungen über das Browser-Interface zu benutzen. Dass dabei die Ansprüche an die Benutzbarkeit einer solchen Oberfläche steigen, ist nur natürlich - und damit erhöhen sich auch die Anforderungen an die Sprache, die vorrangig für die Darstellung dieser Oberfläche zuständig ist.

Generell sind sich die Fachleute in der Industrie einig, dass HTML in der starren Form, in der es derzeit existiert, nicht mehr ausreicht, um die Bedürfnisse der Anwender und Entwickler zu befriedigen. Eine Erweiterung muss her. Zwar haben in der Vergangenheit die Browser-Hersteller in Eigeninitiative immer wieder neue Sprachelemente oder Ergänzungen zu HTML hinzugefügt. Dies hob jedoch die einheitliche Struktur der Sprache auf, weil dadurch effektiv mehrere HTML-Dialekte enstanden, die nur begrenzt zueinander kompatibel waren. Als Ergebnis waren die proprietären Veränderungen nahezu unbrauchbar.

Das W3C-Konsortium, als Wächter über die im World Wide Web (WWW oder auch W3) benutzten Standards dafür zuständig, reagiert jetzt auf den Wunsch nach einer erneuten Standardisierung und einfachen Erweiterbarkeit mit einem verbesserten HTML-Standard, der "Extensible HyperText Markup Language" (XHTML 1.0).

Hinter der Bezeichnung XHTML 1.0 verbirgt sich die Neuimplementation von HTML 4 (ursprünglich aus der "Standard Generalized Markup Language" SGML hervorgegangen) auf der Basis von XML, der "Extensible Markup Language". Wichtigstes Ziel des neuen Standards ist die Unabhängigkeit von Systemplattformen und die Wahrung der Leistungsfähigkeit, gepaart mit einer einfachen Erweiterbarkeit für zukünftige Entwicklungen.

Für HTML-Programmierer bedeutet XHTML keine große Umstellung. Wer mit der neuen Sprache eine Befehlserweiterung beziehungsweise neue Tags erwartet, kann von dieser Vorstellung Abstand nehmen. Neben der Erweiterbarkeit wird ein weitaus größerer Wert auf syntaktische Genauigkeit gelegt. Offene Tags oder gemischte Groß- und Kleinschreibung sind in XHTML nicht erlaubt, ebenso wie ungeordnet verschachtelte Tags.

Abwärtskompatibilität als oberstes Ziel

Der strukturelle Aufbau von XHTML-Dokumenten ist dem der HTML-Pendants sehr ähnlich und abwärtskompatibel gehalten. XHTML verlangt zwingend die Angabe einer "Document Type Definition" (DTD) in der "Doc Type"-Angabe des Dokuments. Die meisten aktuellen HTML-Editoren versehen neue HTML-Dokumente bereits mit einer solchen Angabe, diese wird jedoch von den gegenwärtigen Browsern nicht ausgewertet. Das ändert sich mit XHTML künftig grundlegend, denn Anzeigewerkzeuge, die XHTML interpretieren wollen, werden die Sprachdefinition von einer zentral zugänglichen Stelle laden.

Der Vorteil liegt auf der Hand: Das Interface bekommt die aktuelle Seitenbeschreibungsvorschrift mitgeteilt, ohne dass der Anwender in einer ständigen Upgrade-Pflicht die Software auf den letzten Stand bringen muss. Dass der Browser die DTD in jedem Fall interpretieren kann, ist durch den Aufbau von XHTML als Anwendung von XML gewährleistet. Drei DTDs werden für XHTML bereitgestellt: Der Typ "Strict" stellt die konsequenteste Reformulierung von HTML 4 dar. Einige gewohnte Tags wie<FONT>und andere sind darin nicht mehr enthalten und wurden durchgehend durch CSS-Elemente ersetzt. Der Typ "Transitional" ist, wie der Name schon andeutet, für eine Übergangsphase gedacht, um Abwärtskompatibilität zu gewährleisten. Letztendlich ist der Typ "Frameset" eine DTD für Framesets mit einem dafür benötigten speziellen Grundmenge an Tags.

"XHTML Basic" für mobile Geräte

Speziell für den Gebrauch in mobilen Kleingeräten hat sich das W3C in letzter Zeit mit einer abgespeckten Version der Sprache beschäftigt. Ein Arbeitspapier zu "XHTML Basic" wurde im Februar auf den Weg gebracht. Ein typisches Dokument nach diesem Standard enthält zunächst die wesentlichen Module von XHTML, um den Großteil der benötigten Funktionalität abzudecken. Hinzu kommt die Fähigkeit zur Verarbeitung von Bildern, Formularen und einfachen Tabellen.

Das Haupteinsatzgebiet von XHTML Basic wird das Umfeld von Web-Clients sein, zum Beispiel in Mobiltelefonen, Personal Digital Assistants (PDAs), Pagern oder Settop-Boxen. In Zukunft sollen auch Navigationssysteme in Fahrzeugen oder Lesegeräte für elektronische Bücher mit dieser Technik ausgerüstet werden.

Das aus dem kompletten Satz von Definitionen bekannte Sprachelement "Style" wird in der Basisvariante nicht unterstützt. Stattdessen schlagen die Entwickler ein Konzept vor, bei dem stets auf externe Style-Sheets verwiesen wird. Dies soll Speicherplatz auf den Kleingeräten einsparen. Ein weiteres Feature, auf das Nutzer von XHTML Basic verzichten müssen, ist der Gebrauch von Scripts. Logischerweise stehen daher die Elemente "script" und "noscript" ebenfalls nicht zur Verfügung. Dasselbe gilt für so genannte Event-Handler. Geräteabhängige Ereignisse, wie der Eingang von Abfragen, kommen beim typischen Einsatz nicht vor, glauben die Experten vom W3C und verweisen auf die an ein Fernsehgerät angeschlossene Settop-Box. Ebenfalls verzichten müssen Programmierer in der XHTML-Basic-Version auf Datei- und Bildzugriffe in Formularen, da in den meisten Fällen auf den Web-Geräten kein lokales Dateisystem existiert.

Bei XHTML in allen seinen Varianten handelt es sich um den Versuch des W3C, den immer häufiger entstehenden, unkontrollierbaren Wildwuchs aus dem Web fernzuhalten und eine gelungene Seitendarstellung zu garantieren, unabhängig von der Systemplattform. Die Zukunft wird immer neue Anforderungen an Web-Anwendungen und damit an die Browser und Programmierer stellen. Deshalb werden Weiterentwicklungen von XHTML vermutlich nicht lange auf sich warten lassen. Für Version 1.1 sind unter anderem der modulare Aufbau für XHTML, volle Erweiterbarkeit, Mehrfachverwendung von Modulen und eine auf allen XML-fähigen Plattformen garantierte Einsetzbarkeit geplant. (js)

Zur Person

Jörn Janoschek

ist beim Content-Managementsystem-Hersteller Klahold aus dem hessischen Haiger beschäftigt. Als CTO (Chief Technologie Officer) beschäftigt er sich unter anderem mit neuen Internet-Trends.