DTD: Regeln für XML-Dokumente

XML-basierte Inhalte verlangen nach Regeln, die festlegen, welche Tags in welcher Form verwendet werden dürfen. Diese Aufgabe erledigt die Dokumententyp-Definition DTD.

Eine der herausragenden Eigenschaften von XML ist seine Flexibilität: Jeder Entwickler kann nach Belieben eigene Tags einführen oder beinahe beliebig Attribute vergeben. Will man jedoch zwischen verschiedenen Softwarepaketen XML-Daten austauschen, müssen die Dokumente eben doch gewissen Regeln entsprechen. Irgendwie muss also festgelegt werden, welche Tags zulässig sind und welche nicht. Genau das ist Aufgabe der Dokumententyp-Definition - kurz DTD. DTDs sind formale Spezifikationen aller in einem Dokumenttyp erlaubten Strukturen. Man spricht auch von einer formalen Grammatik, in der zulässige Tags, Attribute und deren Verschachtelung definiert sind. Erst DTDs geben dem Ganzen also eine sinnvolle Bedeutung.

So wie jede natürliche Sprache ein Regelwerk benötigt, das festlegt, wie Sätze konstruiert, und Wörter und Begriffe aneinander gereiht werden können, so benötigen auch Auszeichnungssprachen eine Grammatik. In DTDs werden zulässige Elementnamen, deren möglichen Eigenschaften und deren Attribute definiert. Sie stellen somit sicher, dass verarbeitende Anwendungen XML-Dokumenten entsprechend der zu Grunde liegenden Grammatik interpretieren und verstehen können.

Einziger Haken: Die DTDs hat XML von SGML geerbt. Die dahinter stehende Technik unterliegt beispielsweise bei der Verwendung von Datentypen diversen Beschränkungen. Noch schlimmer ist, dass DTDs keine XML-Syntax verwenden. Diese Einschränkungen löst der DTD-Nachfolger XML-Schemata.