DTD: Regeln für XML-Dokumente

Logische und physikalische Struktur

DTDs beschreiben alle Aspekte, wie Tags innerhalb von Dokumenten verwendet werden dürfen. Sie definieren, welche Elemente verfügbar sind, in welcher Reihenfolge diese erscheinen müssen und welche Verschachtelungen möglich sind. XML-Dokumente, die sich an die Vorgaben der DTD halten, bezeichnet man als gültig.

Der Begriff "Struktur" ist grundlegend für das Verständnis von DTDs. Prinzipiell muss man zwischen logischen und physikalischen Strukturen unterscheiden. Logische Strukturen definieren die strukturelle Abfolge von Elementen im Dokument. Hier eignet sich wieder das Bild des Baumes, das aus genau einem Wurzelelement besteht, an dem beliebig viele Unterbäume hängen. Diese Unterbäume bestehen selbst aus Elementen. Diesen Elementen lassen sich Attribute zuordnen. Aus dieser Betrachtungsweise folgt: Logische Strukturen bestehen aus Elementtyp- und Attributlisten-Deklarationen.

Die physikalische Struktur von XML-Dokumenten ist durch die Speicherungseinheiten, so genannte Entitäten, gegeben. Ein XML-Dokument kann aus einer oder mehreren Entitäten bestehen. Da XML-Dokumente nicht nur Textstrukturen beschreiben, sondern ebenso multimediale Inhalte (also auch Nicht-XML-Inhalte) einbinden, werden diese über externe Entitäten deklariert. Eine entsprechende Notation beschreibt dabei das Datenformat einer externen Entität. Eine solche Notation kann beispielsweise einen Hinweis auf ein externes Programm beinhalten, das den Inhalt der Entity verarbeitet. Physikalische Strukturen werden also durch Entity- und Notation-Deklarationen definiert.