Nur der Wandel bleibt konstant

Datenbanken, Normalformen und Legacy Data

Die Datenbank als Verwaltungsinstrument von Daten ist wesentlich jünger als der Computer selbst. Sie geht zurück auf die Erkenntnis, dass die rasant steigenden Mengen an Daten, die ein Computer zu verwalten hat, möglichst effizient und zugriffsfreundlich aufbewahrt werden müssen, um den Suchaufwand so gering wie möglich zu halten. Die Struktur einer Datenbank ist auf diese Bedürfnisse ausgerichtet. Sie besteht aus vielen unterschiedlichen Tabellen, in denen jeweils bestimmte Daten abgespeichert werden. Zum Beispiel werden in der Adressdatenbank alle zu einer bestimmten Adressnummer gehörigen Adressdaten erfasst. Über diese Nummer können dann etwa die Buchhaltungs- oder die Auftragsdaten mit den Adressdaten verknüpft werden. So wird verhindert, dass die gleichen Daten je nach Anwendung immer wieder neu erfasst werden und damit Speicherplatz belegen.

Das Prinzip der relationalen Datenbanken (RDBs) geht auf E.F. Codd zurück, dessen Normalformen zum Grundwissen eines jeden Informatik-Studenten gehören. Während dieses Grundprinzip bei allen RDBs identisch ist, unterscheiden sie sich erheblich in den Details ihres Aufbaus, ganz zu schweigen von der jeweils zugrunde liegenden Programmiersprache.

Im Gegensatz zu dieser strukturierten Form der Datenaufbereitung und -ablage stehen ältere Datenbestände, so genannte Legacy Data, die in vielen Systemen immer noch vorhanden sind und einen teilweise unverzichtbaren, in jedem Fall aber wertvollen Informationsbestand des jeweiligen Unternehmens darstellen. Häufig sind diese Daten unstrukturiert, sequenziell oder in Vorformen der Datenbanken abgelegt - etwa nach der Methode "Index sequenziell" oder VSAM.