Datenbankdesign

Normalisierung von Datenbanken

Problemfall Redundanzen

Redundante Daten, also Daten, die entweder in mehreren Tabellen gleichzeitig gespeichert sind oder innerhalb einer Tabelle mehrfach vorkommen, verursachen nicht nur bei der Wartbarkeit der Daten große Probleme. Sie erhöhen ganz erheblich die Datenmenge, weil eben überflüssiger Weise gleiche Daten mehrfach gespeichert werden müssen. Die folgende Abbildung verdeutlicht das.

Nicht normal: Diese Datenbank bietet noch viel Raum für Verbesserungen.
Nicht normal: Diese Datenbank bietet noch viel Raum für Verbesserungen.

Hier werden Daten einer Sportveranstaltung eines Sportvereins gespeichert. Für jede Veranstaltung können dabei beliebig viele Teilnehmer definiert werden.

Doppelte und inkonsistente Daten

Das Problem dabei ist, dass für jeden Teilnehmer nicht nur dessen Daten gespeichert sind, sondern auch die der ganzen Veranstaltung, wie Richter, Termin, Ort oder Meldeschluss.

Auch bei der Wartung bereiten diese Redundanzen natürlich erheblichen Aufwand. Nehmen Sie an, für die Veranstaltung ändert sich der Name des Richters. Dann müssen Sie diese Änderung nicht nur in einem Datensatz vornehmen, sondern in mehreren, womöglich in mehreren hundert.

Tritt dabei ein Fehler auf oder vergessen Sie, einen Datensatz zu ändern, entstehen dabei inkonsistente Daten. Das heißt, die Daten in mehreren Datensätzen widersprechen sich. Sie können dann unter Umständen nicht mehr ermitteln, welche Daten die falschen und welche die richtigen sind.