Grundlagenserie Business Intelligence

Business Intelligence (Teil 3): Datenmodellierung – Relationale und Multidimensionale Modelle

Datenbanken und Datenmodelle

Ein Datenbanksystem besteht aus einer Datenbasis und einem Datenbank-Managementsystem (DBMS). Die Datenbasis oder Datenbank beinhaltet dabei die eigentlichen Daten, das DBMS ermöglicht es dem Nutzer, auf die Datenbasis zuzugreifen. Das DBMS kontrolliert dabei alle lesenden und schreibenden Zugriffe auf die Datenbank. Als externe Schnittstelle stellt das DBMS eine Datenmanipulationssprache zur Verfügung, mit der Abfragen formuliert und Daten eingefügt oder verändert werden können.

Datenbanksysteme: Das Zusammenspiel zwischen Datenbasis, DBMS und Schnittstellen
Datenbanksysteme: Das Zusammenspiel zwischen Datenbasis, DBMS und Schnittstellen

Weitere wichtige Aufgaben des DBMS sind unter anderem die Unterstützung des Datenschutzes, die Prüfung von Integritäts- und Konsistenzbedingungen und das Recovery nach Systemabstürzen.

Datenschutz wird gewährleistet, indem beispielsweise nicht jeder alle Daten lesen darf. Mit Integritäts- und Konsistenzbedingungen werden Vorgaben formuliert, denen alle Datensätze bestimmter Satztypen genügen müssen. Beispielsweise darf die Summe aller bezahlten Gehälter einen bestimmten Höchstbetrag nicht überschreiten. Für ein Recovery sorgt ein DBMS nach Systemabstürzen oder Fehlern, indem wieder ein korrekter Datenbankzustand hergestellt wird.

Bei der Einführung eines Datenbanksystems muss man einen Realitätsausschnitt so abbilden, dass er mit einem DBMS verwaltet werden kann. Zwei Fragen sind hier entscheidend. Erstens: Was soll man beschreiben, also welche Objekte der Realwelt und welche Beziehungen zwischen den Objekten sind relevant. Und zweitens: Wie sollen die Objekte und Beziehungen dargestellt werden.

Antworten auf diese Fragen gibt das Datenmodell. Ein Datenmodell als theoretische Grundlage für ein Datenbanksystem bestimmt, auf welche Art und Weise Daten in einem Datenbanksystem gespeichert und manipuliert werden. Es definiert damit die Infrastruktur für ein bestimmtes Datenbanksystem.

Grundsätzlich können Datenmodelle semantisch, logisch oder physisch ausgerichtet sein. Physische Datenmodelle sind techniknah orientiert und spezifizieren, wie Daten physisch abgespeichert werden. Diese Sicht interessiert Anwender wenig. Für sie sind logische und semantische Sichten wichtiger. Logische Datenmodelle beschreiben alle Daten auf logischer Ebene, unabhängig von ihrer Speicherung. Die größte Nähe zur Realität haben die semantischen Modelle. Sie bilden die Daten in einer völlig technikneutralen Ebene ab.