Grundlagenserie Business Intelligence

Business Intelligence (Teil 3): Datenmodellierung – Relationale und Multidimensionale Modelle

Das Star-Schema

Eine besondere Form des multidimensionalen Datenmodells ist das Star-Schema. Das Schema hat sich zur Abbildung multidimensionaler Datenstrukturen in relationalen Datenbanken zum Standard entwickelt und wird vor allem in Data Warehouses und OLAP-Anwendungen eingesetzt.

Das Star-Schema versucht, die große Anzahl an Tabellen, wie sie im relationalen Modell typisch sind, zu minimieren. Die Bezeichnung Star-Schema rührt daher, dass die Tabellen sternenförmig angeordnet werden.

Star-Schema: Dimensionstabellen sind sternenförmig um die Fact-Tabelle angesiedelt. (Quelle: www.2cool4u.ch)
Star-Schema: Dimensionstabellen sind sternenförmig um die Fact-Tabelle angesiedelt. (Quelle: www.2cool4u.ch)

Dabei müssen zwei verschiedene Arten von Tabellen unterschieden werden. Im Zentrum steht die Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren. Beide werden durch Rechtecke symbolisiert. Die Faktentabelle dient zur Speicherung der Zahlen oder abgeleiteten Größen, also etwa Umsätze oder Kosten. Aus Würfelperspektive enthält sie den Würfelkern. Die Dimensionstabellen enthalten die qualitativen Daten zur Visualisierung der Dimensionen und Dimensionshierarchien.

Die einzelnen Zeilen einer Dimensionstabelle werden durch eine minimale Attributkombination, dem Primärschlüssel, identifiziert. Zur Herstellung der Beziehung zwischen den Dimensionstabellen und der zugehörigen Fakttabellen werden die Primärschlüssel der Dimensionstabellen in die Fakttabelle als Fremdschlüssel aufgenommen und bilden dort wiederum zusammen den Primärschlüssel der Fakttabelle. Die folgende Abbildung verdeutlicht dies.

Star-Schema: Die Faktentabelle besitzt als Primärschlüssel einen zusammengesetzten Schlüssel aus den Primärschlüsseln der Dimensionstabellen. (Quelle: www.2cool4u.ch)
Star-Schema: Die Faktentabelle besitzt als Primärschlüssel einen zusammengesetzten Schlüssel aus den Primärschlüsseln der Dimensionstabellen. (Quelle: www.2cool4u.ch)

Die folgende Abbildung zeigt ein konkretes Beispiel zum Star-Schema.

Star-Schema: Beispiel Profitabilitätsanalyse von Organisationseinheiten. (Quelle: www.2cool4u.ch)
Star-Schema: Beispiel Profitabilitätsanalyse von Organisationseinheiten. (Quelle: www.2cool4u.ch)

Ziel des Star-Schemas ist nicht die Normalisierung, sondern eine Optimierung auf effiziente Leseoperationen. Beim Star-Schema liegen die Dimensionstabellen deshalb denormalisiert vor: Es existieren funktionale Abhängigkeiten zwischen Nicht-Schlüsselattributen, so dass die dritte Normalform verletzt wird. Diese Verletzung nimmt man aber in Kauf, denn die Datenstruktur ermöglicht einebessere Verarbeitungsgeschwindigkeit zu Lasten der Datenintegrität und des Speicherplatzes.