Grundlagenserie Business Intelligence
BI-Methoden (Teil 1): Ad-hoc Analysen mit OLAP
OLAP und OLTP
Das „Online“ in „Online Analytical Processing“ verweist auf den OLAP-Anspruch, Analyseprozesse auf Unternehmensdaten interaktiv („Online“) durchzuführen. Dies impliziert eine Nutzung des OLAP-Systems im Dialogbetrieb. Dabei müssen die Responsezeiten möglichst kurz gehalten werden. OLAP-Systeme sind deshalb logisch und physikalisch von den operativen Transaktionssystemen getrennt.
Die Daten werden bei OLAP subjektbezogen und verdichtet unter spezieller Berücksichtigung historischer Verlaufsdaten vorgehalten. Datenaktualisierungen finden nur periodisch durch Abzüge („Snaphots“) operativer Systeme statt. In der Regel wird nur lesend auf die verfügbaren Daten zugegriffen, wobei aufgrund der Historisierung mit einer mittleren bis langen Antwortzeit gerechnet werden muss.
Dem OLAP-Ansatz steht der traditionelle, operative OLTP-Ansatz („Online Transaction Processing“) gegenüber, wie er im relationalen Datenbankkonzept zum Ausdruck kommt. Beide Ansätze unterscheiden sich gravierend: Bei OLTP wiederholen sich die Datenbankprozesse ständig, sind strukturiert und bestehen aus isolierten, atomaren Transaktionen. Diese arbeiten mit aktuellsten Daten und greifen lesend sowie schreibend meist nur auf wenige Datensätze über Primärschlüssel zu.
Bei OLAP hingegen steht die historische, aggregierte Information im Vordergrund. Die Analysen bestehen aus komplexen Abfragen, der Zugriff erfolgt meist nur lesend. Die Tabelle fasst die wichtigsten Unterschiede schlagwortartig zusammen.
Merkmal |
OLTP |
OLAP |
Grundlegende Orientierung |
transaktionsorientiert |
analyse- und themenorientiert |
Anwendungsbereich |
operative Systeme (Administrations- und Dispositionssysteme) |
Data Warehouse Systeme |
Nutzer |
Administration, Sachbearbeiter |
Entscheidungs- und Führungskräfte, Manager |
Datenstruktur |
zweidimensional, anwendungsbezogen |
multidimensional, subjektbezogen |
Dateninhalt |
detaillierte, nicht verdichtete Einzeldaten |
verdichtete und abgeleitete Daten |
Datenverwaltungsziele |
transaktionale Konsistenzerhaltung |
zeitbasierte Versionierung |
Datenaktualität |
aktuelle Geschäftsdaten |
historische Verlaufsdaten |
Datenaktualisierung |
durch laufende Geschäftsvorfälle |
periodische Datenaktualisierung („Snapshot“) |
Zugriffsform |
lesen/schreiben/löschen |
lesen/verdichten |
Zugriffsmuster |
vorhersehbar, repetitiv |
ad hoc, heuristisch |
Zugriffshäufigkeit |
hoch |
mittel bis niedrig |
Transaktionsart und Dauer |
kurze Lese und Schreiboperationen |
lange Lesetransaktionen |