Grundlagenserie Business Intelligence

BI-Methoden (Teil 1): Ad-hoc Analysen mit OLAP

OLAP und OLTP

Das „Online“ in „Online Analytical Processing“ verweist auf den OLAP-Anspruch, Analyseprozesse auf Unternehmensdaten interaktiv („Online“) durchzuführen. Dies impliziert eine Nutzung des OLAP-Systems im Dialogbetrieb. Dabei müssen die Responsezeiten möglichst kurz gehalten werden. OLAP-Systeme sind deshalb logisch und physikalisch von den operativen Transaktionssystemen getrennt.

Die Daten werden bei OLAP subjektbezogen und verdichtet unter spezieller Berücksichtigung historischer Verlaufsdaten vorgehalten. Datenaktualisierungen finden nur periodisch durch Abzüge („Snaphots“) operativer Systeme statt. In der Regel wird nur lesend auf die verfügbaren Daten zugegriffen, wobei aufgrund der Historisierung mit einer mittleren bis langen Antwortzeit gerechnet werden muss.

Dem OLAP-Ansatz steht der traditionelle, operative OLTP-Ansatz („Online Transaction Processing“) gegenüber, wie er im relationalen Datenbankkonzept zum Ausdruck kommt. Beide Ansätze unterscheiden sich gravierend: Bei OLTP wiederholen sich die Datenbankprozesse ständig, sind strukturiert und bestehen aus isolierten, atomaren Transaktionen. Diese arbeiten mit aktuellsten Daten und greifen lesend sowie schreibend meist nur auf wenige Datensätze über Primärschlüssel zu.

Bei OLAP hingegen steht die historische, aggregierte Information im Vordergrund. Die Analysen bestehen aus komplexen Abfragen, der Zugriff erfolgt meist nur lesend. Die Tabelle fasst die wichtigsten Unterschiede schlagwortartig zusammen.

Unterschiede OLTP – OLAP

Merkmal

OLTP

OLAP

Grundlegende Orientierung

transaktionsorientiert

analyse- und themenorientiert

Anwendungsbereich

operative Systeme (Administrations- und Dispositionssysteme)

Data Warehouse Systeme

Nutzer

Administration, Sachbearbeiter

Entscheidungs- und Führungskräfte, Manager

Datenstruktur

zweidimensional, anwendungsbezogen

multidimensional, subjektbezogen

Dateninhalt

detaillierte, nicht verdichtete Einzeldaten

verdichtete und abgeleitete Daten

Datenverwaltungsziele

transaktionale Konsistenzerhaltung

zeitbasierte Versionierung

Datenaktualität

aktuelle Geschäftsdaten

historische Verlaufsdaten

Datenaktualisierung

durch laufende Geschäftsvorfälle

periodische Datenaktualisierung („Snapshot“)

Zugriffsform

lesen/schreiben/löschen

lesen/verdichten

Zugriffsmuster

vorhersehbar, repetitiv

ad hoc, heuristisch

Zugriffshäufigkeit

hoch

mittel bis niedrig

Transaktionsart und Dauer

kurze Lese und Schreiboperationen

lange Lesetransaktionen