Grundlagenserie Business Intelligence

BI-Datenmanagement (Teil 2): Das Data Warehouse

Core Dataware Warehouse - Partitionierung

Partitionierung oder Fragmentierung ist ein weiteres Merkmal, um die Verarbeitungseffizienz eines DWH zu steigern. Dabei wird der Datenbestand in mehrere kleine, unabhängige Partitionen mit redundanzfreien Daten aufgeteilt. Diese kleinen Partitionen können einfacher verarbeitet werden.

Die Partitionierung kann aus technischer und betriebswirtschaftlicher Sicht erfolgen. Die IT-technische Partitionierung hängt wesentlich vom zu Grunde liegenden Datenbanksystem ab, wobei zwischen Partitionierung auf Systemebene und Partitionierung auf Programmebene unterschieden wird.

Mehr verbreitet ist die betriebswirtschaftliche Aufteilung der Daten. Bei der horizontalen Partitionierung, die vor allem bei der dezentralen Datenhaltung genutzt wird, werden die Unternehmensdaten beispielsweise auf verschiedenen Teilbereiche des Unternehmens oder unterschiedliche Zeiträume aufgesplittet. Dabei sind alle Partitionen durch eine identische Datenstruktur verbunden.

Die vertikale Partitionierung kann in Hinblick auf künftige Auswertungen und Analysen erfolgen und untergliedert beispielsweise die Daten bezüglich unternehmerischer Sachverhalte. Die vertikale Partitionierung entspricht dabei weitgehend den Anforderungen und der Struktur von Analyse-Werkzeugen, wie sie bei der Datenanalyse genutzt werden.

Ob und wie Daten partitioniert werden sollen, muss bereits in der Konzeptionsphase festgelegt werden. In der Praxis weit verbreitet ist die Partitionierung nach Zeiträumen, da so zumindest eine grobe Aufteilung möglich ist.