Grundlagenserie Business Intelligence

BI-Datenmanagement (Teil 1): Datenaufbereitung durch den ETL-Prozess

Transformation – 3. Schritt: Aggregation

Es folgt nun die betriebswirtschaftliche Aufbereitung. Im Aggregationsschritt werden die Daten in die gewünschte Granularität überführt. Sollen die detailliertesten Daten des Data Warehouses beispielsweise tagesaktuelle Werte auf Basis von Produkt- und Kundengruppen bilden, so müssen alle Einzeldaten über Aggregationsalgorithmen zu produktgruppen- und kundengruppenspezifischen Werten auf Tagesbasis zusammengefasst werden.

Auch Vorsummierungen, wie sie bestimmte betriebswirtschaftliche Kennziffern benötigen, werden auf dieser Ebene durchgeführt und in den Datenbestand übernommen. Ziel dabei ist es, Summenwerte zu erzeugen, die aus Performancegründen vorberechnet im Data Warehouse gehalten werden.

Zum Zweck der Aggregation werden meist Dimensionshierarchietabellen entwickelt. An der Spitze solcher Hierarchietabellen steht das Element „Gesamt“ oder „Alle“, in der alle Einzelelemente aggregiert sind. Eine einfache Hierarchie wäre zum Beispiel „Kunde, Kundengruppe, Gesamt“.

Wird nach verschiedenen Kriterien hierarchisiert, entstehen parallele Hierarchien. Diese sind oft notwendig, da im Unternehmen unterschiedliche Zielgruppen und Auswertungszwecke vorhanden sind. Beispielsweise ist ein Kundenmanager eher an Summen auf der Basis von Kundengruppen interessiert, während ein Produktmanager meist auf Summen für bestimmte Produktarten zurückgreift.

Dieses Stadium der Datenaufbereitung ist ein wichtiger Einschnitt, was die „Neutralität“ der Daten betrifft. Mit der Ausrichtung der Datenhaltung auf bestimmte Anwendungsklassen und Zielgruppen wird der Ansatz einer applikationsneutralen Datenmodellierung auf dieser Ebene praktisch aufgegeben.