Grundlagenserie Business Intelligence

BI-Datenmanagement (Teil 1): Datenaufbereitung durch den ETL-Prozess

Fazit

Der ETL-Prozess übernimmt die Bereinigung und Transformation der operativen Daten und stellt sie im Data Warehouse für weitergehende Analysen bereit. Umrahmt von den beiden Endpunkten – der Datenextraktion auf der operativen Seite und dem Laden der bearbeiteten Daten auf Seite des Data Warehouses – übernimmt der Transformationsprozess die entscheidende Aufbereitung in vier Schritten. Diese Aufbereitung erfolgt in den Abschnitten Filterung, Harmonisierung, Aggregation und Anreicherung.

Die beiden ersten Transformationsschritte, Filterung und Harmonisierung, sind für die Bereinigung und Aufbereitung von Daten zuständig, etwa die Angleichung unterschiedlicher Kodierungen und Währungen. Danach sind die Daten prinzipiell bereits für BI-Analysen verwertbar. Die beiden folgenden Schritte der Aggregation und Anreicherung fassen Daten themenspezifisch zusammen und erweitern sie um betriebswirtschaftliche Kennzahlen. Die so erzeugten und ins Data Warehouse geladenen Daten erhalten damit bereits eine bestimmte Ausrichtung auf die Bedürfnisse einzelner Nutzergruppen und Analysezwecke. (ala)