Grundlagenserie Business Intelligence

Business Intelligence (Teil 2): Datensammlung und Data Warehouses

Core Data Warehouse und Data Marts

Das Core Data Warehouse stellt die zentrale Datenbank innerhalb des DWH dar. Die Datenbank wird direkt aus den operativen internen und externen Quellen befüllt. Das Core DWH basiert in der Regel auf einer relationalen Datenbank und kann Datengrößen von mehreren Terabyte umfassen. Dies ist etwa bei kundenzentrierten Data Warehouses der Fall, die Daten aller Kunden über den gesamten Lebenszyklus möglichst detailliert vorhalten.

Das Core DWH stellt Daten nach einem ersten Transformationsprozess für unterschiedliche Auswertungszwecke bereit und sorgt dafür, dass sie an entsprechende Nutzergruppen weitergegeben werden.

Um das Handling mit der oft riesigen Core DWH zu vereinfachen werden oft Data Marts eingeführt. Data Marts sind Ausschnitte von Data Warehouses, kleinere Datenpools für Anwendungen, die spezifische Nutzergruppen wie bestimmte Abteilungen oder Aufgabenbereiche bedienen.

Der Vorteil liegt darin, dass nicht die komplette Datenbasis eines Unternehmens sofort abgebildet werden muss, sondern nur die Daten, die für Fragestellungen des jeweiligen Bereichs oder der jeweiligen Abteilung benötigt werden. Die Daten für Data Marts werden meist mit speziellen Transformationsprozessen aus dem Core Data Warehouse in kleine, überschaubare Einheiten extrahiert. Dies können beispielsweise alle relevanten Daten einer Region oder einer bestimmten Produktgruppe sein. Die manchmal als dezentrale Data Warehouse bezeichneten Marts erhöhen so die Effizienz, da die Auswertung Gigabyte großer Datenbestände sehr zeitaufwändig ist.