Video-Schulung

eSeminar Business Intelligence, Lektion 2 - Datensammlung und -speicherung

Data Warehouse

Ein Data Warehouse ist die zentrale Datensammlung, deren Inhalt sich aus den bearbeiteten Daten der eben angegebenen Quellen zusammensetzt. Die Speicherung erfolgt dabei meist in relationalen Datenbanken.

Data Warehouses haben einige typische Merkmale. So ist ein DWH immer themenspezifisch an den Informationsbedürfnissen des Managements ausgerichtet. Dies können bestimmte Produkte, Produktgruppen, Kunden oder Märkte sein. Die Entscheidungsträger können so direkt Daten zu den sie interessierenden Kerngebieten recherchieren.

Ein zweites Merkmal eines Data Warehouses ist der Zeitraumbezug. Während Daten etwa aus ERP-Systemen transaktionsorientiert und auf eine konkrete Ist-Situation mit einem bestimmten Zeitpunkt bezogen sind, repräsentieren Daten im DWH meist Zeiträume wie Tage, Wochen oder Monate. Im Extremfall kann der Zeithorizont bis zu 10 Jahren betragen, etwa um Trendanalysen über historische Daten durchzuführen.

Im Gegensatz zu den normalen IT-Systemen werden Daten im Data Warehouse dauerhaft abgelegt. Die Informationssammlung in Data Warehouses besteht also langfristig und steht für künftige Analysen zur Verfügung. Dabei muss überlegt werden, wie das Datenwachstum begrenzt werden kann. Dies erfolgt beispielsweise durch Aggregierung von Daten oder Auslagern in Archivsysteme.

Data Marts

Im Kern besteht ein Data Warehouse aus einer zentralen, relationalen Datenbank, dem Core Data Warehouse. Das Core Data Warehouse kann Datengrößen von mehreren TByte umfassen. Dies ist etwa bei kundenzentrierten Data Warehouses der Fall, die Daten aller Kunden über den gesamten Lebenszyklus möglichst detailliert vorhalten.

Um das Handling mit der oft riesigen Core Data Warehouses zu vereinfachen werden oft Data Marts eingeführt. Data Marts sind Ausschnitte von Data Warehouses, kleinere Datenpools für Anwendungen, die spezifische Nutzergruppen wie bestimmte Abteilungen, Filialen oder Aufgabenbereiche bedienen.

Neben den eigentlichen Daten spielen im BI-Umfeld auch Metadaten eine wichtige Rolle. Diese „Daten über Daten“ beschreiben die Datenstruktur der in Data Warehouses gespeicherten Daten. Sie dienen beispielsweise zur Dokumentation der Informationsobjekte, zur Kennzeichnung ihrer Herkunft, Struktur und Zusammensetzung.

So, das waren die wichtigsten Facts zur Datensammlung und –speicherung. Im nächsten Video zeigen wir Ihnen, wie die Daten analysiert werden.