Grundlagenserie Business Intelligence

Business Intelligence (Teil 2): Datensammlung und Data Warehouses

Data Warehouse

Data Warehouses (DWH) sind grundsätzlich der Ort mit der höchsten Datenqualität im Unternehmen. Ein DWH ist die zentrale Datensammlung, deren Inhalt sich aus Daten der eben angegebenen Quellen zusammensetzt. Die Speicherung erfolgt dabei meist in relationalen Datenbanken.

Data Warehouse: Im Data Warehouse werden die vorbereiteten Daten langfristig gespeichert
Data Warehouse: Im Data Warehouse werden die vorbereiteten Daten langfristig gespeichert

Der Schwerpunkt von DHWs liegt auf der Bereitstellung und Verarbeitung großer Datenmengen zur Durchführung von Auswertungen und Analysen. Sie dienen als einheitliche und möglichst konsistente Datenbasis für alle Arten von entscheidungsunterstützenden Systemen.

DHWs ermöglichen es, völlig unabhängig von den operativen Geschäftsprozessen, die aufbereiteten Daten in neue Zusammenhänge zu bringen. So können beispielsweise Informationen zur Steuerung und Kontrolle operativer Prozesse erlangt werden. Spezielle Analysetools erzeugen verschiedenen Sichten auf den nun dispositiven Datenbestand. Aus ihm lassen sich prinzipiell beliebige Auswertungen erstellen, die je nach Bedarf erwünscht sind.

Data Warehouses haben einige typische Merkmale. So ist ein DWH immer themenspezifisch an den Informationsbedürfnissen des Managements ausgerichtet. Dies können bestimmte Produkte, Produktgruppen, Kunden oder Märkte sein. Die Entscheidungsträger können so direkt Daten zu den sie interessierenden Kerngebieten recherchieren.

Ein zweites, wesentliches Merkmal ist der Zeitraumbezug. Während operative Daten etwa aus ERP-Systemen transaktionsorientiert und auf eine konkrete Ist-Situation zu einem bestimmten Zeitpunkt bezogen sind, repräsentieren Daten im DWH meist Zeiträume wie Tage, Wochen oder Monate. Im Extremfall kann der Zeithorizont bis zu 10 Jahren betragen, etwa um Trendanalysen über historische Verläufe durchzuführen.

Im Gegensatz zu operativen Systemen werden Daten im Data Warehouse drittens dauerhaft abgelegt. Die Informationssammlung in DWHs besteht also langfristig und steht für künftige Analysen zur Verfügung. Dabei muss überlegt werden, wie das Datenwachstum begrenzt werden kann. Dies erfolgt beispielsweise durch Aggregierung von Daten oder Auslagern in Archivsysteme.

Eine große Rolle bei DWHs spielt auch die Granularität der Daten. Die Granularität beschreibt den Detaillierungsgrad von Daten. Sehr detaillierte Daten haben eine niedrige Granularität, hoch verdichtete Daten eine entsprechend hohe Granularität. Verdichtung erfolgt beispielsweise durch Summeriung einzelner Datenobjekte, Bildung eines statistischen Mittelwertes oder durch Aggregation mehrere Objekte zu einem neuen.

Aus Sicht von IT-Technik und Management bestehen hier unterschiedliche Anforderungen. Während IT-technisch eine möglichst hohe Granularität erwünscht ist, weil sie Datenvolumen und Speicherplatz minimiert, ist aus Management-Sicht eine möglichst niedrige Granularität zu bevorzugen, weil damit flexiblere Auswertungen möglich sind.