Die Datenflut eindämmen

Fitnesskur durch cleveres Datenmanagement

Cleveres Datenmanagement optimiert Kosten und Performance

Mit zunehmendem Datenvolumen nimmt der Anteil der aktiv genutzten Daten rapide ab. Gerade ältere historische (kalte) Daten werden oftmals nur noch für eventuelle Prüfungen vorgehalten. Kalte Daten werden jedoch weiterhin in gleicher Weise wie die aktiv genutzten (warmen und heißen) Daten verwaltet. Das heißt, dass 1 Terabyte aktiv genutzter Daten die gleichen Kosten wie ein Terabyte unregelmäßig genutzter oder sogar ungenutzter temporärer Daten verursacht. Es versteht sich, dass dies aus Kosten- und Performance-Gründen wenig sinnvoll ist. Auch die Einhaltung von Service Level Agreements wird zunehmend schwieriger und teurer. Gefragt ist daher eine sinnvolle Speicherung beziehungsweise Archivierung der Daten gemäß ihrer Nutzung und Aussagekraft.

Speicherstrategie auf Datentyp abstimmen

Für ein Data Warehouse gibt es im Hinblick auf das physische Speichermanagement mehrere Möglichkeiten. Neben der normalen Speicherung (online) können die Daten klassisch in einem festen Speichermedium archiviert werden (offline).

Es gibt aber auch noch eine Zwischenform, die Nearline-Speicherung (NLS) (siehe Abbildung 2). Sie zeichnet sich durch zwei wesentliche Eigenschaften aus: Zum einen können die Daten mithilfe effizienter Komprimierungstechniken und dedizierter Systemlösungen vorgehalten werden. Zum anderen, und das ist für Analyse und Reporting von Bedeutung, haben die Benutzer durch die Integration der NLS-Schnittstelle in die OLAP-Engine weiterhin darauf Zugriff.

Abb 2: SAP-BW-Architektur mit Near-Line Storage
Abb 2: SAP-BW-Architektur mit Near-Line Storage
Foto: Datavard

Die Daten können daher in einem ihrem Alter und ihrer Stellung im Informationslebenszyklus entsprechenden optimalen Speichermedium abgelegt werden und damit die unterschiedlichen Anforderungen an deren Service Level Agreements (SLAs) adressieren. Der Einsatz von NLS empfiehlt sich vor allem für Daten aus InfoCubes und DSOs. Gerade für die Verwaltung großer Datenmengen mit den dabei auftretenden besonderen Anforderungen an Performance und Skalierbarkeit gibt es Konzepte, die für die unterschiedlichen Speicherstrategien Verbesserungspotenzial versprechen.

Die komprimierte Ablage der NLS-Daten erfolgt in spezifischen komprimierten Speicherbereichen der BW-Datenbank. Im Zuge der Big-Data-Diskussion sind darüber hinaus Technologien wie SAP IQ und Hadoop zukunftsträchtig, da sie große Datenvolumina effizient managen und diese mit sehr guter Performance bereitstellen können. Die klassische Datenarchivierung hingegen bietet eine kostengünstige Lösung für sehr alte Daten, Daten aus der Akquisitionsschicht und einige temporäre Daten. Durch das hohe Kosten-Nutzen-Verhältnis bietet es sich an, temporäre Daten nur kurz aufzubewahren und regelmäßig zu löschen.

Fazit

Die aktuellen Herausforderungen rasant wachsender Datenmengen, langer Zugriffszeiten und unnötig hohen administrativen Aufwands in Data-Warehouse-Umgebungen lassen sich schnell und mit wenig Aufwand lösen. Mit einem nachhaltigen Konzept für ein Business-Warehouse-Datenmanagement können Unternehmen die Informationsverwaltung ihrer Systeme deutlich verbessern und versteckte Potenziale realisieren. Ausgangspunkt ist die Analyse des Lebenszyklus von Informationen. Darauf aufbauend können Speicheroptimierungsmöglichkeiten wie Nearline-Storage (NLS) das Datenvolumen deutlich verringern und gleichzeitig den Zugriff auf archivierte Daten erleichtern. (bw)