Information Lifecycle Management

Professionelle Datenbankarchivierung spart Kosten

02.07.2014 von Kilian Götz
Ein konsequentes Information Lifecycle Management (ILM), verbunden mit einer professionellen Archivierung der Datenbanken, entlastet die Storage-Systeme signifikant. Lesen Sie, wann eine Datenbankarchivierung sinnvoll ist und was es dabei zu beachten gilt.

Experten schätzen das weltweite Datenvolumen schon heute auf 2,8 Zettabyte. Für 2020 prognostizierte IDC in seiner aktuellen Studie zum "Digital Universe" eine Zunahme auf 40 Zettabyte. Wie können die Unternehmen dieser Datenflut gerecht werden? Zahlreiche Daten schlummern in Datenbanken, werden aber nur selten benötigt. Dennoch verlangen gesetzliche oder unternehmensinterne Vorschriften ihre sichere Aufbewahrung.

Daten im Überfluss

Täglich fallen in den Unternehmen unzählige neue Informationen an, die in Datenbanken gespeichert werden. Produktions-, Verwaltungs-, Prozess- oder Finanzdaten zählen ebenso dazu wie Indexdaten aus einem Content-Management-System. Die Konsequenz daraus: Der Speicherplatz genügt nicht. Was bedeutet dies für die Unternehmen?

Die schnellste und gleichzeitig teuerste Lösung ist, den vorhandenen Speicher mit neuen Platten zu erweitern. Die Komplexität der IT-Architektur und der Aufwand, diese zu verwalten, steigt damit allerdings immer weiter an. Naheliegend wäre es auch, konsequent alte Daten zu löschen und Platz zu schaffen für neue. Dem stehen allerdings Revisions- und Compliance-Vorschriften entgegen. Sie besagen, dass geschäftsrelevante Informationen so aufbewahrt werden müssen, dass sie nicht nachträglich verändert werden können und jederzeit in einer vertretbaren Zeit auf sie zugegriffen werden kann.

Speicherplatz: Mit einer professionellen Datenbankarchivierung lässt sich im Laufe der Zeit ein Vielfaches an Kapazität sparen.
Foto: CSP

Die langfristig günstigste und effizienteste Möglichkeit liegt in der Archivierung der Datenbanken mit einer professionellen Lösung. Diese identifiziert zunächst anhand definierter Regeln inaktive Informationen, wandelt diese in offene, langzeitsichere Formate um und komprimiert die Daten anhand von Standardalgorithmen. Anschließend lagert sie diese Dateien in eigene Speichersysteme aus. Anwender können aber auch weiterhin über SQL-Abfragen oder Clients auf sämtliche Informationen zugreifen. Anschließend können die Daten in der Datenbank gelöscht werden. Der dadurch frei werdende Speicherplatz ist dabei deutlich größer als die eigentliche Menge der Nutzdaten.

So stellte beispielsweise die CSP GmbH & Co. KG in Kundenprojekten fest, dass Datenbanken oft dreimal größer sind als der Bestand an Nutzdaten. Sicherungsmechanismen legen mehrfache Kopien der Daten sowie Indizes für einen schnellen Datenzugriff im System an. Werden inaktive, ältere und weniger genutzte Daten über die Datenbankarchivierung aus den Produktivsystemen entfernt und separat archiviert, gibt die Datenbank diese Kapazitäten im Speicher ebenfalls frei. Die Performance der aktiven Systeme erhöht sich damit sehr deutlich.

Die Regeln für Unternehmen
MySQL Workbench
Mit der kostenlosen “MySQL Workbench” erhalten Anwender ein Komplettpaket, das die Arbeit mit der beliebten Open Source-Datenbank effizienter macht.
phpMyAdmin
Wer eine Web-basierende, kostenlose und stabile Lösung für die Verwaltung von MySQL-Datenbanken sucht, der wird beim populären “phpMyAdmin” fündig. Das Tool bietet vor allem Anfängern alle nötigen Features in einer bequemen Arbeitsumgebung.
Sequel Pro
Mit "Sequel Pro" stellt sich eine kostenlose und native Anwendung vor, die die Verwaltung von MySQL-Datenbanken auf dem Mac deutlich verbessern kann.
Querious
Mit “Querious” erhalten Mac-User eine weitere professionelle Anwendung, die in Sachen Funktionalität und Design hohe Anforderungen erfüllt. Ob der Lizenzpreis von knapp 30 Dollar im Vergleich zum kostenlosen Sequel Pro gerechtfertigt ist, muss jeder Einzelne für sich entscheiden.
MySQL Editor Pro
MySQL-Datenbanken mobil auf dem iPhone verwalten? Kein Problem mit “MySQL Editor Pro”. Dabei handelt es sich um eine einfache Lösung, die ihre Zwecke vollkommen erfüllt. Mit einem Preis von über 10 Euro ist es aber für eine App nicht gerade günstig.
DataGlass MySQL Mobile Database Client
Gute Performance, eine ansprechende Benutzerschnittstelle und einige nette Funktionen, die nicht unbedingt selbstverständlich sind, machen aus dem “DataGlass MySQL Mobile Database Client” für iPhone und iPad eine gute Option für Fortgeschrittene. Kostenpunkt: Knapp acht Euro.
SQLite Expert
Die Mini-Datenbank SQLite wird dank HTML5 und Smartphones wie Android und iPhone immer beliebter. Mit dem Freeware-Tool für Windows “SQLite Expert” können solche Client-seitige Datenbanken effizient verwaltet werden.
SQLite Manager
Das kostenlose und quelloffene Firefox-Addon “SQLite Manager” wandelt den Browser in einen leistungsfähigen Admin für SQLite-Systeme.

Lohnt sich eine Datenbankarchivierung im eigenen Unternehmen?

Wer dies herausfinden möchte, sollte sich zunächst einige grundlegende Fragen stellen:

Kostenentwicklung: Die Storage-Kosten für Datenbanken sind ohne Datenbankarchivierung um ein Vielfaches teurer.
Foto: CSP

Echte Einsparpotenziale bieten sich allen, die die meisten Fragen bejaht haben. Mit einer durchgängigen Datenbankarchivierung sparen Unternehmen schon innerhalb kürzester Zeit Kosten im fünf- bis sechsstelligen Euro-Bereich ein. Dabei sollten nicht nur die Preise pro Gigabyte für den physischen Speicher berücksichtigt werden. Der hohe Bedarf an Storage lässt auch die Kosten für Betrieb und Wartung der Systeme in die Höhe schnellen. Den Speicherplatz optimal zu nutzen lohnt sich auf jeden Fall.

Unterschiede erkennen, Fehler vermeiden

Nicht zu verwechseln ist eine professionelle Datenbankarchivierung mit einer Backup-Lösung zur reinen Wiederherstellung einer Datenbank. Speichert ein Unternehmen beispielsweise nur Backup- oder Export-Files in einem Langzeitspeichersystem, muss der gesamte Datenbestand wiederhergestellt werden, sobald auf einen Teil der Daten zugegriffen werden soll. Damit binden sich die Unternehmen an den Datenbankhersteller und dessen Dateiformat, das bei der Wiederherstellung unter Umständen nicht mehr unterstützt wird.

Schemaveränderungen in der Datenbank (beispielsweise neue Spalten innerhalb einer Tabelle) erhöhen den Aufwand bei Wiederherstellung und Recherchen über Backup-/Export-Dateigrenzen hinweg. Das verursacht in der Regel viele Fehler und einen hohen personellen Aufwand. Auch bei Eigenentwicklungen muss mit ähnlichen Problemen gerechnet werden. Zwar extrahieren auch diese Lösungen die Daten aus der Produktivdatenbank und speichern sie anschließend in eigenen Formaten. Allerdings basieren sie auf der bestehenden Datenbanksystematik und größtenteils auf den Erfahrungswerten des Entwicklers.

Tritt irgendwann der Ernstfall ein, und Anwender müssen auf die Daten zugreifen, tauchen zum Teil massive Probleme auf. Die Verantwortlichen stellen oft erst zu diesem Zeitpunkt fest, dass der Know-how-Träger nicht mehr zur Verfügung steht, keine ausreichende Dokumentation vorhanden ist oder abhängige Daten nicht konsistent und vollständig archiviert wurden. Fazit: Sicherheit und signifikante Kosteneinsparungen bringt nur eine professionelle Datenbankarchivierung.

Vorhandene Speicherkapazitäten sinnvoll nutzen

Viele Unternehmen arbeiten in sehr heterogenen IT-Landschaften. Bei der Auswahl einer geeigneten Archivierungslösung sollte dies auf jeden Fall berücksichtigt werden. Großes Einsparpotenzial bieten beispielsweise Lösungen, die es ermöglichen, die vorhandenen Speichersysteme in das Konzept einzubinden.

Zum Teil setzen die Hersteller hier auf XAM (extensible access method), eine standardisierte Schnittstelle für Storage-Applikationen, die die Kommunikation mit objektbasierten Speichersystemen ermöglicht. Nachteil dabei ist, dass nicht alle Systeme über diese Schnittstelle verfügen. Andere Lösungen nutzen eigene Frameworks oder Schnittstellen, die unter Umständen nicht alle Funktionen des Storage-Systems ansprechen können.

Größtmögliche Flexibilität bietet eine Datenbankarchivierung, die die Schnittstellen der unterschiedlichen Storage-Systeme über eigene Adapter direkt anspricht. Sie kann sich optimal an das jeweilige Storage-System anpassen und dessen Entwicklungsumgebung nutzen. Die Unternehmen können bei unterschiedlichen Applikationen auch auf separate Storage-Systeme archivieren: Über die Adapter lässt sich Applikation A beispielsweise auf eine Centera archivieren, während Applikation B auf ein lokales Storage-System geschrieben wird. Flexibilität sichert das Adapterkonzept auch bei der Wahl der Hardware. Sobald ein neues Storage-System über eine programmierbare Schnittstelle verfügt, kann bei Bedarf ein Adapter entwickelt und implementiert werden. Die Applikation bleibt davon unberührt. Das spart Zeit und Geld.

Auf Datenbankseite empfiehlt sich ebenfalls eine Lösung, die größtmögliche Flexibilität gewährleistet. Neben Oracle, DB2, MS SQL oder Informix sollte auch die Archivierung anderer relationaler Datenbank-Systeme ohne größeren Aufwand möglich sein. Um die archivierten Daten langfristig lesen und auswerten zu können, speichern professionelle Datenbankarchivierungslösungen sämtliche Informationen in Textdateien sowie die Metadaten in XML-Dateien. Dabei berücksichtigen die Archivierungssysteme auch Änderungen in der Datenbankarchitektur, wie sie gerade bei Unternehmenszusammenschlüssen oder Restrukturierungen häufig vorkommen. Nutzt die Archivierungslösung zusätzlich leistungsfähige und quelloffene Komprimierungsalgorithmen, spart das erhebliche Speicherkapazitäten.

Strategisch planen, strukturiert umsetzen

Haben die Verantwortlichen erst einmal erkannt, dass sie mit einer systematischen Datenbankarchivierung auf Dauer Kosten einsparen, beginnt die strategische Planung. Verfügt das Unternehmen schon über eine eigene Strategie zum Information Lifecycle Management (ILM), wird die Datenbankarchivierung hier integriert.

Häufig beschreiten die Unternehmen den Weg auch in anderer Richtung. Sprich, im Zuge der Einführung einer Datenbankarchivierung wird auch ein eigenes ILM erarbeitet. Soll die Datenbank dauerhaft entlastet werden, muss der Lebenszyklus der Daten möglichst genau analysiert werden. Dies erfordert in der Regel eine sehr enge Zusammenarbeit zwischen der IT-Abteilung und den einzelnen Fachbereichen. Zahlreiche gesetzliche Vorgaben müssen berücksichtigt werden, darunter GDPdU, GoBS und Basel II. Die Dauer der Aufbewahrung variiert dabei von einigen Jahren bis zu mehreren Jahrzehnten wie beispielsweise im Gesundheitswesen. Und auch in der Art und Weise der Aufbewahrung unterscheiden sich die einzelnen Vorgaben. Insbesondere bei komplexen Projekten lohnt es sich für die Unternehmen, schon bei der Planung einen Spezialisten ins Team zu integrieren, um alle Vorgaben abzudecken und das gesamte Potenzial einer Archivierungslösung ausschöpfen zu können.

Kalkulation: Tools wie der Chronos Calculator von CSP errechnen die Kosten für eine Archivlösung.
Foto: CSP

Im Zuge der strategischen Planung stellt sich auch die Frage, ob nicht sogar einige Anwendungen komplett stillgelegt werden können. Gerade bei älteren Systemen besteht immer das Risiko, dass gesetzliche Anforderungen nicht mehr eingehalten werden können, sobald die Hardware ausfällt oder die Daten nicht mehr gelesen oder ausgewertet werden können. Zusätzlich belasten die Aufwendungen für Wartung und Betrieb des Legacy-Systems die IT-Budgets in großem Maße.

Beim Application Retirement oder Decommissioning schaltet das Unternehmen die Altsysteme komplett ab, und eine Archivierungslösung speichert die Daten unabhängig davon in einem zentralen System. Die Anwender können nach wie vor auf die Daten zugreifen und Recherchen durchführen. Legt man für den Betrieb der Altsysteme inklusive Personalkosten 50.000 Euro pro Jahr zugrunde, spart das Unternehmen in zehn Jahren 500.000 Euro ein. Im Mainframe-Umfeld liegen diese Kosten oft um ein Vielfaches höher.

Datenbankarchivierung bringt hohe Kosteneinsparungen

Selbst wenn keine Anwendung komplett stillgelegt wird, amortisieren sich Lösungen zur Datenbankarchivierung in der Regel sehr schnell. Dies verdeutlicht die folgende praxisnahe Beispielrechnung:

Eine Datenbank mit einem angenommenen Datenvolumen von 5 Terabyte soll mit einer Datenbankarchivierung entlastet werden. In den nächsten fünf Jahren wird ein monatlicher Anstieg der Daten zunächst um 50 Gigabyte erwartet. In den kommenden Jahren wachsen die Daten immer um 10 weitere Gigabyte pro Monat, sodass im fünften Jahr monatlich 90 Gigabyte zusätzlich erwartet werden. Bei den Storage-Kosten für die Datenbank wurde ein durchschnittlicher Betrag von 5 Euro pro Gigabyte angenommen, bei der Archivierung von 0,10 Euro pro Gigabyte. Als weiterer Parameter wurde der Anteil inaktiver Daten innerhalb der Datenbank auf 50 Prozent geschätzt - häufig liegen die Werte hier deutlich höher.

ROI: Der Chronos Calculator von CSP zeigt auf, ab wann sich die Investition in eine Datenbankarchivierungslösung rechnet.
Foto: CSP

Bei den Kosten für die Implementierung einer Datenbankarchivierung wurden neben den Lizenzierungskosten auch Aufwendungen im Unternehmen berücksichtigt, um ein realistisches Bild zu zeichnen. Anhand des Kalkulations-Tools Chronos Calculator von CSP ergibt sich bei diesen Werten, dass sich die Investition schon nach sieben Monaten rechnet. Innerhalb von fünf Jahren lassen sich die Storage-Kosten gar um 1,2 Millionen Euro reduzieren.

Mit einer durchdachten ILM-Strategie und einer professionellen Datenbankarchivierung können die Kosten für Storagesysteme deutlich gesenkt werden. Die Verfügbarkeit der Informationen bleibt dabei in vollem Umfang erhalten. (cvi)