Der Weg zum Information Lifecycle Management

29.06.2005 von ROLAND KEMPF
Der steigende Kostendruck und rechtliche Vorgaben zur Datenarchivierung in Verbindung mit der wachsenden Datenflut erfordern eine effiziente Informationsverwaltung. Die Grundlage dafür ist ein einheitliches Datenmanagement.

Nach aktuellen Studien führender Marktforscher wächst der Datenbestand jährlich weltweit um 20 bis 40 Prozent. Speicheradministratoren müssen dieses Volumen bewältigen, ohne in zusätzliches Personal oder kostenintensive Ressourcen zu investieren. ILM-Strategien sind ein probates Mittel, um den Anforderungen der modernen Datenspeicherung zu begegnen.

ILM ist ein Konzept der automatisierten Datenverwaltung, bei der Informationen nach festgelegten Richtlinien entsprechend ihrer Wertigkeit und ihrer vorgesehenen Nutzung über ihren gesamten Lebenszyklus hinweg auf bestimmten Speichermedien verwaltet werden. Ziel von ILM ist es, den Wert der Informationen voll auszuschöpfen - und das zu möglichst geringen Kosten. Der Erfolg eines ILM-Konzepts steht und fällt mit der effizienten und automatisierten Verwaltung des Daten-Lifecycles von der ersten Speicherung, über Datensicherung inklusive Recovery, Replikation, Hierarchisches Storage Management (HSM), Archivierung und Storage Resource Management bis zum Löschen des Datensatzes.

Voraussetzungen für die Umsetzung der ILM-Strategie

ILM ist kein Einzelprodukt, sondern setzt sich aus Elementen des Workflowmanagement, dem Dokumentenmanagement und dem Speichermanagement zusammen. Soll ILM greifen, müssen diese Elemente zu einer ganzheitlichen Lösung zusammengeführt werden, mit dem Ziel, über definierte Zeiträume hinweg jeweils den kostengünstigsten Speicherort oder das ideale Medium zu verwenden.

Je wichtiger eine Datei für die Geschäftsprozesse ist, umso höher muss die Verfügbarkeit sein und desto teurer sind wiederum die geeigneten Speichermedien. Es hat sich gezeigt, dass hierarchische Speicherstrategien das notwendige Kosten-/Nutzen-Verhältnis der zu sichernden Daten garantieren. Das undifferenzierte Wegspeichern auf ein einziges Speichersystem würde der unterschiedlichen Wertigkeit von Daten nicht gerecht. Gerade in datenintensiven Branchen wäre dies mit immensen Kosten verbunden und daher wirtschaftlich nicht tragbar.

Speicherinfrastruktur

Wer die Datenverwaltung im Sinne einer ILM-Strategie vereinfachen und automatisieren möchte, geht schrittweise vor. Prinzipiell lässt sich die Einführung eines ILM-Konzepts in drei Phasen gliedern. Dazu gehört die Analyse der bestehenden Speicherinfrastruktur, die Einteilung der Speicherhierarchien sowie die Klassifizierung der Daten.

In einem ersten Schritt sollte die bestehende Speicherinfrastruktur und Storage-Umgebung bezüglich ihrer Auslastung, Kapazitäten und Integrationsfähigkeit untersucht werden. Technologische Voraussetzung für ILM sind intelligente Speichernetzwerke wie Storage Area Networks (SAN), Network Attached Storage (NAS) und IP Storage. Sie bieten flexible Plattformen, die die Hauptaufgaben der Datenverwaltung (wie beispielsweise Backup und Recovery) automatisieren.

Speicherhierarchien und Klassifizierung der Daten

In einem zweiten Schritt erfolgt die Definition, wie mit den Informationen umzugehen ist. Dabei sind die Daten in Service-Levels zu unterteilen, durch die sich wiederum die Speicherinfrastruktur in verschiedene Ebenen teilt. Neue kostengünstigere Speichertechnologien wie zum Beispiel SATA-Platten haben die Speicherhierarchie erweitert. Der Einsatz von Disk-to-Disk-Speicherung hat eine neue Dimension von Sekundärspeichern geschaffen.

Heute gibt es mindestens drei Hierarchien (Primärspeicher, Sekundär-, Tertiärspeicher), wenn man die unterschiedlichen Technologien im Online-Bereich (High-End, Mid-tier bzw. Entry-RAID-Systeme) und die Technologien im Nearline-Bereich betrachtet (Bänder, Cartridges, CD, DVD etc.). Für eine optimale Ausnutzung dieser Hierarchien ist ein einheitliches, automatisiertes Datenmanagement erforderlich. Mit dessen Hilfe werden Prozesse bestimmt, wobei Anwender zunächst Primär- und Sekundärdaten je nach ihrem Geschäftswert innerhalb des Lebenszyklus klassifizieren. Diese Daten werden dann auf dem idealen, das heißt kostengünstigsten physikalischen Speicherort beziehungsweise dem geeigneten Medium abgelegt – je nach Anforderung an Verfügbarkeit, Performance, Skalierbarkeit und Kosten.

Daten einteilen und Richtlinien anwenden

Um eine Einteilung diesbezüglich vorzunehmen, müssen folgende Fragen beantwortet werden:

Anhand dieser Analyse lässt sich bestimmen, welche der Daten für den ständigen Online-Betrieb auf teurem Online-Speicher vorgehalten werden müssen und welche Daten sich auf günstigere Nearline-, Inline- oder Archivspeicher verteilen lassen.

Zuletzt geht es darum, geschäftsorientierte Regeln (Policies) auf die gesamte heterogene IT-Infrastruktur anzuwenden und so die richtige Anwendung zur richtigen Zeit dem entsprechenden Service-Level automatisiert zuzuordnen.

Generell steht fest: Je automatisierter die Datenbewegung zwischen den Speicherebenen in heterogenen Umgebungen erfolgt, desto wirksamer kann ILM greifen. Die Voraussetzung für eine automatisierte und intelligente Datenbewegung ist eine einheitliche Sicht und Kontrolle über die Auslastung der Speicherressourcen auf allen Ebenen.

Komponenten für ILM

ILM ist zwar ein präsentes Dauerthema, doch momentan bietet kaum ein Anbieter eine ganzheitliche ILM-Lösung. Zentrale Datenmanagementkomponenten für ein ILM sind Backup und Disaster Recovery, Replikation, Hierarchisches Storage Management, Archivierung und Storage Resource Management. All diese Funktionen bieten besondere Fähigkeiten zur Verwaltung des Datenlebens.

Damit Unternehmen ILM-Vorteile jedoch voll ausschöpfen können, ist eine Lösung ideal, die diese unterschiedlichen Komponenten zu einem einheitlichen Konzept verbindet. Durch die Integration von Datenbewegungs-Tools (Backup und Restore, Archivierung etc.) mit Managementfunktionen wie beispielsweise SRM und SAN-Management lassen sich unterschiedliche Speichertechnologien, Software- und Hardware-Lösungen als geschlossene Einheit verwalten. Datenzugang und Datenverfügbarkeit können so richtlinienbasiert automatisiert werden. Diese durchgängige automatische Verwaltung und Überwachung der Dateninfrastruktur bildet die Plattform für die praktische Umsetzung der ILM-Strategie.

Unified Data Management

Ein ILM-Ansatz basiert beispielsweise auf der Strategie des Unified Data Management, das unterschiedliche Datenmanagementfunktionen in eine Gesamtlösung integriert. Alle für ein ILM relevanten Aufgaben wie Backup und Recovery, Archivierung, Replikation, HSM, SRM und Service Level Management bauen auf einer gemeinsamen, automatisierten Technologieplattform auf und werden von dieser aus gesteuert.

Die einheitliche, integrierte Verwaltung der verschiedenen Datenmanagementfunktionen vereinfacht die Bestimmung von unternehmensweiten Richtlinien, um Daten anhand von bestimmten Klassifizierungen zu sichern und zu speichern. Die Datenverschiebung (Backup, Archivierung, HSM etc.) zwischen den Stufen kann so automatisiert erfolgen. Indem die Speichermedien einheitlich dargestellt werden und alle Funktionen über eine Plattform unter Verwendung einer gemeinsamen Metadaten-Datenbank übergreifend arbeiten, lässt sich die Speicherinfrastruktur überwachen. (Robert Kempf/mje)

Der Autor

Roland Kempf ist Country Manager Central Europe bei CommVault Systems.