Unstrukturierte Daten verwalten

Sechs Tipps für Storage aus der Open Hybrid Cloud

05.03.2015 von Regina Böckle
Mit einer Software-defined-Storage-Lösung, die in einer Open-Hybrid-Cloud-Umgebung eingesetzt wird, können Unternehmen unstrukturierte Daten speichern und verwalten. Red Hat definiert sechs Best Practices für die Storage-Implementierung in einer Open Hybrid Cloud.

Das rasante Datenwachstum stellt Unternehmen vielerorts vor beträchtliche Probleme, wobei sich der Anstieg ungleich zwischen strukturierten und unstrukturierten Daten verteilt. Erfahrungen aus mittelständischen und großen Unternehmen zufolge hat sich in den vergangenen Jahren das Verhältnis zwischen den gespeicherten strukturierten und den unstrukturierten Daten drastisch geändert.

Lange Zeit waren beide Segmente in etwa gleich groß, heute entfallen rund 90 Prozent des Speichervolumens auf semistrukturierte und unstrukturierte Daten, beispielsweise Audio-, Video- und Bilddateien, E-Mails, Office-Dokumente, Zeichnungen und Virtual Machine Images. Genau hier ist vielerorts ein rasantes Wachstum zu verzeichnen.

Die Verlagerung der Daten in eine Open Hybrid Cloud ist eine Möglichkeit, diese Herausforderungen zu bewältigen. Gerald Sternagl, EMEA Business Unit Manager Storage bei Red Hat, empfiehlt folgende Vorgehensweise:

Gerald Sternagl: Der EMEA Business Unit Manager Storage bei Red Hat gibt Tipps für Storage aus der Open Hybrid Cloud.
Foto: Red Hat

1. Unstrukturierte Datenbestände inventarisieren

Nur ein geringer Anteil der in einem Unternehmen vorhandenen Daten befindet sich in relationalen Datenbanken. Weitgehend unklar ist, wo die unstrukturierten Informationen wie Bilder, Tabellen, Dokumente, Präsentationen oder archivierte Beiträge aus sozialen Medien gespeichert sind. Zu klären ist: Welche Daten liegen vor? Wo befinden sich die Daten? Wem gehören sie? Wann wurden sie zuletzt verwendet?

2. Daten klassifizieren

Wenn klar ist, welche unstrukturierten Informationen in einem Unternehmen vorliegen, sollte als Nächstes ermittelt werden, wer welche Dateien wie oft in welchen Anwendungsszenarien nutzt und welchen Stellenwert die Informationen für ein Unternehmen haben. Bei vorhandenen Beständen kann die Klassifizierung sehr aufwendig sein, weil es kaum automatisch arbeitende Tools gibt, die auch die Dateninhalte gut erkennen und eingruppieren können. Deshalb ist es auch wichtig, den Ursprung der Daten zu ermitteln. Die objektorientierte Datenspeicherung erlaubt die Vergabe von zusätzlichen Attributen, die sich vor allem bei der Implementierung eines Informationslebenszyklus als enorm nützlich erweisen.

3. Gesetzliche Anforderungen für die Aufbewahrung von Daten und Dokumenten berücksichtigen

Wichtig bei Belegen, elektronischen Rechnungen oder anderen Geschäftsdokumenten sind die Aufbewahrungsorte und die Aufbewahrungsfristen. Es gelten die Regeln und Anforderungen an die Speicherung von Daten und Dokumenten aus dem Bundesdatenschutzgesetz. Cloud-Computing-Anwendungsszenarien, bei denen keine personenbezogenen Daten zwecks Aufbewahrung an Server im Ausland gesendet werden, sind datenschutzrechtlich weniger problematisch.
Dokumentenmanagement-Systeme oder Archivierungslösungen können eingesetzt werden, um das Management des Informationslebenszyklus und die Wahl des passenden Speichermediums zu automatisieren.

4. Die Eignung bestimmter Daten für die Open Hybrid Cloud prüfen

Nach Klärung der grundlegenden Bedingungen können Unternehmen entscheiden, welche Daten, etwa aus Compliance-Gründen, weiterhin im Rechenzentrum vor Ort und welche in der Cloud gespeichert werden können.
Die Vorteile einer sicheren Speicherung in der Cloud liegen auf der Hand: Es müssen keine kostspieligen Investitionen in neue Speichersysteme getätigt werden, und vor allem entfallen zusätzliche Aufwendungen für den Betrieb und die regelmäßige Datensicherung und Disaster-Recovery-Maßnahmen, da diese üblicherweise in den Cloud-Dienstleistungen enthalten sind.
Cloud-Storage kann aber auch zur Entlastung der lokalen Speicherkapazitäten im Rechenzentrum verwendet werden, zum Beispiel durch Auslagerung von Backup- und Disaster-Recovery-Images in die Cloud. Die meisten gängigen Enterprise-Backup-Lösungen unterstützen den direkten Datentransfer in die Cloud.

5. Anforderungen wie Verfügbarkeit, Latenzzeiten und Datensicherheit beachten

Die organisatorischen Voraussetzungen im Unternehmen zu schaffen, um zumindest ausgewählte unstrukturierte Datenbestände in eine Open Hybrid Cloud zu migrieren, ist die eine Seite der Medaille. Die andere Seite ist die Klärung und Festlegung zentraler Anforderungen an den Cloud-Provider.
Dazu zählen Aspekte wie Verfügbarkeit, Performance und die Latenz der Datenverbindungen. Unternehmen mit vielen Standorten sollten Außenstellen mit einem eigenen lokalen Internetzugang ausstatten, um die Gateways in der Firmenzentrale zu entlasten.

6. Mit einem überschaubaren Pilotprojekt starten

Die Migration unstrukturierter Daten in eine Open Hybrid Cloud ist aus organisatorischer und IT-Sicht ein anspruchsvolles Projekt mit vielfältigen Implikationen. Um erste Erfahrungen zu sammeln, sollten Unternehmen in einem klar umgrenzten Anwendungsszenario ihre Vorstellungen und Anforderungen testen. Auf dieser Basis können dann weitere Datenbestände migriert und die Adaption von Cloud-Services weiter vorangetrieben werden.

Schritt für Schritt zum Online-Speicher -
Schritt für Schritt zum Online-Speicher
Unternehmen sollten bei der Einführung eines eigenen Online-Speichers verschiedene Punkte berücksichtigen. Dabei bieten sich zum Beispiel folgende Schritte an:
Bei der Auswahl der Lösung ...
... ist eine frühzeitige Einbindung der Mitarbeiter dringend zu empfehlen, da viele schon einen Online-Speicherdienst nutzen. Falls sich die eingeführte Anwendung ähnlich bedienen lässt, erhöht sich die Akzeptanz deutlich. Daher sollte im ersten Schritt festgestellt werden, wie viele Mitarbeiter welche Online-Speicherlösung nutzen. Dabei ist nicht nur die berufliche, sondern auf freiwilliger Basis auch die private Nutzung abzufragen.
Anhand der Ergebnisse sind die ...
... in Frage kommenden Speicherdienste auszuwählen. Dabei sollten einerseits die Bedienoberflächen und bereitgestellten Funktionen der Lösungen verglichen werden, andererseits die im Unternehmen zu erwartenden Anwendungsszenarien und einzuhaltenden Sicherheitsrichtlinien. Dabei steht nicht so sehr der Filesharing-Dienst an sich im Fokus, sondern die Collaboration-Möglichkeiten innerhalb des Unternehmens und mit externen Partnern sowie die Verwaltbarkeit. Zudem ist zu berücksichtigen, wo die Daten gespeichert werden und wie der Zugriff darauf geregelt ist.
Nach der Entscheidung für ein ...
... System sollte dieses zuerst als zusätzliche Option bereitstehen. Um die Mitarbeiter zum Ausprobieren zu bewegen, ist eine verständliche Präsentation und Erklärung der Funktionen ratsam sowie ein zusätzlicher Anreiz, etwa ein Gewinnspiel oder Wettbewerb. Im Vergleich zu den bisherigen Diensten sollte die neue Lösung einen echten Mehrwert bieten wie zum Beispiel einfachere Bedienung, schnellere Synchronisierung zwischen Mobilgeräten oder Integration in berufliche Anwendungen.
Ist der Enterprise-Speicher ...
... etabliert, sollte er schrittweise vorgeschrieben werden. Dabei hilft es, wenn er sich per Mausklick in immer mehr Anwendungen öffnen lässt oder als mobile App zur Verfügung steht. Denn je einfacher und praktischer Zugriff und Nutzung sind, desto eher verwenden ihn die Mitarbeiter.