Grundlagen: Backup-Software

27.04.2005 von KARL FROEHLICH, speicherguide.de 
Wenn wichtige Daten nach einem Server-Crash nicht gesichert sind, steht die Existenz einer Firma auf dem Spiel. Nur eine funktionelle und intelligente Backup-Software hilft, solche Katastrophen im Vorfeld abzuwenden.

Datensicherungs-Software-Pakete sind ein elementarer Bestandteil der unternehmensweiten Backup/Recovery-Strategie. Neben den üblichen Funktionen bietet eine gute Software unter anderem eine Management-Anbindung, eine praxistaugliche Benutzeroberfläche, ein sinnvolles Lizenzierungsverfahren und die Unterstützung einer großen Auswahl an Datenträgern.

Niemand macht es wirklich gern, wenige können sich auf die Ergebnisse verlassen und kaum jemand spricht darüber: Backup. Das Stiefkind der EDV wird in Rechenzentren gern nach anderen Aufgaben erledigt, sofern noch Zeit dafür bleibt. Auf der anderen Seite bilden die Ergebnisse des Backups die Grundlage für die Wiederherstellung des Betriebs nach einer Katastrophe. Seit einiger Zeit werden diese auch für die Beurteilung der Kreditwürdigkeit eines Unternehmens herangezogen.

Grundsätzliche Backup-Funktionen

Zu den grundsätzlichen Funktionen von Backup-Software-Paketen zählt das Kopieren von Dateien beziehungsweise kompletten Dateisystemen von Festplatten auf Medien wie Magnetbänder, optische Datenträger oder Disc Arrays. Darüber hinaus müssen sie das Zurückholen der Sicherung in den Produktivbetrieb beherrschen.

Nahezu alle Programme unterstützen dabei die gängigen Betriebs- und Dateisysteme sowie unterschiedliche Tape-Medien wie AIT, DLT und LTO. Alle Applikationen bringen einen eigenen Zeitplaner, den so genannten Scheduler mit, der es ermöglicht, die Sicherungen zu definierten Zeitpunkten und bei Bedarf nur für bestimmte Dateien durchzuführen.

Backup-Medien

Beim Aufbau einer Backup-Umgebung sollten die ersten Überlegungen den Speichermedien gelten. Zur Auswahl stehen hier Bänder, optische Medien oder preiswerte Festplatten mit PATA- oder SATA-Schnittstelle. Denkbar sind mehrstufige Konzepte, bei denen die für den Produktivbetrieb notwendige Sicherung auf schnellen Medien und die Langzeitsicherung auf preiswerten Datenträgern erfolgt. Für den Gesamtaufbau entscheidend sind die zu sichernden Dateisysteme beziehungsweise Speicherformate, die Art des verwendeten Netzwerks und der übrigen Infrastruktur.

Für die Sicherung kleiner und mittlerer Umgebungen und deren Rekonstruktion eignen sich einzelne DLT- oder LTO-Laufwerke, deren Medien jeweils Kapazitäten von 100 bis 600 GByte bieten. Mit Hilfe von integrierten Kompressionsalgorithmen können diese Mengen auf das Doppelte bis Dreifache erhöht werden, so dass hier maximal 1,8 TByte auf ein Band passen. Bei dem relativ geringen Preis von 20 bis 100 Euro pro Band muss man allerdings auch eine Reihe von Nachteilen in Kauf nehmen. Dazu zählen der fehlende physikalische Datenschutz, der mechanische und daher vergleichsweise langsame Betrieb des Bandsystems sowie die Vorgabe der Hersteller, die Daten regelmäßig umzuspulen und die Bänder nachzuspannen. Durch die Nutzung von Bandbibliotheken mit mehreren Tape-Drives lassen sich diese Nachteile zwar mindern, aber nicht völlig ausräumen.

Die aus dem Archivumfeld bekannten optischen Medien wie DVDs speichern zwischen 4,7 und 8,5 GByte pro Scheibe und sind im einfachsten Falle mit preiswerten Standardlaufwerken nutzbar. Allerdings gibt es auch hier mehr Nach- als Vorteile, wie zum Beispiel die relativ geringe Lebensdauer und den langsamen Zugriff.

Im laufenden Jahr haben mehrere große Hersteller Plattenbibliotheken auf den Markt gebracht, die mit allen oben genannten Nachteilen von Bändern und optischen Medien aufräumen sollen. Festplatten in PATA- oder SATA-Technologie bieten eine unschlagbare Kombination an Kapazität (bis zu 400 GByte im 3,5-Zoll-Format), Zuverlässigkeit (höhere MTBF als alle anderen Medien) und Geschwindigkeit (Faktor 3 bis 5 gegenüber Bändern oder DVDs). Diese Bibliotheken sind ideal für die schnelle Rekonstruktion der Produktivumgebung unter Beibehaltung der bisherigen Sicherungsverfahren.

Backup-Strategien

Alle großen Backup-Software-Pakete bieten die Möglichkeit, einzelne Dateien oder auch ganze Dateisysteme zu sichern. Bei der Auswahl sollte natürlich auf die Unterstützung der im Rechenzentrum verwendeten Betriebs- und Dateisysteme geachtet werden.

Da Dateien oder Datenbanken nur konsistent und damit in einer rekonstruierten Umgebung wieder zu gebrauchen sind, wenn diese zum Zeitpunkt der Sicherung nicht durch Anwendungen oder Nutzer geöffnet waren, ermöglichen die meisten Pakete nur die Sicherung "geschlossener" Dateien. Einige Hersteller werben zwar damit, dass ihre Produkte auch "geöffnete" und damit inkonsistente Dateien sichern können. Jedoch müssen sich die Nutzer über die Folgen der Nutzung dieser unsicheren Inhalte im Klaren sein. Viel wichtiger ist da eine Programmierschnittstelle, ein so genanntes API (Application Programming Interface). Mit dessen Hilfe können Anwendungen wie Mail-Programme oder Datenbanken der Sicherungs-Software mitteilen, wenn die einschlägigen Dateien geschlossen wurden und sie damit der Sicherung zur Verfügung stehen.

Zu den grundsätzlichen Backup-Funktionen gehören so genannte Voll- und inkrementelle Sicherungen. Für Vollsicherungen werden komplette Dateisysteme auf den Datenträger kopiert. Dagegen sichert das inkrementelle Verfahren nur die seit dem letzten Durchlauf veränderten Dateien. Die meisten Anwender nutzen eine Kombination aus Vollsicherung und Inkrementen, wobei meist ein Mal pro Woche eine Vollsicherung und dann ein Mal pro Tag ein inkrementelles Backup erfolgt. Somit nimmt der Sicherungsprozess nur ein Mal pro Woche eine längere Zeit in Anspruch, während die täglichen Durchläufe wesentlich schneller abgeschlossen sind. Nachteil: Das Restore verlängert sich, da im Worst-Case-Fall die Bänder der kompletten Woche benötigt werden. Alle Datenbankhersteller bieten die Möglichkeit, ihre entsprechenden Dateien logisch zu schließen und somit eine konsistente Sicherung zu gestatten, ohne dass die Arbeit mit ihrem Produkt unterbrochen oder eingeschränkt wird.

Backup-Umgebung

Eine weitere grundsätzliche Entscheidung muss für den Aufbau der Sicherungsumgebung getroffen werden. Geringe oder mittlere Datenaufkommen lassen sich über die vorhandenen Ethernet-Verbindungen sichern, während größere Bestände besser über direkt an die Festplattensysteme angeschlossenen Fibre-Channel-Verbindungen bewegt werden.

Zum Vergleich: Über Gbit-Ethernet lassen sich maximal 128 MByte Rohdaten pro Sekunde transportieren, also maximal 90 bis 95 MByte/s nach Abzug des Protokoll-Overheads. Diese Kapazitäten müssen meist mit einem Produktivnetz geteilt werden, stehen der Sicherung also nicht voll zur Verfügung oder schränken den Netzwerkbetrieb spürbar ein. Allerdings können die meisten Bandlaufwerke nicht mehr als 30 bis 35 MByte/s schreiben und fordern bei weitem nicht die zur Verfügung stehende Bandbreite ab. Problematischer wird es in Standardnetzen mit 100 Mbit/s, die höchstens 9 bis 9,5 MByte/s transportieren. Abhilfe kann hier die Nutzung von FC-Verbindungen schaffen. Diese bieten maximal zwei Gbit/s Bandbreite und transportieren dank des wesentlich schlankeren Protokolls bis zu 200 MByte/s. Erst hier lohnt sich der Einsatz von Bandbibliotheken mit parallelem Betrieb mehrerer Laufwerke oder von Disc Arrays mit entsprechenden Geschwindigkeiten.

Die allerwenigsten Umgebungen leisten sich den Komfort nur eines Betriebssystems. Daher bieten die meisten Software-Hersteller die Möglichkeit, auch Daten aus heterogenen Betriebs- und Dateisystemen über so genannte Agenten auszulesen und zu sichern. So ist es beispielsweise möglich, Daten nicht nur direkt von einem Windows-Server aus, sondern über Agenten auch Unix-, AS/400- und Mainframe-Systeme auf Band oder Platte zu sichern. Der große Vorteil eines solchen Aufbaus liegt in der zentralen Verwaltung und dem somit wesentlich geringeren Zeit-, Personal- und Materialaufwand.

Bedienung und Integration

Die Frage nach einer Benutzeroberfläche stellt sich heute eigentlich kaum noch, bringt doch jede Sicherungs-Software ihre eigene Schnittstelle mit oder wird in andere Verwaltungspakete für Netzwerke oder Speichersysteme integriert. Auch hier sollte der Anwender überprüfen, ob alle zu sichernden Betriebs- und Dateisysteme in die Benutzeroberfläche eingebunden sind und alle Funktionalitäten homogen über alle Plattformen zur Verfügung stehen. Kommandozeilen kommen nur noch dort zum Einsatz, wo die Sicherung in andere Prozesse, zum Beispiel in Batch- oder Kopierläufe, eingebettet werden muss. Kein Anwender gibt sich heute mehr mit der manuellen Eingabe unübersichtlicher und kryptischer Befehlsketten zufrieden.

In großen Umgebungen mit vielen zu sichernden Systemen sollte darüber hinaus die Möglichkeit bestehen, den zentralen Backup-Server über eine Netzwerkschnittstelle oder ein Webinterface bedienen zu können. Damit lassen sich alle Sicherungsoperationen von einem beliebigen Punkt im Netzwerk, im Extremfall sogar über eine Ferneinwahl oder das Internet, bedienen.

Backup steht heute nicht mehr isoliert im Betrieb, sondern wird mehr und mehr in die Gesamtabläufe des Rechenzentrums integriert. Das Anhalten der Schreiboperationen, die Überprüfung auf geöffnete Dateien und die Sicherung von Teilen oder eines gesamten Dateisystems sollten ebenso extern steuerbar sein wie die Rücksicherung nach einem eventuellen Katastrophenfall. Darüber hinaus sollten Fehler oder Probleme mit der Sicherung an eine zentrale Stelle gemeldet und in einer Datei aufgezeichnet werden.

Lizenzierung der Backup-Software

Einen nicht unerheblichen Kostenfaktor neben den genutzten Medien und den benötigten Bandbreiten generieren die Lizenzkosten für das Backup-Software-Paket der Wahl. Hier gibt es unterschiedliche Modelle, die je nach Umgebung und Medien in deutlichen Preisunterschieden resultieren können.

Zur Wahl stehen Kapazitätsmodelle bis hin zu Grund- beziehungsweise Agenten-Varianten. Das heißt, ein zentraler Sicherungs-Server wird pauschal in Rechnung gestellt, während jeder Agent auf einem fremden Betriebssystem oder auf einem anderen Rechner extra kostet.

Möglich ist auch ein Nutzermodell. Dieses berechnet die Lizenzkosten auf Basis der Anzahl der angeschlossenen Systeme, der parallel möglichen Sicherungsläufe oder der angeschlossenen Band- oder Plattenlaufwerke. Am günstigsten erweist sich meist eine Mischform aus den hier aufgeführten Modellen, die ebenfalls von den meisten Herstellern angeboten wird.

Backup-Tests unter Realbedingungen

Kein Backup der Welt ist ohne ständige Tests in realistischen Umgebungen auch nur einen Cent wert. Jeder Datenbestand sollte mindestens ein Mal im Jahr - am besten noch häufiger - unter Katastrophenbedingungen vom Sicherungsmedium in die Produktivumgebung zurückgespielt werden.

Hierbei gewinnen alle Beteiligten die nötige Sicherheit und Ruhe im Umgang mit den Anwendungen und der verwendeten Technik. Erst bei und vor allem nach diesen Übungen werden eventuelle Mängel und Lücken in der Backup-Strategie deutlich und lassen sich rechtzeitig beheben, bevor Schaden entsteht.

Fazit

Die großen Backup-Software-Pakete bieten heute weit mehr als nur die Möglichkeit zur Sicherung und Wiederherstellung von Dateien und Dateisystemen. Vielmehr sollten Backup und vor allem Restore als Bestandteil der Überlebensstrategie eines Unternehmens behandelt und entsprechend konzipiert werden. Übersichtliche Benutzeroberflächen, die Unterstützung vieler unterschiedlicher Plattformen und Formate, APIs und die Einbindung in Management-Umgebungen sollten als selbstverständlicher Standard gelten. Entsprechende Lösungen stellt der Markt in vielfältiger Form zur Verfügung.

Unsere Marktübersicht Backup-Software liefert Ihnen die wichtigsten technischen Details und Service-Aspekte zu Backup-Software-Paketen für Windows, Macintosh und Unix/Linux. Die Einstiegskosten belaufen sich auf rund 49 Euro und reichen bei Server-Varianten bis zu mehreren Tausend Euro. (hal)

Dieser Artikel basiert auf einem Beitrag von speicherguide.de.