Letzte Hoffnung im Labor

28.04.1999
Wenn sämtlichen Sicherheitsmaßnahmen zum Trotz wichtige Informationen verloren gehen, ist noch lange nicht alles verloren. In der Not schlägt die Stunde der Datenretter.

Von: Hartmut Lüerßen

Runtergefallen. Ganz einfach runtergefallen. Von außen sieht das Notebook völlig unbeschädigt aus, aber beim Booten kratzt die Festplatte und wird vom System nicht mehr erkannt. Der Anwender ist hilflos. Seine gesamten Daten auf dem Notebook scheinen unwiederbringlich verloren. Aber dort, wo Standardbetriebssysteme und Applikationen nur noch Fehlermeldungen produzieren, fängt die Arbeit der professionellen Datenretter wie Convar, Ibas oder Ontrack erst an. Mit speziellen Softwaretools und Analyseverfahren rükken sie allen möglichen Datenträgern zu Leibe. Vom zerknitterten Streamer-Tape bis zu halb verschmorten Rechnern landet alles in ihren Labors. Und in den meisten Fällen können sie zumindest Teile der Daten rekonstruieren.

Außer Pech oder Ungeschick gibt es vielfältige Gründe für Datenverluste: Hardware- und Softwarefehler, mangelnde Sorgfalt beim Systemaufbau, aber auch menschliches Versagen, Viren, Sabotage oder Naturkatastrophen. Die Sicherheit gegenüber Datenverlusten innerhalb eines Netzwerks hängt maßgeblich davon ab, wieviel Geld der Systemverwalter ausgeben darf. Storage-Pools mit RAID-Arrays (Raid = Redundant Array of independent Disks) und redundant ausgelegten Servern, die in Mehrknoten-Clustern mit Load-Balancing arbeiten, erreichen Verfügbarkeitswerte von 99,99 und mehr Prozent. Spiegelt man die Daten zusätzlich über Fibre-Channel in ein einige Kilometer entferntes erdbebensicheres Rechenzentrum, können auch Naturkatastrophen den gespeicherten Informationen kaum noch etwas anhaben. Diese Sicherheit kann sich jedoch nicht jeder leisten.

Verluste vermeiden

Auch mit geringerem Budget lassen sich wirksame Präventivmaßnahmen etablieren. Dabei gilt es, "Single Points of Failure" zu eliminieren, also Elemente, deren Ausfall einen totalen Kollaps auslösen würde. Der erste Schritt ist daher, Festplatten als Raid-Systeme zu fahren. Raid 5 ist am weitesten verbreitet und bietet hohe Datensicherheit, weil der Raid-Controller die Daten über mehrere Platten verteilt. Über Informationen zur Fehlerkorrektur (Parity Bits) kann Raid 5 den Ausfall einer Platte kompensieren. Fällt tatsächlich eine Platte aus, ist das System bis zum Austausch der fehlerhaften Platte wieder ein Single Point of Failure, so daß Ersatzplatten vorrätig sein sollten.

Tägliches Server-Backup ist generell ein Muß. Auch Raid-Systeme ändern nichts daran, da sie weder vor katastrophalen Softwarefehlern schützen noch vor Benutzern, die schwerwiegende Defekte auslösen. Trotzdem soll es sogar Internet-Ser-viceprovider gegeben haben, die aufgrund von Plattenspiegelung lange auf ein Tape-Backup verzichteten. Eines Tages stürzte das System ab und die Daten diverser Kunden gingen verloren.

Schon in kleinen Umgebungen kann sich der Kauf eines Autoloaders gegenüber einem einfachen Strea-mer rentieren, weil das Backup dann nahezu ohne die Fehlerquelle "Mensch" abläuft. Damit im Ernstfall jeder Handgriff sitzt, hilft regelmäßiges Wiederherstellungstraining (Recovery) in einer Testumgebung.

Strom, Viren, Sabotage

Genauso selbstverständlich wie das Backup sollte das Absichern der Server mit unterbrechungsfreien Stromversorgungen (USVs) sein. Diese schützen nicht nur bei Stromausfällen, sondern filtern auch die Eingangslast. Sie gleichen Über- und Unterspannungen aus und verhindern Hardwareschäden durch Spannungsspitzen. Wichtig ist, daß die USV-Batterie der Shut-Down-Software ausreichend Überbrückungszeit gibt, um das System vollständig herunterzufahren. Shut-Down-Software gehört heute zum Standardangebot der Hersteller dazu und unterstützt die gängigen Betriebssysteme. Zusätzliche Module, die die Umgebungstemperatur sowie die Luftfeuchtigkeit der klimatisierten Räume und Schränke überwachen, ergänzen das Konzept ebenso wie Managementsoftware, die über Alarm-Funktionen verfügt.

Kaum taucht ein neuer Virus auf, erscheint kurze Zeit später die Definition, die ihn unschädlich macht. Im Falle des Makrovirus "Melissa", der kürzlich in der Presse für Aufsehen sorgte, dauerte es bis zum Anti-Code nur wenige Tage. Um im Wettlauf zwischen Virenautoren und den Herstellern von Antivirussoftware auf dem neuesten Stand der Sicherheit zu sein, gehört regelmäßige Pflege der Online-Updates zu den Routinearbeiten. Größtenteils können die Updates automatisiert ablaufen und beanspruchen dadurch nicht allzuviel zusätzliche Arbeit auf dem Server. Mit Softwareverteilungswerkzeugen bekommen auch die Clients automatisch die neuen Definitionen.

Sabotage ist eng mit dem Thema Viren verbunden. Beide bedrohen das Unternehmen von innen und außen. Firewalls schützen gegen externe Angreifer, intern betreffen die Sicherheitsmaßnahmen vor allem Paßwortsicherung der Arbeitsplatzrechner und Gebäudesicherung mit Schlüsseln, Chipkarten oder biometrischer Authentifizierung.

Daten replizieren

Die nächste Sicherheitsstufe erreicht man mit Replikationssoftware und verteilten Servern. Dabei fungieren beispielsweise zwei Server gegenseitig als Stand-by-Server. Fällt der eine Server aus, kann der Administrator nach erfolgter Reparatur die Daten vom Stand-by-Server zurückreplizieren und hat dem Datenstamm wieder hergestellt. Wenn auf dem Zielserver die gleiche Anwendung installiert ist, kann dieser bei Ausfall des anderen sogar die Produktion aufrechterhalten. Dazu loggen sich die Benutzer des ausgefallenen Servers bei dem Ersatzserver ein. Auf diese Weise entstehen zwar noch keine Failover-Eigenschaften wie in einem Mehrknoten-Cluster, bei dem der Ausfall eines Servers für den Anwender transparent bleibt, aber die Datenverfügbarkeit steigt deutlich. Logischerweise wächst auch die Netzlast durch replizierte Daten. Nachdem das Image eines Servers übertragen ist, replizieren die Lösungen jedoch lediglich die veränderten Daten, was die zusätzliche Datenmenge erheblich reduziert. Dabei bestimmt der Administrator, ob das Replizieren online oder nach vorgegebenen Intervallen erfolgt.

Auch lassen sich durch replizierte Server enger werdende Backup-Zeitfenster umgehen. Dieser Aspekt spielt in 24x7-Umgebungen eine große Rolle. Dient ein Server als Ziel-server für mehrere replizierte Produktivserver, kann das Backup direkt über diesen Server laufen, ohne daß die Daten erneut das Netz belasten.

Diagnose und Heilung

Jeder Datenträger hat seine spezifischen Fehlerquellen. Datenretter unterscheiden dabei zwischen physikalischen und logischen Fehlern. Zu den typischen physikalischen Fehlern von Bandmedien zählen zerknitterte oder zerrissene Bänder, ausgelöst durch dejustierte Mechanik des Bandlaufwerks. Logische Fehler bei Tapes haben häufig ihre Ursache in verstellten Schreib-Leseköpfen, die früher aufgezeichnete Informationen nicht mehr korrekt lesen. Auch besteht die Gefahr, daß die Köpfe aus diesem Grund beim Backup fehlerhaft schreiben, ohne daß die Backup-Software Alarm schlägt. Als Vorbeugungsmaßnahme empfehlen die Hersteller daher, mit selbst angelegten Referenz-Tapes die korrekte Ausrichtung der Köpfe regelmäßig in Probeläufen zu kontrollieren. Das kostet zwar Zeit, verhindert aber auch, daß ein Recovery aufgrund von leeren Backup-Bändern fehlschlägt.

Bei Festplatten kommen Oberflächenschäden nach Headcrashes häufig vor. Sie entstehen meist durch Überalterung oder mechanische Erschütterungen, etwa durch Stürze. Logische Fehler, wie versehentlich formatierte Festplattenpartitionen oder Korruptionen der File Allocation Tables (FATs), passieren dagegen oft durch Benutzerfehler, Programm- oder Systemabstürze.

Überhitzung ist besonders bei schlecht belüfteten SCSI-Platten ein Problem und führt zu Ausfällen von Hardwarekomponenten der Festplatte. Solange die Temperatur an der Scheibenoberfläche die Magnetisierung nicht aufhebt, können die Labortechniker auch nach einer Feuersbrunst noch Daten rekonstruieren. Der Grenzwert liegt bei etwa 400 Grad Celsius.

Der erste Schritt zur Datenrettung ist in jedem Fall wie im Krankenhaus eine genaue Diagnose, die folgende Fragen beantworten sollte:

- Wie wichtig sind die Daten?

- Wie sehen die Symptome aus? (Geräusche, Fehlermeldungen)

- Welche Aktion hat zu dem Schaden geführt?

- Was für ein Schaden liegt vor?

Sowohl die Laborretter Ontrack und Convar als auch andere Hersteller wie Powerquest oder Symantec bieten Softwaretools zur Datenrettung an, von denen die meisten ausschließlich Windows-Umgebungen unterstützen. Grundsätzlich eignen sich die Werkzeuge nur für logische Fehler einzelner Festplatten, außerdem für Zip-Drives, Jazz-Laufwerke und Floppies. Sind die Daten durch weitere Festplattenaktivitäten bereits überschrieben, gelangen die Werkzeuge an ihre Grenzen. In diesen Fällen bleibt als Ausweg nur der Gang zum Spezialisten. Das gleiche gilt bei Hardwareschäden, komplexen Konfigurationen wie Raid und bei Problemen mit Bandspeichermedien.

Bevor ein Anwender sich im Notfall erstmals mit einer solchen Software beschäftigt, sollte er den Umgang vorher trainieren und dabei herausfinden, welche Fehler die Lösung seiner Wahl beheben kann. Bleiben bei der Diagnose einer Festplatte physikalische Schäden an der Oberfläche unerkannt, kann ein Rettungsversuch mit Softwaretools sogar schwerwiegende Folgen haben. Mit jedem Hochfahren der Platte besteht die Gefahr zusätzlicher Schäden, die möglicherweise auch im Labor nicht mehr zu beheben sind.

Preis nach Aufwand

Ein Anruf bei einer der Hotlines lohnt sich indes immer. Entscheidet sich der Anwender nach dem Gespräch dazu, den Datenträger einzuschicken, erhält er zunächst eine detaillierte Diagnose, die je nach Datenträger zwischen 150 und 500 Mark kostet. In der Diagnose erfährt der Kunde auch genau, welche Daten wiederhergestellt werden können. Der Preis, den er letzten Endes zahlt, hängt vorrangig vom Aufwand des Verfahrens ab, weniger von der Datenmenge. Eine Datenrettung von einer einzelnen Festplatte kostet zwischen 2000 und 5000 Mark.

Worin unterscheiden sich die Datenhelfer? Von den verschiedenen Unternehmen, die sich darauf spezialisiert haben, Daten zu rekonstruieren, haben einige zusätzlich zu den Labordiensten eigene kommerzielle Softwaretools entwickelt.

Ontrack bietet einen Online-Service namens "Remote Data Recovery" an, der allerdings voraussetzt, daß kein Hardwareschaden vorliegt. Über eine gesicherte Modemverbindung führen Techniker von Ontrack die Diagnose und die Datenrettung durch. Die norwegische Firma Ibas, die seit November letzten Jahres eine eigene Niederlassung mit Reinraumlabors in Hamburg betreibt, hat einen anderen Sonderservice parat: die "Patan"-Technik, deren genaues Verfahren Ibas hütet wie einen Schatz. Sie kommt in besonders aussichtslosen Fällen zu Einsatz. Bei dem arbeitsintensiven Verfahren entnehmen die Labortechniker einzelne Platten aus der Festplatte und montieren diese auf einen Spindelstand. Anschließend liest der "Pattern Analyzer" mit einem Universalkpof die Daten analog aus der rotierenden Platte aus. Über die entsprechenden Modelierungsverfahren der jeweiligen Harddisk-Hersteller lassen sich danach in mühsamer Arbeit die Dateistrukturen rekonstruieren. Mit der PatanTechnik gewinnen die Techniker sogar Daten aus Teilstücken von Scheiben. Aufgrund des besonders hohen Meßaufwandes klettern die Kosten schnell über 10 000 Mark.

Hohe Preise ergeben sich auch, wenn es ganz schnell gehen muß. Für Arbeit an Wochenenden, Feiertagen oder mitten in der Nacht steigen die Preise gegenüber den normalen Tarifen erheblich. Darin sind sich alle einig.

Konsequenzen

Grundsätzlich stehen die Chancen nicht schlecht, daß verloren geglaubte Daten noch zu rekonstruieren sind. Eine schnelle und genaue Diagnose, die das weitere Vorgehen bestimmt, steigert die Erfolgsquote enorm.

Dem Glücksgefühl, die verloren geglaubten Daten wieder mitnehmen zu können, gehen Verzweiflung, Wut und Angst voraus. Für viele hätte ein einziges zerstörtes Laufwerk oder Band den finanziellen Ruin bedeutet. Die meisten Klienten verlassen die Gebäude ihrer Helfer mit dem festen Entschluß, in Zukunft auf mehr Sicherheit zu achten. Auch wenn es mehr Geld kostet. Zu den Labors zurückkommen möchte keiner. Einmal zittern reicht.