IT Desaster Recovery

So vermeiden Sie IT-Ausfälle im Unternehmen

Um Ausfälle von Servern, Storage und Netzwerken im Unternehmen zu vermeiden, bedarf es einer ausgeklügelten IT-Desaster-Recovery-Strategie. Dabei müssen IT-Verantwortliche Aspekte von A wie Alarmierung bis Z wie zentrales Power-Management eines umfassenden Notfallplans beachten.

Ein Blick in die Medien genügt, um zu begreifen, dass das Thema der sogenannten "IT Desaster Recovery" eine neue Dimension erreicht hat. Bisher war dies ein vorwiegend technischer Aspekt, der mit der Anschaffung von USV-Anlagen und der Einführung einiger Prozesse rasch zu den Akten gelegt wurde. Bei diversen Einsparungsprogrammen wurden sicherlich auch mal Tests nicht durchgeführt, bei Wartungen gespart und empfohlene Batterie-Lebensleistungen künstlich verlängert. Mittlerweile sind die Gefahren vielschichtiger geworden und die Auswirkungen existenzbedrohend. Das gilt gerade für mittelständische Unternehmen.

Es herrscht immer das Bestreben, sich vor einer Naturkatastrophe, vor IT-Security-Vorfällen und einem technischem Ausfall bestmöglich zu schützen. Die Schlagworte "Resilienz und Redundanz" sind allgegenwärtig und Stand der Technik, auch wenn es öfter vorkommt, dass dieser Zustand nur theoretisch vorherrscht. Die zentrale Frage ist aber, welcher Budgetanteil in die Krisenprävention und wie viel in das tatsächliche Katastrophenmanagement investiert wird. Implizit wird angenommen, dass USV-Geräte, redundante Leitungen und treibstoffbetriebene Systeme dafür sorgen, dass ein Ausfall nicht stattfinden kann oder die Notsituation in einem überschaubaren Zeitraum behoben ist. Womöglich ist das ein spekulativer Trugschluss, wie die Realität gelehrt hat.

Die Werkzeuge im Krisenfall

Bisher war Stand der Technik, dass verschiedene Hersteller ihre Lösungen mit Analyse- und Managementfähigkeiten ausgestattet haben. Die USV-Lieferanten überwachen die Batteriesysteme, die Serverfarmen und Netzwerke werden genauso im Auge behalten wie virtuelle Umgebungen. Nun ist es aber im Krisenfall notwendig, automatisierte Prozesse ablaufen zu lassen, die eine ganzheitliche Sicht und nicht nur ein Monitoring erlauben, sondern zudem ein konkretes Eingreifen ermöglichen.

Das bedeutet nichts anderes, als auf Knopfdruck ein Rechenzentrum herunterzufahren oder aus bestimmten Brandabschnitten Daten zu evakuieren. In Zukunft wird es notwendig sein, flexibel agieren zu können, Fehler zu vermeiden und ruhigen Gewissens auch einen Desaster-Recovery-Test durchführen zu können, wenn die Auditoren dies verlangen.