Störungs- und Krisenmanagement

IT-Ausfällen vorbeugen

Workflow-gestützte Dokumentation

Um auf einen IT-Notfall angemessen zu reagieren, benötigen Unternehmen eine strukturierte IT-Notfallkonzeption, die verschiedene Eventualitäten bereits im Vorfeld beleuchtet. Tritt in der IT-Umgebung eine Notfallsituation ein, beschreibt sie die Vorgehensweise, wie in einer angemessenen Zeit zum einen der Notfallbetrieb und zum anderen die vollständige Verfügbarkeit der IT und der Daten sichergestellt werden können. Eine Orientierung gibt der IT-Service-Continuity-Management (ITSCM)-Standard nach ITIL 2011, der als vierstufiger Leitfaden zur Behebung von "Major Incidents" und zur Realisierung einer gezielten Wiederherstellungsplanung von IT-Services verfasst wurde.

Um Unternehmen bei der zuverlässigen IT-Notfallplanung zu unterstützen und die ITSCM-Maßnahmen unter Berücksichtigung individueller Strukturen erfolgreich umzusetzen, hat sich heute auf Basis dieses Leitfadens ein ganzheitliches Best-Practice-Modell etabliert. Dieses umfasst sowohl die Identifikation relevanter IT-Services und die Konzeptionierung der Notfallprozessplanung als auch die Einrichtung eines Notfall-Desks und die Informationsbereitstellung für den Wirtschaftsprüfer. Am Ende bekommt das Unternehmen eine vollständige, software- und Workflow-gestützte Dokumentation mit allen relevanten Informationen an die Hand, sodass die notwendigen Schritte zur Wiederherstellung der IT wie eine Checkliste abzuarbeiten sind.

Entwicklung des Notfallplans

Ein Notfall entsteht zumeist durch eine Verkettung einzelner Störungen, die jeweils für sich genommen nicht kritisch gewesen wären. Die Notfallplanung erfüllt daher nicht nur den Zweck, eine systematische Wiederherstellung des Betriebes und der Daten zu gewährleisten, sondern dient auch dazu, Risiken präventiv zu managen und zu verhindern, dass Notfälle überhaupt entstehen können. Am Anfang des Planungsprozesses steht daher eine Risikobetrachtung (Business-Impact). Deren Basis ist es, mögliche Risiken zu identifizieren, zu analysieren, zu bewerten und zu dokumentieren. Daraus lassen sich sowohl die kritischen Ausfallzeiten, quasi die "Überlebensdauer" des Unternehmens im Hinblick auf bestehende Verträge und SLAs, als auch Schwachstellen auf Prozessebene, IT-Risiken und geeignete Gegenmaßnahmen ermitteln.

Vorlage für die Praxis: Ein mögliches Entwicklungsschema eines IT-Notfallplans.
Vorlage für die Praxis: Ein mögliches Entwicklungsschema eines IT-Notfallplans.
Foto: mIT Solutions GmbH

In dieser Analysephase wird ebenfalls definiert, welche Systeme für die Leistungserbringung des Unternehmens als kritisch einzustufen sind, wie diese zusammenspielen und welche Bedingungen gegeben sein müssen, um bestimmte Workflows anzustoßen. Auf dieser Grundlage wird schließlich festgelegt, wann eine Störung zu einem Notfall beziehungsweise wann ein Notfall zu einer Krise wird sowie welche Kommunikationswege und Abläufe zur Wiederherstellung zu initiieren sind. Im Anschluss wird genau geplant, wie Notfallprozesse und Wiederanläufe auszusehen haben, um die Störung zu beheben.

Anhand einer "Notfall-Checkliste" kann der verantwortliche Mitarbeiter die Einhaltung sämtlicher Prozessschritte von A bis Z überwachen.