Wege zu ausfallsicheren Systemen

Auf die richtige Implementierung kommt es an

In diesem Bereich wird zwar häufig in die Hardware investiert - redundante L3-Switches im Core, redundante Routeranbindungen - jedoch lässt die korrekte Implementierung oft zu wünschen übrig. Diese ist die Vorrausetzung für ein sauberes Umschalten auf die redundanten Systeme im Falle einer Störung. Administratoren dokumentieren und aktualisieren die Konfiguration häufig nicht und führen keine Backuptests durch. Ist ein Netz nicht richtig implementiert, ist dessen Verhalten nicht mehr vorherbestimmbar, dann lässt sich auch keine Aussage über die Verfügbarkeit treffen. Es ist oft sogar mit redundanter Hardware fraglich, ob das Netz wieder hergestellt werden kann.

Häufig ist die Root-Bridge in einem geswitchten Ethernet-LAN falsch gewählt. Wer hier nicht richtig konfiguriert, bringt durch die Neuinstallation eines einfachen Etagenswitches leicht das ganze Netz zum Stillstand. Bei den Routern sind IP-Netze falsch zusammengefasst oder OSPF-Domänen schlecht entworfen. Oft kommen diese Fehler erst zum Tragen, wenn das Netz eine bestimmte Größe erreicht hat. Sie sind dann nur schwer ohne längere Ausfallzeiten zu korrigieren, da meistens ein grundsätzliches Redesign notwendig ist.

Im WAN garantieren die Serviceprovider verschiedene Verfügbarkeiten, die je nach der Höhe der Gesamtverfügbarkeit unterschiedliche Investitionen erfordern wie etwa Backup-Strategien mit mehreren parallelen Standleitungen. Als preiswerte Alternative nutzen viele Unternehmen die wenig hochverfügbaren VPNs. Weit verbreitet ist heutzutage ein ISDN-Backup zur Standleitung. Teilweise sind die ISDN-Leitungen aber mitbetroffen, wenn beim Provider ein Switch ausfällt, der über das gleiche Equipment läuft. Deshalb sind für unternehmenskritische Ressourcen, die über das WAN erreichbar sein müssen, unterschiedliche Leitungswege über getrenntes, voneinander unabhängiges Equipment zu wählen.

Zu der Verfügbarkeit der Services zählen neben der Hardware, auf der die Dienste laufen, auch die gewünschte Mindestantwortzeit und die vertraglich festgelegte maximale Belastung. Beispielsweise ist es nicht von Nutzen, wenn ein Provider zwar eine unternehmenskritische Applikation auf zwei Server verteilt, jedoch bei einem Ausfall der intakte Server unter der Last der doppelten Anfragen zusammenbricht. Daher ist ein korrektes Baselining erforderlich. Das bedeutet, dass Provider die typische Last aller Systeme im Durchschnitt und unter Spitzenlast ermitteln, um herauszufinden, ob der Rest der Geräte bei einem Ausfall die Funktionen übernehmen kann. Eine lückenlose, bedarfsgerechte Netzwerkdokumentation, von Konfigurationsdaten für Router bis zum komplexen Kabelmanagementsystem, verschafft Unternehmen auch langfristig eine Grundlage für einen störungsfreien Netzbetrieb.