Vorsorgen verhindert Pannen

14.10.1998
Neben den Maßnahmen zur Vorbeugung von Netzwerkproblemen sorgt eine optimale Wartungsstrategie für einen problemfreien Netzwerkbetrieb. Der folgende Beitrag be-schreibt die sieben "goldenen Regeln" einer Wartungsstrategie und bietet einen Test zur Selbstüberprüfung.

Von: Neal Allen Henriecus Koeman Paul Stone

Früher galten bestimmte Computernetze als "Mission Critical" oder auf deutsch als "unverzichtbar für den Geschäftsbetrieb". Dies bezog sich auf Systeme, deren Ausfall katastrophale Folgen für die Arbeit einer Organisation gehabt hätte. Das Marktforschungsinstitut Infonetics Research fand heraus, daß 83 Prozent aller Netzwerkmanager die Applikationen auf ihren Netzwerken als unverzichtbar für den Geschäftsablauf bezeichnen.

Während die Netze immer mehr zum integralen Bestandteil des Geschäftsbetriebs wurden, nahmen andererseits auch die Probleme zu. Dazu gehören nicht nur Störungen und Ausfälle, sondern auch die Implementierung technischer Verbesserungen und weiterentwickelter Applikationen, die Ausweitung der Netze auf immer mehr Arbeitsplätze und Standorte, die Integration von Geräten und Systemen unterschiedlicher Hersteller sowie der Zugriff von Benutzern auf das Netz, die bislang keine Erfahrungen mit vernetzten Computern haben. Diese Umstände, in Verbindung mit einem stetigen Wachstum der Netze, brachten immer größere Herausforderungen für die Support-Mitarbeiter, angefangen vom Help-Desk-Operator bis zum Netzwerkingenieur. Ausfallzeiten und eine schlechte Performance im Netz sind für den Betreiber kostspielig. Eine der Möglichkeiten, die Probleme in den Griff zu bekommen, ist die Implementierung einer Netzwerkwartungsstrategie. Ähnlich wie die Feuerwehr, die 95 Prozent ihrer Zeit dafür aufwendet, durch Inspektionen potentiell gefährlicher Bereiche, Erstellung von Plänen, Prüfung der Ausrüstung et cetera, Feuerkatastrophen vorzubeugen, und nur fünf Prozent ihrer Zeit tatsächlich dem Feuerlöschen widmet, sollten auch Netzwerkmanager den Hauptteil ihrer Zeit und Aufwendungen für Vorsorgemaßnahmen einsetzen.

Die Netzwerk-Wartungsstrategie

Auf Basis dieser Studien und Untersuchungen lassen sich sieben "goldene Regeln" aufstellen, mit denen Netzwerke ab 100 Knoten aufwärts in einer Weise gewartet werden können, die zu einer höheren Betriebszeit und geringeren Support-Kosten führt. Zu den sieben Regeln gehören:

Die Einbeziehung des Managements in die Netzwerk-Entscheidungen, Vorbereitung und Planung, Problemprävention, frühe Problemerkennung, Problemeingrenzung und -lösung, Investitionen in Werkzeuge und Schulung statt in zusätzliche Mitarbeiter, um das Wachstum zu bewältigen sowie ein Qualitätsverbesserungskonzept für Netzwerkmanagement und -wartung. Unternehmen, in denen diese Regeln angewendet werden, können folgende Vorteile daraus ziehen: Eine im Verhältnis 35:1 geringere Gesamt-Ausfallzeit im Vergleich zu Gruppen, die diese Regeln nicht anwenden, durchschnittlich zehn Prozent weniger Mitarbeiteraufwand pro Knoten, erhebliche Einsparungen pro Jahr bei den Support-Kosten und eine geringere Fluktuation bei den Support-Mitarbeitern.

Das vielleicht überraschendste Ergebnis bestand darin, daß jene Manager am meisten mit dem Betrieb ihres Netzes zufrieden waren, die tatsächlich weniger Wartungsmitarbeiter zur Verfügung hatten als diejenigen, die mit ihrem Netzwerkbetrieb unzufrieden waren (Bild 2).

Einbeziehung des Managements

Das obere Management sollte durch Schaffung der Rahmenbedingungen, die eine Problemprävention und -lösung erlauben, zeigen, daß ihm etwas an der Leistungsfähigkeit des Netzes liegt. Es muß darüber hinaus in den regulären Prüfablauf einbezogen sein, um sicherzustellen, daß das Netz seine Aufgaben gegenüber der Organisation erfüllt.

Darüber hinaus muß das Management mit den technischen Mitarbeitern zusammenarbeiten, um sicherzustellen, daß die Ziele in bezug auf das Netz mit den allgemeinen Geschäftszielen in Übereinstimmung sind. Zusammen sollten beide Gruppen Richtlinien darüber aufstellen, welche Teile des Netzes höchste Priorität beim Betrieb haben.

Von grundlegender Bedeutung ist ein Plan, in dem dokumentiert ist, wer die Verantwortung für welchen Bereich des Netzwerkes trägt, welches die Kriterien für die präventive Wartung sind, welche Arten von Leistungsparametern überwacht werden, wie die Probleme delegiert und welche Werkzeuge zur Fehlersuche/-behebung zum Einsatz kommen.

Die Endbenutzer darin zu unterweisen, was sie tun und lassen sollen, ist ein wichtiges Element der Problemprävention. Dazu gehört beispielsweise, den Benutzern klar zu machen, daß sie den "Help Desk" kontaktieren, wenn sie ihren Computer woanders anschließen oder auch, daß es gefährlich ist, mit Ausrüstungsgegenständen oder Möbeln über Kabel zu rollen oder zu fahren. In diesem Sinne sollten Geräte wie Router, Hubs und Switches für Endbenutzer unzugänglich sein.

Ein weiterer Aspekt der Problemprävention ist das Testen und Zertifizieren der Verkabelung während der Installation und nach Standortwechseln oder Erweiterungen. Zu guter Letzt sollte das Netz immer aktuell dokumentiert und regelmäßig auf seine Leistung hin überwacht werden. 60 Prozent der Netzwerkbetreiber, die mit geringen Ausfallzeiten arbeiten, führen regelmäßig Leistungsanalysen und Tuning-Maßnahmen durch, im Gegensatz zu 38 Prozent derjenigen Netzwerkbetreiber, die es mit hohen Ausfallzeiten zu tun haben (Bild 3).

Frühe Problemerkennung

Um die Auswirkungen von Problemen zu vermindern, sollte das Netz überwacht werden, so daß Leistungsabweichungen sofort zutage treten. Das bedeutet den Einsatz von Managementsystemen, wie beispielsweise "OpenView" von Hewlett-Packard, "SunNet Manager" von Sun oder "Spectrum" von Cabletron, zur Leistungsüberwachung von Routern und Switches sowie RMON-Tastköpfe zur Überwachung der Leistung abgesetzter Segmente. 80 Prozent der Netzwerkbetreiber, die nur geringe Ausfallzeiten zu beklagen haben, arbeiten mit Managementplattformen, wohingegen dies nur 38 Prozent der entsprechenden Gruppe tun, die mit hohen Ausfallzeiten kämpfen (Bild 4).

Help Desks nutzen Trouble-Ticketing-Applikationen, um Netzwerkprobleme aufzuzeichnen und zu verfolgen. 40 Prozent der Netzwerkbetreiber mit geringen Ausfallzeiten setzen eine Trouble-Ticketing-Applikation ein, während es in der Netzbetreibergruppe mit hohen Ausfallzeiten nur 25 Prozent sind.

Schnelle Problemeingrenzung und -lösung

Die zentrale Benutzerhilfe (Help Desk) sollte das jeweilige Problem mit dem betroffenen Benutzer erörtern. Falls notwendig, sollte ein Techniker vor Ort die Probleme schnell diagnostizieren und beheben. Für eine schnelle Eingrenzung und Lösung des Problems ist es wichtig, daß die Support-Mitarbeiter mit den geeigneten Werkzeugen ausgestattet sind. Dazu kommen auf jeweils unterschiedlichen Ebenen Protokoll-Analyzer, portable Netzwerktester sowie Kabeltester zum Einsatz. 73 Prozent der Netzwerkbetreiber mit geringen Ausfallzeiten verwenden diese Werkzeuge, während in der Gruppe mit hohen Ausfallzeiten nur 58 Prozent damit arbeiten (Bild 5).

70 Prozent der Netzwerkbetreiber mit geringen Ausfallzeiten des Netzes schaffen arbeitssparende Werkzeuge an, statt die Zahl der Mitarbeiter aufzustocken. In der untersuchten Probandengruppe mit hohen Ausfallzeiten folgen dagegen nur 54 Prozent dieser Strategie. Als Resümee läßt sich daraus ableiten, daß bei den gut laufenden Netzen bessere Ergebnisse mit weniger Mitarbeitern pro Knoten erreicht werden.

Das richtige Werkzeug

Die Anschaffung entsprechender Werkzeuge ist nicht nur kostengünstiger als zusätzliche Mitarbeiter, sondern verleiht auch den vorhandenen Mitarbeitern höhere Effizienz. Durch Einsatz solcher Werkzeuge sind die Mitarbeiter in der Lage, mehr Zeit auf proaktive Maßnahmen zu verwenden, die gemäß den Regeln der Vorbereitung und Planung, Problemprävention und der Qualitätsverbesserung dienen. (mi)

Neal Allen

arbeitet als Produktmanager bei der Fluke Corporation in Everett/Washington. Allen ist Mitglied des Interop-NOC-(Network Operations Centre)Teams für die Ausstellungen in Las Vegas und Atlanta und war auch an der Netzwerkwartung bei den Olympischen Spielen 1996 in Atlanta beteiligt.

Henriecus Koeman

ist Principal Engineer bei der Fluke Corporation in Everett/Washington. Er hat einen MSEE-Abschluß der Technical University of Delft und promovierte an der Universität von Nijmegen. Bei der Telecommunications Industry Association (TIA) war er an der Entwicklung des TIA-TSB-67-Standards beteiligt.

Paul Stone

ist Communications Director der Fluke Networks Division und begann als freier Journalist. Er gründete ein Beratungsunternehmen mit Schwerpunkt im Bereich Technik.

Literatur

[1] Allen, Neal; Koeman, Henriecus; Stone, Paul: Vorbeugen ist besser; Gateway 10/97, S. 126 ff.; Verlag Heinz Heise; Hannover 1997

[2] Allen, Neal; Koeman, Henriecus; Stone, Paul: Diagnose statt Ratespiel; Gateway 11/97, S. 130 ff.; Verlag Heinz Heise; Hannover 1997

[3] Allen, Neal: Network Maintenance and Troubleshooting Guide; ISBN 0-9638650-1-3; Fluke Corporation 1997

[4] Schuiki, Karl; Miserre, Rainer: Im Reich der Analyse; Gateway 4/97, Seite 102 ff.; Verlag Heinz Heise; Hannover 1997