Spezialisten für die Fehlersuche

Kontrolle auf allen Ebenen

Die Root Cause kann verschiedene Ebenen eines Netzes betreffen. Fehler der "Layer 2" liegen an einem defekten Switch oder einem ausgefallenen Port. Probleme der dritten und vierten Netzwerkschicht treten auf, wenn eine TCP/IP-Verbindung nicht zustande kommt oder wenn die Performance einer Übertragung einbricht und einen definierten Grenzwert unterschreitet. Schließlich können auch Server und darauf installierte Programme durch Störungen beeinträchtigt werden. In der Sprache des OSI-Netzmodells (Open System Interconnection) verbirgt sich die Ursache dann auf einer der Anwendungsebenen, die mit 5, 6 und 7 nummeriert sind.

Um die erste Ursache zu finden, muss die Netzmanagementsoft-ware Fehlermeldungen aus verschiedenen Quellen zueinander in Beziehung setzen. Einer der wichtigsten Lieferanten von Informationen sind SNMP-Agenten (Simple Network Management Protocol). Diese schicken im Fehlerfall eine "Trap Message", zu deutsch Ereignismeldung an das Managementprogramm. Einige Hersteller haben ihre eigenen "Agenten" entwickelt, die den Server bei Problemen verständigen, zum Beispiel BMC Software, Computer Associ-ates, Micromuse und Riversoft. Firmen wie Aprisma, Hewlett-Pa-ckard und Smarts haben sich da-rauf spezialisiert, neben den Standardquellen wie SNMP und "Remote Monitoring" möglichst viele Netzproben anderer Anbieter auszuwerten.

Was die Verfahren anbelangt, nach denen die Managementplattformen Ereignisse zueinander in Beziehung setzen, unterscheidet man zwei Ansätze:

- Herkömmliche regelgestützte Methoden kombinieren die Events nach den Vorgaben des Anwenders oder des Herstellers. In vielen Fällen lassen verletzte Service-Level-Bestimmungen und Angaben über die Performance auf ein überlastetes Netz schließen, falls keine Übertragungsfehler auftauchen. Die Regeln enthalten logische Verknüpfungen wie "Und", "Oder" und "Nicht".

- Modellgestützte Techniken funktionieren objektorientiert. Sie beziehen die Ereignisse auf ein internes Modell, das die Topologie oder den Aufbau eines Netzes widerspiegelt. Auch hier gibt es Regeln. Allerdings sind diese vom Aufbau des Netzes unabhängig, weil sie sich auf Klassen von Geräten beziehen. Während das Modell von einem Discovery-Mechanismus selbstständig konstruiert wird, legt die Software für jede Netzkomponente ein Objekt aus einer entsprechenden Klasse an. Das Modell repräsentiert sowohl die geografischen Zusammenhänge eines Netzes in Form von physikalischen Verbindungen zwischen Geräten, als auch logische Beziehungen von virtuellen VLAN-Segmenten oder Anwendungen.

Regelgestützte Verfahren sind mit ihrem einfachen Konzept leicht zu verstehen. Davon abgesehen haben sie aber viele Nachteile. Erstens wächst die Zahl der Regeln mit der Menge der Geräte und Anwendungen im Netz sehr schnell. Die Fülle der Bestimmungen wird unübersichtlich und das Bearbeiten der Rules schluckt Rechenzeit. Zweitens erfordert jede Erweiterung des Inventars das Anpassen und Neuformulieren von Regeln. Drittens hängt die Qualität der Ursachen-analyse von den Vorgaben des Anwenders ab.