Novell OES: Cluster überwachen

01.01.2007 von Martin Kuppinger
Gerade bei Clustern ist eine kontinuierliche Überwachung von hoher Bedeutung. Mit den Zustandsinformationen des iManagers sowie mit wichtigen Konsolen-Befehlen im Zusammenhang mit der Überwachung und Fehlerbeseitigung befasst sich dieser Artikel.

Grundsätzlich gilt, dass viele der Schnittstellen, die auch sonst für die Überwachung des OES genutzt werden, auch für die Analyse von Clustern verwendet werden können. Dazu zählen beispielsweise die verschiedenen Funktionen für das Health Monitoring.

Zusätzlich gibt es aber auch spezielle Schnittstellen und Funktionen für die Überwachung von Clustern sowie Möglichkeiten, um clusterspezifische Aktivitäten wie die Migration von Ressourcen durchzuführen. Das Clusterereignisprotokoll wird Thema eines gesonderten Artikels in einen der nächsten Beiträge von Experts Inside Novell sein.

Der Cluster-Zustandsbericht

Im Bereich Cluster/Cluster-Manager des Novell iManager wird der Clusterzustandsbericht angezeigt (Bild 1). Es besteht aus einer Liste aller Ressourcen mit ihrem aktuellen Status. Im oberen Bereich finden sich auch die Knoten im Cluster mit ihrem aktuellen Zustand. Es gibt mehrere Zustandsinformationen, die über Farben und Symbole dargestellt werden.

Bild 1: Übersicht über den Zustand von Knoten in einem Cluster und die darauf konfigurierten Ressourcen.

Bei den Knoten selbst sind vor allem diejenigen zu beachten, die entweder explizit als fehlerhaft gekennzeichnet sind oder bei denen es kein Zustandssymbol gibt. Falls kein Symbol angezeigt wird, wie in Bild 1 bei der Ressource cluster3, so ist der Zustand des Knotens unbekannt. Das bedeutet, dass in jedem Fall der Administrator eingreifen muss, weil sonst der Cluster keine Kommunikation mit diesem Knoten durchführen kann. Das kann daran liegen, dass das System nicht arbeitet oder dass es ein grundlegendes Problem mit der Clustersoftware auf diesem Knoten gibt.

Zustände von Ressourcen

Bei den einzelnen Ressourcen wird zwischen verschiedenen möglichen Zuständen unterschieden. Der Idealzustand ist Läuft. Sehr klar ist auch offline als Zustand einer nicht aktiven Ressource. Die anderen Zustände sind aber wesentlich interessanter, auch wenn sei nicht allzu häufig auftreten. Hier gibt es folgende Situationen:

Interessant im Zusammenhang mit den Zuständen von Clustern und ihren Ressourcen ist auch die Information darüber, wie oft sich der Zustand geändert. Diese Information findet sich bei jeder Ressource. Neben Failover- und Failback- Systemen wird der Wert auch durch den Start und das Herunterfahren von Clustern und manuelle Änderungen des Zustands wie das Offline- und Online-Nehmen von Ressourcen beeinflusst.

Cluster-Ressourcen migrieren

Zu den Aktivitäten, die für Ressourcen in einem Cluster durchgeführt werden können, zählt die Migration. Damit kann eine Ressource manuell auf einen anderen Knoten verschoben werden. Das ist sinnvoll, wenn man beispielsweise einen Knoten im Cluster für Wartungsarbeiten offline nehmen möchte.

Für die Migration muss die Ressource ausgewählt und anschließend Migrieren angeklickt werden. Im angezeigten Dialogfeld (Bild 2) kann der Knoten im Cluster ausgewählt werden, auf den die Migration erfolgen soll. Nach dessen Auswahl wird der Migrationsprozess vom Cluster Service gestartet und abgewickelt. Es empfiehlt sich, dabei die Stati der Ressource auf beiden Knoten zu überwachen, um bei etwaigen Problemen, beispielsweise weil ein Dienst nicht korrekt gestartet wird, eingreifen zu können.

Bild 2: Die Auswahl des Migrationsziels für eine Ressource.

Die Migration kann übrigens auch über den Novell Remote Manager (NRM) erfolgen. Dort finden sich ebenfalls Funktionen für das Cluster Management.

Konsolen-Anweisungen im Cluster

Für die Überwachung von Clustern sind auch einige der Befehle, die es an der Konsole gibt, von Bedeutung. Zu nennen sind hier insbesondere folgende Anweisungen:

Mithilfe der verschiedenen Befehle kann man sich relativ einfach einen Überblick über den Status eines Clusters verschaffen. Allerdings wird man sich auch überlegen müssen, ob das ausreicht. Denn gerade bei Clustern ist eine permanente Überwachung erforderlich, um auf Fehler schnell reagieren zu können. Hier sind Werkzeuge wie Novell Audit mit einer entsprechenden Konfiguration für automatische Warnungen und Maßnahmen ein Ansatz.

Eine weitere Möglichkeit sind Benachrichtigungen in einem Cluster. Auf sie wird in einem nachfolgenden Artikel noch näher eingegangen.