Unternehmen brauchen eine verlässliche und leistungsstarke Infrastruktur für ihre Informations- und Kommunikationstechnologie. Insbesondere bedarf das Management einer physikalischen Netzwerkinfrastruktur inklusive Server, Router, Stromversorgungs-, Kühl- und Rackkomponenten einer effektiven Verwaltungslösung für die Überwachung und Steuerung der unterschiedlichsten Geräte und Dienste.
Um die gewünschte Verfügbarkeit zu garantieren, können sich IT-Manager nicht mehr auf so genannte „Closed Shop“ Lösungen verlassen. Diese allein stehenden Lösungen sind nicht mehr zeitgemäß und in Hinsicht auf Gesamtkosten einer IT Infrastruktur nicht mehr wirtschaftlich. Neue Konzepte basieren auf offenen IT-Management-Standards. Sie sind einfach in bestehende Systeme zu integrieren und ermöglichen skalierbare und effiziente Systemlösungen.
Eine vorbildliche IT-Infrastruktur bettet sich mit aufeinander abgestimmten Bausteinen: Rack, Energieversorgung, Kühlung, Sicherheit und Fernüberwachung vollständig in ein ITIL konformes Gesamtkonzept ein. So kann vor allem das Remote Management mit Überwachungs-, Mess- und Steuerungsmodulen als wichtiger und unverzichtbarer Bestanteil einer gelungen Umsetzung des ITIL-Konzeptes gelten. Mit Blick auf dieses Ziel werden in diesem Artikel die Anforderungen zur Verwaltung der physikalischen Infrastruktur hochverfügbarer Netze - insbesondere das Remote Management und Monitoring - aus der Sicht des ITIL-Rahmenwerks beschrieben.
Das sichere Rechenzentrum der Zukunft
Ob kleines, mittleres oder großes Unternehmen – die Anforderungen an die IT-Performance steigen permanent. Hochkomplexe Anwendungen, schnellere Prozessoren, Informationen und Kommunikation rund um die Uhr verlangen mehr als eine intakte physikalische Infrastruktur.
Zu beachten ist, dass ein entsprechendes hochmodernes Rechenzentrum eine integrierte Gesamtlösung mit umfassendem Service und fünf perfekt aufeinander abgestimmten IT-Bausteinen: Rack, Power, Cooling, Security sowie Monitoring/Remote-Management enthält. Damit erhalten Unternehmen eine Komplettlösung für eine sichere, verfügbare und kostensparende IT-Infrastruktur.
IT Infrastructure Library
Der am weitesten verbreitete Ansatz zur Umsetzung des IT-Service-Managements ist die IT Infrastructure Library, kurz ITIL. Dies entspricht auch dem Ergebnis einer Umfrage der FH Aalen, nach der die meisten Unternehmen ihre Prozesse nach Vorgaben der ITIL organisieren.
Das ITIL-Rahmenwerk wurde von der Central Computing und Telecommunications Agency (CCTA) in Großbritannien Ende der 80er Jahre entwickelt und ist in einer Reihe von Publikationen definiert. Ziel war es, ein Rahmenwerk zu schaffen, welches den effizienten und kostengünstigen Einsatz von Informationstechnologie beschreibt. Dabei basiert es auf Erfahrungswerten aus der Praxis und wird daher gerne als „best practice framework“ bezeichnet.
ITIL ist ein Leidfaden zur Unterteilung der Funktionen und Organisation der Prozesse, die im Rahmen des serviceorientierten Betriebs einer IT-Infrastruktur entstehen. Es besteht aus sieben Schwerpunktpublikationen, die eng miteinander verzahnt sind.
Prozessgruppen des ITIL-Service-Mangements
Neben fünf Prozessfeldern für das Management des IT-Betriebs (Service Support), der IT-Services (Service Delivery), der Anwendungen (Applications Management) und der IT-Infrastruktur (ICT Infrastructure Management) widmet sich jeweils ein weiterer Band dem Sicherheitsmanagement (Security Management) und der Einführung von ITService- Management (Planning to implement Service-Management).
Das Remote-Management und Monitoring ist dem IT-Service Management nach ITIL zuzuordnen. Das IT-Service Management besteht aus zwei Prozessgruppen:
-
Service Support umfasst die Prozesse zur direkten Unterstützung der Nutzer im täglichen Betrieb (operationelle Ebene).
-
Service Delivery befasst sich mit der mittel- bis langfristigen Planung und Verbesserung der ITServices (taktische Ebene).
In der aktuellen Version werden 10 Service Management Prozesse zuzüglich der Funktion „Service Desk“ beschrieben. Sämtliche Prozesse sind durch Prozessabläufe miteinander verbunden und beziehen sich aufeinander. Es müssen aber nicht alle Prozesse und Abläufe analysiert werden. Es reicht aus, diejenigen zu identifizieren, die wichtig und relevant für das Remote-Management und Monitoring sind.
ITIL-Schlüsselprozesse für das Remote-Management
Die für das Remote-Management wichtigsten Prozesse werden in der nachfolgenden Abbildung gezeigt und dienen als Grundlage für die Beschreibung der Herausforderungen an ein modernes Remote Management.
Ausgehende von diesem vereinfachten ITIL Prozessmodell werden die Herausforderungen und zugrunde liegenden Probleme auf der jeweiligen Prozessebene aufgezeigt.
Störungsmanagement
Das Störungsmanagement (Incident Management) dient der schnellstmöglichen Wiederherstellung des normalen Service-Betriebs. Die schnelle Behebung von Störungen übt einen wesentlichen Einfluss auf die Zufriedenheit der Anwender aus. Die Priorität bei der Behebung einer Störung ergibt sich aus der Dringlichkeit, mit der eine Störung behoben werden muss und den Auswirkungen, die eine Störung für den Geschäftsablauf hat. Der Prozess umfasst unter anderem die:
-
Störungsannahme und Erfassung
-
Klassifikation, Priorisierung nach Dringlichkeit und Auswirkungen
-
Analyse und Diagnose
-
Behebung und Service-Wiederherstellung
-
Abschluss des Störungsvorganges
Mit der durchgängigen Dokumentation der Störung stehen anderen Servicemanagement-Prozessen zudem wichtige Informationen für die Steuerung der Servicequalität zur Verfügung.
Problemmanagement
ITIL unterscheidet das Management von Störungen und Problemen (Problem Management). Bei Störungen soll der Service möglichst schnell wiederhergestellt werden – egal wie. Nicht für jede Störung ist die Ursache offensichtlich und kann mitunter über Umwege beseitigt werden. Dies behebt natürlich nicht das eigentliche Problem und es kann zu weiteren Störungen kommen. Dies zu verhindern ist Aufgabe des Problemmanagements. Berücksichtigt man, dass ein Großteil des Tagesgeschäfts im IT-Betrieb und Support mit der Behebung von Störungen verbunden ist, dann wird deutlich, welchen Beitrag das Problemmanagement für die Zuverlässigkeit und die Wirtschaftlichkeit hat.
ITIL empfiehlt einen zweistufigen Prozess:
-
Problembehandlung (Problem Control): Im ersten Schritt wird zunächst die Ursache aufgedeckt - also dem Problem ein bekannter Fehler zugeordnet oder dieser ermittelt.
-
Fehlerbehandlung (Error Control): Im zweiten Schritt wird eine sinnvolle Lösung für den Fehler gesucht, deren Umsetzung überwacht und die Wirksamkeit der Lösung geprüft.
Je aussagekräftiger die Störungs- und Monitoring-Daten sind, umso besser und leistungsfähiger kann ein proaktives Problemmanagement sein.
Änderungsmanagement
Das Änderungsmanagement (Change Management) plant und koordiniert die Durchführung von Änderungen an den IT-Systemen. Dazu werden geplante Änderungen bewertet, priorisiert und auf ihre Abhängigkeiten hin untersucht. ITIL empfiehlt Änderungen im Zusammenhang mit den geänderten Konfigurationskomponenten zu dokumentieren. Somit können Störungen infolge von Änderungen schnell aufgeklärt und behoben werden. Gleichzeitig nutzt das Problemmanagement diese Informationen in der Diagnose.
Das Änderungsmanagement gliedert sich grundsätzlich in folgende Stufen:
-
Annahme: Erfassung von Änderungsanträgen, Akzeptieren und Filtern anstehender Änderungen.
-
Planung: Klassifikation und Bewertung nach Dringlichkeit und Auswirkungen, Planung von Durchführungen, etc.
-
Steuerung: Entwickeln, Testen und Umsetzen der Änderungen. Gegebenenfalls Rückführung auf den letzten funktionierenden Stand bei Scheitern der Änderung.
Verfügbarkeitsmanagement
Im Verfügbarkeitsmanagement (Availability Management) werden Verfügbarkeitsanforderungen an die Services definiert und eine möglichst kostengünstige Abdeckung der Anforderungen sichergestellt. Dazu sind Kriterien für die Messung der Verfügbarkeit zu definieren. Daneben definiert es auch die Anforderungen an die Wartung von Hardware- und Softwarekomponenten. Im Fokus des Verfügbarkeitsmanagements stehen die Zuverlässigkeit und Verfügbarkeit der eigenen als auch der Servicefähigkeit externer Lieferanten.
Der Managementprozess kann in drei wesentliche Stufen gegliedert werden:
-
Verfügbarkeitsplanung durch Analyse der Geschäftsanforderungen an die Service-Verfügbarkeit, Analyse der Umsetzbarkeit über entsprechende Bewertungsmodell und Definition möglicher Verfügbarkeitsstufen für die Gestaltung der Service Levels.
-
Verfügbarkeitsumsetzung durch Definition von Anforderungen an die Systemverfügbarkeit und gegebenenfalls Definition von SLM-Verträgen.
-
Verfügbarkeitskontrolle durch die Überwachung und Analyse der erzielten Serviceverfügbarkeit und Ableitung von Verbesserungsmaßnahmen.
Kapazitätsmanagement
Während das Verfügbarkeitsmanagement die Verfügbarkeit von Diensten sicherstellt, kümmert sich das Kapazitätsmanagement (Capacity Management) um den wirtschaftlichen Umgang mit den entsprechenden Ressourcen. Das Kapazitätsmanagement stellt sicher, dass die vorgehaltenen Kapazitäten den Anforderungen gerecht werden. Dazu müssen permanent die Anforderungen aus den Service Level Agreements und deren Veränderungen überwacht werden, um rechtzeitig auf Änderungen des Bedarfs reagieren zu können.
Das Kapazitätsmanagement wird generell in zwei Kategorien unterteilt:
-
Kapazitätsmanagement auf Geschäftsebene stellt Prognosen zum IT-Bedarf, entwickelt Modell und bestimmt die erforderlichen Kapazitäten für die Unterstützung der Anwendungen.
-
Kapazitätsmanagement auf Service & Ressourcenebene stimmt Ressourcen auf die Anforderungen ab und implementiert diese, misst, überwacht und analysiert die Performance und leitet Optimierungsmaßnahmen ein. Als Grundlage dienen hier oft entsprechende Service Level Agreements (SLAs) und die darin definierten Schwellwerte.
Mit dem Kapazitätsmanagement steht also ein wichtiges Instrument zur Reduzierung und Flexibilisierung der Servicekosten zur Verfügung.
Remote-Management und Monitoring in der Praxis
Die Implementierung von Remote-Management und Monitoring-Systemen als Basis eines ITIL-Framework-Konzeptes muss die Folgende Kriterien erfüllen:
-
Die Vernetzung unterschiedlichster Systeme ist heute einfach auf Basis einer de facto bereits als „allgegenwärtig“ zu bezeichnenden Kommunikationsinfrastruktur jeder Zeit möglich.
-
Schnell wachsende IT-Infrastrukturen mit immer komplexeren Funktionen erfordert wirtschaftliche Methoden zur Administration.
-
Die Vernetzung eröffnet neue Möglichkeiten der Fernadministration, -wartung und -überwachung bei gleichzeitiger Kostenreduktion für den Service.
-
Das offene Framework erleichtert eine Integration unterschiedlichster Geschäftsprozesse und die Integration in ein bestehendes Netzwerkmanagementsystem.
Als potentielle Aufgaben für ein Remote Management und Monitoring System lassen sich folgende Bereiche identifizieren:
-
Administration, Konfiguration und Überwachung des Systems.
-
Nach Austausch von Soft- und Hardwarekomponenten eine automatische Aktualisierung der Infrastrukturinformationen der Software.
-
Modifikation von Systemparametern.
-
Überwachung von Betriebsdaten des Systems bzw. seiner Komponenten (Aktoren, Sensoren)
Aufgaben im Rahmen des ITIL-Konzeptes im Überblick I
Legt man die auf den letzten Seiten beschriebenen Prozesse zu Grunde, so ergeben sich nachfolgende Anforderungen für ein modernes Remote-Management.
Anforderung/Problem: |
Lösung: |
Ermittlung der Ursache eines Problems und dessen Auswirkungen. |
Ein IT Infrastruktur besteht aus unterschiedlichsten miteinander verbundenen Komponenten. Eine Anzeige auf Systemebene, aus der die Beziehungen zwischen den einzelnen Komponenten und die Auswirkung der einzelnen Komponentenprobleme ersichtlich werden. |
Ermittlung der Verantwortlichkeiten für ein Problem bzw. der Problembehebung. |
Ein System, in dem Benachrichtigungen und Zuständigkeiten in Abhängigkeiten des Problems definiert werden können. Ergänzend sollte eine Eskalationsstrategie innerhalb des Systems möglich sein. |
Gleichzeitiges Auftreten mehrerer Fehler und Störungen. |
System mit der Möglichkeit der Prioritätensetzung für die jeweiligen Störungen. |
Umsetzen der richtigen Maßnahmen zur Wiederherstellung des verlangten Services. |
Vorschlag von geeigneten Maßnahmen und Unterstützung des Administrators bei der Wiederherstellung des Normalbetriebs. |
Anforderung/Problem: |
Lösung: |
Unterstützung bei der Erstellung von Verfügbarkeitsberechnungen. |
Durch die Speicherung unterschiedlichster statistischer Informationen zum Beispiel Betriebs- beziehungsweise Ausfallzeiten oder Dauer der Wiederherstellung können Service und Verfügbarkeitsberechnungen angestellt werden. |
Ausgabe ungenauer Warnmeldungen. |
Die gelieferten Informationen müssen leicht verständlich sein, damit auch notfalls von ungeschulten Personen Gegenmaßnahmen eingeleitet werden können. |
Verwaltung und Reduktion der Auswirkungen geplanter Stillstandzeiten. |
System ermöglicht die zeitliche Planung von Wartungsarbeiten. Innerhalb dieser Zeitspanne dürfen keine Warnmeldungen ausgegeben werden. |
Ständige Verbesserung der Verfügbarkeit der IT Infrastruktur. |
System liefert Basisdaten und ermöglicht so eine verbesserte Risikoabschätzung die die Verfügbarkeit erhöht. |
Aufgaben im Rahmen des ITIL-Konzeptes im Überblick II
Legt man die auf den letzten Seiten beschriebenen Prozesse zu Grunde, so ergeben sich nachfolgende Anforderungen für ein modernes Remote-Management.
Anforderung/Problem: |
Lösung: |
Fehlende Überwachung und Protokollierung aller Änderungen innerhalb der Infrastruktur. |
System mit Mess- und Überwachungsfunktionalität, welches Daten permanent protokollieren. |
Bereitstellung von benötigten Kapazitäten zur Unterstützung kritischer Geschäftsprozesse. |
System sollte die Möglichkeit zur Trendanalyse bieten, damit Ressourcen rechtzeitig angeschafft und bereitgestellt werden. |
Ungenügtender Einsatz der vorhandenen physikalischen Infrastruktur. |
System sollte Infrastruktur einfach und sinnvoll überwachen und basierend auf den ermittelten Daten wie Performance, Fehler oder Infrastruktur Möglichkeiten zur Optimierung vorschlagen. |
Anforderung/Problem: |
Lösung: |
Beeinträchtigungen des SLAs beim Wechsel bzw. bei der Erweiterung der Infrastruktur. |
System, welches Maßnahmen zur Planung, Durchführung und Nachverfolgung von Änderungen bietet. |
Firmware und Konfigurationsdateien müssen regelmäßig geändert werden. Der manuelle Prozess ist fehleranfällig und kostenintensiv. |
System zur zentralen Konfiguration und Nachverfolgung von Änderungen. |
Optimierte Organisation bei weniger Kosten
Ein gut organisiertes Remote-Management ermöglicht nicht nur schnelle Behebung von Fehlern in einer verteilten Umgebung, sondern entlastet auch die Administration und hilft dadurch Kosten zu sparen.
Im Rahmen einer ROI-Analyse können folgende Faktoren in die Berechnung mit einfließen:
-
Die Kosten für die Nutzung und Wartung, die Anpassungsfähigkeit an sich ändernde Geschäftsanforderungen, die Funktionalität und die einfache Integration.
-
Verringerung der Belastung durch die Systemverwaltung.
-
Reduktion des Risikos von Ausfallzeiten.
-
Eine rechtzeitige Wahrung verbunden mit einer schnellen Reaktionszeit bei kritischen Ereignissen ermöglicht verbesserte Maßnahmen, bevor Geräte beschädigt werden.
-
Möglichkeit der Leistungsanalyse und der Fehlerfrühwarnung.
-
Steigerung der Produktivität von IT-Fachkräften.
-
Hoch qualifizierte Fachleute können für anspruchsvollere Aufgaben eingesetzt werden.
-
Rechenzentren oder Serverräume können ohne Bedienpersonal und trotzdem unter vollständiger Kontrolle betrieben werden.
-
Alle IT-Infrastruktur- und Netzwerkkomponenten werden mittels einer einheitlichen, zentralisierten und herstellerunabhängigen Plattform zentral koordiniert. Dies ermöglicht eine bessere Korrelation und damit eine schnellere Problemfindung.
-
Teuere Rechenzentrumsfläche kann durch den Verzicht auf Kontrollmonitore und Bedienungsgeräte an jedem Rack besser genutzt werden.
-
Die verbesserte Reaktion auf Problemen innerhalb der IT-Infrastruktur und die durch den besseren Informationsstand schnelle Umsetzung von Lösungen, reduziert die Ausfallzeiten und erhöht den Servicelevel für den Anwender.
-
Die Hersteller- und Betriebssystemunabhängigkeit gepaart mit der dadurch einfachen Installation und einfachen Bedienbarkeit.
-
Durch das zentrale und in die Serviceumgebung integrierte Management erfolgt eine effiziente Verwaltung von Betriebsmitteln.
Fazit
Der hier beschriebene Prozess des Remote-Managements im Rahmen eines IT-Frameworks kann als voll kompatibler und integraler Bestandteil eines ITIL konformem IT-Managements angesehen werden. Als Fundament für die im Rahmen der in ITIL definierten Anwendungen und Prozesse und um die mit den Kunden vereinbarten Serviceanforderungen (SLAs) einzuhalten, spielt das Remote-Management eine wichtige und vor allem entscheidende Rolle.
Bei der Entwicklung, Planung, Installation und beim Betrieb jeder Remote-Management Lösung sollte besonders darauf geachtet werden, eine auf offene Systemstandards basierende und in diese integrierbare Managementlösung zu wählen. Das IT-Management erhält bei sorgfältiger und erfolgreicher Umsetzung der beschriebenen Prozesse die Möglichkeit, die Verfügbarkeit und die Effizienz ihrer bestehenden IT-Infrastruktur zu optimieren, Veränderungen und Anpassungen rasch und unproblematisch durchzuführen und somit die Gesamtbetriebskosten zu reduzieren. (hal)
Dipl.-Ing.Elektrotechnik (FH) Sven M. Laurösch ist Gruppenleiter im Produktmanagement IT der Firma Rittal GmbH & Co. KG. Er betreut den Bereich Sicherheit, Monitoring und Remote Management für das Produkt RimatriX5.