Mit Monitoring ist es nicht getan

23.05.2003
Nach der Fusion von Südwestfunk und Süddeutschem Rundfunk hatte die IT-Abteilung des neu geschaffenen Südwestrundfunks alle Hände voll zu tun. Für die Überwachung des Netzes blieb zu wenig Zeit. Der Sender entschloss sich deshalb, diese Aufgabe an einen Dienstleister zu übergeben - und stellte schnell fest, dass Monitoring allein noch nicht für gute Verbindungen sorgt.

Von: Dr. Thomas Hafen

Als 1998 der Südwestfunk (SWF) mit dem Süddeutschen Rundfunk (SDR) fusionierte, trafen nicht nur unterschiedliche Programmstrukturen und Mentalitäten aufeinander. Auch in der IT des neuen Südwestrundfunks (SWR) gab es Koordinationsbedarf, die Netze verlangten nach einem Redesign. Die Unternehmensteile verwendeten nicht nur unterschiedliches Equipment, sondern mit "HP-Openview" und "Netview" auch verschiedene Programme zur Netzüberwachung.

Das Problem beim Netzwerk-management war jedoch weniger, dass es zwei Systeme gab. Schwerwiegender war die Tatsache, dass beide kaum genutzt wurden. Die IT-Abteilung war mit der Reorganisation bereits ausgelastet. "Die Systeme sind im Betrieb verhungert", erinnert sich Bernd Hänsch, Fachbereichsleiter Netze beim SWR. "Keiner hat sie betreut, keiner saß vor den Konsolen."

Keine Qualität ohne Netzwerküberwachung

Dies musste anders werden. Ohne Monitoring der IT-Infrastruktur waren die Qualitätsanforderungen der internen Kunden nicht zu erfüllen. Schnell war klar, dass diese Aufgabe mit dem vorhandenen Personal nicht zu stemmen war - ein Dienstleister sollte die Aufgabe übernehmen. Ende 2000 holten Hänsch und seine Kollegen verschiedene Offerten ein. In die engere Wahl kamen schließlich vier Anbieter. Neben dem Outsourcer IBM Global Services waren dies die Telekom-Tochter Deteline, der Dienstleister Dimension Data sowie der Energieversorger Neckarwerke, der bereits in einem ähnlichen Projekt Erfahrungen gesammelt hatte.

Die Wahl fiel schließlich auf Dimension Data. Vier Gründe sprachen für das Unternehmen, so Hänsch. Zunächst einmal kam das flexible Konzept des "Outtasking" den Wünschen des SWR entgegen. Im Unterschied zum klassischen Outsourcing, bei dem ganze Abteilungen an den Dienstleister übergehen, übernimmt dieser beim Outtasking nur definierte Aufgaben. "Wir wollten den SWR nicht zwingen, uns alle Prozesse zu übergeben", sagt Michael Kemper, Leiter des Operations Center (OPC) von Dimension Data. "Der Kunde konnte die Aufgaben behalten, die er behalten wollte." Für den Dienstleister sprach auch, dass er Systemmeldungen nicht einfach ungefiltert an den Kunden weiterleitete, sondern diese durch einen OPC-Mitarbeiter auswerten und interpretieren ließ. "Jede Störung wird von Anfang bis Ende von einem Verantwortlichen in unserem Rechenzentrum begleitet", erklärt Klaus Eitelbuss, Manager Solution Development, das Prinzip. So lassen sich irrelevante Fehlermeldungen herausfiltern - ein wichtiges Kriterium für Hänsch: "Aus Erfahrung wussten wir: zwei, drei Mal blinder Alarm und die IT-Abteilung reagiert nicht mehr." Schließlich gefiel dem SWR, wie der Anbieter Systeminformationen auf dem Webportal verband und darstellte. Andere boten zwar auch Remote-Zugang, so Hänsch, bildeten aber einfach die Konsolen der verschiedenen Überwachungsprogramme ab, ohne diese zu integrieren.

Monitoring erfüllt Erwartungen nicht

Anfang 2001 wurde man sich einig. In einer einjährigen Pilotphase nutzte der SWR zunächst nur den Monitoring-Service "Insite". "Wir gingen davon aus, dass sich rund 75 Prozent aller Störungen ohnehin remote beheben lassen", erklärt Hänsch. Deshalb habe man sich auf die Störungserkennung konzentriert.

Über eine 128-kBit/s-Standleitung überwachte Dimension Data zunächst das Netz in Baden-Baden, später auch die Standorte Stuttgart und Mainz. "Da wir eine Polling Engine nutzen, reicht diese Bandbreite aus", erklärt Eitelbuss. Ein ISDN-Backup hält beim Ausfall der Standleitung die Verbindung aufrecht. In Service Level Agreements (SLA) vereinbarten die Partner unter anderem Meldezeiten für Störungen. Auf ein Bonus-/Malus-System wurde verzichtet. "Wir betrachten SLAs als gegenseitiges Versprechen, Strafsysteme haben in einem partnerschaftlichen Vertrag nichts verloren", sagt Hänsch. Eitelbuss sieht das etwas pragmatischer: "Ein solches System hätte auf beiden Seiten den Verwaltungsaufwand erhöht."

Obwohl der Service vertragsgemäß lief, machte sich beim SWR Ernüchterung breit. "Das reine Monitoring brachte wenig", erinnert sich Hänsch, "es führte nicht zu einer Lösung - schon gar nicht zu der gewünschten Remote-Lösung." Die Ursache lag in der fehlenden Schnittstelle sowie nicht ausreichenden Support-Verträgen. Der Übergang vom Erkennen zum Beheben von Störungen klappte nicht. "Unsere Wartungssituation war alles andere als optimal", gibt Hänsch zu.

Erkennen und Beheben gehören zusammen

Der SWR entschied sich schließlich, zusätzlich zum Monitoring den Support-Dienst "Uptime" zu nutzen, obwohl Hänsch prinzipielle Bedenken hegte: "Wenn etwas kaputt geht, ist doch immer genau das defekte Teil nicht Gegenstand des Wartungsvertrages." Beide Partner schlossen einen Dreijahreskontrakt über die Services Insite und Uptime. Abgerechnet wird nach Ports. Je nach Objekt und Service kostet dies 20 bis 60 Euro im Monat. Der gesamte Vertrag hat ein Volumen von zirka 1,3 Millionen Euro - nicht viel gegen die Megadeals der Konkurrenz, wie Eitelbuss zugibt. "Entscheidend ist nicht die Größe eines Projekts, sondern welche Vorteile beide Seiten aus dem Geschäft ziehen", gibt er zu bedenken.

Entgegen seinen schlechten Erfahrungen mit Support-Verträgen, war Hänsch vom Service bei Data Dimension angenehm überrascht: "Mich erstaunt, wie nachhaltig unser Dienstleister vorgeht." So würden bereits behobenen Störungen nicht einfach abgehakt. Stattdessen analysiere ein Mitarbeiter des Systemintegrators den Fehler und mache Vorschläge, wie man ähnliche Probleme in Zukunft vermeiden könnte. Für Hänsch ist der bestehende Vertrag durchaus ausbaufähig: "Wir decken zurzeit zirka 80 Prozent unseres Equipments ab, das wollen wir erweitern. Außerdem interessieren uns Dienstleistungen wie Managed Firewalls oder Server-Services."