Standort, Verfügbarkeit, Redundanz, Brandschutz und Co.

So planen Sie ein betriebssicheres Rechenzentrum

11.04.2014 von Andreas Schaffry
Unternehmen, die ein betriebssicheres und hochverfügbares Rechenzentrum aufbauen wollen, müssen viele Aspekte beachten. Dazu zählen neben der Wahl des richtigen Standortes und der Errichtung einer redundanten IT-Infrastruktur, Verkabelung und WAN-Verbindung auch die unterbrechungsfreie Stromversorgung und ein zuverlässiger Brandschutz.

Samstagnacht um drei Uhr bricht im hauseigenen Rechenzentrum der Firma ABC GmbH, einem Automobilzulieferer, plötzlich Feuer aus. Obwohl der Wachdienst die Feuerwehr sofort verständigt und diese den Brand rasch löscht, ist der Bereich des Rechenzentrums , der die zentrale ERP-Software beherbergt, bereits komplett zerstört.

Wie ein Katastrophenfall die Existenz bedroht

Weil dadurch auch das ERP-System bei der ABC GmbH vollständig lahmgelegt wurde, standen Produktion und Auslieferung auf einen Schlag still. Die Firma war mehrere Tage lang nicht lieferfähig. Kunden warteten vergeblich auf Komponenten, die sonst zuverlässig Just-in-Sequence (JIS) an ihre Montagebänder kommen. Der finanzielle Schaden war hoch, denn das Unternehmen musste saftige Vertragsstrafen zahlen. Und damit noch nicht genug: Der wichtigste Kunde hatte in der Folge alle Lieferverträge gekündigt.

Bei der späteren Untersuchung stellt sich heraus, dass ein Schmorbrand das Rechenzentrum und die dort betriebene ERP-Anwendung zerstört hatte. Der Brand war zu spät entdeckt worden, weil die Rauchmelder in diesem Teil des Rechenzentrums defekt waren. Ein typischer Katastrophenfall (K-Fall) also, gegen den der Zulieferer jedoch nicht abgesichert war, da er auf kein Ausweichsystem zurückgreifen konnte. Das fiktive Beispiel zeigt: Ein K-Fall wie dieser kann verheerende Auswirkungen auf die Geschäftsfähigkeit eines Unternehmens haben und schlimmstenfalls sogar die Existenz bedrohen.

RZ-Betriebssicherheit ist geschäftskritisch

Da heute in Unternehmen immer mehr Prozesse IT-gestützt laufen, sowohl intern als auch mit B2B-Kunden und Geschäftspartnern, ist die durchgängige Verfügbarkeit der im Rechenzentrum betriebenen IT-Anwendungen und IT-Infrastrukturen ein geschäftskritischer und wettbewerbsrelevanter Faktor. Es gibt viele Gründe, die einen Komplettausfall des Rechenzentrums verursachen können: Naturkatastrophen, Sabotageakte von Mitarbeitern, menschliches Versagen oder unzureichende Absicherung gegen Leitungsschäden oder längere Stromausfälle.

Ein betriebssicheres internes Rechenzentrum bildet somit das Herzstück in Unternehmen, Planung und Bau kommt eine hohe Bedeutung zu. Soll ein effizientes und wirtschaftlich tragbares Rechenzentrum entstehen, ist eine individuell abgestimmte Auswahl aller relevanten Parameter entscheidend. Bei der Planung des Rechenzentrums sollte auch ein Wachstumsspielraum von rund 25 Prozent berücksichtigt werden.

Den richtigen Standort wählen

Bevor es an die Planung und Auslegung der technischen Komponenten für die angestrebte Verfügbarkeit geht, muss im ersten Schritt der richtige Standort für das Rechenzentrum gefunden werden. Ein absolutes Muss bei der Standortwahl ist die Risikobewertung. Es ist genau zu analysieren, ob es sogenannte "Arealrisiken" gibt, die die Wahrscheinlichkeit eines potenziellen Ausfalls erhöhen können.

Dazu zählen geografische Aspekte, etwa die Gefährdung durch Luftverkehr oder Hochwasser, und politische Gesichtspunkte wie die Kriegs- oder Terrorgefahr. Auch feuergefährdete Betriebsstätten wie Tankstellen sowie Öl-, Gas- und Chemikalienlager in der Nachbarschaft sind sicherheitsrelevante Faktoren, die in die Standortbetrachtung einfließen müssen.

Mindestanforderungen für Betriebssicherheit definieren

Sobald der geeignete Standort gefunden ist, sind die Mindestanforderungen zu klären, die das künftige Rechenzentrum im Rahmen des IT-Konzepts erfüllen muss, sowie die angestrebte Verfügbarkeit der IT-Systeme. Es muss klar definiert sein, wie hoch die maximal tolerierbaren Ausfallzeiten der Unternehmens-IT sein dürfen, wobei auch künftige Anforderungen zu berücksichtigen sind. Ist zum Beispiel eine internationale Expansion geplant, sollte von Beginn an eine sehr hohe Verfügbarkeit eingeplant werden.

Dieser wie auch weitere Faktoren bestimmen dann die Planung sowie Bauart und -größe, die elektrische Leistung, Wärmeabführung, Verkabelung, Gebäude- sowie Daten- und Ausfallsicherheit wie auch die verwaltungstechnische Organisation. Auch auf Energieeffizienz, Unterbrechungsfreie Stromversorgung (USV) und Redundanz kritischer Komponenten ist zu achten. Eine erste Orientierung zur Gestaltung des Rechenzentrums bieten dabei die vom BSI (Bundesamt für Sicherheit in der Informationstechnik) herausgegebenen IT-Grundschutz- und Maßnahmenkataloge für das Rechenzentrum.

Gewünschte Verfügbarkeit festlegen

Verfügbarkeitsklassen nach BSI 16 zu 9.
Foto: Bitkom

Für den Nutzer ist besonders die Verfügbarkeit und somit die Ausfallsicherheit eines Rechenzentrums wichtig. Laut einer Definition des ITK-Branchenverbandes Bitkom wird "ein System als verfügbar bezeichnet, wenn es in der Lage ist, die Aufgaben zu erfüllen, für die es vorgesehen ist. Die Verfügbarkeit wird als Verhältnis aus fehlerbedingter Stillstandzeit (= Ausfallzeit) und Gesamtzeit eines Systems bemessen." Bei einer Verfügbarkeit von 99,9999 Prozent beträgt die Ausfallzeit umgerechnet 0,5265 Minuten im Jahr. Ist das Rechenzentrum "nur" zu 99,99 Prozent verfügbar, steht es pro Jahr dagegen 52,65 Minuten still.

Verfügbarkeit nach dem Tier-Konzept des Uptime-Instituts.
Foto: Bitcom

Um einstufen zu können, wie hoch die Ausfallsicherheit des eigenen Rechenzentrums sein soll, eignet sich zum Beispiel die sogenannte Tier-Klassifizierung wie sie das US-amerikanische Uptime Institut für die Rechenzentrumsinfrastruktur definiert hat. Dabei werden die Rechenzentren in vier Klassen unterteilt, die jeweils Auskunft über die Verfügbarkeit geben.

Die richtige Tier-Klasse wählen

Tier 1 = 99,67 Prozent Verfügbarkeit:

Die niedrigste Stufe gemäß der Klassifizierung des Uptime Instituts bildet das Tier-1-Rechenzentrum mit einer Verfügbarkeit von 99,67 Prozent, was einer jährlichen Ausfallzeit von 28,8 Stunden entspricht. Es besteht aus einem System und einzelnen, nicht redundant ausgelegten Versorgungspfaden und Komponenten. Es gibt keine räumliche Trennung und nur eine Unterbrechungsfreie Stromversorgung in Form einer USV-Anlage. Ein RZ der Tier-1-Klasse eignet sich eher für kleinere Firmen oder Start-ups, die IT-Prozesse lediglich intern abwickeln, keine elektronisch gestützten Abläufe zu Kunden oder Lieferanten haben und das Internet lediglich passiv nutzen.

Tier 2 = 99,75 Prozent Verfügbarkeit:

Ein Tier-2-Rechenzentrum hat eine Verfügbarkeit von 99,75 Prozent, das sind 22 Stunden Ausfallzeit pro Jahr, und verwendet bereits redundante Komponenten. Dazu zählen etwa ein zweiter Telekommunikationseingang, USV und Reservestromversorgung mittels Dieselgenerator und eine zweite Klimaanlage. Auch die Traglast des Bodens ist höher als bei Tier 1. Die Tier-2-Klasse eignet sich für Unternehmen, die mit Geschäftspartnern einfache Prozesse IT-gestützt während der üblichen Büro- und Geschäftszeiten abwickeln und deren Ausfall nicht geschäftskritisch ist.

Tier 3 = 99,98 Prozent Verfügbarkeit:

Ein Rechenzentrum mit einer Tier-3-Ausstattung hat eine Verfügbarkeit von 99,98 Prozent, was einer jährlichen Ausfallzeit von 1,6 Stunden entspricht. Es kann - im Unterschied zu Tier-1- und Tier-2-Rechenzentren - auch während des laufenden Betriebs gewartet werden und bietet eine hohe Ausfallsicherheit für geschäftskritische Anwendungen, Backup-Lösungen oder Entwicklungsumgebungen. Es gibt redundante Hardwarekomponenten, aktive und passive redundante Pfade für die Telekommunikation, elektronische Geräte und Klimaanlagen sowie mehrere Brandabschnitte.

Das Gebäude wird per Video überwacht und ist mit Vereinzelungsschleusen ausgestattet. Die Wände sind elektromagnetisch abgeschirmt, und das Personal ist rund um die Uhr verfügbar. Ein Tier-3-Rechenzentrum eignet sich für Firmen, die E-Commerce-Prozesse durchführen, international und in mehreren Zeitzonen tätig sind und deren Mitarbeiter jederzeit, also auch von unterwegs per Mobilgerät, auf Informationen zugreifen müssen.

Tier 4 = 99,99 Prozent Verfügbarkeit:

Noch einen Schritt weiter geht ein Tier-4-Rechenzentrum, das sich durch eine hohe Fehlertoleranz auszeichnet, und bei nur 0,8 Stunden Ausfallzeit im Jahr eine Verfügbarkeit von 99,99 Prozent hat. Bei einem RZ der Tier-4-Klasse sind SinglePoint of Failures (SPOFs) nahezu ausgeschlossen. Sämtliche IT-Komponenten wie Applikations- und Datenbankserver sowie Storage-Systeme sind redundant ausgelegt; gleichzeitig verfügen alle Geräte über eine redundante Daten- und Stromverkabelung und werden über separate Wege versorgt.

Der Schutz vor Erdbeben, Wirbelstürmen und Überflutung liegt über den Mindestanforderungen, sodass mindestens ein unvorhergesehenes Worst-Case-Ereignis überstanden wird. Eine Tier-4-Verfügbarkeit wird von international agierenden Firmen benötigt, die Dienstleistungen rund um die Uhr und an 365 Tagen im Jahr zuverlässig erbringen müssen, um wettbewerbsfähig zu bleiben.

Alle Komponenten redundant auslegen

Der nächste logische Schritt nach der Hochverfügbarkeit ist die Absicherung des Katastrophenfalls (K-Fall) über ein Dual-Data-Center-Konzept. Hierbei werden Server und Daten in einem zweiten, räumlich entfernten Rechenzentrum redundant gehalten. Überhaupt: Redundanz ist das Zauberwort für ein betriebssicheres Rechenzentrum. Sie gilt auch für die WAN-Anbindungen (Wide Area Network).

Im Idealfall werden die WAN-Verbindungen sogar von verschiedenen Netzwerk-Providern betrieben und führen auf zwei physikalisch unterschiedlichen Wegen ins Rechenzentrum und zum Kunden. Auch die Daten- und Stromverkabelung von Applikations- und Datenbankservern, Switches und Speichern ist redundant auszulegen. Die Verkabelung der IT-Geräte, die miteinander kommunizieren und Daten austauschen, sollte zudem am aktuellen Stand der Technik orientiert sein. Dieser wird durch die DIN-Norm 50173-5 (VDE 0800-173-5) vorgegeben.

Server-Racks modular und flexibel bauen

Beim Bau eines neuen Rechenzentrums muss nicht nur das Gebäude sorgfältig und mit Blick auf die Zukunft geplant werden, sondern auch die Basisinfrastruktur, die aus Netzwerkschränken und Server-Racks besteht. Diese sollten möglichst modular und variabel aufgebaut sein, sodass später auch die Anforderungen von Blade-Systemen oder Virtualisierung erfüllt werden, und sich durch eine hohe Tragkraft auszeichnen. Ebenso wichtig ist ein exakt auf die Serverschränke abgestimmtes Klimatisierungs- und Belüftungskonzept, das den Betrieb der IT-Komponenten im gewünschten Temperaturbereich ermöglicht.

Die empfohlene Raumtemperatur innerhalb eines Rechenzentrums liegt zwischen 22 und 25 Grad Celsius bei einer Luftfeuchtigkeit bei 30 bis 50 Prozent. Auch bei der Klimatisierung bilden redundante Versorgungswege mit zwei- oder dreiphasigen Einspeisungen einen wichtigen Faktor für den kontinuierlichen RZ-Betrieb. Die Verlustwärme der eingesetzten IT- und Netzwerkkomponenten kann zum Beispiel durch Luft-Wasser-Wärmetauscher kompensiert werden, die dezentral am Rack installiert sind und nach Bedarf kühlen. Auch an eine geeignete Luftführung durch Doppelböden und eine getrennte Kaltgang- und Warmgang-Einhausung sollte gedacht werden.

Unterbrechungsfreie Stromversorgung garantieren

Durch die Installation einer geeigneten USV-Anlage werden Störungen wie Spannungsschwankungen gefiltert und Unterbrechungen im Netz überbrückt, was dazu beiträgt Übertragungsfehler, Rechnerabstürze und Datenverluste zu reduzieren. Je nach Bedarf reicht bereits eine statische USV-Anlage aus, die Energie in wieder aufladbaren Batterien speichert. Diese liefern den notwendigen Strom, wenn es zu einem Netzausfall kommt, allerdings nur für 10 bis maximal 30 Minuten. Dagegen kann mit einer dynamischen USV-Anlage sogar ein Stromausfall von mehreren Tagen überbrückt werden. Mehrere mit Diesel betriebene Notstromaggregate liefern im Ernstfall binnen weniger Sekunden - die Zwischenzeit wird durch Batteriebetrieb überbrückt - die nötige Energie.

Zuverlässige Brandschutzmaßnahmen installieren

Eine weitere Voraussetzung für den sicheren Betrieb eines Rechenzentrums ist ein zuverlässiger Brandschutz. Diesen bieten in der Regel Rauch- und Brandmeldesysteme mit hochsensiblen Messfühlern und automatische Löschanlagen. Um den Verbrennungsprozess zu stoppen, werden Argon, Stickstoff oder chemische Löschgase eingesetzt. Spezielle Maßnahmen wie das Einleiten von Stickstoff, der den Sauerstoffgehalt im RZ dauerhaft reduziert, verhindern, dass ein offenes Feuer entsteht.

Abhängig davon, wo ein RZ gebaut wird, sind die gesetzlichen Anforderungen des baulichen Brandschutzes gemäß den Bauordnungen der einzelnen Bundesländer einzuhalten. Nicht zuletzt müssen auch geeignete Lärmschutzmaßnahmen getroffen werden, damit die Emissionsrichtwerte eingehalten werden können. Laut dem Bundesimmissionsschutzgesetz (BimSchG) sind in einem Industriegebiet außerhalb von Gebäuden bis zu 70 dB(A) zulässig, in einem Gewerbegebiet tagsüber 65 dB(A) und in der Nacht 50 dB(A).

Gesetzliche Vorschriften einhalten

Neben individuellen Anforderungen an die Verfügbarkeit sind bei der Gestaltung eines Rechenzentrums auch gesetzliche Regelungen und Vorschriften zu berücksichtigen. Dazu zählen unter anderem das Gesetz zur Kontrolle und Transparenz im Unternehmensbereich (KonTraG), das Handelsgesetzbuch (HGB), das Bundesdatenschutzgesetz, das Telemediengesetz (TMG), die Grundsätze ordnungsmäßiger DV-gestützter Buchführungssysteme (GoBS) oder die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU). Hinzu kommen meist noch vertragliche Anforderungen von Kunden an die Verfügbarkeit der Prozesse, die ebenfalls erfüllt werden müssen. Ein Beispiel dafür sind die Just-in-Sequence (JIS)-Abläufe in der Automobilindustrie.

Zudem unterstützen Normen und Richtlinien wie ISO/IEC 27001, ISO 27002:2008 den Compliance-konformen Betrieb eines Rechenzentrums. Auf Grundlage der ISO/IEC 27001 lässt sich ein Sicherheits-Management-System realisieren und nach dem Plan-Do-Check-Act-Prinzip stetig verbessern. Als "Leitfaden für das Informationssicherheits-Management" liefert die ISO 27002:2008 (früher BS 17799) den Bauplan zur Umsetzung der ISO 27001. Auch das IT-Service-Management spielt eine wichtige Rolle, es erfolgt nach den Richtlinien der IT Infrastructure Libary (ITIL) oder gemäß der ISO-20000-Norm.

Durch Zertifikate die RZ-Qualität sichern

Ein wichtiges Qualitätsmerkmal für ein betriebssicheres Rechenzentrum bilden nicht zuletzt auch Zertifikate, die verschiedene Prüfstellen nach eingehender Begutachtung der Sicherheitsstandards erteilen, die regelmäßig kontrolliert werden. In Deutschland hat sich für die Zertifizierung der Rechenzentrumsinfrastruktur laut Bitkom der TSI-Prüfkatalog des TÜV als Industriestandard etabliert. Die Informationstechnik wird in der Regel auf Grundlage der ISO-15408-Norm (= Common Criteria) zertifiziert, die organisatorischen Abläufe nach ISO 27001 (Sicherheitsmanagementsystem) und ISO 20000. Typische Betriebsprozesse im RZ werden nach ITIL bewertet, Business-Continuity-Maßnahmen nach BS 25999. (hal)