Service aus der Cloud

Das müssen Sie bei Cloud-SLAs beachten

Service-Verfügbarkeit

Der wichtigste SLA-Parameter ist die Verfügbarkeit. Am Beispiel dieses Parameters sollen die wichtigsten SLA-Elemente vorgestellt werden, bei den anderen verhält es sich ähnlich.

Die Verfügbarkeit eines Cloud Service ist der Zeitraum, in dem das System mindestens bereit steht. Als Zeiteinheiten werden typischerweise Minuten, Stunden, Tage, Monate, Quartale oder Jahre verwendet. Üblicherweise wird die Verfügbarkeit einer Cloud-Leistung als Prozentwert in Bezug auf den Betrachtungszeitraum angegeben, zum Beispiel "99,5 % im Monat"

Gemessen werden kann die Verfügbarkeit als Verhältnis von Uptime - also der Zeit, die der Service ordnungsgemäß bereit steht - zur Gesamtzeit, also Uptime plus Downtime (Ausfallzeit):

Verfügbarkeit = Uptime / (Uptime + Downtime).

Ist die Downtime = 0, ist die Verfügbarkeit 100 Prozent - der Idealwert. Als Mindestwert im Cloud Computing gelten Verfügbarkeiten von 99,9 Prozent. Das klingt beeindruckend, reicht aber in der Praxis oft nicht. Denn immerhin lassen 99,9 Prozent einen Zugriffsverlust von 8,7 Stunden pro Jahr zu - sind es acht Stunden in der Geschäftszeit, kann dies zu lang sein. Amazon bietet beispielsweise als einer der größten Cloud Anbieter für seinen Elastic Compute Cloud EC2-Service eine generelle Verfügbarkeit von 99,95 Prozent pro 365 Tage an, was einer Ausfallzeit von 4,38 Stunden entspricht.

Verfügbarkeiten in Prozent - umgerechnet in Minuten für ein System, das 24 Stunden am Tag, an 365 Jahrestagen (24 × 365) zur Verfügung steht (8760 Stunden). (Quelle: Daten nach Wikipedia)

Verfügbarkeit

Minimale erwartete Betriebszeit (in Stunden)

Maximale erlaubte Ausfallzeit (in Stunden)

Maximale erlaubte Ausfallzeit (in Minuten)

99 %

8672,40

87,60

5256,00

99,1 %

8681,16

78,84

4730,40

99,5 %

8716,20

43,80

2628,00

99,9 %

8751,24

8,76

525,60

99,99 %

8759,12

0,88

52,56

99,999 %

8759,91

0,09

5,26

100 %

8760,00

0,00

0,00

Die nächst höhere übliche Stufe der Verfügbarkeit ist eine Ausfallsicherheit von 99,99 Prozent. Dies entspricht einem Systemausfall von etwa 50 Minuten pro Jahr. Auch dies ist für manche Einsatzgebiete zu wenig. Als magischer Wert gelten "Five-Nine": 99,999 Prozent Verfügbarkeit - das sind etwa fünf Minuten Ausfall pro Jahr.

Ungeplante Ausfälle

Ausfallsicherheit gibt es nicht umsonst, sie kostet Geld. Grob lässt sich sagen: Je mehr Neunen ein Provider anbietet (und damit: je höher die Verfügbarkeit) umso mehr steigen die Kosten für den Service. Bei kritischen Systemen empfiehlt es sich, hier nicht zu sparen. Weniger kritische Systeme können mit geringeren und kostengünstigeren Ausfalllevels betrieben werden.

Was aber zählt zur Downtime? Fällt ein Service ungeplant aus, ist die Verfügbarkeit ganz klar nicht gegeben. Wie aber verhält es sich mit geplanten Ausfällen aufgrund von Wartung oder Systemaktualisierungen? Für den Provider zählt letzteres nicht zur Ausfallzeit:

Verfügbarkeit = (Servicezeit + geplante - ungeplante Ausfallzeit) / Gesamtzeit

Der Kunde sieht dies naturgemäß anders. Er hat das Interesse, aus dem Plus hinter der Servicezeit ein Minus zu machen.

Dieser Provider legt verschieden Wartungsfenster-Klassen mit und ohne Kundenrücksprache fest.
Dieser Provider legt verschieden Wartungsfenster-Klassen mit und ohne Kundenrücksprache fest.
Foto: Pegasus IT

Wartungsfenster sollten deshalb in der SLA klar geregelt sein. Es muss ersichtlich sein, ob und wenn ja, welche Wartungszeiten zur Servicezeit zählen. Dort sollte auch festgelegt werden, ob Wartungsintervalle in regelmäßigen Abständen erfolgen, einer Genehmigung des Kunden bedürfen oder diese auch außerplanmäßig erfolgen können.

Verfügbarkeit ist eine klare Ja-Nein-Frage. Ein Service ist verfügbar oder nicht. Allerdings kann ein Service in seiner Qualität nicht den Erwartungen des Kunden entsprechen. Beispielsweise kann ein Cloud-System zwar antworten, aber die Antwort kann sehr lange auf sich warten lassen. Ist die Leistungserbringung damit erfüllt oder nicht?