zurück zum Blog

SLA – Wie man Verfügbarkeit bei Services messen sollte und wie Microsoft es macht

Bild von Daniel Goldinger
Daniel Goldinger
vor 728 Tagen
'Taschenrechner auf Notizblock, der die Verfügbarkeit von IT Services berechnet'

 

In der IT Branche wird die Qualität von Hosting-Anbietern unter anderem in Verfügbarkeit gemessen. Die Verfügbarkeit wird in % pro Quartal oder % pro Jahr angegeben und die Zielwerte werden im Vertrag mit dem Anbieter (meist SLA, «Service Level Agreement») schriftlich festgehalten. Hier kommt ein Beispiel:

Die garantierte Verfügbarkeit eines Servers von 99.9% über ein Jahr bedeutet:

1 Jahr = 8760h

0.1% = 8.76h

Der Server darf also pro Jahr 1x für 8.76 Stunden ausfallen. Oder 4x für 2.19h. Und so weiter.

Was passiert beim Unterschreiten der Zielwerte?
Fragen Sie Ihren Anbieter auch immer, was passiert, wenn der Zielwert unterschritten wird. Falls er darauf keine (oder keine zufriedenstellende) Antwort findet, ist die «Garantie» auch nichts wert. Das Nichterfüllen des SLA muss für den Anbieter immer mit Kosten / Vertragsauflösung o.Ä. verbunden sein, damit es auch einen Anreiz gibt, den Vertrag zu erfüllen.

Downtimes (Ausfälle) sollten transparent sein!
Es fällt naturgemäss schwer, Systemausfälle mitzuteilen. Schliesslich zeigen diese erbarmungslos die eigenen Schwächen auf.

Deshalb sind transparente Mitteilungen der eigenen Downtimes immer auch ein Zeichen für die Qualität des Anbieters.

Google zeigt die Downtime History für sämtliche Google Cloud Services etwa hier auf:

https://status.cloud.google.com/summary

Transparent, übersichtlich (inkl. Dauer des Unterbruchs) und für jedermann einsehbar.

Und wie man es auch machen kann…
Schauen wir uns mal die Statusseite von Microsoft für MS365 näher an:

https://status.office365.com/

Keine History und weitere Informationen gibt es nur nach Anmeldung (also nur für Kunden). Ich kaufe somit die Katze im Sack.

Fairerweise muss man sagen, dass Microsoft die Meldungen auch auf Twitter publiziert (https://twitter.com/MSFT365Status). Von dort kann man sich die Downtime also selbst zusammenrechnen.

Ausgewiesene Verfügbarkeit vs. reale Verfügbarkeit
Prüfen Sie als Kunde immer genau nach, ob die veröffentlichten Zahlen stimmen und fragen Sie auch nach, wie die Zahlen zusammengesetzt sind. Kleines Beispiel gefällig?

Unter diesem Link publiziert Microsoft die «worldwide uptimes» für «Microsoft 365 and Office 365 platform service»:

https://docs.microsoft.com/en-us/office365/servicedescriptions/office-365-platform-service-description/service-health-and-continuity

Q3, 2018:
99.97% Verfügbarkeit gemäss Microsoft. Ein Quartal hat 2190h, 0.03% Ausfallzeit sind demnach 0.657h, oder knapp 40 Minuten.

Gemäss der Webseite GeekWire waren es am 04.09.2018 jedoch «mehrere Stunden»:
https://www.geekwire.com/2018/microsoft-azures-southern-u-s-data-center-goes-hours-impacting-office365-active-directory-customers/

Q1, 2021:
99.97% Verfügbarkeit gemäss Microsoft. Also wieder 40 Minuten im ganzen Quartal.

Gemäss der Newsseite Bleepingcomputer waren es wieder mehrere Stunden:
https://www.bleepingcomputer.com/news/microsoft/microsoft-365-outage-knocks-down-teams-exchange-online/

Fazit
IT ist Vertrauenssache. Transparenz schafft Vertrauen.

Hinterfragen Sie als Kunde die Daten, die Sie von Ihrem Anbieter erhalten immer kritisch. Auch die von uns. Prüfen Sie anhand Stichproben, ob die Angaben plausibel sind. Und verwenden Sie bei Bedarf ein unabhängiges «Monitoring as a Service».

Bild von Daniel Goldinger

Autor: Daniel Goldinger

Als Gründer der Goldinger IT GmbH erfreue ich mich täglich daran, unsere aktuellsten und innovativen Cloud Lösungen weiterzuentwickeln.

Erhalten Sie kostenlose Anleitungen & News über uns

Melden Sie sich für unseren Newsletter an. Wir respektieren den Datenschutz.