Azure-Ausfall unterbricht Internetdienste aufgrund aktueller Bedenken hinsichtlich der Zuverlässigkeit von Cloud-Anbietern

29

Am Mittwochnachmittag kam es zu einer erheblichen Störung, die Teile des Internets betraf, als es bei der Cloud-Computing-Plattform Azure von Microsoft zu einem unerwarteten Ausfall kam. Dieser Vorfall verdeutlicht die anhaltenden Herausforderungen für große Cloud-Anbieter bei der Gewährleistung einer konsistenten Serviceverfügbarkeit.

Der Ausfall nimmt seinen Lauf

Die technischen Probleme begannen gegen 16:00 UTC (12:00 Uhr ET), zu einer Zeit, in der viele Unternehmen und Online-Dienste weltweit stark auf die Cloud-Infrastruktur angewiesen sind. Die Dienststatusseite von Microsoft Azure bestätigte die Störung und verwies auf Probleme mit der Azure Front Door (AFD)-Komponente, die die Weiterleitung des Internetverkehrs verwaltet.

Das Azure-Team identifizierte eine „versehentliche Konfigurationsänderung“ als wahrscheinlichen Auslöser für den weit verbreiteten Dienstverlust. Als Reaktion auf die Krise implementierten Azure-Ingenieure Notfallmaßnahmen:

  1. Änderungsblocker: Sie haben sofort alle Konfigurationsänderungen an den betroffenen Azure Front Door-Diensten ausgesetzt, sowohl an den internen Einstellungen von Microsoft als auch an denen der Kunden.
  2. System-Rollback: Gleichzeitig wurde damit begonnen, die problematische Azure Front Door-Konfiguration auf den stabilen Zustand zurückzusetzen, in dem sie vor Beginn der Probleme lief.

Auswirkungen auf Benutzer und Dienste

Dieser technische Schluckauf hatte spürbare Folgen für Internetnutzer und Unternehmen weltweit. Über Dienste wie Downdetector gingen Berichte ein, die auf weit verbreitete Probleme beim Zugriff auf Folgendes hinweisen:

  • Microsoft 365 (einschließlich Outlook.com und Office-Anwendungen)
  • Minecraft
  • Xbox Live-Dienste
  • Andere auf Azure gehostete Websites und Anwendungen

Besonders auffällig war die Störung für Minecraft- und Xbox-Benutzer, da zahlreiche Online-Beschwerden die Schwere des Problems für Gamer bestätigten. Dieser Ausfall fügte der wachsenden Besorgnis über die Zuverlässigkeit von Cloud-Diensten nach dem ähnlichen Vorfall von Amazon Web Services (AWS) nur wenige Tage zuvor eine weitere Ebene hinzu.

Ein bekanntes Muster?

Dies war der zweite größere Azure-Ausfall in diesem Monat. Die Infrastruktur der Plattform ist für unzählige Websites, Anwendungen und Unternehmenssysteme weltweit von grundlegender Bedeutung. Während Azure wichtige Cloud-Dienste für zahlreiche Unternehmen und Plattformen bereitstellt und kritische Daten und Infrastrukturen hostet, unterstreichen die wiederholten Vorfälle die inhärenten Herausforderungen bei der Aufrechterhaltung der absoluten Betriebszeit solch riesiger und komplexer Systeme.

Fazit: Dienstlebensläufe, Fragen bleiben bestehen

Gegen 14:30 Uhr. Benutzerberichten zufolge waren Dienstwiederherstellungen für einige Azure-abhängige Plattformen im Gange. Microsoft bestätigte, dass es seine „letzte bekanntermaßen funktionierende Konfiguration“ bereitstellte, von der erwartet wird, dass die Dienste innerhalb von etwa 30 Minuten vollständig wiederhergestellt werden.

Während die unmittelbare Krise gelöst wurde, wirft das Wiederauftreten größerer Ausfälle bei Azure und AWS umfassendere Fragen zur Widerstandsfähigkeit moderner Internet-Infrastrukturen und zur immensen Komplexität der Verwaltung globaler Cloud-Plattformen auf