Une panne d’Azure perturbe les services Internet au milieu de récents problèmes de fiabilité des fournisseurs de cloud

29

Une perturbation importante affectant certaines parties d’Internet s’est produite mercredi après-midi lorsque la plate-forme de cloud computing Azure de Microsoft a connu une panne inattendue. Cet incident met en évidence les défis permanents auxquels sont confrontés les principaux fournisseurs de cloud pour garantir une disponibilité constante des services.

La panne se déroule

Les problèmes techniques ont commencé vers 16h00 UTC (12h00 HE), une époque où de nombreuses entreprises et services en ligne dans le monde dépendent fortement de l’infrastructure cloud. La page d’état du service de Microsoft Azure a confirmé la perturbation, citant des problèmes avec son composant Azure Front Door (AFD), qui gère le routage du trafic Internet.

L’équipe Azure a identifié un « changement de configuration involontaire » comme étant le déclencheur probable de la perte de service généralisée. En réponse à la crise, les ingénieurs Azure ont mis en place des procédures d’urgence :

  1. Change Blocker : Ils ont immédiatement suspendu toutes les modifications de configuration apportées aux services Azure Front Door concernés, à la fois les paramètres internes de Microsoft et ceux des clients.
  2. Restauration du système : Simultanément, ils ont commencé à restaurer la configuration problématique d’Azure Front Door vers l’état stable dans lequel elle fonctionnait avant le début des problèmes.

Impact sur les utilisateurs et les services

Ce contretemps technique a eu des conséquences tangibles pour les internautes et les entreprises du monde entier. Des rapports ont afflué via des services comme Downdetector, indiquant des problèmes généralisés d’accès :

  • Microsoft 365 (y compris les applications Outlook.com et Office)
  • Minecraft
  • Services Xbox Live
  • Autres sites Web et applications hébergés sur Azure

La perturbation a été particulièrement notable pour les utilisateurs de Minecraft et Xbox, avec de nombreuses plaintes en ligne confirmant la gravité du problème pour les joueurs. Cette panne a ajouté une autre couche aux inquiétudes croissantes concernant la fiabilité des services cloud suite à un incident similaire survenu chez Amazon Web Services (AWS) quelques jours auparavant.

Un modèle familier ?

Il s’agit de la deuxième panne significative d’Azure ce mois-ci. L’infrastructure de la plateforme est fondamentale pour d’innombrables sites Web, applications et systèmes d’entreprise dans le monde. Alors qu’Azure fournit des services cloud essentiels à de nombreuses entreprises et plates-formes, hébergeant des données et des infrastructures critiques, les incidents répétés soulignent les défis inhérents au maintien d’une disponibilité absolue pour des systèmes aussi vastes et complexes.

Conclusion : reprise du service, des questions persistent

Vers 14h30. À 13 h 30 HE, les rapports des utilisateurs ont indiqué que des récupérations de services étaient en cours pour certaines plates-formes dépendantes d’Azure. Microsoft a confirmé qu’il déployait sa « dernière bonne configuration connue », qui devrait restaurer complètement les services dans un délai d’environ 30 minutes.

Alors que la crise immédiate a été résolue, la répétition des pannes majeures chez Azure et AWS soulève des questions plus larges sur la résilience de l’infrastructure Internet moderne et l’immense complexité de la gestion des plateformes cloud mondiales.