Значительное нарушение, затронувшее части интернета, произошло в среду во второй половине дня, когда облачная платформа Microsoft Azure пережила неожиданный сбой. Этот инцидент подчеркивает продолжающиеся проблемы для крупных облачных провайдеров в обеспечении стабильной доступности сервисов.
Развитие инцидента
Технические проблемы начались около 16:00 UTC (12:00 p.m. ET), когда многие предприятия и онлайн-сервисы по всему миру сильно зависят от облачной инфраструктуры. Страница статуса сервисов Azure подтвердила сбой, ссылаясь на проблемы с компонентом Azure Front Door (AFD), который управляет маршрутизацией интернет-трафика.
Команда Azure определила «непреднамеленную конфигурационную смену» как наиболее вероятный триггер широкомасштабной потери сервисов. В ответ на кризис инженеры Azure реализовали аварийные процедуры:
- Блокировка конфигурации: Они немедленно приостановили все конфигурационные изменения для сервисов Azure Front Door, как внутренних настроек Microsoft, так и клиентов.
- Восстановление системы: Одновременно они начали откатывать проблемную конфигурацию Azure Front Door к стабильному состоянию, в котором она работала до начала проблем.
Влияние на пользователей и сервисы
Этот технический сбой имел ощутимые последствия для интернет-пользователей и предприятий по всему миру. Отчеты поступили через сервисы, такие как Downdetector, указывающие на широкие проблемы с доступом к:
- Microsoft 365 (включая Outlook.com и приложения Office)
- Minecraft
- Xbox Live сервисы
- Другие веб-сайты и приложения, размещенные на Azure
Сбой был особенно заметен для пользователей Minecraft и Xbox, с многочисленными онлайн-жалобами, подтверждающими серьезность проблемы для геймеров. Этот сбой добавил еще один слой к растущей обеспокоенности по поводу надежности облачных сервисов, последовав за аналогичным инцидентом у Amazon Web Services (AWS) всего через несколько дней.
Знакомый узор?
Это был второй значительный сбой Azure в этом месяце. Платформа является фундаментальной для бесчисленных веб-сайтов, приложений и корпоративных систем по всему миру. Хотя Azure предоставляет важные облачные сервисы для многих компаний и платформ, размещение критических данных и инфраструктуры, повторные инциденты подчеркивают присущие сложности в обеспечении абсолютной доступности для таких обширных и сложных систем.
Заключение: Восстановление сервисов, вопросы остаются
К примерно 2:30 p.m. ET отчеты пользователей показали, что восстановление сервисов было начато для некоторых Azure-зависимых платформ. Microsoft подтвердила, что развертывает свою «последнюю известную хорошую конфигурацию», которая, как ожидается, полностью восстановит сервисы в течение примерно 30 минут.
Хотя немедленный кризис был разрешен, повторный возникновение крупных сбоев в Azure и AWS порождает более широкие вопросы о надежности современной интернет-инфраструктуры и огромной сложности управления глобальными облачными платформами










































































