Отключение Azure нарушает интернет-сервисы на фоне недавних опасений по поводу надежности облачных провайдеров

5

Значительное нарушение, затронувшее части интернета, произошло в среду во второй половине дня, когда облачная платформа Microsoft Azure пережила неожиданный сбой. Этот инцидент подчеркивает продолжающиеся проблемы для крупных облачных провайдеров в обеспечении стабильной доступности сервисов.

Развитие инцидента

Технические проблемы начались около 16:00 UTC (12:00 p.m. ET), когда многие предприятия и онлайн-сервисы по всему миру сильно зависят от облачной инфраструктуры. Страница статуса сервисов Azure подтвердила сбой, ссылаясь на проблемы с компонентом Azure Front Door (AFD), который управляет маршрутизацией интернет-трафика.

Команда Azure определила «непреднамеленную конфигурационную смену» как наиболее вероятный триггер широкомасштабной потери сервисов. В ответ на кризис инженеры Azure реализовали аварийные процедуры:

  1. Блокировка конфигурации: Они немедленно приостановили все конфигурационные изменения для сервисов Azure Front Door, как внутренних настроек Microsoft, так и клиентов.
  2. Восстановление системы: Одновременно они начали откатывать проблемную конфигурацию Azure Front Door к стабильному состоянию, в котором она работала до начала проблем.

Влияние на пользователей и сервисы

Этот технический сбой имел ощутимые последствия для интернет-пользователей и предприятий по всему миру. Отчеты поступили через сервисы, такие как Downdetector, указывающие на широкие проблемы с доступом к:

  • Microsoft 365 (включая Outlook.com и приложения Office)
  • Minecraft
  • Xbox Live сервисы
  • Другие веб-сайты и приложения, размещенные на Azure

Сбой был особенно заметен для пользователей Minecraft и Xbox, с многочисленными онлайн-жалобами, подтверждающими серьезность проблемы для геймеров. Этот сбой добавил еще один слой к растущей обеспокоенности по поводу надежности облачных сервисов, последовав за аналогичным инцидентом у Amazon Web Services (AWS) всего через несколько дней.

Знакомый узор?

Это был второй значительный сбой Azure в этом месяце. Платформа является фундаментальной для бесчисленных веб-сайтов, приложений и корпоративных систем по всему миру. Хотя Azure предоставляет важные облачные сервисы для многих компаний и платформ, размещение критических данных и инфраструктуры, повторные инциденты подчеркивают присущие сложности в обеспечении абсолютной доступности для таких обширных и сложных систем.

Заключение: Восстановление сервисов, вопросы остаются

К примерно 2:30 p.m. ET отчеты пользователей показали, что восстановление сервисов было начато для некоторых Azure-зависимых платформ. Microsoft подтвердила, что развертывает свою «последнюю известную хорошую конфигурацию», которая, как ожидается, полностью восстановит сервисы в течение примерно 30 минут.

Хотя немедленный кризис был разрешен, повторный возникновение крупных сбоев в Azure и AWS порождает более широкие вопросы о надежности современной интернет-инфраструктуры и огромной сложности управления глобальными облачными платформами