Серйозний збій у роботі Інтернету стався в середу вдень, коли хмарна платформа Microsoft Azure зазнала неочікуваного збою. Інцидент підкреслює постійні проблеми для великих хмарних провайдерів у забезпеченні постійної доступності послуг.
Розвиток інциденту
Технічні проблеми виникли близько 16:00 UTC (12:00 за східним часом), коли багато компаній і онлайн-сервісів у всьому світі значною мірою покладаються на хмарну інфраструктуру. Сторінка стану служб Azure підтвердила збій, посилаючись на проблеми з компонентом Azure Front Door (AFD), який керує маршрутизацією Інтернет-трафіку.
Команда Azure визначила «ненавмисну зміну конфігурації» як найбільш вірогідну причину масової втрати послуг. У відповідь на кризу інженери Azure запровадили надзвичайні процедури:
- Блокування конфігурації: вони негайно призупинили всі зміни конфігурації для служб Azure Front Door, як внутрішні налаштування Microsoft, так і налаштування клієнтів.
- Відновлення системи: Водночас вони почали відкат проблемної конфігурації передніх дверей Azure до стабільного стану, в якому вона працювала до початку проблем.
Вплив на користувачів і сервіси
Цей технічний збій мав відчутні наслідки для користувачів Інтернету та компаній у всьому світі. Через такі служби, як Downdetector, надійшли звіти, які вказують на масові проблеми з доступом до:
- Microsoft 365 (включаючи програми Outlook.com і Office)
- Майнкрафт
- Служби Xbox Live
*Інші веб-сайти та програми, розміщені на Azure
Збій був особливо помітний для користувачів Minecraft і Xbox, численні онлайн-скарги підтвердили серйозність проблеми для геймерів. Збій додав ще один рівень занепокоєння щодо надійності хмарних служб після подібного інциденту в Amazon Web Services (AWS) лише через кілька днів.
Це знайомий шаблон?
Це був другий значний збій Azure цього місяця. Платформа є фундаментальною для незліченних веб-сайтів, програм і корпоративних систем у всьому світі. Незважаючи на те, що Azure надає критично важливі хмарні служби для багатьох компаній і платформ, розміщуючи важливі дані та інфраструктуру, повторювані інциденти підкреслюють невід’ємні проблеми забезпечення абсолютної доступності для таких великих і складних систем.
Висновок: відновлення служб, питання залишаються
Приблизно о 14:30 год. ET, у звітах користувачів зазначено, що для деяких платформ, залежних від Azure, почалося відновлення служби. Microsoft підтвердила, що розгортає свою «останню відому хорошу конфігурацію», яка, як очікується, повністю відновить служби протягом приблизно 30 хвилин.
Хоча безпосередню кризу було вирішено, повторення великих збоїв у Azure та AWS піднімає ширші питання щодо надійності сучасної інтернет-інфраструктури та надзвичайної складності керування глобальними хмарними платформами.











































































