Технічний директор Cloudflare Дейн Кнект вибачився перед клієнтами та інтернет-спільнотою за масштабний збій, який у вівторок 18 листопада вивів з ладу численні сервіси та сайти. Він підкреслив, що це був саме збій. а не кібератака.
“Ми підвели наших клієнтів і ширший інтернет. Прихована помилка у сервісі, що лежить в основі наших можливостей із пом’якшення бот-трафіку, почала спричиняти збої після звичайної зміни конфігурації. Це призвело до масштабної деградації нашої мережі та інших сервісів. Це не була атака”, – написав Кнект у своєму Х.
За офіційними даними, інцидент розпочався приблизно о 11:48 UTC 18 листопада, коли на сторінці статусу Cloudflare з’явився запис про “внутрішнє погіршення сервісів”. Користувачі з різних регіонів почали повідомляти про неможливість отримати доступ до сайтів, що працюють через інфраструктуру Cloudflare, а також про збої в службах Access та WARP. У соцмережах з’явилися тисячі скарг – іронічно, що навіть сервіс Downdetector, що відстежує аварії, тимчасово став недоступним.
“Вплив, який спричинила проблема, і час на її вирішення – неприйнятні. Робота вже ведеться, щоб це більше не сталося, але я знаю, що сьогодні це спричинило справжній біль. Довіра, яку наші клієнти покладають на нас – це те, що ми цінуємо найбільше, і ми зробимо все можливе, щоб її повернути”, – зазначив Кнект.
Компанія встановила, що корінь проблеми полягав у модулі захисту від бот-трафіку: рутинне оновлення конфігурації спрацювало так, що латентна помилка у системі миттєво активувалася. Замість поодинокого ефекту це призвело до каскаду — деградації внутрішніх мережевих компонентів, CDN-шарів та мережевих маршрутів, що забезпечують роботу тисяч сайтів. Оновлення з виправленням було впроваджено близько 14:42 UTC, після чого основні сервіси почали повертатись до функціонування. Проте Cloudflare попередила, що аналітичні панелі керування та деякі підтримувані сервіси можуть ще працювати зі збоями деякий час.

Експерти з інтернет-інфраструктури підкреслюють: Cloudflare обслуговує значну долю світового веб-трафіку, тому її збій запускати ланцюжок наслідків — від приватних сайтів до великих онлайн-платформ. Цей інцидент ще раз наголосив на ризиках централізації цифрової інфраструктури: навіть якщо провайдер має потужні ресурси і широке покриття, один несподіваний баг може призвести до глобальних наслідків. До речі, подібний випадок не є єдиним: рівно рік тому Cloudflare зазнала зламу.
Компанія заявила, що готує повний технічний звіт (post-mortem), у якому буде описано як причини збоїв, так і план дій із запобігання таких ситуацій у майбутньому. Для бізнесу та кінцевих користувачів це стало ще одним сигналом — варто мати план дій на випадок таких масштабних перебоїв, навіть якщо інфраструктура здається надійною.
Джерело: TomsHardware

Повідомити про помилку
Текст, який буде надіслано нашим редакторам: