Масштабний збій Cloudflare: причини, наслідки та вплив на український ІТ-сектор

Аркадій Хвиля19.11.2025

109 2 хвилин читання

Масштабний збій Cloudflare: причини, наслідки та вплив на український ІТ-сектор — Джерело: freepik

18 листопада 2025 року о 13:28 за київським часом стався один із найбільших інцидентів у роботі Cloudflare за останні роки. Понад три години мільйони веб-сайтів і сервісів по всьому світу, зокрема ChatGPT, YouTube, X (Twitter), Discord, Google-сервіси, Microsoft 365, а також велика кількість українських ресурсів, були частково або повністю недоступні – розповідає dou.

Офіційна причина інциденту

За даними Cloudflare, збій не був спричинений зовнішньою атакою чи DDoS, як припускали спочатку. Коренева причина – внутрішня помилка при зміні прав доступу до бази даних конфігурації модуля Bot Management.

Під час оновлення правил доступу система автоматично згенерувала конфігураційний файл, розмір якого перевищив очікуваний удвічі. Цей файл почав поширюватися на всі edge-сервери компанії (понад 330 дата-центрів у 120+ країнах). Програмне забезпечення, відповідальне за маршрутизацію трафіку (traffic manager), не було підготовлене до обробки файлу такого обсягу, що призвело до масових збоїв у роботі глобальної мережі доставки контенту (CDN) та систем захисту.
О 13:45 Cloudflare оголосила про «критичний інцидент» (PEXK).
О 14:12 було локалізовано проблемний процес і зупинено поширення конфігураційного файлу.
Повне відновлення роботи завершилося о 16:27 за київським часом.

Наслідки для українського ІТ-сектору

Незважаючи на те, що критичні бізнес-процеси більшості компаній не зупинилися, інцидент суттєво вплинув на операційну діяльність українських продуктових і сервісних ІТ-компаній:

Тимчасово недоступними стали корпоративні VPN, системи CI/CD (GitLab, GitHub Actions), інструменти моніторингу (Datadog, Grafana Cloud), документація (Notion, Confluence Cloud) та внутрішні дашборди.
Компанії, які використовують Cloudflare Workers та R2 для продакшн-оточень, зіткнулися з неможливістю деплою та деградацією сервісів.
Продуктові компанії повідомили про короткочасне падіння трафіку (до 30 %) через недоступність статичного контенту та проблем із захистом від ботів.

Представники провідних українських ІТ-компаній зазначили:

Віра Ткаченко, CTIO MacPaw: «У нас тимчасово вимкнули частину WAF-правил і перейшли на fallback-режим, щоб зберегти доступність магазинів. Наразі проводимо внутрішній пост-мортем».
Команда Hily (appflame): «Через недоступність GitLab CI/CD та JitPack зупинився Android-білд на ~2 години. Перейшли на локальні раннери».
Laba Group: «Доступ до prod/dev-оточень був ускладнений, довелося використовувати прямі IP-адреси для деплоїв».

Висновки та рекомендації

Інцидент став черговим нагадуванням про ризики концентрації критичної інфраструктури в одного постачальника, навіть такого надійного, як Cloudflare (SLA 100 % протягом останніх 12 кварталів до цього випадку). Експерти рекомендують українським компаніям:

Розглядати мульти-CDN стратегії для публічних продуктів.
Використовувати enterprise-плани Cloudflare з можливістю швидкого перемикання на «bypass»-режим.
Налаштувати незалежний моніторинг статусу інфраструктури (наприклад, через сторонні сервіси, що не залежать від Cloudflare).
Розробити та регулярно тестувати процедури реагування на глобальні інциденти постачальників.

Видання GALERA.NEWS зазаначає, що подія 18 листопада 2025 року підкреслила необхідність системного підходу до управління інфраструктурними ризиками та підтвердила, що навіть найнадійніші хмарні сервіси не застраховані від людського фактору.

Позначки