Cloudflare ошибочно предположила, что масштабный сбой, который вывел из строя множество веб-сайтов 18 ноября, был вызван DDoS-атакой, признал генеральный директор компании. Однако в своем сообщении в блоге, подробно описывающем произошедшее, Мэтью Принс объяснил, что, осознав свою ошибку, его команда смогла исправить проблему. «Проблема не была вызвана, прямо или косвенно, кибератакой или злонамеренной деятельностью какого-либо рода», — написал он. Вместо этого причиной стало изменение разрешений в системах баз данных компании, что привело к проблеме с файлом, используемым системой управления ботами.
Система управления ботами компании использует модель машинного обучения для оценки каждого запроса, который боты делают при сканировании сети Cloudflare. Ее клиенты полагаются на эти оценки ботов, чтобы решить, разрешать или блокировать определенным ботам доступ к своим веб-сайтам. Одно из применений оценки ботов — возможность блокировать ботов ИИ-компаний, чтобы они не могли использовать контент веб-сайта для обучения своих LLM. В июле Cloudflare запустила эксперимент под названием «оплата за сканирование», которая позволяет владельцам веб-сайтов разрешать ИИ-ботам сканировать их страницы, если они получают плату за доступ.
Принс заявил, что модель полагается на конфигурационный файл «признаков» для прогнозирования того, был ли запрос бота автоматизированным или нет. Файл признаков обновляется каждые несколько минут, а изменение в базовом механизме, генерирующем этот файл, привело к изменению его размера, что вызвало ошибку. «В результате система основного прокси-сервера, обрабатывающая трафик наших клиентов, начала возвращать коды ошибок HTTP 5xx для всего трафика, который зависел от модуля ботов», — написал Принс.
Это недавнее событие стало худшим сбоем Cloudflare за последние годы. Компания заявила, что с 2019 года у нее не было сбоя, который «привел бы к остановке большинства основных потоков трафика через [ее] сеть». Принс от имени своей команды принес извинения за возникшую проблему.
