gdgt

Skip to Content

AWS потерпела неудачу, оставив многие приложения, веб-сайты и игры офлайн

Этим ясным октябрьским утром кажется, что половина интернета испытывает похмелье. Серьезный сбой в работе Amazon Web Services вывел из строя множество веб-сайтов, приложений, игр и других сервисов, которые полагаются на облачное подразделение Amazon для обеспечения бесперебойной работы.

Согласно странице состояния служб AWS, Amazon исследовала «повышенные показатели ошибок и задержек для нескольких служб AWS» в регионе US-EAST-1 (то есть дата-центры в Северной Вирджинии) по состоянию на 3:11 утра по восточному времени в понедельник. К 5:01 утра AWS выяснила, что причиной сбоя стала проблема с разрешением DNS в их API DynamoDB. DynamoDB — это база данных, которая хранит информацию для клиентов AWS.

«Amazon безопасно хранил данные, но никто другой не мог их найти в течение нескольких часов, что привело к временной потере связи приложений с их данными», — сказал Майк Чаппл, преподаватель информационных технологий, аналитики и операций в Университете Нотр-Дам, в интервью CNN. «Это похоже на то, как если бы большие части интернета временно страдали от амнезии».

К 6:35 утра AWS сообщила, что полностью устранила проблему с DNS, и что «большинство операций служб AWS теперь успешно выполняются». Однако каскадный эффект вызвал проблемы с другими службами AWS, включая EC2, службу виртуальных машин, на основе которой многие компании создают онлайн-приложения.

В 8:48 утра AWS сообщила, что «добивается прогресса в решении проблемы с запуском новых экземпляров EC2 в регионе US-EAST-1». Они рекомендовали клиентам не привязывать новые развертывания к конкретным зонам доступности (то есть к одному или нескольким дата-центрам в данном регионе), «чтобы EC2 имел гибкость» в выборе более подходящей зоны.

В 9:42 утра Amazon отметила на странице состояния, что, хотя они применили «несколько мер по смягчению последствий» в нескольких зонах доступности в US-EAST-1, они «по-прежнему испытывают повышенное количество ошибок при запуске новых экземпляров EC2». В связи с этим AWS «ограничивала скорость запуска новых экземпляров, чтобы способствовать восстановлению». Компания добавила в 10:14 утра, что наблюдает «значительные ошибки API и проблемы с подключением в нескольких службах в регионе US-EAST-1». Даже после устранения всех проблем у AWS останется значительный объем запросов и других факторов для обработки, поэтому полное восстановление займет некоторое время.

Многие, многие, многие компании используют US-EAST-1 для своих развертываний AWS, поэтому в понедельник утром казалось, что половина интернета была отключена. По состоянию на середину утра, множество веб-сайтов и других сервисов работали медленно или выдавали сообщения об ошибках. Отчеты о сбоях для широкого спектра услуг резко возросли на Down Detector. Помимо собственных сервисов Amazon, пользователи сообщали о проблемах с такими сервисами, как банки, авиакомпании, Disney+, Snapchat, Reddit, Lyft, Apple Music, Pinterest, Fortnite, Roblox и The New York Times — приносим извинения всем, чьи серии Wordle могли оказаться под угрозой.

AWS предлагает клиентам множество полезных функций, таких как возможность для веб-сайтов и приложений автоматически масштабировать вычислительную мощность и серверную мощность вверх и вниз по мере необходимости для обработки колебаний трафика. У них также есть дата-центры по всему миру. Такая инфраструктура привлекательна для компаний, обслуживающих глобальную аудиторию и нуждающихся в круглосуточной доступности. По состоянию на середину 2025 года оценивалось, что доля AWS на мировом рынке облачной инфраструктуры составляла 30 процентов. Но такие инциденты подчеркивают, что полагаться на всего нескольких поставщиков в качестве основы значительной части интернета — это некоторая проблема.