Первопричиной масштабного сбоя в одном из крупнейших дата-центров AWS’s S3 Amazon в США, который привел к отключению во всем мире интернет-ресурсов, использующих облачный сервис компании, оказалась ошибка сотрудника.

Отмечается, что утром 28 февраля технические профессионалы компании занимались отладкой системы выставления счетов и собирались отключить несколько серверов. Amazon объяснила, что из-за опечатки была неправильно введена команда при отладке серверов. Как передает Bloomberg, после происшедшего руководство Amazon опубликовало официальное объявление, в котором раскрыло причины сбоя.

Компания Amazon сообщила, что приняты меры на то, чтобы таковых инцидентов больше не повторялось. В том числе — те, которые поддерживали работу 2-х подсистем, ответственных за управление метаданными и администрирование хранилищ. Для восстановления нормальной работы потребовалась полная перезагрузка системы, чего Amazon не приходилось делать уже большое количество лет. На протяжении приблизительно четырех часов сотни порталов и приложений были недоступны либо работали некорректно.

Масштабы проблемы были настолько внушительными, что юзеры сети назвали случившееся «концом интернета».

Масштабный сбой в Amazon Web Services вызвала ошибка инженера


В записи нет меток.