Awaria AWS wyłączyła dużą część internetu

Awaria AWS wyłączyła dużą część internetu

26 listopada 2020 0 przez Rafał Skrzypek

Środowa awaria AWS na wiele godzin wyłączyła sporą część internetu. Stało się tak dlatego, że usługa infrastruktury sieciowej Amazon jest podstawą działania wielu witryn i aplikacji. Dopiero dziś, parę minut po 10 rano naszego czasu, udało się przywrócić stabilne działanie większości serwisu. Nie wiemy jednak, kiedy wszystkie problemy zostaną usunięte.

Ostatnia aktualizacja (10:18): Przywróciliśmy cały ruch do strumieni danych Kinesis przez wszystkie punkty końcowe i teraz działa on prawidłowo. Rozwiązaliśmy również problem częstych błędów wywoływania interfejsów CloudWatch API. Nadal pracujemy nad pełnym przywróceniem usług IoT SiteWise. Szczegółowe informacje znajdują się poniżej. Wszystkie inne serwisy działają normalnie. Zidentyfikowaliśmy główną przyczynę awarii Kinesis Data Streams i podjęliśmy natychmiastowe działania, aby zapobiec ponownemu jej wystąpieniu. – czytamy na AWS Service Health Dashboard.

Poprzednia aktualizacja (9:43 czasu PST): (…) Nadal pracujemy nad pełnym przywróceniem  IoT SiteWise i Elastic Container Service; szczegóły dotyczące statusu tych usług znajdują się poniżej. Wszystkie inne serwisy działają normalnie…

Poprzednia aktualizacja (8:43): (..) Nadal monitorujemy Kinesis i pracujemy nad pełnym przywróceniem wszystkich usług. (…) Kinesis i CloudWatch działają normalnie.

Komunikaty o awariach

Chwilę po wystąpieniu awarii wiele firm informowało na Twitterze o problemach:

Przerwę w działaniu zanotował też serwis Anchor.FM, z którego korzysta nasza redakcja:

awaria AWS
Statystyki serwisu Downdetector mówią same za siebie

AWS to jedna z najczęściej używanych na świecie usług przetwarzania w chmurze. Z tego właśnie powodu wszelkie problemy tego serwisu mają poważne skutki dla wielu witryn internetowych i aplikacji. Świadczy o tym liczba firm, których dotyczy awaria. Wśród nich znajdziemy m.in.: 1Password, Acorns, Adobe Spark, Anchor, Autodesk, Capital Gazette, Coinbase, DataCamp, Getaround, Glassdoor, The Philadelphia Inquirer, Pocket, RadioLab, Roku, RSS Podcasting, Tampa Bay Times, Vonage, The Washington Post oraz WNYC. Amazon twierdzi, że problem dotyczył tylko jednego regionu geograficznego z 23, w których działa usługa. Nie chcemy sobie nawet wyobrażać, jaki armagedon spowodowałaby awaria AWS w kilku obszarach jednocześnie.

Źródło: The Verge