Cloudflare potwierdza awarię spowodowaną błędem aktualizacji konfiguracji sieci w centrum danych


Cloudflare potwierdził, że krótkotrwała awaria, która spowodowała wyłączenie setek stron internetowych we wtorek, 21 czerwca, była spowodowana planowaną zmianą konfiguracji sieci w 19 jej centrach danych i nie była wynikiem szkodliwej aktywności.

Jak wcześniej zgłoszone przez Computer Weeklypodczas incydentu związanego z przestojem, którego rozwiązanie firma zajmująca się bezpieczeństwem aplikacji internetowych zajęła nieco ponad godzinę, wiele stron internetowych i usług online skierowanych do konsumentów i przedsiębiorstw zostało tymczasowo wyłączonych.

W poście na blogu opublikowane w tym samym dniu, w którym wystąpiła awariaCloudflare powiedział, że awaria była wynikiem zmiany konfiguracji sieci, wprowadzonej w 19 centrach danych w ramach szerszej pracy mającej na celu zwiększenie odporności jej usług w „najbardziej obciążonych lokalizacjach”.

Obiekty te obejmują kilka centrów danych w Ameryce Północnej i Południowej, Europie i regionie Azji i Pacyfiku, co daje pewien kontekst, dlaczego jedną z charakterystycznych cech awarii była duża liczba głośnych usług internetowych i usług online, których dotyczyła.

„W ciągu ostatnich 18 miesięcy Cloudflare pracował nad przekształceniem wszystkich naszych najbardziej ruchliwych lokalizacji w bardziej elastyczną i odporną architekturę” – czytamy w poście na blogu. „W tym czasie przekonwertowaliśmy 19 naszych centrów danych na tę architekturę.

„Kluczowym elementem tej nowej architektury… jest dodatkowa warstwa routingu, która tworzy siatkę połączeń. Ta siatka umożliwia nam łatwe wyłączanie i włączanie części sieci internetowej w centrum danych w celu konserwacji lub rozwiązania problemu”.

Reklama

I chociaż nowa konfiguracja wzmocniła solidność konfiguracji sieci w centrach danych, co jest ważne, ponieważ te 19 centrów danych przenosi znaczną ilość ruchu Cloudflare, jest to również powód, dla którego awaria miała tak dalekosiężne skutki, dodał blog.

„Ta nowa architektura zapewniła nam znaczną poprawę niezawodności, a także umożliwiła prowadzenie konserwacji w tych lokalizacjach bez zakłócania ruchu klientów” — powiedział.

„Ponieważ te lokalizacje przenoszą również znaczną część ruchu Cloudflare, każdy problem tutaj może mieć bardzo szeroki wpływ i niestety tak się stało dzisiaj”.

W następstwie incydentu firma zidentyfikowała kilka obszarów wymagających poprawy, aby zapobiec ponownemu wystąpieniu tego incydentu, i „będzie nadal pracować nad odkrywaniem wszelkich innych luk, które mogą spowodować nawrót”, dodał post na blogu.

„Jesteśmy głęboko przykro z powodu zakłóceń dla naszych klientów i wszystkich użytkowników, którzy nie mogli uzyskać dostępu do usług internetowych podczas awarii. Rozpoczęliśmy już prace [making] zmiany i będziemy kontynuować naszą staranność, aby to się nie powtórzyło” – podsumował.



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Czy powinieneś kupić AirPods Pro?

AirPods Pro to jedne z najpopularniejszych prawdziwie bezprzewodowych słuchawek na rynku. Po wprowadzeniu w październiku 2019 r. AirPods Pro stały się niezbędnym...

Meta zamyka jedną ze swoich największych gier VR — ale tylko dla posiadaczy Quest 1

W tym samym czasie Meta podniosła cenę swoich zestawów słuchawkowych Quest 2ogłosił również, że kończy obsługę Quest 1 dla Populacja 1,...

Najlepsze książki, komiksy i nie tylko Neila Gaimana

W tym tygodniu Netflix adaptacja Neila Gaimana Piaskun debiutuje. To było długa, długa droga za adaptację legendarnego komiksu oraz Zaangażowanie...
Advertisment

Chcesz być na bieżąco z najnowszymi wiadomościami?

Bardzo chcielibyśmy usłyszeć od Ciebie! Podaj swoje dane, a pozostaniemy w kontakcie. To takie proste!