Cloudflare potwierdza awarię spowodowaną błędem aktualizacji konfiguracji sieci w centrum danych


Cloudflare potwierdził, że krótkotrwała awaria, która spowodowała wyłączenie setek stron internetowych we wtorek, 21 czerwca, była spowodowana planowaną zmianą konfiguracji sieci w 19 jej centrach danych i nie była wynikiem szkodliwej aktywności.

Jak wcześniej zgłoszone przez Computer Weeklypodczas incydentu związanego z przestojem, którego rozwiązanie firma zajmująca się bezpieczeństwem aplikacji internetowych zajęła nieco ponad godzinę, wiele stron internetowych i usług online skierowanych do konsumentów i przedsiębiorstw zostało tymczasowo wyłączonych.

W poście na blogu opublikowane w tym samym dniu, w którym wystąpiła awariaCloudflare powiedział, że awaria była wynikiem zmiany konfiguracji sieci, wprowadzonej w 19 centrach danych w ramach szerszej pracy mającej na celu zwiększenie odporności jej usług w „najbardziej obciążonych lokalizacjach”.

Obiekty te obejmują kilka centrów danych w Ameryce Północnej i Południowej, Europie i regionie Azji i Pacyfiku, co daje pewien kontekst, dlaczego jedną z charakterystycznych cech awarii była duża liczba głośnych usług internetowych i usług online, których dotyczyła.

„W ciągu ostatnich 18 miesięcy Cloudflare pracował nad przekształceniem wszystkich naszych najbardziej ruchliwych lokalizacji w bardziej elastyczną i odporną architekturę” – czytamy w poście na blogu. „W tym czasie przekonwertowaliśmy 19 naszych centrów danych na tę architekturę.

„Kluczowym elementem tej nowej architektury… jest dodatkowa warstwa routingu, która tworzy siatkę połączeń. Ta siatka umożliwia nam łatwe wyłączanie i włączanie części sieci internetowej w centrum danych w celu konserwacji lub rozwiązania problemu”.

Reklama

I chociaż nowa konfiguracja wzmocniła solidność konfiguracji sieci w centrach danych, co jest ważne, ponieważ te 19 centrów danych przenosi znaczną ilość ruchu Cloudflare, jest to również powód, dla którego awaria miała tak dalekosiężne skutki, dodał blog.

„Ta nowa architektura zapewniła nam znaczną poprawę niezawodności, a także umożliwiła prowadzenie konserwacji w tych lokalizacjach bez zakłócania ruchu klientów” — powiedział.

„Ponieważ te lokalizacje przenoszą również znaczną część ruchu Cloudflare, każdy problem tutaj może mieć bardzo szeroki wpływ i niestety tak się stało dzisiaj”.

W następstwie incydentu firma zidentyfikowała kilka obszarów wymagających poprawy, aby zapobiec ponownemu wystąpieniu tego incydentu, i „będzie nadal pracować nad odkrywaniem wszelkich innych luk, które mogą spowodować nawrót”, dodał post na blogu.

„Jesteśmy głęboko przykro z powodu zakłóceń dla naszych klientów i wszystkich użytkowników, którzy nie mogli uzyskać dostępu do usług internetowych podczas awarii. Rozpoczęliśmy już prace [making] zmiany i będziemy kontynuować naszą staranność, aby to się nie powtórzyło” – podsumował.



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Ceny Apple Vision Pro w serwisie eBay przyprawiają mnie o smutek

Zapłaciłem dużo pieniędzy za przywilej zdobycia Apple Vision Pro nowość w lutym. W sumie, z wkładkami optycznymi i podatkami, sfinansowałem nieco ponad...

Przyjrzyj się projektowi renowacji wentylatora Terminatora 2

Terminator 2: Dzień Sądu był – i dla niektórych jest – wzorcem bombastycznych filmów akcji po premierze w 1991 roku, ale wielu jego...

Doskonałe słuchawki douszne QC Ultra firmy Bose osiągają najniższy poziom w historii

Jeśli poprzeczka dla słuchawek dousznych z redukcją szumów wydaje się obecnie wysoka, dzieje się tak dlatego, że Bose i Sony wydają się ją...
Advertisment