Cloudflare potwierdza awarię spowodowaną błędem aktualizacji konfiguracji sieci w centrum danych


Cloudflare potwierdził, że krótkotrwała awaria, która spowodowała wyłączenie setek stron internetowych we wtorek, 21 czerwca, była spowodowana planowaną zmianą konfiguracji sieci w 19 jej centrach danych i nie była wynikiem szkodliwej aktywności.

Jak wcześniej zgłoszone przez Computer Weeklypodczas incydentu związanego z przestojem, którego rozwiązanie firma zajmująca się bezpieczeństwem aplikacji internetowych zajęła nieco ponad godzinę, wiele stron internetowych i usług online skierowanych do konsumentów i przedsiębiorstw zostało tymczasowo wyłączonych.

W poście na blogu opublikowane w tym samym dniu, w którym wystąpiła awariaCloudflare powiedział, że awaria była wynikiem zmiany konfiguracji sieci, wprowadzonej w 19 centrach danych w ramach szerszej pracy mającej na celu zwiększenie odporności jej usług w „najbardziej obciążonych lokalizacjach”.

Obiekty te obejmują kilka centrów danych w Ameryce Północnej i Południowej, Europie i regionie Azji i Pacyfiku, co daje pewien kontekst, dlaczego jedną z charakterystycznych cech awarii była duża liczba głośnych usług internetowych i usług online, których dotyczyła.

„W ciągu ostatnich 18 miesięcy Cloudflare pracował nad przekształceniem wszystkich naszych najbardziej ruchliwych lokalizacji w bardziej elastyczną i odporną architekturę” – czytamy w poście na blogu. „W tym czasie przekonwertowaliśmy 19 naszych centrów danych na tę architekturę.

„Kluczowym elementem tej nowej architektury… jest dodatkowa warstwa routingu, która tworzy siatkę połączeń. Ta siatka umożliwia nam łatwe wyłączanie i włączanie części sieci internetowej w centrum danych w celu konserwacji lub rozwiązania problemu”.

Reklama

I chociaż nowa konfiguracja wzmocniła solidność konfiguracji sieci w centrach danych, co jest ważne, ponieważ te 19 centrów danych przenosi znaczną ilość ruchu Cloudflare, jest to również powód, dla którego awaria miała tak dalekosiężne skutki, dodał blog.

„Ta nowa architektura zapewniła nam znaczną poprawę niezawodności, a także umożliwiła prowadzenie konserwacji w tych lokalizacjach bez zakłócania ruchu klientów” — powiedział.

„Ponieważ te lokalizacje przenoszą również znaczną część ruchu Cloudflare, każdy problem tutaj może mieć bardzo szeroki wpływ i niestety tak się stało dzisiaj”.

W następstwie incydentu firma zidentyfikowała kilka obszarów wymagających poprawy, aby zapobiec ponownemu wystąpieniu tego incydentu, i „będzie nadal pracować nad odkrywaniem wszelkich innych luk, które mogą spowodować nawrót”, dodał post na blogu.

„Jesteśmy głęboko przykro z powodu zakłóceń dla naszych klientów i wszystkich użytkowników, którzy nie mogli uzyskać dostępu do usług internetowych podczas awarii. Rozpoczęliśmy już prace [making] zmiany i będziemy kontynuować naszą staranność, aby to się nie powtórzyło” – podsumował.



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Fani Delicious in Dungeon uznają krasnoluda Senshi za symbol seksu

Każda drużyna poszukiwaczy przygód jest tak dobra, jak jej członkowie i główna partia Pyszne w Dungeon, zarówno manga autorstwa Ryoko Kui,...

Audio-Technica rozszerza działalność w Ameryce Północnej

Audio-Technica US Incorporated, ogłosiła niedawno utworzenie nowej spółki zajmującej się operacjami logistycznymi, Technica Logistics Inc. Ogłoszenie to zostało dokonane przez pana Manabu Aoki,...

Jak zmiany w systemie Windows mogą pomóc firmie Microsoft w wykorzystaniu komputerów wyposażonych w sztuczną inteligencję

Po szefie Windows i Surface, Panosie Panayu odszedł z Microsoftu w zeszłym roku gigant oprogramowania szybko podzielił swoje dwa działy na dwa różne...
Advertisment