Equinix przeprowadza przegląd odporności swoich zasilaczy po awarii jednego z jej centrów danych w Londynie, która zepsuła działalność setek klientów 18 sierpnia 2020 roku.
Gigant kolokacyjny doznał przerwy w dostawie prądu w swoim centrum danych LD8 IBX w Docklands, które jest domem dla jednego z 11 punktów obecności dwóch londyńskich sieci LAN (LANX) peeringowych.
Zgodnie z oświadczeniem na stronie LINX, szacuje się, że około 150 jego członków – w tym firmy hostingowe, dostawcy usług internetowych i firmy telekomunikacyjne – napotkało problemy z łącznością z powodu incydentu.
„Wszyscy członkowie LINX podłączeni do tych sieci LAN na LD8 utracą połączenie z LON1 i / lub LON2, gdy utracą zasilanie własnego sprzętu” – powiedział LINX w swoim oświadczeniu. „Jednocześnie straciliśmy zasilanie naszych własnych źródeł zasilania A i B, a następnie naszego sprzętu w LD8.
„Przewidujemy, że około 150 członków LINX będzie bezpośrednio dotkniętych tym incydentem. Ponadto członkowie LINX znajdujący się w innych obiektach mogli utracić lub osłabić połączenie z członkami, których bezpośrednio dotyczy ”.
Po wstępnym dochodzeniu firma Equinix potwierdziła, że awaria była spowodowana przez wadliwy system nieprzerwanego zasilania (UPS) na miejscu.
„Zespoły inżynierów Equinix zdiagnozowały pierwotną przyczynę jako wadliwy system UPS i przez cały dzień pracowały nad rozwiązaniem problemu” – powiedziała firma w oświadczeniu dla Computer Weekly.
„Wszystkie usługi zostały przywrócone. Ponieważ niezawodność naszych centrów danych jest naszym najwyższym priorytetem, Equinix przeprowadza dokładną analizę tego incydentu, aby zapobiec wszelkim przyszłym problemom. ”
Przyjmuje się, że problemy zaczęły się tuż po 4.30 w środę rano, a niektórzy z nich nadal zgłaszają się za pośrednictwem mediów społecznościowych do wczesnego wieczora.
Jednak sposób postępowania z awarią przez firmę spotkał się z krytyką w mediach społecznościowych, a wiele osób dotkniętych przestojem pytało, dlaczego zajęło firmie około siedmiu godzin, aby potwierdzić problem. Jeden powiedział:
Musiałem dziś rano znaleźć te informacje z innych źródeł, żeby wiedzieć, co się dzieje na ziemi. Aktualizacja za 8 godzin bez ETA, kiedy możemy znowu mieć łączność, nie jest wystarczająco dobra.
– Scott Fuller (@scottindeed)
18 sierpnia 2020