Podcast: Czym są migawki? Czy mogą zastąpić kopię zapasową?


W tym podcaście wraz z Shawnem Meyersem, dyrektorem ds. technologii (CTO) w Tintri, przyglądamy się migawkom i ich roli w strategii ochrony danych.

Rozmawiamy o tym, jak definiujemy migawkipoziom infrastruktury, na którym są podejmowane, dlaczego migawki nie są kopiami zapasowymiwpływ szczegółowości migawki na wydajność odzyskiwania, docelowy punkt przywracania (RPO) i docelowy czas przywracania (RTO).

Meyers mówi także o ograniczeniach migawek, takich jak wykorzystanie w bazach danych, oraz o wpływie na wzrost ilości danych.

Antony Adshead: Czym są migawki oraz ich zalety i ograniczenia?

Shawn Meyers: Problem w przypadku migawek polega na tym, że musisz się martwić, na jakim poziomie je robisz.

Migawka to w zasadzie zbiór punktu danych z określonego momentu. Innymi słowy, mogę to zrobić na różnych poziomach, tj. systemie operacyjnym [operating system]maszyna wirtualna [virtual machine]na poziomie przechowywania.

Jest to kolekcja z określonego punktu w czasie, która pozwala mi cofnąć się w czasie lub przywrócić go do tego punktu w czasie.

Reklama

Zapewniam, że wyrażam się bardzo jasno: Migawka nie jest kopią zapasową. Znajdziesz ludzi, którzy używają migawek jako kopii zapasowych. Migawkę to coś, co możesz dodać do swojego zestawu narzędzi i z którego możesz odzyskać dane, ale zdecydowanie nie jest to kopia zapasowa, ponieważ kopia zapasowa umożliwia przewijanie do przodu i do tyłu w czasie, aby znaleźć określone ramy czasowe; migawka to konkretny, zdefiniowany moment w czasie.

Istnieją różne sposoby wykonywania migawek i zależy to od posiadanych technologii przechowywania. Najfajniejszą rzeczą, o której lubię rozmawiać, jest to, że będziesz ją mieć jednostka LUN [logical unit number] lub głośność migawkę, w której wszystko na tym jednym woluminie jest rejestrowane w tym samym czasie. Innym razem będzie to migawka dla maszyny wirtualnej lub dla obiektu, jeśli jest to mniejszy zbiór podzbiorów.

Im bardziej szczegółowa migawka, tym dłuższy jest okres odzyskiwania z punktu widzenia tego, czego dotyczy problem, w porównaniu z szerszą migawką, która stanowi szerszy proces ochrony.

W pamięci masowej często używamy migawek do replikacji, na przykład replikowania danych do innej witryny, więc robię migawkę i replikuję ją. Nadal mam tę migawkę, którą mogę przywrócić i odzyskać.

„Migawka to coś, co możesz dodać do swojego zestawu narzędzi. Można z nich odzyskać dane, ale na pewno nie jest to kopia zapasowa – kopia zapasowa umożliwia przewinięcie do przodu, cofnięcie w czasie, aby znaleźć konkretny przedział czasowy; migawka to konkretny, zdefiniowany moment w czasie”

Shawn Meyers, Tintri

Istnieją oczywiście ograniczenia. Większość swoje bazy danych będą w stanie zablokowanym, więc nie mogę przewijać do przodu ani do tyłu za pomocą dzienników transakcji.

Również wzrost danych. To jedna z najważniejszych rzeczy. Mam migawki, które w miarę wprowadzania zmian zwiększają ilość danych. Jeśli mam blok, w którym zapisano, i zrobię migawkę, napiszę do niego ponownie, ponownie zrobię kolejną migawkę, wszystkie dane zostaną zapisane.

Jest to jedna z największych rzeczy, jeśli chodzi o ograniczenia, ponieważ zwracamy uwagę na wzrost ilości danych pochodzących z migawek, a im bardziej szczegółowa staje się migawka, tym mniejszy jest wpływ na pamięć masową. Zatem im szersza migawka, tym większy wpływ w porównaniu z bardziej szczegółową, tym mniejszy wpływ.

Adshead: Jaka jest najlepsza praktyka dotycząca migawek i jak pasują one do kompleksowej strategii ochrony danych?

Meyersa: Migawki powinny być częścią każdej strategii ochrony danych. I oczywiście sprowadza się to do tego, że trzeba wrócić do deski kreślarskiej.

Wracamy do naszego RPO – celu w zakresie punktu odzyskiwania – i naszego RTO – celu w zakresie czasu powrotu do zdrowia. Siadamy i zastanawiamy się, jak nasze technologie współpracują z migawkami, aby sprostać tym potrzebom.

[We also have to take into account] dane przechowywane w innych lokalizacjach. Musimy się także martwić o wpływ na produkcję, ponieważ obecnie często używamy migawek do tworzenia kopii zapasowych.

Robimy więc migawkę, dołączam tę migawkę do systemu kopii zapasowych i tam wykonujemy kopie zapasowe. W ten sposób nie mam żadnego wpływu na wydajność mojego systemu produkcyjnego w przypadku tej kopii zapasowej.

To samo co replikacja. Robię migawkę i wykonuję replikację z tyłu, więc nie replikuję aktywnych danych, więc nie ma to na mnie wpływu w moim systemie produkcyjnym.

Jedną z najlepszych cech migawek jest to, że odciążam warstwę pamięci masowej od poziomu systemu operacyjnego, dzięki czemu nie ma to wpływu na produkcję.

Oczywiście, wiedząc, kiedy muszę odzyskać siły – tj. mówię o punkcie przywracania; ile danych mogę stracić w porównaniu z ilością danych, których potrzebuję i jak szybko potrzebuję ich z powrotem do trybu online. Zawsze opisuję to jako działanie jak pokrętło – kręcisz je tam, gdzie chcesz, a najfajniejsza część polega na tym, że kiedy kręcisz pokrętłem i uzyskujesz mniejsze RPO i RTO, moje koszty zwykle rosną.

Jeśli więc mogę obejść się bez mniejszej liczby procesów lub dłuższych RPO i RTO, moje koszty spadną. Jeśli wejdę w ułamek minuty lub ułamka sekundy, moje koszty wydają się rosnąć stratosferycznie i sprawiają, że wszystko jest droższe.

Wszystko sprowadza się do zaprojektowania strategii, ustalenia, ile masz pieniędzy, aby dowiedzieć się, co możesz zrobić. Albo wiesz, czego chcesz i ile to będzie kosztować. Trzeba chodzić tam i z powrotem i rozważać za i przeciw. Ponieważ tak jak wszystko inne, decyzją biznesową Twojej organizacji jest określenie, ile pieniędzy chcesz zainwestować w strategię dotyczącą danych.

W przeszłości przez długi czas pracowałem jako konsultant i współpracowałem z firmami, które utraciły centra danych, a ich pomysł i podejście do strategii ochrony danych różni się od tych, w których nigdy nie doszło do masowej utraty danych.

Zawsze będzie się czym martwić, a jeśli nigdy nie miałeś problemu z utratą danych, oznacza to, że miałeś szczęście; stanie się to w przyszłości, dlatego poświęć trochę czasu na strategię ochrony danych.

Dla mnie migawki to jedna z najważniejszych części tego procesu, ponieważ pozwala wiedzieć, jak to zrobię, gdzie będę przechowywać dane, jak często i jaki będzie proces odzyskiwania.

Jedną z największych zalet migawek jest czas regeneracji. Jeśli korzystam z kopii zapasowych, często muszę go ponownie uruchamiać, a nawodnienie zajmuje trochę czasu. Dzięki migawkom zazwyczaj mogę odzyskać ten obiekt, tę maszynę wirtualną, cokolwiek to jest, w ciągu kilku minut, jeśli nie sekund, i przywrócić system do stanu pierwotnego, ponownie obniżając procesy RTO.



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Aplikacja Threads zapewnia szybki dostęp do aparatu i opcję zapisywania wersji roboczych

Niedawno o tym pisaliśmy Wątkiplatforma mikroblogowa Meta, wdrażamy funkcję Trendy. Chociaż jest to dostępne tylko dla niektórych użytkowników w USA, użytkownicy na...

Concept przewiduje, że Apple może wprowadzić nowe funkcje do systemu VisionOS 2

Chociaż Vision Pro pojawił się w sklepach zaledwie kilka tygodni temu, Apple ogłosiło nowe urządzenie w czerwcu ubiegłego roku na WWDC – i...

Vice porzuca Vice.com i zwalnia setki pracowników

Po niemal trzech dekadach Wice przestanie publikować artykuły na swojej stronie internetowej. Wiceprezes ds. mediów, Bruce Dixon, powiedział dzisiaj, że firma zamierza...
Advertisment