Zapasowe centrum danych uchroni Twoje usługi przed najpoważniejszymi awariami

Przedsiębiorstwa coraz częściej rezygnują z utrzymywania własnych centrów danych, a zamiast tego przenoszą swoje aplikacje i systemy do chmury publicznej lub prywatnej – do zewnętrznych, profesjonalnych data center. Niektórym wydaje się, że nowoczesna serwerownia wyposażona w najlepsze systemy bezpieczeństwa to gwarancja nieprzerwanej dostępności usługi. To błąd. Są – co prawda rzadkie – sytuacje, w których cała serwerownia może ulec awarii lub zostać odcięta od internetu. Najczęściej powodują je katastrofy naturalne czy nawet zamach terrorystyczny – niedawno o mało do takiego nie doszło na terenie USA. Dobra wiadomość jest taka, że można zabezpieczyć się i przed takimi wydarzeniami. Warto skorzystać z usług odpowiedniego partnera, takiego jak np. T-Mobile, który oferuje swoim klientom georedundancję, czyli możliwość udostępniania usług z kilku centrów danych, zlokalizowanych w różnych częściach miasta, jak również w innym regionie. Wtedy nawet unicestwienie całego data center nie spowoduje przerwy w działaniu usługi czy aplikacji.

Materiał partnerski

Georedundancja ochroni Twoje zasoby

Wspomniana georedundancja polega na zreplikowaniu infrastruktury w geograficznie innej lokalizacji. Lokalizacje powinny być oddalone od siebie przynajmniej o kilka-kilkanaście kilometrów, a jeszcze bezpieczniej, gdy znajdują się w innym mieście. Aby proces replikacji danych między dwiema (lub więcej) lokalizacjami był optymalny, niezbędne jest ich połączenie sieciowe i sprawna, szerokopasmowa transmisja danych.

Tutaj dużą przewagę nad tradycyjnymi operatorami centrów danych mają operatorzy telekomunikacyjni, ponieważ są oni właścicielami rozbudowanej infrastruktury sieciowej pokrywającej bardzo duże obszary geograficzne – państwo lub nawet kontynent. Mają oni także nowoczesne centra przetwarzania danych, które wykorzystują nie tylko na swoje potrzeby, ale część zasobów udostępniają też zewnętrznym klientom biznesowym. T-Mobile jest operatorem sieci obiektów kolokacyjnych w kraju, w tym pięciu komercyjnych centrów danych dla usług kolokacji, hostingu serwerów i cloud computing. W najbliższym czasie operator planuje otworzyć kolejne, supernowoczesne Data Center na północy Warszawy. Centra te połączone są ze sobą łączami światłowodowymi o potężnej przepustowości, co oznacza możliwość praktycznie natychmiastowej replikacji danych między tymi lokalizacjami.

To idealny przykład georedundancji – centra są na tyle blisko siebie, że zapewniają świetną łączność, a jednocześnie na tyle daleko, że gdyby wydarzyła się jakakolwiek z opisanych wyżej katastrof, to dotknie ona co najwyżej jedno z tych centrów, więc drugie może natychmiast przejąć rolę tego uszkodzonego.

Active-Active niemal jak RAID 1 w serwerze

Klient konfigurujący swoją usługę georedundancji może wybrać jedną z kilku dostępnych opcji. Najprostszą i niezbędną jest backup danych. Dobre praktyki uczą, że kopie zapasowe powinniśmy realizować w modelu „3-2-1” – czyli 3 kopie danych, zrealizowane na co najmniej 2 różnych nośnikach, w tym 1 kopia powinna się znaleźć w zdalnej lokalizacji (poza siedzibą firmy).

Przedsiębiorstwo może zatem utrzymywać własne centrum danych (chmurę prywatną), a usługę redundancji geograficznej wykupić na przykład u T-Mobile jedynie na potrzebę backupu w zdalnej lokalizacji. W tej sytuacji kopia zapasowa będzie realizowana w trybie ciągłym, ale aplikacje serwowane będą z własnego data center klienta. Na wypadek uszkodzenia centrum danych (na przykład w sytuacji ataku typu ransomware) można po prostu odtworzyć dane z lokalizacji zewnętrznej. W tej sytuacji nastąpi przerwa w dostępie do usługi, ale jej odtworzenie to kwestia przeciętnie kilku godzin. Jeśli zaistnieje potrzeba odbudowy własnego centrum danych (np. gdy dotychczasowe uległo uszkodzeniu), na czas budowy można wynająć serwerownię u zewnętrznego operatora.

Dużo lepszym rozwiązaniem jest zaprojektowanie architektury wirtualnej, świadczącej usługi lub aplikacje w oparciu o rozwiązanie MetroCluster. Jest to rozwiązanie bazujące na macierzach dyskowych, które fizycznie znajdują się w minimum dwóch ośrodkach data center, jednakże dla infrastruktury wirtualnej widoczne są jako jedna, logiczna macierz dyskowa. Jaka jest najważniejsza zaleta tego rozwiązania? Dane są replikowane synchronicznie pomiędzy ośrodkami data center, czyli w drugim data center pojawiają się natychmiastowo. W tej sytuacji każde z data center może w razie potrzeby serwować dane dla maszyn wirtualnych, uniezależniając się od awarii jednego z data center czy macierzy dyskowej w danym data center.

Usługa MetroCluster może być oferowana w kilku opcjach. Pierwszą jest tzw. Active-Standby. Usługi storage na potrzeby maszyn wirtualnych serwowane są tylko z głównego centrum danych, które na bieżąco replikowane jest do zapasowego centrum w innej lokalizacji. W przypadku awarii macierzy dyskowej podstawowego data center, replika danych w drugim ośrodku przejmuje jego rolę. Przełączenie usługi trwa przeciętnie od kilkudziesięciu sekund do maksymalnie kilku minut. Klient może wykupić umowę SLA (Service Level Agreement) na poziomie 99,999%, co oznacza, że otrzymuje gwarancję niedostępności swojej usługi na poziomie maksymalnie około 300 sekund… w skali całego roku.

Druga opcja to Active-Active. W tej wersji dane z głównego centrum danych nie tylko są replikowane do zapasowego centrum w innej lokalizacji, ale usługa serwowana jest użytkownikom jednocześnie z obu centrów. W tej sytuacji nawet nie powinniśmy mówić o „głównym centrum” i „zapasowym” – oba są tak sak samo ważne. Active-Active możemy sobie wyobrazić jak macierz RAID 1 w serwerach, gdy identyczne kopie danych są przechowywane na dwóch dyskach twardych (lub ich wielokrotności). W przypadku awarii jednego dysku nie tracimy nawet na moment dostępu do danych. W tym wypadku wymagane jest, aby krytyczne aplikacje były uruchomione w obu ośrodkach (na maszynach wirtualnych lub serwerach dedykowanych), a ruch sieciowy od strony użytkownika końcowego był balansowany na oba ośrodki data center, działające w trybie Active-Active. Dzięki temu potencjalna awaria jest całkowicie niezauważalna dla użytkownika danej aplikacji czy systemu.

Firmy mogą wybrać jeszcze opcję Active-DRC (Disaster Recovery Center). W tej sytuacji podstawowe centrum danych zlokalizowane jest w siedzibie klienta i na bieżąco replikowane do infrastruktury zewnętrznego dostawcy. Na wypadek awarii własnego centrum danych, usługa przełączana jest na centrum zapasowe.

Dobry Disaster Recovery Plan uchroni firmę przed upadkiem

Planując dostępność usług informatycznych w firmie powinniśmy bardzo dobrze przemyśleć plan na wypadek katastrofy. Może to być zarówno fizyczne uszkodzenie pojedynczych serwerów lub całego centrum danych, ale także ataki cyberprzestępców, szczególnie typu ransomware, tak bardzo popularne w ostatnich miesiącach. Wyobraźmy sobie sytuację, gdy wszystkie nasze firmowe dane po prostu znikają – ulegają uszkodzeniu lub zaszyfrowaniu, w tym utworzony lokalnie backup. Co to oznacza dla naszej organizacji?

Przygotowując plan Disaster Recovery powinniśmy brać pod uwagę kilka czynników: czy nasza usługa wymaga ciągłej dostępności, czy może dopuszczamy kilka minut, a może kilka godzin przerwy? Czy ewentualne obniżenie wydajności usługi ma kluczowe znaczenie, czy niekoniecznie? Czy zależy nam na replikacji naszego własnego centrum danych, a może w ogóle go nie potrzebujemy i możemy wykorzystać centra operatorów zewnętrznych?

Na pewno jednak warto rozważyć zakup usługi chmurowej zbudowanej z wykorzystaniem georedundancji, czyli więcej niż jednego centrum danych. Zyskujemy dzięki temu bezpieczeństwo, od którego może zależeć być lub nie być całej naszej firmy.

Artykuł powstał we współpracy z T-Mobile

0 0 votes
Article Rating
Powiadomienia
Powiadom o
0 komentarzy
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x