Tania archiwizacja w chmurze dzięki OVHcloud, IBM i Atempo

OVHcloud nawiązało współpracę z firmami IBM i Atempo, aby opracować nową ofertę usług Storage-as-a-Service. Rozwiązanie będzie oparte na nośnikach taśmowych IBM i oprogramowaniu Atempo, hostowanym i obsługiwanym przez OVHcloud.

Połączenie wiedzy i technologii oferowane przez te trzy firmy pozwoliło na opracowanie taniego sposobu na bezpiecznie przechowywanie krytycznych, ale „zimnych danych” przez długi czas. Zastosowane nośniki taśmowe zapewniają najniższy możliwy koszt archiwizacji w przeliczeniu na terabajt. Dodatkowo, jeśli kasety będą przechowywane prawidłowo, da się je odczytać nawet za 30 lat. Jest jeszcze jedna, nie do końca oczywista korzyść. Dyski, które dziś stosuje się do realizacji tych zadań w chmurze, zużywają sumarycznie dużo więcej prądu niż taśmy.

OVHcloud IBM Atempo
IBM TS4500

Oferta przechowywania danych w chmurze będzie skierowana do publicznych i prywatnych organizacji europejskich. Za pamięć masową posłużą odpowiedzialne urządzenia IBM 3592 Enterprise Tape, kontrolowane przez platformę technologiczną Atempo – Mira. OVHcloud, poza hostingiem, wzbogaci ofertę o technologię erasure coding 9+3, umożliwiającą inteligentną replikację i podział danych użytkowników.

Udało nam się porozmawiać z przedstawicielami IBM i OVHcloud, którzy podzielili się bardziej szczegółowymi informacjami na temat nowej oferty:

Czy dane na taśmach będą szyfrowane? Jeśli tak, to jakim algorytmem i kto będzie miał klucz?

Miroslaw Klaba, co-founder & VP of engineering, OVHcloud
Tak. Umieszczenie danych na taśmie podlega procesowi, którego integralną częścią jest szyfrowanie danych.

Julien Demeulenaere, Tape & DS8k Brand Manager, IBM
Technologia IBM Tape wspiera szyfrowanie za pomocą przeznaczonego do tego układu w napędzie taśmowym. Ta opcja jest uruchamiana w zależności od wymagań klienta. Klucz jest przechowywany przez oprogramowanie „key manager”.

Dane na taśmach są oczywiście kompresowane. Jak rozwiązany został problem czasu zapisu i odczytu oraz gdzie w infrastrukturze będzie odbywała się kompresja?

M.K.
Kompresja odbywa się na wyższym poziomie infrastruktury. Należy jednak uwzględnić fakt, że zapisywane dane często są już skompresowane i zaszyfrowane, choćby jako backup.

J.D.
Już od kilku generacji nie występuje problem czasu odczytu i zapisu podczas kompresji danych z wykorzystaniem technologii IBM Tape. Proces odbywa się wewnątrz napędu, ponieważ posiada on specjalizwoany układ do wykonywania kompresji i dekompresji w locie, co nie wpływa na wydajność odczytu i zapisu.

OVHcloud IBM Atempo
Julien Demeulenaere, IBM

Magazyny z taśmami mają określoną pojemność. Gdzie przechowujecie zapisane taśmy?

M.K.
W miarę przyrastania ilości danych planujemy wdrażanie nowych bibliotek.

J.D.
Wszystkie taśmy przechowujemy na bibliotekach IBM TS4500, bez względu na częstotliwość dostępu. Dzięki temu zautomatyzowane ramię robotyczne zyska dostęp do każdej taśmy w systemie. Pojedyncza biblioteka TS4500 może pomieścić do 17 550 kaset 3592 Tape. Globalne rozwiązanie można zainstalować w kilku bibliotekach.

Ekologia ma znaczenie

Mniejsze zużycie prądu jest oczywiste, ale jak duża jest to różnica w porównaniu z HDD?

M.K.
W przeliczeniu na szafę rackową możemy potrzebować do 10 razy mniej mocy. Jednak to nie są te same współczynniki wykorzystania i wydajności, by je zestawiać z HDD.

J.D.
Po pierwsze, kaseta Tape nie zużywa w ogóle prądu, bo jest to urządzenie pasywne (w przeciwieństwie do dysku HDD czy SSD). Stąd większość oszczędności wynika właśnie z tego faktu. Napęd taśmowy, gdy nie pracuje, potrzebuje 38 W, a 18-ramkowy TS4500 – 276 W. Ponieważ TS4500 może obsłużyć do 128 dysków, całkowite zużycie w stanie uśpienia wyniesie około 5140 W.

OVHcloud IBM Atempo
Miroslaw Klaba, OVHcloud

Co po upływie zakładanego czasu archiwizacji? Jak usuwacie dane z taśm?

M.K.
Taśmy ponownie wykorzystujemy do przechowywania nowych porcji danych.

J.D.
Dane pozostawimy na taśmach tak długo, jak użytkownicy będą korzystać z usługi OVHcloud. Usuniemy je dopiero wtedy, gdy zmienią zdanie. Jeżeli będziemy musieli przechowywać je dłużej niż przewiduje technologia, automatycznie przeniesiemy je na nowe kasety następnych generacji.

Jaki jest średni czas odszukania konkretnego pliku? W przypadku dysków twardych to kwestia milisekund, a gdy mówimy o magazynie opartym na taśmach?

M.K.
Docelowo maksymalny czas wyszukiwania ma się zamknąć w kilku minutach.

J.D.
Średni czas odnalezienia pojedynczego pliku na taśmie wynosi 45 sekund. Może on wydawać się zbyt długi dla danych aktywnych lub gorących, niemniej jest całkowicie akceptowalny w przypadku danych zimnych i archiwizowanych.

Żródło: Informacja prasowa

Dodaj komentarz