IBM buduje pamięć o pojemności 120 PB

31 sierpnia 2011 0 przez Marcin Kaczmarek

IBM zaprojektował pamięć masową o pojemności 120 PB (petabajtów), czyli 120 tys. terabajtów, wykorzystującą 200 tys. dysków Serial SCSI. Całość jest dostępna jako jeden dysk o ogromnej pojemności, pozwalającej zapisać bilion plików. Rozwiązanie ma posłużyć głównie do tworzenia matematycznych modeli klimatu na świecie i lepszego prognozowania pogody. Informacja jest podawana w kontekście huraganu Irene, który według dostępnych prognoz miał być znacznie bardziej niszczycielski, niż był w rzeczywistości.

Nowy klaster IBM oferuje wielokrotnie większą pojemność, niż dostępne do tej pory rozwiązania. Na przykład pamięć systemu Internet Archive, przechowująca zawartość internetu od 1996 roku, ma pojemność "zaledwie" 2 PB. IBM zdecydował się na wykorzystanie dysków SAS, a nie pojemniejszych SATA, ze względu na wysokie wymagania co do wydajności. Dyski SAS są podłączone do systemów obliczeniowych za pomocą światłowodów, których konstrukcji IBM nie ujawnił.

Rozwiązanie IBM ma wykorzystywać General Parallel File System, stosowany również we wcześniejszych maszynach IBM. To system plików, w którym poszczególne pliki są przechowywane na wielu dyskach jednocześnie. Efektem jest szybkość odczytu rzędu terabajtów na sekundę, a także nieprawdopodobna niezawodność, znacznie przekraczająca możliwości RAID. Dla przykładu, RAID 6 z podwójnymi kodami parzystości oferuje średni czas przechowywania danych 56 lat, GPFS może przechowywać dane aż przez milion lat bez ryzyka utraty danych!