Skazani na archiwum

Jeśli nie taśma, to co?

Emulacja taśm rozwiązuje problem szybkości wykonywania kopii zapasowych bez wprowadzania rewolucji - idzie więc z duchem oczekiwań klientów. Skoro jednak dane mają być archiwizowane na wiele lat, taśma wciąż może być przydatna - jako nośnik, który można wynieść z serwerowni i umieścić w bezpiecznym miejscu. Nie wszyscy są jednak zadowoleni z taśmy, nawet jeżeli cenią jej zalety. Wielu producentów prowadzi prace, mające na celu stworzenie nośnika wymiennego o dużej pojemności i niewielkim koszcie, a jednocześnie pozbawionego najważniejszych wad taśmy: długiego czasu ładowania do napędu (co najmniej kilkadziesiąt sekund), długiego czasu wyszukiwania danych na nośniku (kolejne kilkadziesiąt sekund), a także relatywnie niskiej odporności mechanicznej.

Przykładem przenośnego nośnika o dużej pojemności stworzonego z myślą o małych i średnich firmach są jednotalerzowe dyski twarde firmy iOmega. Interfejs USB 2.0 zapewnia dostęp do nośnika w ciągu kilku sekund i dostęp do danych liczony w milisekundach. Na razie firma oferuje dyski o pojemności 40 i 60 GB, ale wraz z pojawianiem się technologii zapisu pojemność będzie rosnąć.

Próbą przezwyciężenia długiego czasu ładowania taśm do napędów może być budowa bibliotek, w których taśmy zostają zastąpione dyskami twardymi z interfejsami SATA. Interfejs SATA ma tę zaletę, że pozwala wygodnie włączać i wyłączać dysk - nieaktywne urządzenie jest gotowe do pracy po maksymalnie 8 s od włączenia. Niepracujący dysk nie zużywa się, w związku z czym jego żywotność znacząco wzrasta. Nie bez znaczenia są tu także poprawa bilansu cieplnego w serwerowni i mniejsze zużycie energii.

Od wielu lat mówi się, że przyszłością tanich nośników wymiennych o dużej pojemności są rozwiązania optyczne, a dokładniej technologie hologramowe. Prace nad takimi nośnikami trwają od lat i całkiem prawdopodobne, że w 2005-2006 na rynek trafią nowe napędy holograficzne i nośniki o pojemnościach rzędu 100-200 GB z bardzo krótkimi czasami dostępu.

Tradycyjne technologie optyczne również nie stoją w miejscu. Brytyjski Plasmon już dziś oferuje biblioteki optyczne zawierające dyski MO 5,25" o pojemności 30 GB (niebieski laser, czas dostępu do nośnika rzędu 5 s, dostęp do danych - ok. 25 ms). Firma planuje wprowadzenie do sprzedaży nośników o pojemnościach 60 i 120 GB. Równolegle DVD Forum doszło do porozumienia w sprawie nowej generacji nośników optycznych wielokrotnego zapisu wysokiej gęstości (HD-DVD) pozwalających na zapis 20 GB danych na jednej stronie standardowej jednowarstwowej płyty o średnicy 12 cm.

Alternatywą dla taśm, dysków optycznych, a nawet dysków twardych mogą się wkrótce okazać... pamięci Flash. Wiele takich układów może być zintegrowanych w jednej obudowie. Przy zapewnieniu zapisu równoległego i wewnętrznego bufora ze zwykłej półprzewodnikowej pamięci SDRAM wydajność całości może być zaskakująca. Takie pomysły już dziś są realizowane w praktyce. Wymienne "dyski" Flash o pojemności 32 GB i transferze danych rzędu 7 MB/s przy zachowaniu standardowych wymiarów urządzeń 3,5" oferuje amerykańska firma Adtron. Zastosowanie najnowszych układów Flash (produkowane przez tandem Toshiba/Sandisk układy pamięciowe o pojemności 0,5 GB) zwiększy ich pojemność co najmniej dwukrotnie. Patrząc na skalę produkcji pamięci Flash i związany z nią systematyczny spadek cen, przyszłość takich rozwiązań rysuje się w jasnych barwach. Na obecnym etapie producenci deklarują trwałość zapisu na poziomie ok. 10 lat.

Kolejnym konkurentem - również dla pamięci typu Flash - jest rodząca się właśnie technologia Magnetic RAM (MRAM). To pamięć półprzewodnikowa podobna do SDRAM, jednak zachowująca zapisane w niej dane po odłączeniu zasilania. Oprócz szybkiego dostępu do nośnika i danych wszystkie technologie półprzewodnikowe oferują trwałość mechaniczną nośnika i relatywnie krótkie czasy dostępu do danych.

Porządek w archiwum

Problemem numer jeden osób odpowiedzialnych za archiwizację danych jest dziś nie nośnik, lecz oprogramowanie. Jaki bowiem pożytek z najszybszych bibliotek dyskowych albo rozwiązań taśmowych o najniższej cenie za 1 GB pojemności, skoro nikt nie jest w stanie powiedzieć, co jest na nich zgromadzone? Gdy taśm jest 10 czy 20, może ktoś to zapamięta, ale gdy jest ich 100 albo więcej - to raczej wątpliwe.

Z punktu widzenia przedsiębiorstwa jako całości wydatek na nieco szybszy czy nieco tańszy system archiwizacyjny jest sprawą drugorzędną. Jeżeli zakłada się, że przynajmniej niektóre z gromadzonych informacji są ważne, trzeba umieć odróżnić je od informacji bez znaczenia. Podobnie, jeżeli zapada decyzja o tym, by dane gromadzić na dużą skalę i przechowywać je dłuższy czas, trzeba mieć w ręku narzędzia do tego, by móc łatwo odnaleźć to, co nas interesuje. Inaczej archiwizacja nie ma sensu.

Firma przymierzająca się do wdrożenia rozwiązania archiwizacyjnego powinna w pierwszym rzędzie przekonać się, jakie informacje były gromadzone do tej pory, kto z nich korzystał, jak często i w jakim celu. Dopiero na tej podstawie można budować plany na przyszłość, konstruować reguły archiwizacji itd. Zanim zwrot z inwestycji w taki czy inny typ nośników będzie można uczciwie policzyć, najpierw trzeba zapanować nad pęczniejącymi w oczach zasobami danych: zindeksować je, nadać im wagi i priorytety, oznaczyć je datami, przypisać im reguły dostępu, określić zasady usuwania itd.

Katalogowanie i porządkowanie istniejących zasobów archiwalnych można zautomatyzować za pomocą oprogramowania. Rozwiązania indeksujące są wbudowane w pakiety dostarczane m.in. przez Veritas, Legato czy AppIQ. I choć pakiety te wykonują większość żmudnej pracy, ostateczny kształt systemu archiwizacji danych zależy od wypracowania spójnej koncepcji procesów i architektury.

Nie nośnik, lecz architektura

Zamiast roztrząsać dylemat taśma czy dysk, być może warto najpierw skupić się na architekturze rozwiązania archiwizacyjnego, by jak najlepiej odpowiadała ona konkretnym potrzebom firmy. Jest bardzo prawdopodobne, że w rozwiązaniu ostatecznie znajdzie się miejsce zarówno dla taśm, jak i dysków, a być może nawet zupełnie nowych nośników danych.


TOP 200