Brontobajtowe archiwa

Duże instytucje, korzystające w sposób intensywny z komputeryzacji, stanęły przed problemem archiwizacji ogromnej liczby danych, przekraczających nierzadko kilku gigabajtowe porcje informacji dziennie.

Duże instytucje, korzystające w sposób intensywny z komputeryzacji, stanęły przed problemem archiwizacji ogromnej liczby danych, przekraczających nierzadko kilku gigabajtowe porcje informacji dziennie.

Gigabajt - 1 000 000 000 bajtów

Terabajt - 1 000 000 000 000 bajtów

Petabajt - 1 000 000 000 000 000 bajtów

Brontobajt - 1 000 000 000 000 000 000 bajtów

Przykładem firmy, która przetwarza biliard bajtów (czyli petabajty) może być amerykańska SAA (Social Security Administrations). Zainstalowanych jest w niej 14 mainframe'ów IBM, obsługujących 39 tys. terminali podłączonych w całym kraju i przetwarzających dziennie 22- 24 milionów transakcji. Każdego roku obciążenie tej instalacji wzrasta o 20%. W "pierwszej linii" systemu stosowane są pamięci typu DASP (Direct Acces Storage Devices) jak stacje dysków magnetycznych czy optycznych. Chodzi tu przede wszystkim o osiągnięcie średniego czasu odpowiedzi systemu pracującego w SAA, mniejszego od 5 s przez 95% czasu pracy. Do zastosowań jak backup czy archiwizowanie używa się tańszych i powolniejszych pamięci taśmowych.

Kolejny przykład to centrum komputerowe Goddard Space Flight Center z NASA (wykorzystujące superkomputer firmy Cray Research Inc.), w którym obecnie archiwizuje się 5 GB dziennie, zaś na koniec roku wielkość ta ma wzrosnąć do 20 GB dziennie. Informatycy zatrudnieni w centrum zakładają konieczność archiwizacji do 100 GB informacji dziennie. Oceny te są związane z rosnącą liczbą zapisywanych obrazów grafiki czy wideo.

W opisanych firmach wprowadza się hierarchiczne systemy magazynujące informację. Używają one różnych nośników do różnych aplikacji. Pamięci taśmowe są z reguły stosowane przy archiwizowaniu danych. Znanych jest kilka technik wykorzystujących w tym celu taśmę magnetyczną, przy czym są one powiązane często zautomatyzowanymi urządzeniami, wymieniającymi cartridge, kasety czy pojemniki z taśmą.

W zeszłym roku firma Ampex Systems Corp. rozpoczęła sprzedaż systemu DST 600, który stosuje w swej pracy 19 mm taśmę magnetyczną, zapis typu "helical" (stosowany do tej pory na kasetach wideo, "ukośny" zapis w poprzek taśmy) i zautomatyzowaną bibliotekę kaset. Rozwiązanie to pracuje bardzo efektywnie w porównaniu do działania swych poprzedników. Umożliwa przechowywanie na kasecie 60 razy więcej danych oraz zapewnia 60% wzrost szybkości (15 MB/s) przy przesyłaniu danych w stosunku do urządzeń typu 3480/3490.

IBM, zainteresowany otrzymanymi osiągnięciami rozpoczął współpracę z firmą Apex. W jej wyniku mają powstać szybkie urządzenia do archiwizacji typu on-line, stosujące w swej pracy zapis "helical". Pozwolą one na zapis terabajtowych danych dostępnych naukowcom czy inżynierom i przesyłanych z prędkościami ponad 10 MB/s.

Dla zastosowań zorientowanych transakcyjnie (bazy danych) IBM chce zastosować do celów archiwizacji danych mechanizmy kompresji danych i automatyzację wymiany taśm magnetycznych. Pozwoli to zwiększyć pojemność cartidge'ów i zwiększyć tempo transferu danych. W obecnie stosowanych kasetach wielkości te wynoszą 2,5 GB/cartridge i ok. 9 MB/s.

IBM prowadzi również prace nad użyciem do archiwizacji taśm optycznych, przy czym proponowane rozwiązania są jeszcze dość drogie.

Firma StorageTek, jeden z bardziej znanych producentów streamerów, obiecuje rychłe wejście na rynek z systemem, który stosując również zapis typu "helical" pozwoli na zapisanie na jednej kasecie 20 do 25 GB danych. Kasety mają być umieszczone w zautomatyzowanej bibliotece, która będzie obsługiwać pojemniki z taśmami o zapisie typu "helical", 18- lub 36- ścieżkowym. Te ostatnie, stosowane obecnie, zapewniają pojemność jednego cartridge'a zaledwie 400 i 800 MB.

Wspomniana na początku firma SAA stosuje w swej pracy zautomatyzowane roboty firmy StorageTek, eliminujące ręczną obsługę kaset z taśmami. Wykonują one 104 tys. wymian kaset dziennie. (FCW/wn)

Porównanie właściwości użytkowych kilku technik stosujących zapis taśmowy

Transfer danych dla 20 GB

Typ kasety 9 ścieżek 8 mm optyczna 3480 3490E 19 mm long tape helical

Liczba 140 4 10 100 25 1 kaset

Czas (min) 513 667 278 111 111 22 przesyłania danych (20 GB)

Całkowity 723 671 281 186 116 23 czas (min) przesyłania danych (20 GB) (z podłączeniem i przewinięciem)

Liczba jednostek potrzebnych do zapisu jednego TB (terabajta) danych

Typ kasety 9 ścieżek 3480 3490E optyczna 8 mm 19 mm long tape helical 25 GB 75 GB 165 GB

Liczba 6667 5000 1250 500 200 40 14 6 jednostek

Cena USD 122 tys 45 tys 28 tys 100 tys 5500 5400 4800 4200 (wg cen w USA)

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200