Brontobajtowe archiwa
- Computerworld,
- 11.10.1993
Duże instytucje, korzystające w sposób intensywny z komputeryzacji, stanęły przed problemem archiwizacji ogromnej liczby danych, przekraczających nierzadko kilku gigabajtowe porcje informacji dziennie.
Duże instytucje, korzystające w sposób intensywny z komputeryzacji, stanęły przed problemem archiwizacji ogromnej liczby danych, przekraczających nierzadko kilku gigabajtowe porcje informacji dziennie.
Gigabajt - 1 000 000 000 bajtów
Terabajt - 1 000 000 000 000 bajtów
Petabajt - 1 000 000 000 000 000 bajtów
Brontobajt - 1 000 000 000 000 000 000 bajtów
Przykładem firmy, która przetwarza biliard bajtów (czyli petabajty) może być amerykańska SAA (Social Security Administrations). Zainstalowanych jest w niej 14 mainframe'ów IBM, obsługujących 39 tys. terminali podłączonych w całym kraju i przetwarzających dziennie 22- 24 milionów transakcji. Każdego roku obciążenie tej instalacji wzrasta o 20%. W "pierwszej linii" systemu stosowane są pamięci typu DASP (Direct Acces Storage Devices) jak stacje dysków magnetycznych czy optycznych. Chodzi tu przede wszystkim o osiągnięcie średniego czasu odpowiedzi systemu pracującego w SAA, mniejszego od 5 s przez 95% czasu pracy. Do zastosowań jak backup czy archiwizowanie używa się tańszych i powolniejszych pamięci taśmowych.
Kolejny przykład to centrum komputerowe Goddard Space Flight Center z NASA (wykorzystujące superkomputer firmy Cray Research Inc.), w którym obecnie archiwizuje się 5 GB dziennie, zaś na koniec roku wielkość ta ma wzrosnąć do 20 GB dziennie. Informatycy zatrudnieni w centrum zakładają konieczność archiwizacji do 100 GB informacji dziennie. Oceny te są związane z rosnącą liczbą zapisywanych obrazów grafiki czy wideo.
W opisanych firmach wprowadza się hierarchiczne systemy magazynujące informację. Używają one różnych nośników do różnych aplikacji. Pamięci taśmowe są z reguły stosowane przy archiwizowaniu danych. Znanych jest kilka technik wykorzystujących w tym celu taśmę magnetyczną, przy czym są one powiązane często zautomatyzowanymi urządzeniami, wymieniającymi cartridge, kasety czy pojemniki z taśmą.
W zeszłym roku firma Ampex Systems Corp. rozpoczęła sprzedaż systemu DST 600, który stosuje w swej pracy 19 mm taśmę magnetyczną, zapis typu "helical" (stosowany do tej pory na kasetach wideo, "ukośny" zapis w poprzek taśmy) i zautomatyzowaną bibliotekę kaset. Rozwiązanie to pracuje bardzo efektywnie w porównaniu do działania swych poprzedników. Umożliwa przechowywanie na kasecie 60 razy więcej danych oraz zapewnia 60% wzrost szybkości (15 MB/s) przy przesyłaniu danych w stosunku do urządzeń typu 3480/3490.
IBM, zainteresowany otrzymanymi osiągnięciami rozpoczął współpracę z firmą Apex. W jej wyniku mają powstać szybkie urządzenia do archiwizacji typu on-line, stosujące w swej pracy zapis "helical". Pozwolą one na zapis terabajtowych danych dostępnych naukowcom czy inżynierom i przesyłanych z prędkościami ponad 10 MB/s.
Dla zastosowań zorientowanych transakcyjnie (bazy danych) IBM chce zastosować do celów archiwizacji danych mechanizmy kompresji danych i automatyzację wymiany taśm magnetycznych. Pozwoli to zwiększyć pojemność cartidge'ów i zwiększyć tempo transferu danych. W obecnie stosowanych kasetach wielkości te wynoszą 2,5 GB/cartridge i ok. 9 MB/s.
IBM prowadzi również prace nad użyciem do archiwizacji taśm optycznych, przy czym proponowane rozwiązania są jeszcze dość drogie.
Firma StorageTek, jeden z bardziej znanych producentów streamerów, obiecuje rychłe wejście na rynek z systemem, który stosując również zapis typu "helical" pozwoli na zapisanie na jednej kasecie 20 do 25 GB danych. Kasety mają być umieszczone w zautomatyzowanej bibliotece, która będzie obsługiwać pojemniki z taśmami o zapisie typu "helical", 18- lub 36- ścieżkowym. Te ostatnie, stosowane obecnie, zapewniają pojemność jednego cartridge'a zaledwie 400 i 800 MB.
Wspomniana na początku firma SAA stosuje w swej pracy zautomatyzowane roboty firmy StorageTek, eliminujące ręczną obsługę kaset z taśmami. Wykonują one 104 tys. wymian kaset dziennie. (FCW/wn)
Porównanie właściwości użytkowych kilku technik stosujących zapis taśmowy
Transfer danych dla 20 GB
Typ kasety 9 ścieżek 8 mm optyczna 3480 3490E 19 mm long tape helical
Liczba 140 4 10 100 25 1 kaset
Czas (min) 513 667 278 111 111 22 przesyłania danych (20 GB)
Całkowity 723 671 281 186 116 23 czas (min) przesyłania danych (20 GB) (z podłączeniem i przewinięciem)
Liczba jednostek potrzebnych do zapisu jednego TB (terabajta) danych
Typ kasety 9 ścieżek 3480 3490E optyczna 8 mm 19 mm long tape helical 25 GB 75 GB 165 GB
Liczba 6667 5000 1250 500 200 40 14 6 jednostek
Cena USD 122 tys 45 tys 28 tys 100 tys 5500 5400 4800 4200 (wg cen w USA)