Udostępnić dane

Zarządzanie zasobami pamięciowymi w sieci istniało od tak dawna, jak długo istnieje sieć. Nie jest ono tak efektywne jak realizują je duże komputery, ale idee tam wypracowane znajdują swe odzwierciedlenie w produktach sieciowych. Nadal jednak nie ma dobrego zintegrowanego systemu zarządzania wszystkimi zasobami pamięciowymi sieci lokalnej - produkty zajmują się poszczególnymi zagadnieniami.

Zarządzanie zasobami pamięciowymi w sieci istniało od tak dawna, jak długo istnieje sieć. Nie jest ono tak efektywne jak realizują je duże komputery, ale idee tam wypracowane znajdują swe odzwierciedlenie w produktach sieciowych. Nadal jednak nie ma dobrego zintegrowanego systemu zarządzania wszystkimi zasobami pamięciowymi sieci lokalnej - produkty zajmują się poszczególnymi zagadnieniami.

W swej najwcześniejszej i najbardziej podstawowej postaci, zarządzanie zasobami pamięciowymi sprowadza się do wykonywania archiwalnych kopii danych z jednego PC na jakiś nośnik zapasowy. Wyższy poziom polega na wykonywaniu tej operacji dla PC połączonych w sieci lokalnej, przy czym program archiwizacji działa na serwerze sieciowym.

Zupełnie inną sprawą jest optymalne udostępnianie użytkownikom danych, bez nadmiernego zwiększania pojemności dysków serwera i stacji PC. Systemy takie znane są pod nazwą "hierarchicznych systemów pamięciowych". Ich działanie polega na tym, że specjalny program śledzi zapotrzebowanie stacji roboczych na określone pliki i udostępnia je, przenosząc je na dyski stacji roboczej.

Z punktu widzenia administratora sieci potrzebny jest jeden system zajmujący się tymi dwiema sprawami w sposób możliwie mało absorbujący dla użytkowników i obsługi. Teraz przyjrzyjmy się bliżej jak można sobie radzić z problemami zarządzania zasobami pamięciowymi.

Najprostsze rozwiązanie problemów z dostępem do plików polega na dokupieniu odpowiedniej liczby dysków w serwerze i stacjach, napędów taśmy magnetycznej lub dysków magnetooptycznych, automatyzowanych zmieniaczy (bibliotek) taśm, dysków magnetooptycznych albo płyt CD jednokrotnego zapisu.

Najlepsza metoda przyspieszenia dostępu do plików (z ewentualnym uzyskaniem automatycznie kopii zapasowej) polega na zakupieniu zestawu dyskowego RAID w odpowiedniej konfiguracji.

Automatyczne zmieniacze taśm lub dysków optycznych zapewniają możliwość przenoszenia danych na nośnik zapasowy i dostęp do niego bez potrzeby interwencji operatora.

Archiwizacja danych

Pakiet programowy archiwizacji danych umieszcza pliki na taśmie lub dysku optycznym dla bezpieczeństwa, w celu ich zmagazynowania. Największy problem przy zakupie takiego systemu, to określenie jak dobrze taki system archiwizacji zapamiętuje informacje o miejscu składowania poszczególnych plików.

Weźmy prosty przykład archiwizowania 100 tys. plików. Czy program wie dokładnie, w którym pokoju i na której taśmie znajduje się każdy plik? Właściwie to potrzebna jest baza danych o plikach, pokazująca aktualne położenie pliku w każdym momencie w ciągu roku. Jeżeli na dodatek przechowujemy różne wersje plików o tych samych nazwach (co jest rzeczą nagminną w przypadku plików baz danych, informacji księgowych, handlowych, zamówień itp.), to okaże się, że baza danych będzie musiała zawierać informacje o milionach kopii plików i ich wersjach!

Większość współczesnych systemów archiwizacji, zarówno dla sieci Novell jak i Unixa, radzi sobie dobrze ze wspomnianymi problemami. Niektórzy producenci oferują systemy działające dobrze w sieciach niejednorodnych NetWare/Unix.

Produkty do archiwizacji danych różnych producentów odróżniają się następującymi cechami:

- Do jakiego systemu operacyjnego się nadają? Coraz częściej działają one jako programy Windows w sieciach Novell.

- Ile urządzeń do archiwizacji obsługują? Czasem tylko jeden napęd taśm lub dysków magnetooptycznych, czasem wiele a inne nawet automatyczny zmieniacz (bibliotekę taśm).

- Miejscem dołączenia urządzeń do archiwizacji: serwer lub stacja robocza w sieci. Jeżeli system działa na serwerze, to zwykle zapewnia większą wydajność archiwizacji, gdyż nie korzysta z sieci do przesyłania plików. Takie systemy nie radzą sobie dobrze z sieciami zawierającymi wiele serwerów. Istnieją rozwiązania działające na serwerze, obsługujące także inne serwery (Intel).

- Szybkością tworzenia bazy danych o historii backupu. Zwykle trwa to dość długo, czasem nawet dłużej niż sam proces archiwizowania.

Hierarchiczne zarządzanie zasobami

Hierarchiczne zarządzanie zasobami pamięciowymi (Hierarchical Storage Management - HSM) polega na automatycznym przenoszeniu (migracji) plików z głównego medium pamięciowego na media wtórne o większym czasie dostępu, ale za to tańsze w eksploatacji i zakupie. Z punktu widzenia użytkownika HSM tworzy wrażenie, że rozmiar zasobów pamięciowych w sieci jest nieograniczony, co pozwala mu nie martwić się o brak miejsca na dysku lokalnym lub sieciowym. Korzystając z HSM nigdy nie otrzymamy komunikatu DISK FULL. Zwykle pliki, które zostały przeniesione na nośniki wtórne zostawiają na nośniku zasadniczym etykietkę, pozwalającą na przywołanie ich powtórnie na nośnik główny.

Zagadnienia hierarchicznego zarządzania zasobami pamięciowymi zostały w zadowalający sposób rozwiązane dla serwerów unixowych już kilka lat temu. Gorzej jest z obsługą HSM w sieciach NetWare. Firma Novell wbudowała pewne rozszerzenia do zarządzania zasobami pamięciowymi w sieciowy system operacyjny NetWare 4 w postaci podsystemu Storage Management System (SMS). Producenci sprzętu pamięciowego korzystają z tych właściwości w celu dostarczania rozwiązań HSM dla sieci Novell. Takie rozwiązania proponują np. firmy Cheyenne, Avail i Legato. Jest to jednak na tyle nowa technologia, że stoi przed nią wiele nie rozwiązanych problemów.

Kiedy migrować?

Istnieje spór co do tego, jakie powinny być zasady przenoszenia plików z nośnika głównego na nośnik zapasowy, o mniejszych kosztach, ale o większym czasie dostępu. Współczesne systemy HSM pozwalają administratorowi sieci na określenie kryteriów migracji. Zwykle przyjmuje się, że plik nie używany przez 30 dni powinien być przeniesiony na nośnik zapasowy. Jeżeli korzystamy z wielopoziomowego systemu HSM, podobne kryteria stosuje się przy przenoszeniu pliku na niższy poziom, a w końcu przenosi się go na taśmy archiwalne.

Takie kryterium migracji jest zadowalające jedynie w przypadku systemów operacyjnych, które zostawiają ślad użycia pliku na dysku. (Takich możliwości nie daje np. DOS, w którym przeczytanie pliku tekstowego nie zostawia śladu w postaci zmienionych atrybutów pliku.)

Jeżeli system nie daje takich możliwości, administrator powinien móc określić inne kryteria (np. migracji nie podlegają pliki w katalogach systemowych, pliki wykonywalne itp.).

Co z bazami danych?

System hierarchicznego zarządzania zasobami pamięciowymi nie zastępuje dobrego systemu archiwowania danych (backupu), gdyż nie taki jest cel. HSM może przenieść dane z dysków sieciowych na taśmy czy dyski magnetooptyczne, ale operuje on zwykle jedynie na wszystkich plikach danych. Największy zaś problem przedstawiają aktywne bazy danych o dużych rozmiarach. Im większa jej pojemność, tym większy kłopot z migracją. Ponadto, żaden z systemów HSM dostępnych na rynku nie ma możliwości migrowania jedynie nie używanej części bazy: albo wszystko albo nic. Takie podejście nie jest zadowalające dla nikogo.

Trudny problem pojawia się także w razie konieczności przeniesienia na dysk główny plików o takim rozmiarze, że nie mieszczą się na nim. Proponowane rozwiązanie polega na zwolnieniu na dysku miejsca przez przeniesienie na nośnik zapasowy plików, które jeszcze nie kwalifikują się do migracji, ale są takimi kandydatami w najbliższej przyszłości i przeniesieniu potrzebnych plików na zwolnione w ten sposób miejsce.

Problemy

Każdy, kto rozpoczął zadanie kontrolowania zasobów pamięciowych w sieci lokalnej przyzna, że jest to jedno z najtrudniejszych zagadnień, jakiego podjął się w swej karierze informatycznej.

Najprostsze pytania. Ile masz serwerów w sieci? Jak migrować dane? Na jeden system HSM czy na kilka? Ile ich potrzeba, aby w całej sieci otrzymać skutecznie działający system migracji? Ile różnych technologii taśm do backupu jest używanych? Czy przewidywany system HSM obsługuje wszystkie te napędy taśmowe czy tylko niektóre?

Dużo trudniejszy problem sprowadza się do opracowania długofalowej strategii zarządzania zasobami pamięciowymi. Większość sieci LAN przyrastała lawinowo, sieci w poszczególnych departamentach i wydziałach nie mają związku z sieciami w innych. Teraz zaś okazało się, że w tych sieciach zgromadzono dane ważne do działania całej firmy. Jak zapewnić im dostateczne bezpieczeństwo i szybki dostęp.

Wiele firm uważa, że jedynie scentralizowany system ochrony, bezpieczeństwa, archiwizacji i migracji zapewni im osiągnięcie celów strategicznych firmy. Należy tu jeszcze wspomnieć o tym, że system zdecentralizowany wymaga ogromnych nakładów pracy. Trzeba przecież przejść do każdego zestawu do backupu/migracji, upewnić się czy właściwe nośniki są dostępne, czy kopie archiwalne i migracyjne są dobrze zinwetaryzowane oraz zabezpieczone. Ocenia się, że do obsługi systemu migracji potrzebna jest jedna osoba na kilka serwerów i ok. 50 PC.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200