Sieci pamięci masowych (III)

W dużych przedsiębiorstwach cierpiących z powodu zalewu danymi najczęściej planuje się zwiększenie obecnie posiadanych zasobów: dyskowych, taśmowych, optycznych, personalnych. Takie działanie jest najprostsze organizacyjnie, niemniej jednak jest najbardziej kosztowne. Wtedy gdy gigabajty danych urastają do terabajtów, obciążenie finansowe związane z zakupem dodatkowych dysków twardych, dodatkowych systemów taśmowych i wreszcie koszty związane z wyszkoleniem dodatkowego personelu stają się przeważającą częścią budżetu IT przedsiębiorstwa. Czy jest na to rada?

W dużych przedsiębiorstwach cierpiących z powodu zalewu danymi najczęściej planuje się zwiększenie obecnie posiadanych zasobów: dyskowych, taśmowych, optycznych, personalnych. Takie działanie jest najprostsze organizacyjnie, niemniej jednak jest najbardziej kosztowne. Wtedy gdy gigabajty danych urastają do terabajtów, obciążenie finansowe związane z zakupem dodatkowych dysków twardych, dodatkowych systemów taśmowych i wreszcie koszty związane z wyszkoleniem dodatkowego personelu stają się przeważającą częścią budżetu IT przedsiębiorstwa. Czy jest na to rada?

Sieć jednoserwerowa

Sieć jednoserwerowa

Oczywiście nie ma rozwiązań idealnych, to jednak koncepcja SAN (Storage Area Network) daje nowy sposób spojrzenia na problemy pojemności i wydajności, a przede wszystkim planowania systemów pamięci masowych w przedsiębiorstwie.

Inżynierowie i administratorzy, którzy rozważają rekonfigurację swoich zasobów dyskowych i taśmowych opartą na rozwiązaniu SAN, zwykle traktują sieć SAN jako alternatywę i uzupełnienie sieci LAN, która jest:

- niezwykle szybka (np. 100 MB/s w technologii FC)

- łatwo zarządzalna z jednego serwera

- łatwo skalowalna i perspektywiczna na kilka lat

- oszczędna ze względu na centralizację i współdzielenie zasobów

- oszczędna ze względu na minimalizację personelu.

Jest to prawda, faktycznie te zalety rekompensują z nawiązką koszt i wysiłek organizacyjny związany z odejściem od rozproszonych centrów składowania danych (Server Attached Storage).

Niemniej jednak podejście do koncepcji SAN jako usprawnienia sieci LAN do przesyłania danych gubi jedną, bardzo istotną cechę tej technologii, a mianowicie możliwość podłączenia wielu serwerów do wspólnej sieci SAN.

Skąd to przeoczenie bardzo ciekawej opcji od dawna oferowanej przez technologię FC dla sieci SAN? Otóż obecnie instalowane konfiguracje SAN rzadko korzystają z możliwości podłączania kilku serwerów do wspólnej magistrali SAN ze względu na bezpieczeństwo całej konfiguracji. Otóż serwery podłączone do sieci SAN traktują zasoby danych jako własne (jest to zaszyte w koncepcji systemów operacyjnych) i w ten sposób istnieje ryzyko, że każdy z nich może wpływać na dane współdzielone z innymi serwerami. Dopóki zapisy na współdzielone urządzenia nie są zarządzane nadrzędnym oprogramowaniem kontrolującym dostępy, istnieje poważne ryzyko utraty danych.

Problem w tym, że jak na razie dostępność takiego oprogramowania zarządzającego jest na rynku ograniczona. Jednak istnieją pewne mechanizmy, które umożliwiają współdzielenie danych między serwerami, z gwarancją bezpieczeństwa. Jak wiadomo, dane mogą być dzielone na poziomie pliku, wolumenu albo zasobu (np. dyskowego), dodajmy, że mamy tu na myśli współdzielenie danych na poziomie pliku, a nie współdzielenie urządzenia, w którym dyski czy taśmy są dedykowane do poszczególnych serwerów.

Prześledźmy problemy, które pojawiają się we współdzielonej konfiguracji SAN, aby potem zdefiniować sposoby ich rozwiązania lub obejścia:

- Montowanie zasobów: w trakcie procesu bootowania serwer odnajduje urządzenia i stara się je oznaczyć jako własne, często podejmując próbę formatowania w przypadkach wątpliwych. W ten sposób zasób raz oznaczony i sformatowany przez jeden serwer może zostać przeformatowany ponownie przez kolejny uruchamiany serwer. Szczególnie problem ten dotyczy Windows NT, które bardzo agresywnie zawłaszczają wszystkie widziane zasoby, nie zważając, czy są one już zajęte przez inne systemy operacyjne w sieci SAN.

- Logi systemowe i transakcyjne stanowią zapis obecnie przeprowadzanych operacji. Jeśli jeden z podłączonych serwerów przerwie pracę (brak prądu), może podjąć próbę odtwarzania transakcji według logów innego serwera.

- Alokacja plików i miejsca na dane: dane dotyczące położenia obecnie zapisywanych plików i wolnego miejsca są przechowywane w pamięci RAM serwera. Może się zdarzyć, że dwa serwery podejmą próbę zapisu danych w tym samym obszarze.

- Spójność danych w cache serwera, mogących pochodzić z przeszłości, gdy właśnie zostały zmienione przez inny serwer (który nie ma możliwości poinformowania pozostałych serwerów o swojej aktywności).

- Sterowanie robotem (robotami) w bibliotekach taśmowych i optycznych musi być zarezerwowane dla dedykowanego serwera, tak aby robotyka biblioteki nie otrzymywała sprzecznych rozkazów.

- Niekompatybilność formatu zapisu dotyczy zarówno zapisu na taśmach magnetycznych, formatu systemów plikowych, jak i wewnętrznego formatu plików. Celem jest pełne współdzielenie plików pomiędzy serwerami różnego typu, z umożliwieniem operacji otwarcia, odczytu, zapisu i zamknięcia pliku.