Pamięci w sieciach i siatkach

Wykorzystanie w sieciach pamięci masowych przetwarzania siatkowego (grid) to kolejne wyzwanie, z którym już wkrótce zmierzą się ich producenci. Problem jest o tyle unikalny, że nie wykreowali go sami dostawcy, ale użytkownicy sfrustrowani dużą liczbą urządzeń pamięci masowych.

Wykorzystanie w sieciach pamięci masowych przetwarzania siatkowego (grid) to kolejne wyzwanie, z którym już wkrótce zmierzą się ich producenci. Problem jest o tyle unikalny, że nie wykreowali go sami dostawcy, ale użytkownicy sfrustrowani dużą liczbą urządzeń pamięci masowych.

Tradycyjne rozwiązania grid computing pozwalają na zbudowanie superkomputerów z klastrów złożonych z pojedynczych, tanich stacji roboczych. Ogólna idea grid storage jest podobna, chociaż największe różnice są w szczegółach.

Grid storage oparte jest na dwóch założeniach - topologii umożliwiającej skalowanie pojemności urządzeń NAS (Network Attached Storage) w zależności od rosnących wymagań aplikacji oraz technologii umożliwiającej udostępnianie i zarządzanie pojedynczymi systemami plików, a w efekcie połączenie ich w jedną dużą pulę pojemności.

Trzymać pion i poziom

Obecnie dołączone do sieci pamięci masowe można skalować horyzontalnie i wertykalnie. Ale każda z tych metod generuje inne problemy. Rozbudowa horyzontalna oznacza dodanie kolejnych macierzy NAS do sieci LAN. Metoda ta sprawdza się do momentu, gdy liczba podłączonych do sieci macierzy staje się niemożliwa do ręcznego zarządzania. W topologii grid kontrolery macierzy NAS podłączone byłyby do jednego wirtualnego dużego kontrolera, a zarządzanie wszystkimi macierzami odbywałoby się tak, jakbyśmy zarządzali jedną dużą macierzą.

Rozbudowa wertykalna polega na dodaniu kolejnych dysków do macierzy (oczywiście, jeśli jeszcze jest taka fizyczna możliwość). Skalowalność ta jest też ograniczona limitami adresowania macierzy NAS (jak wiele plików jednocześnie możemy zapisać i odczytać) oraz wydajnością kontrolera. Generalnie im więcej dysków w jednej macierzy, tym bardziej nieefektywnie ona działa, ze względu na duże obciążenia kontrolera.

Idea grid storage teoretycznie doprowadza do kompromisu między tymi dwoma metodami rozbudowy systemu pamięci masowych. Dzięki niej wiele małych (i tanich) macierzy, zamiast być rozbudowywane o kolejne dyski, może być połączone w jedną dużą - wirtualną.

Z dobrodziejstw grid storage skorzystają wszyscy administratorzy dużych farm macierzy NAS, gdzie zarządzanie setkami maszyn stanowi nie lada problem. Zarządzanie pojemnością na każdej z nich wymaga wejścia na odpowiedni serwer web umożliwiający jej konfigurację. W wielu przypadkach oznacza to "surfowanie" przez cały dzień. Możliwość połączenia wszystkich indywidualnych macierzy w jedną, zarządzaną wirtualnie, zdecydowanie odciąży informatyków od nudnych i monotonnych prac.

Szczegóły już wkrótce

Nad technologią grid storage (zwaną też czasem klastrowaniem NAS) pracują zarówno znani w tej branży (Network Appliance czy Silicon Graphics), jak też nowicjusze (np. Panasas). SGI chce zaadoptować swoją technologię klastrowania do macierzy NAS. Panasas chce wprowadzić na rynek system klastrowy, oparty na Linux Beowulf. Obie firmy stawiają na wydajne przetwarzanie danych.

W kontekście grid storage Network Appliance planuje zastosować technologię, którą pozyskał wraz z przejęciem w lutym firmy Spinnaker Networks. Podobnie jak konkurencja, Network Appliance stara się stworzyć rozwiązanie, które pozwoli na szybsze i wydajniejsze zarządzanie wieloma fizycznymi macierzami NAS, a także stworzenie jednego dużego, skalowalnego katalogu, który miałby udostępniać pliki ze wszystkich macierzy NAS dołączonych do sieci.

Obserwatorzy rynku twierdzą jednak, że prawdopodobieństwo szybkiego pojawienia się uniwersalnych i niezależnych od producenta rozwiązań grid storage jest dość małe. Większość uważa, że technologie zarządzania dużymi ilościami plików, wirtualizacji i synchronicznej replikacji są wciąż niedojrzałe i niezbyt odporne na integrację wewnątrz jednego rozwiązania macierzy wielu producentów. Nie ulega wątpliwości natomiast, że jeśli grid storage ma przyjąć się na rynku, to musi być niezależne od producentów sprzętu, stabilne oraz przezroczyste dla użytkowników i aplikacji.

Pytania o grid storage (GS)

Wciąż jest więcej pytań niż odpowiedzi. Oto najważniejsze z nich:

  • Kiedy GS będzie dostępny?
  • Które produkty pamięci masowych (i których producentów) będą działały z technologią GS?
  • Które serwerowe systemy operacyjne będą działały z technologią GS?
  • Czy technologia GS wymaga wymiany funkcjonujących systemów plików?
  • Czy technologia GS wymaga wdrożenia nowych serwerów, które będą odpowiedzialne za zarządzanie tak dużymi ilościami plików? Czy będzie konieczność instalowania specjalnych agentów na stacjach klienckich?
  • Jak duża przepustowość sieci WAN będzie konieczna, aby systemy GS mogły działać globalnie?
  • Jakie standardy będą wykorzystywane w GS i przez kogo są one obecnie wspierane?
  • Jak będą wyglądały narzędzia do zarządzania plikami?
  • Jak GS poradzi sobie z alokacją i dealokacją pamięci masowych?
  • Jak GS wykryje i zareaguje na zwiększone zapotrzebowanie aplikacji (więcej miejsca lub dostęp do konkretnych plików)?
  • Jak duże opóźnienia czasowe wystąpią w rozproszonych środowiskach GS?
  • Jakie zagwarantowane będą poziomy bezpieczeństwa w otwartych środowiskach?
W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200