Ostatnia taka macierz

Oficjalna premiera macierzy EMC Symmetrix DMX-3 każe zastanowić się nad sposobami skalowania pamięci masowych w najbliższych latach. Wydaje się, że architektura monolityczna osiągnęła właśnie kres możliwości skalowania.

Oficjalna premiera macierzy EMC Symmetrix DMX-3 każe zastanowić się nad sposobami skalowania pamięci masowych w najbliższych latach. Wydaje się, że architektura monolityczna osiągnęła właśnie kres możliwości skalowania.

Macierz dyskowa o pojemności przekraczającej jeden Petabajt to najnowszy pomysł EMC, by zdobyć serca i kieszenie dużych klientów. Koncepcja konsolidacji dużych zbiorów danych w jednym urządzeniu Symmetrix DMX-3, którego oficjalna premiera właśnie się odbyła, jest ogólnie rzecz biorąc zbieżna z oczekiwaniami użytkowników. Diabeł tkwi jednak w szczegółach. Może się bowiem okazać, że obiecywana przez EMC skalowalność jest rzeczywiście możliwa, ale tylko dla klientów zdolnych spełnić bardzo wyśrubowane warunki środowiskowe związane z konstrukcją centrum danych i wydajnością jego wewnętrznych instalacji.

Oficjalna premiera macierzy Symmetrix

DMX-3 rozogniła dyskusję o tym, jak skalować i środowiska SAN w ogóle. Zbiory danych sięgające dziesiątek Terabajtów ma dziś niewiele firm, ale to się zmieni w ciągu kilku lat, dlatego dyskusja nad architekturami i ich konsekwencjami technicznymi i finansowymi już teraz jest jak najbardziej na miejscu. Niestety, jak bywało wielokrotnie w przeszłości, argumenty techniczne przeplatają się z obroną aktualnego rynkowego status quo i strategii sprzedaży dostawców, co podejmowaniu decyzji na chłodno raczej nie służy. Spróbujmy zatem odsiać argumenty wartościowe od naciąganych.

Cykl życia i koszty

EMC przekonuje, że Symmetrix DMX-3 stwarza najlepsze warunki dla konsolidacji danych i budowy hierarchicznych systemów pamięci masowych, w których dane na bieżąco wykorzystywane zapisane są na najszybszych dyskach, zaś rzadziej używane na dyskach mniej wydajnych, a więc tańszych. Czy jednak różnica w cenie dysków Fibre Channel i LC-FC (Low Cost Fibre Channel, określanych przez HP mianem FATA i będących standardowymi dyskami ATA z dodatkowo zamontowanym interfejsem FC) będzie istotna?

To raczej wątpliwe, bo ceny dysków dla klientów nie zależą od kosztów ich produkcji, lecz od klasy macierzy, dla jakich są certyfikowane. Jeśli dyski LC-FC będą nieznacznie tańsze niż standardowe dyski dla macierzy Symmetrix, co jest do przewidzenia, a jednocześnie będą oferować znacząco mniejszą wydajność (7,2 tys. obr./min zamiast 10 lub 15 tys. obr./min, brak zaawansowanych funkcji, takich jak niezależne kolejkowanie), to umieszczanie ich wewnątrz DMX-3 nie będzie chyba dobrym pomysłem.

Przeciw umieszczaniu dysków LC-FC w macierzy Symmetrix DMX-3 przemawia także fakt, że EMC proponuje w tym celu dyski o pojemności 500 GB. Jest mało prawdopodobne, że dyski te będą pracować mniej intensywnie, niż szybkie dyski przeznaczone dla aplikacji transakcyjnych. Jeśli będą jednocześnie przyjmować dane z dysków transakcyjnych i oddawać je do bibliotek taśmowych, prawdopodobieństwo ich awarii będzie dość wysokie - jeśli duży zasób dyskowy jest dostępny, pojawia się bowiemnaturalna tendencja do częstszego wykonywania kopii. Jeśli tanie dyski zostaną wykorzystane jako "stacja przesiadkowa" dla danych podróżujących w kierunku archiwum, ich głowice również będą w ciągłym ruchu.

Takie rozumowanie prowadzi do tego, że tanie dyski wymagają zabezpieczeń podobnych do tych, którymi cieszą się dyski najwyższej klasy. Mirroring tanich dysków wydaje się najprostszym sposobem na zabezpieczenie przechodzących przez nie danych, ale w takim razie dysków tych będzie dwa razy więcej. Zdrowy rozsądek podpowiada tymczasem, że macierzy, której cena swobodnie przekracza milion dolarów, nie warto wypełniać po brzegi tanimi dyskami w imię teoretycznych koncepcji ILM. Dyski LC-FC, SAS lub SATA umieszczone w macierzy klasy średniej będą koniec końców znacznie tańsze.

Skala i problemy

Konsolidacja w wydaniu EMC wygląda kłopotliwie dla potencjalnych klientów także z powodu skali, jaką systemy DMX-3 są w stanie osiągnąć. Standardowe konfiguracje Symmetrix DMX-3 kończą się na 1920 dyskach, ale na specjalne zamówienie w najnowszej macierzy można umieścić ich aż 2400! Nawet standardowe maksimum robi wrażenie, a co dopiero 500 dysków więcej, choć akurat nie dlatego, że każdy z nich może być dyskiem LC-FC o pojemności 500 GB. Osiągnięta w ten sposób pojemność byłaby, zgodnie z przesłaniem marketingowym EMC, większa niż 1 TB, ale szczerze: kto potrzebuje 1 PB danych na wolnych, a do tego zawodnych dyskach LC-FC (FATA)?

Przy tak dużych pojemnościach dysków i ich relatywnie niedużej wydajności czas odtworzenia grupy RAID będzie bardzo długi - liczony w dniach, a nie w godzinach. Gdyby były to dyski FC, czas odtworzenie byłby krótszy - choć też nie tak krótki, jakiego życzyłby sobie administrator odpowiedzialny za bezpieczeństwo danych. A zatem, petabajtowa pojemność macierzy DMX-3 jest zatem czysto teoretyczna.

Prawie dwa i pół tysiąca dysków w ośmiu szafach (plus dziewiąta mieszcząca kontrolery) to najbardziej "gęsty" system pamięci masowych, jaki świat kiedykolwiek widział. Oszczędność powierzchni centrum danych wydaje się tu oczywistością i na pierwszy rzut oka jest korzystny. Szkopuł w tym, że macierzy DMX-3 nie można rozczłonkować na większej powierzchni - szafy z dyskami muszą stać obok siebie. W efekcie zestaw 9 szaf DMX-3 załadowanych dyskami waży nieco ponad 7 (1920 dysków) do prawie 11 ton (2400 dysków), co przy niewielkiej zajmowanej przez nią powierzchni wytwarza wielki nacisk na 1 m kw. Doprawdy, niewiele podłóg jest w stanie udźwignąć takie monstrum.

Nawet jeśli konstrukcja podłogi udźwignie DMX-3, pojawia się pytanie o efektywne zasilanie macierzy i jej chłodzenie. Aby zasilić pełną konfigurację macierzy potrzebne jest ponad 50 kVA na relatywnie niedużej powierzchni - zapewne nie od razu, ale jeśli DMX-3 ma być platformą, która będzie rosnąć razem z firmą, trzeba mieć to na względzie. Jeżeli rzeczywiście wszystkie szafy DMX-3 mają stać obok siebie, jej efektywne chłodzenie z pewnością będzie wymagać modyfikacji instalacji klimatyzacyjnej. Duża liczba dysków zgromadzona na niewielkiej powierzchni wymagać będzie praktycznie dedykowanego klimatyzatora.

Koniec z monolitem

Przedstawione wyżej argumenty pojawiające się na listach dyskusyjnych każą zastanowić się nad strategią rozbudowy systemów pamięci masowych w najbliższych latach. Konsolidacja systemów pamięciowych będzie zjawiskiem nasilającym się pod wpływem rosnących kosztów zarządzania i konieczności skracania czasów przenoszenia danych między grupami dysków obsługującymi różne potrzeby. Ale wizja konsolidacji EMC zawarta w konstrukcji macierzy Symmetrix DMX-3 z pewnością nie wszystkim się spodoba, a nawet jeśli, nie każda firma będzie w stanie fizycznie ją zrealizować.

Wiedząc to, EMC przygotowuje alternatywny scenariusz skalowania, oparty na routerze InVista. Urządzenie to jest wyposażone w oprogramowanie wirtualizacyjne i pozwala przenosić dane między macierzami bez wpływu na ich dostępność dla aplikacji. Jeśli w technologii twardych dysków nie zdarzy się innowacja znacząco zwiększająca szybkość odczytu i zapisu danych, InVista i jego następcy oraz potencjalni "młodsi bracia" są jedyną przyszłością skalowania dużych systemów pamięci masowych. Co oczywiste, wszystko odbędzie się płynnie - klienci wykorzystujący dziś platformy Symmetrix DMX-2 kupią wkrótce DMX-3 i w ciągu 2-3 lat wypełnią je dyskami.

Do tego czasu EMC musi przedstawić całkiem nową architekturę macierzy, ponieważ obecna sięga już granic możliwości skalowania. Czy EMC pójdzie w kierunku modułów składująco-obliczeniowych, o których niegdyś pisaliśmy, czy też może w kierunku inteligentnego połączenia minimacierzy z globalnym systemem plików, jak uczyniła to firma 3Par? A może nowa macierz EMC będzie podobna do rozwiązań zwirtualizowanych zastosowanych przez IBM w macierzach DS8000? Zobaczymy - możliwości jest wiele.


TOP 200