Nowoczesne składowanie danych

Systemy silosowe są zastępowane przez nowoczesne zintegrowane środowiska, które obsługują wszystkie aspekty związane z przechowywaniem danych. Rozwiązania wymagające ultrawysokiej wydajności korzystają z pamięci półprzewodnikowych.

Zwirtualizowane środowisko IT oczekuje od macierzy dyskowych elastyczności porównywalnej do tej, którą dostarcza przy przetwarzaniu danych wirtualizacja serwerowa. Od kilku lat dostępne są narzędzia do wirtualizacji zasobów storage, ale nie wszędzie mogą być one zastosowane. Szczególnym przykładem zastosowania wirtualizacji zasobów jest backup, w którym powszechnie stosuje się deduplikację i kompresję.

Backup w maszynie wirtualnej

Dla firm, które masowo korzystają z klastrów wirtualizacyjnych, ciekawym rozwiązaniem wydaje się system składowania danych dostarczony w formie maszyny wirtualnej. Oferuje on deduplikację i kompresję, może wykorzystać każdy zasób dyskowy i pracować na tej samej maszynie fizycznej co aplikacja. Umieszczenie maszyny wirtualnej na tym samym hoście pozwoli na odciążenie sieci LAN i SAN przy wykonywaniu kopii bezpieczeństwa, gdyż największy ruch przed deduplikacją może być przeprowadzony bez opuszczania fizycznych interfejsów sieciowych maszyny.

Zaprezentowana na konferencji HP Discover 2013 maszyna wirtualna StoreOnce VSA zawiera oprogramowanie spójne z całą linią StoreOnce, może być rozwijana w modelu scale out, a także obsługuje przenoszenie danych między systemami w formie deduplikowanej, bez konieczności przywrócenia ich poprzedniej postaci, tzw. "nawodnienia".

David Scott, SVP i generalny menedżer działu storage w firmie HP, wyjaśnia: "Przedstawiając StoreOnce w postaci maszyny wirtualnej, zapełniamy lukę między deduplikacją wbudowaną w oprogramowanie Data Protector a najmniejszym urządzeniem StoreOnce 2600. Jest to jednocześnie rozwiązanie otwarte, może być uruchomione w standardowym środowisku wirtualizacyjnym VMware lub Hyper-V na typowym serwerze. W ten sposób firma może świadczyć usługi backupu dla różnych odbiorców, separując całkowicie ich środowiska. Środowisko to skaluje się poziomo, a także umożliwia migrację danych, np. ze zdalnego oddziału do centralnego środowiska backupu w firmie".

Superszybka macierz SSD

Moduły SSD od początku były wykorzystywane do akceleracji pracy najbardziej wymagających aplikacji. Dzięki swojej charakterystyce pracy oferują wydajność, która wymagałaby budowania woluminów z wielu setek dysków mechanicznych.

Kluczowym parametrem przy znacznie obciążonych aplikacjach i bazach transakcyjnych jest opóźnienie w dostępie do danych. Karta pamięci łączona za pomocą magistrali PCI Express ma najmniejsze opóźnienia, ale oferuje najmniejszą skalowalność, a w typowej konstrukcji nie jest medium współdzielonym. Z kolei macierze dyskowe realizowane w całości z modułów półprzewodnikowych rzadko wykorzystują w pełni zalety pamięci, takie jak bardzo niskie opóźnienia.

Obecnie dostępne macierze dyskowe wykorzystują moduły SSD w obszarze pamięci podręcznej albo modułów połączonych i zarządzanych tak samo, jak dyski mechaniczne. Ten drugi wariant jest o tyle niekorzystny, że po drodze od źródła danych występuje dodatkowo kontroler, który niekiedy wywodzi się ze starszych konstrukcji, bazujących na dyskach mechanicznych. Ponadto koszt pamięci Flash jest nadal dość duży, a zatem niezbędna jest co najmniej deduplikacja danych. Wprowadzenie deduplikacji za pomocą odpowiedniego oprogramowania umożliwia lepszą efektywność kosztową takiej macierzy, ale wprowadza dodatkowe opóźnienia.

Firma HP wprowadziła macierz dyskową z serii 3PAR StoreServ 7450, w całości zbudowaną na modułach SSD, ale wyposażoną w sprzętowo realizowany thin provisioning, zapis z kompresją zer, a także deduplikację. Macierz StoreServ 7450 dysponuje wydajnością na poziomie 550 tys. IOPS (operacji wejścia/wyjścia na sekundę), przy czym nawet przy deklarowanym obciążeniu zachowuje opóźnienia, które nie przekraczają 700 µs.

Osiągnięcie tak dobrych parametrów było możliwe dzięki sprzętowej akceleracji za pomocą programowalnych układów ASIC i specjalnie opracowanej architekturze z wieloma kontrolerami. Macierz może wykorzystać do czterech niezależnych kontrolerów, działa zrównoleglony sposób, który dodatkowo uwzględnia parametry usługi (QoS).

W odróżnieniu od innych produktów na rynku seria 7450 ma wszystkie opcje znane z innych modeli 3PAR, w tym spójny obszar pamięci podręcznej cache, porty zachowujące stan połączeń, przełączanie do rezerwowego urządzenia, a także replikację do innych lokalizacji.