Co w macierzach piszczy?

Deduplikacja i kompresja

Pamięć cache dla środowisk wirtualizowanych

Środowiska wirtualizowane charakteryzują się bardzo dużym obciążeniem niewielkiego podzbioru danych. Wykorzystanie SSD (Fast Cache w macierzach EMC) kilkunastokrotnie przyspiesza pracę VMware View. W macierzach innych firm można wykorzystać zestaw szybkich dysków SSD, które pozwalają na przechowanie najmocniej obciążonych zasobów. Są nimi "złote obrazy" systemów operacyjnych, które pracują w wirtualizowanych środowiskach.

Pewna część informacji jest zapisywana wielokrotnie. Naturalnym rozwiązaniem, które zwiększa pojemność, jest kompresja danych oraz deduplikacja. Radomir Bordon, dyrektor Technicznego Wsparcia Sprzedaży EMC Polska, mówi: "Przy dostępie blokowym w macierzach EMC stosuje się kompresję całych LUN, co umożliwia zaoszczędzenie od 30 do 40% miejsca. Jest ono zwracane do puli, w której rezyduje LUN. Może być to wykorzystane do tego samego LUN, powiększając jego zasoby o tyle, ile zyskało się dzięki kompresji. Przy dostępie plikowym (np. w macierzach VNX) buduje się polityki deduplikacyjne na poziomie plików, umożliwiając redukcję ilości zajętego miejsca".

Deduplikacja powoduje wzrost obciążenia macierzy i spadek jej wydajności, gdyż wymaga dodatkowych obliczeń przez jej system, zatem nie opłaca się ustalać polityki deduplikacji obejmującej wszystkie składowane pliki. Zazwyczaj takie operacje ustala się dla plików, które są rzadko wykorzystywane, na przykład są starsze niż 3 miesiące.

W macierzach NetApp również występuje deduplikacja i kompresja.

Pozioma skalowalność i wielodostęp

W zastosowaniach masowego przetwarzania danych, takich jak obliczenia z użyciem komputerów dużej mocy, niezbędne jest dostarczenie bardzo szerokiego pasma. Urządzenia EMC posiadają wielościeżkowy system plików MPFS (multi-path filesystem), który zachowuje wielodostęp plikowy, ale przesyłanie zasobów odbywa się blokowo za pomocą FibreChannel lub iSCSI. Dzięki temu uzyskuje się bardzo duży przyrost wydajności.

Firma NetApp również ma produkty zapewniające wielodostęp plikowy, jest to wbudowane w ONTAP GX. System ten tworzy na kilku macierzach jeden wolumin, przy czym możliwy jest dostęp przez kilka macierzy do jednego pliku. Zestaw macierzy wykorzystujących ONTAP GX może mieć nawet milion IOPS wydajności. W Polsce nie ma implementacji GX, ale na świecie wykorzystuje się takie rozwiązania przy badaniach naukowych, geologicznych czy poszukiwaniu ropy naftowej.


TOP 200