Co w macierzach piszczy?
- 10.05.2011
Deduplikacja i kompresja
Środowiska wirtualizowane charakteryzują się bardzo dużym obciążeniem niewielkiego podzbioru danych. Wykorzystanie SSD (Fast Cache w macierzach EMC) kilkunastokrotnie przyspiesza pracę VMware View. W macierzach innych firm można wykorzystać zestaw szybkich dysków SSD, które pozwalają na przechowanie najmocniej obciążonych zasobów. Są nimi "złote obrazy" systemów operacyjnych, które pracują w wirtualizowanych środowiskach.
Deduplikacja powoduje wzrost obciążenia macierzy i spadek jej wydajności, gdyż wymaga dodatkowych obliczeń przez jej system, zatem nie opłaca się ustalać polityki deduplikacji obejmującej wszystkie składowane pliki. Zazwyczaj takie operacje ustala się dla plików, które są rzadko wykorzystywane, na przykład są starsze niż 3 miesiące.
W macierzach NetApp również występuje deduplikacja i kompresja.
Pozioma skalowalność i wielodostęp
W zastosowaniach masowego przetwarzania danych, takich jak obliczenia z użyciem komputerów dużej mocy, niezbędne jest dostarczenie bardzo szerokiego pasma. Urządzenia EMC posiadają wielościeżkowy system plików MPFS (multi-path filesystem), który zachowuje wielodostęp plikowy, ale przesyłanie zasobów odbywa się blokowo za pomocą FibreChannel lub iSCSI. Dzięki temu uzyskuje się bardzo duży przyrost wydajności.
Firma NetApp również ma produkty zapewniające wielodostęp plikowy, jest to wbudowane w ONTAP GX. System ten tworzy na kilku macierzach jeden wolumin, przy czym możliwy jest dostęp przez kilka macierzy do jednego pliku. Zestaw macierzy wykorzystujących ONTAP GX może mieć nawet milion IOPS wydajności. W Polsce nie ma implementacji GX, ale na świecie wykorzystuje się takie rozwiązania przy badaniach naukowych, geologicznych czy poszukiwaniu ropy naftowej.