Jak porównywać koszty pamięci masowych

O ile bazowe ceny nośników danych przeliczane na gigabajty liczy się w groszach, to ostateczny koszt pamięci masowej dla przedsiębiorstw jest znacznie wyższy.

Szybkie sprawdzenie w dowolnym internetowym sklepie pokazuje, że dysk o pojemności 2 TB można kupić za plus minus 450 zł. To daje 22,5 grosza za gigabajt. W przypadku pamięci masowych nie da się jednak w tak prosty sposób oszacować ostatecznych kosztów. Wpływa na nie bowiem wiele czynników, m.in. rodzaj nośników, możliwości platformy sprzętowej oraz koszty oprogramowania.

W jaki sposób można więc oszacować cenę 1 gigabajta? Czy ta metryka w ogóle jest właściwa, aby porównywać koszty różnych produktów? W ciągu ostatnich 15 lat ten parametr był faktycznym standardem używanym do porównywania cen produktów. Jednak kiedyś środowiska pamięci masowych były znacznie prostsze. Używano dysków twardych o szybkości 10 000 obr/min. i konfiguracji RAID 1. Ten świat szybko się skomplikował. Zaczęto używać konfiguracji RAID 5 i RAID 6 do ochrony danych, a producenci wprowadzili do sprzedaży napędy 7 500 oraz 15 000 obr./min. Wszystkie wymienione rodzaje dysków mogły być montowane w tej samej macierzy. W 2009 r. pojawiły się pierwsze korporacyjne produkty z nośnikami Flash, którym towarzyszyło wprowadzenie mechanizmów rozwarstwiania danych w zależności od wymaganej szybkości dostępu do nich. To jeszcze bardziej utrudniło obliczanie kosztów 1 gigabajta. Dlatego można rozważyć inne metody oceny kosztów pamięci masowych.

Zobacz również:

Zacznijmy od dotychczasowego miernika: kosztu jednego gigabajta (zł/GB). W każdej kalkulacji warto zacząć od tego parametru, obliczając go dla sumarycznej pojemności wszystkich dysków, bez uwzględniania czynników powodujących zmniejszenie dostępnej przestrzeni dyskowej (np. konfiguracje RAID) czy też jej zwiększenie (deduplikacja, kompresja). Niezależnie od funkcji oferowanych przez daną pamięć masową, ten parametr umożliwia dość dobre porównanie kosztów różnych produktów.

Istotne jest porównanie w zależności od przeznaczenia. Zestawienie osiągów dysków SATA z nośnikami Flash w kategoriach wydajności i pojemności nie ma większego sensu. Zamiast tego warto skonkretyzować własne wymagania dotyczące wydajności i pojemności, dobrać do nich odpowiedni rodzaj pamięci masowych i dopiero wtedy przejść do porównania.

Warto sprawdzić jaka jest binarna i dziesiętna pojemność nośników, ponieważ między tymi wartościami jest różnica. Dostawcy nośników danych podają pojemność według systemu dziesiętnego, co oznacza, że 1 GB = 1 000 000 000 bajtów. Tradycyjnie do pojemności nośników używa się jednak systemu binarnego, w którym 1 GB = 1 073 741 824 bajtów. Różnica między tymi dwoma wartościami wynosi 7%, co w obliczeniach kosztów może przełożyć się na znaczne różnice.

W kalkulacji kosztów przyda się standardowy model. Na ostateczną cenę pamięci masowej składają się nie tylko dyski twarde. Trzeba uwzględnić również kontrolery, liczbę portów, narzędzia do zarządzania oraz inne elementy sprzętowe niezbędne do wdrożenia pamięci masowej. Dostawcy sprzedają te komponenty oddzielnie lub w pakietach. Potrzebne jest jeszcze oprogramowanie. Tutaj również można kupić je w pakiecie ze sprzętem lub za dodatkową opłatą. Niezależnie, czy zakup jest w pakiecie czy oddzielnie, wszystkie te elementy, również oprogramowanie, należy uwzględnić w obliczeniach wartości parametru zł/GB.

Porównanie kosztów w przypadku różnych producentów wymaga wybrania produktów o podobnych konfiguracjach. Dlatego tak ważne jest określenie wymagań, a jednocześnie pokazuje, dlaczego wdrożenia nowych pamięci masowych bywają bardzo złożone. Kiedyś wyzwaniem było skalowanie macierzy, aby uzyskać wymaganą wydajność. Dzisiaj to nie jest już problemem od strony technologicznej, ponieważ dysponujemy nośnikami Flash.

Należy z rezerwą podchodzić do możliwości optymalizacji, które zachwalają producenci. Podstawowa pojemność nośników to dobry punkt wyjścia do kalkulacji kosztów, ale wielu dostawców sugeruje, żeby kierować się tzw. pojemność efektywną. Ta metryka wykorzystuje użyteczną pojemność systemu obliczaną po zastosowaniu mechanizmów ochrony danych i technik optymalizacji. Takie funkcje, jak kompresja i deduplikacja umożliwiają zapisanie na dyskach znacznie większej liczby danych niż wynika z nominalnej pojemności. Współczynnik ten może sięgnąć nawet 10:1 i więcej.

Faktyczne korzyści z kompresji z reguły różnią się od tego, co obiecuje dostawca, ponieważ efekt zależy od danych, które są kompresowane. Maszyny i desktopy wirtualne dobrze poddają się deduplikacji. Z kolei transakcyjne bazy danych dobrze się kompresują, ale nie są dobrym kandydatem do deduplikacji. Także bardzo zróżnicowane zbiory danych nie nadają się do deduplikacji. Współczynniki kompresji mogą się również zmieniać z upływem czasu, np. na skutek wprowadzenia nowej wersji systemu operacyjnego.

Rachunki za macierze

Pomijając porównywanie kosztów produktów różnych dostawców i różnych technologii, czy obliczanie kosztów zł/GB ma jeszcze jakieś inne zastosowanie? Producenci oferują wiele funkcji, które trudno jest ująć w tak prostej metryce. We wdrożeniach mających bardziej usługowy charaktery lub w chmurach prywatnych działy IT muszą stworzyć mechanizm prawidłowego rozliczania klientów (zewnętrznych lub wewnętrznych) za wykorzystane zasoby. Z tego powodu duże znaczenie ma zrozumienie, jakie są podstawowe koszty. A jeśli firma rozważa przeniesienie danych do chmury, również potrzebny jest sposób, który umożliwi oszacowanie kosztów korzystania z takiego rodzaju pamięci masowej. Jeśli więc nawet parametru zł/GB nie używa się do porównywania różnych produktów, może się okazać przydatny w przypadku pamięci masowych oferowanych jako usługa (cloud storage).

zł/GB czy zł/IOPS?

Jest takie branżowe powiedzenie: pojemność jest za darmo, a wydajność kosztuje. W pewnym stopniu jest ono prawdziwe. Przykładowo, nominalny koszt zł/GB napędów 15 000 obr/min. jest 20x a nawet 30x wyższy niż dysków SATA 7,200 obr/m.in. Na marginesie warto dodać, że z tego powodu najszybsze dyski HDD są szybko wycofywane z produkcji, ponieważ ustępują miejsca znacznie wydajniejszym nośnikom Flas

Mimo że stale zmniejsza się różnica w cenach nośników HDD i SDD, to ceny macierzy typu all-flash wciąż znacznie przewyższają ceny modeli wyposażanych w dyski HDD. Producenci uzasadniają to znacznie większą liczbą operacji wejścia/wyjścia i korzystnym współczynnikiem zł/IOPS (Input/Output Per Second). Tak było kilka lat temu. Dzisiaj ceny rozwiązań Flash znacznie spadły i cena 1 gigabajta w ich przypadku oscyluje wokół kilku złotych. W efekcie porównywanie na bazie kosztów zł/GB znów ma sens.

Warto odnotować, że producenci sprzętu niezbyt chętnie patrzą na porównania z innymi dostawcami, chyba że widzą jakąś korzyść z takiego porównaniu. Z tego względu nie spieszą się podawaniem cen swoich produktów.


TOP 200