Trudne testowanie wydajności

Najpierw trzeba określić, jakie dyski spełniają wymogi dotyczące planowanej wydajności. Dopiero w kolejnym etapie należy analizować ich liczbę i modele

Najpierw trzeba określić, jakie dyski spełniają wymogi dotyczące planowanej wydajności. Dopiero w kolejnym etapie należy analizować ich liczbę i modele

Trudne testowanie wydajności

Organizacja Storage Performance Council przeprowadza testy wydajnościowe systemów pamięci masowych. Ich wyniki można pobrać ze strony http://www.storageperformance.org.

Zdaniem przedstawicieli branży, wśród szefów IT i administratorów istnieje świadomość wagi parametrów związanych z wydajnością pamięci masowych i jej wpływem na środowisko. Dzieje się tak głównie wśród największych firm, gdzie już we wczesnym etapie procesu planowania zakupu są określane wymagania wydajnościowe - nie na podstawie danych marketingowych, ale według rzeczywistego zapotrzebowania aplikacji. Coraz częściej klientów - inwestujących w średnie i duże rozwiązania centrów danych - interesują nie tylko same macierze, ale także cale środowisko zbudowane wokół nich.

Dla wielu firm odpowiednio wysoka wydajność pamięci masowych to po prostu warunek możliwości skutecznego świadczenia usług. "Już dziś wielu klientów na co dzień mierzy wydajność systemów pamięci masowych" - mówi Jacek Browarski, Channel Manager w polskim oddziale Hitachi Data Systems, "Jest to dla nich bardzo ważny parametr i jeśli zaobserwują znaczny spadek wydajności, często zgłaszają to do serwisu jako awarię" - dodaje. Planując jednak modernizację lub budowę infrastruktury, na testy w środowisku produkcyjnym mało kto się decyduje ze względu na bezpieczeństwo systemu lub bezpieczeństwo danych. Z kolei budowa dedykowanego środowiska testowego jest kłopotliwa i kosztowna. Dlatego w praktyce poważne testy wydajnościowe przeprowadza niewielu użytkowników.

Działy sprzedaży znanych dostawców pamięci masowych z zasady wyposażone są w kalkulatory, które umożliwiają analizę krytycznych dla klienta parametrów systemu, jak rodzaj dostępu do danych, liczba operacji wejścia-wyjścia na sekundę IOPS (Input-Output Per Second) lub czasy dostępu i określenie optymalnej konfiguracji macierzy spełniającej wymagania klienta. Narzędzia te z reguły nie są udostępniane publicznie, stanowiąc w pewnym sensie tajemnicę firmy. Należy także pamiętać, że źle użyte mogą prowadzić do błędnych oszacowań.

Teoretyczne IOPS

Wydajność systemów pamięci masowej określa się przede wszystkim parametrem liczby operacji wejścia-wyjścia na sekundę - IOPS. Producent powinien podawać trzy wartości tego parametru: wydajności odczytu z pamięci cache, odczytu z dysków oraz zapisu na dyski. Niestety, z reguły firmy podają tylko pierwszy, który jest największy, bo pamięć buforowa jest najszybszym elementem systemu. Ale tylko jej cześć jest przeznaczona do przechowywania danych i z reguły nie są to duże pojemności.

Z punktu widzenia użytkownika, określenie wymagań na wydajność systemu pamięci masowej zależy od tego, czy istnieje już działające środowisko aplikacyjne, czy też aplikacje są dopiero budowane, ale do funkcjonowania potrzebują infrastruktury udostępniającej zasoby pamięci. W pierwszym przypadku problem jest łatwiejszy do rozwiązania, bo konsolidując środowisko rozproszone lub działające niewydajnie, wystarczy pozbierać statystyki z już działających maszyn i serwerów oraz przeanalizować je. W drugim należy pamiętać, że szacunki wydajności kupowanych macierzy oparte na ich parametrach podawanych przez producenta, często mogą okazać się w praktyce istotnie odbiegające od założeń i wymagań.

Najpierw wydajność, później pojemność

W procesie doboru macierzy dyskowej do środowiska pamięci masowych krytyczna jest decyzja dotycząca rodzaju dysków, bo to właśnie napędy potrafią być wąskim gardłem rozwiązania. "W centrach danych, gdzie wysoka przepustowość jest parametrem krytycznym, jedynym rozsądnym rozwiązaniem są wydajne dyski Fibre Channel, ale jeśli jest to system o mniejszym obciążeniu, to najczęściej w zupełności wystarczą dyski SAS - Serial Attached SCSI" - mówi Jacek Goździk, Storage Channel Development Specialist w polskim oddziale IBM. "Napędy SAS są tańsze i mają całkiem dobrą wydajność. Natomiast tam, gdzie zapisywane są duże pliki, np. kopie zapasowe lub pliki multimedialne, z powodzeniem można korzystać z dysków Serial ATA. Ich wydajność jest niższa, ale znacznie niższa jest też cena, a jednocześnie większa pojemność. W efekcie jednostkowy koszt przechowywania danych jest znacznie niższy, co w wypadku dużych plików może się przełożyć na istotne oszczędności, w niektórych zastosowaniach niwelujące zalety związane z wysoką wydajnością" - zauważa.

Zdaniem Bartosza Charlińskiego, konsultanta technicznego w dziale wsparcia sprzedaży w polskim oddziale EMC, rozpoczynając proces doboru macierzy, trzeba skupić się przede wszystkim na wydajności, a pojemność zostawić na później. Najpierw należy określić, jakie dyski spełniają wymogi dotyczące planowanej wydajności, a dopiero w kolejnym etapie analizować liczbę niezbędnych napędów i modele macierzy, które spełniają wymagania dotyczące pojemności. "Analiza prowadzona w odwrotnym kierunku prawie zawsze kończy się błędem - mówi Bartosz Charliński. - Fizyki nie da się oszukać - najbardziej wydajny model macierzy wyposażony w niewielką liczbę wolnych, pojemnych dysków nigdy nie będzie tak wydajny, jak można by tego oczekiwać".

Z tą opinią zgadza się Jacek Browarski. "Zwiększenie pojemności przestrzeni dyskowej w macierzy prawie nigdy nie idzie w parze ze zwiększeniem wydajności, bo nie zapewniają tego dostępne dziś, najbardziej pojemne dyski. Skalowanie wydajności to temat trudny i z reguły wymagający przeprowadzenia testów oraz analiz wykorzystujących kalkulatory wydajnościowe. Często okazuje się wówczas, że zwiększenie wydajności do żądanego poziomu przez zwiększenie liczby dysków powoduje wzrost pojemności macierzy, którego użytkownik po prostu nie potrzebuje" - stwierdza.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200