Tamy na SANnie

W przypadku kontrolerów dyskowych istotnym parametrem jest liczba operacji I/O, które mogą one obsłużyć w ciągu sekundy. Ważne jest, by macierz pozwalała na instalację co najmniej dwóch kontrolerów tak, aby jeden mógł przejąć zadania drugiego w razie awarii (zazwyczaj każdy dysk jest podłączony do dwóch pętli FC- AL obsługiwanych przez niezależne kontrolery). Warto też zwrócić uwagę na sposób połączenia kontrolerów - w przypadku gdy cache jest stosowany nie tylko do odczytu danych, lecz także do zapisu (taka kombinacja występuje najczęściej), wąskim gardłem może się stać magistrala komunikacyjna między kontrolerami. Cache do zapisu jest zawsze mirrorowany, co oznacza, że zawartość z jednego kontrolera jest również kopiowana do pamięci podręcznej zapisu w drugim kontrolerze.

Walka o wydajność

Producenci systemów pamięci masowych stosują wiele dodatkowych i specyficznych dla ich produktów rozwiązań, które mają zwiększyć ich wydajność i zmniejszyć prawdopodobieństwo powstawania wąskich gardeł - przynajmniej w obrębie macierzy konsolidujących zasoby dyskowe serwerów.

Oprócz stosowanej w najbardziej zaawansowanych urządzeniach architektury magistrali typu crossbar (połączenia krzyżowe) coraz częściej wydziela się w nich dwie niezależne magistrale komunikacyjne: sygnalizacyjną i transmisji danych. Pierwsza z nich służy wyłącznie do przenoszenia komunikatów i żądań I/O, podczas gdy rzeczywiste przesyłanie danych odbywa się za pośrednictwem drugiej magistrali. Dzięki takiej separacji możliwe jest uniezależnienie wymiany komunikatów od transmisji.

Istotnym, ale nie udokumentowanym przez producentów detalem jest algorytm zarządzania danymi przechowywanymi w pamięci podręcznej: reguły określające, kiedy zawartość pamięci cache powinna zostać usunięta, które informacje z pamięci podręcznej powinny być skasowane jako pierwsze itd. Algorytm zarządzania pamięcią podręczną jest dużo ważniejszy niż sama pojemność tej pamięci. Ważniejsze jest bowiem, czy kontroler potrafi poprawnie zidentyfikować dane, które powinien przetrzymać, niż to jak wiele bezużytecznych danych będzie gromadził w pamięci cache.

Warto przy wyborze pamięci masowej zwrócić uwagę na to, czy kontroler pozwala administratorowi niezależnie przydzielać pamięć cache poszczególnym LUN-om (tak jest np. w macierzach EMC Symmetrix) i czy możliwe jest rozdzielenie pamięci cache przeznaczonej do odczytu i zapisu. Niektórzy z producentów (np. StorageTek) pozwalają administratorowi wyłączać (w celu zwiększenia wydajności) mirroring pamięci podręcznej do zapisu, konfigurować mechanizmy usuwania danych lub też całkowicie wyłączać pamięć podręczną dla określonych wolumenów.

Wydajność systemu pamięci masowych można zwiększyć (lub zmniejszyć) poprzez konfigurację poziomów RAID. Notabene w tej dziedzinie niewprawni administratorzy często popełniają błędy. Chociaż ze względów bezpieczeństwa wielu administratorów skłania się do konfiguracji dysków macierzy w tryb pracy RAID 5, to należy pamiętać, że ten poziom wymaga wykonania wielu operacji dyskowych, przez co wydajność macierzy istotnie się zmniejsza. Przy zadaniach wymagających szybkiego odczytu i zapisu jest zalecany RAID 1. Oczywiście wybór odpowiedniej konfiguracji jest uzależniony od wymagań konkretnej aplikacji: zarówno pod względem bezpieczeństwa, specyfiki pracy, jak i wymaganej wydajności odczytu i zapisu. Przykładowo, zupełnie inne wymagania mają aplikacje bazodanowe, które generują wiele transakcyjnych zapytań I/O, niż np. aplikacje wykonujące backup, w których liczy się wydajność sekwencyjnej transmisji danych. W pierwszym przypadku najważniejsza jest możliwość równoległego wykonywania wielu zapytań (istotny jest przede wszystkim czas dostępu), a w drugim czas dostępu jest mniej ważny, za to bardzo liczy się wydajność blokowego odczytu i zapisu danych (w MB/s).

Często zdarza się, że producenci podają wydajność oferowanych przez siebie macierzy przy założeniu, że 100% danych jest odczytywanych z pamięci podręcznej - zarówno w przypadku obsługiwanych operacji wejścia/wyjścia, jak i wydajności sekwencyjnej transmisji danych. Taki nadmierny optymizm dostawców łatwo jednak zdemaskować, obliczając dokładnie wydajność poszczególnych pętli FC-AL (na podstawie parametrów dołączonych do nich dysków) i zwielokrotniając otrzymaną liczbę przez liczbę pętli.

Sieć SAN

Kolejnym etapem na drodze danych jest sieć SAN. Sposób jej konstrukcji i specyfika transmisji danych wpływają na wydajność.

W najprostszym przypadku sieć SAN składa się z jednego przełącznika Fibre Channel (8- lub 16-portowego), do którego są dołączone macierze, pamięci taśmowe i serwery wyposażone w kontrolery FC HBA. Taka sieć SAN nie powinna ulegać jakimkolwiek przeciążeniom - zazwyczaj przełączniki FC oferują komunikację w trybie non blocking, a pojemność ich wewnętrznej magistrali przekracza sumę przepustowości wszystkich portów.


TOP 200