Firmowe dyski pełne danych

Krzemowe dyski do gorących danych

Prawdziwą rewolucję w przechowywaniu plików przyniosły pamięci półprzewodnikowe (SSD), gdyż charakteryzują się bardzo krótkim czasem dostępu, zatem mogą obsłużyć nawet ponad 10 tys. operacji wejścia/wyjścia na sekundę. Obecnie wszyscy producenci wykorzystują pamięci SSD do przyspieszenia pracy macierzy dyskowych, gdyż moduły takie charakteryzują się praktycznie zerowym czasem losowego dostępu. Obecnie wykorzystanie pamięci SSD jest najsprawniejszym sposobem zapewnienia dobrej wydajności dostępu do danych w firmie. Nie opłaca się jednak tworzenia woluminów z całych dysków SSD, gdyż nawet w obrębie jednej bazy danych czy maszyny wirtualnej nie wszystkie bloki są równie często przetwarzane. Znacznie sprawniej działają macierze, które potrafią migrować poszczególne bloki danych do najszybszego poziomu, obsadzonego dyskami SSD, pozostawiając pozostałe bloki na dyskach mechanicznych.

Autotiering

Migracja rzadziej przetwarzanych danych do tańszego zasobu storage (na przykład dysków SATA) umożliwiła zaoszczędzenie dużej ilości miejsca na szybkich dyskach. Jednocześnie producenci opracowali mechanizm, który te migracje wykonuje automatycznie, na poziomie bloków. Zatem po krótkim czasie pracy infrastruktury firmy system taki samoczynnie dostosuje się do potrzeb, migrując dane między poziomami składowania, by jak najsprawniej wykorzystać szybkie dyski.

Statystyki dostępu macierzy z autotieringiem pokazują, że w przypadku badanych firm zaledwie 10% ogółu składowanych danych wymaga naprawdę szybkiego dostępu, zatem pojemność najszybszych dysków wcale nie musi być tak duża, jak dotąd sądzono. Wprowadzenie modułów SSD umożliwia przeniesienie do bardzo szybkiej pamięci półprzewodnikowej bloków, które zmieniają się najczęściej. Jest to jeszcze mniejsza porcja danych, zatem w praktyce dla średniej firmy korzystającej z macierzy z autotieringiem wystarczą dwa dyski SSD połączone w mirrorze, by uzyskać bardzo dobre parametry pracy zasobów storage. Aby ułatwić dobór rozmiarów poszczególnych poziomów storage, opracowano narzędzie TierAdvisor, które umożliwia analizę wpływu zmian rozmiaru na wydajność zasobów w firmie jeszcze przed ich zastosowaniem. Typowym zastosowaniem jest dobór rozmiaru pamięci SSD używanej w najszybszym poziomie oraz znajdowanie i usuwanie wąskich gardeł.

Wirtualizacja

Rozpowszechnienie się wirtualizacji w przedsiębiorstwach sprawia, że ilość danych znacznie rośnie. Przyczyną jest zjawisko zwane "virtual sprawl" polegające na tym, że łatwość tworzenia kopii środowiska sprawia, że działy IT z tych możliwości skrupulatnie korzystają. Powstaje bardzo wiele maszyn wirtualnych, z których każda wykorzystuje pewne zasoby. Unika się dzięki temu instalacji więcej niż jednej usługi w hostowanym systemie operacyjnym, ale płaci się za to cenę w postaci większego zapotrzebowania na przestrzeń dyskową.

Zjawisko to jest szczególnie widoczne w dziale deweloperskim, gdzie tworzy się wiele maszyn, służących do testów różnych wersji oprogramowania, wariantów konfiguracji i dodatkowych opcji. Zaletą jest szybkość i elastyczność, wadą - znacznie większe zapotrzebowanie na przestrzeń dyskową.

Replikacja do drugiego ośrodka

Duża ilość danych sprawia, że mechanizm odzyskiwania sprawności po awarii wykorzystujący taśmę nie zapewnia oczekiwanego czasu odtworzenia danych. Chociaż taśma nadal jest najtrwalszym medium, oczekiwania firm wzrosły na tyle, że czas przerwy w pracy nawet w przypadku całkowitej utraty serwerowni jest krótszy niż czas odtworzenia kopii z taśmy. Przy zbiorach danych liczonych w dziesiątkach i setkach terabajtów narzędziem, które zapewni szybkie przywrócenie działania usług IT, jest replikacja danych do rezerwowej serwerowni. Mechanizm ten jest znany od dawna w macierzach klasy Enterprise, ale dopiero niedawno pojawił się w rozwiązaniach kierowanych do sektora średnich przedsiębiorstw. Obecnie jest to standard i można go traktować jako sensowne uzupełnienie strategii backupowej.

W tym modelu najważniejszym czynnikiem przywrócenia sprawności działania firmy jest szybkie uruchomienie przetwarzania danych w rezerwowym ośrodku lub połączenie do drugiej macierzy.


TOP 200