Jak wybrać pamięć masową na lata

Nowe koncepcje architektury oraz programowe sterowanie systemami pamięci wpływają na rozwiązania sprzętowe i na sposób opracowywania aplikacji nowej generacji.

W firmach powszechnie wykorzystywane są dwie podstawowe architektury pamięci masowej: SAN i NAS (oprócz tego wciąż funkcjonują pamięci Direct Attached Storage, czyli dyski instalowane bezpośrednio w serwerach). Pamięci Storage Area Network składają się z dwóch podstawowych warstw. Pierwsza zapewnia łączność między węzłami pamięci działającymi w systemie i transmisję poleceń oraz informacji o stanie urządzeń i zasobów. Druga to warstwa programowa, która umożliwia świadczenie dodatkowych potrzebnych w systemie usług.

Z kolei Network Attached Storage to pamięć masowa składająca się z fizycznego urządzenia oraz zintegrowanego oprogramowania do zarządzania danymi. Jest zoptymalizowana do pełnienia funkcji serwera plików i zarządzania zasobami pamięci dostępnymi w firmowej sieci. W idealnym przypadku NAS może działać niezależnie od systemów operacyjnych i platform wykorzystywanych w firmie. Po podłączeniu do sieci dla wszystkich aplikacji NAS jest widoczny jako serwer, który może udostępniać dane bez potrzeby rekonfiguracji sieci i innych działających w niej serwerów.

Zobacz również:

Historia pamięci SAN i NAS liczy już kilkadziesiąt lat: swego czasu były rozwiązaniem rewolucyjnym, który pozwalał na współdzielenie zasobów pamięci w sieciach. Jeśli firma nie planuje w najbliższym czasie wykorzystania usług świadczonych w chmurze i chce oprzeć swój system IT na pamięciach masowych zainstalowanych we własnych centrach danych, menedżerowie powinni śledzić kierunki rozwoju technologii, bo zakup pamięci masowej to zwykle inwestycja na wiele lat. Rozwój technologii umożliwia stopniowe zwiększanie wydajności i pojemności takich systemów, np. z zastosowaniem pamięci SSD lub Optane oraz interfejsów i protokołów nowej generacji. Jednocześnie pojawiają się innowacyjne koncepcje modyfikacji architektury pamięci masowych. Niektóre z takich rozwiązań już są na rynku.

Po stronie technologii sprzętowych największy wpływ na rozwój pamięci masowych ma zastosowanie układów Flash (dyski SSD) i Optane oraz interfejsów NVMe i NVMe-oF (NVMe over Fabrics). Nowe architektury kryją się m.in. za takimi pojęciami, jak Software Defined Storage i Shared Accelerated Storage.

Jak wybrać pamięć masową. Klasyczne architektury SAN i NAS

Zarówno SAN, jak i NAS udostępniają dane za pośrednictwem sieci. W SAN-ach najczęściej stosowany jest wewnętrzny system sieciowy Fibre Channel, podłączany do sieci LAN za pomocą odpowiednich przełączników. Pamięci NAS są zwykle połączone za pomocą standardowych interfejsów Ethernet. W sieciach SAN dane są przechowywane w postaci bloków, a w pamięciach NAS jako pliki. Z punktu widzenia systemów operacyjnych urządzeń klienckich pamięć SAN jest widoczna typowo jako dysk przechowujący dane, a urządzenie NAS jako serwer plików.

Pamięci SAN są stosowane najczęściej do zapisu danych o zdefiniowanej strukturze, takich jak bazy danych, a pamięci NAS służą do przechowywania danych niemających struktury, np. pliki wideo lub obrazy. Dlatego też w wielu firmach stosowane są zarówno pamięci SAN, jak i NAS, co wynika z potrzeby efektywnego dopasowania działania pamięci masowej do wymagań różnych aplikacji.

SAN to system wykorzystujący dedykowaną sieć o wysokiej przepustowości i niezawodności, która zapewnia dostęp do urządzeń pamięciowych i wymianę danych na poziomie bloków. Sieć służy do transmisji między urządzeniami w obrębie systemu SAN i jest oddzielona od LAN. Jej architektura została tak zaprojektowana, by zapewnić wysoką wydajność i dostępność danych dla aplikacji działających w systemie. Oprócz tego alokacja zasobów i zarządzanie nimi są łatwiejsze niż w innych systemach pamięci masowej, bo nie ma potrzeby obsługi pamięci rozproszonych między różnymi serwerami. Dostępne zasoby mogą być wykorzystywane przez różne aplikacje, a ich pojemność dopasowywana do ich wymagań. System SAN ułatwia zarówno zarządzanie pamięcią, jak i ochronę przechowywanych w niej danych.

Głównymi elementami, z których składa się system SAN, są połączone w sieć urządzenia pamięci, serwery i przełączniki. Do wymiany danych mogą być stosowane różne protokoły. Podstawowym i najczęściej wykorzystywanym jest Fibre Channel. Inną opcją jest protokół Fibre Channel over Ethernet, który umożliwia wykorzystanie firmowego Ethernetu o wysokiej przepustowości do obsługi SAN i utworzenie jednolitej infrastruktury sieciowej w firmie. W sieciach SAN działających w małych i średnich firmach wykorzystywany jest też protokół Internet Small Computing System Interface, a w systemach High Performance Computing, o najwyższych wymaganiach na przepustowość, protokół InfiniBand.

Producenci pamięci masowych wciąż pracują nad zwiększeniem ich skalowalności i efektywności, a także możliwości zarządzania pamięciami masowymi. Jeśli chodzi o wydajność, to największy postęp jest związany z zastosowaniem półprzewodnikowych układów pamięci flash (dysków SSD). Dotyczy to zarówno pamięci SAN, jak i NAS. Popularyzacja SSD jest szczególnie widoczna w systemach SAN, bo migracja danych nieustrukturyzowanych do systemu pamięci flash jest w przypadku NAS nieco trudniejsza.

Jak wybrać pamięć masową. Zunifikowane pamięci masowe

Pamięć ujednolicona Unified Storage, określana również jako Multiprotocol Storage, to koncepcja połączenia blokowych i plikowych pamięci w jeden zunifikowany zasób, który może obsługiwać różne protokoły, takie jak: FC, iSCSI, NFS, SMB itd. Za pioniera w opracowywaniu takiego systemu uznawana jest firma NetApp, choć obecnie wielu producentów oferuje pamięci z opcjami pozwalającymi na obsługę różnych wymaganych przez użytkownika protokołów transmisji.

Ostatnio widać popularyzację wieloprotokołowych pamięci masowych przede wszystkim w systemach średniej wielkości. Zamiast wdrażać dwie niezależne platformy SAN i NAS, można kupić jeden system pamięci masowej obsługujący różne protokoły, a po zainstalowaniu kolejnej fizycznej pamięci podłączyć ją, zależnie od potrzeb, do sieci SAN lub NAS.

Jak wybrać pamięć masową. Protokół NVMe

Protokół komunikacyjny Non-Volatile Memory express został opracowany specjalnie pod kątem zastosowań w pamięciach masowych typu all-flash; wykorzystuje fizyczne interfejsy PCIe i nie obsługuje klasycznych dysków HDD. W odróżnieniu od używanego wcześniej w pamięciach masowych szeregowego SCSI, jest to protokół stosujący równoległą transmisję danych, który umożliwia jednoczesną obsługę nawet 64 000 zapytań.

Pierwsze systemy pamięci masowych używające NVMe pojawiły się na rynku w latach 2016–2017. Były to najczęściej specjalizowane urządzenia pamięci oferowane przez nowe, względnie mało znane firmy, w tym: Apeiron Data Systems, E8 Storage, Excelero czy Pavilion Data Systems. Nieco później najwięksi producenci też zaczęli wprowadzać do oferty pamięci wspierające NVMe. W pierwszej połowie 2018 r. na rynku pojawiło się wiele takich modeli, m.in.: Dell EMC PowerMax, HPE Nimble Storage, IBM FlashSystem 900, NetApp AFF A800 i Pure Storage FlashArray X.

Planując zakup nowej pamięci masowej, warto rozważyć zakup modelu wyposażonego w interfejsy obsługujące NVMe. Jednocześnie, jak radzą analitycy z IDC, należy zwracać uwagę, czy urządzenie można łatwo rozbudować i zmodernizować przez dodanie obsługi nowych technologii dopiero wchodzących na rynek, np. NVMe-oF lub Storage-Class Memory.

Jak wybrać pamięć masową. Architektura SAS i protokół NVMe-oF

Jednym z przykładów nowej generacji rozwiązań jest Shared Accelerated Storage. Technologia, wykorzystując m.in. interfejsy NVMe i pamięci flash, umożliwia zbudowanie systemu zapewniającego minimalne opóźnienia transmisji. Architektura SAS jest oparta na koncepcji rozproszonego systemu przetwarzania i przechowywania danych obsługującego interfejsy NVMe i NVMe-oF (protokół NVMe over Fabrics pozwala na współpracę z sieciami Fibre Channel, InfiniBand i Ethernet, umożliwiając odciążenie serwerów od obsługi pamięci masowych).

Wdrożenie systemu SAS ułatwia dostęp do rozproszonych w sieci zasobów pamięci przy wydajności porównywalnej z oferowaną przez pamięci DAS instalowane bezpośrednio w serwerach. Oprócz tego pozwala na odciążenie serwerów od obsługi operacji wejścia/wyjścia związanych z dostępem do pamięci masowej. Najważniejszymi obszarami zastosowań NVMe-oF będą: bazy danych OLTP, systemy do analityki w czasie rzeczywistym, aplikacje High-Performance Computing, np. do renderingu wideo, przetwarzania i analiz finansowych, handlu online, badań nad genami itd. – przewidują analitycy Gartnera.

Jak wybrać pamięć masową. Pamięci SCM

Storage-Class Memory to technologia, która w najbliższych latach zmieni architekturę pamięci masowych oraz wykorzystujących je aplikacji. W porównaniu do pamięci Flash pamięci SCM mają wydajność o kilka rzędów większą i znacznie dłuższy czas życia, przy zachowaniu wydajności przetwarzania operacji zapisu i odczytu. Przykładem już dostępnych na rynku pamięci klasy SCM są układy Intel Optane. Inne podobne technologie, takie jak: Resistive RAM, Magnetoresistive RAM, Phase Change Memory, Nonvolatile RAM lub HP Memristor, nie weszły jeszcze do masowej produkcji.

W SCM pamięć może być adresowana na poziomie bloków lub bajtów, co daje dużą elastyczność twórcom aplikacji. Na początku dla zapewnienia zgodności systemy operacyjne będą stosowały SCM jako pamięć blokową sformatowaną przez system plików lub bazę danych, ale kolejna generacja aplikacji może wykorzystać bezpośredni dostęp do zmapowanych w pamięci plików. Opcja adresowania pamięci na poziomie bajtów pozwala na uniknięcie potrzeby formatowania danych w standardowe 512-bajtowe bloki. Natomiast hiperwizory będą mogły udostępniać izolowane obszary pamięci SCM różnym maszynom wirtualnym zarówno jako pamięć operacyjną, jak zasób pamięci masowej.

Rozwiązania wykorzystujące pamięci SCM już zaczynają pojawiać się na rynku. Pod koniec 2018 r. HPE zapowiedziało wprowadzenie na rynek pamięci nowej kategorii określanych jako Memory-Driven Flash. Są to pamięci do zastosowań w centrach danych wykorzystujących aplikacje do analityki w czasie rzeczywistym, sztucznej inteligencji, obsługi dużych zbiorów danych, transakcji online i innego oprogramowania wymagającego szczególnie wysokiej wydajności systemu pamięci masowej.

„Wielu dostawców pamięci zaczęło wprowadzać do oferty urządzenia klasy korporacyjnej wyposażone w interfejsy NVMe, ale współpracujące z pamięciami NAND-flash, które nie są w stanie wykorzystać pełnej przepustowości tego złącza. Technologia HPE MDF używa pamięci Intel Optane jako warstwy buforowej pozwalającej na znaczne przyspieszenie zapisu lub odczytu danych praktycznie przez wszystkie stosowane obecnie aplikacje” – mówi Eric Burgener, analityk z IDC.

HPE wprowadziło do sprzedaży macierze 3Par wysokiej klasy, w których można instalować karty Optane, oraz zapowiedziało wprowadzenie na początku 2019 r. pamięci Nimble średniej klasy, wykorzystujących tę nową technologię. W macierzach 3Par wyposażonych w kontrolery z podłączonymi pamięciami Optane i interfejsami Fibre Channel, jak wynika z testów HPE, średnie opóźnienia wynoszą poniżej 200 mikrosekund, co jest wartością bardzo niską.

Jak wybrać pamięć masową. Liderzy rynku

Według IDC w III kwartale 2018 r. wartość sprzedaży systemów pamięci masowych wzrosła o 19,4% w porównaniu do analogicznego okresu poprzedniego roku, osiągając poziom 14 mld USD. Całkowita pojemność sprzedanych w tym kwartale pamięci była większa aż o 57,3% (113,9 eksabajta). Jeśli chodzi o różne kategorie pamięci masowych, to największy wzrost, wynoszący 45,8%, dotyczył urządzeń dostarczanych bezpośrednio do operatorów największych centrów danych, tzw. hyper-scale data center, przez producentów ODM.

Original Design Manufacturers to potraktowana łącznie przez IDC grupa producentów, którzy sprzedają pamięci masowe na zamówienie. Według IDC ich udział w rynku osiągnął poziom 27,7% (3,9 mld USD). Sprzedaż masowych pamięci zewnętrznych wzrosła o 12,5% (6,3 mld dol.), a pamięci instalowanych w serwerach o 10,1% (3,8 mld USD).

W najbliższych latach ranking ten może się zmienić. Warto zauważyć, że Lenovo i NetApp utworzyły w Chinach spółkę joint venture zajmującą się wytwarzaniem pamięci masowych oraz opracowywaniem oprogramowania do zarządzania danymi. Ma ona wzmocnić ich pozycję w konkurencji z dominującymi w tym segmencie rynku firmami Dell EMC i HPE. Pamięci oferowane przez tę firmę to przede wszystkim macierze hybrydowe i all-flash wspierające również nowej generacji interfejsy NVMe.

Dominującą pozycję na rynku pamięci masowych zarówno Dell, jak i HPE budowały przy wykorzystaniu przejęć innych firm; Dell przejął EMC, a HPE – Nimble Storage. Czy Lenovo chce skorzystać z tych doświadczeń i przejąć NetApp? Zdaniem analityków rynku dla Lenovo byłoby to dobre rozwiązanie, znacznie wzmacniające pozycję konkurencyjną firmy jako dostawcy infrastruktury dla korporacyjnych centrów danych. Joint venture może być przymiarką do takiego przejęcia. Pojawia się jednak pytanie, czy taka transakcja nie zostałaby zablokowana przez amerykańską administrację.

Pamięci masowe – prognozy

Według analityków Gartnera trzy technologie, które w ciągu najbliższych trzech do pięciu lat będą miały największy wpływ na modyfikację systemów pamięci masowej wykorzystywanych w firmach, to: pamięci nieulotne (SCM) nowej generacji, nowe protokoły do obsługi przepływu danych (NVMe) oraz popularyzacja specjalizowanych pamięci przeznaczonych do obsługi określonych aplikacji, np. backupu.


TOP 200