Plikowa, blokowa czy obiektowa pamięć masowa?

Czym się różnią systemy pamięci i jakie są ich zastosowania to wiedza ułatwiająca optymalny wybór typu lub typów pamięci masowej, które spełnią wymagania firmowego systemu IT.

Źródło: Pexels.com, Sergei Starostin.

Pamięć masowa to ważny i niezbędny element każdego system IT, a jego znaczenie rośnie zwłaszcza w czasach, gdy następuje transformacja cyfrowa oraz wzrost wykorzystania systemów sztucznej inteligencji i uczenia maszynowego, które intensywnie korzystają z dużych zbiorów danych.

Wybór rodzaju pamięci masowej wpływa na koszt inwestycji i łatwość dostępu do danych w przyszłości. Dlatego warto wiedzieć jakie rodzaje pamięci są dostępne, a następnie ocenić potrzeby firmy w zakresie przechowywania i udostępniania danych. Dopiero wówczas można wybrać najbardziej odpowiedni typ pamięci masowej.

Zobacz również:

  • Brak miejsca na dysku? Najlepsze metody na zwiększenie pamięci
  • Duże załączniki w poczcie e-mail - na co zwrócić uwagę?

W miarę pojawiania się nowych typów danych i ich zastosowań, firmy muszą stale oceniać i optymalizować infrastrukturę pamięci wykorzystywanych do obsługi różnych podzbiorów firmowych danych. Strategia i decyzje dotyczące pamięci masowej powinny też stale ewoluować wraz ze zmieniającymi się potrzebami biznesowymi i technologiami.

Trzy podstawowe typy pamięci znajdującej zastosowanie w firmach to pamięć plikowa, blokowa i obiektowa. Optymalny wybór zależy od rodzaju danych, ich ilości, aplikacji, które będą z danych korzystać, a także pożądanej wydajności i skalowalności systemu.

Pliki, bloki i obiekty to formaty przechowywania, które pozwalają na organizowania i prezentowania danych na różne sposoby, każdy z nich ma swoje możliwości i ograniczenia. System plikowy przechowuje, organizuje i reprezentuje dane w formie plików umieszczonych w hierarchicznym systemie folderów. System blokowy dzieli dane na dowolnie zorganizowane woluminy o równych rozmiarach. Natomiast system obiektowy łączy dane z powiązanymi z nimi metadanymi i umożliwia zarządzanie informacjami w systemach rozproszonych wykorzystujących na przykład pamięci funkcjonujące w systemach chmurowych.

Pamięci plikowe

W systemie pamięci plikowej wszystkie dane są zapisywane razem, w jednym pliku z rozszerzeniem określonym przez aplikację użytą do jego utworzenia. Zapisując dokument w sieci firmowej lub na dysku komputera z reguły korzysta się z pamięci plikowej. Również sieciowe urządzenia NAS (Network Attached Storage) są oparte na systemie plikowym. Inne przykłady urządzeń i usług służących do przechowywania plików to systemy pamięci chmurowej, dyski sieciowe, dyski lub pamięci półprzewodnikowe instalowane w komputerach, smartfonach i urządzeniach przenośnych.

System przechowywanie danych w formie plików wykorzystuje hierarchiczną strukturę. Pliki są umieszczane przez użytkownika w strukturze składającej się z folderów i podfolderów, co ułatwia ich znajdowanie. Aby uzyskać dostęp do pliku, użytkownik wybiera lub wprowadza ścieżkę, która obejmuje katalogi i podkatalogi oraz nazwę pliku. Użytkownicy tworzący plik mogą określać prawa dostępu do niego.

Niestety zarządzanie dużą liczbą plików i koszty niezbędnej do ich przechowywania pamięci masowej mogą stwarzać problem.

Główne zalety pamięci plikowych

- Przy małej lub umiarkowanej liczbie plików użytkownicy mogą łatwo je zlokalizować, a po kliknięciu otworzyć przy wykorzystaniu odpowiedniej aplikacji. Po zakończeniu pracy plik może być zapisany w tej samej lub innej lokalizacji.

- System pamięci plikowej jest dobrze znany większości użytkowników. Osoby z podstawowymi umiejętnościami obsługi komputera mogą z łatwością przeglądać zawartość plikowej pamięci masowej.

- Użytkownicy mogą zarządzać własnymi plikami i korzystając z prostego interfejsu tworzyć, przenosić lub usuwać swoje pliki.

- System plikowy umożliwia ustawianie praw dostępu na poziomie użytkownika. Użytkownik lub administrator systemu może określić plik jako pozwalający na zapis (co oznacza, że użytkownicy mogą wprowadzać zmiany), tylko do odczytu (użytkownicy mogą tylko przeglądać dane) lub zablokowany (tylko określeni użytkownicy mogą uzyskać dostęp). Pliki mogą być również chronione hasłem.

Podstawowe wady pamięci plikowych

- Hierarchiczna pamięć masowa dobrze działa w przypadku niewielkiej liczby kilkudziesięciu folderów. Zarządzanie plikami staje się coraz bardziej skomplikowane wraz ze zwiększaniem się liczby folderów, podfolderów i plików. Bo wówczas wzrasta czas potrzebny do znalezienie pożądanej treści co w efekcie może doprowadzić do istotnego zmniejszenia produktywności pracowników firmy.

- Chociaż w systemie plikowym możliwe jest zapisywanie nieustrukturyzowanych danych, takich jak teksty, obrazy, wideo, posty w mediach społecznościowych lub dane z czujników IoT, ale plikowa pamięć masowa zazwyczaj nie jest najlepszą opcją zwłaszcza do przechowywania dużej ilości danych nieustrukturyzowanych.

- Pamięć plikowa staje się zbyt kosztowna w systemach o dużej skali i pojemności. Jeśli pojemność pamięci w urządzeniach i systemie sieciowym zostanie wyczerpana, konieczny jest zakup dodatkowych urządzeń sprzętowych.

Pamięć blokowa

Jest to najprostsza forma pamięci będąca podstawą praktycznie wszystkich zewnętrznych typów pamięci masowej. Jej pojemność ma strukturę bloków (jednakowych segmentów danych), z których każdy ma swój własny identyfikator. Bloki mogą być przechowywane w różnych środowiskach, na przykład jeden w systemie Windows, a inny w systemie Linux. Gdy użytkownik pobiera dane, system pamięci masowej łączy bloki w jeden plik zawierający pożądany zestaw informacji.

Oprogramowanie systemowe baz danych i systemów operacyjnych może odczytywać, zapisywać lub aktualizować informacje zawarte w pojedynczych blokach.

Oprogramowanie i struktury danych, jak na przykład pliki, często przechowywane są w tysiącach bloków. Ponieważ aktualizacja danych jest możliwa na poziomie pojedynczych bloków, pamięć taka jest dobrym rozwiązaniem dla środowisk transakcyjnych wymagających niskiego poziomu opóźnień, bo jeśli nastąpi nieznaczna zmiana danych to wystarczy zaktualizować jeden lub kilka bloków, a nie cały plik lub segment danych.

Blokowe systemy pamięci masowej są wykorzystywane od dziesięcioleci. Jednak wiele firm odchodzi od stosowania takich rozwiązań przede wszystkim ze względu na ich ograniczoną skalowalność i brak obsługi metadanych.

Główne zalety blokowej pamięci masowej

- Wysoka szybkość dostępu. Gdy wszystkie bloki są przechowywane lokalnie lub blisko siebie, taka pamięć masowa zapewnia wysoką wydajność i niskie opóźnienia w pobieraniu danych. Dlatego jest to rozwiązanie często wybierane do przechowywania danych wykorzystywanych przez aplikacje o krytycznym znaczeniu dla działania firm.

- Niezawodność. Ponieważ bloki są przechowywane jako samodzielne jednostki, tego typu pamięci masowe mają niskie wskaźniki awaryjności.

- Łatwość modyfikacji danych. Zmiana danych nie wymaga tworzenia nowego bloku, tworzona jest tylko jego nowa wersja.

Podstawowe wady przechowywania danych w formie bloków

- Brak obsługi metadanych. Blokowa pamięć masowa nie zawiera metadanych i w efekcie jest mniej przydatna do przechowywania danych nieustrukturyzowanych. Brak metadanych ogranicza możliwości efektywnego przeszukiwania dużej liczby informacji zapisanych w pamięci blokowej. Utrudnia to też zarządzanie przechowywanymi danymi.

- Wysoki koszt. Zakup dodatkowej blokowej pamięci masowej jest kosztowny, a przy dużych wymaganiach na wysoką pojemność często nieopłacalny.

Gdzie najczęściej znajdują zastosowania blokowe pamięci masowe

- Bazy danych. Ponieważ blokowa pamięć masowa ma wysoką wydajność i jest łatwa do aktualizacji, wiele firm używa jej do obsługi transakcyjnych baz danych.

- Serwery poczty elektronicznej. Wysoka wydajność i niezawodność sprawiają, że blokowa pamięć masowa jest rozwiązaniem wykorzystywanym do przechowywania wiadomości e-mail.

- Systemy plików maszyn wirtualnych VMFS (Virtual Machine File System). Firmy często wykorzystują blokową pamięć masową do wdrażania systemu VMFS. Pamięć blokowa umożliwia łatwe utworzenie i sformatowanie woluminów do przechowywania systemu VMFS wykorzystywanego przez serwer fizyczny obsługujący wiele maszyn wirtualnych.

Pamięci obiektowe

Pamięć obiektowa to najmłodsza z wymienionych technologii. Jest to system, który obsługuje dane podzielone na oddzielne, samodzielne jednostki (obiekty), przechowywane na tym samym poziomie tzn. nie ma tu podkatalogów, jak w przypadku pamięci plikowej. Oprócz tego pamięć obiektowa nie przechowuje wszystkich danych w jednym pliku – element obiektu mogą być rozproszone między różnymi urządzeniami działającymi pod kontrolą różnych systemów operacyjnych. Ważnym elementem obiektów są metadane zawierające informacje o jego zawartości, co ułatwia przeszukiwanie i przetwarzanie danych.

Każdy obiekt ma unikalny numer i może być przechowywany lokalnie w pamięci masowej komputera lub na serwerach działających w chmurze. Aby uzyskać dostęp do obiektów i zarządzać nimi, aplikacja musi używać odpowiedniego interfejsu API.

Obiektowa pamięć masowa jest dobrym rozwiązaniem do obsługi dużych zbiorów danych. Oprogramowanie do zarządzania pamięcią można zainstalować na standardowych, ekonomicznych serwerach, a dane mogą swobodnie być przemieszczane w systemie. Względnie łatwo można też skalować zasoby pamięci i optymalizować je. Dla porównania, jest to trudniejsze do zrobienia w przypadku przechowywania plików, które są zablokowane w określonym katalogu zdefiniowanym przez ścieżkę dostępu i nazwę pliku.

Główne zalety pamięci obiektowej

- Możliwość obsługi dużych ilości danych nieustrukturyzowanych. Jest to szczególnie ważne w przypadku aplikacji wykorzystujących sztuczną inteligencję, uczenie maszynowe i analizę dużych zbiorów danych.

- Elastyczny, przystępny cenowo model udostępniania pamięci w chmurze. Zamiast płacić z góry za określoną ilość przestrzeni dyskowej, co jest powszechne w przypadku przechowywania plików, można kupować tylko tyle pamięci obiektowej, ile jest aktualnie potrzebne, a później skalować jej pojemność w praktycznie nieograniczonym zakresie.

- Wykorzystanie metadanych. Ponieważ wraz z obiektami przechowywane są metadane zawierające informacje o ich zawartości i innych właściwościach ułatwia to i przyspiesza wyszukiwanie potrzebnych danych.

Podstawowe wady

- Brak możliwości modyfikacji pojedynczych fragmentów pliku. Po utworzeniu obiektu nie można go zmienić; można jedynie ponownie utworzyć nowy obiekt.

- Mniejsza wydajność niż w przypadku innych typów pamięci masowej. Format pliku tworzącego obiekt wymaga więcej czasu na przetwarzanie niż w przypadku pamięci plikowych lub blokowych.

- Ograniczone możliwości blokowania dostępu do obiektów. Z reguły użytkownicy, którzy uzyskają dostęp do pamięci chmurowej, sieci lub urządzenia mogą też uzyskać dostęp do przechowywanych tam obiektów.

- Pamięć obiektowa nie współpracuje dobrze z tradycyjnymi bazami danych, ponieważ zapisywanie obiektów jest powolnym procesem, a tworzenie aplikacji korzystających z interfejsu API do przechowywania obiektów nie jest tak proste, jak w przypadku systemu plikowego.

Niektóre zastosowania obiektowej pamięci masowej

- Obiektowa pamięć masowa jest podstawą usług przechowywania danych w chmurze, zwłaszcza tych, które zawierają dane nieustrukturyzowane takie, jak pliki audio, wideo lub graficzne.

- Zarządzanie danymi IoT. Możliwość szybkiego skalowania i łatwego pobierania danych sprawia, że obiektowe pamięci masowe są dobrym wyborem w przypadku systemów IoT, w których liczba danych szybko rośnie.

- Poczta e-mail. Firmy, które muszą przechowywać dużą liczbę wiadomości ze względu na konieczność zapewnienia zgodności z regulacjami prawnymi często wybierają obiektową pamięć masową jako główne repozytorium zapewniające dużą skalowalność oraz atrakcyjną cenę.

- Backup/odzyskiwanie danych. Firmy często wybierają obiektową pamięć masową do przechowywania kopii zapasowych i odzyskiwania danych po poważnej awarii, ponieważ w tym przypadku wysoka wydajność pamięci najczęściej nie jest parametrem o krytycznym znaczeniu.

- Systemy wideo-monitoringu. Obiektowa pamięć masowa stanowi przystępną cenowo opcję dla firm, które muszą przez wiele lat przechowywać zbiory nagrań wideo.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200