NFS 4.2 usprawni przesyłanie plików

NFS to obok FTP najważniejszy protokół transmisji plików. Jego nowa wersja może stać się standardem przesyłania danych w środowiskach zwirtualizowanych.

NFS to stary protokół służący do transmisji plików w sieciach, opracowany początkowo przez firmę Sun dla własnych potrzeb w 1988 r. W 1990 pojawiła się jego druga wersja (RFC1094), wydanie NFSv3 pochodzi z 1990, a obecny standard oznaczony numerem 4.1 został opublikowany w 2010. Wymagania związane z elastycznością niezbędną w dzisiejszych środowiskach IT były podwalinami do opracowania zmian, które utworzą najnowszą wersję tego protokołu - NFS 4.2. W porównaniu do NFSv3 będą to usprawnienia związane z bezpieczeństwem, skalowalnością i lepszym zarządzaniem - opcje mogą sprawić, że będzie to preferowany protokół transmisji rozproszonych plików w wirtualizowanym środowisku. Specyfikacja NFSv4.2 ma być wydana w pierwszej połowie 2012, a implementacja funkcji powinna następować szybko. Warto rozważyć wykorzystanie protokołu przy modernizacji infrastruktury.

Przyjrzyjmy się pięciu najważniejszym usprawnieniom, jakie pojawiają się w wersji 4.2 protokołu NFS.

1. Kopia po stronie serwera

Wirtualizacja oznacza swobodę przetwarzania danych. Aplikacje nie są już przywiązane do fizycznego sprzętu w pojedynczym centrum przetwarzania danych i mogą być łatwo przenoszone między serwerami. Ale każda z aplikacji ma własne dane, do których się odwołuje. Przeniesienie maszyny do innej lokalizacji wymaga przeniesienia danych - obecnie ten proces wymaga zestawienia trójstronnego połączenia, by klient przekopiował dane z jednego serwera do drugiego.

Kopia po stronie serwera, czyli SSC (Server-Side Copy), usuwa jedno z połączeń. Zamiast odczytywania wszystkich plików lub katalogów z plikami dla klienta, który następnie zapisze je w nowej lokalizacji, SSC umożliwia komunikację między serwerami. Dane są przenoszone w pojedynczym bezpośrednim połączeniu serwer-serwer, zamiast trójstronnego serwer-klient-serwer.

2. Gwarantowana rezerwacja

Granicą przydzielania miejsca jest pojemność fizycznych dysków. Wielu administratorów zdaje sobie sprawę, że użytkownicy pragną przydzielenia większej ilości miejsca, niż potrzebują, czasami o rząd wielkości. By pogodzić ograniczenia związane z kosztami zakupu przestrzeni dyskowej z sygnalizowanymi potrzebami użytkowników, wprowadzono thin provisioning, nazywany nadrezerwacją. Chociaż technika ta jest powszechnie stosowana, może powodować problemy w szybko rozwijających się środowiskach. Wtedy jest możliwe, że dwóch użytkowników jednocześnie zażąda ponad 50% wolnej przestrzeni dyskowej na macierzach w ramach o wiele większego przydziału dla nich widocznego. Gwarantowana rezerwacja miejsca obecna w NFS 4.2 zapewnia, że niezależnie od polityki thin provisioning miejsce na pliki zostanie przydzielone.

3. Zwrot nieużywanego miejsca

Chociaż alokacja z wyprzedzeniem jest możliwa w przypadku niektórych typów danych, może pogarszać wykorzystanie przestrzeni dyskowej. Gdy hypervisor tworzy plik dysku wirtualnego, często wstępnie alokuje miejsce. Aplikacje często wypełniają taki plik zerami, co jest mało sprawne z punktu widzenia obciążenia wejścia/wyjścia i pogarsza wykorzystanie przestrzeni dyskowej. Aby usprawnić składowanie danych, nowy protokół wprowadza obsługę prealokowanych plików, w których nieużywane, a wyzerowane części dużego pliku są zwracane do puli wolnego miejsca. Dla klienta ta funkcjonalność jest niezauważalna.

4. Bloki danych zapisywane przez aplikacje

Zwracanie nieużywanego miejsca to czasami zbyt mało - niektóre aplikacje zamiast wypełniać zerami, zapisują pewien zbiór danych, tworzący wzór, który służy potem do skomplikowanych sprawdzeń spójności plików. Opcja Application Data Blocks (ADB) rozwiązuje problem, umożliwiając zdefiniowanie przez aplikację formatu bloków danych, które będą deduplikowane, zmniejszając rozmiar zajętego miejsca. Jeśli aplikacja wysyła bloki danych o znanej postaci i wypełnia nimi plik, ADB można będzie "nauczyć" cech tego bloku, dzięki czemu NFS rozpozna fakt inicjalizacji pliku i zapisze informację. Przy odczycie zwróci właściwą postać bloku do aplikacji, unikając wielokrotnego zapisu tego samego wzoru danych na dyskach. Tak mechanizmy kontroli spójności plików danych w aplikacji zwrócą sukces, ale sprytny system plików zmniejsza znacząco obciążenie podsystemu wejścia/wyjścia.

NFSv4.2 będzie mógł przeprowadzić bardzo szybką i oszczędną pod względem miejsca operację inicjalizacji zasobów danych.

5. Poprawa wejścia/wyjścia w aplikacjach

Nowe wydanie NFS umożliwi zaplanowanie operacji wejścia/wyjścia, by maksymalnie wykorzystać możliwości, jakie daje nowoczesna technologia stosująca podział na warstwy (tier) i bufory z pamięcią półprzewodnikową (SSD) pomiędzy pamięcią DRAM a wolniejszymi dyskami. Dzięki temu przy odczycie sekwencyjnym danej partii danych będzie wprowadzane wcześniejsze doczytywanie z dysków (read ahead), przy wielokrotnym zapisie i odczycie zintensyfikuje się wykorzystanie szybkiej pamięci podręcznej. Jeśli dane będą tylko zapisywane bez późniejszego odczytu w krótkim czasie, zapis nie będzie przechodzić przez cache, by uniknąć zaśmiecania pamięci podręcznej.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200