Jak przechować więcej za mniej

Subskrybuj RSS A A A
27 maja 2008
Krzysztof Jakubik

Jeśli zaczyna brakować pojemności pamięci masowej, najprostszym rozwiązaniem jest zakup dodatkowych macierzy. Są jednak również inne sposoby.

Jeśli zaczyna brakować pojemności pamięci masowej, najprostszym rozwiązaniem jest zakup dodatkowych macierzy. Są jednak również inne sposoby.

K ażdy administrator odpowiedzialny w centrum danych za pamięci masowe z pewnością zauważył, że ilość przechowywanych tam danych jest znacznie większa od ilości przechowywanych informacji. Backup, nad którym utracono kontrolę, często wykonywany jest po kilka razy na różnych nośnikach, wielokrotne zabezpieczane są te same pliki, nie mówiąc już o kopiach systemu operacyjnego, czy kopiach migawkowych maszyn wirtualnych. Takie przykłady można mnożyć. Gdy wolna przestrzeń w macierzach dyskowych i bibliotekach taśmowych kurczy się, trzeba zaplanować zakup dodatkowego sprzętu, a może lepiej bliżej przyjrzeć się temu problemowi i ograniczyć ilość przechowywanych danych lub poprawić organizację ich przetwarzania.

Eliminacja zbędnych danych

Od przynajmniej dwóch lat rynek pamięci masowych szturmem zdobywa nowa koncepcja - deduplikacja. To odpowiedź na przeładowanie danymi systemów backupu, kurczące się okno backupowe lub brak pieniędzy w budżecie na rozbudowę i powiększanie pojemności systemu. Technologie deduplikacji pozwalają na przeprowadzenie automatycznej, skrupulatnej analizy danych w celu wyszukania dwu lub wielokrotnie powtarzających się plików. Efekty jej działania są czasem zadziwiające.

Deduplikacja to operacja wykonywana automatycznie przez oprogramowanie, najczęściej w macierzy dyskowej, dzięki której możliwe jest wyeliminowanie powtarzających się danych (ich duplikatów). Umożliwia ona przechowywanie jedynie unikatowych plików lub bloków z danymi powodując w ten sposób znaczne oszczędności w postaci uwolnienia przestrzeni dyskowych w macierzach. Oprogramowanie to często pozwala jednocześnie na kompresję danych, co oczywiście daje dodatkowy zysk. Przy szybko rosnącej ilości przechowywanych informacji funkcje te zaczynają nabierać szczególnie istotnego znaczenia. Tym bardziej że regulacje prawne coraz częściej zmuszają firmy do archiwizowania danych nawet przez dziesiątki lat.

Eksplodujący rynek deduplikacji
Firma analityczna The 451 Group opracowała raport, w którym wskazuje deduplikację jako technologię, która będzie miała w najbliższych latach wielki wpływ na kształt całego rynku ochrony danych. Bo deduplikacja jest już obecnie przyjmowana z otwartymi rękoma przez firmy, które cierpią na problem ogromnego przyrostu danych. Zdaniem analityków z The 451 Group, przez ostatnie trzy lata rynek deduplikacji wzrósł ze stanu zerowego do ponad 100 mln USD w 2006 r. i 260 mln USD w 2007 r. Realną prognozą na 2009 r. jest możliwość osiągnięcia sprzedaży na poziomie 1 mld USD. Oprócz tego warto zauważyć, że technologia deduplikacji bardzo szybko ewoluuje od oferty niezależnych produktów do funkcji standardowo integrowanych w zaawansowanych rozwiązaniach infrastruktury backupowej. Kolejnymi etapami tej ewolucji będzie zastosowanie tej technologii w systemach do archiwizacji, a następnie również rozwiązaniach do bieżącego przetwarzania danych.


Technologie deduplikacyjne świetnie sprawdzają się też jako mechanizm eliminacji powtarzających się załączników poczty elektronicznej, przechowywanych w serwerach pocztowych lub archiwach. Jedną z najbardziej efektywnych metod wdrażania deduplikacji jest wykorzystanie wirtualnych bibliotek taśmowych VTL (Virtual Tape Library) - macierzy dyskowych z wbudowanym oprogramowaniem, które emuluje napędy taśmowe bądź całe urządzenie automatyki taśmowej, czyli zmieniacze i biblioteki. To właśnie w tym oprogramowaniu mogą być dodatkowo zaszyte funkcje deduplikacji.

Chociaż w swej idei eliminacja powtarzających się danych jest pomysłem oczywistym, to jej praktyczna realizacja wymaga zastosowania zaawansowanych mechanizmów analizy i zarządzania danymi. Bo nie wystarczy sama eliminacja tych samych plików przechowywanych w różnych katalogach, załączników poczty lub nawet pojedynczych bloków w bazach danych, trzeba jeszcze zapewnić użytkownikom lub aplikacjom dostęp do informacji oraz odpowiedni poziom bezpieczeństwa, by nie okazało się, że ważne informacje nieoczekiwanie zniknęły z systemu. Zyski mogą być jednak ogromne. Według analityków, wdrożenie oprogramowania do deduplikacji często pozwala na nawet 20-krotną redukcję liczby przechowywanych danych.

Metody deduplikacji

Systemy deduplikacji jeszcze przez dość długi czas nie znajdą powszechnego zastosowania jako oprogramowanie zintegrowane w macierzach dyskowych wykorzystywanych jako pamięć masowa obsługująca aplikacje. Wynika to głównie z ograniczonej wydajności przetwarzania danych, ale także braku ogólnie przyjętych standardów. Deduplikacja świetnie sprawdza się jednak tam, gdzie zabezpieczone dane można dodatkowo przetworzyć w późniejszym czasie, czyli na przykład w systemach do backupu.

Sposób na deduplikację

  • Avamar, Asigra i Symantec - element oprogramo-wania do tworzenia kopii bezpieczeństwa;

  • Data Domain, Diligent Technologies i ExaGrid Systems - brama filtrująca dane przed zapisaniem na dysku lub macierzy dyskowej;

  • FalconStor Software, Quantum i Sepaton - wirtualna biblioteka taśmowa, gdzie wszystkie dane są najpierw zapisywane, a dopiero później jest uruchamiany proces deduplikacji;

  • EMC i NetApp - macierz dyskowa wyposażona w zintegrowane mechanizmy deduplikacji.


Oceń artykuł

średnio: 0 liczba ocen: 0
1  2  dalej »

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88