By informacja była wartościowa

W dużych firmach zaledwie 10% plików jest wykorzystywanych na bieżąco. Dotarcie do potrzebnych danych wymaga odpowiedniego zarządzania jej zasobami.

Większość informacji w firmach jest w postaci niestrukturalnej - zapisana w dokumentach tekstowych, arkuszach kalkulacyjnych czy plikach PDF. Materiały te zazwyczaj zapisane są w zasobach dyskowych udostępnianych zgodnie ze strukturą organizacyjną przedsiębiorstwa.

Rzadko zdarza się, że zasoby są przypisywane do spraw i we wszystkich plikach panuje porządek. Częściej mamy do czynienia ze zjawiskiem odwrotnym. W różnych zasobach znajduje się mnóstwo plików, a w wielu miejscach magazynuje się wiele kopii tego samego pliku w różnych stadiach jego tworzenia.

Polityka backupowa zakłada kopiowanie wszystkich zasobów do zapasowego medium, a więc przechowuje się nadmiar informacji. Wprowadzenie deduplikacji rozwiązuje jeden z problemów - redukuje miejsce, na którym przechowywane są pliki - ale nie sprawia, że można zapanować nad zasobami.

Gdzie są pliki?

Przez kilka lat ciągłej pracy nad dokumentami pojawia się dylemat związany z lokalizacją aktualnych wersji plików. Dokumenty rozproszone są po różnych miejscach: użytkownicy przechowują je na pulpicie, w swoich katalogach w profilu, na wspólnych dyskach sieciowych, a nawet na dyskach lokalnych. Pierwszym krokiem jest zazwyczaj wprowadzenie wędrujących profili z przekierowaniem folderów na serwer sieciowy. W następnym etapie warto opracować politykę przechowywania informacji, by zapewnić ich dostępność przy niskich kosztach składowania.

Nieużywane odłożyć na bok

W dużych firmach zaledwie około 10% plików jest wykorzystywanych na bieżąco. Pozostałe znajdują się w zasobach storage, ale otwierane są rzadko. Zamiast przechowywać komplet informacji na nośniku online, warto zastanowić się nad wprowadzeniem narzędzi, które przechowają pliki w deduplikowanym zasobie. Dzięki temu zmniejsza się ilość danych przechowywanych na dyskach, a pliki nadal są dostępne online.

Backup jako narzędzie przechowania

Ze względu na nierównomierność dostępu do różnych plików firmy podejmują decyzję o odłożeniu nieużywanych obiektów do nośników backupowych, a następnie o usunięciu ich z poprzedniej lokalizacji. Wymaga to narzędzi, które potrafią sprawnie katalogować przenoszone zasoby, by potem móc je odtworzyć. Możliwości takie ma dziś każde oprogramowanie backupowe, zapewniając retencję danych. Pliki trwale przenoszone na taśmę lub dyski deduplikatora mogą być oznaczone jako "niekasowalne", czyli z zapewnionym przechowywaniem.

Metoda sprawdza się przy pracy z plikami, ale przy poczcie elektronicznej sprawia problemy, gdyż zasoby serwerów, takich jak Exchange, wymagają oprogramowania, które potrafi odtworzyć wybrane obiekty. Opcja "granular recovery" umożliwia odtworzenie wiadomości z wybranego okresu bez konieczności odtwarzania całego zasobu bazy Exchange.

Przeszukać kopię

Jeśli chronione zasoby są bardzo duże, znalezienie przeznaczonych do odtworzenia obiektów staje się znacznie trudniejsze. Niekiedy nie są znane daty powstania obiektów ani ich nazwy, ale cechy, takie jak: adresat e-mail, załącznik wiadomości czy fragment treści pliku. Technologią, która będzie pomocna jest pełnotekstowe przeszukiwanie zapisanych kopii bezpieczeństwa. Razem z przywracaniem fragmentów zasobów umożliwia to np. odtworzenie wybranych wiadomości kierowanych do wskazanej osoby i zawierających oczekiwaną frazę i załącznik.

Dane w wielu oddziałach

Wprowadzenie deduplikacji niesie ze sobą zmiany w strukturze przechowywania informacji. Jeśli jest to firma wielooddziałowa, centralizowany backup sprawia, że informacje są przenoszone do jednego miejsca. Jeśli występuje potrzeba ich odtworzenia, a więc przeniesienia w drugą stronę, muszą zostać złożone do poprzedniej postaci, a następnie przesłane przez sieć. Na rynku pojawiły się rozwiązania umożliwiające przenoszenie danych przez WAN w formie zdeduplikowanej. Są one obecne w ofercie firmy HP.

Zagadnienia związane z przechowywaniem i przetwarzaniem informacji w firmie były jednym z tematów konferencji HP Discover 2012.

Medium zależne od potrzeb

Napędy taśmowe charakteryzują się najniższym kosztem długoterminowego przechowywania danych. Niemniej w firmach pojawiła się silna konkurencja w postaci deduplikatorów, na które można wysłać strumień danych z oprogramowania backupowego. Narzędzia umożliwiają bardzo szybkie odtworzenie zapisanych danych, szybki backup i niewrażliwość na zmianę prędkości dostarczania danych. Dla porównania, streamer wymaga stałego strumienia danych zapewniającego wysycenie napędu.

Deduplikatory najważniejszych firm umożliwiają odkładanie nie tylko plików i folderów (pracując jako NAS), ale także mogą działać jako wirtualny napęd taśmowy. Dzięki temu istniejące oprogramowanie backupowe może odkładać strumień danych z chronionych tradycyjnie serwerów na deduplikator tak samo jak na streamer. Informacja o szczególnym znaczeniu, która musi być wyniesiona poza siedzibę firmy na trwałym nośniku, może być zapisana na taśmę. Działanie to można przeprowadzić także dwustopniowo - kopiując dane na zasób deduplikatora podczas okna backupowego, a następnie kopiując dane na taśmę poza nim.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200