14 rzeczy, które warto wiedzieć o zarządzaniu przechowywaniem danych

„W kwestii przechowywania danych, nie istnieje jedno rozwiązanie pasujące do wszystkich'" - mówi Orlando Scott-Cowley, Messaging, Security and Storage Evangelist w Mimecast, dostawcy usług przechowywania i zabezpieczania danych w chmurze i na urządzeniach mobilnych.

14 rzeczy, które warto wiedzieć o zarządzaniu przechowywaniem danych

Fot. ThisIsEngineering, Pexels

Przed podjęciem decyzji o tym, gdzie lub jak będą przechowywane dane strukturalne i nieustrukturyzowane, „firmy muszą najpierw zrozumieć ilość i rodzaj posiadanych danych oraz motywację, która stoi za przechowywaniem informacji" - mówi Cowley. „Posiadanie takich podstaw pomoże określić, jaką drogę należy obrać, czy będzie to budowanie rozwiązań na miejscu, czy przeniesienie do chmury" lub jakaś kombinacja tych dwóch rozwiązań.

Jak upewnić się, że dane, które powinny być archiwizowane, są archiwizowane?

Jak więc sformułować rozsądną strategię zarządzania przechowywaniem danych? Serwis CIO.com zapytał kilkudziesięciu ekspertów w dziedzinie pamięci masowej i zarządzania danymi, co zaowocowało przedstawieniem 14 najważniejszych sugestii dotyczących kroków, jakie należy podjąć w celu wybrania odpowiedniego rozwiązania (rozwiązań) do przechowywania danych dla swojej organizacji - i jak można lepiej zadbać o to, aby dane były odpowiednio chronione i możliwe do odzyskania.

Zobacz również:

  • WhatsApp zaczyna szyfrować kopie zapasowe danych w trybie E2EE
  • HPE przejmuje Zerto
  • Konsolidacja i ujednolicony dostęp dla systemów obrazowania PACS

1. Poznaj swoje dane

„Dane nie są sobie równe - a zrozumienie ich wartości biznesowej ma kluczowe znaczenie dla określenia strategii przechowywania danych" – mówi Souvik Choudhury, starszy dyrektor ds. zarządzania produktami w SunGard Availability Services. Dlatego formułując politykę zarządzania przechowywaniem danych, należy zadać sobie następujące pytania:

- Jak szybko potrzebuję odzyskać dane w przypadku ich utraty?

- Jak szybko muszę mieć dostęp do danych?

- Jak długo muszę przechowywać dane?

- Jak bezpieczne muszą być dane?

- Jakie wymogi prawne muszą zostać spełnione?

2. Nie zaniedbuj danych nieustrukturyzowanych

„Pomyśl o tym, jak możesz połączyć wielostrukturalne dane z systemów transakcyjnych z półstrukturalnymi lub nieustrukturyzowanymi danymi z serwerów poczty elektronicznej, sieciowych systemów plików itp." - mówi Aaron Rosenbaum, dyrektor ds. zarządzania produktami w MarkLogic, dostawcy rozwiązań bazodanowych. „Upewnij się, że platforma do zarządzania danymi, którą wybierzesz, pozwoli ci połączyć wszystkie te typy bez poświęcania miesięcy na modelowanie danych".

3. Zrozum swoje potrzeby w zakresie zgodności z przepisami

„Jeśli jesteś spółką notowaną na giełdzie lub działasz w wysoce regulowanej branży, takiej jak usługi finansowe lub opieka zdrowotna, poprzeczka została ustawiona wysoko w zakresie zgodności i bezpieczeństwa" - mówi Jay Atkinson, dyrektor generalny dostawcy usług hostingowych w chmurze AIS Network.

„Jeśli zdecydujesz się na outsourcing przechowywania danych i zarządzania nimi, upewnij się, że dostawca usług zarządzanych posiada referencje niezbędne do zapewnienia bezpiecznego, zgodnego z przepisami środowiska. Brak pełnej zgodności może prowadzić do poważnych kar w późniejszym czasie" - mówi Atkinson.

4. Ustanowienie polityki przechowywania danych

„Ustalenie właściwych zasad przechowywania danych jest niezbędne zarówno dla wewnętrznego zarządzania danymi, jak i dla zachowania zgodności z przepisami prawa" - mówi Chris Grossman, starszy wiceprezes ds. aplikacji korporacyjnych w Rand Worldwide i Rand Secure Archive, dostawcy rozwiązań do archiwizacji danych i zarządzania nimi. „Niektóre z Twoich danych muszą być przechowywane przez wiele lat, podczas gdy inne mogą być potrzebne tylko przez kilka dni".

„Podczas konfigurowania procesów należy zidentyfikować najważniejsze dane organizacji i odpowiednio uszeregować zasoby zarządzania pamięcią masową" - mówi Scott-Cowley. „Na przykład, poczta elektroniczna może być priorytetem firmy, ale przechowywanie i archiwizowanie danych poczty elektronicznej dla jednej konkretnej grupy, powiedzmy kadry kierowniczej, może być bardziej krytyczne niż dla innych grup" - mówi. „Upewnij się, że te priorytety są ustalone, aby zasoby zarządzania danymi mogły być skoncentrowane na najważniejszych zadaniach".

5. Szukaj rozwiązania, które pasuje do twoich danych, a nie na odwrót

„Wiele osób uważa, że jedynym wyborem jest to, czy potrzebują DAS, SAN czy NAS" - mówi Olivier Thierry, dyrektor ds. marketingu w firmie Pivot3, dostawcy konwergentnej, wysoce dostępnej współdzielonej pamięci masowej i urządzeń do obsługi serwerów wirtualnych. „To ważne wybory, ale niewystarczające" - kontynuuje.

„Podczas gdy sieć Fibre Channel SAN może być świetna do wykonywania wielu operacji odczytu/zapisu o niskiej latencji na dość uporządkowanej bazie danych, nie jest ona zazwyczaj przeznaczona do pracy z delikatnymi, nieuporządkowanymi plikami wideo" - mówi Thierry. Dlatego „zamiast wybierać strategię uniwersalną, wielu kupujących bierze pod uwagę charakterystykę obciążenia i wybiera strategię pamięci masowej odpowiednią dla danego zadania".

Podobnie, „należy szukać rozwiązania, które zapewnia elastyczność wyboru miejsca przechowywania danych: w siedzibie firmy i/lub w chmurze" - mówi Jesse Lipson, założyciel ShareFile oraz wiceprezes i dyrektor generalny ds. udostępniania danych w firmie Citrix. „Rozwiązanie powinno umożliwiać wykorzystanie istniejących inwestycji w platformy danych, takie jak udziały sieciowe i SharePoint".

A jeśli, jak wiele firm w dzisiejszych czasach, zatrudniasz pracowników mobilnych, wybrane rozwiązanie do zarządzania danymi i ich przechowywania „powinno być zoptymalizowane pod kątem platform mobilnych i wirtualnych, oprócz komputerów stacjonarnych i laptopów - oraz zapewniać spójne wrażenia na każdej platformie, w tym możliwości edycji mobilnej i intuicyjną obsługę na urządzeniach mobilnych, wirtualnych lub stacjonarnych".

6. Nie pozwól, aby koszty początkowe podyktowały twoją decyzję

„Prawdziwy koszt pamięci masowej wynika z eksploatacji rozwiązania przez kilka lat" - mówi Antony Falco, współzałożyciel i dyrektor generalny Orchestrate.io. Dlatego „upewnij się, że naprawdę rozumiesz swoje koszty operacyjne [lub całkowity koszt posiadania]: personel, pomoc techniczna innych firm, monitorowanie, a nawet prawdopodobieństwo utraty danych, co z pewnością wiąże się z kosztami" - mówi. „Wszystkie te koszty szybko przewyższają koszty początkowe zakupu i wdrożenia".

„Wielu użytkowników kupuje pamięć masową (systemy lub usługi) ze względu na duże rabaty początkowe lub zaniedbuje przemyślenie kosztów wybranej pamięci masowej w perspektywie kilku lat" - dodaje Jon Hiles, starszy menedżer produktu w firmie Spectra Logic, dostawcy rozwiązań pamięci masowej.

„Uwzględnienie skalowalności, odświeżania technologii i kosztów operacyjnych, takich jak zasilanie, administracja, powierzchnia i odnowienie wsparcia technicznego w czasie może znacząco wpłynąć na decyzję przy zakupie pamięci masowej" - mówi Hiles. „Rozważenie długofalowych implikacji tych cech pamięci masowej i zakup pamięci masowej, która zapewnia najlepszy całkowity koszt posiadania w czasie, zmniejsza szansę, że długofalowe koszty znacznie przekroczą krótkoterminowe rabaty".

7. Stosuj warstwowe podejście do pamięci masowej

„Oszczędzaj pieniądze, używając najszybszej pamięci masowej, takiej jak SSD, tylko do danych, z których aktywnie korzystasz, i wykorzystuj tańsze platformy, takie jak chmura, do przechowywania danych archiwalnych lub kopii zapasowych" - mówi Aaron Rosenbaum, dyrektor ds. zarządzania produktami w firmie MarkLogic, dostawcy rozwiązań bazodanowych. „Upewnij się, że twoje systemy mogą wykorzystywać różne warstwy pamięci masowej, aby w miarę jak zmieniają się potrzeby wydajnościowe aplikacji, nie trzeba było jej ponownie projektować".

8. Poznaj swoje chmury

„Różne chmury pamięci masowej nie są sobie równe" - ostrzega Andres Rodriguez, dyrektor generalny firmy Nasuni, która dostarcza infrastrukturę pamięci masowej jako usługę. „Niektóre chmury są zoptymalizowane do obsługi archiwizacji, inne mają wydajność i stabilność, aby działać jako back-end dla podstawowego systemu przechowywania danych, a jeszcze inne nie są warte ryzyka" - wyjaśnia. „Najniższa cenowo chmura może okazać się znacznie droższa w dłuższej perspektywie, jeśli dane zostaną utracone lub będą niedostępne".

9. Starannie zweryfikuj dostawców pamięci masowej

„Na rynku istnieje wiele opłacalnych rozwiązań pamięci masowej, które spełnią twoje wymagania" - mówi Mike Garber, starszy dyrektor ds. zarządzania platformą u dostawcy ubezpieczeń zdrowotnych Independence Blue Cross. „Wybierz dostawcę pamięci masowej, który ma doskonałą pomoc techniczną i sprawdzony zespół ds. obsługi klienta" - mówi. „Kiedy w sieci pamięci masowej pojawiają się problemy, mają one zazwyczaj duży wpływ na organizację. Zdolność do rozwiązywania tych problemów w odpowiednim czasie będzie miała kluczowe znaczenie dla twojego sukcesu".

Ważne jest również, aby „sporządzić listę wszystkiego, co chcesz, aby robiło twoje rozwiązanie do ochrony danych - i zapytać sprzedawców, jak wiele z tej listy mogą pokryć" - mówi Jarrett Potts, dyrektor marketingu dostawcy rozwiązań do tworzenia kopii zapasowych danych STORServer.

„Organizacje poszukujące dostawców pamięci masowej powinny zwrócić szczególną uwagę na pojemność, wydajność, dostępność i odporność na awarie" - mówi Milton Lin, Master Cloud Specialist w firmie Force 3, która dostarcza różnorodne rozwiązania technologiczne. „Ważne jest również, aby szukać dostawców, którzy oferują innowacyjne funkcje, takie jak thin provisioning, tiering i deduplikacja".

Wreszcie, należy pamiętać, że „nie można przenieść całego ryzyka związanego z danymi po prostu poprzez przechowywanie ich w obiekcie zewnętrznym", ostrzega Chris Reffkin, starszy menedżer w dziale Risk Consulting w Crowe Horwath LLP. "To organizacja jest ostatecznie odpowiedzialna za swoje dane", mówi.

"Odpowiedzialność ta obejmuje przeprowadzanie due diligence nie tylko podczas zakupów, ale przez cały cykl życia relacji z dostawcą. Oznacza to również, że jeśli zdarzy się najgorszy scenariusz, [trzeba] mieć odpowiednią umowę w miejscu, aby pokryć koszty naruszenia, itp.

10. Nie przechowuj nadmiarowych danych

"Wiele firm nie ma planu przechowywania danych" - mówi Michael Clapperton, dyrektor ds. informatyki w George Little Management, firmie zajmującej się organizacją targów. Zamiast tego "mają tendencję do przechwytywania i przechowywania nadmiarowych danych" - mówi.

„Kiedyś, gdy dyski były drogie, stanowiło to mniejszy problem; firmy były znacznie ostrożniejsze w planowaniu tego, co mają przechowywać" - mówi Clapperton. „Jednak w czasach, gdy pojemność jest bardziej przystępna cenowo, pojawia się tendencja do przechowywania wszystkiego. Problemem jest identyfikacja tego, co jest ważne, a co przestarzałe, a także wydajność bazy danych". Dlatego przed decyzją o przechowywaniu danych należy je przeanalizować i „wybrać najbardziej wiarygodne źródło", usuwając kopie.

11. Upewnij się, że twoje dane są bezpieczne

„Podczas zarządzania danymi w każdym środowisku IT, bezpieczeństwo musi być priorytetem" - twierdzi Neil Kole, wiceprezes ds. globalnej infrastruktury i operacji w firmie Informatica, dostawcy oprogramowania do integracji danych.

„Bezpieczeństwo ma dwojaki charakter: dane muszą być zabezpieczone zarówno wirtualnie, jak i fizycznie" - mówi Kole. „Muszą być również zaszyfrowane, aby nie mogły być odczytane lub wykorzystane przez pozbawione skrupułów osoby trzecie, jeśli kiedykolwiek znajdą się w ich posiadaniu lub zostaną zhakowane (co się zdarza)".

Ponadto Kole zaleca tworzenie kopii zapasowych zaszyfrowanych danych na taśmach i przechowywanie ich w bezpiecznym miejscu na zewnątrz, „aby w przypadku awarii lub klęski żywiołowej można było odtworzyć dane i system przedsiębiorstwa".

12. Wykorzystanie deduplikacji, migawek i klonowania

„To może zaoszczędzić sporo miejsca, dając jednocześnie kontrolę nad wersjami danych" - mówi David Stahl, dyrektor IT w agencji cyfrowej Huge. „Niektóre z nowszych systemów plików, takie jak ZFS, realizują wszystkie te funkcje i są dostępne na zasadach open source. Ale produkty komercyjne, takie jak NetApp, robią to od lat".

„Migawki SAN można obecnie przekształcać w kopie zapasowe, które dział IT może przechowywać poza siedzibą firmy, co umożliwia tworzenie kopii zapasowych środowiska kilka razy na godzinę zamiast tylko raz dziennie" - dodaje Doug Hazelman, wiceprezes ds. strategii produktowej w firmie Veeam Software.

13. Upewnij się, że możesz znaleźć dane po ich zapisaniu

„Możliwość łatwego przeszukiwania danych przechowywanych elektronicznie i natychmiastowego dostarczania dokładnych wyników ma kluczowe znaczenie dla jak najlepszego wykorzystania danych na co dzień i w pilnych sytuacjach, np. gdy są potrzebne do postępowania sądowego" - mówi Chris Grossman, starszy wiceprezes ds. aplikacji dla przedsiębiorstw, Rand Worldwide i Rand Secure Archive, dostawca rozwiązań do archiwizacji danych i zarządzania nimi. „W końcu, jeśli nie możesz znaleźć odpowiednich danych, kiedy ich potrzebujesz, jaki jest sens archiwizowania danych w ogóle?".

14. Posiadaj plan odzyskiwania danych po awarii i stale testuj

„Wszystko sprowadza się do odzyskiwania danych" - mówi Potts. „Wszystkie kopie zapasowe świata nie uratują cię, jeśli nie będziesz w stanie odzyskać [swoich danych]". Dlatego niezależnie od tego, jakiej metody lub metod tworzenia kopii zapasowych używasz, pamiętaj, aby je testować - i to nie tylko raz w roku czy raz w miesiącu.

„Wykonuj losowe odzyskiwanie danych w każdym tygodniu" - radzi Potts. „Wykonuj testy odzyskiwania danych po awarii i audytuj swoje pule danych [okresowo, abyś mógł] mieć pewność, że możesz odzyskać swoje dane".

„Zawsze pamiętaj o zasadzie 3-2-1" - dodaje Dave Hamilton, Dave prowadzący podcast Mac Geek Gab w serwisie The Mac Observer. „Utrzymuj co najmniej trzy kopie wszystkiego, na czym ci zależy, w co najmniej dwóch różnych formatach, przy czym co najmniej jedna z nich powinna znajdować się poza siedzibą firmy".

Artykuł pochodzi z Network World

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200