Storage 2.0

Gdy połączymy oprogramowanie open source, wiele tanich macierzy dyskowych oraz Internet, otrzymamy możliwość przechowywania 1 GB danych za 0,15 USD miesięcznie. Ta usługa powoli wchodzi też do Europy.

Gdy połączymy oprogramowanie open source, wiele tanich macierzy dyskowych oraz Internet, otrzymamy możliwość przechowywania 1 GB danych za 0,15 USD miesięcznie. Ta usługa powoli wchodzi też do Europy.

Kupno sprzętu i oprogramowania do profesjonalnego przechowania setek gigabajtów danych na potrzeby backupu lub archiwizacji to koszt od 15 USD do 25 USD za 1 GB. Macierze do przechowywania danych przetwarzanych na bieżąco to już ponad 50 USD za 1 GB. Oczywiście nie oznacza to, że od razu możemy pozbyć się sieci SAN na korzyść dużo tańszych rozwiązań internetowych. Usługi przechowywania danych online nie zapewniają wystarczającej wydajności dla aplikacji transakcyjnych czy baz danych. Wciąż można też mieć zarzuty odnośnie do poziomu bezpieczeństwa. Ale mimo wszystko dzięki coraz szybszym łączom internetowym i wirtualizacji, przychody dostawców systemów pamięci masowych mogą wkrótce zostać uszczuplone.

Tanie i otwarte technologie

Pierwszą technologią, która umożliwia obniżkę cen, jest oprogramowanie open source, dzięki któremu możemy zbudować podwaliny infrastruktury pamięci masowych. Usługodawcy najczęściej korzystają z oprogramowania Amanda do backupu, Darik Boot And Nuke (DBAN) do zarządzania dyskami oraz programów Lustre, OpenAFS i SAMBA do tworzenia sieciowych systemów plików. Drugą technologią jest architektura pamięci masowych, bazująca na rozproszonej siatce (grid) lub klastrach. Tu głównymi dostawcami są Cleversafe (oprogramowanie) i Berkeley Data Systems (usługa backupu online MozyPro). Trzecia technologia to tradycyjne serwery i napędy dyskowe, instalowane zamiast macierzy dyskowych.

Berkeley Data Systems zbudował usługę MozyPro na własnym oprogramowaniu do klastrowania i udostępniania plików, które działa na samodzielnie zmontowanych serwerach w centrum BDS. Dane są przechowywane na twardych dyskach wewnątrz serwerów. Cena 4 USD za każdy komputer lub serwer, z którego przechowywane są dane i 0,50 USD za 1 GB danych. W przeciwieństwie do innych usługodawców, którzy tworzą wiele kopii danych przekazanych przez klientów, oprogramowanie stworzone przez BDS pozwala na przechowywanie tylko o 33% więcej nadmiarowych danych, które pozwolą odzyskać pliki.

Cleversafe, tworząca oprogramowanie dla firm, które chcą świadczyć usługi typu storage online, poszła jeszcze dalej. Algorytm zastosowany w jej oprogramowaniu pozwala na dzielenie danych na 11 porcji, które są przechowywane na różnych serwerach i muszą być skompletowane, aby przekazać klientowi ponownie żądany plik. Technologia ta, której idea jest podobna do RAID 5 i 6 stosowanego w macierzach dyskowych, pozwoliła na eliminację konieczności wykonywania backupu i archiwizacji, a przez to zmniejszenie konieczności przechowywania nadmiarowych danych z 300% do 130%.

Obecnie największym internetowym graczem na amerykańskim rynku przechowywania danych jest... Amazon.com. Dane powierzone przez klientów, przechowywane w ramach realizowanej przez Amazon usługi S3, są przetrzymywane na wielu serwerach pamięci masowych, w wielu lokalizacjach i wielu kopiach. Dzięki temu przechowanie 1 GB danych przez miesiąc kosztuje 0,15 USD, jego wgranie - 0,10 USD, a pobranie - od 0,13 USD do 0,18 USD. Szefowie Amazon.com odmawiają podania szczegółowych informacji odnośnie do infrastruktury usługi, ujawniają jednak, że prawie w całości bazuje ona na oprogramowaniu open source.

Nie dla każdego?

John Webster, analityk z firmy Illuminata twierdzi, że kombinacja oprogramowania open source i technologii grid stwarza dość duży problem komercyjny twórcom oprogramowania do zarządzania backupem i disaster recovery. To podejście - jeśli się sprawdzi - znacznie uprości zarządzanie danymi w pamięciach masowych. Choć oczywiście rynek profesjonalnych pamięci masowych nie zniknie. Obecnie jedyną zaletą systemów storage online jest cena, wadą zaś brak gwarantowanego bezpieczeństwa i szybkiego dostępu.

Josh Coates, założyciel i prezes Berkeley Data Systems twierdzi, że tego typu usługi będą raczej wykorzystywane do zastąpienia backupu taśmowego. Jego zdaniem, klienci coraz częściej zastanawiają się nad alternatywnym rozwiązaniem wobec taśmy, które nie gwarantują odpowiednio krótkich czasów dostępu i nie są wygodne. Jako jedyny nośnik są na tyle elastyczne, aby umożliwić wywiezienie danych z firmy. Usługi online eliminują tę potrzebę. Rynek outsourcingu pamięci masowych jednak rośnie, choć na razie są to głównie kontrakty zawierane między klientami a centrami danych "do wynajęcia". Już wkrótce okaże się, czy podobnym zaufaniem będą cieszyć się firmy świadczące swoje usługi na szeroką skalę.