Wirtualne biblioteki taśmowe

Tworzenie zapasowych kopii danych i ich archiwizowanie jest jednym z najważniejszych zadań każdego administratora, a technologia przechowywania danych na taśmie magnetycznej jest tak stara jak sam komputer. Jednak taśmy są kłopotliwym medium i z czasem dane zaczęto przechowywać na dyskach.

Tworzenie zapasowych kopii danych i ich archiwizowanie jest jednym z najważniejszych zadań każdego administratora, a technologia przechowywania danych na taśmie magnetycznej jest tak stara jak sam komputer. Jednak taśmy są kłopotliwym medium i z czasem dane zaczęto przechowywać na dyskach.

Dyski stosuje się do przechowywania informacji, która powinna być dostępna tak szybko, jak to tylko możliwe (np. w razie awarii systemu informatycznego czy niespodziewanej utraty danych). Taśmy służą natomiast do tworzenia archiwów zawierających dane, które powinny być magazynowane długo. Aplikacje typu HSM (Hierarchical Storage Management - hierarchiczne zarządzanie pamięcią) przenoszą automatycznie rzadko używane dane z szybkich macierzy dyskowych na wolne, ale bardzo pojemne taśmy.

Obecnie popularność zdobywają systemy VTL (Virtual Tape Library - wirtualne biblioteki taśmowe). Korzyści wynikające z wdrożenia VTL są oczywiste - zapasowe kopie danych można wtedy wykonywać (oraz odzyskiwać) wielokrotnie szybciej niż w przypadku tradycyjnej pamięci taśmowej, a administrator nie musi sobie zaprzątać głowy takimi problemami jak ewidencjonowanie kaset czy ustawiczne sprawdzanie ich jakości. W jednym ze swoich ostatnich raportów Gartner Group przewiduje, że w 2008 r. firmy będą odzyskiwać większość danych nie z taśm, ale z dysków.

VTL i dyski SATA

Wirtualne biblioteki taśmowe

Rozwój technologii dyskowych

Do rozwoju zintegrowanych rozwiązań VTL (macierzy dyskowych z oprogramowaniem emulującym taśmy) przyczyniły się walnie nowe technologie dyskowe. Przed 2001 rokiem komputery były wyposażone w dyski twarde z interfejsem SCSI (Small Computer System Interconnect) albo IDE (Integrated Drive Electronics). Dyski SCSI instalowano w serwerach (czyli w systemach obliczeniowych potrzebujących szybkiej pamięci masowej), a IDE w pecetach.

Pierwsze interfejsy SCSI transferowały dane z szybkością 5 MB/s, a SCSI dostępne obecnie potrafią już przesyłać dane z szybkością 80 MB/s. Duży postęp w szybkości wniosła technologia Fibre Channel. Dyski twarde tej technologii oferują transfer danych z szybkością 200 MB/s. Są one często instalowane w macierzach dyskowych z najwyższej półki, co w połączeniu z urządzeniami sieciowymi dysponującymi portami FC 4 Gb/s tworzy bardzo wydajny tandem.

Ostatnio dużą karierę robi technologia Serial SCSI. Interfejs tego standardu transferuje dane z szybkością 300 MB/s. Jednak ze względu na stosunkowo wysoką cenę, dyski takie są stosowane tylko w drogich serwerach oraz dużych pamięciach masowych dla przedsiębiorstw.

Interfejs IDE (znany bardziej pod nazwą ATA - Advanced Technology Attachment) też przeszedł metamorfozę. Standardowy ATA jako interfejs równoległy (stąd nazwa PATA; Parallel ATA) osiągnął już kres swoich możliwości. Dlatego w ostatnich latach stworzono interfejs Serial ATA, który może transferować dane wielokrotnie szybciej niż interfejsy ATA czy SCSI). Ostatnia wersja tego standardu to SATA II (300 MB/s). To właśnie dyskom SATA (tanim i szybkim) należy zawdzięczać rosnącą popularność wirtualnych bibliotek taśmowych.

Różne metody

Przyglądając się architekturom systemów używanych do tworzenia zapasowych kopii danych i archiwów, można je podzielić na cztery grupy.

Do pierwszej należą systemy pracujące w trybie d2d (disc-to-disc). Mogą to być systemy lokalne (w których dane są przepisywane z dysku twardego serwera na macierz dyskową podłączoną bezpośrednio do tego serwera), albo systemy sieciowe (w których dane są pobierane z dysku serwera przez serwer backupu i przesyłane np. przez sieć IP do systemu pamięci masowej typu NAS (Network Attached Storage). Główną zaletą tych systemów jest szybkość. Idea przechowywania danych na dyskach cieszy się coraz większą popularnością, głównie za sprawą nowych technologii, dzięki którym systemy pamięci masowych opartych na dyskach są coraz tańsze. A wiadomo, że nawet najwolniejsze dyski ATA czy SATA pracują wielokrotnie szybciej niż systemy archiwizowania danych oparte na napędach taśmowych. Typowa macierz dyskowa może zapisywać dane z szybkością ok. 200 MB/s, podczas gdy np. napęd taśmowy LTO2 oferuje szybkość (i to po kompresji danych) rzędu 70 MB/s (czyli rzeczywistą rzędu 35 MB/s).

Druga grupa to systemy pracujące w trybie d2t (disc-to-tape). Główną zaletą jest ich duża pojemność, szczególnie wtedy gdy dane są zapisywane na bibliotekę taśmową. W aplikacjach d2t biblioteka taśmowa komunikuje się z serwerem backupu najczęściej przez sieć IP lub połączenie Fibre Channel (sieć SAN).

Trzecią grupę reprezentują systemy pracujące w trybie d2d2t (disc-to-disc-to-tape). Dane są wtedy przepisywane w trybie online z dysków serwera na pamięć masową wyposażoną w dyski twarde, a następnie mogą być przeniesione już w trybie offline z dyskowej pamięci masowej na taśmy. Warto zwrócić uwagę na fakt, że w systemach d2d2t dane zapisywane w pierwszym kroku na sieciową macierz dyskową mają taki sam format, jaki jest stosowany przez system plików serwera aplikacji. Dopiero w drugim kroku format danych jest zmieniany na postać obsługiwaną przez konkretny system pamięci taśmowej.

Ostatnio coraz większym wzięciem cieszy się technologia VTL (Virtual Tape Library). Idea wirtualnej taśmy nie jest nowa. IBM używa tej technologii w swoich systemach mainframe od lat. Ocenia się, że obecnie blisko 60% systemów mainframe produkowanych przez IBM używa tej technologii. Jednak ostatnio technologia VTL śmiało wkracza do świata Windows i Linuxa.

VTL (Virtual Tape Library)

Wirtualne biblioteki taśmowe

Backup oparty na technologii VTL

VTL to technologia tworzenia kopii zapasowych danych oparta na wirtualizowaniu aplikacji taśmowej. Produkt VTL może mieć postać oprogramowania wirtualizującego bibliotekę taśmową, które administrator instaluje np. na tanim serwerze.

Zintegrowane rozwiązania VTL zawierają serwer (emulujący bibliotekę taśmową i formaty danych, używane w procesie zapisywania informacji na taśmę) oraz macierz dyskową. Współpracując z tradycyjnymi narzędziami do tworzenia kopii zapasowych danych (oferowanymi np. przez Commvault, Legato czy Veritas), rozwiązania VTL zapisują informacje na dyski (zachowując formaty danych używane w środowisku biblioteki taśmowej).

Niektóre rozwiązania VTL oferują też dodatkowe opcje (np. pozwalają zarządzać taśmami, tworzyć katalogi czy sprawdzać automatycznie daty wygaśnięcia ważności medium).

Rozwiązanie VTL używa własnego systemu plików, który emuluje bibliotekę taśmową. Systemy VTL pracują szybciej niż systemy d2d, ponieważ dane zapisywane na dysk mają postać bloków zapisywanych na taśmy, a nie plików (jak w tradycyjnych macierzach dyskowych). Odzyskiwanie danych przechowywanych na systemach VTL przebiega też wielokrotnie szybciej niż w przypadku systemów d2d2t, nie mówiąc już o systemach typy d2t.

VTL mają pojemność od kilkudziesięciu do nawet powyżej 200 TB i są całkowicie przezroczystym rozwiązaniem dla systemu, ponieważ emulują w 100% bibliotekę taśmową. Administrator nie musi tu zapisywać danych najpierw na dysk, a następnie na taśmę, jak ma to miejsce w przypadku systemów typu d2d2t.


TOP 200