Porządek w bibliotece

Ciągły przyrost danych i konieczność natychmiastowej ich archiwizacji przyspieszyły decyzję PTC Era o rozbudowie systemu wykonywania kopii zapasowych. Firma konsekwentnie tworzy go z wykorzystaniem urządzeń taśmowych ADIC.

Ciągły przyrost danych i konieczność natychmiastowej ich archiwizacji przyspieszyły decyzję PTC Era o rozbudowie systemu wykonywania kopii zapasowych. Firma konsekwentnie tworzy go z wykorzystaniem urządzeń taśmowych ADIC.

Gdy PTC zaczynała działalność, a telefon komórkowy uchodził jeszcze za symbol luksusu, na taśmach magnetycznych archiwizowano tylko najcenniejsze dane. Do tego celu wystarczały niewielkie, jak na dzisiejsze standardy, urządzenia, każde bezpośrednio przyłączone do serwera. Po trzech latach nieodzowne stało się zorganizowanie na nowo systemu archiwizacyjnego. Rozwiązaniem okazała się częściowa centralizacja. Powstały trzy odrębne systemy: dwa na potrzeby centrum przetwarzania danych (oddzielnie dla aplikacji bazujących na Windows i Unix) i jeden przeznaczony dla działu zarządzania siecią. Tak zorganizowany system działa do dziś. Niedawno jednak Sebastian Bar, odpowiedzialny w PTC za centrum przetwarzania danych, podjął decyzję o zwiększeniu pojemności podlegających mu systemów. Operator sieci Era kupił dwie olbrzymie biblioteki taśmowe Scalar 10K firmy ADIC.

Atak klonów

Porządek w bibliotece

Sebastian Bar PTC Era

Ilość danych przetwarzanych przez PTC Era systematycznie rośnie, głównie za sprawą systemu billingowego, połączonego z nim systemu obsługi klientów oraz hurtowni danych. Decyzja o zwiększeniu pojemności systemu zapadła z chwilą wyczerpania się możliwości rozbudowy starszych bibliotek Scalar 1000. "Zwykle sygnałem do rozpoczęcia rozbudowy systemu wykonywania kopii zapasowych jest wykorzystanie ok. 80% pojemności. Trzeba przy tym uwzględnić, że procedura zakupu trwa kilka miesięcy. Wyprzedzamy z drobnym zapasem sytuację, w której nie moglibyśmy już zrobić pełnego backupu, ale jednocześnie dokładamy starań, by nie rozbudować systemu zbyt wcześnie" - opowiada Sebastian Bar.

Argumentem za rozbudową było również wprowadzenie w PTC planu zapewniającego ciągłość działania firmy na wypadek katastrofy tzw. business continuity plan. Wszystkie dane po archiwizacji muszą być niezwłocznie klonowane na innym nośniku. Jedna z zakupionych bibliotek Scalar 10K została umieszczona w podstawowym centrum przetwarzania, druga trafiła do centrum zapasowego. Wszystkie backupy są natychmiast kopiowane na drugie urządzenie.

Dodatkową korzyścią z klonowania danych - poza podniesieniem poziomu bezpieczeństwa i zwiększaniem szans na skuteczne ich odtworzenie nawet w przypadku najgorszych katastrof - jest możliwość bezpośredniego testowania poprawności wykonanego backupu.

Skuteczne przeniesienie danych z taśm w jednej bibliotece na taśmy w drugiej potwierdza, że dane zostały poprawnie zapisane i można je będzie później prawidłowo odczytać.

Na żądanie

Porządek w bibliotece

Organizacja systemu wykonywania kopii zapasowych w PTC

Biblioteki Scalar 10K są wykorzystywane na potrzeby systemów unixowych (ponadto na potrzeby wyłącznie systemu billingowego, działającego na maszynach unixowych, pracują dwa Scalary 1000). Wynika to z faktu, że w przypadku systemów unixowych wykorzystywanych przez Erę średnio dziennie rozmiar backupu wynosi ok. 3 TB. Na zarchiwizowanie danych zgromadzonych na serwerach Windows wystarczają stare biblioteki Scalar 1000 - jedynie 0,5 TB.

Podstawowa różnica pomiędzy nowymi a starymi bibliotekami polega na tym, że w Scalar 10K można skorzystać z różnych rodzajów taśm. Biblioteka obsługuje zarówno otwarty standard LTO, opracowaną przez Quantum technologię SDLT, jak i Sony AIT. Scalar 10K może być wyposażony maksymalnie w 15 tys. taśm i 648 napędów. Takie parametry można jednak osiągnąć tylko w przypadku taśm AIT. W odniesieniu do taśm SDLT jedna biblioteka wystarcza, by obsłużyć 324 napędy i 9,5 tys. taśm lub 8 tys. LTO. Scalar 10K posiada szybszego i trwalszego robota, który wyszukuje taśmy i umieszcza w napędach.

Znaczące różnice zachodzą również w pojemności. Starszy Scalar 1000 oferuje maksymalną pojemność ok. 80 TB. Nowszy model ponad 10 razy więcej - 950 TB. PTC zdecydowała się jednak na zakup urządzeń o mniejszych możliwościach, zostawiając sobie przy tym furtkę w postaci możliwości rozbudowy biblioteki na zasadach capacity-on-demand. W każdej z bibliotek kupionych przez PTC Era można fizycznie zmieścić po 1100 taśm. Operator zapłacił tylko za 700.

Kolejne taśmy mogą być uaktywnione w dowolnej chwili po wpisaniu w oprogramowaniu obsługującym bibliotekę klucza licencyjnego. Biblioteki Scalar 10K oferujące takie możliwości mają nieco mniejszą pojemność maksymalną 394 TB i mieszczą do 84 napędów. PTC stosuje taśmy LTO o pojemności 100 GB każda (bez kompresji) i 16 napędów w każdej bibliotece.

Meandry SAN-ów

"Pomijając wymianę dwóch wadliwych napędów na samym początku, nie mieliśmy żadnych problemów z uruchomieniem urządzeń i włączeniem do sieci SAN" - twierdzi Sebastian Bar. Po tygodniu testów biblioteki zaczęły pracować w normalnym trybie.

Ze znacznie większymi trudnościami firma zmagała się przy budowie sieci SAN. Na pierwszy plan wysunął się podstawowy problem - brak standardów. By uniknąć kłopotów z brakiem kompatybilności urządzeń pochodzących od różnych producentów, Era stosuje wyłącznie przełączniki Fibre Channel firmy Brocade. "Mieliśmy również dużo problemów z dobraniem kart HBA do serwerów. Ostatecznie po przetestowaniu wielu produktów wybraliśmy firmę JNI" - mówi Sebastian Bar. Kompromisem była również decyzja o stworzeniu dwóch odrębnych sieci SAN - dla Unixa i Windows.

Obawy przed niezgodnością rozwiązań różnych producentów opóźniają decyzję informatyków PTC o zakupie systemu do zarządzania siecią SAN. "Uznaliśmy, że warto jeszcze poczekać. Dostępne obecnie rozwiązania nie spełniają naszych oczekiwań" - wyjaśnia Sebastian Bar. Na razie wszelkie prace administracyjne są wykonywane przy użyciu narzędzi dostarczonych przez producentów poszczególnych urządzeń. Błędy są rejestrowane w systemie OpenView.

Na potrzeby systemu do tworzenia kopii zapasowych wykonano niezależną sieć w technologii Gigabit Ethernet i ATM 622. W przypadku archiwizacji danych potrzebna jest duża przepustowość, by w krótkim czasie przesłać jak najwięcej danych. Na pojedynczą taśmę dane są zapisywane z prędkością 15-30 Mb/s. Może być zapisywanych jednocześnie kilkanaście taśm.

Kopia jak w zegarku

Całością procesu archiwizacji danych zarządza oprogramowanie Legato Networker. Kopie są wykonywane zgodnie z ustalonym harmonogramem. W zależności od specyfiki wykorzystywania aplikacji i możliwości systemu archiwizacyjnego są wybierane odpowiednie tzw. okna czasowe na wykonanie kopii danych.

Kopiowanie obejmuje dane znajdujące się na wszystkich serwerach będących pod kontrolą administratorów centrum przetwarzania danych. Łącznie to ok. 200 maszyn. Nie wykonuje się kopii danych na stacjach roboczych. Pracownicy mają obowiązek przechowywać istotne pliki na serwerach. Jedyny wyjątek to kadra kierownicza najwyższego szczebla, której komputery przenośne i stacjonarne są archiwizowane przy użyciu oprogramowania Legato Networker Laptop.

Oczywiście, większość zadań, w tym pełne kopie, są wykonywane w nocy, kiedy systemy są najmniej obciążone. W ciągu dnia realizowane są backupy przyrostowe. Logi transakcyjne z baz danych są archiwizowane co godzinę. Z maksymalną częstotliwością są tworzone archiwa systemu billingowego, znacznie rzadziej systemów analitycznych. Tylko raz na tydzień są wykonywane kopie zapasowe informacji gromadzonych w hurtowni danych. "Nawet w przypadku awarii hurtowni potrafimy odtworzyć utracone dane na podstawie danych zgromadzonych w systemach, z których zasilana jest hurtownia" - wyjaśnia Sebastian Bar.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200