Replikacja danych w bazach

Replikatory danych na ogół stosują model "zapamiętaj i prześlij" w celu uaktualnienia danych w lokalizacjach podległych w przypadku ich niedostępności z powodu nadmiernego obciążenia lub awarii sieci lokalnej i telekomunikacyjnej. Replication Server Sybase nie kopiuje do lokalizacji podległych całej bazy, ani nawet całej tabeli, a jedynie właściwe wiersze (rekordy) tabeli.

Replikatory podnoszą znacznie niezawodność systemu obsługi danych, gdyż zwykle pozwalają na przejęcie obsługi całej bazy przez inny serwer danych w razie awarii serwera głównego. Serwer ten korzysta wtedy z kopii bazy w celu wykonywania operacji. Po usunięciu awarii następuje samoczynna synchronizacja zawartości bazy głównej i jej kopii.

Oracle proponuje bardzo skomplikowany model replikacji bazy danych będący połączeniem kopiowania całej bazy lub tabeli do lokalizacji podległych, metody zapamiętania i przesyłania oraz dwufazowego blokowania danych. Z punktu widzenia obciążenia sieci komunikacyjnej łączącej serwery, następuje mocne jej obciążenie przez krótki czas. Metoda zastosowana przez Sybase powoduje niewielkie obciążenie sieci przez cały czas pracy systemu.

Replikacja okazjonalna

W wielu systemach przetwarzania danych istnieje potrzeba dostępu do danych z bazy w celu przeprowadzenia skomplikowanych analiz, ale aktualność tych danych nie jest na tyle ważna, aby konieczne było utrzymywanie jej z dokładnością do kilku transakcji. Ponadto w celu wykonywania analiz związanych ze wsparciem podejmowania decyzji, na ogół potrzebne są dane z różnych systemów zarządzania bazami danych i z różnych serwerów. Wielkość danych i kryteria wyboru często ustalane są ad hoc w momencie wykonywania analizy. Zastosowanie standardowych mechanizmów replikacji byłoby więc "wytaczaniem armaty dla zestrzelenia wróbla".

Niezależni producenci oprogramowania opracowali wiele narzędzi przeznaczonych do wykonywania replikacji okazjonalnej, w miarę potrzeby i w zakresie ustalanym dowolnie. Na przykład programy Data Integrator (Mentor Communications) czy InfoPump (Trinzic Corp.) są przeznaczone do przesyłania kopii danych do serwerów lokalnych z różnych źródeł. Jednakże w odróżnieniu od systemów zarządzania bazami danych programy te nie działają samodzielnie i bez nadzoru. Ściągają one potrzebne dane wykonując program (skrypt), określający precyzyjnie zakres danych (całe bazy lub tabele) lub określający kryteria wyboru w formie zapytania do bazy.

Programy te są przystosowane do okazjonalnego powielania danych w jednym kierunku: od serwera danych do lokalnej stacji roboczej dokonującej ich analizy.

Zwykle takie narzędzia są w stanie pracować w niejednorodnym środowisku sprzętowym i systemowym, np. w celu dostarczenia do stacji PC danych z AS/400 lub dużego komputera. Na przykład, program NetWeave (NetWeave Corp.) umożliwia wielu różnym klientom korzystanie z dowolnych danych w sieciach.

Replikacja w Lotus Notes

Program Lotus Notes jest przeznaczony do pracy ze skomplikowanymi dokumentami, bez wyraźnej struktury, takimi jak złożone dokumenty zawierające grafikę, wideoklipy i sekwencje dźwiękowe. Lotus Notes umożliwia użytkownikom tworzenie dokładnej kopii bazy danych w globalnej sieci WAN. Jednakże korzystanie z możliwości replikacji danych w różnych serwerach staje się kłopotliwe, gdy w firmie pojawia się wiele kopii tej samej bazy. Notes nie zawiera bowiem mechanizmu rozstrzygania konfliktów, gdyż korzysta z koncepcji równorzędnego (peer-to-peer) korzystania z bazy przez wszystkich uprawnionych użytkowników. Nie ma w systemie pierwotnej kopii bazy danych, która zostanie powielona do lokalizacji podległych. Każdy serwer może zainicjować operację powielenia swej bazy do innych serwerów. W celu uniknięcia sytuacji, gdy replikowane dane są już nieaktualne i po przesłaniu spowodują zniszczenie danych aktualnych, administrator systemu musi dokładnie opracować reguły replikacji danych, określić jakie dane są przesyłane do innego serwera, a który serwer ma prawo dokonywać pełnej replikacji swej bazy. Wadą metody replikacji stosowanej w Notes jest także konieczność replikowania całej bazy. Nie można ograniczyć operacji do poszczególnych transakcji.

Dojrzałe produkty

Przewiduje się, że w ciągu najbliższych dwóch lat twórcy systemów zarządzania bazami danych rozwiążą wszystkie problemy związane z replikacją baz danych, utrzymywaniem spójności i integralności bazy i jej kopii oraz poradzą sobie z problemami wykorzystania danych zgromadzonych na dużych komputerach. Można więc oczekiwać, że w 1995 lub 1996 r. systemy zarządzania bazami danych nie będą korzystać z mechanizmu dwufazowego blokowania transakcji. Zamiast niego używać się będzie wyrafinowanych mechanizmów replikacji i synchronizacji zawartości baz danych i ich kopii. Pozwoli to także na zwiększenie niezawodności systemów informacyjnych.

Wielu producentów oprogramowania już obecnie wprowadziło na rynek pierwsze produkty zwiastujące tę nową erę systemów informacyjnych. Jednakże brak uzgodnionych i powszechnie akceptowanych systemów zarządzania systemami rozproszonymi powoduje, że działania te nie spotykają się z powszechną akceptacją użytkowników.


TOP 200