Rozproszone bazy danych i 12 zaleceń C. J. Date'a

Rozproszona baza danych składa się z pewnej liczby lokalizacji, połączonych wspólną siecią; w każdej z lokalizacji działa baza danych; wszystkie te bazy współpracują między sobą w celu umożliwienia dostępu do danych w taki sposób, jakby dane były przechowywane lokalnie u każdego z użytkowników. Tak więc rozproszona baza danych, to coś w rodzaju obiektu wirtualnego, złożonego z wielu realnie istniejących baz danych (logicznej kombinacji tych baz).

Rozproszona baza danych składa się z pewnej liczby lokalizacji, połączonych wspólną siecią; w każdej z lokalizacji działa baza danych; wszystkie te bazy współpracują między sobą w celu umożliwienia dostępu do danych w taki sposób, jakby dane były przechowywane lokalnie u każdego z użytkowników. Tak więc rozproszona baza danych, to coś w rodzaju obiektu wirtualnego, złożonego z wielu realnie istniejących baz danych (logicznej kombinacji tych baz).

C. J. Date, jeden z najbardziej znanych autorytetów w dziedzinie baz danych i autor fundamentalnego podręcznika An Introduction to Database Systems, (6th ed., Addison-Wesley, Reading, 1995) podał tzw. fundamentalną zasadę bazy rozproszonej i opracował 12 reguł lub raczej zaleceń, które powinien spełniać taki system.

Fundamentalna zasada rozproszonej bazy danych brzmi:

Z punktu widzenia użytkownika system rozproszony powinien wyglądać dokładnie, tak jak system nierozproszony.

Z tej fundamentalnej zasady C. J. Date wyprowadził 12 dodatkowych zaleceń, które powinna spełniać rozproszona baza danych. Nie są one od siebie całkowicie niezależne, ani jednakowo ważne. Jednakże ułatwiają zrozumienie właściwości funkcjonalnych systemów posługujących się mianem rozproszonych.

1. Lokalna autonomia oznacza, że wszystkie operacje lokalne zależą tylko od systemu lokalnego i żadna lokalizacja zdalna nie ma na nie wpływu. Dotyczy to także bezpieczeństwa i integralności danych.

2. Nie istnieje zależność od centrali. Wszystkie lokalizacje powinny być uważane za równorzędne. Nie powinien więc istnieć np. centralny serwer bezpieczeństwa czy usług nazewniczo-katalogowych. To zalecenie jest w pewnym sensie wnioskiem z poprzedniego.

3. Ciągła operacja. System rozproszony powinien zapewniać większą niezawodność i lepszą dostępność danych. Jeżeli uszkodzeniu ulegnie system w jednej z lokalizacji, to baza działa nadal (może z ograniczeniami). Lepszą dostępność zapewnia np. replikacja danych do wielu lokalizacji.

4. Przezroczystość lokalizacji - użytkownik nie powinien wiedzieć, gdzie znajdują się potrzebne mu dane.

5. Niezależność od fragmentacji danych. Dane są dzielone na fragmenty przechowywane w tym miejscu, gdzie są używane najczęściej.

6. Niezależność od replikacji. Z wielu powodów wskazane jest przeniesienie kopii danych (replik) do wielu lokalizacji, ale użytkownik nie musi wiedzieć, gdzie one się znajdują.

7. Równoległe przetwarzanie zapytań. Zapewnia taką możliwość rozdzielenia zapytań, aby były realizowane niezależnie przez różne lokalizacje. Ponadto powinna istnieć metoda optymalizacji zapytań, przy której następuje jak najmniejszy ruch danych w sieci łączącej lokalizacje.

8. Rozproszone zarządzanie transakcjami z wykorzystaniem dwufazowego zatwierdzania transakcji (two-phase commit) oraz takim blokowaniem tabel bazy, aby żadne składniki rozproszonej transakcji nie blokowały się wzajemnie.

9. Niezależność od sprzętu.

10. Niezależność od systemu operacyjnego.

11. Niezależność od systemu sieciowego.

12. Niezależność od systemu zarządzania bazami danych. Niestety z powodu realizacji różnych wersji standardu SQL przez różne systemy, na ogół system rozproszony musi być realizowany za pomocą serwerów baz danych jednego producenta. Jednakże nawet w tym przypadku nie zawsze da się tę niezależność osiągnąć, bo często systemy zarządzania bazami danych, działające na różnym sprzęcie/systemie operacyjnym, nie realizują tego samego zestawu funkcji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200