Rozproszyć informacje

Koszt osobowy. W przypadku systemu rozproszonego niezbędny jest zespół ludzi znający problemy replikacji i budowania systemów rozproszonych. Często koszt utrzymania takiego zespołu jest większy niż cena sprzętu komputerowego i oprogramowania. Ponadto należy uwzględnić koszt lokalnych administratorów systemu.

Koszt zarządzania i utrzymania systemu. Złożony system składający się z wielu podsystemów jest trudny do projektowania i zarządzania. Należy go traktować jak jeden system, w którym rozproszenie informacji jest ukryte przed użytkownikiem. Z jednej strony istotne jest zapewnienie spójności i integralności danych, z drugiej - autonomia poszczególnych podsystemów i aplikacji.

Przy porównywaniu kosztów i zysków z rozpraszania informacji należy wziąć pod uwagę wiele czynników, które nie jest łatwo zmierzyć. Są to zadowolenie klientów w wyniku krótszego czasu odpowiedzi systemu, satysfakcja pracowników lepiej sterujących przepływem informacji, zwiększenie dostępności systemu dzięki zwielokrotnieniu miejsc składowania informacji.

Techniki dystrybucji informacji

Istnieje wiele metod podziału i przesyłania danych w środowisku rozproszonym.

Replikowany katalog - technika polegająca na umieszczeniu danych w różnych lokalizacjach, bez ich powielania. W każdej z nich znajduje się katalog odwzorowujący poszczególne tabele na ich fizyczną lokalizację. Taki katalog ukrywa przed użytkownikiem informację o lokalizacji danych. Zaletą rozwiązania jest brak potrzeby synchronizacji danych, ponieważ rezydują one tylko w jednym egzemplarzu, w rozproszonych magazynach danych. Wadą rozwiązania jest kłopotliwy dostęp i optymalizacja zapytań do rozproszonych danych. Szczególnie jest to kłopotliwe przy zapytaniach analitycznych w systemach wspomagania decyzji.

Replikowana baza danych - sposób polegający na kopiowaniu całej bazy danych do innych lokalizacji. Rozwiązanie to nie jest trudne do zaprojektowania. Zapewnia efektywny dostęp do wszystkich informacji, gdyż całość jest przechowywana lokalnie. Wadą jest potrzeba przesyłania bazy danych przez sieć, w tym wielu niepotrzebnych informacji. Kłopotliwe jest także uaktualnianie, ponieważ trzeba zapewnić rozwiązywanie konfliktów związanych z uaktualnianiem tego samego rekordu w inny sposób w dwóch kopiach bazy.

Replikowane tablice - metoda bardzo podobna do replikowania całej bazy danych, z tą różnicą, że nie jest przesyłana cała baza danych, a jedynie te tablice, które są potrzebne w danej lokalizacji. W tym rozwiązaniu oszczędzamy na ruchu w sieci i skracamy czas dostępu, natomiast zapytania analityczne, dotyczące kilku tablic, składowanych w kilku lokalizacjach, są kłopotliwe do wykonania i optymalizacji. Technika ta czasem jest rozbudowywana o podział tablic. Stosowany jest podział zarówno pionowy (wybierane są niektóre kolumny), jak i poziomy (wybrane rekordy). Trudniej takim systemem zarządzać, natomiast możliwe jest osiągnięcie optimum między udostępnianiem danych, ich przesyłaniem a uaktualnianiem.

Innym problemem przy budowie rozproszonego systemu informatycznego jest przesyłanie danych. Jeśli centrala banku ma rozesłać nową wersję bazy danych do wszystkich swoich oddziałów na terenie całego kraju, jest to duże przedsięwzięcie organizacyjne, a jednocześnie znaczne obciążenie sieci poprzez wielokrotne przesyłanie tych samych informacji. Toteż przy tworzeniu systemów rozproszonych buduje się hierarchię przesyłania danych. Centrala przesyła do kilku ośrodków regionalnych, te z kolei do większych oddziałów, a te do pozostałych odbiorców. Ogranicza to ruch w sieci i naturalny podział informacji potrzebnych na różnych poziomach zarządzania organizacją.


TOP 200