Tylko przez równoległe komputery

Jak pokazują badania prowadzone przy okazji spotkań użytkowników poszczególnych systemów zarządzania bazami danych, średni rozmiar bazy w 1994 r. wynosił 2 GB i rósł w tempie ok. 30% rocznie. Można obliczyć, że przy tym tempie wzrostu w 2000 r. wyniesie on 5 GB. Oczywiście bazy największe już obecnie mają rozmiar liczony w TB (terabajt równa się 1000 GB).

Jak pokazują badania prowadzone przy okazji spotkań użytkowników poszczególnych systemów zarządzania bazami danych, średni rozmiar bazy w 1994 r. wynosił 2 GB i rósł w tempie ok. 30% rocznie. Można obliczyć, że przy tym tempie wzrostu w 2000 r. wyniesie on 5 GB. Oczywiście bazy największe już obecnie mają rozmiar liczony w TB (terabajt równa się 1000 GB).

Obsługa bardzo dużych baz danych wymaga specjalnych komputerów, serwerów baz danych zdolnych do zarządzania taką bazą i wyrafinowanych narzędzi do jej administrowania.

Istnieją dwa - niesprzeczne ze sobą - podejścia do obsługi bardzo dużych baz danych. Jedno polega na korzystaniu z komputerów o przetwarzaniu równoległym SMP, komputerów masowo równoległych MPP i gron komputerowych; drugie sprowadza się do tworzenia baz rozproszonych metodą replikacji lub fragmentacji bazy na wiele serwerów.

Wielcy producenci baz danych dostarczają systemy działające na różnych wersjach systemów równoległych. Zarówno system Oracle7, jak Sybase System 11 mają możliwości obsługi systemów SMP, maszyn MPP i gron komputerów. Informix OnLine 7 dobrze się nadaje do obsługi komputerów SMP a wersja rozszerzona Informix OnLine Extended Parallel Server 8.0 jest przeznaczona dla komputerów SMP, MPP i gron komputerów.

Oracle i Informix zaoferowały także opcję Very Large Memory umożliwiającą obsługę baz o rozmiarze do 14 GB bezpośrednio w pamięci komputera o 64-bitowej architekturze AlphaServer. Podobne możliwości ma baza IBM DB2 na komputerach ES/9000 w połączeniu Sysplex i Parallel Sysplex, które są w stanie umieścić w pamięci bazę do 460 GB!

Replikacja

Stała się tematem roku. Każdy producent w celu zmniejszenia czasu dostępu do bazy przez udostępnienie jej lokalnej kopii, oferuje jakąś postać replikacji baz danych. Jeżeli udostępnia się lokalnym użytkownikom możliwość aktualizacji tej kopii, to problemem staje się synchronizacja zawartości bazy głównej i baz lokalnych. Jest on różnie rozwiązywany przez różne sposoby replikacji; najłatwiejszy sposób polega na podejmowaniu decyzji na podstawie z góry ustalonych kryteriów, np. ostatnia aktualizacja ma przewagę nad wcześniejszą lub określenie, że ważne są aktualizacje w głównej lokalizacji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200