Klastrowa baza danych o "internetowej skali"
- Janusz Chustecki,
- IDG News Service,
- 27.05.2008, godz. 09:30
Wiedząc o tym, że użytkownicy generują coraz więcej elektronicznych informacji, producenci oprogramowania pracują nad pojemnymi i wydajnymi bazami danych opartymi na nowych technologiach. Firma Aster Data Systems opracowała takie właśnie rozwiązanie (nCluster), nazywając je analityczną, klastrową bazą danych opartą na architekturze o "internetowej skali".
Pomysł łączenia ze sobą w jeden organizm większej liczby węzłów obliczeniowych (komputerów), które wykonują określone zadanie, to nic innego jak technologia MPP (Massively Parallel Processing; masowe przetwarzanie równoległe). Jednak firma Aster wzbogaciła technologię o nowe możliwości, projektując rozwiązanie o nazwie nCluster, które rozprasza całe obciążenie związane z zarządzaniem i analizowaniem danych na wiele oddzielnych, abstrakcyjnych części.
Charakterystyczną cechą klastrowych baz danych jest to, że dane oraz zadania związane z zarządzaniem nimi są rozkładane na wiele serwerów (węzłów) rozproszonych po całej sieci. Bazy takie są przy tym oparte na architekturze, która pozwala w łatwy sposób, wraz z rosnącą wielkością i wymaganiami dotyczącymi wydajności, dodawać kolejne serwery.
Zobacz również:
Bazę danych można elastycznie rozbudowywać, zaczynając od pojemności kilkuset gigabajtów, a kończąc na kilkuset terabajtach, używając w warstwie sprzętowej standardowych serwerów x86 (pracujących pod kontrolą systemu operacyjnego Linux) oraz standardowych urządzeń sieciowych Ethernet 1 i 10 Gb/s. Baza obsługuje następujące interfejsy API: SQL, JDBC i ODBC.
Wchodząca w skład aplikacji nCluster warstwa "loader" zawiaduje całym obciążeniem, eksportując oraz importując poszczególne zadania do i z zewnętrznych źródeł. Inna warstwa, nosząca nazwę "worker", zarządza węzłami, które przechowują dane na dołączonych do nich dyskach twardych. Na samym szczycie aplikacji znajduje się warstwa "queen". Wchodzące w jej skład węzły zarządzają w inteligentny sposób całym procesem przetwarzania danych i zapytaniami kierowanymi do bazy danych.
Bazę danych nCluster wdrożyła ostatnio u siebie znana firma MySpace, używając jej do analizowania ruchu WWW. Baza składa się ze 100 węzłów, które mogą zarządzać danymi (i analizować je) o wielkości 360 TB.