Klastrowa baza danych o "internetowej skali"

Wiedząc o tym, że użytkownicy generują coraz więcej elektronicznych informacji, producenci oprogramowania pracują nad pojemnymi i wydajnymi bazami danych opartymi na nowych technologiach. Firma Aster Data Systems opracowała takie właśnie rozwiązanie (nCluster), nazywając je analityczną, klastrową bazą danych opartą na architekturze o "internetowej skali".

Pomysł łączenia ze sobą w jeden organizm większej liczby węzłów obliczeniowych (komputerów), które wykonują określone zadanie, to nic innego jak technologia MPP (Massively Parallel Processing; masowe przetwarzanie równoległe). Jednak firma Aster wzbogaciła technologię o nowe możliwości, projektując rozwiązanie o nazwie nCluster, które rozprasza całe obciążenie związane z zarządzaniem i analizowaniem danych na wiele oddzielnych, abstrakcyjnych części.

Charakterystyczną cechą klastrowych baz danych jest to, że dane oraz zadania związane z zarządzaniem nimi są rozkładane na wiele serwerów (węzłów) rozproszonych po całej sieci. Bazy takie są przy tym oparte na architekturze, która pozwala w łatwy sposób, wraz z rosnącą wielkością i wymaganiami dotyczącymi wydajności, dodawać kolejne serwery.

Zobacz również:

  • Efekt synergii zmienia zasady pracy z danymi
  • Oracle znosi ograniczenia w zarządzaniu danymi

Bazę danych można elastycznie rozbudowywać, zaczynając od pojemności kilkuset gigabajtów, a kończąc na kilkuset terabajtach, używając w warstwie sprzętowej standardowych serwerów x86 (pracujących pod kontrolą systemu operacyjnego Linux) oraz standardowych urządzeń sieciowych Ethernet 1 i 10 Gb/s. Baza obsługuje następujące interfejsy API: SQL, JDBC i ODBC.

Wchodząca w skład aplikacji nCluster warstwa "loader" zawiaduje całym obciążeniem, eksportując oraz importując poszczególne zadania do i z zewnętrznych źródeł. Inna warstwa, nosząca nazwę "worker", zarządza węzłami, które przechowują dane na dołączonych do nich dyskach twardych. Na samym szczycie aplikacji znajduje się warstwa "queen". Wchodzące w jej skład węzły zarządzają w inteligentny sposób całym procesem przetwarzania danych i zapytaniami kierowanymi do bazy danych.

Bazę danych nCluster wdrożyła ostatnio u siebie znana firma MySpace, używając jej do analizowania ruchu WWW. Baza składa się ze 100 węzłów, które mogą zarządzać danymi (i analizować je) o wielkości 360 TB.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200