Bazy danych upakowane w mniejszej przestrzeni dyskowej

Bazy danych rozrastają się dzisiaj do gigantycznych rozmiarów, powodując istotne obniżenie wydajności. Wydaje się więc, że jednym ze sposobów rozwiązania tego kryzysu mogą być nowe technologie kompresji.

Jednym z większych problemów, z jakimi borykają się dzisiaj bazy danych jest kryzys pamięci. Z chwilą, gdy pojedyncze bazy danych osiągają rozmiary liczone w petabajtach (tysiąc terabajtów), coraz trudniej znaleźć dla nich odpowiednią pamięć masową. Jednocześnie nie rośnie proporcjonalnie liczba tabel baz danych, co oznacza, że rozmiar tablic liczony w milionach wierszy zmierza do wielkości liczonej w miliardach.

Przechowywanie tych wszystkich nowych danych to tylko jedna trzecia problemu. Drugi z to zapewnienie dostępności tych danych: pamięć dyskowa staje się coraz tańsza, ale zapewnienie przyzwoitej wydajności bazie danych liczonej w petabajtach może wymagać tysięcy jednostek dyskowych.

Zobacz również:

  • Efekt synergii zmienia zasady pracy z danymi
  • Oracle znosi ograniczenia w zarządzaniu danymi

Problem trzeci to po prostu zapewnienie przestrzeni wymaganej dla składowania tych wszystkich danych. Już dzisiaj składowanie bazy danych liczonej w terabajtach jest zbyt drogie bez kompresji.

Tak więc wydaje się, że kolejnym dużym osiągnięciem w obszarze technologii baz danych będą lepsze, bardziej efektywne algorytmy kompresji i struktury towarzyszące tablicom danych, a być może nawet bazom danych jako całości. Używane dzisiaj technologie kompresji ani nie są zbyt powszechnie używane, ani wystarczająco wydajne w konfrontacji z wymaganiami systemów DSS (Decision Support System) i OLTP (OnLine Transaction Process).

Kilku dostawców aktualnie sprzedaje rozwiązania kompresji dla SQL Server, ale żadne bardziej konsekwentne rozwiązanie dla innych relacyjnych baz danych nie istnieje. Wszystkie istniejące rozwiązania opierają się na otwartym API i standardowych algorytmach kompresji. Dla osiągnięcia poziomu kompresji i wydajności, które będą niezbędne dla przyszłych baz danych, konieczny będzie jednak technologiczny przełom.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200