Spór o przyszłość baz danych

W dziedzinie baz danych prognozowanie nie jest łatwe. Na niezbyt szybką ewolucję istniejących technologii nakładają się coraz to nowe rewolucyjne wynalazki w zakresie architektury systemów, struktur danych, interfejsów, języków i zupełnie nowych zastosowań.

W dziedzinie baz danych prognozowanie nie jest łatwe. Na niezbyt szybką ewolucję istniejących technologii nakładają się coraz to nowe rewolucyjne wynalazki w zakresie architektury systemów, struktur danych, interfejsów, języków i zupełnie nowych zastosowań.

Zanim zacznie się spekulacje na temat przyszłości baz danych, trzeba odpowiedzieć na pytanie: czym jest dziś ta dziedzina, jak wygląda pejzaż systemów i zastosowań, co w nim można uznać za wadliwe lub perspektywiczne. Jakkolwiek bazy danych stanowią odrębne zagadnienie, ich zakres przecina się z innymi obszarami informatyki. To splątanie dziedzin powoduje wątpliwości, czy bazy danych jako dziedzina informatyczna pozostają odrębną całością, której granice, chociaż rozmyte, dadzą się w przybliżeniu określić.

Aby wypracować klucz do klasyfikacji tematów obejmujących dziedzinę baz danych, można ją podzielić na kilka wzajemnie uzależnionych warstw:

*Warstwa ideologii. Ideologie są arbitralnymi hipotezami odnośnie do tego, jak należy budować przyszłość. W bazach danych ideologie są zwane "modelami danych".

*Warstwa koncepcji, teorii, języków i standardów. W dziedzinie baz danych wypracowano wiele tego typu elementów mających istotny wpływ na jej rozwój.

*Warstwa architektury i anatomii systemów. Bazy danych obejmują dużą liczbę specyficznych metod i rozwiązań technicznych, takich jak fizyczna organizacja danych, metody buforowania i dostępu, rozproszone bazy, metody przetwarzania transakcji, procesory języków zapytań, metody ochrony danych itd., które są uniwersalną wiedzą w dużym stopniu niezależną od modelu danych i konkretnych systemów.

*Warstwa komercyjnych systemów i technologii. Obejmuje charakterystykę systemów zarządzania bazami danych oraz to, co dzieje się na rynku, na którym konkurują firmy oferujące oprogramowanie i usługi związane z bazami danych.

*Warstwa zastosowań. Obejmuje specyfikę zastosowań baz danych w różnych dziedzinach.

*Warstwa związków z innymi dziedzinami. Związki te dotyczą takich zagadnień, jak języki programowania, inżynieria oprogramowania, przetwarzanie rozproszone, Internet, systemy operacyjne, sztuczna inteligencja, hurtownie danych i przetwarzanie danych analitycznych, eksploracja danych (data mining) i inne.

Oprócz tego podziału, charakterystycznego dla obecnej literatury z zakresu baz danych, istnieje też podział tradycyjny: zarządzanie pamięcią zewnętrzną, indeksowanie i buforowanie, schemat i podschematy danych, współbieżny dostęp, zarządzanie transakcjami, składowanie, zabezpieczanie i odtwarzanie po awarii, języki zapytań i ich optymalizacja, autoryzacja dostępu i ochrona danych, perspektywy i zapamiętane procedury, wyzwalacze (triggers), języki programowania, bazy rozproszone, heterogeniczne i federacyjne oraz inne zagadnienia.

Ideologie

Ideologie miały i mają nadal zasadniczy wpływ na charakter baz danych i ich przyszłość. Zwykle ideologiczne ramy dyscyplinują rozwój na pewnym jego etapie, ale później narzucone ograniczenia przeszkadzają i zostają odrzucone. Znamy to też z ideologii społecznych, a w przypadku baz danych taką rolę odegrał model relacyjny.

Model relacyjny nie jest uniwersalną teorią baz danych. Warstwa matematyczna tego modelu, cienka i nie do końca spójna, oraz naukowy autorytet matematyki zostały wykorzystane do promocji ideologii. I to się udało. Model relacyjny zyskał ogromny autorytet naukowy i komercyjny. Niemniej prawie od początku rzeczywistość baz danych wymykała się jego regułom. Skutkiem było pojawienie się pierwszego manifestu ideologicznego w dziedzinie baz danych, znanego jako "dwanaście reguł systemu relacyjnego". Świat komercyjny, besztany za odstępstwa od pryncypiów, zareagował tak jak można było przewidzieć: nie chciał nic zmienić, natomiast przyjął dwanaście reguł jako ideał i ustanowił swoisty, nieco komiczny ranking: w ilu procentach dany system jest zgodny z ideałem. Było to konsekwencją zachowania zdrowego rozsądku, ponieważ ideologia modelu relacyjnego, potraktowana ortodoksyjnie, okazała się utopijna.

W połowie lat 80. wielu specjalistów zaczęło zdawać sobie sprawę, że ideologia modelu relacyjnego jest zbyt ograniczająca. Stało się to za sprawą popularyzacji języka SQL, którego własności nie są zgodne z niektórymi założeniami modelu relacyjnego. A metoda kolejnych mutacji na długo nie wystarczyła. Ideologia relacyjna przyczyniła się do podniesienia poziomu abstrakcji zarówno danych, jak i środków wyszukiwania i przetwarzania, niemniej okazała się mało adekwatna w stosunku do modelowania pojęciowego, czyli odwzorowania niesformalizowanego problemu biznesowego w strukturach danych oraz funkcjach aplikacji. W wyniku tego zrodziła się koncepcja obiektowych baz danych, w której dominują pojęcia, takie jak złożony obiekt (odwzorowujący bezpośrednio obiekt dziedziny przedmiotowej), powiązanie między obiektami (odwzorowujące asocjacje między obiektami dziedziny przedmiotowej), klasa (zawierająca typ obiektu i zestaw operacji), dziedziczenie własności pomiędzy klasami, hermetyzacja (wyodrębnienie brył, którymi programista może posługiwać się jako całością i ukrycie szczegółów ich budowy i działania).

W roku 1989 ogłoszono nową ideologię - obiektowych baz danych. Prawie natychmiast zwolennicy modelu relacyjnego i dobrze prosperujących systemów relacyjnych ogłosili opracowanie "baz danych trzeciej generacji", postulując zachowanie sprawdzonych cech systemów relacyjnych i ostrożne wyposażanie ich w nowe cechy, w tym obiektowe. Zalecano zachowanie SQL "na lepsze i gorsze intergalaktycznej mowy danych". Oczywiście, obecny SQL nadaje się wyłącznie do przetwarzania obecnych tablic, a nie przyszłych tablic wyposażonych w zaawansowane cechy obiektowe; zatem twórcom tej koncepcji chodziło o zachowanie tego SQL, który pojawi się w przyszłości. Jeżeli Czytelnik dostrzegł w poprzednim zdaniu nonsens, to ma całkowitą rację - taka już jest natura manifestów, że pod pozorem świetlanych celów ukrywają demagogię. Walka ideologiczna zaowocowała większą liczbą tego rodzaju epizodów, ale szkoda czasu na wyliczanie wszystkich nonsensów, które podczas tej walki zostały wypowiedziane.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200