Ontologiczne bazy danych

Istnieniologia stosowana

Ontologiczne bazy danych to jeden z fundamentów potrzebnych do budowy paradygmatu Web 2.0, związanego z sieciami semantycznymi. Grecki źródłosłów ontologii, w dosłownym tłumaczeniu, oznacza "istnieniologię". W obszarze IT pod tym pojęciem możemy rozumieć metajęzyk formalnego systemu reprezentacji wiedzy, definiujący pojęcia, relacje między nimi oraz reguły wnioskowania. Elementy takiego podejścia znajdziemy już w prekursorze obiektowych języków programowania - SIMULI (1967 r.). Nie jest to przypadek. Związki między ontologią a obiektowością dostrzeżemy wyraźnie na przykładzie standardu modelowania obiektowego - UML (Unified Modeling Language). Notację tę możemy postrzegać jako opis transformacji danych, natomiast ontologia w tym kontekście opisuje samą przestrzeń informacyjną, a więc łączy się z algebrą (przestrzenie, teoria zbiorów, logika np. rozmyta). Jednocześnie możemy połączyć słynną definicję ontologiczną Quine'a "być to znaczy być wartością zmiennej" z wymiarem informatycznym, mówiąc "być to znaczy być informacją".

Podejście ontologiczne integruje zatem wiele strategii kontrolowania kompleksowości rzeczywistości:

  • upraszczanie metodą zstępowania (top-down)
  • generalizowanie metodą wstępowania (bottom-up)
  • tworzenie systemów powielarnych poprzez standaryzację
  • antropomorfizacja aplikacji (ergonomia)
Zwłaszcza ten ostatni aspekt odgrywa kluczową rolę, mówimy tu bowiem de facto o przetwarzaniu języka naturalnego. Ontologiczna baza danych (sieć semantyczna) nie składa się bowiem z danych (prostych, zagregowanych), ale z wyrażeń (zdań) o postaci typu <podmiot, orzeczenie, dopełnienie>, czyli w notacji RDF (Resource Description Framework) <resource, property, object>, gdzie sam obiekt może być kolejnym zasobem (podmiotem) bądź daną (literal).

W takim systemie tradycyjne wyszukiwarki internetowe staną się systemami ekspertowymi, zdolnymi do udzielania odpowiedzi na pytania stawiane przez człowieka w języku naturalnym, np. "jak najszybciej dostanę się z Gdańska do Edynburga?". Dziś nie jest to jeszcze możliwe. Co prawda można "wklepać" powyższą sekwencję w okienku wyszukiwarki, ale w efekcie otrzymamy tylko listę stron internetowych, które zawierają określone wyrazy bądź frazy uszeregowane zgodnie z algorytmem wartościującym (np. "strona, do której jest więcej odniesień z innych stron, jest bardziej wartościowa"). Tymczasem system ontologiczny jest w stanie samodzielnie sformułować oryginalną odpowiedź znając znaczenie pytania. Będzie zatem wiedział, że "dostać się" to tyle co przemieszczać się korzystając ze środka transportowego. Będzie wiedział, że takim środkiem transportowym może być samolot i uwzględni także fakt, że alternatywnie warto rozważyć zarówno lotnisko w miejscowości docelowej, jak i w nieodległym Glasgow.

Już tylko tak fragmentaryczny przykład pokazuje, jak złożona musi być ontologia opisująca system zdolny jedynie do poszukiwania optimów transportowych z uwzględnieniem czasu i kosztów. Ale semantyczne sformatowanie na nowo już istniejących zasobów Internetu stworzy przestrzeń, w której zacznie działać inteligentne oprogramowanie "drążące wiedzę" (data mining) i zdolne do rozwiązywania problemów formułowanych przez człowieka w języku naturalnym. Agent, który będzie w stanie odpowiedzieć na każde pytanie, będzie również mógł postawić - sam sobie - trudne pytanie i znaleźć na nie odpowiedź. Będzie mógł zatem znajdować odpowiedzi na pytania, na które odpowiedzi jeszcze nie istnieją. W momencie przekroczenia tej bariery inteligentny agent będzie nie tylko reagował odpowiedziami na pytania dotyczące istniejącej już wiedzy, ale sam, w sposób aktywny, będzie nową wiedzę tworzył. W takiej chwili wkroczymy w sferę o niezwykłych i dzisiaj jeszcze trudno wyobrażalnych możliwościach: po raz pierwszy w historii maszyna samodzielnie zacznie tworzyć wiedzę.


TOP 200