Internet przyszłości

Sieć semantyczna

Ideę sieci semantycznej (ang. semantic web) pierwszy zaproponował Tim Berners-Lee, twórca standardu WWW i pierwszej przeglądarki internetowej. Jak wiadomo, semantyka to dział językoznawstwa zajmujący się znaczeniem słów, zdań, zwrotów itd. Sieć semantyczna, a właściwie oprogramowanie działające w jej ramach miałoby "rozumieć" dane wprowadzane przez człowieka. Potrafiłoby skojarzyć znaczenia poszczególnych słów i odpowiednio do nich, w "rozumny" sposób przetworzyć informację.

Najlepiej wyjaśnić to na przykładzie. Zamiast jak do tej pory zadawać wyszukiwarce pytanie "John F. Kennedy +potomek +prezydent USA +mieszkają" (w Google można się obejść bez plusów), w sieci semantycznej zadalibyśmy pytanie "gdzie mieszkają potomkowie prezydenta Johna F. Kennedy’ego" - tak samo, jakbyśmy kierowali je do człowieka. Albo zamiast "kwas salicylowy +skład +odkrywca +kiedy", pytanie brzmiałoby: "kto i kiedy odkrył kwas salicylowy i jaki jest jego skład".

Zobacz również:

  • WordPress 6.5 trafia na rynek. Oto 5 najważniejszych zmian

Odpowiedni program obsługujący wyszukiwarkę semantyczną zorientuje się, że pisząc "jego skład", mamy na myśli skład kwasu, a nie "ktosia", czyli jego odkrywcy (dla człowieka takie powiązania znaczeniowe są oczywiste, ale nie dla komputerów), następnie "zrozumie" sens całego zapytania, przeszuka kilka baz danych lub witryn zawierających informacje o historii chemii, a na koniec wyświetli pełną odpowiedź, wzbogacając ją wzorem chemicznym kwasu salicylowego, rysunkiem przedstawiającym jego cząsteczkę i wieloma innymi danymi, przytaczanymi zwykle w takich wypadkach.

Internet przyszłości

Na przykładzie wyszukiwarki Wolfram|Alpha można się przekonać, jak będzie funkcjonowała sieć semantyczna.

Skąd jednak serwery mają wiedzieć, co oznaczają nasze polecenia czy zapytania i w jaki sposób mogą odgadywać znaczenia i wzajemne relacje poszczególnych słów i zwrotów? Kluczem do rozwiązania problemu są etykiety dodawane do kodu stron internetowych, będące, formalnie rzecz biorąc, metadanymi. Tak jak dziś w języku XHTML są znaczniki (tagi) określające strukturę dokumentu, tak w sieci semantycznej będą one uzupełnione o etykiety określające znaczenie treści, kontekst, powiązania itd.

Powstał już specjalny język OWL (Web Ontology Language) do reprezentacji i przetwarzania danych, który na podstawie specyfikacji RDF (Resource Description Network) ma służyć do opisywania danych z uwzględnieniem relacji między nimi i tworzenia w ten sposób sieci semantycznej. Oczywiście, aby cały ten system działał, niezbędne są poważne zmiany w oprogramowaniu sieciowym, a przede wszystkim w przeglądarkach i programach serwerowych.

Piękna to wizja, w której globalna sieć zachowuje się jak inteligentny organizm, ale napotykamy tutaj dwa istotne problemy. Pierwszym są same etykiety. Sytuacja dziś wygląda mniej więcej tak, jakbyśmy dostali wielki gmach biblioteki pełen miliardów książek, ale bez katalogu. Ktoś musi każdą z nich przeczytać, przemyśleć, co napisać na karcie książki, i wprowadzić to do katalogu. W bibliotece robi to doświadczony bibliotekarz, a w Sieci?

Tu dochodzimy do drugiego problemu: na ile możemy mieć zaufanie do kogoś, kto będzie przyczepiał etykiety do obiektów? Przecież w Sieci, która z założenia jest demokratyczna i dostępna dla wszystkich, każdy może umieścić dowolny obiekt i opatrzyć go dowolną etykietą. No i wtedy dowiemy się na przykład, że wnukiem Kolumba jest niejaki Harry Potter. Problem ten, nazywany mechanizmem certyfikacji i zaufania, jest obecnie w fazie rozważań czysto teoretycznych. Bez jego rozwiązania nie ma co marzyć o prawidłowo działającej sieci semantycznej.


TOP 200