Wybór należy do ciebie

Jak te założenia sprawdzają się w praktyce?

Okazuje się, że autorzy nie są jednak skłonni do masowego opatrywania metadanymi swoich dokumentów. Być może wystarczy im, że ich lokalizację znają ich koledzy zajmujący się podobnymi problemami. W efekcie metadane stosowane są głównie tam, gdzie jest możliwe ścisłe zarządzanie zasobami: w portalach dziedzinowych i w zamkniętych dla publiczności firmowych intranetach.

Poza tym metadanych zaczyna dotyczyć ten sam problem, jaki jest przypadłością opisów stosowanych w bibliotekach. Bibliotekarze starają się stworzyć formaty pozwalające na opis wszelkich możliwych aspektów dokumentu. Powoduje to, że formaty te są niesłychanie rozbudowane, przy czym przeciętna biblioteka stosuje małą część wszystkich możliwości. Przeciętny użytkownik może natomiast odnieść wrażenie, że jest to sztuka dla sztuki, nieuwzględniająca jego realnych potrzeb. Podobnie również Dublin Core, najbardziej znany format metadanych (stosowany dla dokumentów tekstowych) staje się coraz bardziej skomplikowany. Już dawno porzucono myśl, aby poprzestać na pierwotnie ustalonych 15 elementach, tworząc coraz bardziej skomplikowane zasady ich kwalifikacji i uszczegóławiania.

W Internecie natomiast - środowisku o wiele bardzie heterogenicznym niż intranety czy portale - trwają próby tworzenia coraz bardziej efektywnych rozwiązań technologicznych służących zwiększeniu możliwości wyszukiwawczych bez potrzeby prac przygotowawczych, a więc rozwiązań realizowanych na podstawie gotowych i funkcjonujących w sieci dokumentów. Już obecnie algorytmy wyszukiwawcze i ustalające ranking wyników w wyszukiwarkach internetowych funkcjonują całkiem sprawnie.

Dodatkowo postanowiono zrobić to, co bibliotekarze w systemach najpierw manualnych, a potem skomputeryzowanych robili od zawsze - dodać do danych semantykę. W semantycznym Web postanowiono zastosować narzędzia dobrze bibliotekarzom znane, typu tezaurusów czy innych podobnych struktur, które porządkują aparat pojęciowy przez usystematyzowanie terminologii i ukazanie relacji łączących poszczególne terminy i pojęcia. Różnica pomiędzy tymi narzędziami a ontologiami stosowanymi w semantycznym Web polega głównie na tym, że tezaurusy służyły przede wszystkim ludziom, natomiast ontologie mają być zrozumiałe dla komputerów w sieci.

Czy w przyszłości do wyszukiwania informacji w sieci w większym stopniu będą wykorzystywane narzędzia automatyczne, takie jak indeks cytowań Citeseer czy też tzw. portale jakościowe oferujące sporządzone przez specjalistów katalogi sieciowych zasobów, np. angielski SOSIG?

Dla jednych i drugich istnieje miejsce wśród systemów służących porządkowaniu i udostępnianiu naukowych oraz fachowych zasobów sieciowych. Trzeba tylko zdawać sobie sprawę z indywidualnych cech każdego z nich i występujących pomiędzy nimi różnic.

Indeksy cytowań pojawiły się niedługo po wynalezieniu komputera. Nowy jest pomysł maksymalnej automatyzacji wyszukiwania cytowań i kojarzenia tekstów z cytowanymi i cytującymi dokumentami. Jednocześnie użytkownik otrzymuje dostęp do pełnych tekstów dokumentów znajdujących się w sieci. Tego typu narzędzia mogą być określone jako wyszukiwarki podążające za cytowaniami. Jakość ich pracy zależy w dużym stopniu od stosowania odpowiednich konwencji przez autorów prac, np. podawanie autora i tytułu na początku tekstu pracy inną czcionką niż reszta tekstu, odpowiednie wyróżnianie cytowań itp. Na podstawie takich wyróżników algorytmy odczytują poszczególne elementy tekstu. Takie konwencje są stosowane w pracach naukowych, więc tutaj indeksy cytowań spełniają swoją rolę.

Portale pełnią dla dokumentów internetowych rolę podobną do biblioteki tradycyjnej. Przy pomocy ludzkiej inteligencji i wiedzy selekcjonuje się materiały, opracowuje przy użyciu skomplikowanych schematów metadanych i procedur oraz archiwizuje i udostępnia. Portale dostarczają także dodatkowych usług, np. ułatwiają znalezienie pracy lub uzyskanie konsultacji u specjalisty z danej dziedziny. Z pewnością ich usługi będą miały swoich zwolenników, tak jak zwolenników mają niewielkie biblioteki instytutowe, w których panuje swojski porządek i wiadomo, czego można się spodziewać.

W portalach stosuje się narzędzia opracowania rzeczowego, np. tezaurusy, do których użytkownicy są przyzwyczajeni, bo korzystali (korzystają) z nich w systemach tradycyjnych. Indeksowanie zasobów za ich pomocą, oprócz pewnej wady (w stosunku do indeksowania pełnotekstowego), polegającego na tym, że jest wykonywane "ręcznie", ma też zalety, bo pozwala na ujednolicenie terminologii używanej podczas wyszukiwania i uniezależnia wyniki wyszukiwania od różnic terminologicznych występujących w dokumentach.


TOP 200