Informacja na zawołanie

Stworzenie efektywnych mechanizmów dzielenia się wiedzą w sieci jest celem europejskiego programu badawczego SWAP. Ma temu służyć połączenie możliwości technologii peer-to-peer i idei semantycznej sieci Web (Semantic Web).

Stworzenie efektywnych mechanizmów dzielenia się wiedzą w sieci jest celem europejskiego programu badawczego SWAP. Ma temu służyć połączenie możliwości technologii peer-to-peer i idei semantycznej sieci Web (Semantic Web).

Wiadomo nie od dzisiaj, że ogromne ilości informacji są "nieproduktywne", gdyż nie ma do nich dostępu. Tak się dzieje np. z danymi gromadzonymi na własny użytek przez poszczególne osoby czy firmy lub powstającymi przy okazji prowadzonej na co dzień rutynowej działalności. Często są to dane nieistotne z punktu widzenia ich posiadacza, ale niezwykle ważne dla innych. Czasami ich znajomość może mieć decydujące znaczenie dla wyników podejmowanych działań gospodarczych. Co więc zrobić, by takie dane, zamiast jedynie zalegać na dyskach poszczególnych użytkowników, mogły być dostępne wszystkim zainteresowanym za pośrednictwem Internetu? Chodzi tu głównie o te zasoby, które nie są umieszczane na stronach WWW (chociażby ze względu na brak środków lub czasu niezbędnych do ich przetworzenia).

Na te i podobne pytania mają odpowiedzieć wyniki prac prowadzonych w ramach współfinansowanego przez Komisję Europejską programu SWAP (Semantic Web and Peer-to-Peer). Na jego realizację przeznaczono 3,3 mln euro. Prace są prowadzone przez konsorcjum złożone zarówno z firm komercyjnych, jak i placówek naukowych, m.in. Uniwersytetu w Karlsruhe, Uniwersytetu w Amsterdamie, hiszpańskiej firmy Meta4 oraz firm empolis UK i empolis Polska.

Razem, nie osobno

Semantic Web, czyli tzw. semantyczna pajęczyna, został obwołany niedawno przez Tima Bernersa-Lee, twórcę technologii WWW, kolejnym, wyższym szczeblem rozwoju Internetu (chociaż przedstawiciele środowisk bibliotekarskich twierdzą, że jej reguły były znane i stosowane od dawna). Pomysł polega na uzupełnianiu informacji dostępnych w sieci ich znaczeniem. To pozwala na zwiększenie możliwości ich praktycznego wykorzystania. Do interpretacji informacji zapisanych na stronach internetowych nie będzie konieczny udział człowieka - stanie się ona dostępna dla specjalistycznych programów "przeczesujących" Internet i podejmujących działania w imieniu użytkowników (tzw. agenty).

Koncepcja sieci P2P (peer-to-peer), czyli bezpośredniej wymiany informacji między równorzędnymi użytkownikami bez potrzeby odwoływania się do pośrednictwa centralnych serwerów, jest znana głównie z zastosowań związanych z wymianą plików muzycznych czy filmowych przez Internet. Teraz chodzi o to, by wykorzystać ją również do dzielenia się wiedzą.

"Każde z tych rozwiązań z osobna nie nadaje się do wykorzystania różnych źródeł wiedzy. Natomiast z połączenia ich zalet ma powstać środowisko sieciowe pozwalające na łatwy dostęp do wielu różnych zasobów" - mówi Mariusz Olko z firmy empolis Polska. Technologia P2P nie wymaga dużych inwestycji i jest łatwa w obsłudze. Jej możliwości szybko się jednak wyczerpują przy dużym nasyceniu treściami do wymiany - nic więcej nie da się już za pomocą P2P zrobić. Z drugiej strony rozbudowane systemy zarządzania wiedzą oparte na Semantic Web mają skomplikowaną strukturę, wymagając długiego czasu na naukę obsługi czy stosowania złożonych procedur. "Prosty i szybki dostęp z jednej strony oraz kompletność klasyfikacji z drugiej to podstawowe korzyści rozwiązań testowanych w ramach programu SWAP" - wyjaśnia Rafał Księżyk, prezes empolis Polska.

W ramach projektu ma powstać środowisko dzielenia się wiedzą pomiędzy użytkownikami określonej sieci. Każdy posiadacz komputera osobistego z zainstalowaną aplikacją SWAP jest traktowany jak równorzędny użytkownik, który może opisywać i klasyfikować przechowywane na własnym komputerze dokumenty, listy lub zakładki internetowe, a jednocześnie zadawać pytania kierowane do sieci podobnych sobie użytkowników. Dzięki temu wszyscy uczestnicy będą mieli możliwość tworzenia indywidualnego profilu czy zbioru potrzebnej im wiedzy oraz współdzielenia swoich zasobów bez konieczności uciekania się do odgórnego narzucania wszystkim jednakowych, sztywnych zasad organizacji ich zasobów informacyjnych.

Porozumienie ponad różnicami

Wyniki prac badawczych mają zostać zweryfikowane w praktycznych zastosowaniach. Przewidziane jest przeprowadzenie tzw. studiów zastosowania w hiszpańskiej fundacji IBIT i międzynarodowym środowisku naukowym wymieniającym się informacjami na temat publikacji z dziedziny nauk informatycznych.

IBIT zajmuje się działalnością na rzecz rozwoju turystyki na Balearach. Celem fundacji jest wspieranie lokalnych inicjatyw biznesowych obejmujących turystykę. Jej członkami są zarówno firmy, jak i samorządy lokalne oraz placówki naukowe zajmujące się badaniami nad turystyką. Te podmioty mają ściśle z sobą współpracować na rzecz stwarzania jak najlepszych warunków do rozwoju rynku turystycznego. I robią to, ale mają przy tym problemy z wymianą informacji czy docieraniem do wiedzy gromadzonej u każdego z osobna. Fundacja liczy na to, że narzędzia udostępnione jej w ramach programu SWAP pomogą rozwiązać wiele problemów komunikacyjnych. "Oczekiwania są takie, że dowolny użytkownik sieci SWAP będzie mógł zadać przez Internet ogólne pytanie skierowane do innych uczestników i otrzyma od nich informacje na interesujący go temat" - mówi Mariusz Olko. System nie będzie sam wykonywał wnioskowania na podstawie znalezionych informacji, ale dostarczy wszystkie związane z postawionym pytaniem dokumenty i dane będące w zasobach użytkowników. Nie policzy od razu, ile osób było zainteresowanych pobytem w danej miejscowości w wybranym terminie, ale udostępni różnego rodzaju zestawienia, statystyki, dokumenty, na podstawie których taką analizę będzie można wykonać.

Aby do pytającego trafiały tylko te materiały, których rzeczywiście potrzebuje, trzeba będzie w odpowiedni sposób rozwiązać problem klasyfikacji rozproszonych zasobów informacyjnych. Nie będzie katalogu centralnego. Fundacja ma przygotować jedynie predefiniowane struktury danych (ontologie), np. podział administracyjny, geografię wysp, relacje między grupami obiektów i osób itp. Wysiłek uczestników projektu idzie w kierunku stworzenia mechanizmów rozpoznawania struktur klasyfikacji stosowanych w indywidualnych zasobach i uzgadniania ich z określonymi wcześniej, ogólnymi strukturami danych. Każdy użytkownik może mieć własną strukturę pojęć opisujących posiadane zasoby, nie zawsze zgodną z kategoriami używanymi przez innych. Hotele patrzą na turystów przez pryzmat noclegu, restauracje - wyżywienia, dla biur podróży pierwszoplanowe znaczenie mają kwestie transportu. "Każdy widzi i opisuje rzeczywistość po swojemu. Chodzi o to, aby była możliwość uzgadniania tych różnych perspektyw poznawczych bez potrzeby prowadzenia specjalnej klasyfikacji poszczególnych, indywidualnych zbiorów danych" - podkreśla Rafał Księżyk. Nie jest to zadanie łatwe, ale znalezienie satysfakcjonujących rozwiązań w tym zakresie pozwoliłoby na daleko idące usprawnienia w zakresie pracy grupowej.

Niełatwym problemem do rozwiązania jest też konieczność zapewnienia bezpieczeństwa użytkowników. Wiele z udostępnianych dokumentów może mieć duże znaczenie dla konkurencji i nie powinno być znanych nikomu spoza uczestników systemu. W tradycyjnym modelu systemy bezpieczeństwa funkcjonują z wykorzystaniem serwera centralnego. Tutaj takiego nie będzie. Proponowane rozwiązanie bazuje na PKI i polega na tym, że autoryzacja uczestnika będzie następować poprzez wykorzystanie reguł semantycznych, np. na podstawie informacji dotyczących logującego się do systemu podmiotu otrzymanych od innych uczestników sieci oraz klasyfikacji żądanych zasobów.