Odczytywanie wiedzy

Nowe możliwości zgromadzenia wiedzy na niespotykaną dotąd skalę - uzyskane dzięki wykorzystaniu Internetu - wymagają również nowego mechanizmu wyszukiwania potrzebnej w danej chwili informacji.

Nowe możliwości zgromadzenia wiedzy na niespotykaną dotąd skalę - uzyskane dzięki wykorzystaniu Internetu - wymagają również nowego mechanizmu wyszukiwania potrzebnej w danej chwili informacji.

Język naturalny musi być dla Internetu tak dobrze zrozumiały, jak dla sprzedawczyni w osiedlowym sklepie albo doradcy w wielkim supermarkecie budowlanym. Jest to warunek, aby Internet rzeczywiście stał się przestrzenią do handlowania, aby spełnił nadzieje budowniczych Nowej Ekonomii. Tymczasem dotychczasowe doświadczenia w zakresie używania naturalnego języka w Internecie są mało optymistyczne. Zadając banalne pytanie, otrzymuje się masę odpowiedzi, nie mających związku z istotą pytania. Wszyscy użytkownicy Internetu znają ten problem, choć różnie rozkładają akcenty. Jedni kładą nacisk na zalew informacji bezwartościowej, a "ukrywanie" informacji rzeczywiście potrzebnych. Drudzy czują się oszołomieni wielością źródeł, które trzeba przejrzeć, by zgromadzić wiedzę i sformułować opinię na określony temat. Jeszcze inni są zniechęceni czasochłonnością poszukiwania czegokolwiek w Internecie. Wszyscy jednak jako źródło tych negatywnych zjawisk związanych z upowszechnieniem Internetu w celu wzbogacenia swojej wiedzy uważają to, że w Internecie jest za dużo informacji, aby mógł je przyswoić ludzki umysł. Ale to nie jest chyba dostateczne wyjaśnienie.

Wyszukiwanie informacji w zgodzie z logiką języka naturalnego polega na tym, że na zadane pytanie otrzymuje się taką samą odpowiedź, jakiej udzieliłby zapytany człowiek, oczywiście dysponujący odpowiednią wiedzą. Tymczasem jest tak, że wyszukiwarki radzą sobie o wiele lepiej ze znajdowaniem odpowiedzi według słów kluczowych niż po zadaniu pytania. Na przykład, jeśli w portalu About.com zastosowanie słowa klucza "witamina A" daje rezultat 927 wskazań stron, natomiast zadanie pytania w naturalnym języku "Jakie warzywa zawierają witaminę A?" powoduję lawinę odpowiedzi - 6763 odnośniki do stron. Czyżby tych dodatkowych 5836 stron sprowokowało słowo "warzywa"? Weźmy pod lupę inne narzędzia. AltaVista w odpowiedzi na pytanie wskazała 1424275 stron. Poszukiwania w Go.com dały jeszcze bardziej szokujący rezultat: 40332722 strony. Okazało się jednak, że były przynajmniej uporządkowane, co dawało możliwość szybszego wyselekcjonowania wartościowych odsyłaczy. Od Inference Find otrzymano wskazanie dla 59 stron. Odnośniki są pogrupowane w pewne kategorie pod względem pochodzenia informacji, np. organizacje zdrowotne, administracja rządowa, biznes itd. Daje to pewne wskazówki, jeśli chodzi o wiarygodność informacji, nie ma jednak wiele wspólnego z ich trafnością, związku z danym pytaniem. 29 stron było nie na temat lub nieaktualnych. Ask Jeeves dał rezultat w postaci sześciu bezpośrednich odpowiedzi, z których dwie wiązały się z tematem, cztery - nie, oraz odnośniki do innych wyszukiwarek, np. AltaVista czy About.com.

To proste doświadczenie wskazuje, że "maszyneria" zastosowana do wyszukania informacji po prostu nie rozumie zadanego pytania. Nie rozumie logiki naturalnego języka, a zatem i logiki, według której rozumują ludzie.

Po kilku godzinach klikania w Internecie można znacznie wzbogacić swoją wiedzę o witaminie A, ale można się także zmęczyć, a przede wszystkim poczuć się zawiedzionym tym, że wyszukiwarki na logicznie zadane pytanie dostarczały aż 75% bezwartościowych odpowiedzi.

Oczywiście, zagorzali wielbiciele Internetu zaprotestują: zaraz, zaraz, przecież mamy coraz lepsze narzędzia do surfowania po Internecie, wiele z nich jest już w stanie uchwycić związki logiczne, a że niektórzy słabo sobie z nimi radzą, to nie powód, aby oskarżać Internet o bałagan.

Nie chodzi o żaden bałagan, chaos czy śmietnik, jak mówią zdegustowani użytkownicy Internetu. Chodzi o użyteczność Internetu do celów komercyjnych, o metodologię odczytywania wiedzy w Internecie, o sprawnego pośrednika między naturalnym sposobem komunikowania się ludzi a językiem technologii, w którym jest ona zapisana w Internecie. Metodologia czytania książek jest tak dobrze nam zna, że nawet nie bywa przedmiotem refleksji. Jest składnikiem kultury. Metodologia komunikowania się z Internetem dopiero powstaje. Ona wyznacza dynamikę rozwoju Nowej Ekonomii.

--------------------------------------------------------------------------------

Jenny Oh jest dziennikarzem amerykańskiego tygodnika The Industry Standard wydawanego przez IDG. Tłum. idb

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200