Internet szansą dla wszystkich

O zapotrzebowaniu na ten rodzaj usług może świadczyć mnogość serwisów WWW, które w mniej czy bardziej udany sposób starają się je realizować. Powstały już nawet metaserwisy, które nie dysponują własnymi katalogami zasobów, lecz zdobywają informacje odpytując kilka, kilkanaście dużych wyszukiwarek i przetwarzając otrzymane odpowiedzi. Podstawę współcześnie działających wyszukiwarek stanowi oprogramowanie zajmujące się katalogowaniem zasobów. Działanie takiego oprogramowania opiera się na w pełni automatycznym przetwarzaniu zawartości stron WWW, w wyniku którego w bazie danych serwisu zostaje dokonany wpis zawierający adres strony oraz słowa kluczowe dobrane na podstawie zawartości dokumentu. Jeśli dokument HTML zawiera odnośniki do innych dokumentów - są one również przetwarzane. Baza danych popularnego serwisu Altavista zawiera ponad 250 mln odnośników.

Ponieważ algorytmy określania zawartości dokumentów okazywały się nieskuteczne, wprowadzono w języku HTML metaznaczniki (metatags), pozwalające autorowi dokumentu ustalić słowa kluczowe odpowiednie dla danego dokumentu. Metaznaczniki mogą zawierać słowa kluczowe nie pojawiające się przy wyświetlaniu strony, ale dostępne dla agenta, co zwiększa prawdopodobieństwo sukcesu przy wyszukiwaniu. Informacje zawarte w metaznacznikach są traktowane przez agenta jako znacznie istotniejsze od treści dokumentu (mechanizm ten jest zresztą powszechnie nadużywany przez wprowadzanie popularnych słów kluczowych luźno związanych czy wręcz nie związanych z treścią dokumentu). Coraz szerzej wprowadza się również wyszukiwanie na podstawie zapytań sformułowanych w języku naturalnym (potrafiące odpowiadać na pytania w rodzaju „Gdzie mogę znaleźć strony o Elvisie Presleyu?” - oczywiście sformułowane w języku angielskim). Przykładem takiego serwisu jest AskJeeves. Oczywiście, na razie, można liczyć na sensowne odpowiedzi jedynie na najprostsze pytania.

Duże nadzieje wiąże się z promowanym ostatnio standardem XML, który przenosi akcent w dokumencie z aspektu prezentacyjnego (jak strona ma wyglądać w przeglądarce) na aspekt zawartości informacyjnej (jakie dane zawiera dokument). Takie podejście znakomicie ułatwia m.in. przeszukiwanie i katalogowanie dokumentów. Obecnie jest już dostępna wyszukiwarka Xdex firmy Sequoia Software, umożliwiająca internautom przeprowadzenie szczegółowego wyszukiwania dokumentów zapisanych w języku XML.

Ogromna liczba stron WWW oraz gwałtowny przyrost zasobów informacyjnych sprawiają, że nawet najbardziej zaawansowane narzędzia mają trudności z wytypowaniem właściwych stron WWW . Obecnie tylko 77% internautów wghttp://www.ndp.com znajduje to, czego szukało.

Sposobem na zwiększenie szansy znalezienia poszukiwanej informacji w sieci WWW są wyszukiwarki wyspecjalizowane. Zasadniczą różnicą między wyszukiwarką wyspecjalizowaną a zwykłą jest zawartość ich zasobów. Wyszukiwarka wyspecjalizowana zawiera w katalogu linki tylko do takich stron, które odpowiadają profilowi danej wyszukiwarki.

Innym sposobem na efektywniejsze wyszukiwanie informacji są wyszukiwarki nowej generacji. Oprogramowanie sortujące tych wyszukiwarek decyduje o trafności wyboru odpowiednich linków z bazy danych na podstawie pewnych algorytmów. Jednym ze sposobów jest obliczanie, ile razy dana strona była odwiedzana przez użytkowników i jak długo użytkownicy pozostawali na tej stronie (wg założenia, że strona lepsza jest częściej odwiedzana przez użytkowników). Drugim sposobem jest wyznaczenie trafnej strony na podstawie liczby linków prowadzących do tej strony z serwisów „autorytatywnych” (zawierających odpowiednio duży zasób wartościowych informacji na poszukiwany temat).

Do najbardziej popularnych wyszukiwarek należą:

  • Yahoo (http://www.yahoo.com)

  • AltaVista (http://www.altavista.com)

  • Infoseek (http://www.infoseek.com)

  • Excite (http://www.excite.com)

  • Hotbot (http://www.hotbot.com)

  • Lycos (http://www.lycos.com)

  • WebCrawler (http://www.webcrawler.com).
Przykładem metaserwisu jest Webferret (http://www.webferret.com).

Przykładem wyszukiwarki wyspecjalizowanej jest serwis MP3 (http://www.mp3.com).

Do wyszukiwarek nowej generacji należą:

  • Direct Hit (http://www.directhit.com)

  • Clever (http://www.clever.com)

  • Google (http://www.google.com).

TOP 200