Metaszperacze

Wyszukiwanie informacji to podstawowa umiejętność każdego internauty

Wyszukiwanie informacji to podstawowa umiejętność każdego internauty

Bez odpowiednich narzędzi jesteśmy skazani na błądzenie po zasobach danych światowej pajęczyny. Obok typowych maszyn szukających (search engine) pojawia się coraz więcej superwyszukiwaczy, korzystających z innych.

Otchłanie informacji

Stając przed niepozornym ekranem naszej przeglądarki, czekającej na podanie internetowego adresu, czujemy się niczym astronom uzbrojony w potężny teleskop, umożliwiający oglądanie dowolnie oddalonego obiektu w kosmosie. Ale przecież galaktyk są miliardy, w nich miliardy gwiazd, a my chcemy zobaczyć z bliska tylko niektóre z nich. Bez dobrej mapy nieba jednak dokonać tego nie sposób. Podobnie jest z otchłanią informacyjną wszechsieci.

Internet nie jest podzielony na strefy odległościowe. Połączenie z serwerem w Nowej Zelandii kosztuje tyle, co z Kaliszem czy bazą danych na sąsiedniej ulicy. Poza taryfami internetowymi zależnymi od usługodawcy płacimy, jak za telefoniczną rozmowę lokalną (ściślej mówiąc - do najbliższego węzła naszego providera).

Niektórzy usługodawcy oferują możliwość uiszczenia ryczałtowej opłaty tylko za dostęp do Internetu, bez względu na czas połączeń nie zmienia to jednak faktu, że dłuższy czas pracy w sieci wiąże się z wyższą opłatą rachunku telefonicznego. Nasz czas jest również cenny. W tym kontekście realnej wartości nabiera wiedza o tym, co wpisać po magicznych literkach http.

Chcąc dotrzeć do interesujących nas danych, musimy skorzystać z odpowiedniego oprogramowania. W innym przypadku podejmujemy się karkołomnego przedsięwzięcia typu: -"Znajdź w książce telefonicznej nazwisko do podanego numeru telefonu". Wyobraźmy sobie, że spis telefonów indeksowany jest nie tylko według nazwisk, ale i numerów. Postawione zadanie rozwiążemy wówczas bez kłopotów. Podobnie działa typowy wyszukiwacz internetowych informacji. Lecz co zrobimy, gdy musimy skorzystać z wielu książek telefonicznych? Czyżby nie pozostało nam nic innego, jak kolejne badanie każdej z nich? Przydałby się wówczas "spis spisów"! I to jest właśnie pole do popisu dla metawyszukiwaczy.

Pierwsze kroki

Umiejętność poruszania się w Internecie jest warunkiem efektywnego korzystania z tego medium. Można więc zaopatrzyć się dowolną pozycję książkową, poświęconą "żeglowaniu" i "surfowaniu, lub poszukać ubiegłorocznego hitu: "Internetowej książki teleadresowej", która za jedne 10, 20 zł dostarczy kilku tysięcy adresów URL (Uniform Resource Locator). Nie popełnimy też błędu, jeśli zaczniemy od największej wyszukiwarki, jaką jest LYCOS (http://www.lycos.com ).

Roboty szukające (specjalne oprogramowanie) permanentnie dołączają nowe indeksy i adresy do zasobów tej potężnej bazy danych, obejmującej ponad 67 mln URL i korzystającej w swoich algorytmach z reguł logiki rozmytej (fuzzy logic). Sprzętowo LYCOS wykorzystuje kilkanaście stacji Sun Sparc. Oczywiście dane dotyczące hardware'u, oprogramowania i informacji dostępnych za pomocą internetowych szperaczy zmieniają się niemal z dnia na dzień. Również indywidualnej ocenie należy pozostawić uproszczony osąd, iż LYCOS - z racji swoich rozmiarów - jest wolniejszy od innych, mniejszych wyszukiwaczy. Warto też podkreślić, że dobre wyszukiwacze reagują na typowe zapytania w ciągu sekund, a nie minut, aczkolwiek sumaryczny czas odpowiedzi jest dłuższy, choćby z uwagi na zależność od parametrów połączeń teleinformatycznych.

Do klasycznych wyszukiwaczy należy też YAHOO (http://www.yahoo.com ). Choć w Internecie terminem "klasyczny" często nazywany jest produkt, którego istnienie lepiej liczyć w miesiącach niż w latach. Ta sama firma oferuje również wyszukiwacz specjalnie przeznaczony dla dzieci od 7 do 12 lat - YAHOOLIGANS (http://www.yahooligans.com ). Stąd możemy wybrać jeden z kilku działów tematycznych i udać się np. do zbioru niemal 100 tys. programów shareware'owych i freeware'owych JUMBO (http://www.jumbo.com ).

Dziełem firmy Inktomi, założonej w lutym 1996 r., jest kolejny wyszukiwacz - HOTBOT (http://www.hotbot.com ). Celem firmy jest rozwój wydajnych systemów sieciowych NOW (networks of workstations), wykorzystujących technologie superkomputerowe Kalifornijskiego Uniwersytetu Berkeley. Zawierający 54 mln dokumentów HOTBOT sprawia solidne wrażenie. W razie potrzeby użytkownik może znaleźć niezbędne wskazówki do obsługi programu na stronach pomocy (help). Podstawowa maska systemu (search) zawiera 4 dodatkowe grupy opcji, z których można korzystać indywidualnie:

* MODIFY (modyfikacje) - dodatkowe specyfikacje logiczne dla wyszukiwanych terminów np. "Nie musi zawierać".

* DATE (data) - umożliwia uściślenie przestrzeni czasowej dla badanych dokumentów, np. "Po styczniu 1996" czy "Z okresu ostatnich 6 dni".

* LOCATION (lokacja) - ograniczenia obszaru pochodzenia danych np. w sensie geograficznym - dla hasła "czerwiec" z opcją podstawową "dowolne miejsce" (Any Place) otrzymujemy 1175 trafień, a z opcją "region geograficzny" (Geo Place) dla Europy redukujemy tę liczbę do 1038.

* MEDIA TYPE (rodzaj dokumentu) - dodatkowe wyszczególnienie typu obiektów np. Java, Image, VRML (Virtual Reality Markup Language - standard opisu animacji WWW) czy audio.

Listę wyszukiwaczy można by wydłużać do kilkudziesięciu pozycji, wymieńmy zatem jeszcze EXCITE (http://www.excite.com ), INFOSEEK (http://www.infoseek.com ) i WEBCRAWLER (http://www.webcrawler.com ). W dotychczasowym zestawieniu brakuje nazwy, którą powinien zapamiętać każdy internauta: ALTAVISTA (http://www.altavista.digital.com ).

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200