Metaszperacze

Superwyszukiwacze

Typowa wyszukiwarka bada jedynie część olbrzymich i stale rosnących zasobów wszechsieci. Od konstatacji tego faktu tylko krok do idei Uniwersalnej Maszyny Szukającej (USE - Universal Search Engine). Wystarczy do istniejącego poziomu indeksów dobudować wyższy poziom metaindeksów. W praktyce użytkownik nie będzie pytał, czy faktycznie ma do czynienia z metaindeksami, czy też z aplikacją zawierającą połączenia (links) z wcześniej wymienionymi pojedynczymi wyszukiwarkami. Może więc bardziej trafnym od przedrostka "meta" będzie posługiwanie się dodatkiem "multi"? Takim multiszperaczem jest DOGPILE (http://www.dogpile.com ).

Po podaniu hasła, np. "myszka", otrzymujemy zestaw odpowiedzi siedmiu wyszukiwarek. W tym przypadku YAHOO znalazł 0 dokumentów. LYCOS był bardziej efektywny podając 927 adresów, przy czym zgodnie z oczekiwaniami - rodzimego pochodzenia znalazły się na czele. Wymieńmy jeszcze EXCITE, która zgłosiła jednen URL z domeny anglojęzycznej i komentarzem "Exotic Animals" (egzotyczne zwierzęta). Warto przetestować efektywność poszczególnych metaszperaczy i porównać je ze zwykłymi. Wyniki mogą być różne, w zależności od sposobu formułowania zapytań i obszaru zainteresowań.

Z drugiej strony

Dotychczas zakładaliśmy, że przeszukiwanie sieci odbywało się jedynie za pomocą przeglądarki. Notabene omawiana wcześniej statystyka WP zawiera również opcję wskazującą na typ przeglądarki, z której korzysta użytkownik - przewaga Netscape nad konkurencją jest w tym przypadku miażdżąca. Zasoby źródłowe Internetu zawsze pozostaną po stronie sieci, ale analizę wyników zapytań może przejąć nasz PC. Również część oprogramowania szukającego możemy zainstalować po naszej stronie, czyli na dysku sztywnym. Chodzi bowiem o możliwość bardziej elastycznego konfigurowania quasi-indywidualnej multiwyszukiwarki.

Z pomocą przychodzi paleta (a jakże!) mniej lub bardziej wyrafinowanego oprogramowania. Przykładem takiej osobistej multiwyszukiwarki (PC multi-search engine) jest pakiet WebFerret firmy FerretSoft (http://www.vironix.com ). Złośliwi mogą stwierdzić, iż największą zaletą programu jest przynależność do klasy freeware, jednak być może prostota pakietu przysporzy mu zwolenników. Użytkownik sam ustala, które z wyszukiwarek mają zostać wykorzystane. Poza ANANZI i MAGELLANEM, inne wymienialiśmy wcześniej. Możemy również ograniczyć liczbę trafień łącznie czy na serwer. Określamy także precyzję szukania: bardziej "na luzie" (loose match) bądź ściśle (strong match) w połączeniu z operatorami logicznymi "i", "lub". Wyniki prezentowane są w tabeli, którą może przejąć inne oprogramowanie do dalszej obróbki.

Opisane funkcje są typowe dla multiwyszukiwarek lokalnych. Znalezione dokumenty mogą być ładowane do specjalnych baz danych, gdzie łatwiej jest je analizować i dokonywać grupowania według ustalonych kryteriów (haseł). W ten sposób można oszczędzać czas połączeń internetowych. Tak właśnie skonfigurowany jest NetAttachePro (http://www.tympani.com ). Ten off-line-reader ładuje dokumenty o ustalonych przez użytkownika cechach na dysk, korzystając z 12 wyszukiwarek. Także opcja wykluczająca z ładowania dokumenty o charakterze multimedialnym przynosi oszczędności finansowe. W tej grupie software'u należy wymienić 3 produkty:

* EchoSearch (http://www.iconvex.com )

* WebCompass (http://www.qdeck.com )

* Internet Fast Forward (http://www.symantec.com ).

Agenci w sieci

Kolejny poziom meta- i multiszperaczy nie daje gwarancji, że obronimy się przed wzrastającą lawiną danych. Zastosujmy zatem chwyt bohaterów "Gwiezdnych wojen" i ucieknijmy w nadprzestrzeń informacyjną.

Na tym hieperpoziomie nie musimy już niczego szukać, a tylko kazać szukać. Ale żeby stać się internautą zarządzjącym żeglowaniem, musimy mieć oddanych pomocników - agentów. Co to jest "agent"? Jak niemal wszystko w informatyce, zapewne będzie to program. Termin ten dobrze znany jest projektantom nowoczesnych baz danych w kontekście produktu Oracle in Motion.

Koncepcja zastosowana przez Oracle może być traktowana jako rodzaj architektury middleware'owej C/S (klient/serwer z dodatkową warstwą "środka"). Mamy tu do czynienia z modyfikacją konfiguracji C/S do postaci C/A/S (A jak agent). Pozwala to na stosowanie sieci bezprzewodowych z transmisją asynchroniczną. Aplikacja zachowa więc swą ciągłość działania, nawet wtedy gdy sprzedawca w drodze do klienta znajdzie się ze swym pracującym notebookiem w tunelu i fizycznie połączenie nie będzie możliwe. Taki komfort funkcjonalny wymaga dodatkowych komponentów pośredniej warstwy konfiguracji: po stronie klienta (użytkownik) sterowaniem transmisją zajmuje się "zarządca informacji" (message manager), któremu w firmie (warstwa serwera) odpowiada moduł "stacji informacji" (message gateway). Właśnie między gatewayem a odpowiednimi bazami danych znajduje się pole działalności agentów.


TOP 200