Igła w stogu siana

Czy nastąpi ujednolicenie mechanizmów zapytań w internetowych serwisach wyszukiwawczych?

Czy nastąpi ujednolicenie mechanizmów zapytań w internetowych serwisach wyszukiwawczych?

Trudno byłoby korzystać z Internetu, gdyby nie narzędzia do przeszukiwania zasobów sieci. Mimo to wyszukanie właściwej, najbardziej użytecznej informacji nie jest proste. Mechanizmy przeszukujące wskazują zbyt wiele stron, a programy umożliwiające uściślenie zapytań rzadko działają w ten sam sposób.

Wydawca Search Engine Watch, periodyku zajmującego się usługami świadczonymi przez Internet, podjął pracę nad projektem Search Engine Standard Project, mającego na celu doprowadzenie do współpracy twórców oprogramowania przeszukującego. Więcej informacji o nim można znaleźć na stroniehttp://searchenginewatch.com/standards. Byłoby to wygodne dla użytkowników, gdyby mechanizmy zapytań i zawężania zakresu poszukiwań działały podobnie w najpopularniejszych serwisach - AltaVista, Excite, HotBot, Infoseek, WebClawler czy Yahoo!

Dlaczego w Internecie jest tak dużo różnych serwerów przeszukujących zasoby sieci? Odpowiedź brzmi: ponieważ nie ma takiego, który spełniałby oczekiwania każdego użytkownika. Ja używam MetaClawlera do gromadzenia ogólnych informacji zbieranych przez różne aparaty przeszukujące, AltaVista służy mi do wyszukiwania niejednoznacznych terminów w zasobach WWW, Yahoo! do wyszukiwania stron tematycznych, a Northern Light do skanowania komercyjnych baz danych. Niełatwo zdecydować, który z serwisów jest najlepszy do wyszukania określonej informacji.

Mówi się, że perfekcyjne ogłoszenie typu "poszukuję pracownika" powinno spowodować, że aplikację złoży tylko jeden, najlepszy kandydat. Tak właśnie powinien pracować idealny program do przeszukiwania Internetu - wskazując tylko jedną, właściwą stronę WWW, na której znajdują się potrzebne informacje lub odnośniki do innych źródeł. Najczęściej jednak serwisy zwracają tysiące adresów stron, a proces dochodzenia do właściwej bywa czasochłonny.

Jak sobie radzić

Istnieją pewne mało znane sposoby, dzięki którym proces szukania można usprawnić. Jedna z metod polega na przeszukiwaniu wyłącznie tytułów stron. Dzięki temu pomijane są wszystkie serwery, które zawierają tylko odwołania do tematu interesującego użytkownika. AltaVista, HotBot, Infoseek, GoTo, MSN, Snap i Northern Light realizują to zadanie po umieszczeniu przed słowem kluczowym przedrostka title (np. title: windows bugs). Yahoo! używa przedrostka "t", a Lycos wymaga uruchomienia funkcji Advanced Search.

Jeśli w dalszym ciągu jest wyświetlanych dużo odpowiedzi, to ich liczbę można ograniczyć do jednego adresu, który zawiera wiele odwołań do stron omawiających interesujący temat. W tym przypadku istnieje wiele różnych rozwiązań stosowanych przez programy. AltaVista używa przedrostka host, Infoseek - wyrażenia site, a HotBot, GoTo, MSN i Snap - domain. Inne serwisy nie oferują tego rodzaju mechanizmu, choć niektóre mają podobne opcje po uruchomieniu funkcji Advanced Search.

Warto zauważyć, że wyniki przeszukania mogą być różne, nawet po wpisaniu tak prostego słowa kluczowego, jak windows bugs. Większość programów traktuje taki wpis jako windows OR bugs (windows LUB bugs), ale HotBot, Lycos, MSN i Northern Light interpretują zapytanie jako windows AND bugs. Natomiast AltaVista i Google uznają, że podane słowo kluczowe to windows bugs.

Wszystkie zasady są opisane w dokumencie dostępnym pod adresemhttp://searchenginewatch.com/facts/powersearch.html.

Na podstawie InfoWorlda wydawanego przez IDG oprac. jch.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200