Szukajcie, a znajdziecie

Zbiory indeksowe polskich zasobów !WWW. W polskiej sieci pojawiło się wiele serwisów wyszukiwawczych.

Zbiory indeksowe polskich zasobów !WWW. W polskiej sieci pojawiło się wiele serwisów wyszukiwawczych.

Nie musimy już sięgać za ocean, aby znaleźć kompletne informacje o zawartości polskiego Internetu. W Polsce dostępne są 3 serwery, dzięki którym można lokalizować zasoby, zgromadzone na krajowych serwerach World Wide Web. Takie serwisy wyszukiwawcze stanowią istotny krok naprzód wobec statycznych zbiorów katalogowych (jak Wirtualna Polska czy WOW), zawierających podzielone w drzewiaste katalogi kolekcje dowiązań do poszczególnych serwerów !WWW. Nowo otwarte serwisy same przeszukują zawartości poszczególnych stron, indeksując je w lokalnej bazie danych. Użytkownik może wyszukiwać potem taką bazę według słów kluczowych. Na świecie serwisy istnieją stosunkowo od dość dawna (w internetowym pojęciu upływu czasu) - przykładami mogą być AltaVista czy Lycos. Po raz pierwszy jednak dostępne są serwery, obejmujące jedynie polską zawartość Internetu - dzięki czemu będą mogły dostarczać kompletne i aktualne informacje.

Wielkie szukanie

Można zastanawiać się jak dużą część ruchu w Internecie generują serwisy wyszukiwawcze. Ich mechaniczna praca jest dość żmudna, a utrudnia ją coraz powszechniejsze umieszczanie zasobów w bazach danych i dynamiczne generowanie stron. Przeszukiwanie zawartości Internetu jest procesem wymagającym czasu i poważnych zasobów. Oprogramowanie do przeszukiwania stron WWW powinno pracować współbieżnie (zgodnie z algorytmami przechodzenia grafów), zaś do gromadzenia danych potrzebne są bardzo duże pamięci zewnętrzne. Obecnie AltaVista funkcjonuje na bazie 10 serwerów, z których każdy ma 10 procesorów Alpha. W bazie przechowywane są dane o ponad 35 mln różnych stron WWW z całego świata (w tym ok. 100 tys. z Polski).

W tym kontekście nasze serwisy wyszukiwawcze prezentują się dość skromnie. Niemniej ogromnie ważne, że w ogóle są.

Serwisów ci u nas dostatek

W grudniu ub.r. Polska OnLine uruchomiła serwis Sieciowid. Sama nazwa stała się źródłem dość poważnego konfliktu. Firma NetWalker prowadziła zaawansowane rozmowy, m.in. z Polska OnLine, nad uruchomieniem ich własnego oprogramowania wyszukiwawczego w serwisie PoL. Ostatecznie podpisała porozumienie z wydawnictwem Vogel. Polska OnLine zastrzegła sobie wówczas urzędowo markę Sieciowid, chociaż - jak utrzymują założyciele NetWalkera - ta nazwa była ich oryginalnym pomysłem. Chcąc nie chcąc, musieli zmienić nazwę, i tak powstał Netoskop. Być może sprawa znajdzie swój finał w sądzie.

Netoskop od samego początku tworzony był z myślą o katalogowaniu zawartości polskiego Internetu. Miał on być wyłączną własnością firmy NetWalker, jednak brak odpowiednich środków finansowych zmusił jego autorów do poszukiwania partnera, z którym wspólnie można by uruchomić serwis wyszukiwawczy. Rozmowy prowadzone z kilkoma najważniejszymi firmami komputerowymi i operatorami Internetu skończyły się niepowodzeniem. Obecnie Netoskop funkcjonuje jako fragment internetowego serwera miesięcznika Chip. Jest to jedyny serwis wyszukiwawczy w polskiej sieci, którego kod napisała krajowa firma. Obecnie w bazie skatalogowanych jest sto kilkadziesiąt tysięcy stron WWW.

Sieciowid zaczął działać prawie jednocześnie z Netoskopem. Niestety, oba serwisy nie potrafią eliminować powtórzeń stron w generowanych odpowiedziach.

Prosto z importu

Polski InfoSeek został uruchomiony przez Interdyscyplinarne Centrum Modelowania (na razie nieoficjalnie) i wykorzystuje oryginalne oprogramowanie Ultraseek. Niestety, oprogramowanie jest zupełnie nie zlokalizowane. Obecnie w utworzonej bazie zgromadzone są informacje o zawartości stron WWW z ponad 2000 polskich serwerów i ponad pół miliona dowiązań URL, z których znacząca część to strony nadające się do indeksowania.

Wszystkim serwisom wyszukiwawczym za jakiś czas przybędzie nowy, bardzo poważny konkurent. Na mocy porozumienia, podpisanego przez Telekomunikację Polską S.A. z polskim oddziałem Digitala, w sieci TPNet uruchomiony zostanie serwer AltaVista Search z polskim interfejsem użytkownika. Będzie on zawierał zarówno kopie plików indeksowych z głównego serwera, jak i samodzielnie przeszukiwał polską zawartość sieci. "Gdy eksperymentalnie uruchomiliśmy na krótko AltaVista Search w polskiej sieci, w ciągu jednego dnia udało się nam zindeksować 10 tys. stron" - mówi Andrzej Borowiec z Digitala.

Nieoczekiwane pojawienie się aż tylu serwisów może stanowić problem dla tych, którzy je przygotowali, jeśli weźmie się pod uwagę korzyści marketingowe, wynikające z faktu bycia "tym pierwszym". Wszystko to jednak z korzyścią dla nas - użytkowników Internetu.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200