NEToskop+ - wyszukiwarka dla polskich tekstów

Zakończono prace nad nową polską wyszukiwarką o nazwie NEToskop+, dostosowaną do specyficznych właściwości języka polskiego, dzięki czemu może ona konkurować z zagranicznymi „szperaczami" na terenie Polski.

Zakończono prace nad nową polską wyszukiwarką o nazwie NEToskop+, dostosowaną do specyficznych właściwości języka polskiego, dzięki czemu może ona konkurować z zagranicznymi „szperaczami" na terenie Polski.

NEToskop+ rozróżnia polskie znaki diakrytyczne w podstawowych standardach kodowania: ISO 8859-2, CP-1250, Latin 2 i Mazovia, oraz uwzględnia najnowsze standardy sieciowe - potrafi m.in. katalogować strony umieszczone na wirtualnych serwerach WWW. Przy okazji opracowano także nową bazę danych, która jest znacznie szybsza niż jej poprzedniczka i dostosowana do przechowywania znacznie większej liczby informacji o każdej przewertowanej stronie. Oprócz indeksowania zawartości NEToskop+ zapamiętuje rozmiar dokumentu, datę skanowania, informacje zawarte w deklaracjach <meta> oraz liczbę odsyłaczy do strony, znalezionych na innych stronach. NEToskop+ wykorzystuje najnowsze algorytmy zapewniające dobrą wydajność wyszukiwania w bazie danych: użyte rozwiązania były konsultowane m.in. ze specjalistami z uniwersytetu w Trondheim w Norwegii, skąd wywodzą się najbardziej zaawansowane systemy wyszukiwawcze na świecie (<i>fast</i> i <i>ftpsearch</i>).

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200