NEToskop+ - wyszukiwarka dla polskich tekstów
- Józef Muszyński,
- 17.02.2000, godz. 11:54
Zakończono prace nad nową polską wyszukiwarką o nazwie NEToskop+, dostosowaną do specyficznych właściwości języka polskiego, dzięki czemu może ona konkurować z zagranicznymi „szperaczami" na terenie Polski.
Zakończono prace nad nową polską wyszukiwarką o nazwie NEToskop+, dostosowaną do specyficznych właściwości języka polskiego, dzięki czemu może ona konkurować z zagranicznymi „szperaczami" na terenie Polski.
NEToskop+ rozróżnia polskie znaki diakrytyczne w podstawowych standardach kodowania: ISO 8859-2, CP-1250, Latin 2 i Mazovia, oraz uwzględnia najnowsze standardy sieciowe - potrafi m.in. katalogować strony umieszczone na wirtualnych serwerach WWW. Przy okazji opracowano także nową bazę danych, która jest znacznie szybsza niż jej poprzedniczka i dostosowana do przechowywania znacznie większej liczby informacji o każdej przewertowanej stronie. Oprócz indeksowania zawartości NEToskop+ zapamiętuje rozmiar dokumentu, datę skanowania, informacje zawarte w deklaracjach <meta> oraz liczbę odsyłaczy do strony, znalezionych na innych stronach. NEToskop+ wykorzystuje najnowsze algorytmy zapewniające dobrą wydajność wyszukiwania w bazie danych: użyte rozwiązania były konsultowane m.in. ze specjalistami z uniwersytetu w Trondheim w Norwegii, skąd wywodzą się najbardziej zaawansowane systemy wyszukiwawcze na świecie (<i>fast</i> i <i>ftpsearch</i>).