Rzepicha po remoncie

Rzeczpospolita usprawniła elektroniczne archiwum.

Rzeczpospolita usprawniła elektroniczne archiwum.

Rzeczpospolita OnLine udostępniła Rzepichę - nową wersję elektronicznego archiwum dziennika. Zmiany dotyczą przede wszystkim mechanizmu wyszukiwania artykułów. Do dotychczasowego prostego wyszukiwania wg słów kluczowych dodano wyszukiwanie złożone. Użytkownicy mogą tworzyć spisy artykułów, np. wszystkich tekstów danego autora lub spisy tekstów, które ukazały się w określonym dziale gazety.

"Nowe archiwum jest szybsze i wygodniejsze. Zawiera wszystkie teksty z wydania papierowego od 1993 r. Dotychczas dostępnych było tylko ok. 75% artykułów wydań publikowanych od marca 1997 r." - mówi Marek Kopyt, kierujący Rzeczpospolitą OnLine. "Rzepichę, do momentu jej połączenia z archiwum Rzeczpospolitej OnLine, traktujemy jako wersję testową. Mogą pojawić się więc błędy, ale sukcesywnie będziemy je usuwać. Czekamy na informacje od użytkowników" - dodaje. Stare archiwum miało błędy. Jeden z najbardziej uciążliwych powodował niepoprawne wyświetlanie dużej liczby odsyłaczy do odnalezionych tekstów.

W nowym archiwum mogą pojawić się błędy w nazwiskach autorów. Powstały one w wyniku przenoszenia wewnętrznego archiwum elektronicznego gazety do Internetu. Program MarcoPolo, który obsługiwał to archiwum, wyświetlał teksty w postaci grafiki z dołączoną metryczką tekstową, nie zawierającą polskich znaków. Przeniesienie dokumentów było możliwe dopiero po zastosowaniu programów napisanych w języku PostScript, które rozpoznawały polskie znaki.

Rzepicha została wyposażona w nowy indekser, który ma zapewnić większą niezawodność. Stary indekser WAIS zastąpiono produktem niemieckiej firmy BSN. Wykrywane w nim błędy poprawiane są przez BSN na bieżąco. Oprogramowanie działa na serwerach pracujących pod kontrolą Linuxa. Artykuły przechowywane są jako pliki HTML, ich opisy natomiast znajdują się w bazie danych MySQL.

Rzeczpospolita OnLine jest podłączona do Internetu łączem o przepustowości 2 Mb/s. "Ruch na stronie jest duży, ale łącze obciążone jest tylko w połowie" - mówi Marek Kopyt.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200