(Nie) każdy umie nieść kaganek oświaty

W Polskiej Bibliotece Internetowej - sztandarowym projekcie rządu zmierzającym do budowy społeczeństwa informacyjnego - prędzej natkniemy się na chaos i przypadkowość w doborze książek niż na przemyślane działanie.

W Polskiej Bibliotece Internetowej - sztandarowym projekcie rządu zmierzającym do budowy społeczeństwa informacyjnego - prędzej natkniemy się na chaos i przypadkowość w doborze książek niż na przemyślane działanie.

Pierwszy etap prac nad projektem Polskiej Biblioteki Internetowej kosztował 750 tys. zł. W rezultacie zasoby biblioteki liczą 206 pozycji, co oznacza, że digitalizacja każdej z nich kosztowała 3,6 tys. zł. Za te same pieniądze można by zdigitalizować 100 razy więcej utworów, nie korzystając z zaawansowanych metod typu OCR, a jedynie ze zwykłego komputerowego maszynopisania.

Notabene, chyba aby poprawić sobie statystykę, przyjęto zasadę, że oddzielną pozycją jest zarówno pojedynczy wiersz Józefa Czechowicza, jak i każdy tom Krzyżaków Henryka Sienkiewicza.

Sztuczna inteligencja

Jak deklarują przedstawiciele Ministerstwa Nauki i Informatyzacji (MNiI), do końca 2003 r. w zasobach biblioteki znajdzie się 20 tys. pozycji, czyli codziennie liczba dokumentów powinna zwiększać się o 54 utwory. Dotrzymanie tej obietnicy oznacza, że przez najbliższe sześć miesięcy zostanie wprowadzonych 19 794 pozycji. "Do 2008 r. jest planowane przeniesienie wszystkich archiwalnych zasobów literatury polskiej do wersji elektronicznej" - dowiadujemy się ze stron Polskiej Biblioteki Internetowej.

Zagadką pozostaje, jak autorzy zamierzają tego dokonać, przecież bibliografia literatury polskiej liczy kilkadziesiąt tomów. Przedstawiciele Biblioteki Kongresu USA policzyli, że mając do dyspozycji 2000 pracowników, digitalizacja wszystkich zbiorów biblioteki ("drukowana" zawartość Biblioteki Kongresu w przeliczeniu na bity to ok. 10 TB informacji) zajęłaby kilkaset lat. Ale żeby uspokoić czytelników, zwróćmy uwagę, że w Strategii informatyzacji RP resort informatyzacji zapowiada przeniesienie do PBI tylko ok. 100 tys. pozycji.

W zasobach biblioteki znajdują się obecnie: zeskanowane fragmenty Biblii wydanej przez Johannesa Gutenberga w 1452 r., De Revolutionibus Mikołaja Kopernika, Theatrum Urbium Halicarum, Khur Fźrstliche Brandenburgiche Hinter - Pommerische Horsgerichts Ordnung auff Gnadigsten, Przygody Piotrusia Pana Jamesa Mattew Barrie, Niebezpieczne związki Choderlos de Laclos, Dzieci kapitana Granta Juliusza Verne'a, Romeo i Julia Williama Shakespeare'a oraz książki prof. Ryszarda Tadeusiewicza, rektora Akademii Górniczo-Hutniczej, uczelni współtworzącej PBI. Tymczasem zasadniczym celem powołania Polskiej Biblioteki Internetowej miało być "wyrównanie szans dostępu do różnorodnych publikacji wydanych dotychczas w języku polskim osobom pochodzącym z małych miast, wsi czy innych regionów oddalonych od ośrodków akademickich i kulturalnych, gdzie komputer z łączem do Internetu może być jedyną szansą kontaktu ze zdobyczami literatury i kultury (...) Zasadniczy katalog PBI będzie obejmować klasykę literatury polskiej".

Czy znajdzie się choć jeden wiejski mól książkowy, który będzie chciał przeczytać dzieła Mikołaja Kopernika i Biblię po łacinie czy inkunabuły po niemiecku? I od kiedy dzieła Juliusza Verne'a i Williama Shakespeare'a stanowią klasykę literatury polskiej? Które dziecko sięgnie po rozważania prof. Ryszarda Tadeusiewicza o sztucznej inteligencji? Nieprzemyślana kolejność digitalizacji utworów powoduje, że z jej zasobów polscy internauci długo nie będą masowo korzystać.

Szukaj wiatru w polu

Polska Biblioteka Internetowa - oprócz katalogu autorskiego i tytułowego oraz wyszukiwarki przeszukującej jedynie tytuły utworów i nazwiska autorów - nie oferuje żadnych zaawansowanych mechanizmów wyszukiwawczych czy kategoryzacyjnych. W PBI brak stosowanego od lat w Internecie wyszukiwania pełnotekstowego zdigitalizowanych, a nie zeskanowanych tekstów, tezaurusa, języka haseł przedmiotowych, deskryptorów, słów kluczowych, czy chociażby - dostępnych od dziesiątek lat nawet w kartotekowych systemach bibliotecznych - indeksu utworów według dat wydania. Po finansowanym z publicznych pieniędzy projekcie, w którym udział biorą tak renomowane instytucje, jak Biblioteka Jagiellońska czy Archiwa Państwowe, można by spodziewać się więcej.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200