Ani likwidacja ani kontynuacja

Polska Biblioteka Internetowa jest projektem zbyt ważnym, by go zarzucić. Musi on jednak wyjść z okresu niemowlęctwa i stać się profesjonalnym systemem.

Polska Biblioteka Internetowa jest projektem zbyt ważnym, by go zarzucić. Musi on jednak wyjść z okresu niemowlęctwa i stać się profesjonalnym systemem.

Historia Polskiej Biblioteki Internetowej (PBI) od początku stanowi splot dwóch niezależnych od siebie opowieści. Jedna z nich dotyczy bytu czysto postulatywnego, powstałego w wyniku "decyzji politycznej" i funkcjonującego w strategiach, planach, sprawozdaniach, projektach lokalnych, krajowych i europejskich. Druga opowieść mówi o projekcie informatycznym, który został zlecony, wykonany i ma określony potencjał rozwojowy. Tym, co najdziwniejsze w tych opowieściach, jest fakt, że każda z nich żyje własnym życiem - stąd może tak duża rozbieżność opinii o PBI i ocen w różnych kontekstach. Computerworld pisał o PBI kilkakrotnie, komentując rozwój projektu wielowymiarowo. Nie próbując rekonstruować obu opowieści szczegółowo, warto jednak nieco je uporządkować, by określić, o czym właściwie mówimy w przypadku PBI.

Potęga marzeń

Polska Biblioteka Internetowa zaczęła swój żywot jako koncepcja w ramach planu działań ePolska, gdzie nazywano ją jeszcze Polską Biblioteką Wirtualną. Tam też przypisano jej dwie podstawowe funkcje: edukacyjną wobec społeczeństwa polskiego i promocyjną wobec społeczeństw innych krajów. W kolejnych edycjach ePolska, opracowaniach powstałych na zlecenie Ministerstwa Nauki i Informatyzacji oraz w wypowiedziach urzędników tego ministerstwa, PBI miała:

  • udostępniać online kanon literatury polskiej

  • udostępniać podręczniki szkolne i akademickie (darmowo lub odpłatnie)

  • udostępniać archiwalia, czasopisma, a nawet dzieła malarstwa polskiego

  • udostępniać w bliżej niesprecyzowanym wyborze kanon literatury powszechnej.

Miało to wyrównać szanse edukacyjne młodzieży z terenów słabo zurbanizowanych, zapewnić dostęp do ojczystej literatury rodakom za granicą oraz sławić kulturę polską na świecie. Czyli "wszystko w jednym". Taki projekt nie mógł się udać, bo historia Internetu na całym świecie nie zna podobnej realizacji. Co nie przeszkadza kolejnym decydentom powtarzać tych samych zapewnień i "przypinać" PBI do coraz to nowych inicjatyw, włącznie z e-Content i open source. W takim ujęciu historia PBI to kolejne sukcesy, nieustanny rozwój i nieograniczone perspektywy.

Informatyczne reality

Druga opowieść jest nieco mniej fascynująca. Na zlecenie MNiI, udzielone w drodze przetargu, wykonano aplikację pod nazwą Polska Biblioteka Internetowa. Jest to zamknięty system portalowy, przechowujący bliżej nieokreśloną liczbę tekstów (liczba publikacji z pierwszej strony nie jest miarodajna, bowiem "publikacja" oznacza zarówno książkę, jak i fraszkę o wielkości jednego akapitu), w niejednolitym formacie, zarządzany poprzez amatorsko zaprojektowaną metainformację (pola wyszukiwawcze: tytuł, autor, wydanie). I tutaj od początku nic się nie zmieniło. Portal wykonany przez prywatne firmy był i jest nadal niedostępny w sensie informatycznym oficjalnym zarządcom merytorycznym. Najpierw była to Akademia Górniczo-Hutnicza, a teraz jest Książnica Kopernikańska w Toruniu. Instytucje wymieniane jako zarządcy nie miały wpływu ani na dobór tekstów zasilających bibliotekę, ani na technologię, w jakiej realizowany jest projekt, ani nawet na poprawność metainformacji! Jeśli się to zmieniło, nic o tym nie wiadomo. Specjalnie powoływane fundacje i rady należą do sfery pierwszej, postulatywnej i ich przełożenie na realny projekt jest bardzo nikłe. Zeszłoroczne tytuły prasowe nazywają rzecz bez ogródek "Śmietnik za trzy miliony" (Newsweek, 11.01.2004), "Błędy w zbiorach Polskiej Biblioteki Internetowej kompromitują Bibliotekę i Uniwersytet Jagielloński" (Gazeta Wyborcza, 21.01.2004). W tym ujęciu PBI to kompletna klapa bez przyszłości.

"Biblioteka" czy "internetowa"?

Od początku projektu istniał opór przeciw stylowi jego prowadzenia, który umownie nazwać można "informatycznym". Firmy IT realizujące projekt skoncentrowały się na jego technicznych aspektach - wszak przeskanowanie inkunabułu czy dokumentu bankowego to w sumie ten sam proces. Poindeksowanie takiego zbioru również. A i tak Google (lub inne cudowne narzędzie informatyczne) znajdzie, co trzeba.

Podejście "bibliotekarskie" jest dokładnie odwrotne. Nieważne, jaką technologią reprodukuje się dokument. Jeśli ma on być dostępny, musi występować w dobrze zorganizowanym zbiorze, poindeksowanym tym pieczołowiciej, im większy jest rozmiar całości. Bo tylko ta pieczołowitość gwarantuje późniejszy sukces w wyszukaniu potrzebnej informacji.

Opisana tu różnica podejść nie przekłada się mechanicznie na środowiska bibliotekarzy i informatyków. Wielu bibliotekarzy współpracowało przy budowie PBI, ale tylko w roli "dawców materiału". Do budowy PBI nie zaproszono też informatyków z "bibliotecznym" doświadczeniem. I w tym tkwi słabość merytoryczna projektu.

Bibliotekarze od setek lat zajmują się porządkowaniem zbiorów informacji, a co najmniej od dwustu lat zmagają się z problemem opracowania wielkich zasobów informacyjnych. Nie każdy zdaje sobie z tego sprawę, ale zasób średniej biblioteki akademickiej ma tyle pozycji, że gdybyśmy czytali 1 książkę dziennie (trudno o bardziej wyśrubowaną normę!), to przeczytanie całego zbioru zajęłoby ponad 2 tysiące lat. To uczy pokory.

Bibliotekarstwo wypracowało wiele metod pozwalających na sprawne zarządzanie tak dużymi zbiorami: od właściwej polityki gromadzenia, poprzez staranne opracowanie (metainformacja), aż do sprawnego udostępniania.

Tym, co najbardziej irytuje w projektach podobnych do PBI, jest przekonanie ich twórców, że oto budują coś, czego nikt jeszcze nie tknął dotąd myślą, zatem każdy błąd zostanie im, jako prekursorom, wybaczony. To samo przekonanie mieli twórcy dot-comów głoszący "nową ekonomię". Życie dość brutalnie zweryfikowało te twierdzenia dowodząc, że ekonomia jest zawsze taka sama. Tak samo jest z bibliotekami. Internetowe nadal pozostają bibliotekami, choć wydaje się, że mamy do czynienia z zupełnie nowym zjawiskiem. Oczywiście, sieć i cyfrowość zapisu niespotykanie potęgują pewne właściwości biblioteki, np. jej dostępność. Ale sedno zjawiska jest wciąż to samo.

Co dalej z PBI?

Bez większego trudu można sporządzić przekonującą analizę kardynalnych błędów popełnionych na każdym etapie - gromadzenia materiału, tworzenia metainformacji, aż do sposobu wyszukiwania i prezentacji tekstu. Zasób PBI pełen jest mniej lub bardziej zabawnych pomyłek i paradoksów, zaś przy większych tekstach zawodzi nawet nawigacja po dokumencie. Wyszukanie przykładów zabiera kilkanaście minut, zatem wydłużanie listy zauważonych już mankamentów jest tyleż prawdziwe, co trywialne. Nie zmienia to jednak statusu projektu, który w obecnym kształcie ani nie może zostać zlikwidowany, ani kontynuowany, co być może tłumaczy jego petryfikację w kształcie niewiele zmienionym od momentu powstania.

Likwidacja jest mało prawdopodobna, bowiem Ministerstwo Nauki i Informatyzacji wraz z wykonawcami projektu musiałoby się przyznać do zmarnowania pieniędzy podatników. Łatwo obalić taki zarzut, bowiem PBI istnieje, jakiś zasób został zdigitalizowany i udostępniony, zaś firmy przystępujące do przetargów wywiązały się z warunków zawartych w umowach. Formalnie rzecz biorąc nie ma podstaw do negowania osiągnięć projektu, choć wszyscy wiemy, że nie o taki produkt nam chodziło.

Rozwój jest tak samo problematyczny, bowiem dodawanie kolejnych tekstów w obecnej formule PBI będzie tylko potęgować chaos i prowadzić do kolejnych błędów, przeinaczeń i niekonsekwencji. "Dopinanie" do tego chaosu superwyszukiwarek to tylko face-lifting, który pozwoli wyszukać dowolną frazę, ale będzie ona zawarta w dokumencie bez rozwiniętych powiązań z całym uniwersum innych dokumentów. Wartość informacyjna będzie zatem "punktowa" - zamiast sięgnąć do książki, uczniowie wydrukują sobie potrzebne fragmenty, ale kontekstu żadnego nie będzie. Nie zorientują się z opisu w PBI, w jakiej epoce żył autor, kiedy wydano dzieło po raz pierwszy, czy skopiowany fragment jest jedyną wersją, czy najpopularniejszym wariantem, ani nawet czy dana pozycja należy do jakiegokolwiek kanonu lub choćby w której klasie jest lekturą!

Jak to robią zawodowcy

Polska Biblioteka Internetowa jest projektem zbyt ważnym, by go zarzucić. Ale musi on wyjść z okresu niemowlęctwa i stać się profesjonalnym systemem. Istnieje pewna analogia do cyklu rozwoju każdego oprogramowania. Początkowy produkt jest zwykle "łatany" (patche to dziś standard) oraz obudowywany dodatkowymi funkcjami ("wtyczki", makra, ładowalne moduły). Ale prędzej czy później przychodzi moment, że najeżony wtyczkami patchwork staje się coraz trudniejszy w obsłudze i coraz mniej efektywny. Następuje "przepisanie" systemu według nowego planu za pomocą nowych narzędzi.

PBI nie da się po prostu poprawić. Cały system musi zostać "przepisany" i będzie to ogromna praca, której w 90% można było uniknąć, gdyby założenia projektu były opracowane profesjonalnie. Większość problemów nie tkwi w technologiach, które można poprawić relatywnie łatwo, ale w złym przygotowaniu materiału.

Po pierwsze, należałoby ujednolicić format zasobów. Jeśli zdecydowano się na format tekstowy, to pakowanie do tego samego zasobu skanów druków jest nieporozumieniem (co innego materiał ilustracyjny). Format zasobu powinien pozwalać na pełną wirtualizację sposobu prezentacji, czyli uzyskanie widoku do czytania, widoku do druku lub wykonania zrzutu w "czystym" ASCII lub ładnie uformowanym PDF. Z rozpowszechnionych standardów własności takie posiada XLM, ale każda inna elastyczna notacja byłaby również akceptowalna.

Po drugie, każda publikacja w PBI powinna mieć szczegółową proweniencję - czyli dokładnie opisane źródło, z którego zaczerpnięto tekst. Umieszczanie jako jedynej informacji nazwy firmy, która skanowała nie wiadomo właściwie co (krytyczne wydanie o wysokiej jakości, czy dodatek do gazety pełen błędów), jest bezsensowne. Wskazanie na proweniencję jest nie tylko gwarantem jakości i wierności oryginałowi, ale łączy zasoby cyfrowe z wciąż dużo większym uniwersum informacji utrwalonej drukiem na papierze. Przerwanie ciągłości pomiędzy źródłami tradycyjnymi i cyfrowymi może prowadzić tylko do wtórnego, kulturowego analfabetyzmu, już świdocznego w młodym pokoleniu.

Po trzecie, należałoby w ramach PBI wydzielić "kolekcje", które uporządkowałyby zarówno proces selekcji tekstów, jak i ułatwiałyby korzystanie z nich. Zabieg taki zastosowano w projekcie American Memory Biblioteki Kongresu i wydaje się on być dobrą drogą budowania wielkich zasobów cyfrowych. Zatem w PBI można by zdefiniować kolekcje pt. "Kanon literatury polskiej", "Lektury do klasy x", "Zabytki piśmiennictwa", "Źródła do historii Polski" i wiele, wiele innych funkcjonalnych całości (które mogą się przecinać zakresami). W ramach każdej kolekcji należałoby wtedy zmierzać do kompletności zasobu, co zarówno podniosłoby jego funkcjonalność, jak i ustaliłoby ramy dla polityki pozyskiwania tekstów. Tak robią bibliotekarze kompletując zbiory. Wrzucenie wszystkiego do jednego worka, w którym Biblia Gutenberga sąsiaduje z podręcznikiem o mechanice płynów i przemyśleniami Karola Marksa, musi sprawiać wrażenie chaosu.

Po czwarte, metainformacja PBI musiałaby zostać znacznie rozbudowana i sprzężona z innymi systemami katalogowymi - Biblioteki Narodowej oraz NUKAT. Przecież teksty w PBI są pozyskiwane z druków, aż się zatem narzuca, by w metainformacji o tych drukach znalazł się link do zasobów PBI. Dokładna specyfikacja tych powiązań wykracza poza ramy tego artykułu - powiedzmy tylko, że takie integrowanie informacji jest normalną praktyką służb informacyjnych (w tym bibliotekarzy) w krajach rozwiniętych.

Cudu nie będzie

Nadzieja na cudowne uzdrowienie PBI za pomocą technologii pozwalającej na przeskoczenie solidnej bibliotekarskiej roboty jest płonna. Trzeba zakasać rękawy i uporządkować tę bibliotekę, tak jak się porządkuje każdą zaniedbaną placówkę, "zapuszczoną" przez dyletantów. Trzeba poukładać zbiory, powywalać co niepotrzebne, kupić porządne wydania w twardych okładkach, zrobić dobry katalog i zaprosić czytelników. Jak długo Ministerstwo Nauki i Informatyzacji będzie kultywowało mit o udanym projekcie, tak długo będzie egzystować w sieci to co jest. I tylko to.

Dr Aleksander Radwański kieruje Działem Komputeryzacji w Zakładzie Narodowym im. Ossolińskich, jest członkiem zespołu redakcyjnego elektronicznego serwisu informacyjnego dla bibliotekarzy i specjalistów informacji EBIB - Elektroniczna BIBlioteka.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200