Cyfrowe biorą wszystko

Stworzenie biblioteki cyfrowej z prawdziwego zdarzenia nie ogranicza się tylko do zdigitalizowania tradycyjnych zbiorów. To skomplikowane przedsięwzięcie, które wymaga pokonania wielu problemów organizacyjnych, informatycznych, semantycznych, prawnych. Biblioteka cyfrowa ma swoją specyfikę i charakter.

Stworzenie biblioteki cyfrowej z prawdziwego zdarzenia nie ogranicza się tylko do zdigitalizowania tradycyjnych zbiorów. To skomplikowane przedsięwzięcie, które wymaga pokonania wielu problemów organizacyjnych, informatycznych, semantycznych, prawnych. Biblioteka cyfrowa ma swoją specyfikę i charakter.

Jednym z budzących powszechne zainteresowanie symboli przyszłości są elektroniczne książki. Kilka lat temu masową wyobraźnią zawładnął e-book - domniemany następca książki drukowanej. Potencjalni odbiorcy nowego gadżetu interesowali się przede wszystkim możliwością stworzenia nowego nośnika, który by łączył cechy komputerowego wyświetlacza z poręcznością woluminu. Najbardziej ekscytowała chyba spełniająca się już zresztą perspektywa "miękkiego ekranu" - a przecież miękkość ekranu to nie jest ta zasadnicza jakość, której szukamy. Sprawą o wiele donioślejszą byłoby odtworzenie kontaktu z całym tekstem, jaki książka (czasopismo) na papierze, łatwa do intuicyjnego przeglądania i szybkiego ogarnięcia wzrokiem, zapewnia nam w zdecydowanie lepszym stopniu niż system komputerowy, w którym przeszukiwanie całego tekstu jest bardzo uciążliwe.

Tu postęp był o wiele wolniejszy. Stopniowo jednak przestawiamy się na lekturę bez wydruku. Komputer oferuje nam bowiem jeszcze inne, niezwykle istotne możliwości, jak rozległe zestawianie i porównywanie tekstów, włącznie ze śledzeniem obiegu cytowań. To zestawianie jest interesujące, a w nauce wręcz niezbędne, więcej - stanowi o istocie pracy badawczej, nawet wtedy, gdy teksty są dobierane za pośrednictwem metadanych. Z drugiej strony dorasta pokolenie, które dyskomfort nawigacji po tekście cyfrowym zaakceptuje z radością, jeśli tekst ten będzie szybko dostępny, a jego wyszukiwanie i porównywanie z innymi będzie zawierało element gry, opartej na wyuczonych algorytmach. To chyba przesądza sprawę.

Biblioteka dla każdego

Znaczące porcje zasobów bibliotek naukowych to dziś elektroniczny materiał cyfrowy, pobierany z nośników, których lokalizacja pozostaje na ogół niewidoczna i obojętna dla użytkownika. Kiedy biblioteka dokonuje agregacji materiałów pochodzących od różnych instytucji i z różnych urządzeń, mówimy o bibliotekach wirtualnych. Przez analogię do wirtualnych bytów fizycznych, biblioteki takie nie istnieją realnie i obiektywnie, lecz powoływane są do życia przez samo uruchomienie wyszukiwania.

Z czasem wirtualnymi zaczęto nazywać wszelkie biblioteki elektroniczne, czyli jakoś tam zorganizowane zasoby tekstów archiwizowanych i udostępnianych w jednym z popularnych formatów, takich jak PDF, HTML czy DjVU. Jest to określenie chwytliwe, choć dalekie od precyzji. Mają jednak rację przytomni dostawcy systemów scalających i przeszukujących rozproszone zasoby cyfrowe, którzy szybko zauważyli, że ich zaawansowane programy (dostępne już w Polsce, ale rzadko jeszcze kupowane) pozwalają każdemu użytkownikowi na kreowanie własnej biblioteki w trakcie prowadzonych wyszukiwań, to znaczy na przekraczanie granic pomiędzy instytucjami, kolekcjami, tytułami czasopism itp. Taka transgresja narzuca projektantom trudne zadania organizacyjne i informatyczne, inspiruje badania nad semantyką tekstu i stwarza łamigłówki dla znawców prawa autorskiego. Wszędzie tam, gdzie faktycznie do niej dochodzi, możemy rzeczywiście mówić o bibliotekach wirtualnych.

Tak więc e-book wymyślony po to, żeby można było wziąć w podróż czy na plażę książkę albo nawet nieco więcej książek, albo nawet tysiące książek, to naprawdę zabawka w porównaniu z możliwościami i ofertą biblioteki wirtualnej. Przyszłościowym odpowiednikiem książki drukowanej jest wirtualna, elektroniczna, cyfrowa biblioteka pełnych tekstów. Tylko aktualizowane online połączenie ze wszystkimi dostępnymi zasobami mogłoby uczynić e-book konkurencyjnym dla biblioteki, ale wtedy on sam stanie się po prostu tej biblioteki końcówką. Jak zauważa pewien wydawca: "e-libraries are working: e-books are not".

Cyfrowe biblioteki elektroniczne (będziemy je w dalszym ciągu nazywać "cyfrowymi" i pominiemy kwestię ich "wirtualności") powstają wszędzie. Nie mamy tu na myśli elektronicznych katalogów, choć niektóre serwisy właśnie katalogom online nadają to mylące miano, lecz prawdziwe kolekcje pełnotekstowe. Te z kolei są wynikiem różnych inicjatyw, często prywatnych, nierzadko dyletanckich, niepodlegających rzecz jasna rygorom, jakie ustawa nakłada na organizatora biblioteki, toteż niejedna strona WWW otrzymuje nagle od swojego twórcy dumne miano "biblioteki cyfrowej". Google wymienia polski termin "biblioteka cyfrowa" ponad 500 razy, a "bibliotekę wirtualną" - aż 7800 razy, co dobrze ukazuje, jak głęboko owa "wirtualność" jest rozumiana.

Na przeciwległej krawędzi mamy wielkie zbiory będące w istocie portalami przeznaczonymi dla specjalistów i badaczy. Taka np. Danmarks Elektroniske Fag-og Forskningbibliotek (Deff -http://deff.dk ) oferuje 16 tys. tytułów czasopism naukowych. Oczywiście otwierają one swoje pełne teksty w zależności od uprawnień instytucji, z jaką łączymy się poprzez Deff. Są tu także tzw. gatewaye dziedzinowe i bazy danych, jest katalog centralny, baza ukończonych prac naukowych i projektów badawczych, wyszukiwarka e-printów. Podobne państwowe serwisy istnieją teraz w wielu krajach, np. w Rosji1. Z drugiej strony, nie podejmują one na ogół wysiłku dostarczenia materiałów użytkownikom bibliotek publicznych; tych generalnie obsługują inne, czasem także bardzo rozwinięte portale.

Od lokalnych po narodowe

W Polsce jedynym odpowiednikiem uniwersalnego archiwum publikacji naukowych jest Biblioteka Wirtualna Nauki, powstała jeszcze w 1998 r. Umożliwia ona dostęp do zawartości czasopism archiwizowanych na serwerze Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego (ICM) Uniwersytetu Warszawskiego i zmierza w kierunku objęcia wszystkich zgromadzonych dokumentów, bez względu na ich pierwotną platformę, specjalnie zaprojektowaną wyszukiwarką. Należy mieć nadzieję, że będzie ona wyposażona we wszystkie możliwości w zakresie linkowania i wyszukiwań skrośnych, jakie dają produkty komercyjne. Obecnie pełne teksty w BWN to: baza ScienceDirect (czasopisma Elsevier), czasopisma wydawnictw Springer, Wolters Kluwer i American Chemical Society oraz pełnotekstowe bazy danych: Ovid Biomedical Collection i The European Mathematical Society. To nie jest jeszcze żaden komplet, ale jest tego na tyle dużo, że oględziny prościutkiej strony domowej BWN mogą wyleczyć każdego internautę z dobrodusznego przekonania, że zasoby Internetu są zawsze bezpłatne (tylko europejscy matematycy hołdują zasadzie Open Access). Ponadto ICM oferuje pełnotekstowe czasopisma i książki polskie, udostępniane jako "Biblioteka Wirtualna Matematyki" i "Biblioteka Wirtualna Nauk Przyrodniczych". Oba przedsięwzięcia są permanentnie "under construction", z niewyjaśnionym zakresem, zasięgiem i harmonogramem napełnienia.

Poza Biblioteką Wirtualną Nauki, serwisem ogólnopolskim jest bez wątpienia Polska Biblioteka Internetowa - bądź co bądź prawie 25 tys. jednostek (http://www.pbi.edu.pl ). Jej zadania miały być jednak zupełnie inne, raczej oświatowe, i to według zachowawczego modelu historyczno-literackiego. Deklarowano, że w jej zawartości dominować będą: klasyka literatury polskiej, podręczniki akademickie, dokumenty archiwalne, publikacje dla niewidomych, rękopisy muzyczne oraz pozycje kartograficzne, dzieła malarstwa, grafiki i fotografii, a także zawartość czasopism naukowych. Niektóre teksty PBI przejmuje z Wirtualnej Biblioteki Literatury Polskiej - pożytecznego serwisu Instytutu Filologii Polskiej Uniwersytetu Gdańskiego, zawierającego ponad 120 dzieł lub zbiorów, opublikowanych w postaci transkrypcji htmlowych, z dużą liczbą niekonsekwencji redakcyjnych i o zupełnie amatorskiej szacie graficznej.

Ze względu na postępujące napełnienie PBI staje się znaczącym serwisem. Poprawiła się też nieco szwankująca technika organizacji i prezentacji materiału. Pozostają wady: terminologia i mechanizmy wyszukiwania niedostosowane do tego, co umie już osoba przygotowana do korzystania z bibliotek - poczynając od ubogiego pseudokatalogu, a kończąc na złej polszczyźnie, w jakiej serwis komunikuje się ze swoim użytkownikiem. Nigdy też nie wiemy, który dokument jest reprodukcją oryginału, który zaś - jego transkrypcją, dopóki nie zagłębimy się w jego treść. Oba te braki są regułą w polskich bibliotekach cyfrowych. Nie wszystkie jednak z tych bibliotek są sztandarowymi i bardzo kosztownymi przedsięwzięciami rządowymi.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200