Otwarte środowisko badań naukowych dla humanistyki

Opublikowany w numerze z 1.03.1993 r. artykuł "Otwarte środowisko badań naukowych" napisany został prawdopodobnie przez jakiegoś humanistę cierpiącego na komputerofobię, czyli paniczny strach przed komputerami. Artykuł ten dowodzi, że jego autor nie ma zielonego pojęcia o tym, do czego się komputer nadaje i co można dzięki niemu osiągnąć. By użyć jego stylu: fakt opublikowania bez komentarza tych "groźnych i złowróżbnych słów" w tygodniku "menedżerów i użytkowników komputerów" to niepokojące zjawisko.

Opublikowany w numerze z 1.03.1993 r. artykuł "Otwarte środowisko badań naukowych" napisany został prawdopodobnie przez jakiegoś humanistę cierpiącego na komputerofobię, czyli paniczny strach przed komputerami. Artykuł ten dowodzi, że jego autor nie ma zielonego pojęcia o tym, do czego się komputer nadaje i co można dzięki niemu osiągnąć. By użyć jego stylu: fakt opublikowania bez komentarza tych "groźnych i złowróżbnych słów" w tygodniku "menedżerów i użytkowników komputerów" to niepokojące zjawisko.

Najpierw jawne kłamstwa. Nieprawdą jest, że publikowane w formie elektronicznej rozprawy, wraz z materiałami pomocniczymi, czytać można tylko na miejscu ich stworzenia bo istnieją tylko w jednym "miękkim" egzemplarzu. Bez trudu mogę ze swojego biurka połączyć się z węzłem komputerowym Uniwersytetu Stanu Virginia i na ekranie swojego komputera obejrzeć wszystkie materiały. Mogę również skopiować je bez żadnej opłaty na swój dysk i wydrukować dowolną czcionką na drukarce laserowej całą rozprawę, powiększając liczbę owych "miękkich kopii", jeśli przyjdzie mi na to ochota. Co za tym idzie nieprawdą jest, że "świat przestaje być globalną wioską". Wręcz odwrotnie, świat stał się w tym momencie globalną wioską. Na informacje nie muszę czekać miesiącami, a szukanie w bibliotekach rozrzuconych po świecie wszystkich źródeł, na których oparta jest dana rozprawa (w praktyce nie do zrealizowania ze względu na koszty) nie będzie już konieczne do jej pełnej oceny. Wszystkie bowiem materiały są dostępne natychmiast, w tym samym miejscu co rozprawa - na ekranie monitora. Gromadzenie materiałów było jednym z najbardziej czasochłonnych etapów pracy historyków. Nieprawdą są dalsze stwierdzenia, iż "bogaty uniwersytet nie będzie już mógł zamawiać wszystkiego, co się publikuje na jakiś temat". Będzie mógł, ale nie będzie takiej potrzeby, gdyż zarówno bogate jak i biedne uniwersytety stać będzie na dostęp do informacji.

Dlaczego miałyby powstać nowe ośrodki naukowe, do których zjeżdżali by się badacze z całego świata? Idea "humanistycznego komputera", leżąca u podstaw snutych w artykule rozważań, do którego można tylko wkładać nowe dane, ale nie można ich przekazać dalej, a jedynie oglądać teksty na miejscu, pokazuje, że autor tych rewelacji nigdy z komputerem nie miał do czynienia. Co więcej, przeczy sam sobie w innych miejscach artykułu pisząc, że zgromadzone tomy spisu ludności będą służyć innym pracom naukowym z tego okresu, "ich znaczenie będzie więc szybko wzrastać". Dane te dostępne są w wielu innych węzłach sieci Internatu, umiejscowionych na uniwersytetach amerykańskich. Nie ma najmniejszych nadziei na odrodzenie średniowiecznego modelu nauki "z mistrzem przy komputerze i gronem czeladników".

Autor artykułu wydaje się również zupełnie nie rozumieć, na czym polegają badania naukowe. Jego obawy dotyczące uznania "wyciągu z katalogu biblioteki" za zbiór ciekawych myśli są całkowicie bezpodstawne. Kto miałby je za takie uznać? Przecież nie recenzenci pracy, specjaliści z danej dziedziny. Nie mylić zgromadzonych materiałów z wynikami pracy naukowej. Materiały mogą być interesujące, mogą służyć za podstawę wielu innych prac, stąd nic dziwnego, że w zgromadzonych w formie elektronicznej materiałach znaleźć można wiele rzeczy, którymi autor właściwej rozprawy wcale się nie zajmował - patrzył on na swoje żródła pod jednym, określonym kątem. Nikt nie osiąga jednak sukcesów w nauce tylko dlatego, że gromadzi materiały.

Klio, muza historii, udzieliła swojego imienia nauce o nazwie kliometria, zajmującej się ilościowymi (statystycznymi) metodami w historii. Przodują w tej dziedzinie Amerykanie. Już w połowie lat 70. komputerowa baza danych, zwana "Archiwum Historyczne", zawierała ogromną ilość informacji (ponad 1 mld znaków), włączając w to wszystkie dane, dotyczące wyborów na różnych szczeblach od 1790 r. Dane zawarte w tym komputerowym archiwum pozwoliły na nowe spojrzenie na wiele aspektów amerykańskiej historii. Jednym z pierwszych przykładów była "radykalna reinterpretacja spraw niewolnictwa", będąca wynikiem przebadania aspektów ekonomicznych utrzymywania tego systemu. Do końca lat 60. panował pogląd, że system oparty na niewolnictwie już przed wojną domową był bliski załamania. Okazuje się jednak, że nie jest to prawda. Inwestycje rolnicze, oparte na pracy niewolniczej, były równie dochodowe, co najlepsze inwestycje przemysłowe. Amerykańscy studenci mają do dyspozycji stworzony w 1987 r. program o nazwie "Wielka Maszyna Amerykańskiej Historii", przedstawiający różne aspekty demograficzne i ekonomiczne w zadanym okresie czasu, bezpośrednio na mapach kartograficznych i wykresach dla podanych obszarów. Można, np. porównać ze sobą sytuację ludności pochodzenia polskiego i irlandzkiego w 1870 r. w stanie Illinois. Wkrótce doczekamy się czasów, gdy wszystkie informacje historyczne będą natychmiast dostępne badaczom w komputerowych archiwach i zamiast szperać po starych dokumentach historycznych historycy będą spędzali całe dni przed monitorami. Stworzenie takich archiwów (nie tylko samych tekstów, ale i grafiki) i ich powszechne udostępnienie poprzez sieci komputerowe to ogromne zadanie, które zajmie znaczną część życia obecnemu pokoleniu historyków. Można to bardziej określić jako "historię w komputerze" niż "komputerową historię". Kolejnym krokiem będzie przekształcenie tych baz danych w bazy wiedzy, dzięki zastosowaniu metod sztucznej inteligencji. Pozwoli to na automatyczne wyszukiwanie powiązań i sprzeczności pomiędzy znanymi faktami i umożliwi wiarygodną rekonstrukcję niektórych zdarzeń.

Dzięki takim bazom danych, zamiast spędzać miesiące w archiwach, każdy historyk może w bardzo krótkim czasie dotrzeć do wszystkich informacji w nich zawartych i sporządzić dowolne wyciągi. Ponieważ takie podsumowania pozwalają na uzasadnienie nowego punktu widzenia, można je istotnie nazwać "otwartymi myślami", ale czemu się ich obawiać i nazywać "głupstwami", jak to czyni autor publikowanego w "ComputerWorld" artykułu?

Przykład z Pensylwanii jest również chybiony. Tekst "Wyznań" św. Augustyna, jak i inne teksty tego autora, poddane zostały badaniom dawno temu. Już od 1949 r. włoski teolog, jezuita, Ojciec Buso, rozpoczął, przy współpracy z firmą IBM, tworzenie konkordacji, czyli wyciągu cytującego każde słowo występujące w tych tekstach wraz z kontekstem, w którym to słowo występuje. Było to dzieło na owe czasy heroiczne, prawdziwie pionierska praca trwająca przez lat 18, aż do roku 1967! Nie wystarczyło po prostu przepisać sam tekst, trzeba było zaznaczyć, z jakiego dzieła i której strony pochodzi. Przez kolejne 13 lat Ojciec Buso sortował i przygotował do druku konkordancję. Dziurkowane karty zajmowały kilka ciężarówek. Ich sortowanie i sporządzanie wyciągów odbywało się wszędzie tam, gdzie firma IBM

pozwalała korzystać wytrwałemu jezuicie ze swoich komputerów. W sumie projekt ten trwał ponad 30 lat, wymagał 1,8 mln godz. pracy ludzkiej i zajął 10 tys. godz. pracy komputerów. Jego rezultatem było 60-tomowe dzieło, zawierające 70 tys. stron!

Była to praca dużo trudniejsza niż sporządzenie słownika rekwencyjnego. Najlepszym ośrodkiem analizy tekstów w Europie jest Oxford, gdzie istnieje "Centrum Studiów nad Tekstami". Miałem przyjemność odwiedzić ten ośrodek parę miesięcy temu i ze zdziwieniem i dużą przyjemnością usłyszałem, że Ojciec Buso nadal aktywnie zajmuje się analizą tekstów, przy współpracy z naukowcami z Oxfordu! Tekst, zapisany w formie elektronicznej, można rzeanalizować bardzo szybko dzięki odpowiedniemu oprogramowaniu - zamiast lat pracy wystarczą obecnie godziny.

Wracając do omawianego artykułu - nieprawdą jest, by trzeba było się udać do Pensylwanii, by dowiedzieć się, jakich to słów św. Augustyn nie użył w swoich "Wyznaniach". Każdemu zainteresowanemu gotów jestem udzielić takiej informacji lub podać adres poczty elektronicznej Prof. O'Donnell'a. Uprawnienie nauki polega m.in. na szerokim propagowaniu wyników swoich badań. Naukowiec, chroniący rezultaty swoich badań w niedostępnym dla innych komputerze, szybko skazałby się na zapomnienie, a co za tym idzie -naukowy niebyt i brak środków na kontynuację badań.

Kolejne kłamstwo to stwierdzenie artykułu, że przy okazji tworzenia archiwum tekstów i obrazów dotyczących pracy poety i malarza Dante Gabriela Rossetiego "powstał nowy termin, zyskujący sobie coraz więcej zwolenników, hypertext". Na łamach Waszego tygodnika pisano już na ten temat: sam termin rozpowszechnił w początkach lat 70. Ted Nelson w swojej wizjonerskiej książce "Komputerowe Biblioteki i Maszyny Marzeń", a idea wywodzi się od V. Busha z jego artykułu z 1945 r. Archiwum Rossetiego jest jednym z wielu archiwów poświęconych wybitnemu twórcy. Jednym z pierwszych takich archiwów, które miałem okazję "odwiedzić" - oczywiście nie ruszając się od swojego biurka, chociaż archiwum to mieści się w Dartsmouth College w USA - i bez "wykupywania czasu na tamtejszym komputerze", było znakomicie zorganizowane archiwum dotyczące Dantego Alighieri. Dzięki takim archiwom każdy humanista może uzyskać szybki dostęp do całej zgromadzonej wiedzy na specjalistyczny temat. Nie tylko historycy, ale nawet filozofowie tworzą obecnie takie archiwa dla własnych celów badawczych.

Zupełnie zgadzam się z cytowanymi amerykańskimi uczonymi: wszystkie badania z historii literatury i innych dziedzin nauk humanistycznych będą wkrótce prowadzone w ten sposób. Czas tracony na dotarcie do źródeł znacznie się skróci, a koszty prowadzenia badań w tej dziedzinie zmaleją. Ludzie będą mogli się zająć myśleniem, pozostawiając ślęczenie w archiwach pracownikom technicznym, którzy będą pomagać zmieniać zawarte w nich dane na elektroniczną postać. Są to dobre wróżby dla humanistów i dobre dla przemysłu komputerowego. Idea "otwartego środowiska badań naukowych" nie umrze własną śmiercią - komputery są po to, by uławić nam życie. Każdemu wolno pisać dowolne głupoty. Redakcje pism, publikujących takie artykuły ponoszą jednak przynajmniej częściową odpowiedzialność za to, co publikują.

Prof. dr hab. Władysław Duch

Katedra Metod Komputerowych UMK

ul. Grudziądzka 5, 87-100 Toruń

Od redakcji: odpowiedź na list zamieścimy w następnym numerze.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200