Elektroniczny Homer

Wbrew naszym wyobrażeniom, znawcy bardzo starych lub odległych języków nie zatrudniają komputera do odczytywania niezrozumiałych i tajemniczych alfabetów. Przynajmniej nie na co dzień.

Wbrew naszym wyobrażeniom, znawcy bardzo starych lub odległych języków nie zatrudniają komputera do odczytywania niezrozumiałych i tajemniczych alfabetów. Przynajmniej nie na co dzień.

Komputer służy zwykle do opracowywania dużych ilości materiałów porównawczych, tak obszernych, że człowiek nie podołałby tej pracy. Dokonuje analiz, wyszukuje różne zestawienia, warianty, konteksty, słowem - obrabia dane. W przypadku języków i pism do dziś nie odczytanych (np. starożytne pismo Krety czy cywilizacji doliny Indusu) zachowało się zbyt mało materiału do jakichkolwiek porównań. Dopóki archeolodzy nie wykopią większej liczby tabliczek czy pieczęci, komputery będą w tej kwestii bezradne.

Do pracy z wieloma egzotycznymi dla nas, ale dobrze znanymi i zrozumiałymi dla fachowców alfabetami, takimi jak np. arabski, pisma indyjskie czy pochodzące od nich pismo tybetańskie, można używać zupełnie zwyczajnych metod edycji tekstu, np. Worda dla Windows, tylko że z odpowiednimi sterownikami klawiatury. Są to przecież alfabety - choć inne od naszego, ale funkcjonujące na tych samych zasadach.

Podróże Sindbada Żeglarza

Czcionki tych pism projektuje się graficznie, między innymi za pomocą programu Fontographer 3.5. Tak samo, jak dowolny krój alfabetu łacińskiego, można w nim skomponować krój pisma dewanagari. Litery są zapamiętywane jako bitmapy, które następnie trzeba skonwertować na właściwe czcionki i dalej - normalnie już - używać klawiatury.

Wprowadzenie graficznego interfejsu użytkownika znacznie ułatwiło życie specjalistom od obcych pism. Przedtem czcionki te trzeba było zapisywać informatycznie, w trybie zero-jedynkowym, a w dodatku przeprogramowywać drukarkę. Teraz własne czcionki jest w stanie zaprojektować każdy filolog obeznany z komputerem.

Nad programem służącym do klasyfikacji i identyfikacji różnych krojów pisma arabskiego pracują naukowcy z Uniwersytetu w Bergen, w Norwegii. Oni też, wespół z Uniwersytetem Karola w Pradze, zabierają się do tworzenia ogromnej bazy danych - korpusu tekstów arabskich. Ciekawostką jest, że wspomniany przed chwilą program do pisma arabskiego, a przynajmniej program działający na tej samej zasadzie, mają zamiar wykorzystać do klasyfikacji... runów, czyli starego i tajemniczego pisma skandynawskiego z czasów Wikingów.

Po chińsku?

Nieco trudniejszy problem pojawia się przy pismach ideograficznych czyli takich, gdzie znaki nie odpowiadają dźwiękom (jak w naszym, czyli łacińskim alfabecie, i we wszystkich alfabetach w ogóle), lecz pojęciom. Klasycznym przykładem takiego systemu jest pismo chińskie, składające się z kilkudziesięciu tysięcy znaków (współczesny Chińczyk, nawet wykształcony, używa "tylko" kilku tysięcy). Na szczęście każdy z tych znaków można rozłożyć na "czynniki pierwsze", czyli pojedyncze linie i ich układy. Okaże się wtedy, że znak taki ma swój rdzeń, najważniejszy i wspólny dla pewnej grupy znaków (czasami bardzo licznej) oraz różne uzupełnienia. Można więc opracować program, który pozwoli komponować znaki z pojedynczych elementów. Programy takie istnieją i w gruncie rzeczy są pewnego rodzaju sterownikami klawiatury.

Najpopularniejszym w tej chwili programem do języka chińskiego jest jednak Chinese Star (pierwsze chińskie fonty dla Windows 95). Daje on różne możliwości: albo dla poszczególnych znaków wpisuje się odpowiednie kody (jest ich kilka tysięcy i trzeba posługiwać się specjalnymi tabelami) albo - co jest znacznie bardziej pociągające - pisze się alfabetem łacińskim, używając jednej z powszechnie przyjętych transkrypcji. Najczęściej tzw. pekińskiej, którą wymyślili sami Chińczycy w latach 50-tych.

Jest ona dosyć męcząca z powodu zbyt swobodnego zastosowania liter łacińskich, niemniej jest to bez porównania lepsze od tysięcy kodów. Po wpisaniu wyrazu w transkrypcji otrzymujemy wszystkie znaki czytane w ten sposób. Może ich być kilka, a nawet kilkanaście, bo taka jest specyfika języka chińskiego, że znaki o różnym wyglądzie i - co więcej - różnym znaczeniu wymawia się tak samo lub tylko z różnicą tonu. Na to już żaden komputer nic nie poradzi, trzeba wybrać ten właściwy znak, co oczywiście dla sinologa nie jest wielkim problemem.

Dużą zaletą Chinese Star jest to, że jego czcionek można używać nawet pod notatnikiem, a także w poczcie elektronicznej, tworzyć dwujęzyczne strony WWW (istnieje opcja tłumaczenia), a nawet grafiki ze znakami chińskimi.

Po japońsku?

Technikę rozkładania ideogramów (w tym przypadku japońskich) na podstawowe elementy przyjęli też autorzy japońskoürosyjskiego słownika automatycznego, pracujący w specjalnej grupie przy Rosyjskiej Akademii Nauk.

Przedsięwzięcie jest skomplikowane ze względu na zupełnie inny rodzaj zapisu obydwu języków (rosyjski - pismo alfabetyczne, japoński - ideograficzne chińskie i sylabiczne), co wymaga innych systemów analizy tekstów. Rosyjscy naukowcy zasługują na szczery podziw - sprzęt, na którym prowadzoną te prace, to dwa komputery IBM, jeden 386, drugi 286... i to pomimo specjalnego grantu przyznanego na projekt słownika.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200