KALI - nie bać się jeleni

Dzięki Globalinkowi od niedawna istnieje pakiet programów na PC, który jest urzeczywistnieniem starego marzenia: komputer tłumaczy. Zobaczymy jednak, na ile to, co robi, można rzeczywiście nazwać tłumaczeniem.

Dzięki Globalinkowi od niedawna istnieje pakiet programów na PC, który jest urzeczywistnieniem starego marzenia: komputer tłumaczy. Zobaczymy jednak, na ile to, co robi, można rzeczywiście nazwać tłumaczeniem.

Utopia przekładu maszynowego, żywa od lat dwudziestu, ma się ku końcowi. Dla programów maszyn elektronicznych każdy język ludzki sam przez się jest zbyt skomplikowany, a zestawienia dwóch lub większej liczby języków zbyt kompleksowe. Surowy przekład maszynowy jest dla tłumacza czymś podobnym do nieprzeżutego pokarmu, zwłaszcza wobec mocno ograniczonych możliwości mikrokomputerów.

Do badania stanu przekładu wspomaganego maszynowo posłużył nam komputer AT z programem tłumaczeniowym Globalink. Historia powstania tego programu zaczęła się w późnych latach pięćdziesiątych i wczesnych sześćdziesiątych, tj. w okresie zauroczenia językiem w USA, kiedy to wszystko wydawało się możliwe, jeśli tylko maszyny będą odpowiednio szybkie. Nieco później w latach sześćdziesiątych, po tym, kiedy rząd przyznał milionowe subwencje na rozwój automatycznego tłumaczenia, na gruzach marzeń o wielkości powstały mniejsze firmy prywatne. Człowiek tamtej wczesnej epoki, czeski językoznawca i tłumacz Bedf ich Chaloupka z początkiem lat siedemdziesiątych wniósł swą wiedzę do firmy Hadron, Inc., która w końcu w roku 1986 przeniosła swój system tłumaczenia na mikrokomputer.

Przebieg tłumaczenia maszynowego Globalinkiem wygląda następująco: tekst do przetłumaczenia zostaje wprowadzony do maszyny, następnie przetworzony oraz wyprowadzony po przetłumaczeniu. Powstaje od razu pierwszy problem: Jak wprowadzać tekst do maszyny? Czy ma być w postaci pliku, czy musi być w formacie ASCII, jako że Globalink nie akceptuje dowolnych formatów tekstowych? Konwersja wcale nie jest bezproblemowa, jak wynikałoby z opisów produktów, nawet w najprostszych wypadkach. Żywy tłumacz ma tekst tłumaczony przed sobą, natomiast przy przekładzie maszynowym tekst musi być albo wprowadzony bezpośrednio z klawiatury, albo przy pomocy skanera umiejącego go odczytywać. Takim systemem rozporządzał autor niniejszej relacji: miał Microtec-Scanner MS-II wraz z programem OCR Recognita, a do późniejszej korekty - program Grammatik IV. Jako edytor tekstów posłużył Wordstar 2000.

W obu wypadkach, tzn. przy wprowadzaniu tekstu z klawiatury i za pomocą specjalnie oprogramowanego skanera, powstają oczywiście błędy, jeszcze zanim rozpocznie się właściwą pracę. Dlatego też wprowadzony do maszyny tekst zaleca się przepuścić przez program korekty ortograficznej (tzw. spelling-checker). Małe błędy ortograficzne mogą spowodować wielkie zamieszanie w przekładzie maszynowym. W wielu wypadkach tekst przekładany należy uprzednio opracować pod względem sensu: z góry przecież wiadomo, że pewnych rzeczy program nie potrafi zrobić, na pewno na przykład nie zrozumie figur poetyckich. Dopiero potem można zacząć pracę nad przekładem. Dla kogoś, kto chce to od razu zobaczyć, podane są w tabeli typowe przykłady tłumaczenia z niemieckiego na angielski r odwrotnie.

Tekst, który z natury rzeczy jest bezpośrednio po przetłumaczeniu surowy, musi być jeszcze poddany dodatkowej redakcji - stosownie do celów, którym ma służyć. Ten surowiec może być jeszcze udoskonalony przez tłumacza, ale aby wykorzystać wszystkie możliwości maszyny, powinien być jeszcze wcześniej lub później poddany automatycznej korekcie ortograficznej i gramatycznej. Cały ten złożony proces będzie zapewne któregoś dnia zebrany w jednym pakiecie programów, tak że człowiek będzie wprowadzał tekst za pomocą skanera, a przebieg pracy - aż do ukazania się tekstu na ekranie - pilnie obserwował, aby tu i tam móc ingerować, wnosząc poprawki. Na razie jednak mogą to być co najwyżej marzenia senne zestresowanego tłumacza,bo obecnie każde z tych stadiów jest dostępne osobno.

Zanim zabierzemy się do niewielkiego tłumaczenia próbnego z zastosowaniem programu Globalink, poczynimy szybko kilka uwag dla lepszego wprowadzenia w problem: Globalink dobrze się nadaje zaledwie do „języka podręcznikowego", a mało lub wcale -na przykład do technicznych wypowiedzi skrótowych, w których niemieckie zalecenie („Deckel schlessen" - dosłownie „klapę zamknąć") powinno się oddać przez angielski rozkaz („Close Cover" -„zamknij klapę"). Niestety w Glo-balinku otrzymamy „Cover Close", a więc odwrotny porządek słów. Na to nie można się zgodzić.

Zapotrzebowanie na miejsce na twardym dysku dla dostarczonych słowników wynosi ok. 10 MB. Ten bardzo jeszcze skromny zasób podstawowy miałby przy odpowiednim doborze wyrazów wzrosnąć do 20 MB, a nawet 30 MB. Umiejętności przekładowe maszyny pokazywane w reklamowych ogłoszeniach producenta są przy obecnej wielkości słownika nie do osiągnięcia. Przyjmijmy, że przytoczone w nich przykłady zyskały na wartości w wyniku „obróbki dodatkowej" lub też zostały przetłumaczone przy pomocy (maszynowych) słowników, rozszerzonych w stosunku do zasobu dostarczanego w handlu.

Słowniki dają się też doraźnie rozszerzyć o wskazania szczegółowe, istotne przy tłumaczenia poszczególnych słów. Nie istnieje natomiast możliwość maszynowego przejęcia posiadanych wcześniej zasobów słownikowych. Trzeba wszystko wpisywać do maszyny na nowo. Na przykład autor tego artykułu ma mozolnie zestawiony techniczny słownik komputerowy z zakresu budowy silników lotniczych, zawierający 25 000 haseł (tylko w jednym kierunku). Gdyby dla wprowadzenia do Globalinku jednego hasła zużywać tylko 3 minuty (a może to być realne przy starannej pracy), doszłoby się do tego, że taki zasób wyrazów zdołałoby wcisnąć w Globalink po harówce trwającej pół roku z okładem (bez niedziel i świat). Gdyby zaś zlecić tę pracę komuś innemu (szczególne umiejętności fachowe nie są tu konieczne), to nie obeszłoby się bez wydatku około 30 tys. marek. Tak czy inaczej trzeba by stworzyć do celów specjalnych jeszcze jeden słownik zawierający około 100 tys. haseł. Przy obecnej metodzie wprowadzania haseł kosztowałoby to połowę życia tłumacza.

Istotną pomocą mogłyby być tzw. mikrosłowniki, zawierające słownictwo profesjonalne z różnych dziedzin. Jak dotychczas, są do nabycia nieliczne takie słowniki (m.in. „Biznes - Finanse"), jednak ich zawartość nie stanowi rewelacji. W każdym razie przed rozpowszechnieniem muszą się one jeszcze rozrosnąć. Zapowiedziane są już dalsze: „Farmacja -Chemia" oraz „Prawo".

Tekst do tłumaczenia wczytany za pomocą skanera ma w zestawieniu z tekstem wpisanym z klawiatury wyraźne braki: jeżeli wczytywanie przebiegało z 98-procentową dokładnością, to w każdym wierszu tekstu pojawia się jeden błąd do poprawienia. W wypadku tekstu otrzymanego z drukarki laserowej wysokiej jakości zarówno Microtek-Scanner, jak i program OCR Recognita funkcjonowały praktycznie bezbłędnie, ale użycie ich w odniesieniu do tej zbieraniny, która rzeczywiście trafiała na biurko, było bardzo pracochłonne. Często jesteśmy zmuszeni wprowadzony tekst poprawiać ręcznie (używając do tego jakiegoś standardowego edytora). Może programy korekty ortograficznej okazałyby się w takiej pracy rzeczywiście pomocne.

Globalink dokonuje tłumaczenia w obu kierunkach - z niemieckiego na angielski i z powrotem. Rezultat to - według sformułowania filologa, proszonego o zajęcie stanowiska po demonstracji gramu - „przekład surowy, w najlepszym wypadku daje ogólny wgląd w przybliżoną treść tekstu źródłowego". Mimo to Globalink budzi spore zainteresowanie, między innymi w wielkich przedsiębiorstwach, w których informacje z przedstawicielstw zagranicznych nie zawsze formułowane są po angielsku. Dlatego właśnie znajdują zbyt dalsze wersje Globa-linka: francuska, hiszpańska, rosyjska i chińska (w połączeniu z angielskim), znajdujące się już w ofercie handlowej. W przygotowaniu - według HEI-Soft - znajdują się wersje włoska, portugalska, arabska oraz przeznaczona tłumaczenia z niektórych języków indyjskich.

Szybkość przekładu, drobiazgowo wykazywana przez Globalink, jest duża: ok. 20 tys. słów na godzinę, zależnie od wydajności komputera. Można by się zgodzić, żeby komputer pracował nawet nieco wolniej, ale za to inteligentniej. Dobrze byłoby na przykład, by maszyna wiedziała, czy w wypadku „Loschen" („gaszenie") chodzi o wapno, ogień, zdeaktua-lizowane pliki czy duże pragnienie. Musiałaby jednak w tym celu uchwycić jednocześnie sens ok. 30 wyrazów z najbliższego sąsiedztwa albo też zapytać tłuma-cza-człowieka: „No, jak to właściwie jest?". Pewne „Proximity Se-arch" (przeszukiwanie najbliższego kontekstu) technicznie nie jest niby rzeczą zbyt skomplikowaną, ale jak wiele fakultetów filologicznych trzeba skończyć i ile semestrów poświęcić, żeby potrafić zdefiniować otoczenia choćby tylko 200 najczęstszych czasowników!

Globalink pracuje wybiórczo: albo w trybie interakcyjnym, albo w trybie przetwarzania wsadowego. W trybie interakcyjnym ekran jest podzielony poziomo na połowy: w górnej przesuwa się zdanie po zdaniu tekst niemiecki (wprowadzany bezpośrednio z klawiatury lub sukcesywnie wywoływany z danych w pamięci), a w dolnej jest on tłumaczony na angielski i z miejsca redagowany. Przy przetwarzaniu wsadowym plik tekstowy jest przetwarzany całościowo, a przekład zostaje zapisany w nowym pliku.

Na speqalne życzenie Globa-link utworzyć może jeszcze jeden plik, w którym zestawione zostaną poszczególne zdania oryginału i tłumaczenia oraz podana będzie lista wyrazów nie znalezionych w słowniku i z tego powodu nie przetłumaczonych.

Pokazane teksty próbne treściowo pretensjonale, są w istocie dla przekładu maszynowego znacznie łatwiejsze niż zwykły potoczny list do mamy („Der Erich hat sich da ja man ganz sch"on was ge-leistet!!" - sens „Erich coś narozrabiał!"). Globalink przebija się przez nie - w porównaniu z innymi systemami przekładu maszynowego (także tymi, które działają na dużych komputerach) - bardzo dzielnie. Brakuje - oprócz pewnych wyrazów w słowniku - umiejętności zrozumienia niektórych wyrażeń. Można je jednak wprowadzić do tzw. słownika semantycznego i w przyszłości ich unikać. Nie należy jednak bez zastanowienia pomijać przejmowanego z oryginału przestankowania (np. przecinek przed „that").

W angielskim tekście testowym podprogram korekty ortograficznej Wordstara wskazuje bardzo niewiele wyrazów angielskich zapisanych nieortograficznie. Wydobywa on jednak natychmiast wszyskie nie-przetłumaczone słowa. Program gramatyczny Grammatik IV wytyka pewne rzeczy, a mianowicie złe przestankowanie (przecinek po j.e."), i słusznie użala się, że w danym miejscu coś nie gra (np. pierwsza część zdania rozpoczyna się od .after durability"). Oprócz tego wskazywane są zdania o długości takiej, że są trudne do zrozumienia.

Najpóźniej - po maszynowym usunięciu błędów, które się do tego nadawały - może być potrzebny tłumacz-człowiek (w naszym przypadku do zmian: „durability requirements" zamiast „de-mands", „marking area" zamiast .place", „as a conseąuence" zamiast ..to the conseąuence"). Niektóre z tych błędów można poprzez odpowiednie poprawki w słownikach wygładzić, tak że maszyna w przyszłości podobne teksty będzie tłumaczyła lepiej. Jednak nie da się ominąć pewnych słabych punktów treściowych i gramatycznych, można je tylko lekko poprawić przez ingerencję tłumacza.

Trudno jest bezstronnie ocenić Globalink. Tłumaczowi zawodowemu pomaga się naprawdę dopiero wtedy, kiedy może on wetknąć do maszyny kartkę papieru zapisaną po niemiecku, a wyciągnąć tekst angielski, nawet jeśli wymaga on jeszcze znacznych ulepszeń. Najważniejsze, że nie trzeba już tyle stukać w przeklęte klawisze, liczby zgadzają na wszystkich miejscach po przecinku, nic nie jest opuszczone itp. Ale zbyt daleko jeszcze nie jesteśmy. Kiedy dodane do Globalinka mikrosło-wniki, o których była mowa wyżej, nie będą zbyt mikro, prawdopod-bnie będzie on znacznie lepszy.

Oczywiście dla zawodowego tłumacza byłoby jeszcze lepiej, gdyby twórca powiększył podstawowy bank danych do odpowiedniej objętości i nie obarczał klienta nadmierną robotą. Jednak Globalink robi już dziś coś więcej niż tylko kaleczenie języka. Udaje mu się to przynajmniej częściowo: przetwarza niezrozumiałe na zrozumiałe.

Poleciłem na przykład Globalinkowi przetłumaczyć instrukcję obsługi pewnego przyrządu elektrycznego: da się ją zrozumieć. W rzeczywistości często mamy do czynienia z dołączanymi do różnych urządzeń wielojęzycznymi instrukcjami, które tłumaczone są maszynowo (najczęściej dotyczy to produktów z Dalekiego Wschodu).

Z filologicznego punktu widzenia można oczywiście je wyśmiać, ale trzeba przyznać, że japoński tekst pierwotny jest w nich przetworzony do tego stopnia, że w innojęzycznych odpowiednikach nie ma już jego widocznych śladów strukturalnych.

Poza tym pozostaje jednak jeszcze jeden haczyk. Program Globalink kosztuje ok. 3000 marek. Komplet ze skanerem, oprogramowaniem OCR i odpowiednimi dodatkami wymaga już mnóstwa pieniędzy. A w istocie stanowi zapewne ledwie, .maleńki kąsek" dla „wilka samotnika" z całego stada parającego się tłumaczeniem, nawet gdy ma on PC i doświadczenie w trudnej sztuce posługiwania takimi urządzeniami.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200