Trudności z tłumaczeniami maszynowymi

Sprawa tłumaczeń maszynowych nie schodzi z porządku dnia w Europie Zachodniej.

Sprawa tłumaczeń maszynowych nie schodzi z porządku dnia w Europie Zachodniej.

Dotychczas problem ten interesował głównie władze administracyjne. W różnych językach trzeba bowiem wydawać obowiązujące w EWG dokumenty. Jest to praca nie lada. Już obecnie tłumaczy się tam rocznie ok. 100 mln stron maszynopisu, a koszty tłumaczeń stanowią 1/3 wydatków personalnych Wspólnoty Europejskiej.

Od przyszłego roku z tym problemem zetknie się również większość producentów i dostawców wspólnego europejskiego rynku. Już dziś łamią oni sobie głowę nad tym, jak wyposażać swe produkty w etykietki w wielu językach oraz w różnojęzyczną dokumentację, a także prowadzić ich reklamę w języku kraju przeznaczenia.

Pewne pojęcie na temat skali problemu daje przykład Japonii, kraju o rozwiniętym eksporcie. Tam na obcojęzyczną dokumentację wydaje się rocznie kilka miliardów jenów i już obecnie do pracy translacyjnej zaprzęgnięto ponad 20 komercyjnych systemów tłumaczeń komputerowych.

Przede wszystkim trzeba sobie zdać sprawę, że praktycznie tłumaczenie maszynowe można stosować jedynie tam, gdzie teksty są jednoznaczne i nie stawia się im zbytnich wymagań pod względem stylistycznym. Wszelka dwu - czy wieloznaczność jest bowiem dla komputera zabójcza. A nie daj Boże, jeśli sens tłumaczonego zdania ukryty jest między wierszami, bądź gdy do tłumaczenia potrzebna jest wiedza humanistyczna, czy wysoko specjalistyczna.

Dwa rodzaje systemów

Innymi słowy maszynowe tłumaczenie nadaje się przede wszystkim do sporządzania wykazów rzeczowych, asortymentowych, prognoz pogody i prostych instrukcji obsługi. Przystosowane do tej pracy komputery noszą nazwę MAT lub systemów MT. Dzielą się one na dwie podgrupy:

- systemy pre-edycyjne, w których tekst będący do przetłumaczenia zostaje przedtem przygotowany;

- systemy post-edycyjne, w których tłumaczenie surowe jest następnie korygowane.

Pierwsza grupa tych maszyn może tłumaczyć tylko teksty dostosowane do wymogów komputera. Tekst do tłumaczenia musi być więc dopasowany pod względem językowym. Na tej zasadzie pracuje z powodzeniem eksploatowany od wielu lat w Kanadzie system komputerowy, tłumaczący wyłącznie prognozy pogody, które, jak wiadomo, nie wymagają szczególnej dbałości o styl.

Formą takiego pre-edycyjnego przygotowania tekstu są podjęte w kilku koncernach USA próby, polegające na tym, że na monitorze podaje się wykaz słów i reguł gramatycznych, którymi pracownicy powinni się posługiwać przy formułowaniu tekstów do tłumaczenia komputerowego. Maszyna może wówczas przekładać takie teksty równocześnie na wiele języków. Nie jest to jednak dobra metoda, bo choć, ułatwia pracę, to z drugiej strony, powoduje z konieczności zubożenie języka.

Systemy post-edycyjne są rozwiązaniami doskonalszymi. Do najbardziej znanych w Europie Zachodniej systemów tej grupy należą: Metal Siemens-Nixdorf (SNI) w Monachium, Logos firmy Logos Corp. z siedzibą w RFN we Frankfurcie/Menem i Systran firmy Gachot S.A., Paryż.

Wydajność systemów MAT waha się od 5 do więcej niż 200 stron na godzinę, zależnie do wielkości komputera i jego mocy obliczeniowej. (Dla porównania: Wydajność tłumacza jest oczywiście znacznie mniejsza, wynosi 5 do 15 stron na dzień, w zależności od stopnia trudności tłumaczonego tekstu. Ale w większości przypadków jakość tego tłumaczenia jest zdecydowanie wyższa).

Jak pracuje Metal?

Przyjrzyjmy się jak działa taki system na przykładzie rozwiązania siemensowskiego, które już wkrótce, pod względem funkcjonalnym, powinno stać się samodzielnie pracującą jednostką. Metal jest systemem modularnym, który nadaje się przede wszystkim do tłumaczenia dokumentów technicznych. Tekst tłumaczony w komputerze przechodzi trzy etapy: analizy, przekładu i syntezy.

Podczas analizy, która obejmuje tylko język wyjściowy tłumaczonego tekstu, dokonuje się przy użyciu zmagazynowanej w pamięci gramatyki i zgromadzonych w słowniku informacji rozbioru całego zdania na części składowe. Zdanie jest przekładane na język docelowy, dopiero po zdefiniowaniu każdego słowa pod kątem funkcji pełnionej w zdaniu i pod kątem znaczenia.

W procesie syntezy, która znów dotyczy tylko języka docelowego, tłumaczone zdanie jest porządkowane według reguł tegoż języka i dostosowywane do jego cech szczególnych.

Ważne jest przy tym, aby komputer tłumaczył nie słowo po słowie, co często prowadzi do zabawnych nieporozumień, jak to się zdarza na poziomie PC lub kieszonkowych translatorów. Wielkie systemy MAT tłumaczą słowo w kontekście całego zdania, przestrzegając specyficznych dla każdego języka struktur gramatycznych i leksykalnych. Dodatkową zaletą tych systemów jest jednolitość stosowanej terminologii, również w obszernych tekstach, co przyczynia się do lepszego zrozumienia tłumaczenia.

Decyduje człowiek

Mimo że maszynowe systemy tłumaczące są bardzo wydajne, mogą jednak dostarczyć jedynie surowych tłumaczeń. Żywy język bowiem tylko w ograniczonym stopniu daje się wtłoczyć w elektroniczny gorset. Tłumaczenie dokonane przez maszynę musi być na monitorze opracowane i skorygowane pod względem stylistycznym. Ideałem byłoby, aby komputer pracował dzień i noc, a tłumacz nadawał produktowi tylko ostatni szlif.

Czym dysponuje tłumacz?

Jego stanowisko pracy składa się z komputera z edytorem tekstu oraz wielojęzycznych słowników elektronicznych, do których przez cały czas pracy ma zapewniony dostęp z monitora. Słowniki mogą być rezydentne lub w postaci bazy danych. W pierwszym przypadku, po naciśnięciu aktywnych kluczy ukazuje się na monitorze okienko, w które wpisuje się nieznane słowo, by otrzymać natychmiast jego znaczenie. W drugim, istnieje możliwość uzupełnienia słownika o nowe, nie uwzględnione w nim słowa obcojęzyczne.

Oprócz tych tradycyjnych baz danych w PC zainstaluje się system zarządzania terminologią Mercury/Temex z Euroluxu w Luksemburgu, który w przeciwieństwie do systemów zamkniętych, umożliwia dowolną zmianę struktury.

Wśród wielodostępnych terminologicznych baz danych na szczególną uwagę zasługują wielkie bazy danych On-Line, utrzymywane przez państwa lub duże koncerny. Są to: zarządzany przez EWG bank danych Eurodicautom w Luksemburgu, podległy rządowi kanadyjskiemu Terminum oraz zarządzany przez Siemensa bank danych Team.

Sumując: z uwagi na specyfikę tłumaczenia maszynowego, generalnie przyjmuje się, że przed wprowadzeniem tłumaczenia komputerowego, trzeba najpierw ustalić dla jakich tekstów i jakiej ilości tłumaczeń maszyna ma być użyta. System maszynowy opłaca się przede wszystkim tam, gdzie w możliwie krótkim czasie trzeba przetłumaczyć wielkie ilości tekstu o prostej strukturze i przejrzystej treści. Z uwagi na specyfikę pracy tłumacza rozsądny jest taki podział pracy - człowiek kieruje, maszyna wykonuje.

Z drugiej strony wiadomo, że mimo "intelektualnych ograniczeń", komputer jest zawsze w stanie wykonać za tłumacza czy językoznawcę pracę najbardziej żmudną. Toteż rozsądny jest taki podział pracy - tłumacz myśli i kieruje, komputer wykonuje tłumaczenie surowe.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200