Tłumacze będą niepotrzebni

Systemy przekładu maszynowego mogą być stosowane tylko z pewnymi ograniczeniami. „Informacyjnie" można tylko tłumaczyć teksty z dziedzin stosunkowo „zamkniętych", posługujących się ścisła terminologią.

Systemy przekładu maszynowego mogą być stosowane tylko z pewnymi ograniczeniami. „Informacyjnie" można tylko tłumaczyć teksty z dziedzin stosunkowo „zamkniętych", posługujących się ścisła terminologią.

W raporcie sporządzonym na zlecenie federalnego ministerstwa do spraw badań i technologii przez hamburski instytut techniki informatycznej, uwzględniającym opinie ekspertów od zagadnień literacko-stylistycznych, a także producentów i użytkowników, twierdzi się, że zaledwie co setna strona wykonywanych obecnie tłumaczeń jest wytwarzana za pomocą systemów przekładu maszynowego. Stosowane systemy są bardzo różnorodne: od programów na PC-ty z leksykonem, tłumaczących słowo po słowie, aż do wyrafinowanych systemów, tłumaczących całymi zdaniami. Te ostatnie pozwalają zwiększyć wydajność tłumacza-człowieka do trzech razy, w zależności od jakości i zakresu stosowanych słowników.

W pełni automatyczne systemy tłumaczenia maszynowego używane są dziś w krajach niemieckiego obszaru językowego do przetwarzania informacji fachowej, a szczególnie:

do przekładania fachowej informacji niemieckojęzycznej (w postaci drukowanej albo zapisanej na nośniku komputerowym) na inne języki (przede wszystkim angielski) oraz przekazywania tej informacji na rynek

do tłumaczenia na niemiecki fachowej informacji obcojęzycznej, np. otrzymanej w wyniku kwerendy w anglojęzycznej bazie danych.

Skok w latach osiemdziesiątych

Po okresie opadającego zainteresowania i znikomego (w skali światowej) zaangażowania się w badania nastąpił w latach osiemdziesiątych ogromnie kosztowny rozwój prac nad przekładem maszynowym. Jego początek związany jest w Europie z działalnością komisji EWG, która w końcu lat siedemdziesiątych z jednej strony zaczęła pracę nad przeróbką systemu SYSTRAN, z drugiej zaś -podjęła własny projekt badawczy EUROTRA. W latach osiemdziesiątych były już rozpoczęte liczne projekty w Europie, USA i Japonii. Od tego czasu język niemiecki był uwzględniony w kilku systemach komercyjnych, które mają za sobą kilkuletnią historię rozwoju. Natomiast w sprawnych systemach tłumaczenia maszynowego lat osiemdziesiątych, opracowanych przede wszystkim przez Japończyków zorientowanych na eksport, nie jest on już przewidziany.

Stan badań i ograniczenia

Stopnia komplikacji tłumaczenia maszynowego nikt dziś nie może nie doceniać. Badania od dawna mają charakter interdyscyplinarny: łączą lingwistykę z informatyką, i to pod wzrastającym wpływem dalszych dziedzin fachowych, np. translatoryki, nauk kognitywnych (cognitive science) i sztucznej inteligencji.

Rola składni (struktury języka) jest stosunkowo dobrze rozumiana w dziedzinie tłumaczenia maszynowego. Natomiast odczuwa się ogromny deficyt w zakresie semantyki i pragmatyki, tj. tych działów, które uwzględniają kontekstowe i sytuacyjne zależności od znaczenia. Przekład maszynowy (TM) jest dotychczas rozumiany i realizowany jako proces w niedostatecznym stopniu oparty na bazie naukowej. Uwzględnienie wiedzy o świecie nie jest jeszcze możliwe. Kontekst w dzisiejszych systemach tłumaczenia ogranicza się z reguły do jednego zdania.

Na rynku systemów przekładu maszynowego panuje duża konkurencja. Dotyczy ona zarówno procedur starszych i prostszych, jak i nowszych metod Transfer i Interlingua. W modelu Transfer wykorzystuje się trzy słowniki dla każdej pary języków: wyjściowy, docelowy i transferowy. Głębokość transferu zmienia się od systemu do systemu. Niektóre wykorzystują głębokie struktury syntak-tyczne, inne - powierzchniowe struktury drzewowe, wzbogacone

o informacje syntaktyczne i semantyczne. W modelu Interlingua tłumaczenie jest dokonywane z pomocą tzw. Interlinguy - uniwersalnej, niezależnej od języka znaczeniowej reprezentacji tekstu. Eksperci liczą na to, że w przyszłości nastąpi dalszy postęp wiedzy dzięki zwiększonej współpracy ze specjalistami od sztucznej inteligencji..

Największy wpływ na jakość . programów tłumaczących wywierają: rozmiar i stopień „zamkniętości" danej dziedziny terminologicznej oraz objętość użytych sło.-wników. Teksty reklamowe, umowy, powieści, nie mówiąc już o poezji, jeszcze bardzo długo nie będą się poddawać tłumaczeniu maszynowemu, ponieważ sens zdania często leży w nich między wierszami, a nie w słowach. Często też wymagają one znajomości środowiska społeczno-kulturalne-go, do którego się odnoszą. Efektywne i znaczące gospodarczo są tylko „surowe przekłady informacyjne" podręcznika technicznego, instrukcji obsługi albo fachowego artykułu z dziedziny elektroniki.

Przyszłe systemy tłumaczenia maszynowego będą się rozwijać w tradycyjnych proceduralnych językach programowania, jak AS-SEMBLER czy FORTRAN, tak jak dziś rozwijają się głównie w języku C oraz językach związanych ze sztuczną inteligencją, jak LISP

i PROLOG, czy wreszcie w językach zorientowanych na obiekt, jak Smalltalk albo C++.

Rynki i zastosowania

Jak wynika z badań, dzięki rozwojowi używanych słowników ilość tłumaczeń wspomaganych maszynowo wzrasta około 30% rocznie. A tłumaczeń informacyjnych, dopuszczających usterki stylistyczne i gramatyczne, ale muszących zachowywać zawartość informacyjną tekstu, może wzrastać nawet o 50% rocznie.

Systemy tłumaczenia maszynowego i oparte na nich usługi są wykorzystywane przez licznych użytkowników:

• Władze europejskie z wzrastającym przekonaniem przyjmują techniki MT wewnątrz EWG. EWG oferuje też usługi przekładowe na zewnątrz.

• Wielkie koncerny europejskie coraz częściej używają systemów MT i tłumaczenia informacyjnego.

• Eksporterzy korzystają z usług dużych firm MT.

• Firmy specjalizujące się w najbardziej zaawansowanej technologii używają możliwości dostępu do fachowych systemów informacyjnych przez sieci telekomunikacyjne za pomocą tłumaczenia maszynowego.

Oferta systemów tłumaczenia maszynowego i usług związanych z nimi zostaje opanowana przez trzy wielkie firmy: Siemens, Logos i Systran oraz kilku Japończyków, którzy coraz ostrzej wciskają się na rynek europejski. Do tego dochodzi holenderska DLT z wielką bazą danych leksykalnych w języku esperanto.

Zaleca się stosowanie systemu, który z reguły opiera się na zasadach maszyn liczących średniego i wielkiego rozmiaru przetwarzania danych, w postaci tzw. pre-edycji dla określonych rodzajów tekstów i określonych dziedzin fachowych, zwłaszcza dla dokumentacji oraz instrukcji obsługi urządzeń technicznych.

Otrzymywane teksty osiągają poprawność od 70 do 95 proc. Muszą one być poddawane post-redakcji przez tłumacza z krwi i kości. W porównaniu z tłu-maczem-człowiekiem maszyny pracują nie tylko dzień i noc, ale także bardzo szybko. Człowiek zdoła przetłumaczyć średnio ok. 8 stron na dobę, maszyny - aż do 200 stron. Hamburski instytut doszedł do wniosku, że przekład maszynowy będzie jeszcze przez wiele lat dziedziną badań. Biorąc przeciętną, przekład maszynowy w tłumaczeniu informacyjnym przez pocztę elektroniczną, podobnie jak przy kwerendzie informacji fachowej w obcojęzycznych bankach danych, będzie grał coraz bardziej znaczącą rolę.

Systemy przekładu maszynowego, wspomagające kwerendy w obcojęzycznych bankach danych, są bliskie realizacji, przynajmniej w postaci uproszczonej. Nasuwają się tu trzy grupy problemów. Użytkownik musi mieć możliwość sformułowania pytania do banku danych w swoim własnym języku, chociaż bank ten gromadzi informacje w innym języku. A więc złożone pytanie musi zostać przetłumaczone na język, którym pb-sługuje się bank. I odwrotnie - informacje z banku muszą być przekazane użytkownikom w różnych językach. Wreszcie treść danych banku musi być automatycznie zbierana w języku użytkownika.

Najambitniejszym celem badania pozostaje nadal stworzenie automatycznego tłumacza kabinowego. Taki system łączy przekład maszynowy z analizą i syntezą mowy brzmiącej. Na przykład rozmowa telefoniczna, prowadzona w dwóch językach, mogłaby być symultanicznie tłumaczona. Jednak zanim podobne zadanie będzie realizowane seryjnie, miną jeszcze lata.