Tłumaczenie maszynowe

Można powiedzieć, że w jakimś sensie Europejska Wspólnota Gospodarcza jest istną Wieżą Babel. Obowiązuje tam dziewięć języków urzędowych.

Można powiedzieć, że w jakimś sensie Europejska Wspólnota Gospodarcza jest istną Wieżą Babel. Obowiązuje tam dziewięć języków urzędowych.

W związku z czym każdy dokument, napisany w jednym z nich, musi być przełożony na 8 innych. W ten sposób dokonuje się przekładów aż w 72 kierunkach. Absorbuje to w każdym kraju całą armię tłumaczy, którzy ledwie nadążają z ogromem pracy, produkując rocznie ponad 170 mln stron tekstu. Jest to praca żmudna i kosztowna. Tłumaczenia pochłaniają co roku 1/3 administracyjnego budżetu Wspólnoty. Nic więc dziwnego, że od dawna czyni się starania o odciążenie ludzi od tego żmudnego zajęcia i zaprzęgnięcie do tej pracy komputerów, które automatycznie przekładałyby urzędowe dokumenty i wydawały je w wymaganych językach.

Prace w tym kierunku władze EWG podjęły już na początku lat osiemdziesiątych, stosując do tłumaczeń komputerowy system o nazwie Syntran. Dokonuje on surowych tłumaczeń tekstów fachowych, które potem są redagowane. Syntran ma jednak słabe strony, toteż od 1978 r. trwają dyskuje nad opracowaniem nowego systemu "tłumaczeń maszynowych".

Zachodnioeuropejscy specjaliści od tłumaczeń maszynowych mieli w ciągu kilku lat zbudować prototyp systemu tłumaczenia maszynowego, który przekładałby teksty w ograniczonym zakresie rzeczowym z każdego języka EWG na pozostałe. Prace trwały do ub. roku. Wydano na nie 55 mln marek i praktycznie zakończyły się niczym. Myśli się o podjęciu dalszych starań. Ale tym razem specjaliści europejscy mają już do czynienia z silną konkurencją ze strony USA i krajów azjatyckich. M.in. te ostatnie, z Japonią na czele, zamierzają do 1995 r. opracować prototyp systemu tłumaczeń dla swego rejonu językowego.

Aby uprościć żmudne i kosztowne tłumaczenia, Wspólnota Europejska ustanowiła w 1982 r. program Eurotra. Jego celem było utworzenie systemu tłumaczeń maszynowych między dziewięcioma urzędowymi językami krajów EWG. Od 1985 r. podjęto w tej dziedzinie intensywne prace, pod kierunkiem Komisji EWG, w placówkach naukowych krajów członkowskich Wspólnoty. W zasadzie chodziło o to, by tekst rozłożyć na szereg części składowych, które mogłyby lec u podstaw abstrakcyjnej struktury każdego języka (język syntetyczny). Dopiero na poziomie tej struktury można wymieniać jednostki leksykalne - np. przedrostki - aby później zbudować strukturę języka docelowego (język syntetyczny). Każdy język ma własną strukturę, dlatego jednego nie da się bezpośrednio przełożyć na inny. Następujący przykład ilustruje budowę systemu Eurotry: francuskie zdanie "Le Japon propose un nouveau programme de cooperation" należy przetłumaczyć na niemiecki.

* pierwszy krok stanowi analiza podanego zdania z punktu widzenia gramatyki ECS (Eurotra Constituent Strukture)

* następnie system bada zależności gramatyczne - jaki jest wzajemny związek poszczególnych części zdania, co jest podmiotem, co orzeczeniem, co dopełnieniem itd. W tym celu pomija się rodzajniki określone i nieokreślone i szereguje się słowa w innej kolejności: "Proposer Japon programme nouveau de cooperation". Części zdania zostają przyporządkowane strukturze drzewa z określonymi pojęciami - całość nazywa się prezentacją ERS (Eurotra Relational Structure), która w tym stadium jeszcze specyficznie odzwierciedla język wyjściowy.

* ta specyficzna dla języka prezentacja zostaje przełożona w trzecim kroku w obowiązującą wszystkie języki prezentację IS (Interface Strukture). Często jest ona identyczna ze strukturą ERS, jednak opatrzona odmiennymi etykietkami i dodatkowymi informacjami semantycznymi.

* następnie słowa wyjściowe są po prostu tłumaczone na odpowiednie słowa języka docelowego. W ten sposób testuje się różne znaczenia semantyczne słowa tak, by przy wielokrotnych sposobach czytania odfiltrować niepoprawne zapisy. Wynikiem jest niemiecka prezentacja IS: "Vorschlag japan kooperationsprogramm neu" (propozycja japonia program współpracy nowy).

* teraz te niemieckie słowa przechodzą całą procedurę wstecz. W piątym kroku ERS zostają uszeregowane w zależności zgodnej ze specyfiką gramatyki niemieckiej w poprawnej kolejności.

* w szóstym, końcowym stadium struktura ECS zostaje "wygładzona", tak że powstaje poprawne zdanie: Japonia proponuje nowy program współpracy. Tłumaczenie tak prostego zdania trwa na stacji roboczej o wielkiej mocy obliczeniowej od dwóch do trzydziestu sekund.

Trochę historii

Idea wykorzystywania komputerów nie tylko do operacji czysto numerycznych, lecz również do tłumaczeń, nie jest nowa. Jednakże początkowe starania, polegające na słownikowym tłumaczeniu słowo po słowie, nie dawały oczekiwanych wyników i w rezultacie ALPAC (Automatic Language Processing Advisory Committee - Komitet Doradczy ds. Automatycznego Przekładania Języków) uznał maszynowe tłumaczenia za "kosztowny nonsens". Niemniej efektem wcześniejszych prac nad mechanicznym tłumaczeniem tekstów było powstanie obszernych słowników, które stanowiły podwaliny do kontynuowania prac, z tym że kolejnym etapem było tłumaczenie najpierw na sztuczny język pośredni (interlingua) a dopiero z niego na język docelowy. Zaleta tej metody polega na tym, że nie wymaga ona opracowywania odrębnych reguł przekładu dla każdej pary języków. To legło właśnie u podstaw Eurotry, a także koncepcji lingwistów i programistów azjatyckich. Przeciwnicy tego rozwiązania zwracają uwagę, że wymaga ono niepotrzebnie podwójnej pracy. Ale przy szybkości operacyjnej komputerów nie stanowi to istotnej przeszkody. Inna metoda dokonywania tłumaczeń, tzw. transferowa, polega na podziale zdań na elementy składowe i ich analizie, a następnie przeniesieniu struktury zdania do języka docelowego. Ale to jeszcze wszystko pieśń przyszłości, jako że do maszynowego tłumaczenia potrzebne są bardzo rozbudowane i stale uzupełniane słowniki.

Trudności

Jak dotychczas istnieją wielkie słowniki niemieckie, francuskie i angielskie. Pozostałe języki to w tej dziedzinie wielka pustynia. Zestawienie wielkiego słownika, to praca żmudna i czasochłonna. Np ostatnio ukazał się wielki słownik ekonomiczny niemiecko-angielski, zawierający 175 000 haseł. Jego opracowanie zajęło dwóm anglistom z uniwersytetu w Bochum ponad 10 lat. Dotyczy to jednej dziedziny. A przecież życie tworzy nieustannie nowe słowa, pojęcia, zwroty. Wreszcie, na zakończenie, kilka przykładów na jakie trudności napotykają językoznawcy przy maszynowych przekładach. Przykład najprostszy - gdy przypisze się jednoznacznym w różnych językach słowom identyczne oznaczenia cyfrowe, np. słowu "kochać", (lieben, to love, aimer), tłumaczenie nie powinno sprawiać trudności. Kłopot pojawia się, gdy w zdaniu wystąpią dwa rzeczowniki. No bo jak przetłumaczyć zdanie niemieckie: "Gras friBt die Kuh" (krowa żarła trawę)? Dla maszynowego tłumacza brzmi ono jednoznacznie: Trawa żarła krowę. Albo gdy występują dwuznaczniki: np. "M„dchenhandelsschule" (Żeńska Szkoła Handlowa) w maszynowym tłumaczeniu brzmi "girl trade school" (szkoła handlu dziewczętami). Albo zdanie angielskie: "I dropped the cake on the table and washed it" (upuściłem ciastko na stół i umyłem - jest dwuznaczne, bo "it" może się odnosić zarówno do ciastka jak i do stołu). Bez porównania łatwiej dokonywać mechanicznych przekładów w wąskiej dziedzinie, w której liczba słów, pojęć i zwrotów jest ograniczona i jednoznaczna. Dlatego przede wszystkim tak bujnie rozwijają się obecnie podręczne translatory wielojęzyczne. Bądźmy jednak dobrej myśli. Tłumaczenia maszynowe mają przed sobą przyszłość. Wszystko wskazuje na to, że niedługo będą mogły być wykorzystywane na szeroką skalę.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200