Wałęsa, Walesa czy Wal/e/sa

Od lat trwa nieustająca, "akademicka" dyskusja o tzw. Problemie Polskich Znaków. Dotyczy przede wszystkim problemów z poprawnym kodowaniem i odkodowaniem polskich liter w sytuacji, gdy czytający widzi znaki różne od tych, które zostały napisane.

Od lat trwa nieustająca, "akademicka" dyskusja o tzw. Problemie Polskich Znaków. Dotyczy przede wszystkim problemów z poprawnym kodowaniem i odkodowaniem polskich liter w sytuacji, gdy czytający widzi znaki różne od tych, które zostały napisane.

Tak naprawdę problem bierze się z mnogości standardów kodowania. Teoretycznie, istnieje rozwiązanie w postaci Unicodu (tablicy zawierającej "wszystkie" znaki "wszystkich" alfabetów: w sumie 256*256 znaków tworzy zupełnie wystarczający zasób, chociaż brak np. jednego znaku dla "zł" występującego w standardzie Mazovii). Superstandard Unicode (http://www.stonehand.com/unicode.html) jest bardzo elegancki, ale nie zawładnie od razu całością oprogramowania. Praktyczne rozwiązania zmierzają raczej w stronę wyposażania oprogramowania w konwertery czy filtry akceptujące różne, stosowane standardy kodowania potrzebnego alfabetu na 7, 8 czy 16 bitach (oraz czasami, choć z tym jest trochę gorzej, mechanizmy rozpoznawania standardu). Najprawdopodobniej doczekamy się dzięki temu zadowalających wyników. Użytkownicy nie chcą nic wiedzieć o standardach kodowania, chcą po prostu pisać w swoim alfabecie, a producenci oprogramowania mają (i chcą) dać im taką możliwość.

Natomiast ŻADEN z istniejących problemów spowodowanych mnogością standardów kodowania polskich liter nie zostanie rozwiązany przez wprowadzenie nowego standardu. Wręcz przeciwnie: utrudni skuteczne rozwiązanie istniejących problemów, np. problemu polskich liter w Internecie.

Rozumiem jednak, że propozycja profesora Antoniego Mazurkiewicza jest próbą znalezienia rozwiązania w sytuacji, kiedy "piszący" nie może albo nie chce używać polskich liter, lub gdy "czytający" nie ma możliwości ich oglądania.

Według mnie zastosowanie jakiejkolwiek normy transliteracji polskich tekstów nie podniesie raczej użyteczności oprogramowania, które z założenia nie daje możliwości korzystania z polskich liter. Najlepiej widać to w bankach, urzędach czy przedsiębiorstwach, które niezmiennie stosują w swoich bazach danych, dokumentach i rachunkach pseudotransliterację polską: "Lucja Swiderska, Lodz".

Także żaden z podanych przykładów transliteracji polskich liter nie rozwiązuje problemu sortowania. Transliterowana "żaba", niezależnie od tego, czy będzie wyglądała tak: "z'aba", tak: "zhaba" czy tak "z/aba", zawsze znajdzie się w porządku leksykograficznym (w ASCII) przed, a ni po "zwierzę".

Nie znaczy to, że nie istnieją takie sposoby transliteracji, które zachowują polski porządek. Załóżmy, że we wszystkich (których zamierzamy używać) standardach kodowania znaków, znaki "{" "|" "}" "~" , a przynajmniej dwa z nich, istnieją, mogą być zawsze używane w aplikacjach i następują po wszystkich małych i dużych literach alfabetu łacińskiego (tak jak w ASCII). Możemy poprzez dodanie któregoś z tych znaków, jako sufiksu do "podobnej" litery łacińskiej, transliterować polskie teksty w miarę dobrze. Oczywiście sufiks do tworzenia "Ź" musi być późniejszy od tego dla "Ż". Jeżeli chcemy aby nasz standard transliteracji był dostępny w pierwszej połówce ASCII, wspólnej dla różnych stron kodowych i zachowywał prawidłowy polski sposób sortowania, to na tym kończą się nasze możliwości. Co osiągnęliśmy? Przy dosyć mocnych założeniach - cztery znaki do wyboru, z których dwa są nawiasami i raczej nie chcielibyśmy ich używać do transliteracji.

Nowe wersje programów pocztowych i przeglądarek wkrótce skutecznie rozwiążą kłopoty z pisaniem polskich znaków w Internecie. Zanim to się stanie, lepiej pozostawić sprawę wyboru sposobu transliteracji samym zainteresowanym. Nadanie jakiejkolwiek językowej prowizorce statusu normy, może przynieść więcej szkody niż pożytku. Sądzę zresztą, że np. nikt wśród "ircowników" nie przejąłby się nią.

Specjalistom, korzystający z polskich tekstów (np. slawiści) mogą bardzo łatwo zaopatrzyć się w odpowiednie programy. Na przykład użytkownicy Windows 95 w wersjach innych niż polska i paneuro – w których można korzystać z polskich liter - mogą doi nie mają odpowiednich programów. Amerykańska wersja Win95 na CD-ROM jest donstalować Multilanguage Support (lang.exe na stroniehttp://www.microsoft.com/windows/software/cdextras.htm).

Na koniec sprawy transliteracji polskich nazwisk w bibliografiach. Zostały one chyba rozwiązane, zanim wynaleziono komputery. Być może nazwisko "Wałęsa" piszą "Walesa", ale czy to komuś przeszkadza? Czy "Wal/e/sa" będzie lepsze?

Konrad Reszczyk jest Hotline Manager w firmie DELTA SOFTWARE Sp. z o.o

(Centrum Informacji Technicznej Microsoft).

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200