Znowu te ogonki

Kiedyś, jeszcze na początku komputeryzacji w Polsce, teksty pozbawione polskich liter nikogo nie dziwiły. Wkrótce jednak programy zaczęły operować czystą polszczyzną. Dzisiaj, kiedy gwałtownie rozwija się w naszym kraju Internet, powróciły stare problemy z ogonkami.

Kiedyś, jeszcze na początku komputeryzacji w Polsce, teksty pozbawione polskich liter nikogo nie dziwiły. Wkrótce jednak programy zaczęły operować czystą polszczyzną. Dzisiaj, kiedy gwałtownie rozwija się w naszym kraju Internet, powróciły stare problemy z ogonkami.

Wszyscy pewnie jeszcze pamiętają czasy, kiedy na porządku dziennym były pojawiające się na ekranie komputera komunikaty typu: "Byly bledy". Później jednak wymagania użytkowników wzrosły i miarą profesjonalności programów stała się możliwość operowania poprawną polszczyzną. Zaczęły mnożyć się standardy kodowania polskich znaków. Nie było to jednak tak istotne, dopóki komputery stały sobie grzecznie w domach czy biurach, a przenoszenie danych z jednego na drugi zdarzało się sporadycznie. Czasy się jednak zmieniły i oprócz komputerów pojawiły się kabelki, łączące je w większe sieci. Wówczas problem polskich znaków powrócił...

Internet powstał w USA, gdzie o naszych kłopotach z ogonkami mało kto miał pojęcie. W dodatku większość oprogramowania wykorzystywanego w Internecie po dziś dzień używa czystego, 7-bitowego kodu ASCII.

Standard bez standardu

Tymczasem w Internecie powszechnie przyjął się najprostszy sposób kodowania wszystkich liter naszego alfabetu, a mianowicie 'bez polskich znaków'. Tak oto wróciliśmy do czasów początków komputeryzacji w Polsce, kiedy teksty pozbawione ogonków były nie tylko czymś normalnym, ale nawet charakterystycznym dla `dzieł' tworzonych na komputerze. Najczęściej nie prowadzi to do nieporozumień, bo w końcu mało jest w naszym języku słów różniących się jedynie tymi kilkoma ogonkami. Niemal zawsze można wywnioskować z kontekstu całego zdania, o którą 'wersję' słowa idzie.

Pojawia się tutaj poważny problem - codzienne operowanie na takich "polskawych" tekstach bardzo niekorzystnie wpływa na znajomość ortografii. Sam zauważam, że obecnie robię znacznie więcej błędów ortograficznych, niż w czasach, gdy nie zajmowałem się tak dużo Internetem. Bowiem większość ludzi uczy się pisowni wyrazów poprzez zapamiętanie ich wyglądu. Gdy na co dzień spotykam się z "polskawą" pisownią na przykład słowa `również', to coraz częściej nie wiem, jak to właściwie powinno być: `rowniez' czy może raczej `rownierz', jako że obie te wersje wyglądają dla mnie równie dziwnie!

Najważniejsze są jednak mimo wszystko względy estetyczne. Teksty pisane bez ogonków są po prostu nieeleganckie, świadczą o niestaranności autora.

Poczta elektroniczna

Dzisiaj zarówno w systemie poczty, jak i w tak zwanych newsach (Usenet) nie stosuje się polskich znaków. Co prawda coraz ważniejszy staje się standard MIME, pozwalający na przesyłanie pocztą praktycznie wszelkiego rodzaju danych, w tym znaków narodowych. Jednak na jego rozpowszechnienie będzie trzeba jeszcze poczekać.

To taki zamknięty krąg - użytkownicy sieci nie korzystają z MIME, ponieważ nie jest to jeszcze powszechnie stosowany standard i niektórzy mogliby mieć problemy z odczytaniem takich listów . Z drugiej strony nie staje się on popularny, bowiem mało kto z niego korzysta. Można jednak mieć nadzieję, że ten problem uda się rozwiązać i najdalej za rok listy przesyłane w Internecie, będą zawierać wszystkie polskie znaki.

MIME radzi sobie z wieloma różnymi standardami polskich liter. W nagłówku listu zgodnego z MIME znajduje się informacja o tym, jaki zestaw znaków został wykorzystany. Najczęściej jest to ISO-8859-2, stanowiący w sieci standard dla Europy Wschodniej. Dzięki temu program pocztowy może dokonać automatycznej konwersji na standard stosowany lokalnie. Co najważniejsze, dzieje się to zupełnie automatycznie, bez udziału użytkownika. Wówczas, jeśli tylko obydwa komputery, między którymi krąży korespondencja, mają poprawnie skonfigurowane programy pocztowe, pozwalające na korzystanie ze standardu MIME, to list napisany po polsku po jednej stronie, będzie mogł być odczytany w takiej samej postaci po drugiej.

Właśnie owo poprawne skonfigurowanie programów pocztowych jest największym problemem. Na razie progiem nie do przekroczenia jest przekonanie niektórych administratorów sieci, że standard MIME rozwiązuje większość problemów związanych z przesyłaniem dowolnych tekstów. A dopóki MIME nie bęzie powszechnie stosowany, tak długo będziemy skazani na listy pozbawione ogonków.

World Wide Web

O ile jeszcze przy przesyłaniu poczty lub artykułów w Usenecie, pisanie po "polskawemu" jest dopuszczalne wobec braku alternatywy, o tyle brak polskich znaków na czyjejś stronie WWW świadczy wyłącznie o lenistwie i niedbałości autora. Zainstalowanie polskich fontów w systemie WWW nie przedstawia większych trudności technicznych.

Najpopularniejsze obecnie przeglądarki WWW pracują w okienkach X-windows pod Unixem, albo też w popularnych MS-Windows na komputerach PC. W obydwu tych systemach stosuje się dwa różne standardy kodowania polskich znaków. W systemie Unix jest to ISO-8859-2, natomiast w MS-Windows CP1207, określany też czasami jako Latin-2.

Aby poradzić sobie z tą niezgodnością, od niedawna zaczęto stosować rozwiązanie polegające na pozostawianiu użytkownikowi możliwości dokonania interakcyjnego wyboru systemu kodowania polskich znaków. Na pierwszej stronie WWW, która nie musi zawierać liter z ogonkami, można przedstawić listę dostępnych standardów. W zależności od dokonanego wyboru, specjalny program rezydujący na serwerze dokonuje konwersji stron `w locie' i dopiero tak przerobioną stronę wysyła do użytkownika.

Oczywiście zawsze powinna być dostępna opcja `bez polskich znaków', przeznaczona dla użytkowników, którzy nie mają w swoim systemie zainstalowanych polskich liter.

Co dalej?

Nie ulega wątpliwości, że warto chyba trochę popracować nad konfiguracją swojego systemu, tak aby móc używać polskich znaków. Oczywiście najprościej byłoby wprowadzić jednolity standard polskich znaków - wówczas zniknęłyby wszystkie problemy związane z ich niezgodnością. Jest to jednak mało realne.

Pozostają jednak sprawne i proste metody, takie jak MIME, pozwalające na automatyczną konwersję między różnymi standardami, wszędzie tam, gdzie stykają się różne platformy sprzętowe. Niestety to nie rozwiązuje problemu polskich liter w pajęczynie WWW. Można mieć jedynie nadzieję, że nowe wersje protokołu HTTP będą wyposażone w możliwość dokonania automatycznego wyboru standardu kodowania znaków narodowych.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200