Problemy diakrytyczne

Każdy z użytkowników komputerów w naszym kraju zna problem tzw. "polskich liter".

Każdy z użytkowników komputerów w naszym kraju zna problem tzw. "polskich liter". Nie jesteśmy jednak odosobnieni w tych kłopotach - powstał prawdziwy galimatias standardów znakowych w Europie Środkowej i Wschodniej, w Ameryce Łacińskiej czy Skandynawii. Jest to problem dotyczący nie tylko technik DTP czy znaków otrzymywanych z drukarki - sprawa dotyczy także poczty elektronicznej oraz przesyłania tekstu faksem. Obecnie, do reprezentacji znaku zgodnie ze standardem ASCII używa się 7 bitów. Daje to zaledwie 128 kombinacji zer i jedynek co starcza jedynie na zakodowanie liter małych i dużych, cyfr i kilku znaków pomocniczych. Stosowanie tzw. rozszerzonego kodu ASCII o 8 bitach daje możliwość reprezentowania tylko 256 znaków.

Opracowany ostatnio standard ISO 10646 używa 32 bitów do przedstawienia jednego znaku. W skład tego standardu wchodzi tzw. UNICODE (jako oficjalnie uznany podsystem standardu ISO 10646) - zainicjowany w latach 80-tych przez firmę XEROX Parc. Jest to kod używający do przedstawienia znaku 16 bitów. UNICODE pozwala na kodowanie 65 536 różnych znaków. Możliwe, że ze względu na wzrost mocy obliczeniowych komputerów osobistych, stosując UNICODE można będzie wkrótce przesyłać, przy użyciu poczty elektronicznej, teksty pochodzące z różnych stron świata, zawierające wszystkie znaki diakrytyczne, czy też wręcz po arabsku lub chińsku.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200