Brakujące ogniwo

Rozpoznawanie znaków drukowanych i pisma odręcznego jest zadaniem trudnym obliczeniowo. Dlatego systemy komputerowe korzystające z arsenału narzędzi sztucznej inteligencji, choć górują nad nami szybkością rozpoznawania znaków, to wciąż daleko im do ludzkiej dokładności i poprawności rozpoznania.

Rozpoznawanie znaków drukowanych i pisma odręcznego jest zadaniem trudnym obliczeniowo. Dlatego systemy komputerowe korzystające z arsenału narzędzi sztucznej inteligencji, choć górują nad nami szybkością rozpoznawania znaków, to wciąż daleko im do ludzkiej dokładności i poprawności rozpoznania.

Brakujące ogniwo

Najpierw nauka, potem działanie

Wdrożenie systemów informatycznych, takich jak KSI ZUS czy na potrzeby przeprowadzenia spisu powszechnego przez Główny Urząd Statystyczny, byłoby niemożliwe bez zastosowania wydajnych rozwiązań OCR (Optical Character Recognition) do zasilania danymi tych systemów. Wiele milionów stron formularzy przeniesiono na postać cyfrową za pomocą wydajnych skanerów i analizowano przy użyciu narzędzi ICR (Image Character Recognition lub Intelligent Character Recognition tzn. rozpoznawanie znaków z obrazów lub inteligentne rozpoznawanie znaków). Po wielostopniowej korekcie i weryfikacji uzyskiwanych wyników, dane z papierowych formularzy zyskały postać elektroniczną.

Rozwiązania OCR, choć mniejszej skali, stosuje się w bankach i firmach, gdzie zamówienia czy inne dane napływają w papierowej, aczkolwiek zestandaryzowanej postaci. OCR coraz częściej stosuje się do wprowadzania wyników ankiet (gdzie rozpoznanie obrazu jest procesem trywialnym, jeśli mamy do czynienia z ankietą zawierającą jedynie pola wyboru). Techniki rozpoznawania pisma wykorzystano również w procesie oceny próbnej matury przeprowadzonej w formie testów. Potocznie skrót OCR stosuje się jako określenie wszystkich technik rozpoznawania pisma, chociaż właściwie oznacza tylko takie, gdzie następuje dopasowanie do znaku drukowanego określonego wzorca.

OCR stosuje się tam, gdzie zachodzi potrzeba przeniesienia dokumentu z postaci papierowej na cyfrową. "W wielu firmach, które osiągają pewną dojrzałość technologiczno-organizacyjną, zamiast prowizorycznych rozwiązań, w których grupa wynajętych osób przepisuje pracowicie dokumenty do komputera, zainwestowano w rozwiązania OCR" - mówi Michał Bańdo, product manager w krakowskiej firmie AutoID.

Ograniczona perspektywa

Lecz czy systemy masowego przetwarzania OCR nie są rynkiem skazanym na rychłą marginalizację? Nieuchronne jest bowiem przechodzenie w stronę systemów elektronicznego wprowadzania danych. OCR był koniecznym substytutem brakującego ogniwa w elektronicznym obiegu informacji. Gdy już u źródła uda się je uzyskać w postaci elektronicznej, zanika potrzeba digitalizacji i rozpoznawania pisma. Widać to dobrze na przykładzie ZUS-u (gdzie coraz więcej deklaracji, zamiast na papierze, trafia w postaci plików) czy banków, inwestujących w rozwiązania e-bankowości (klienci coraz częściej nie chcą wypełniać papierowych formularzy przelewów).

Oczywiście papierowe dokumenty nie znikną i OCR będzie potrzebny, ale można się spodziewać, że w ciągu najbliższej dekady nie będzie już uzasadnienia budowy wielkich systemów, takich jak chociażby stworzony w Głównym Urzędzie Statystycznym na potrzeby tegorocznego spisu powszechnego (wystarczy, by rachmistrze posługiwali się elektronicznymi rejestratorami). Przedstawiciele firm oferujących rozwiązania OCR nie do końca zgadzają się z taką prognozą. "W Polsce jest jeszcze przed nami wiele pracy, chociażby z uwagi na to, iż całkowicie zaniedbano sprawę archiwów. Tutaj pozostaje do wykonania wiele pracy, bo praktycznie w ogóle nie są one zdigitalizowane" - uważa Marcin Stawarz, dyrektor ds. rozwoju biznesu i członek zarządu w firmie Emax.

W obszarze rozwiązań OCR nie ma już zresztą zbyt szybkiego postępu technologicznego - główny wysiłek badawczy jest skupiony na rozwiązaniach dynamicznych (czyli online), gdzie chodzi przede wszystkim o rozpoznawanie pisma odręcznego (np. na potrzeby urządzeń typu palmtop, gdzie jest analizowana informacja quasi-sensoryczna).

Obraz informacji

Pictorial Information Systems (PIC) jest rozwiązaniem OCR, w którym oprócz dokumentu elektronicznego zawierającego dane pozyskane w procesie OCR, przechowuje się wejściowy plik graficzny (znacznie zwiększa to objętość gromadzonych danych, ale jednocześnie ułatwia późniejszą weryfikację poprawności procesu OCR). Takie rozwiązania stosuje się w przypadku ważnych archiwów czy dokumentów bankowych (m.in. poleceń przelewów, gdzie potrzebne jest również zachowanie np. obrazu graficznego podpisu klienta).

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200