Brakujące ogniwo

Pisane ręcznie

Osobnym nurtem OCR, rozwijającym się właściwie niezależnie od opisywanych wcześniej technik, jest analiza w trybie online. Dopiero od kilku lat dynamiczna analiza pisma znalazła powszechne zastosowanie - w urządzeniach typu Palm, gdzie użytkownik, posługując się rysikiem, na ekranie zapisuje litery, cyfry i inne znaki. Komputer rozpoznaje te symbole na bieżąco, praktycznie z chwilą ich nakreślenia.

Danymi wejściowymi są informacje o sposobie pisania danych słów czy znaków. Dzięki temu, że jest to dość szeroki strumień danych, możliwości prawidłowego rozpoznania pisma ręcznego są nieporównanie większe niż w przypadku analizy offline. Wykorzystuje się w tym przypadku bardzo efektywne narzędzia matematyczne, jakimi są transformaty Fouriera: ruch rysika w ręce przekształca się tutaj w ciąg sygnałów falowych, których odmienna charakterystyka i częstotliwość odpowiada unikalnej dla danej osoby umiejętności posługiwania się długopisem czy innym pisakiem (notabene taki dynamiczny ruch jest właściwie niemożliwy do podrobienia, w każdym razie znacznie trudniej tego dokonać niż w przypadku gotowego już podpisu odręcznego).

Rozpoznawanie to jest jednak ograniczone tylko do pojedynczych znaków. Do pełnego rozpoznawania pisma odręcznego, zapisu całych słów, możliwości komputerów ciągle okazują się zbyt ograniczone. I trudno się temu dziwić, skoro czasami sami mamy trudności z odczytaniem tego co napisaliśmy. Skuteczna może się okazać analiza OCR/ICR jedynie w przypadku "ładnego" charakteru pisma, które poddaje się segmentacji na pojedyncze znaki. Przy analizie OCR/ICR takiego pisma stosuje się czasem krzywe Beziera (splajny), powszechnie wykorzystywane zresztą w tworzeniu obiektów wielowymiarowych w grafice komputerowej (tu opisują one kontury analizowanych znaków). Dzięki temu eliminuje się "szum" tła, analiza obrazu zaś ogranicza się do pisma. Do eliminowania niepotrzebnych elementów z obrazu stosuje się również inne narzędzia sztucznej inteligencji.

Lecz i tak do pełnego rozpoznania pisma odręcznego potrzebne jest rozumienie tekstu, a tego komputery ciągle nie potrafią.

ICR w KIR

Jednym z największych działających w Polsce centrów przetwarzania dokumentów papierowych, wypełnionych pismem drukowanym ręcznym, jest system Imbir, prowadzony przez Krajową Izbę Rozliczeniową. Uruchomiony 2 lata temu system bazujący na oprogramowaniu rozpoznawania pisma RecoStar firmy Oce, przetworzył w pierwszych 10 miesiącach br. ok. 35 mln dokumentów (w większości dyspozycji przelewów międzybankowych). Większość odczytanych danych daje się zweryfikować automatycznie poprzez sumy kontrolne czy bazy słownikowe, jednak nadal problemem pozostaje pole opisu, czego dotyczy dokonywany przelew. Tutaj do korekty często potrzebna jest interwencja operatora.

KIR prowadzi rozliczenia papierowych dokumentów w systemie Sybir, natomiast coraz więcej obrotu jest realizowane za pośrednictwem systemu elektronicznych rozliczeń międzybankowych Elixir. Od połowy 2004 r. przejmie on całość rozliczeń, jednak dzięki rozszerzeniu palety usług bazujących na systemie Imbir, banki będą mogły nadal posługiwać się dokumentami papierowymi do przyjmowania zleceń. KIR będzie w dalszym ciągu przyjmował takie dokumenty, dokonywał ich skanowania i przetworzenia na postać elektroniczną po procesie ICR, wprowadzając ostatecznie do systemu Elixir. Dalej dane będą już wędrować wyłącznie w postaci elektronicznej. Zdaniem Tadeusza Ołdakowskiego, prezesa KIR, taka usługa outsourcingowa z uwagi na efekt skali będzie dla banków znacznie tańsza niż wdrażanie własnych rozwiązań OCR/ICR (mimo tego kilka banków - np. Bank Śląski - zdecydowało się na samodzielne wdrożenie).

Przetwarzanie standardowych dokumentów w systemie Imbir kosztuje banki ok. 30 gr za sztukę (90 gr dla niestandardowych), podczas gdy w systemie elektronicznych rozliczeń Elixir jest to zaledwie 15 gr. Jest to jednak i tak znacznie taniej niż przetwarzanie dokumentów rozliczeniowych w systemie Sybir (do 2,20 zł za sztukę).


TOP 200