Jedynka niejeden ma kształt

System rozpoznawania znaków w Avon Cosmetics przetwarza do kilkunastu tysięcy zamówień dziennie.

System rozpoznawania znaków w Avon Cosmetics przetwarza do kilkunastu tysięcy zamówień dziennie.

Jedynka niejeden ma kształt

Maksymilian Szeliga, odpowiedzialny za wdroŻenie systemu Eyes & Hands w dziale IT Avonu

Każdego dnia do centrali w Warszawie napływa stos zamówień - telefonicznie, listownie, faksem i doręczanych osobiście. Współpracujące z firmą niezależne konsultantki zamawiają kosmetyki, które potem na własną rękę sprzedają klientom. Prawie 80% zamówień dociera do Avonu w formie papierowych formularzy, na których konsultantka ręcznie wpisuje liczbę zamawianych sztuk w kratce z symbolem szamponu, pomadki czy flakonika perfum. Przy tej skali zamówień składanych na papierze zastosowanie systemu rozpoznawania znaków wydaje się nieodzowne. Pozostaje kwestia, w jakim zakresie można mu zaufać?

Wolne kratki

W Polsce, podobnie jak w innych krajach, w których działa koncern kosmetyczny wywodzący się z USA, Avon zastosował Eyes & Hands for Forms szwedzkiej firmy ReadSoft, specjalizowany system do odczytu formularzy, ankiet i wszelkich tego typu druków. Umożliwia on odczytywanie nie tylko pisma maszynowego czy kodów paskowych, ale i pisma odręcznego. I tylko ta ostatnia funkcja jest wykorzystywana w Avonie. Nie było potrzeby dokupienia modułu do rozpoznawania polskich znaków diakrytycznych, bo wystarcza, że system poprawnie interpretuje zapis cyfr. Formularz, którym posługują się konsultantki, to obustronnie zadrukowany dokument formatu A3. Na każdej stronie znajduje się ponad 100 symboli produktów z miejscem na wpisanie liczby zamawianych sztuk.

Na potrzeby wdrożenia Eyes & Hands formularza Avon nie zmieniono diametralnie, co zresztą ReadSoft wymienia jako jeden z atutów systemu. W ankiecie dodano kilka elementów, które sprawiły, że dokument stał się łatwiej przetwarzalny przez system OCR. Dodano przede wszystkim znaki pozycjonujące, określające, gdzie jest góra, a gdzie dół formularza. Formularz jest kolorowy, ale w celu przyspieszenia procesu rozpoznawania, stosowany przez Avon skaner pomija elementy w innych kolorach niż czarny.

Pierwszym poważnym zadaniem dla firmy wdrażającej Eyes & Hands jest oprogramowanie formularzy, tj. odwzorowanie w systemie pól formularza wraz z przypisaniem każdemu polu określonego przedziału wartości i ustaleniem tzw. poziomów zaufania rozpoznania pisma. W Avon zmiana definicji formularza odbywa się regularnie co dwa tygodnie wraz ze zmianą oferty i promocji.

Od faksu do billingu

Wstępnie skategoryzowane i posegregowane formularze trafiają do skanerów w paczkach po 50 sztuk. Przemysłowe, wydajne Fujitsu M3099 GX o wymiarach zbliżonych do starych kserokopiarek skanują formularz z obu stron. Pliki graficzne, które po kompresji zajmują 150 KB, są zapisywane jako rekord w bazie danych działającej na serwerze Eyes & Hands. System korzysta z unikalnej bazy norweskiej firmy Velocis (nowsze wersje współpracują z SQL Server Microsoftu).

Etap weryfikacji danych nie może już obejść się bez interwencji człowieka. Operator widzi na ekranie komputera obraz formularza, może nim manipulować, powiększać fragmenty. Na ekranie "podświetlają się" pola, które przy próbie rozpoznania pisma wzbudziły wątpliwości. Podczas konfiguracji Eyes & Hands definiuje się w ujęciu procentowym "poziom ufności" dla poszczególnych pól w formularzu. Przykładowo, w Avon niezmiernie istotne pole numeru identyfikacyjnego, za którym kryją się dane osobowe konsultantki składającej zamówienie, muszą być rozpoznane z co najmniej 80-proc. pewnością. W przeciwnym razie Eyes & Hands wymusza ręczną weryfikację danych w tym polu.

"O skuteczności systemu OCR w dużej mierze decydują procedury weryfikacyjne" - mówi Maksymilian Szeliga, odpowiedzialny za wdrożenie systemu w dziale IT Avonu. Jego zdaniem mechanizmy w Eyes & Hands są przemyślane i dopracowane. Przykładowo, po przejrzeniu i skorygowaniu wszystkich pól budzących wątpliwości, aplikacja wyświetla po kolei, w osobnych rzędach obrazy wszystkich jedynek, dwójek, trójek itd. występujących w danej ankiecie. Dzięki temu operator może szybko odróżnić zapis zbyt pulchnej trójki w rzędzie smukłych ósemek czy dostrzec fakt, że ogonek niechlujnie wpisanej siódemki wyszedł poza przewidziane dla niej pole i został zinterpretowany w polu poniżej jako jedynka. System umożliwia elastyczny dobór mechanizmów sprawdzających rozpoznawany tekst.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200