Automatyczne rozpoznawanie pisma

Oprogramowanie typu OCR (Optical Character Recognition) - optyczne rozpoznawanie pisma - jest używane na całym świecie w różnych dziedzinach: od prac typu Desktop Publishing, poprzez systemy archiwizacji danych, po procesory tekstu.

Oprogramowanie typu OCR (Optical Character Recognition) - optyczne rozpoznawanie pisma - jest używane na całym świecie w różnych dziedzinach: od prac typu Desktop Publishing, poprzez systemy archiwizacji danych, po procesory tekstu.

Zastąpienie procesem skanowania żmudnego wprowadzania raz już wydrukowanych danych oszczędza czas i znacznie podnosi efektywność pracy. Duże znaczenie ma wybór oprogramowania OCR. Jednym z lepszych programów tego typu jest Recognita Plus, którego sprawność w rozpoznawaniu standardowych druków w każdym z europejskich języków sięga 99.9%. To, że mamy do czynienia z bardzo dobrym produktem, potwierdzić może ponad 10000 użytkowników. Recognita Plus jest wielojęzycznym programem typu OCR, a jednocześnie pierwszym, który uwzględnia specyfikę języków Europy Wschodniej. Przeznaczono go na razie tylko do rozpoznawania pisma drukowanego.

Charakterystyka pakietu

Program automatycznie rozpoznaje każdy rodzaj druku, potrafi odczytywać teksty bez procesu wcześniejszego uczenia go rozpoznawania rodzajów druku. Inteligentnie rozpoznaje wszystkie języki europejskie. Umie także automatycznie oddzielać drukowany tekst od ilustracji, zapamiętując jednocześnie układ strony.

Wymogi sprzętowe

Recognita Plus napisana została dla sprzętu IBM PC pracującego pod kontrolą systemu operacyjnego DOS, jednak praca w środowisku Windows znacznie poszerza jego możliwości. Współpracuje z każdą niemal kartą graficzną - CGA, EGA, VGA, Hercules.

Program nie wymaga żadnego specjalistycznego osprzętu ani rozszerzania pamięci operacyjnej. Najodpowiedniejszym komputerem jest IBM/AT 386(486) lub PS/2 albo każdy inny zgodny z tym standardem. Wymaga tylko 3MB miejsca na twardym dysku i 640 kB pamięci, jeśli pracuje z DOS-em. Podczas pracy w środowisku Windows angażuje tyle pamięci samo, co Windows.

Recognita Plus wymaga skanera o rozdzielczości 300 do 400 dpi (dots-per-inch - punktów na cal) - czyli jednego z ogólnie dostępnych. Potrafi współpracować z około 70 typami skanerów. Jeśli skaner jest wyposażony w automatyczny podajnik dokumentów, program daje sobie również i z tym radę.

Automatyczne rozpoznawanie tekstów

Recognita plus bez trudu rozpoznaje wszelkie teksty drukowane, zarówno te sprzed kilkudziesięciu lat, jak i wydruki z drukarek laserowych, NLQ wykonane na drukarkach igłowych oraz ich fotokopie, Program potrafi rozpoznawać pismo zwarte, pochyłe, wytłuszczone, a nawet połączone razem litery. Rozpoznawana jest większość przypadków występujących w formularzach i znaki charakterystyczne używane w terminologii związanej z biznesem. Toleruje teksty drukowane czcionką o rozmiarach od 6 do 24 punktów (od 1/12 do 1/3 cala). Program można douczyć rozpoznawania ciągów liter złożonych maksymalnie z 10 znaków. Wielkość liter i odległości pomiędzy liniami mogą być dowolne. Strona tekstu może zawierać druk zwykły obok proporcjonalnego. Kroje czcionek mogą być różne nawet w jednym wyrazie. Szybkość wczytywania dla konfiguracji sprzętowej: IBM PC/AT 386/33 MHz, system operacyjny DOS, płaski skaner, tekst w formacie A4, 2000 znaków na stronie, wynosi od 80 do 120 znaków na sekundę, a szybkość rozpoznawania wczytanego tekstu (PC/AT 386/33MHz) waha się od 150 do 250 zn/s.

Pliki wyjściowe

Program umożliwia otrzymanie pliku wyjściowego w różnych formatach: w kodzie ASCII lub w ponad 30 formatach używanych powszechnie procesorów tekstów, edytorów i arkuszy elektronicznych np: MS-Word 3.0 - 5.0, MS-Word for Windows, WordPerfect 4.1 - 5.0, Wordstar, Excel 2.1, Lotus 1-2-3 w wersjach 1A - 2.0, itd.

Twórcą programu Recognita Plus jest SZKI RECOGNITA CORP. Adres: H-1011 Budapest, Iskola u. 16., Hungary. Cena pakietu - 2 400 DM.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200