Acrobat Capture

Problemu przetworzenia tych stosów dokumentów na postać elektroniczną nie są w stanie rozwiązać współczesne systemy optycznego rozpoznawania znaków (OCR), ze względu na niewielką dokładność odczytywania tekstów, ani techniki kompleksowego przetwarzania dokumentów (imaging), wymagające przechowywania na dyskach ogromnych plików graficznych zeskanowanych dokumentów.

Problemu przetworzenia tych stosów dokumentów na postać elektroniczną nie są w stanie rozwiązać współczesne systemy optycznego rozpoznawania znaków (OCR), ze względu na niewielką dokładność odczytywania tekstów, ani techniki kompleksowego przetwarzania dokumentów (imaging), wymagające przechowywania na dyskach ogromnych plików graficznych zeskanowanych dokumentów.

Próbę rozwiązania problemu podjęła firma Adobe oferując pakiet Acrobat Capture, zawierający moduł optycznego rozpoznawania znaków (OCR) oraz moduł do rozpowszechniania i udostępniania dokumentów w formie elektronicznej Acrobat.

Podobnie jak inne systemy optycznego rozpoznawania znaków, Acrobat Capture dzieli wskanowany dokument na część tekstową, która zostaje poddana procesowi rozpoznawania oraz część graficzną, która będzie przechowywana w postaci pliku graficznego.

Acrobat Capture rozpoznaje nie tylko tekst, ale także dopasowuje kroje czcionek do któregoś z 41 krojów dostarczanych z pakietem. Następnie rozpoznany tekst i grafika są łączone w formie przenośnego dokumentu (Acrobat Portable Document File - PDF), zachowującego oryginalny układ dokumentu. PDF może być rozprzestrzeniany elektronicznie i przeglądany na wielu platformach sprzętowych.

Acrobat Capture jest aplikacją 32-bitową do Windows 3.1 (wymaga więc zainstalowania rozszerzenia Win 32s), ale nie działa z Windows NT. W zestawie sprzętowym złożonym z komputera z Pentium 66 MHz i skanera dokumentów z podajnikiem, Acrobat Capture jest w stanie przetwarzać ok. 100 stron dokumentów na godzinę. Cena pakietu wynosi 3 tys. USD.