Rozpoznawanie na dużą skalę
- 07.04.2009
Dodatek do obiegu dokumentów
Jeśli firma posiada oprogramowanie do obiegu dokumentów, może także zastanowić się nad wykorzystaniem opcji modułu OCR. Tego typu moduły pracują w najbogatszych wersjach systemów obiegu dokumentów, w oprogramowaniu do prowadzenia komputerowego archiwum i tym podobnych aplikacjach. Wadą takiego rozwiązania jest przywiązanie usługi do konkretnej aplikacji. Jeśli firma i tak wszystkie najważniejsze dokumenty przetwarza w tym środowisku, nie jest to krytyczne ograniczenie. W odróżnieniu od rozbudowy urządzeń do przetwarzania obrazu czy zakupu nowego serwera, rozbudowanie systemu obiegu dokumentów może być najtańszym rozwiązaniem. Tego typu moduły są dostępne, na przykład, dla oprogramowania Docushare firmy Xerox, jako osobna opcja.
Dla biura, które skanuje dużo dokumentów, można wykorzystać bardzo sprawne urządzenie, na przykład z serii WC 7665, posiadające szybki aparat skanujący (z prędkością rzędu 80 str/min) oraz pojemny podajnik na 250 arkuszy. Skanowany dokument jest obrabiany za pomocą motoru Scan Flow Store, który opisuje, czyta i wprowadza dokument do odpowiedniego miejsca w archiwum elektronicznym (w tym przypadku DocuShare firmy Xerox). Czas od skanowania do publikacji jest bardzo krótki, systemy te są skalowalne i mogą być stosowane zarówno przez małe firmy, jak i gigantyczne archiwa.
Druga metoda zakłada, że OCR dokumentów jest jednym z kroków procesu obiegu dokumentów. W takim przypadku oprogramowanie obiegu może wykorzystać swój wewnętrzny silnik OCR. Dokumenty są kierowane do OCR wybiórczo, na podstawie decyzji podjętych automatycznie lub przez użytkowników w procesie obiegu dokumentów. Efekt OCR jest zapisywany bezpośrednio w systemie i jest od razu dostępny dla użytkowników, na przykład jako kolejna wersja oryginalnego dokumentu. W ten sposób można skonfigurować wiele systemów, na przykład Xerox Docushare.