Systemy do archiwizacji i zarządzania dokumentacją

Systemy DIP

Systemy DIP

Na rynku krajowym pojawiły się pierwsze systemy do archiwizacji i zarządzania dokumentacją DIP - Document Image Processing. Są to: system ADAS oferowany przez Bonair USA, system SAD prezentowany przez Komtech oraz system KIPP - produkt firmy Kofax Image Products, który jest jednym z liderów tego rynku. Ten ostatni rozprowadza firma Elsat, a wszystkie można było obejrzeć podczas Targów Komputer Expo '94.

Oprogramowanie i sprzęt konstruowany dla potrzeb DIP, od dłuższego już czasu odgrywa znaczącą rolę na światowych rynkach. Jest to spowodowane lawiną pism, które krążą między przedsiębiorstwami i urzędami.

Na szczęście bardzo szybko w sukurs tej papierowej powodzi przychodzą elektroniczne techniki przechowywania informacji, co jest tym bardziej obiecujące, że wiążą się one ze słabo udoskonalonymi systemami przetwarzania danych. Czym bowiem wytłumaczyć karierę zapisu na dyskach optycznych, powszechne stosowanie graficznych stacji roboczych połączonych w sieć, czy powstawanie coraz sprawniejszych urządzeń do skanowania i druku. Rynek archiwizacji i zarządzania dokumentami rośnie rokrocznie o ponad 70% i szacuje się, że w 1996 r. przekroczy wartość 3 mld USD.

Garść szczegółów

U podstaw rozwoju systemów komputerowego zarządzania dokumentami leży koncepcja tzw. biura, bez papieru (paperless office). Na dzień dzisiejszy jest to co prawda idea raczej utopijna, lecz rozwój technik sieciowych czy takich metod przesyłania informacji jak poczta elektroniczna czyni ją coraz bardziej realną.

W tym kontekście oferowane rozwiązania DIP, niezależnie od tego czy dotyczą stanowisk przeznaczonych dla jednego użytkownika, czy też bardzo kosztownych systemów budowanych w oparciu o komputery typu mainframe, są w istocie bardzo do siebie podobne. Informacja o dokumencie jest bowiem wprowadzana do systemu zawsze za pośrednictwem skanerów, pliki przechowuje się na dyskach optycznych, zaś odtworzony w miarę potrzeb obraz dokumentu wyświetla się w nich na wysokiej rozdzielczości monitorze, drukuje na drukarce albo przesyła dalej za pomocą faksu.

Oczywiście do tych podstawowych czynności można, zależnie od inwencji, dołączyć wiele innych elementów. Wśród nich mogą być np. techniki kompresji/dekompresji plików, interfejsy (gateways) do popularnych baz danych, aplikacje typu OCR, oprogramowanie indeksujące, przeszukujące, zestawy narzędzi dla programistów, karty sprzętowe, usprawniające pracę systemu i wiele in. Teoretycznie więc wystarczy teraz dołączyć to wszystko do oprogramowania wspomagającego pracę zespołową - typu groupware - uruchomionego na sieciowej platformie sprzętowej (LAN lub nawet WAN), aby doskonale zapanować nad rosnącą, papierową lawiną.

Skanowanie i kompresja

Najważniejszym elementem działania systemów DIP jest zatem skanowanie treści dokumentu. Arkusz papieru zamienia się w obraz, a następnie jest poddawany kompresji i zapisywany na optycznych nośnikach informacji. (Obraz czarno-białego dokumentu składa się zwykle ze sporych obszarów zajętych przez jasne lub czarne obiekty, zamiast więc zapisywać rząd np. 100 zerowych bitów można go poddać kompresji (spakowaniu) zapisując te zera przy użyciu liczby mniejszej od stu kolejnych bitów). Standardy kompresji dokumentów określono w materiałach CCITT jako Group III i Group IV. Dzięki nim można typową stronę A4 dokumentu (a zająć ona potrafi obszar nawet do 1 MB pojemności dla rozdzielczości skanowania 300 dpi) przedstawić jako plik 40 kB.

Zastosowanie kompresji sprzyja także oszczędności miejsca na nośniku optycznych oraz przyspiesza transmisję dokumentu w sieci, dzięki czemu rozesłanie w sieciach LAN czy nawet WAN dokumentu do podległych filii nie jest problemem. Sama zaś kompresja, ze względu na wymaganą szybkość, jest dokonywana raczej przy użyciu technik sprzętowych (patrz rozwiązania SAD czy Kofax) a nie na drodze czysto software'owej.

W systemie DIP do skanowania większości dokumentów czarno-białych wystarcza rozdzielczość 200 dpi. Przy skanowaniu dokładniejszym (z większą rozdzielczością) np. grafiki i wykorzystaniu wielu stopni szarości (lub kolorów) należy się liczyć z tym, że powstałe pliki mogą mieć rozmiary liczone w megabajtach. Zastosowanie kompresji nie jest tu zbyt wydajne. Poza tym może doprowadzić do utraty szczególnie ważnych detali.

Przechowywanie

Jako pamięć masową w systemach DIP wykorzystuje się zazwyczaj napędy dysków optycznych. O jakości zapisu informacji na optycznych mediach niech świadczy gwarancja zapisu - dla dysków WORM o pojemności 1,4 GB wynosząca 50 lat, dla dysków wielokrotnego zapisu o pojemności 1,5 GB - 10 lat. (Dane te podaje Komtech dla produktów firmy Reflection Systems).

W bardziej złożonych (klasy high-end) systemach DIP do zapisu informacji używane są zestawy optycznych juke-boxów, które całkowicie automatyzują archiwum dyskowe. Urządzenia te działają w sposób podobny jak zmieniacz płyt w automatach gramofonowych - stąd też i nazwa - juke-box, czyli szafa grająca. Ich producenci oferują wiele urządzeń, które mogą współpracować z komputerami PC począwszy, na mainframe'ach kończąc. Dla najpojemniejszych archiwów można polecić juke-box MegaStor firmy Reflection Systems, który w solidnej szafo-obudowie mieści ponad 1000 cartridge'ów (typu WORM albo wielokrotnego zapisu), co w sumie daje 1034 GB

pojemności!

(Warto sobie uzmysłowić pojemność takiej szafy, skoro tylko na jednym dysku 1,5 GB można zapisać 50 tys. dokumentów A4.)

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200