Jak zapanować nad plikami

Duża część informacji w firmach jest przechowywana i przetwarzana w postaci nieustrukturyzowanej. Większość stanowią dokumenty biurowe, przechowywane w plikach. Ilość składowanych plików cały czas rośnie, rosną więc i oczekiwania wobec narzędzi do sprawnego zarządzania nimi.

W dużej organizacji zarządzanie dokumentami biurowymi przechowywanymi w plikach składowanych na zasobach dyskowych serwerów jest dość trudne. Pierwszą przeszkodą, na którą napotykają firmy, jest sprawne znajdowanie właściwego dokumentu, tym trudniejsze, im dłużej organizacja działa. Chociaż narzędzia wyszukiwania są bardzo pomocne, nie zawsze radzą sobie z problemem znalezienia dokumentu we właściwej wersji. Gdy dokumenty w różnych wersjach znajdują się w obiegu, nawet wyszukiwanie według daty ostatniej aktualizacji nie przynosi rezultatów. Pracownicy obchodzą problem, nadając nazwy plików zgodne z przyjętym standardem, ale nadal nie jest to rozwiązanie ani wygodne, ani zautomatyzowane.

Najlepszym wyjściem dla instytucji, w których ten problem jest dokuczliwy, byłoby przechowywanie plików w systemie obiegu dokumentów. System ten będzie zarządzał wersjami plików, pilnował publikacji i zatwierdzania oraz udostępniał niezbędne zasoby składowania. Niestety, by taki system miał sens, musi być wprowadzony kompleksowo i należałoby objąć nim wszystkie zasoby, które są niezbędne do pracy.

Nieużywany, ale czy potrzebny?

Im więcej dokumentów przetwarza się w organizacji, tym bardziej rośnie zapotrzebowanie na przestrzeń dyskową. Po pewnym czasie wiele z tych plików jest już dawno niepotrzebnych, nie mają one żadnego zastosowania w bieżącej działalności i należałoby je przenieść do elektronicznego archiwum lub na tańszy nośnik. Wykonywanie tej operacji ręcznie jest bardzo trudne, chociaż możliwe. Administratorzy korzystają przy tym ze znaczników czasu ostatniego dostępu, ale nie zawsze ma to sens.

Wybranie dokumentów, do których nikt dawno nie zaglądał, może skutkować dekompletowaniem informacji dotyczących sprawy. W ten sposób można przypadkowo usunąć lub przenieść dokument, który stanowi jeden z plików, które dopiero w całości tworzą sprawę. Niekiedy, zdekompletowanie może być trudniejsze do wykrycia, zwłaszcza gdy w organizacji stosuje się arkusze kalkulacyjne połączone linkami pobierania danych. Po przeniesieniu pliku z danymi źródłowymi, mogą pojawić się problemy przy aktualizacji połączonych wartości. Właśnie z tych powodów należy bardzo ostrożnie podchodzić do łączenia danych między plikami arkuszy kalkulacyjnych oraz jeszcze ostrożniej typować nieużywane dokumenty do archiwizacji.

Aby móc wykonać operację archiwizacji rozsądnie, oprócz określenia czasu ostatniego dostępu do pliku (za pomocą narzędzi takich jak find z opcją atime w systemach typu UNIX), należy wziąć pod uwagę informacje na temat plików dostarczane przez użytkowników. Jest to jednak metoda pracochłonna.

Czyj jest naprawdę ten plik?

Każdy plik przechowywany w systemie plików nowoczesnego systemu operacyjnego posiada swojego właściciela. Na podstawie tej informacji systemy ustalają zajętość przydziału dyskowego (kwoty dyskowej). Z tych informacji korzystają także skrypty raportowe i inne narzędzia administracyjne. Całość działa dobrze, dopóki nie ma zmian personalnych i obowiązki nie są przekazywane nowym pracownikom. Gdy w organizacji stosuje się system kont przypisanych do osoby, a nie do funkcji (co ma swoje uzasadnienie), po pewnym czasie zapisany w systemie właściciel plików nie pokrywa się z listą ludzi, którzy z nich korzystają. Rozbieżność ta powoduje z kolei, nieaktualne obliczanie kwot dyskowych oraz bardzo trudne określenie, kto naprawdę zarządza danymi dokumentami.