Uwaga na ukryte dane

Zanieczyszczone dokumenty

Najlepszym sposobem ochrony treści dokumentów jest ścisła polityka zabraniająca przesyłania plików w oryginalnym formacie, jeśli nie jest to bezwzględnie konieczne. Dla kontrahentów zewnętrznych należy przygotować plik pozbawiony metadanych. Najlepszym kandydatem jest PDF. Eksportowanie dokumentu do PDF z aplikacji biurowych sprawia, że w wynikowym pliku znajdują się dodatkowe informacje, takie jak login, położenie pliku i wersja narzędzia, które dany plik utworzyło. Mimo wszystko taki dokument zawiera mniej metadanych niż oryginał.

Najczystsze dokumenty da się przygotować za pomocą drukarki PDF (a nie przy pomocy eksportu z pakietów biurowych, takich jak OpenOffice). Nie będą zawierać metadanych zapisywanych przez edytor ani zmian, recenzji czy notatek. Niektóre programy konwersji PS (np. RedMon z drukarką PostScript + Ghostscript) nie zapisują żadnych metadanych z oryginalnego dokumentu.

DOC może wiele powiedzieć

Najpopularniejszymi dokumentami są pliki Word 2000. Ich metadane mogą zawierać:

- autora i tytuł dokumentu;

- czas edycji, czas i datę utworzenia;

- zarejestrowaną w systemie nazwę użytkownika programu (zazwyczaj login domenowy);

- zapisaną w programie nazwę firmy, na którą rejestrowany jest program;

- informacje o dokładnej wersji edytora;

- komentarze, poprawki w trybie śledzenia zmian, włącznie z informacjami o autorach i czasie tych zmian;

- informacje o lokalizacji zapisanego dokumentu, włącznie ze ścieżką sieciową. Jeśli dokument zapisano w usłudze Sharepoint Services, dokument może zawierać także właściwości dokumentu lub informacje dotyczące lokalizacji serwera;

- informacje o położeniu katalogu automatycznego zapisu (najczęściej %APPDATA%\Microsoft\Word), co daje informacje o położeniu profilu;

- informacje w nagłówkach i stopkach, także niedrukowane;

- użyte szablony (najczęściej normal.dot), definicje stylów zapisanych w dokumencie.

- dodatkowe informacje wprowadzone w polach specjalnych albo polach szablonów;

- informacje o scalaniu korespondencji seryjnej;

- zapisane fragmenty różnych stadiów powstawania dokumentu;

- osadzone obiekty, włącznie z opisem lokalizacji sieciowej i własnymi metadanymi;

- informacje o obiektach przeklejanych z przeglądarki;

- ukryte fragmenty dokumentu, sformatowane jako niewidoczne w sposób zamierzony przez użytkownika.


TOP 200