Uwaga na ukryte dane
- 14.04.2009
Zanieczyszczone dokumenty
Najlepszym sposobem ochrony treści dokumentów jest ścisła polityka zabraniająca przesyłania plików w oryginalnym formacie, jeśli nie jest to bezwzględnie konieczne. Dla kontrahentów zewnętrznych należy przygotować plik pozbawiony metadanych. Najlepszym kandydatem jest PDF. Eksportowanie dokumentu do PDF z aplikacji biurowych sprawia, że w wynikowym pliku znajdują się dodatkowe informacje, takie jak login, położenie pliku i wersja narzędzia, które dany plik utworzyło. Mimo wszystko taki dokument zawiera mniej metadanych niż oryginał.
Najczystsze dokumenty da się przygotować za pomocą drukarki PDF (a nie przy pomocy eksportu z pakietów biurowych, takich jak OpenOffice). Nie będą zawierać metadanych zapisywanych przez edytor ani zmian, recenzji czy notatek. Niektóre programy konwersji PS (np. RedMon z drukarką PostScript + Ghostscript) nie zapisują żadnych metadanych z oryginalnego dokumentu.
Najpopularniejszymi dokumentami są pliki Word 2000. Ich metadane mogą zawierać:
- autora i tytuł dokumentu;
- czas edycji, czas i datę utworzenia;
- zarejestrowaną w systemie nazwę użytkownika programu (zazwyczaj login domenowy);
- zapisaną w programie nazwę firmy, na którą rejestrowany jest program;
- informacje o dokładnej wersji edytora;
- komentarze, poprawki w trybie śledzenia zmian, włącznie z informacjami o autorach i czasie tych zmian;
- informacje o lokalizacji zapisanego dokumentu, włącznie ze ścieżką sieciową. Jeśli dokument zapisano w usłudze Sharepoint Services, dokument może zawierać także właściwości dokumentu lub informacje dotyczące lokalizacji serwera;
- informacje o położeniu katalogu automatycznego zapisu (najczęściej %APPDATA%\Microsoft\Word), co daje informacje o położeniu profilu;
- informacje w nagłówkach i stopkach, także niedrukowane;
- użyte szablony (najczęściej normal.dot), definicje stylów zapisanych w dokumencie.
- dodatkowe informacje wprowadzone w polach specjalnych albo polach szablonów;
- informacje o scalaniu korespondencji seryjnej;
- zapisane fragmenty różnych stadiów powstawania dokumentu;
- osadzone obiekty, włącznie z opisem lokalizacji sieciowej i własnymi metadanymi;
- informacje o obiektach przeklejanych z przeglądarki;
- ukryte fragmenty dokumentu, sformatowane jako niewidoczne w sposób zamierzony przez użytkownika.