Uwaga na ukryte dane

W dokumentach znajduje się wiele niewidocznych informacji. Takie pliki mogą powiedzieć znacznie więcej o procesie tworzenia dokumentu, niż życzy sobie firma, która go publikuje.

Microsoft Office jest najpopularniejszym pakietem biurowym wykorzystywanym na świecie. Bardzo wiele dokumentów tworzonych za jego pomocą zawiera ważne informacje ukryte w postaci metadanych, z których część jest widoczna jako właściwości dokumentu. Chociaż informacje te są przydatne wewnątrz firmy, ułatwiając w narzędziach pracy grupowej, mogą ujawniać zbyt wiele danych podmiotom zewnętrznym.

O jedno słowo za dużo

Najwięcej śladów pozostawia najpopularniejsza w Polsce wersja edytora tekstów - Word 2000. Nie czyści on metadanych, dzięki czemu można prześledzić niemal cały proces tworzenia pliku. Nawet jeśli użytkownik zapisze plik jako RTF, część informacji (login, czas, położenie pliku) nadal może się tam znaleźć. Części metadanych pliku DOC nie widać w oknie właściwości dokumentu. Za ich pomocą można określić nie tylko, kiedy dany dokument został utworzony, ale także: w jakim środowisku pracował dany użytkownik (włącznie z lokalizacją profilu Windows i katalogu z dokumentami), jaki miał login, jaki jest adres serwera SharePoint, kto adnotował dany dokument i kiedy, ile było jego wersji oraz kto naniósł zmiany.

Nowsze wersje pakietu Office zawierają narzędzia do usuwania ukrytych danych. W dodano opcję inspekcji dokumentu, usuwającej z niego metadane i inne informacje prywatne. Niestety opcja ta nie wykrywa danych sformatowanych jako niewidoczne (np. biały tekst na białym tle), a jedynie metadane zapisywane przez sam edytor.

Drugie dno obrazów i prezentacji

Prezentacje PowerPoint także zawierają metadane. Oprócz typowych dla pakietu Office informacji o twórcy i procesie przygotowania dokumentu, w pliku .ppt mogą być zapisane notatki dla prezentera, komentarze i inne niewidoczne obiekty. Także metadane osadzanych obrazów mogą ujawnić dużo informacji, gdyż mało programów graficznych usuwa informacje EXIF (a są tam szczegóły zdjęcia, informacje o warunkach ekspozycji i użytym sprzęcie).

Zwykły zapis w programie Adobe oraz domyślne ustawienia programu GIMP nie powodują usunięcia tych danych. Aby je usunąć, należy użyć opcji Save For Web w Photoshopie, w programie GIMP trzeba wyłączyć właściwą opcję w zaawansowanych opcjach zapisu JPG. Eksport prezentacji za pomocą wydruku do drukarki PDF całkowicie usuwa komentarze dla prezentera oraz eliminuje większość metadanych.

Z metadanych w pliku można wywnioskować login (kasz), nazwę serwera (AMON), położenie pliku (zasób DOK, katalog US3PFS, podkatalog Kasia), a także stwierdzić fakt obróbki dokumentu w katalogu poza typowym profilem Windows XP (C:\Moje dokumenty\Kasia).

Z metadanych w pliku można wywnioskować login (kasz), nazwę serwera (AMON), położenie pliku (zasób DOK, katalog US3PFS, podkatalog Kasia), a także stwierdzić fakt obróbki dokumentu w katalogu poza typowym profilem Windows XP (C:\Moje dokumenty\Kasia).


TOP 200