Tasowanie danych

Technika Data Shuffling umożliwia udostępnianie i analizę wrażliwych informacji przy zachowaniu wymagań prawnych dotyczących ochrony danych.

Technika Data Shuffling umożliwia udostępnianie i analizę wrażliwych informacji przy zachowaniu wymagań prawnych dotyczących ochrony danych.

Innowacyjna technologia umożliwiająca ochronę przed wyciekiem wrażliwych informacji być może już wkrótce znajdzie praktyczne zastosowania. Naukowcy z Department of Management Science & Information Systems na uniwersytecie stanowym w Oklahoma uzyskali finansowanie nowego projektu, którego zadaniem jest opracowanie oprogramowania umożliwiającego praktyczne wykorzystanie opatentowanej przez nich już wcześniej techniki Data Shuffling (tasowanie danych). Jak wyjaśnia prof. Rathindra Sarathy, kierujący grupą badawczą, Data Shuffling to technika maskowania danych numerycznych umożliwiająca ich wykorzystanie do celów analitycznych przy jednoczesnym zapewnieniu poufności informacji. Jako przykład podaje on problem z udostępnianiem danych o zarobkach pracowników analitykom przygotowującym ogólne raporty. Regulacje prawne nie pozwalają na ujawnienie takich informacji, bo nawet jeśli dane osobiste zostaną usunięte z pliku, to możliwa jest prosta analiza umożliwiająca odtworzenie powiązań liczb z dotyczącymi ich osobami. Klasyczne metody szyfrowania nie są tu pomocne, bo analityk i tak musi być w stanie je odszyfrować.

Natomiast Data Shuffling umożliwia inteligentną modyfikację informacji w praktyce uniemożliwiającą identyfikację oryginalnych liczb, a jednocześnie zapewniającą, że wyniki zbiorczej analizy są prawidłowe. Jej koncepcja jest względnie prosta, a można ją wyjaśnić na przykładzie zbioru danych zawierających tysiące informacji o wieku, wykształceniu, zarobkach, nazwiskach itp. określonych osób, które nie mogą być dowolnie udostępniane. Tasowanie danych umożliwia ich wymieszanie, tzn. przypisanie zarobków 55. osoby na liście tej, która jest na pozycji 500. itd. W ten sposób następuje takie przetasowanie informacji, że relacje m.in. stają się całkowicie zamaskowane i niemożliwe do odtworzenia przez osobę nieuprawnioną. W praktyce pozwala to na ujawnienie poufnych liczb i relacji przy zachowaniu wymagań prawnych dotyczących ochrony informacji osobistych. "Prawdziwa użyteczność tej techniki ujawnia się w sytuacjach, gdy analizowane są skomplikowane zależności między różnymi parametrami zawierającymi informacje poufne i jawne" - mówi Rathindra Sarathy.

Koncepcje tego typu są badane przez wielu naukowców. Opatentowana technika tasowania danych jest tylko jednym z przykładów technologii maskowania wrażliwych danych. Na razie jest to jednak technika wyraźnie niedoceniana przez firmy i organizacje, które wciąż nie zdają sobie sprawy, jak potężne może to być narzędzie. "Promocja i edukacja to najważniejsze zadania, które chcemy podjąć" - mówi Rathindra Sarathy. W praktyce Data Shuffling. może zostać wykorzystany w niezależnych aplikacjach, jako dodatkowy moduł uzupełniający funkcjonalność innych programów (np. arkusza kalkulacyjnego) lub też nawet jako webowa usługa XML. Przeprowadzone testy prototypowych tego typu rozwiązań potwierdzają praktyczne możliwości takich zastosowań.