Data Shuffling: tasowanie danych zgodnie z prawem

Technika Data Shuffling umożliwia udostępnianie i analizę wrażliwych informacji przy zachowaniu wymagań prawnych dotyczących ochrony danych.

Innowacyjna technologia umożliwiająca ochronę przed wyciekiem wrażliwych informacji być może już wkrótce znajdzie praktyczne zastosowania. Naukowcy z Department of Management Science & Information Systems na uniwersytecie stanowym w Oklahoma uzyskali finansowanie nowego projektu, którego zadaniem jest opracowanie oprogramowania umożliwiającego praktyczne wykorzystanie opatentowanej przez nich już wcześniej techniki Data Shuffling (tasowanie danych).

Co to jest Data Shuffling

Jak wyjaśnia prof. Rathindra Sarathy, kierujący grupą badawczą, Data Shuffling to technika maskowania danych numerycznych umożliwiająca ich wykorzystanie do celów analitycznych przy jednoczesnym zapewnieniu poufności informacji. Jako przykład podaje on problem z udostępnianiem danych o zarobkach pracowników analitykom przygotowującym ogólne raporty. Regulacje prawne nie pozwalają na ujawnienie takich informacji, bo nawet jeśli dane osobiste zostaną usunięte z pliku, to możliwa jest prosta analiza umożliwiająca odtworzenie powiązań liczb z dotyczącymi ich osobami. Klasyczne metody szyfrowania nie są tu pomocne, bo - aby skorzystać z danych - analityk i tak musi być w stanie je odszyfrować.

Natomiast Data Shuffling umożliwia inteligentną modyfikację informacji w praktyce uniemożliwiającą identyfikację oryginalnych liczb, a jednocześnie zapewniającą, że wyniki zbiorczej analizy są prawidłowe. Jej koncepcja jest względnie prosta, a można ją wyjaśnić na przykładzie zbioru danych zawierających tysiące informacji o wieku, wykształceniu, zarobkach, nazwiskach itp. określonych osób, które nie mogą być dowolnie udostępniane. Tasowanie danych umożliwia ich wymieszanie, tzn. przypisanie zarobków 55. osoby na liście tej, która jest na pozycji 500 itd. W ten sposób następuje takie przetasowanie informacji, że relacje m.in. stają się całkowicie zamaskowane i niemożliwe do odtworzenia przez osobę nieuprawnioną. W praktyce pozwala to na ujawnienie poufnych liczb i relacji przy zachowaniu wymagań prawnych dotyczących ochrony informacji osobistych.

"Prawdziwa użyteczność tej techniki ujawnia się w sytuacjach, gdy analizowane są skomplikowane zależności między wieloma różnymi parametrami zawierającymi zarówno informacje poufne, jak i jawne" - mówi Rathindra Sarathy.

Gorąca technologia?

Koncepcje tego typu są badane przez wielu naukowców. Opatentowana technika tasowania danych jest tylko jednym z przykładów technologii maskowania wrażliwych danych. Na razie jest to jednak technika wyraźnie niedoceniana przez firmy i organizacje, które wciąż nie zdają sobie sprawy jak potężne może to być narzędzie. "Dlatego jej promocja i edukacja to najważniejsze zadania, które chcemy podjąć" - mówi Rathindra Sarathy.

Jeśli chodzi o komercyjne aplikacje, to obecnie na rynku jest już przynajmniej kilka ofert tego typu produktów, ale są to względnie proste rozwiązania, których funkcjonalność jest znacznie mniejsza w porównaniu do Data Shuffling. W praktyce technika ta może zostać wykorzystana w niezależnych aplikacjach, jako dodatkowy moduł uzupełniający funkcjonalność innych programów (np. arkusza kalkulacyjnego) lub też nawet jako webowa usługa XML. Przeprowadzone testy prototypowych tego typu rozwiązań potwierdzają praktyczne możliwości takich zastosowań.


TOP 200