GovTech Klub. Otwieranie danych nie tak proste

Polska administracja jest coraz bardziej świadoma korzyści wynikających z otwierania danych publicznych. Potrzeba jednak czasu, by dopracować odpowiednie schematy działania. Dane państwa to majątek narodowy, którym trzeba umiejętnie dysponować i zapewnić mu odpowiednią ochronę.

Zgodnie z ustawą o ponownym wykorzystywaniu informacji sektora publicznego administracja musi udostępniać gromadzone dane innym podmiotom, również komercyjnym. Od 16 czerwca 2016 r., gdy ustawa weszła w życie, dane finansowe, meteorologiczne, statystyczne i mapy cyfrowe mogą być udostępniane online tym, którzy chcą z nich skorzystać. Dodatkowo w tym roku Parlament Europejski przyjął dyrektywę o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego. Te dwa akty prawne w praktyce mają posłużyć do rozwoju technologicznego – a co za tym idzie gospodarczego – państw.

Działania polskiej administracji wpisują się w ten trend. Co więcej, na tle innych krajów wypadamy pod tym względem przyzwoicie. Na przykład w rankingu OECD OURData Index (od Open, Useful, Reusable Government Data), publikowanym w raporcie Government at a Glance, Polska z roku na rok awansuje. W 2015 r. na 31 badanych państw pod względem dostępności i otwartości danych zajmowaliśmy 28. miejsce, w 2017 – 20., a obecnie – już 12.

Ale do pełnego sukcesu jednak daleka droga. Wciąż potrzebne są jasno określone ścieżki działania, scenariusze bezpieczeństwa, a przede wszystkim współpraca międzyresortowa, której czasem brakuje.

Podczas październikowego spotkania GOVTech Klubu specjaliści z sektora publicznego wraz z ekspertami dzieli się doświadczeniami w tym zakresie.

Otwarte dane publiczne. Filary otwartości

W ramach Programu Operacyjnego Polska Cyfrowa zostały opracowane standardy otwartości danych. Funkcjonuje strona www.dane.gov.pl, na której prawie 130 instytucji udostępnia kilkanaście tysięcy zasobów. Pojawiają się aplikacje wykorzystujące otwarte dane, podmiotom zewnętrznym, również komercyjnym, udostępniane są coraz to nowsze zbiory danych.

Agata Miazga, pełnomocnik Ministra Cyfryzacji ds. otwartości danych i dyrektor Departamentu Otwartych Danych i Rozwoju Kompetencji w Ministerstwie Cyfryzacji jasno określa parametry otwartych danych. To filary, na których opiera się działania związane z otwieraniem danych. Muszą być one nie tylko dostępne, ale również upubliczniane w wersji źródłowej. Powinny być udostępnione w postaci surowej, nie tylko jako raporty czy zestawienia. Powinny też być kompletne, czyli udostępniane w całości (całość danych dotyczących danego tematu).

Kolejny parametr to aktualność. „To ważna rzecz, o której zapominają dysponenci danych, udostępniając je na portalu dane.gov.pl. Przez aktualne należy rozumieć – świeże. I muszą być też stale aktualizowane” – dodaje Agata Miazga. Otwarte dane to takie, które są udostępniane w otwartych formatach, bez żadnej rejestracji pobierającego i które nie są niezastrzeżone – formaty tych danych nie powinny wymagać płatnego oprogramowania do ich otworzenia. Wreszcie powinny być bez ograniczeń intencyjnych – użytkownicy nie muszą ubiegać się o zgodę i mogą je wykorzystać w dowolnym celu.

Otwarte dane publiczne. Centrum koordynacyjne

Program otwierania danych publicznych, realizowany przez Ministerstwo Cyfryzacji, ma wpłynąć na poprawienie jakości i dostępności danych publicznych. Jak zaznaczyła Agata Miazga, kluczowe jest zobowiązanie do współpracy wszystkich instytucji administracji centralnej, choć do programu są zaproszone też samorządy, organizacje pozarządowe i środowiska akademickie. Jednak, jak zauważyli uczestnicy GovTech Klubu, nie można mówić o otwartości danych dla przedsiębiorstw, jeśli sami urzędnicy nie udostępniają innym urzędnikom danych, tkwiąc w schematach „Polski resortowej”.

Może więc, co pojawiło się w pytaniach podczas spotkania, warto zastanowić się nad swojego rodzaju centralną ewidencją danych, która zapobiegnie „resortowej redundancji danych”?

Naturalnym miejscem, gdzie mogłyby przecinać się ścieżki danych publicznych, jest Główny Urząd Statystyczny, o czym sam wspomniał obecny na spotkaniu prezes GUS, Dominik Rozkrut. „Jesteśmy w dobie transformacji cyfrowej otaczani przez coraz większą liczbę danych. Konieczny jest więc podmiot, który zajmie się problematyką danych po to, by wyciągnąć z nich wiedzę niezbędną do tego, by rozwój społeczeństwa kształtować w sposób uświadomiony. W naszej ocenie to my jesteśmy tym podmiotem” – stwierdził.

GUS powinien być instytucją, która będzie nieść odpowiedzialność za budowę infrastruktury informacyjnej państwa i stanie się koordynatorem tego ekosystemu danych – przekonywał prezes urzędu. To wyzwanie, które trzeba podjąć, by mądrze zaplanować dostarczanie istotnych informacji dla społeczeństwa, na podstawie których będzie możliwy jego dalszy rozwój. „Powinniśmy pełnić rolę koordynującą, ale partnerzy do rozmów są trudni. Powinniśmy wiedzieć, jakie systemy się projektuje, by później nie było problemu, że trzeba generować inne systemy równolegle i posiadać zduplikowane informacje” – wyjaśniał Rozkrut.

Ustawa o statystyce publicznej zobowiązuje wszystkie organa administracji publicznej do przekazywania danych. Natomiast każdy organ administracji ma swoje akty legislacyjne, na które się powołuje, jednocześnie utrudniając GUS realizację zapisów dotyczących jego funkcjonowania. Na przykład dopiero niedawno udało się pozyskać do statystyki dane z systemu JPK. „Coraz łatwiej jest nam pozyskiwać dostępy do źródeł administracyjnych, bo zmienia się świadomość administracji, jednak co do zasady taki dostęp jest utrudniany” – dodał prezes GUS.

Otwarte dane publiczne. Wojna postu z karnawałem?

Wygląda na to, że ścierają się dwie postawy – klasyczna urzędnicza, „resortowa” oraz, nomen omen, otwarta, czyli rozumiejąca współczesne wyzwania cyfrowego świata, roli danych, a co za tym idzie – konieczności ich zabezpieczania.

Przesada? Niekoniecznie, jeśli spojrzy się na wyniki kontroli przeprowadzanych przez NIK, o czym mówił podczas spotkania klubowego Marek Bieńkowski, dyrektor Departamentu Porządku i Bezpieczeństwa Wewnętrznego Najwyższej Izby Kontroli. W 2015 roku NIK zbadał, jak podmioty państwowe realizują zadania w zakresie ochrony cyberprzestrzeni, w 2016 – zapewnienia bezpieczeństwa działania systemów informatycznych wykorzystywanych do realizacji zadań publicznych. W 2018 r. kontrolowano bezpieczeństwo elektronicznych zasobów informacyjnych w jednostkach samorządu terytorialnego.

Wyniki tegorocznej kontroli bezpieczeństwa teleinformatycznego RP są jeszcze niejawne, jednak wnioski z wcześniejszych nie napawają optymizmem. W pierwszym wypadku NIK oceniła negatywnie realizację przez organy państwowe zadań w zakresie ochrony cyberprzestrzeni RP, a administracja państwowa nie podjęła niezbędnych działań, mających na celu zapewnienie bezpieczeństwa teleinformatycznego Polski”. W drugim „w ocenie NIK stopień przygotowania oraz wdrożenia Systemu Zapewnienia Bezpieczeństwa Informacji nie zapewniał akceptowalnego poziomu bezpieczeństwa danych zgromadzonych w systemach informatycznych wykorzystywanych do realizacji istotnych zadań publicznych”. Po trzeciej kontroli negatywnie oceniono przyjęty sposób ochrony elektronicznych zasobów informacyjnych w skontrolowanych starostwach, urzędach gmin i ośrodkach pomocy społecznej”.

Otwarte dane publiczne. Efekty mało widoczne

Po co otwarte dane? Czy faktycznie, poza prawem otwartego dostępu dla każdego, cały proces może się do czegoś przyczynić? Tak, jeśli dane publiczne będą traktowane tak, jak robią to podmioty komercyjne, budując na nich nowe modele biznesowe. Kajetan Wojsyk, pełnomocnik Ministra Zdrowia ds. otwartości danych publicznych z Centrum Systemów Informacyjnych Ochrony Zdrowia, przywołał przykład Hiszpanii. Powołano tam specjalne ministerstwo zajmujące się danymi. Gdy otworzono zasoby administracyjne, gospodarka znajdująca się w stagnacji, wyraźnie ruszyła.

Jeśli faktycznie będziemy traktować dane jako paliwo współczesnej gospodarki, a do tego będziemy potrafili rozpoznać, co jest prawdziwą daną, a co pewnego rodzaju ‘śmieciem’, nasza gospodarka będzie rozwijała się szybciej

– stwierdził ekspert z CSiOZ.

Dominik Rozkrut zwrócił z kolei uwagę, że nie wystarczy wystawić danych, ale trzeba znaleźć użytkowników, którzy będą zainteresowani wykorzystaniem ich w celach komercyjnych. Według prezesa GUS proces otwierania danych, trwający od kilku lat, dopiero zaczyna się krystalizować i realizować w postaci konkretnych dostępnych zasobów. Należy poczekać, aż proces rozwinie się, również po stronie popytowej.

Czy da się to monitorować i uzyskiwać jasne informacje, kto i do czego użył otwartych danych? Agata Miazga uważa, że to monitorowanie efektów otwierania danych to problem, z którym borykają właściwie wszystkie państwa. Tutaj nie ma prostych mechanizmów - jeśli spełniając założenia otwartości danych uniemożliwia się rejestrację użytkowników, nie można też wiedzieć, kto pobiera dane.

Otwarte dane publiczne. Czy jesteśmy chronieni?

Jedno jest pewne – jeśli dane będą miały aspekt praktyczny, to w sposób naturalny przyciągną korzystających. „Dostęp do danych publicznych to jedno, ale teraz pracuje się na poziomie międzynarodowym nad otwarciem części zasobów, których właścicielami są podmioty prywatne. Wielkie korporacje mają dane, które mogłyby służyć celom społecznym. Może niedługo ten ekosystem danych się poszerzy o nowe zasoby” – mówił Dominik Rozkrut.

Pytanie, czy kolejne zbiory danych to błogosławieństwo czy niebezpieczeństwo. Jak stwierdził Kajetan Wojsyk, problemem polskiej administracji jest to, że zbiera dane masowo, nie mogąc ich potem odpowiednio zabezpieczyć. Pojawia się więc pytanie, czy dane obywateli, dane państwa, są chronione? „Mam coraz większe obawy. Jako obywatel nie mam pewności, czy po ataku typu ransomware instytucje byłyby w stanie się podnieść. Przedsiębiorstwo, które lekceważy sobie zagadnienia cyberbezpieczeństwa, w pewnym momencie przestaje istnieć” – stwierdziła Anna Rydel, Senior Sales Engineer z firmy Commvault.

„Co z tego, że stworzymy super system, jeśli czynnik ludzki jest słaby. Wielu użytkowników przesyła dane wrażliwe przez chmury publiczne. To jest problem” – dodała. „Dane bezwzględnie trzeba chronić. Myślę, że im więcej warstw ochrony wybudujemy przed sobą, tym bardziej utrudnimy życie tym, którzy chcą nasze dane zaatakować. Te warstwy będące blisko danych na pewno je zabezpieczają, szczególnie takie technologie, które pozwalają na zachowanie ich niezmienialności.” – dodał Daniel Michalczak, CEE Data Intelligence Specialist w Hitachi Vantara.

Proces zabezpieczania danych publicznych może, czy wręcz powinien być wspierany technologicznie. Rozwiązania pozwalające na przykład na automatyzację procesów związanych z backupem danych czy usprawniające cały proces składowania danych będą dawać większą pewność bezpieczeństwa. „Nasze rozwiązanie, które ma służyć bezpiecznemu przechowywaniu danych klientów w zgodzie z przepisami GDPR, a które stosuje 4 z 5 największych ubezpieczycieli w Polsce i 5 największych banków, równie skutecznie może wspierać procesy w administracji publicznej” – mówił Daniel Michalczak.

Jeśli dodać do tego narzędzia analityczne, które klasyfikują dane pod kątem ich krytyczności w momencie, kiedy trzeba będzie je odtwarzać, administracja publiczna może uzyskać rozwiązania skutecznie wspierające proces przetwarzania i przechowywania danych obywateli.

Ale czy technologia wystarczy? „Wydaje mi się, że administracja publiczna stoi przed poważnym wyzwaniem, jakim są zasoby ludzkie. Coraz trudniej będzie administracji zapewnić osoby, które będą rozumieć transformację cyfrową” – wyjaśniła Anna Rydel. Marek Bieńkowski stwierdził, że administracja przeszła długą drogę w rozumieniu bezpieczeństwa. Przytoczył przykład z 2015 roku, kiedy to podczas kontroli w ministerstwie cyfryzacji kontroler NIK dotarł do otwartego maila, w którym osoba odpowiedzialna za bezpieczeństwo w cyberprzestrzeni RP, przesyłała analizę ryzyk związanych z audytem systemów bezpieczeństwa w urzędach administracji publicznej.

Świadomość urzędników na szczęście się zmienia, niepokoi natomiast fakt, że za rozwiązaniami legislacyjnymi nie idą odpowiednie środki finansowe i kadrowe.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200