Otwarte dane w nowoczesnej gospodarce cyfrowej

Otwarte dane publiczne (public open data) to dane instytucji, urzędów, z których każdy może korzystać. Na bazie otwartych danych publicznych w Europie i na świecie powstaje coraz więcej nowoczesnych produktów i usług. Już niedługo w Polsce zaczną obowiązywać regulacje prawne wymuszające także na podmiotach prywatnych dzielenie się zanonimizowanymi danymi. Witamy w gospodarce współdzielenia.

Otwarte dane w nowoczesnej gospodarce cyfrowej

Alexey Funta/Mauritius Images

19 sierpnia 2021 prezydent Andrzej Duda podpisał znowelizowaną ustawę o otwieraniu i ponownym użytku danych sektora publicznego. Zacznie ona obowiązywać już tej jesieni. To kolejne dostosowanie polskiego prawa do unijnego, zwiększające ilość danych dostępnych do ponownego wykorzystania. Jak czytamy w uzasadnieniu, rozwój technologii cyfrowych spowodował konieczność zaktualizowania dotychczasowych ram ustawodawczych. Efektem znacznego zwiększenia podaży otwartych danych udostępnianych przez sektor publiczny mają być korzyści dla innowacyjności gospodarki i jakości życia społeczeństwa.

Ustawa m.in. wprowadza do polskiej legislacji pojęcia danych „o wysokiej wartości” (doskonałym przykładem są dane CEPiK) oraz „o wysokiej innowacyjności”, gwarantuje utrzymanie portalu dane.gov.pl oraz ustanawia nowe stanowisko – pełnomocnika ds. otwartości danych, obligatoryjnego w KPRM i GUS.

Zobacz również:

  • Inteligentna giełda – świat się kończy czy zaczyna?

Kiedy Polska przystąpiła w 2004 r. do Unii Europejskiej, dopiero zetknęliśmy się z pojęciem gospodarki opartej na wiedzy. W kraju, w którym ściąganie w szkole jest dowodem zaradności, a nie powodem do wstydu, nadal pozostaje wiele do nadrobienia w zakresie świadomości społecznej prawa własności intelektualnej i wartości danych. Aby nie utknąć w pułapce średniego rozwoju i nie pozostać montownią dla bardziej rozwiniętych gospodarek po wsze czasy, musimy konsekwentnie budować gospodarkę opartą na nowoczesnych technologiach i wiedzy. I choć nadal nie dogoniliśmy Europy Zachodniej, to wg Mc Kinseya, tempo wzrostu cyfryzacji Polski jest dwukrotnie wyższe niż w największych krajach UE. Analitycy McKinsey w raporcie prognozują, że dalsze przyśpieszenie cyfryzacji może przynieść Polsce dodatkowe 275 mld złotych PKB (64 mld euro) do 2025 roku. Pozwoliłoby na to osiągnięcie poziomu cyfryzacji najbardziej zaawansowanych pod tym względem gospodarek Europy Północnej, czyli tzw. Cyfrowych Liderów (Digital Frontrunners): Belgii, Danii, Estonii, Finlandii, Holandii, Irlandii, Luksemburga, Norwegii i Szwecji. Wyniki badań finansowanych ze środków europejskich znajdziemy chociażby w serwisie CORDIS.

Ustawa z 11.08.2021 o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego

Celem nowelizacji ustawy jest implementacja dyrektywy Parlamentu Europejskiego i Rady (UE) 2019/1024 z 20 czerwca 2019 r. w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego. Ustawa wprowadza zmiany w 11 innych aktach prawnych. Dodatkowo, celem nowelizacji ustawy z 17 lutego 2005 r. o informatyzacji działalności podmiotów realizujących zadania publiczne jest stworzenie ram prawnych dla funkcjonowania centralnego rozwiązania analitycznego.

Ustawa określa m.in. zasady bezpłatnego udostępniania informacji sektora publicznego, z określonymi wyjątkami, oraz trybu i sposobu ich przekazania w celu ponownego wykorzystywania; zmodyfikowanych zasad udostępniania informacji dla muzeów, archiwów i bibliotek; zasad i trybu udostępniania danych badawczych wytworzonych lub zgromadzonych w ramach działalności naukowej finansowanej ze środków publicznych (na co od dawna kładzie nacisk UE); zasad i trybu udostępniania oraz ponownego wykorzystania informacji sektora publicznego, w szczególności mających cechy utworu lub przedmiotu praw pokrewnych; obowiązku opracowania polityki otwartego dostępu do danych badawczych finansowanych ze środków publicznych przez ministra właściwego do spraw szkolnictwa wyższego i nauki; zasad i trybu udostępniania danych dynamicznych; zasad i trybu udostępniania danych o wysokiej wartości (których ponowne wykorzystywanie wiąże się z istotnymi korzyściami dla społeczeństwa, środowiska i gospodarki); zasad i trybu udostępniania informacji sektora publicznego o szczególnym znaczeniu dla rozwoju innowacyjności w państwie lub dla rozwoju społeczeństwa informacyjnego; zasad i trybu udostępniania informacji w trybie wniosku o ponowne wykorzystywanie.

W ustawie zdefiniowano między innymi portal danych, czyli powszechnie dostępny system teleinformatyczny, służący do udostępniania informacji sektora publicznego w celu ponownego wykorzystywania oraz danych prywatnych w celu wykorzystywania. To właśnie ten zapis konstytuuje istnienie dane.gov.pl.

Przy Komisji Europejskiej istnieje także funkcja lidera cyfryzacji (Digital Champion), którego każdy kraj wyznacza samodzielnie. Obecnie liderzy cyfryzacji działają w 26 krajach i mają promować cyfrową gospodarkę, uświadamiać i aktywizować ludzi w tym zakresie, tworzyć i wspierać kampanie informacyjne, inicjatywy i partnerstwa ukierunkowane na zagadnienia cyfrowe, oraz oczywiście doradzać

W Polsce od września 2017 r. Digital Championem jest Grzegorz Zajączkowski, doświadczony badacz i wykładowca akademicki, koordynator projektów obszaru rozwoju społeczeństwa informacyjnego.

Grzegorz Zajączkowski, Lider Cyfryzacji Komisji Europejskiej na Polskę:

Cała współczesna gospodarka opiera się na danych. Polskie firmy dopiero wchodzą w obszar intensywnego wykorzystania danych, uczą się ważności i przetwarzania tych danych. Bez danych nie mielibyśmy choćby szczepionek przeciw COVID. Komisja Europejska dzieli dane funkcjonalnie na związane z: ekonomią, społeczeństwem oraz efektywnością gospodarki. Na przykład udostępnienie danych komunikacyjnych Warszawy umożliwia istnienie rozkładów jazdy komunikacji miejskiej w różnych aplikacjach.

W przypadku danych z sektora infrastruktury krytycznej kraju kwestia otwierać dane czy nie, staje się problematyczna. Żyjemy w bardzo konkurencyjnym świecie, a sektor energetyczny jest wrażliwy ponieważ zawsze jest obszarem zainteresowania obcych wywiadów. Ten sektor i tak udostępnia sporo ciekawych wysoko zanonimizowanych danych, jednak nie dziwi mnie, że nie chce tego robić na bieżąco. Informacje o zużyciu energii na poziomie pojedynczego licznika, czyli mieszkania, są informacjami bardzo wrażliwymi, wiadomo, kiedy ktoś jest obecny w domu. Ten sektor jest nie tylko komercyjny, ale mówi mnóstwo o naszej prywatności. Dostrzegam racje drugiej strony, mimo że od lat promuję otwieranie danych. Podobnie rzecz się ma np. z sektorem lotnictwa.

Wiele osób pisze do lidera cyfryzacji w sprawie kwestii suwerenności cyfrowej. Były minister cyfryzacji Marek Zagórski słusznie podkreślał, że dane zawsze mają adres, że „data localization=PL”, że te dane powinny być u nas. Dane mogą być wykorzystywane na różne sposoby, ale zawsze mają narodowość.

Początkiem jest rozumienie danych. Ta nowelizacja ustawy o dostępie do danych tworzy kilka ważnych narzędzi, np. gwarantuje utrzymanie portalu dane.gov.pl, czyli harvestera otwartych danych publicznych.

Dane niczym metale szlachetne dla współczesnej gospodarki cyfrowej

Dane są podstawą nowoczesnego, rozwiniętego państwa i społeczeństwa. Wg raportu Europejskiego Portalu Otwartych Danych, wartość europejskiego rynku otwartych danych szacowano na 184,45 mld euro w 2019 r. Prognoza na 2025 r. mówi już o 334,20 mld euro.

Wykorzystanie danych może przynieść ogromne korzyści nie tylko obywatelom, przedsiębiorstwom i środowiskom akademickim, ale także rządowi i administracji. Aktualne, ogólnodostępne i możliwe do odczytu maszynowego dane mają kluczowe znaczenie dla podejmowania decyzji – aby można było oprzeć ja na faktach. Jednocześnie technologie przyszłości, takie jak sztuczna inteligencja i rozwiązania dla smart city czy IoT muszą opierać się na bogatej i wysokiej jakości, stale dostępnej bazie wiedzy.

Jak utrzymuje m.in. Komisja Europejska, otwarcie informacji – danych, ale także oprogramowania, treści sprzyja rozwojowi innowacji. Dostęp do danych uwalnia potencjał tworzenia nowych modeli biznesowych opartych na danych. W całej Europie, także w Polsce, trwają prace legislacyjne nad zobligowaniem podmiotów prywatnych do otwierania danych.

Dane są otwarte, kiedy każdy człowiek, firma lub instytucja może z nich skorzystać, użyć ponownie i redystrybuować – wszakże z uznaniem autorstwa i bez zmian w oryginale.

Sedno teorii otwartych danych leży w koncepcji:

• dostępności i przystępności poprzez pobieranie i możliwość wprowadzania modyfikacji;

• ponownego wykorzystania i redystrybucji, także poprzez powiązanie z innymi danymi;

• uczestnictwa i idei, że każdy, czy to ogólny użytkownik, czy wykwalifikowany operator, może korzystać z tych danych.

dr Dominik Rozkrut, Prezes GUS
Mamy w GUS świadomość tego, jakim zasobem danych dysponujemy – danych wysoce przetworzonych, mających bardzo wysoką wartość informacyjną, pochodzących z dobrze zaplanowanych i skrupulatnie przeprowadzonych badań. Dlatego od lat dążymy do zwiększenia wykorzystania tych danych i staramy się włączyć w trendy ogólnoświatowe dotyczące rozwoju otwartych danych. Ogłosiliśmy Manifest 5 „O” na rzecz otwartości i transparentności w statystyce publicznej. 5 „O” to nic innego jak: open data (otwarte dane), open access (otwarty dostęp), open algorithms (otwarte algorytmy), open source (otwarte oprogramowanie), open knowledge (otwarty dostęp do zasobów nauki).

Już w 2015 roku udostępniliśmy pierwsze API do odczytu maszynowego rejestru REGON. Dotychczas mamy już 10 miliardów zapytań do tej bazy, 8 tys. zarejestrowanych użytkowników. Wokół tego API stworzyła się społeczność, która dostarcza open source’owe rozwiązania dla naszego API, np. opracowała wtyczki w różnych językach programowania. Drugie API stworzyliśmy do rejestru TERYT – to 47 mln zapytań i 1,5 tys. zarejestrowanych użytkowników. Kolejne API powstało dla Banku Danych Lokalnych w ramach realizowanego wraz z Ministerstwem Cyfryzacji projektu z POPC „Otwarte dane – dostęp, standard, edukacja”. W grudniu 2018 uruchomiliśmy dostęp do zasadniczego źródła badań statystycznych. Od tej pory odnotowaliśmy 132 mln zapytań, mamy 3,2 tys. zarejestrowanych użytkowników. W BDL mamy ok. 50 tys. zmiennych wraz z przekrojami. W ramach projektu dodatkowo opracowaliśmy własny, dedykowany open source’owy moduł dla platformy R. Dzięki niemu, w sposób zautomatyzowany można pobierać dane z Banku Danych Lokalnych bezpośrednio do platformy R. Od 2019 współrealizujemy projekt „Otwarte dane plus”, który także jest współfinansowany z POPC. Tutaj naszym zadaniem jest budowa API do zmodernizowanych i uzupełnionych Dziedzinowych Baz Wiedzy, które stanowią uzupełnienie dla BDL . W ramach modernizacji DBW opracowywane są przewodniki po obszarach wyjaśniających specyfikę wyników istotnych badań statystycznych z określonego obszaru np. rynku pracy. Tworzymy do nich dodatkowe interfejsy, wskazując użytkownikowi, na co powinien zwrócić uwagę, co jest ważne w danym obszarze wiedzy, w jaki sposób powinno się analizować zmienne. To więcej niż zwykła baza danych. Mamy też nasz samodzielny projekt „Wrota statystyki” (realizowany dzięki środkom z POPC), w którym przebudowujemy całą infrastrukturę informatyczną, w tym software. Wyniki naszych badań trafią do jednolitej składnicy. Tworzymy jednolite, spójne API do wszystkich naszych zasobów. Zwiększy to efektywność naszych działań i umożliwi nowe sposoby prezentacji. Chciałbym stworzyć strukturę wieloportalową, z osobnym portalem dla każdej z grup naszych użytkowników, dostosowane do ich potrzeb, np. naukowców. Już mamy namiastkę takiego rozwiązania w postaci witryny nauka.stat.gov.pl. Wszystko to będzie działało na tym jednym silniku. Kolejny projekt to „Przestrzenne Dane Statystyczne” (finansowanie zapewniono także z POPC), w którym, chcemy przebudować to, co mamy na starym portalu z danymi statystycznego, opierając na dzisiejszych technologiach. Prezentacja danych będzie wychodziła od ujęcia mapowego, portal będzie miał też funkcjonalności analityczne. Wystarczy zaznaczyć obszar, by wygenerować statystyki. Systematycznie rozszerzamy zasoby danych dostępnych publicznie.

Otwarte dane publiczne to dane udostępniane bez opłat przez instytucje państwowe i urzędy. Na bazie otwartych danych publicznych w Europie i na świecie powstaje coraz więcej nowoczesnych produktów i usług. Według KE i innych instytucji propagujących ideę otwartych zasobów dzięki dzieleniu się danymi powstały nie tylko nowe firmy, ale też nowe modele biznesowe, przyspieszył wzrost gospodarczy, firmy i gospodarki stały się bardziej innowacyjne, państwowe instytucje bardziej transparentne, a usługi publiczne lepiej dopasowane do potrzeb obywateli (pełna analiza ekonomiczna UE dostępna jest pod linkiem: https://data.europa.eu/pl/highlights/creating-value-through-open-data). Powstały nowe zawody związane z analityką danych. Osoby prywatne oraz przedsiębiorcy, mogą korzystać z zasobów danych publicznych, realizując własne cele, rozwijając swoją działalność gospodarczą lub badania. Warunki korzystania z udostępnionych danych określa licencja. Najbardziej znane i najpopularniejsze są licencje CC, czyli Creative Commons.

Ruch open science i creative commons

Zaczęło się blisko 20 lat temu, a awangardzie przodował m.in. uniwersytet Harvarda. Ruch otwartej nauki zrodził się na gruncie m.in. sprzeciwu wobec wysokich i bezustannie rosnących cen, jakie naukowcy musieli płacić wydawcom za publikację wyników naukowych (bez publikowania nie można nawet utrzymać pracy – sytuację badaczy świetnie podsumowuje powtarzane od lat hasło publish or perish, publikuj albo giń).

„When we share, everyone wins” – czytamy na stronie Creative Commons, amerykańska organizacja non-profit, działa na rzecz równowagi pomiędzy swobodnym, darmowym dostępem do treści a prawami autorskimi. Dąży do tego, by all rights reserved zostało zastąpione przez some rights reserved. W 2001 r. założył ją amerykański prawnik i działacz społeczny, Lawrence Lessing. Polski oddział powstał już w 2005 r. Obecnie organizacja działa w 85 krajach. Podstawowe warunki licencji CC to: uznanie autorstwa, użycie niekomercyjne, na tych samych warunkach (wolno rozprowadzać utwory zależne jedynie na takiej samej licencji jak oryginał), bez utworów zależnych. Ich kombinacje tworzą rodzaje licencji CC, np. Uznanie autorstwa 4.0 – licencja ta pozwala na kopiowanie, zmienianie, rozprowadzanie, przedstawianie i wykonywanie utworu jedynie pod warunkiem oznaczenia autorstwa. Jest to licencja gwarantująca najszersze swobody licencjobiorcy. Creative Commons opracowało jednolity język opisu prawnego licencji – CC Rights Expression Language (CC REL), zrozumiały dla systemów komputerowych Wyszukiwarka treści na otwartej licencji (CC) jest dostępna na stronie https://search.creativecommons.org/. Przykładowo, wyszukiwanie treści objętych licencjami CC dostępne jest w wyszukiwarkach Google i Yahoo (w opcja zaawansowane), zdjęć w serwisie Flickr, muzyki w Jamendo, różnych mediów w seriwsie Spinxpress, video w Blip.tv i Vimeo.com. Wikimedia Commons, która jest zasobem mediów dla Wikipedii również używa licencji CC.

Tim Berners-Lee, twórca sieci WWW i prekursor Linked Data opracował koncepcję 5-star Open Data, opartą na bardzo prostych założeniach. 5-star Open Data opisuje, w jaki sposób dane powinny być dostępne, oznaczone oraz powiązane ze sobą, np.: ★ oznacza udostępnienie naszych treści (danych, oprogramowania etc) w internecie na otwartej licencji, obojętnie w jakim formacie (tj. bez troszczenia się o wygodę potencjalnego odbiorcy) po najwyższym poziom ★★★★★ którym oznacza podlinkowywanie do innych źródeł (https://5stardata.info/en/).

Na podobnych zasadach działają takie licencje jak GNU General Public License, używane przez wiele projektów open source (otwartego oprogramowania).

Cyfryzacja polskiej gospodarki

W Polsce dobiega końca projekt z Programu Operacyjnego Polska Cyfrowa „Otwarte dane plus”, będący kontynuacją projektu „Otwarte dane. Dostęp, standard, edukacja”. Realizują je wspólnie NFZ, ministerstwo finansów (program TREZOR do obsługi budżetu państwa), KPRM (w miejsce zlikwidowanego ministerstwa cyfryzacji), ministerstwo pracy, rozwoju i technologii (współpraca przy otwieraniu przez API rejestrów publicznych w turystyce) i GUS. Ten ostatni odpowiada za budowę interfejsu programistycznego API do Banku Danych Lokalnych (BDL) oraz działań wspierających wykorzystywanie API BDL przez użytkowników. Jak powiedział „Computerworld” prezes GUS, dr Dominik Rozkrut, GUS i tak już wcześniej rozpoczął prace nad tego typu interfejsem.GUS tworzy jednolite, spójne API do wszystkich swoich zasobów w ramach projektu „Wrota statystyki”, również finansowanego z POPC. GUS używa machine learning podczas pozyskiwania źródeł, np. Urząd Statystyczny w Szczecinie analizuje dane – kilka milionów obserwacji dziennie z sytemu AIS na morzu, ma też dostęp do viaTOLL i e-TOLL i generuje z nich statystyki, ma własne silniki do web scpraing. W oparciu o dane z kas fiskalnych analizuje inflację. W najnowszym rankingu Open Data Watch, która oceniła urzędy statystyczne pod względem otwartości danych i spektrum udostępnianych danych z prowadzonych badań, polski GUS jest sklasyfikowany na 2. miejscu na świecie w (pierwsze miejsce zajął Singapur).

Wspomniana tegoroczna nowelizacja ustawy gwarantuje trwałość portalu dane.gov.pl (tzw. harvestera). Aktualnie znajdziemy na nim 1753 zbiorów danych od 163 dostawców do swobodnego wykorzystania, także komercyjnego, w następujących dziedzinach: energia, gospodarka i finanse, dane samorządów, edukacja, kultura, sport, rząd i sektor publiczny, ustrój i sprawiedliwość. Znajdziemy tu też listę aplikacji korzystających z zasobów portalu np. Biała Lista Vat i Rejestrmedyczny.pl

Otwarte dane w sektorze prywatnym. Jakie branże są nimi szczególnie zainteresowane?

Obecnie jednak otwarte dane szybko zyskują na znaczeniu również w sektorze prywatnym. W ciągu ostatnich 20 lat coraz więcej firm zaczęło stosować otwartą innowację, dzieląc się danymi i zasobami z uniwersytetami, naukowcami i inkubatorami start-upów (w Polsce widać to zwłaszcza w sektorach ochrony zdrowia, IT i kosmicznym), aby przyspieszyć badania i rozwój.

Otwarte dane przenoszą otwarte innowacje na kolejny poziom, ponieważ coraz więcej firm decyduje się na udostępnianie swoich danych innym podmiotom w branży i szerszej publiczności. Dane osobowe i handlowe nie są oczywiście dostępne: przed publikacją dane są anonimizowane i agregowane.

Dla Macieja Krzyżanowskiego, prezesa CloudFerro, otwartość to transparentność i bezpieczeństwo - CloudFerro opiera swoje usługi na otwartym oprogramowaniu, dzięki czemu zyskujemy niezależność , chociażby od cudzych praw własności intelektualnej. Bazujemy tylko na własnych kompetencjach, dobrze rozumiemy open software i czynnie bierzemy udział w jego rozwoju. Co więcej, może się okazać, że użycie otwartego oprogramowania jest per saldo bezpieczniejsze, gdyż można je przeczytać i poddać taki kod audytowi bezpieczeństwa. Nie możemy tak sprawdzić oprogramowania zamkniętego. Wbrew pozorom, otwartość może zwiększać poziom bezpieczeństwa.

W Europie szczególne przyspieszenie wykorzystania otwartych danych widać już w następujących obszarach:

Sektor energetyczny

Portugalski gigant energetyczny EDP we współpracy z firmą Opendatasoft uruchomiły portal otwartych danych (https://opendata.edp.com/pages/homepage/), zawierający informacje operacyjne dotyczące testowania paneli słonecznych SunLab oraz jednej z farm wiatrowych. Celem jest zachęcenie wszystkich, zwłaszcza studentów, naukowców i początkujących przedsiębiorców, do ponownego wykorzystania danych w pracach naukowych, nowych programach lub pomysłach biznesowych oraz do dzielenia się swoimi osiągnięciami na platformie. EDP wykorzystuje portal otwartych danych do udostępniania zbiorów danych podczas wyzwań - konkursów technicznych, do których każdy może się zgłosić i które są nagradzane nagrodami pieniężnymi.

W Polsce sprawa staje się nieco bardziej złożona, ponieważ wiele organizacji woli zasłaniać się tajemnica przedsiębiorstwa i wydawać uporządkowane dane jako odpłatne i nietanie publikacje, powołując się na prawo do autorstwa i prawa własności intelektualnej. Taki zarzut pojawia się np. w stosunku do Agencji Rynku Energii. Według krytyków tego podejścia, przypomina to zachowanie bohatera opowiadania Jorge Louisa Borgesa „Pierre Menard, autor Don Kichota”. W połowie 2020 r. fundacja Instrat (niezależny think-tank zajmujący się transformacją energetyczną i gospodarką cyfrową) opublikowała na portalu WysokieNapiecie.pl apel o otwarty dostęp do danych z energetyki i górnictwa, pod którym podpisało się ponad 60 organizacji, ekspertów i liderów opinii. Instrat argumentuje, że „Pełna transparentność danych dotyczących górnictwa i energetyki to warunek konieczny dla sprawiedliwej transformacji regionów górniczych. Bez znajomości danych, niemożliwe jest ich zrozumienie, a co za tym idzie, akceptacja społeczna dla zmian, przed którymi i tak nie ma odwrotu. Niestety, obecnie pisany plan restrukturyzacji górnictwa owiany jest tajemnicą i nikt nie jest w stanie realnie zweryfikować propozycji rządu, bo tylko instytucje rządowe wiedzą w jakim stanie jest sektor górniczy”.

Także w czerwcu ubiegłego roku fundacja uruchomiła pierwszy polski portal energy.instrat.pl z otwartymi, całkowicie bezpłatnymi i przystępnie przedstawionymi danymi z zakresu energetyki i górnictwa.

Blanka Wawrzyniak, analityczka prawna fundacji INSTRAT

Blanka Wawrzyniak, analityczka prawna fundacji INSTRAT

Jako organizacja działamy na rzecz otwierania danych w sektorze energetycznym i węgla kamiennego. Napotykamy na ogromne trudności, ponieważ - w przeciwieństwie do innych danych o statystycznych, które są publikowane np. przez GUS - mamy problem ze stałym dostępem do danych energetycznych z tego względu, że są one zbierane i porządkowane w pewne zbiory przez podmioty prywatne. Ta nowa ustawa o otwieraniu danych w naszym odczuciu może niewiele zmienić, ponieważ wspomniane podmioty prywatne w dalszym ciągu będą się zasłaniać prawem ochrony własności intelektualnej i baz danych. Równocześnie na poziomie unijnym toczą się prace dotyczące nowych regulacji takich jak chociażby Data Act, które będą jeszcze bardziej wspierać się dzielenie się danymi, przede wszystkim w relacjach b2b i b2g oraz które przewidują zaktualizowanie przepisów dotyczących baz danych. Te zmiany będą bardziej rewolucyjne od wprowadzonych nową polską ustawą.

Podmioty prywatne czerpią podwójny zysk z opracowywania danych, ponieważ z jednej strony otrzymują wynagrodzenie od Skarbu Państwa, a równocześnie sprzedają repozytoria danych wytworzone za publiczne pieniądze. Tak robi np. Agencja Rynku Energii, w dodatku nie sprzedaje tych opracowań tanio. Na tym rynku mamy więc właściwie do czynienia z monopolem. Nieujawnianie danych utrudnia natomiast pojawianie nowych firm na rynku.Im większa dywersyfikacja podmiotów zajmujących się opracowywaniem danych, tym większa ich konkurencyjność i wyższa jakość oferowanych produktów.

Barierą rozwoju gospodarki cyfrowej w Polsce są ogromne platformy i kilka podmiotów, które zmonopolizowały ten rynek.

UE bardzo aktywnie działa w zakresie otwierania danych, sukcesywnie wydając kolejne rozporządzenia, jak chociażby Data Government Act, które mają zapewnić bezpieczeństwo podmiotom prywatnym, które zechcą dzielić się swoimi zagregowanymi danymi. Narasta tendencja, by kłaść nacisk na egzekwowanie udostępniania danych, zwłaszcza w przypadku danych generowanych maszynowo, które zanonimizowane mogą być dalej wykorzystywane w gospodarce z korzyścią dla wszystkich obywateli. Z jednej strony firmy prywatne martwią się, że przez udostępniane danych może zostać ujawniona tajemnica przedsiębiorstwa, a z drugiej strony badania pokazują, że dzielenie się danymi jest bardzo korzystne dla rozwoju państwa i gospodarki – chociażby w przypadku możliwości tworzenia rozwiązań w zakresie smart city, narzędzi do walki z epidemiami, a także innowacji dla przedsiębiorstw.

Wszelkie kroki UE mające usprawnić i zmotywować przedsiębiorców do otwierania danych oceniamy bardzo pozytywnie. W Polsce napotykamy niechęć do otwierania danych z powodu niskiej świadomości przedsiębiorców, dlatego oprócz działań legislacyjnych warto byłoby prowadzić działania edukacyjne i propagujące otwartość.

Sektor finansowy

Na dane.gov.pl znajdziemy wiele zasobów udostępnionych przez polskie Ministerstwo Finansów i Krajową Administrację Skarbową, w tym np. dane finansowe jednostek samorządu terytorialnego (JST).

Z kolei otwarta bankowość to trend, który stał się prawem na mocy europejskiej dyrektywy PSD2. Nakłada ona na wszystkie instytucje oferujące rachunki płatnicze obowiązek udostępniania API dla zewnętrznych dostawców usług płatniczych. W ten sposób, za zgodą klienta, dane bankowe klienta mogą być udostępniane autoryzowanym podmiotom trzecim (np. aplikacjom do płatności mobilnych). Otwarta bankowość pozwala na trzymanie pieniędzy w tradycyjnym banku i jednoczesne korzystanie z usług fintech.

Sektor ekologiczny

Wraz z dążeniem do modelu gospodarki cyrkularnej, coraz więcej instytucji otwiera dane środowiskowe. W Polsce np. Gdańsk udostępnia na stronie https://www.gdansk.pl/otwarte-dane szereg danych, w tym o odpadach komunalnych, ruchu miejskim czy natężeniu hałasu. Wrocław dzieli się danymi z Vozilli – miejskiej wypożyczalni samochodów elektrycznych. Takie działania ułatwiają przedsiębiorstwom realizację celów w zakresie recyklingu czy emisji CO2. PAN oraz Politechnika Białostocka zrealizowały repozytorium danych w ramach projektu „E-puszcza”. Na https://ekoportal.gov.pl/ zamieszczono dane o środowisku. Z zagranicznych inicjatyw wspomnijmy InSymbio (http://insymbio.com/), rynek B2B dla bioodpadów i surowców, utworzony przez włoską firmę inżynieryjną Rethink w ramach inkubatora Open Data ODINE UE. Platforma umożliwia przedsiębiorstwom ustalenie ceny, po której chcą kupić lub sprzedać odpady drzewne, roślinne lub zwierzęce, oraz znalezienie odpowiedniego partnera w oparciu o swoją lokalizację. Na tej platformie przedsiębiorstwa rolne mogą sprzedawać odpady owocowe firmom, które przetwarzają je na materiały podobne do plastiku.

Przemysł (w tym nowe technologie, także sektor kosmiczny)

Z otwierania danych cieszy się przede wszystkim sektor nowych technologii, ponieważ dane są podstawą uczenia maszynowego. Firmy technologiczne chętnie dzielą się zanonimizowanymi danymi.

Na stronie https://data.world/datasets/industry znajdziemy 172 zbiory danych z przemysłu. Jest też platforma danych z przemysłu nafty i gazu

„The open industrial data project” https://www.openindustrialdata.com/. Sektor kosmiczny to "European Science Cloud", dane z satelitów czy The Prognostics Data Repository NASA. Pod adresem https://cloud.ibm.com/ IBM prowadzi portal "IBM Open Data for Industries". Wymieńmy jeszcze https://datasetsearch.research.google.com/ i https://www.re3data.org/ (Registry of Research Data Repositories)

Inną znaczącą inicjatywą jest Open Manufacturing, środowisko oparte na chmurze, w którym duże firmy przemysłowe i z łańcucha dostaw mogą dzielić się komponentami i danymi typu open source w celu opracowania innowacyjnych rozwiązań. Do platformy, zainicjowanej przez niemieckiego producenta samochodów BMW i Microsoft, dołączyły ostatnio firmy Bosch, producent części ZF Friedrichshafen i belgijski browar Anheuser-Busch InBev. Partnerzy współpracują obecnie nad łącznością IoT na krawędziach i w chmurze, a także nad semantycznym modelowaniem danych.

Otwarte dane wpisują się w smart city.

Rolnictwo

Polska firma CloudFerro z sektora kosmicznego świadczy też np. usługi związane z rolnictwem, np. oparte na danych z satelitów Sentinel z europejskiej platformy Copernicus dla wspólnej polityki rolnej.

Maciej Krzyżanowski, CEO CloudFerro
CloudFerro dostarcza usługi dedykowanej chmury obliczeniowej oraz dane branżowe i specjalizowane narzędzia do ich przetwarzania. Są to dane Obserwacji Ziemi programu satelitarnego Copernicus. Jesteśmy przekonani, że dane otwarte przez sektor publiczny mogą być bazą dla rozmaitych rozwiązań ułatwiających życie, a zarazem napędzających gospodarkę. Cieszy więc, że poszerza się zakres otwartości danych, bo na danych opiera się współczesna gospodarka. Zwłaszcza wyniki badań finansowanych ze środków publicznych powinny być powszechnie, bezpłatnie dostępne. Dobrze, że pojawiają się nowe rozwiązania legislacyjne, jednak diabeł tkwi, jak zwykle, w szczegółach. Kierunek zmian wprowadzonych nowelizacją ustawy uważam za pozytywny, zwłaszcza że mają być dostępne bezpłatnie interfejsy API, co jest szczególnie ważne dla przedsiębiorców.

Uważam, że także narzędzia do przechowywania i analizy danych powinny być otwarte. CloudFerro opiera swoje usługi na otwartym oprogramowaniu, dzięki czemu zyskujemy niezależność , chociażby od cudzych praw własności intelektualnej. Bazujemy tylko na własnych kompetencjach, dobrze rozumiemy open software i czynnie bierzemy udział w jego rozwoju. Co więcej, może się okazać, że użycie otwartego oprogramowania jest per saldo bezpieczniejsze, gdyż można je przeczytać i poddać taki kod audytowi bezpieczeństwa. Nie możemy tak sprawdzić oprogramowania zamkniętego. Wbrew pozorom, otwartość może zwiększać poziom bezpieczeństwa.

W ramach European Science Cloud udostępniamy dane Copernicusa dla naukowców i zapewniamy usługi chmury obliczeniowej. Współpracujemy z sektorem nauki i edukacji. Dzięki użyciu naszych rozwiązań naukowcy mogą się skupić na merytoryce. Nauka będzie coraz bardziej korzystać z rozwiązań chmurowych. Nie trzeba mieć przecież własnego biurowca czy elektrowni, tak samo można kupić moc obliczeniową, zamiast budować swoje centrum obliczeniowe.

Otwarte dane, generowane zarówno przez sektor publiczny, jak i biznes, mogą być motorem napędzającym gospodarkę. Sektor kosmiczny i dane Obserwacji Ziemi są tego świetnym przykładem. Widzimy ogromny popyt na tego typu otwarte dane i ich specjalizowane przetwarzanie, czego dowodem są nasze projekty dla takich instytucji jak Europejska Agencja Kosmiczna, Europejskie Centrum Prognoz Średnioterminowych, Mercator Ocean International czy też Niemiecka Agencja Aero-Kosmiczna.

Hiszpański start-up Cropti opiera się na otwartych danych z Europejskiej Agencji Kosmicznej (ESA), aby ustalić, które uprawy i działki są bardziej opłacalne. Oferuje rolnikom pulpity nawigacyjne do eksploatacji gleby oraz narzędzia do śledzenia magazynu i kosztów w czasie rzeczywistym.

Na holenderskiej platformie non-profit JoinData, rolnicy mogą scentralizować dane z czujników w jednym miejscu. Mogą również wybrać, jakimi informacjami się dzielić i z jakimi partnerami (dostawcami, weterynarzami, księgowymi, twórcami aplikacji...), zwiększając w ten sposób rentowność, wydajność i innowacyjność.

Dane to jedyne złoże, które przyrasta, a nie wyczerpuje się. Nie generują emisji CO2. Nikt nie ulega wypadkom przy ich wydobywaniu, ani nie następuje degradacja środowiska naturalnego.

Jak otwarcie danych pozwoliło wygasić śmiertelną epidemię

Dekadę temu, w 2011 r. w Niemczech szalała bakteria E. coli – zmarło 50 osób, a tysiące ludzi znalazło się w ciężkim stanie w szpitalu. Pogłoska, że winowajcą miały być hiszpańskie ogórki, uderzyła w eksport warzyw tego kraju. GigaScience zdecydowało, że priorytetem jest zduszenie epidemii w zarodku i zdecydowało się na bezprecedensowy krok – pominięcie tradycyjnej, skrupulatnej, a więc wieloletniej ścieżki badawczej. Otworzyli dane przez Twitter, a zespół Era& stworzył (istniejący do dziś) serwis Github umożliwiający naukowcom na całym świecie natychmiastową wymianę wniosków z przeprowadzanych analiz. Po kilku dniach zidentyfikowano szczep bakterii odpowiedzialny za epidemię (nie pochodził od ogórków). Po tygodniu istniał już specjalny diagnostyczny protokół i bezpłatne primery, które błyskawicznie rozesłano w Europie. Opanowano epidemię w zarodku.

Prawo do informacji publicznej

Co zrobić, jeżeli jesteśmy zainteresowani danymi, którym instytucja publiczna nie chce udostępnić, choć teoretycznie obliguje ją do tego prawo? Możemy wystąpić z wnioskiem o dostęp do informacji publicznej. Prawo do informacji publicznej to w polskim prawie każda informacja o sprawach publicznych. Przysługuje każdemu jako prawo człowieka. Ustawa z 6 września 2001 r. o dostępie do informacji publicznej (Dz. U. Nr 112, poz. 1198) precyzuje konstytucyjny zapis art. 61 o prawie obywateli do informacji o działaniach władz publicznych.

Ustawa nakazuje organom władzy państwowej (i innym podmiotom) udostępniać każdą informację o sprawach publicznych tj. informację publiczną (art.1, ust.1). Wyjątek stanowią informacje niejawne (art.5, ust.1).

Zgodnie z ustawą prawo do informacji publicznej obejmuje uprawnienie do niezwłocznego uzyskania takiej informacji, zawierającej aktualną wiedzę o sprawach publicznych. Na prawo do informacji publicznej składają się uprawnienia do:

• uzyskania informacji publicznej, w tym informacji przetworzonej,

• wglądu do dokumentów urzędowych,

• dostępu do posiedzeń kolegialnych organów władzy publicznej pochodzących z powszechnych wyborów.

Prawo to przysługuje każdej osobie (art.2 ust.1). Od osoby występującej o informację publiczną nie wolno żądać uzasadnienia wniosku (art.2 ust.2).

Zgodnie z ustawą o dostępie do informacji publicznej jej udostępnienie następuje bez zbędnej zwłoki, jednak nie później niż w terminie 14 dni od dnia złożenia wniosku (art. 13, ust.2). Przepisy dopuszczają wydłużenie tego terminu, nie dłużej niż o dwa miesiące od dnia złożenia zapytania. Ich naruszenie stanowi podstawę do wniesienia do sądu administracyjnego skargi na bezczynność organu.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200