Czy można zakochać się w danych i analityce?

Agnieszka Piechocka, Customer Advisor, SAS Forensic & Compliance Team

Computerworld Z Agnieszką Piechocką, Customer Advisor w SAS Forensic & Compliance Team, rozmawiamy o roli analityki i sztucznej inteligencji w budowaniu odporności firm na zmiany i przygotowaniu się na przyszłe wyzwania, kierunkach rozwoju dziedziny data science oraz o tym, jak odpowiednie wykorzystanie dostępnych danych zmienia świat na lepsze.

Krajobraz biznesowy i oczekiwania klientów zmieniają się w coraz szybszym tempie, firmy starają się przygotować najlepsze strategie na przyszłość. Tytuł nadchodzącej, międzynarodowej konferencji SAS to „Beyond Tomorrow” – na jakie trendy technologiczne warto zwrócić uwagę? Czy zaawansowana analityka danych pomaga w przygotowaniu się do kolejnych nieprzewidywalnych zmian?

Bez wątpienia jesteśmy w momencie, w którym trudno jest przewidzieć jutro. Sytuacja zarówno w Polsce, jak i na świecie zmienia się bardzo dynamicznie. I nadal będzie się zmieniać. Jeszcze rok temu nikt z nas nie zakładał, że tyle aspektów naszego życia możemy przenieść do rzeczywistości wirtualnej. Praca, nauka, zakupy – zostaliśmy postawieni przed faktem dokonanym i konieczna była możliwie szybka adaptacja do świata online.

Jeśli chodzi o moje prywatne ulubione trendy technologiczne, które poznałam dzięki nowej rzeczywistości, wskazałabym trzy. Pierwszy z nich to sklepy bezobsługowe, do których wchodzi się za pomocą aplikacji, w ten sam sposób się płaci i wychodzi, bez kontaktu z jakimkolwiek sprzedawcą. Takie sklepy są już dostępne w kilku polskich miastach i wciąż powstają nowe. Drugi trend to aplikacja TooGoodTooGo, przyczyniająca się do ograniczenia marnowania jedzenia, które w danym dniu nie sprzedało się w restauracjach i kawiarniach. Jest to jednocześnie wsparcie dla lokalnej gastronomii, która przeżywa bardzo trudny okres. I ostatni przykład to przenoszenie szkoleń i konferencji do przestrzeni wirtualnej, co pozwala poszerzyć horyzonty w tematach zupełnie nowych bez wychodzenia z domu.

A jeśli chodzi o trendy w branży - zauważamy ogromny wzrost zainteresowania analityką. Odpowiednio przeprowadzona analiza danych pozwala ograniczyć niepotrzebne koszty – a właśnie oszczędności najbardziej teraz poszukują przedsiębiorcy. Optymalizacja, automatyzacja, wykrywanie nadużyć czy raportowanie – to tylko niektóre obszary, które poprawiają sytuację finansową firmy w tych trudnych czasach. Kolejnym niezaprzeczalnym trendem jest wzrost popularności rozwiązań chmurowych – już na początku pandemii firmy dostarczające usługi w chmurze zanotowały ogromny wzrost popytu. Zarówno praca jak i nauczanie w formie zdalnej wymagają nowych zasobów, a szybki dostęp i skalowalność usług w chmurze to zapewnia.

Zaawansowana analityka bez wątpienia pomaga w przygotowaniu się do przyszłych wyzwań. Warto jednak pamiętać, że analityka nie jest szklaną kulą – nie pozwoli nam jednoznacznie zobaczyć, co nas czeka.

Jednak dzięki wykorzystaniu zaawansowanych metod, możemy się na tę przyszłość przygotować najlepiej jak to możliwe. Bazując na ogromnej ilości danych i doświadczeń, które już mamy, możemy z pewnym prawdopodobieństwem przewidywać i tworzyć prognozy. Wszystko po to, żeby móc pewnie podejmować decyzje i przewidywać możliwe scenariusze.

Tworzenie nowej wartości na podstawie danych – to jedna z podstaw cyfrowej transformacji i popularne hasło. W jaki sposób organizacje powinny podejść do analizy danych, aby w pełni wykorzystać ich potencjał?

Od dawna mówi się o danych jako najcenniejszym zasobie każdej firmy – od małego start-upu aż po międzynarodowe korporacje. Dane mogą pochodzić z różnych źródeł – systemów ERP, systemów transakcyjnych, web crawlerów i stanowić ogromne wolumeny. Aby uzyskać wymierną wartość z danych, nie wystarczy ich posiadać. Wyciąganie wniosków z analizy informacji wymaga ich wcześniejszego przygotowania i zazwyczaj właśnie ta część zabiera analitykom najwięcej czasu.

Aby móc wyciągnąć z analityki jak najwięcej, trzeba przede wszystkim dbać o jakość danych – zgodnie z angielskim idiomem garbage in – garbage out (śmieci na wejściu – śmieci na wyjściu), który podkreśla, że nawet przy zastosowaniu najnowocześniejszych i najbardziej wysublimowanych technik analizy danych – wyniki przetwarzania błędnych danych pozostaną błędne. Ponadto przed rozpoczęciem jakiejkolwiek analizy bardzo ważne jest, żeby zastanowić się nad jej celem. Kto będzie jej odbiorcą? Jak uzyskany wynik wpłynie na biznes? Jaką decyzję ma pomóc nam podjąć? Wzrost popularności i dostępności analityki danych doprowadził do masowej produkcji raportów i analiz, często będących jedynie „sztuką dla sztuki”, nie przynoszących przedsiębiorstwu żadnych realnych korzyści.

Dlatego zanim zaczniemy wybierać metody, poziom istotności błędu i rozważać wyższość konwolucyjnych sieci neuronowych nad rekurencyjnymi, zdefiniujmy cel, który chcemy osiągnąć analizując dane.

Jak wygląda przyszłość dziedziny data science? Czy zacznie przenikać inne obszary, takie jak marketing, komunikacja czy rozwój biznesu i będzie to szeroka dziedzina oparta na analizie różnorodnych danych?

Nie ulega wątpliwości, że dane są wszędzie. I w każdej chwili powstaje ich coraz więcej. Szukając najbliższej kawiarni z pomocą nawigacji, płacąc za kawę kartą płatniczą, wrzucając zdjęcie tej kawy na Instagram i polecając nowe miejsce znajomym – nieustanie pozostawiamy po sobie ślad w postaci wygenerowanych danych. Dotyczy to praktycznie wszystkich dziedzin naszego życia. Nieustannie rośnie ilość składowanych danych w sektorze finansowym, handlu detalicznym, medycynie, instytucjach publicznych, edukacji i wielu innych. Ciężko dziś znaleźć segment gospodarki, w którym obserwuje się odwrotną tendencję.

Jednym z ważniejszych trendów jest zwrot w kierunku podejmowania decyzji na podstawie danych.

Wraz ze wzrostem zainteresowania sztuczną inteligencją także najważniejsze decyzje zarządcze są podejmowane na podstawie analiz i prognoz. Prowadzi to do wzrostu zainteresowania i popytu na kompleksowe platformy analityczne, pozwalające na zarządzanie danymi całej firmy za pomocą jednego systemu.

Innym trendem powoli zdobywającym rynek jest RPA (Robotic Process Automation), które można tłumaczyć jako zrobotyzowana automatyzacja procesów. RPA jest klasą oprogramowania do automatyzacji procesów biznesowych. W takim podejściu zakłada się stosowanie dedykowanego oprogramowania (umownego robota) do obsługi powtarzalnych, wieloseryjnych czynności. Coraz częściej rozwiązania klasy RPA wyposażane są w wybrane mechanizmy sztucznej inteligencji (AI) i możliwości uczenia maszynowego, co istotnie poszerza zakres ich stosowania. Poza oszczędnością czasu oraz uwolnieniem zasobów ludzkich od powtarzalnych i mało motywujących zajęć dzięki RPA otrzymujemy szybsze efekty pracy. Rzeczywistość, w której roboty przejmują pracę ludzi z punktu widzenia gospodarki jest dobra, ale z punktu widzenia człowieka już niekoniecznie – dla wielu osób może się to wiązać z utratą pracy i koniecznością przebranżowienia, podejmowania pracy kreatywnej. Oczywiście zmiany te dzieją się stopniowo i na razie nie musimy się z tymi problemami mierzyć, ważne jednak żeby w szczególności te najmłodsze pokolenia, wchodzące na rynek pracy zdawały sobie sprawę z tych trendów, żeby odpowiednio pokierować ścieżką kariery.

Na co dzień jesteśmy świadkami kampanii marketingowych skrojonych pod indywidualne potrzeby użytkownika, mamy świadomość, że nasze pieniądze w bankach są lepiej chronione dzięki dołączeniu danych behawioralnych, nie martwimy się brakiem ulubionych produktów w sklepie wierząc, że planowanie zaopatrzenia jest optymalne. Możliwości wykorzystania analityki są naprawdę niezwykle szerokie, ogranicza nas jedynie kreatywność.

W jaki sposób oczekiwania biznesu związane z analityką danych czy pracą data scientists będą ewoluować w ciągu najbliższych 5 lat?

Narzędzia analityczne stają się coraz bardziej przyjazne dla użytkowników. Zjawisko to, związane również z demokratyzacją danych, sprawia, że dane i wiedza z nich płynąca są dostępne dla wszystkich pracowników przedsiębiorstwa i umożliwiają im podejmowanie decyzji w oparciu o obserwacje z przeszłości. W takiej sytuacji dużo ważniejsze stają się wiedza dziedzinowa i praktyczne doświadczenie, niż umiejętności czysto techniczne.

Ponadto wzrost popularności i zaufania do rozwiązań chmurowych sprawia, że możliwa staje się implementacja bardziej zaawansowanych modeli i otrzymywanie wyników w krótszym czasie, a nawet przetwarzanie danych w czasie rzeczywistym. Pomoże to zrewolucjonizować kolejne obszary i zastosować analizę danych w zupełnie nowych dziedzinach. Demokratyzacja danych wspierana przez narzędzia online pozwoli wyrównywać szanse w rywalizacji rynkowej między dużymi markami a mniejszymi firmami. Na data science z pewnością wpłynie też wzrost popularności rozwiązań z obszaru Internetu Rzeczy (IoT). Dane strumieniowe wysyłane przez sensory będą potrzebowały rozwiązań szybkich i wydajnych, działających w czasie rzeczywistym, ale też specjalistów, którzy będą umieli takie dane przełożyć na zysk.

Niezwykle ważnym aspektem pracy w dziedzinie Data Science jest cyberbezpieczeństwo, a w szczególności bezpieczeństwo danych. Firmy zbierają, przetwarzają i przechowują niezliczoną ilość danych na komputerach i innych urządzeniach. Istotna część tych danych może być informacją wrażliwą, niezależnie od tego, czy jest to własność intelektualna, dane finansowe, dane osobowe lub innego rodzaju dane, w przypadku których nieupoważniony dostęp może mieć negatywne konsekwencje. Utrata zaufania klientów, pozwy sądowe, wielomilionowe kary, utrata przewagi konkurencyjnej na rynku – to tylko niektóre z nich. Wraz ze wzrostem cyberataków, firmy i organizacje, muszą podjąć kroki w celu ochrony poufnych informacji – zaawansowane systemy analityczne pozwolą te dane chronić, zapewniać dostęp jedynie autoryzowanym użytkownikom i zapobiegać zjawiskom kradzieży tożsamości.

Analiza danych to fascynująca i szybko się rozwijająca dziedzina. Co Pani zdaniem jest w niej najbardziej interesujące? Które aspekty? Czy można „zakochać” się w danych i analityce?

Absolutnie tak!

Analiza danych pozwala nam spojrzeć na otaczający nas świat z zupełnie nowej, szerszej perspektywy. Pozwala nam wyjść ponad własne prawdy i przekonania, by w oparciu o dane móc wyciągać adekwatne wnioski.
Oczywiście niezwykle istotne, zarówno w przypadku autorów analiz, jak i ich odbiorców jest krytyczne myślenie. Miałam ostatnio przyjemność przeczytać książkę Janiny Bąk, w której padają bardzo trafne słowa „(…) statystyki nie kłamią. Ale ludzie bardzo często kłamią na temat statystyk”. Dane są jednoznaczne, ale wynikami bardzo łatwo można manipulować. Zawsze trzeba być czujnym i z pewną dozą nieufności podchodzić do prezentowanych wykresów – zwracając uwagę na skalę, osie, a także próbkę danych, która w wielu głośnych badaniach okazywała się być niereprezentatywna. Ważne jest, by do publikowanych analiz podchodzić zdroworozsądkowo i zawsze trochę krytycznie.

A wracając do pytania – dla mnie największą wartością analityki jest możliwość lepszego poznania i zrozumienia świata. Dobrze skonstruowane badania pozwalają nam zaobserwować zmiany na przestrzeni czasu – i odpowiednio na nie reagować, zmieniając świat na lepsze.

W jaki sposób technologia, a zwłaszcza analiza danych, może pozytywnie wpływać nie tylko na biznes, ale także na lokalne społeczności czy pomagać w rozwiązywaniu globalnych problemów?

Analityka może przede wszystkim edukować, i zwracać uwagę na problem. Dobrze przeprowadzona analiza daje nam wyważoną, bardziej obiektywną ocenę sytuacji. Ciekawą lekturą jest książka Hansa Roslinga „Factfullness. Dlaczego świat jest lepszy, niż myślimy, czyli jak stereotypy zastąpić realną wiedzą”. Autor opisuje w niej utrwalone przez lata stereotypy, które zakłócają nasz sposób widzenia świata i sprawiają, że widzimy go w czarnych barwach. Tymczasem na podstawie zbieranych danych widać wyraźnie, jak wiele problemów z biegiem lat zostało rozwiązanych, a kondycja naszego świata i życia wcale nie jest tak zła, jak często nam się wydaje. Analityka pozwala też szybko i trafnie wskazywać obszary do poprawy w naszym najbliższym otoczeniu.

Rok temu miałam okazję spędzić miesiąc w Tanzanii, gdzie razem z grupą przyjaciół pomagaliśmy w małej wiejskiej szkole, organizując zajęcia dla dzieci z okolicy. Jedną z akcji, które podjęliśmy na miejscu, jako że byli z nami również studenci ostatnich lat medycyny, było przeprowadzenie podstawowego badania zdrowia wszystkich uczniów. Po zebraniu danych przepisaliśmy je do Excela, by zabrać je do domu, przeanalizować i wysłać sugestie jakie podjąć działania. Okazało się, że powszechnym zjawiskiem jest bardzo zła postawa ciała maluchów– skrzywienie kręgosłupa spowodowane noszeniem baniaków z wodą na głowie czy młodszego rodzeństwa. Nagraliśmy filmy instruktażowe z ćwiczeniami korekcyjnymi, które od tego roku dzieci wykonują na zajęciach wychowania fizycznego – wprowadzonych do szkoły dzięki naszej analizie. Jak widać na tym przykładzie - dane kształtują naszą rzeczywistość. Są wskaźnikiem zmiany, motywatorem, który pokazuje, że to co robimy ma sens.

Sztuczna inteligencja, machine learning, IoT – to tylko niektóre z technologii, które mają wpływ na błyskawiczny przyrost danych i na zaawansowaną analitykę. Jakie innowacje i technologie będą najważniejsze w najbliższych latach?

Na pewno dalszy rozwój innowacji, o których teraz dużo się mówi, a wciąż nie wykorzystuje ich potencjału. Mam tu na myśli przede wszystkim sztuczną inteligencję – obszar, w który bardzo dużo się teraz inwestuje i w ciągu najbliższych lat powinien on zapewnić realny zwrot z inwestycji w postaci konkretnych rozwiązań. Ponadto Internet Rzeczy, szczególnie w kontekście tworzenia tzw. smart places – inteligentnych domów, biur czy nawet miast pełnych autonomicznych samochodów (choć to raczej w dalszej przyszłości).

W obliczu panującej pandemii, przewiduje się też wykorzystanie w większym stopniu analizy danych w medycynie. Odpowiednio zaimplementowane techniki uczenia maszynowego, mogą wspomagać lekarzy w stawianiu diagnoz i dopasowywaniu leczenia, oszczędzając zarówno czas ich, jak i pacjentów. Dziś, gdy teleporada stanowi najbezpieczniejszą formę kontaktu ze służbą zdrowia, na podstawie analizy tysięcy przypadków objawów występujących u pacjentów i stwierdzonych u nich chorób, możliwe jest sugerowanie lekarzom możliwych wniosków, chorób współistniejących – ale oczywiście nadal leczy nas lekarz. Pozwoli to jednak na chociaż częściowe odciążenie służby zdrowia.

Kolejnym rozwojowym obszarem jest przetwarzanie języka naturalnego i doskonalenie bazujących na nim chatbotów i asystentów głosowych. Choć na razie te rozwiązania pozostawiają wiele do życzenia, wraz z upływem czasu i dostateczną ilością prób i błędów, „nauczą się” coraz lepiej odpowiadać na potrzeby użytkowników. W przyszłości jeszcze więcej firm będzie opierało obsługę klienta właśnie na pracy chatbotów i asystentów.

Zwróciłabym uwagę również na technologię AR i VR. W najbliższych latach możemy spodziewać się coraz szerszego zastosowania tych rozwiązań nie tylko w grach, ale w medycynie, turystyce i e-commerce. Te zmiany już się dzieją - dzięki wprowadzeniu przez Mapy Google LiveView, funkcji wykorzystującej rozszerzoną rzeczywistość w celu lepszej nawigacji, możemy łatwiej i szybciej trafić pod wybrany adres w dowolnym miejscu na świecie.

W aplikacji Google Translate możemy np. będąc na zagranicznych wakacjach tłumaczyć znaki, komunikaty czy menu restauracji za pomocą zwykłej kamery w smartfonie. A skoro większość z nas skupia się dziś raczej na remontach niż podróżach – warto zwrócić uwagę na aplikację sklepu Ikea, która pozwala zwizualizować mebel widziany w sklepie w naszym mieszkaniu (wykorzystując jedynie zdjęcie pokoju).

Rynek technologii rozwija się bardzo dynamicznie, warto na bieżąco obserwować nowe rozwiązania, szczególnie te dostarczane przez małe firmy i start-upy, które starają się czynić nasze życie przyjemniejszym, prostszym i bardziej efektywnym. Bo właśnie w ten sposób rynek weryfikuje wszystkie innowacyjne pomysły. Tak więc wszyscy wspólnie pracujemy na rzecz świata w wersji smart – lepszego dla ludzi i środowiska. Nie robią tego jedynie entuzjaści zmian, ale również ci, którzy z tych zmian decydują się korzystać lub nie. I dlatego to w głównej mierze od nas samych zależy, jak technologia będzie wpływać na nasze życie.

Na wszystkie te tematy będziemy rozmawiać podczas międzynarodowej wirtualnej konferencji Beyond Tomorrow, którą SAS organizuje w dniach 23-25 listopada 2020. Serdecznie zapraszam do udziału, szczególnie w Data Science Day, którego program przygotowaliśmy dla wszystkich, którzy na co dzień pracują z danymi lub chcieliby w tym kierunku rozwijać swoją karierę. Udział w wydarzeniu jest bezpłatny.

www.sas.com/cemea/beyondtomorrow