Internet Rzeczy pełen fałszywek

Firmy próbujące korzystać z Internetu Rzeczy zbierają tony danych i mogą je analizować na wiele sposób. Co jednak, jeśli te dane są błędne, choćby z trywialnego powodu – brudu na czujnikach?

Zautomatyzowana sadzarka firmy John Deere wyposażona w zestaw czujników IoT do kontroli wysiewu nasion. Źródło: John Deere.

Błędne dane to powszechne zjawisko w IoT (Internet of Things), ale trudno ocenić, jaki faktycznie stanowią odsetek. Wielu ekspertów pracuje nad tym problemem. Niektórzy sądzą, że aż 40% danych zbieranych przez czujniki nie nadaje się do użycia. Często nie chodzi o to, że są błędne, ale nieprzydatne, np. zduplikowane informacje, które ktoś przez przypadek dwukrotnie załadował do systemu czy powtarzające się komunikaty, które urządzenia znajdujące się w spoczynku przesyłają automatycznie w regularnych odstępach. Dodatkowo, budowanie nowych platform IoT na starych, przemysłowych systemach powoduje dodatkowe problemy, ponieważ te stare narzędzia przesyłają dane we własnych formatach, które wymagają konwersji.

Błędne pomiary

Czasem dzieje się również tak, że urządzenia generują fałszywe dane. Przykładowo, jeśli mamy do czynienia z rozwiązaniem IoT wykorzystywanym w rolnictwie, może wystarczyć robaczek maszerujący po czujniku, żeby zakłócić odczyty. Jeśli czujnik pokryje się błotem czy pyłem w fabryce lub zostanie mechanicznie uszkodzony, może to wpłynąć na przesyłane przez niego dane.

Zobacz również:

SeMaFOR – Forum Bezpieczeństwa i Audytu IT

Więcej na temat zagadnień związanych z cyberbezpieczeństwem będzie można dowiedzieć się na dziesiątej, jubileuszowej edycji konferencji SeMaFOR – Forum Bezpieczeństwa i Audytu IT.

Im trudniejsze warunki panujące w otoczeniu i trudniejszy dostęp do urządzenia (duża odległość, ukształtowanie terenu), tym możliwe większe problemy ze zbieraniem poprawnych danych. Obok rolnictwa, takie gałęzie przemysłu, jak gazownictwo, górnictwo czy dystrybucja energii są szczególnie narażone na to zjawisko. Jednak nie tylko zanieczyszczone czy uszkodzone czujniki generują błędne dane. Nawet w szpitalu urządzenie mierzące poziomu tlenu we krwi może dokonywać błędnych pomiarów, jeśli zostanie źle przymocowane do palce pacjenta. Do tego dochodzą awarie urządzeń czy ich błędna konfiguracja (błędy ludzkie).

Jednym ze sposobów na ograniczenie odsetka błędnych danych jest monitorowanie, czy urządzenie działa poprawnie. Firma John Deere wyposaża swoje maszyny rolnicze w liczne czujniki sprawdzające poprawność funkcjonowania. Poza tym co roku czujniki są ręcznie kalibrowane, aby zweryfikować ich dokładność.

Im więcej tym lepiej

Wiele czujników jest montowanych w trudnych dostępnych miejscach, więc ich regularna kalibracja i konserwacja jest niemożliwa. W takich sytuacjach rozwiązaniem problemu bywa redundancja. Duplikowanie czujników powoduje zbieranie większej ilości danych, co samo w sobie może być pomocne. Serwis Weather Underground należący do IBM Weather Company generuje raporty częściowo na podstawie danych pochodzących z nieskalibrowanych, tanich czujników montowanych w przydomowych ogródkach. Za stosunkowo nieduże pieniądze Weather Underground uzyskuje dostęp do dużej liczby nowych punktów zbierania danych, mimo że ich jakość pozostaje dużym wyzwaniem. Jeśli jednak czujniki są w wystarczającym zagęszczeniu, można matematycznie wykryć te czujniki, które przysyłają błędne dane.

Można również stosować różne metody monitorowania czujników, np. kamery do sprawdzania, w jakim stanie są sensory. Kamera wideo w połączeniu z oprogramowaniem do analizy obrazu może wykryć czy pracujące w terenie urządzenie jest zabrudzone, uległo awarii czy też zostało przez kogoś uszkodzone. Do tego celu można nawet wykorzystywać już istniejące systemy monitoring wideo.

Jedną z technik weryfikacji danych z różnych rodzajów czujników jest tzw. fuzja sensorów. Porównuje ona dane z dwóch lub większej liczby czujników, aby rozpoznać, które są błędne. Ta metoda jest obecnie wdrażana w szpitalach, gdzie fałszywe alarmy są powszechne. Przykładowo, zamiast za każdym razem wyłączać alarm, gdy przyjdzie błędne wezwanie, system wykorzystujący fuzję sensorów może najpierw porównywać odczyty z różnych czujników, np. respiratora czy pomiaru rytmu serca.

Nieistniejący czujnik

Dane archiwalne mogą być dobrym materiałem do weryfikacji czy estymowania wyników. Ciekawym przykładem są testy silników przeprowadzane przez GE. Przed wypuszczeniem silnika z fabryki mierzy się, m.in. temperaturę gazów spalinowych, która odzwierciedla wydajność silnika.

Jeden z czujników jest umieszczany bezpośrednio w rurze wydechowej, w której spala się po kilku minutach. W tym czasie inne czujniki, umieszczone w bezpiecznym miejscu wokół silnika również zbierają dane. Następnie dzięki porównaniu zebranych w ten sposób danych można po zniszczeniu czujnika nadal odtwarzać dane, które by przesyłał, jedynie na podstawie odczytów z pozostałych czujników.

Problem jakości danych można rozwiązać właśnie poprzez wyciąganie wniosków z wielu strumieni danych, kwestią jest opracowanie mechanizmów uczenia maszynowego, które się tym zajmą. Właśnie w tym obszarze jest ocenie prowadzonych wiele prac badawczych.

Przykładowo, IBM wykorzystuje platformę analityczną Watson to zrozumienia, jak zużywany jest prąd w budynkach firmy w Irlandii. Watson potrafi nie tylko rozpoznać tak proste rozbieżność, jak informacja o wyłączeniu urządzenia w sytuacji, gdy pobiera ono tyle energii jak w normalnym trybie pracy. Z upływem czasu system nauczy się, jak wygląda wzorzec poboru energii danego urządzenia w trakcie jego pracy, co umożliwi wykrycie różnych nietypowych sytuacji, np. awarii czy błędnej konfiguracji. Minusem uczenia maszynowego jest fakt, że musi upłynąć sporo czasu, zanim zacznie skutecznie. W przypadku innych metod, jak dodatkowe czujniki czy kamery, efekty są natychmiastowe.


TOP 200