Jakie błędy popełniają firmy wdrażając aplikacje bazujące na technologii maszynowego uczenia?

Technologia uczenia maszynowego (ML; Machine Learning) pozwala rozwiązywać wielu problemów, z którymi tradycyjne techniki analityczne nie są w stanie sobie poradzić. Pomimo tego biznes rzadko sięga po tę technologię. Firma SAS przeprowadziła badanie mające odpowiedzieć na pytanie, dlaczego tak się dzieje.

SAS wymienia pięć podstawowych błędów, które uniemożliwiają organizacjom wykorzystanie pełni potencjału uczenia maszynowego.

1. Jest to planowanie strategii machine learning bez wsparcia ekspertów. A można do zrobić według SAS poprzez zbudowanie relacji z uczelniami i wprowadzenie programu stażowego lub programu rekrutacji uniwersyteckiej, który będzie szansą na pozyskanie specjalistów.

Zobacz również:

2. Brak odpowiednich danych. Chodzi o to, że zanim zaczniemy myśleć o wdrożeniu rozwiązań z zakresu machine learning, powinniśmy przygotować, zintegrować i sprawdzić dane, którymi dysponujemy. Słabe jakościowo dane możemy wtedy podzielić na cztery grupy: tzw. zaszumione dane, czyli takie które zawierają dużą liczbę sprzecznych lub wprowadzających w błąd informacji; brudne dane, czyli takie które niosą za sobą liczne braki, zmienne kategoryczne o bardzo dużej liczbie możliwych wartości, a także niespójne i błędne wartości (np. wynikające z awarii urządzeń pomiarowych); rzadkie dane, które posiadają niewiele wartości zawierających faktyczne informacje; oraz niekompletne dane, które są niereprezentatywne.

3. Brak odpowiedniej infrastruktury. Uczenie maszynowe wiąże się z potrzebą przeprowadzania skomplikowanych obliczeń, co z kolei wymaga odpowiedniego sprzętu, m.in. dysków SSD. Infrastruktura wykorzystywana przez przedsiębiorstwo powinna być na tyle elastyczna, aby umożliwiała optymalne wykorzystanie mocy obliczeniowej oraz rozbudowę pamięci masowej.

4. Brak strategii wdrożenia. Wybór odpowiedniego momentu, w którym należy zastosować nowsze, bardziej kompleksowe metody analityczne stanowi duże wyzwanie dla każdej organizacji. Wykorzystanie uczenia maszynowego nie zawsze jest koniecznie. Wszystko zależy od tego, jakie jest aktualne zapotrzebowanie na usługi IT w danym biznesie.

5. Problemy z interpretacją modeli metodologicznych uczenia maszynowego. Istotą algorytmów uczenia maszynowego jest ich złożoność. Z jednej strony umożliwiają one przeprowadzanie samodzielnych analiz, ale z drugiej mogą być trudne do zrozumienia. Rozwiązaniem niektórych problemów z interpretacją może być zastosowanie strategii hybrydowej, połączenia tradycyjnych metod analitycznych i uczenia maszynowego.

Cały raport "5 machine learning mistakes – and how to avoid them" znajduje się tutaj.

Źródła: SAS, d*fusion communication.

https://www.sas.com/en_us/insights/articles/big-data/5-machine-learning-mistakes.html/