Big Data nie zastępuje jakościowych danych

Olbrzymia ilość danych agregowanych i przetwarzanych w ramach projektów Big Data może uzupełnić wyniki rozmaitych badań, ale nie pozwala zrezygnować ze zbierania danych jakościowych - twierdzi Michele Goetz, wieloletni analityk Forrester Research.

Wśród osób zajmujących się Big Data wielokrotnie pojawia się opinia, że w przypadku zgromadzenia olbrzymiej ilości danych słabsza jakość części z nich nie jest zbyt dużym problemem. Ogromna ilość materiałów do analizy statystycznej ma zminimalizować wpływ kiepskiej partii danych na końcowe wyniki. Warto pamiętać jednak o tym, że działy IT wciąż muszą dbać o jak najlepszą jakość agregowanych danych.

Swoją opinię na ten temat wyraził jedna z badaczek Forrestera, Michele Goetz. Zauważa ona, że olbrzymia ilość danych jest w stanie nadrobić niepełne wyniki, ale i tak trzeba przywiązywać uwagę do zbierania jak najbardziej kompletnych danych. To ważne w marketingu, gdzie często dane o klientach są zbierane z różnych źródeł, a każdy z badanych konsumentów zostawia nieco inny zestaw informacji na swój temat.

Zobacz również:

  • Co firmy robią źle w kwestii transformacji danych
  • UE zamierza nakładać kary na big techy za tolerowanie fałszywych kont
  • Automatyzacja pozbawi pracy miliony osób. Kto jest zagrożony?

Okazuje się, że osoby i podmioty zainteresowane badaniami i analizami Big Data często są niepewne ich jakości. Z tego powodu wstrzymują decyzje o zatrudnieniu zewnętrznej firmy do wykonania takiej analizy i opóźniają wprowadzenie rozwiązań Big Data do swoich firm. A chociaż informatycy zapewniają, że nawet jeśli część zbiorów jest słabej jakości, ma to minimalny wpływ na wynik, marketerzy patrzą na to zupełnie inaczej.

Goetz w swoim poście na blogu Forrestera wymienia argumenty za tą tezą. Owszem, osoby zajmujące się analizą danych są w stanie wykryć i usunąć z bazy anomalie podczas analizy behawioralnej - ale osoby z działu IT zajmujące się samym pozyskiwaniem tych danych powinny dbać o ich maksymalną integralność. Bez tego algorytmy badawcze tworzą znacznie mniej powiązań, co negatywnie wpływa na miarodajność wyników.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200