Przekleństwo Excela

Podobno przed wojną według odjeżdżających pociągów można było ustawiać zegarki. Stwierdzenie to używane jest nader często do ilustracji popularnej tezy, że lepiej już było. Ja jednak widzę w nim historyczne świadectwo niedoskonałości przedwojennych zegarków.

Podobno przed wojną według odjeżdżających pociągów można było ustawiać zegarki. Stwierdzenie to używane jest nader często do ilustracji popularnej tezy, że lepiej już było. Ja jednak widzę w nim historyczne świadectwo niedoskonałości przedwojennych zegarków.

Żadnego z posiadanych przeze mnie kilkudziesięciu zegarków (wliczam w to wszystkie telefony komórkowe, zestaw DVD, kuchenkę, itd.) nie ustawiam częściej niż raz do roku - bo po prostu dokładnie odmierzają czas. Przed wojną jednakże przejeżdżający przez wieś pociąg spełniał taką rolę, jak dziś zegar atomowy we Frankfurcie nad Menem czy internetowe serwery synchronizacji czasu - dawał zewnętrzny i obiektywny punkt odniesienia dla lokalnych, niedoskonałych urządzeń pomiarowych.

Ogromne nasycenie elektronicznymi urządzeniami przyczynia się do coraz większej atencji, jaką darzymy liczby. Jednym z epokowych, permanentnie niedocenianych wynalazków informatyki jest arkusz kalkulacyjny. Zakładam się, że większość analiz jest dzisiaj wykonywana w arkuszach Excela. Co za tym idzie, większość decyzji zarządczych podejmowana jest w milczącym przeświadczeniu, że modele i algorytmy Microsoftu składające się na to narzędzie działają prawidłowo.

A może wcale nie? Ludzie - a to oni piszą algorytmy - są wszak omylni, więc może z Excelem jest tak jak z przedwojennymi zegarkami? Dopóki Microsoft nie ujawni kodu źródłowego (a nic nie zapowiada, żeby to zrobił) pozostaje nam zaufanie. Nadszarpnięte mocno, dodajmy, niedostateczną starannością wykonania systemów operacyjnych oraz przeglądarki internetowej, o czym napisano dostatecznie dużo bym miał się tutaj powtarzać.

Martwi mnie jednak nie postawa Microsoftu (każdemu wolno sprzedawać produkty, które ludzie chcą kupować), a niepokojący trend: wzrastającej liczbie użytkowników narzędzi obliczeniowych towarzyszy coraz mniejsze zrozumienie skąd się dane liczby biorą i co nam mówią.

Weźmy taki wynalazek jak średnia arytmetyczna. Prostą formułą możemy obliczyć tę wielkość z zadanego zakresu danych wejściowych. Jeżeli zapytać menedżerów "co mówi nam średnia", powiedzą pewnie "jak dana rzeczy wygląda w ogólności". Tymaczasem każdy świadomy użytkownik statystyki powie, że średnia nie powinna być używana przy dużym rozrzucie próbki, jej małej liczności albo wyraźnym grupowaniu wyników. Chcę nieśmiało zauważyć, że "w ogólności" ludzie mają po jednym jajniku i jednym jądrze. Powtórzcie to menedżerom!

Konsekwencje nieświadomego używania średniej w zarządzaniu mogą być bardzo poważne. Np. województwo mazowieckie prawdopodobnie nie dostanie nic a nic z europejskich funduszy regionalnych, bo... jest za bogate. Każdy, kto odrobinę jeździ po Polsce wie, że to jedynie Warszawa i jej przysiółki są bogate, a w odległości 50 km od miasta bieda aż piszczy i parę euro strukturalnej pomocy przydałoby się bardziej niż bardzo. I zamiast po prostu poprawić idiotyczne modele obliczeniowe pisane przez niedouczonych użytkowników Excela, aktualnie rozważa się dopasowanie rzeczywistości do modelu, tj. wyodrębnienie stolicy jako osobnego, 17-tego województwa. Twórca algebry, Al-Dżebrah al-Chorezmi, przewraca się w grobie.

Podobnie dzieje się w przedsiębiorstwach, choć tam liczbowa hucpa odbywa się na koszt właścicieli, a nie podatników. Apeluję więc dziś z tego miejsca do wszystkich informatyków: jeśli nie chcecie żyć w świecie rządzonym przez absurdalne decyzje, to zanim zbudujecie jakiklowiek model obliczeniowy, dokładnie dowiedzcie się z jakich danych i do jakich decyzji będzie on używany.


TOP 200