Na straży jakości danych

Ale pozostawmy spory i sytuacje ekstremalne na boku. Wystarczy utwierdzić się w przekonaniu, że nawet w bazie adresowej zawierającej 20 tys. wpisów, głównie z regionu śląskiego, tak prosta nazwa jak "Gliwice" pojawiać się zwykła w niezwykłych wręcz mutacjach: Gliwce, Gliiwce, Glieice, Glwice. O zachowaniu zasad wielkości liter w nazwach własnych lepiej już nie wspominać. Cóż się dziwić, skoro nawet właściciele danych osobowych nie potrafią poprawnie "wklepać" swojego imienia, stąd na przykład Aleksandra jawi się także jako: Aleksadra, Aleksanra czy Aleksnadra. Śmieszne literówki czasami rzeczywiście są trudno zauważalne przy pobieżnym przeglądzie. Niektóre wyrazy są szczególnie podatne na zamianę kolejności liter. Na poparcie tej tezy wystarczy przeszukać Internet na obecność słowa "inforamtyk". To nie jest niczyja wina, to jest określona podatność na zniekształcenia pisowni, statystycznie obserwowalna. Prawdopodobnie, przy wprowadzaniu nazwisk także zdarzają się literówki, ale tutaj nieco trudniej o weryfikację. W końcu o tym, czy ktoś nazywa się Morda czy Mordka, wie tylko on sam.

Pośpiech i nieuwaga

Przytoczone tu przykłady błędów nie wynikają z niewiedzy, ale z nieuwagi, pośpiechu, niestaranności. Część z nich można w jakiś sposób korygować automatycznie, konstruując stosowne algorytmy walidujące, jednak nie należy zapominać o tym, że informacja tekstowa jest trudna w tego rodzaju obróbce i czasami efekt końcowy jest, pomimo starań programistów, dosyć opłakany. Czasami zamiast wysilać się na budowanie mechanizmów kontrolujących jakość wprowadzanych danych, warto zrzucić na użytkownika odpowiedzialność za podawane informacje, zwłaszcza za te, których jest on właścicielem.

Ciekawe, że na ręcznie wypełnianych formularzach obserwuje się większą staranność niż na tych komputerowych. Czyżby w niektórych przypadkach górę brała podświadoma wiara w to, że w komputerze w razie błędu zawsze można wszystko skorygować bez ponownego przepisywania? Rzeczywiście, w tej klasie danych pomyłki nie mają aż tak wielkiego znaczenia, gdyż dane te nie stanowią wartości wejściowych dla dalszych obliczeń. Co najwyżej komuś wydrukuje się jakieś zaświadczenie z błędem lub nie dotrze przesyłka z zakupionym w sklepie internetowym towarem. Jednak oprócz klienta, zazwyczaj zainteresowana poprawną rejestracją danych jest także druga strona - właściciel serwisu. Stąd powinien dołożyć on wszelkich starań, aby rejestrując dane, mieć wpływ na zmniejszenie stopy błędów. Jedną z metod są właśnie mechanizmy kontrolujące jakość danych wejściowych.


TOP 200