Nieosiągalny ideał i smutna rzeczywistość

Pierwszym krokiem na drodze minimalizacji błędów w danych jest monitorowanie ich jakości, kolejnym podnoszenie jej poprzez opracowanie i wdrożenie odpowiednich procedur organizacyjnych i technicznych.

Pierwszym krokiem na drodze minimalizacji błędów w danych jest monitorowanie ich jakości, kolejnym podnoszenie jej poprzez opracowanie i wdrożenie odpowiednich procedur organizacyjnych i technicznych.

Czy błędne dane, przechowywane w systemie informatycznym, utrudniają prowadzenie bieżącej działalności? Odpowiedź może wydać się zaskakująca - nie utrudniają. Błędne informacje o transakcji sprzed kilku miesięcy nie mają wpływu na realizowaną (rejestrowaną) w dniu dzisiejszym transakcję z innym klientem i w innym oddziale. Trudności pojawiają się wtedy gdy na podstawie posiadanych danych musimy odpowiedzieć na pytanie, dotyczące firmy jako całości. Wtedy dotarcie do źródeł błędu i jego korekta są zazwyczaj trudne i czasochłonne.

Błędy nieumyślne

Często występującym zjawiskiem jest nieprecyzyjne określenie formatu, w jakim dane mają być wprowadzone w poszczególne pola formularza. Dane wprowadzane do bazy nie są wtedy jednorodne, a przez to nie jest łatwe ich porównywanie lub chociażby policzenie wg poszczególnych pozycji, np. osób, firm czy produktów. Dla przykładu, wpisanie do bazy danych Jana Kowalskiego jako:

Jan Kowalski

Kowalski Jan

J. Kowalski

Jan Kowalski (Lublin)

jest rozumiane przez system komputerowy jako opis czterech, nie zaś jednej osoby. Podobnie dowolne wpisywanie nazw firm prowadzi często do sytuacji, w której nie sposób określić, jakie informacje dotyczą tej samej, a które różnych firm. Przykładowo, opisanie Zakładu Produkcji Koszul ,Igła' może wprowadzić sporo zamieszania:

Zakład Produkcji Koszul Igła

Zakład Produkcji Koszul ,Igła' SA

ZPK Igła

Igła

IGŁA

Igła SA

ZPK Igła SA

ZPK Igla SA

Powyższe nazwy opisują w rzeczywistości tę samą firmę, ale dla systemu komputerowego stwierdzenie, że tak jest w istocie, w praktyce nie jest możliwe bez wykonania dodatkowej pracy.

Do masowego wprowadzania danych z reguły zatrudnia się nisko opłacane i niewykwalifikowane osoby. Nie są one związane z problemami jakości wpisywanych danych, gdyż są pracownikami spoza firmy i wykonywana praca ma charakter dorywczy. Dla pracowników wprowadzających masowe dane najistotniejsza jest maksymalizacja liczby wpisanych danych w zadanym czasie, co przekłada się na wysokość honorarium. Wszelka odpowiedzialność za poprawność wprowadzanych danych leży po stronie koordynatora zbierającego dane od poszczególnych zespołów i zapewniającego kontrolę zawartości. Kontrola taka ma charakter ręczny, gdyż porównywana jest zawartość baz z formularzami papierowymi, wypisywanymi odręcznie. Zazwyczaj jest też przepro-wadzana wyrywkowo. Sytuacja ta staje się szeroko otwartą bramą dla błędnego wprowadzania danych.

W dynamicznie rozwijających się firmach nacisk na "porządki" kładzie się dopiero w momencie, gdy pozycja na rynku usta- bilizuje się i wzrost nie jest warunkiem przetrwania. Dokonuje się wtedy oglądu wew-nętrznego i często odkrywa się spory bałagan. Pozornie błaha rzecz, jaką jest ustalenie definicji używanych pojęć w skali firmy, prowadzi do nieoczekiwanych efektów. Dobrym przykładem może tu być liczba agentów, która jest trudna do uchwycenia właśnie z tego powodu. Dla działu sprzedaży agentem jest osoba, która sprzedaje nie mniej niż dwie umowy (ubezpieczeniowe, kredytowe itp.) miesięcznie, dla działu kadr każda osoba, która ma podpisaną umowę o współpracy. Podobnie wartość sprzedaży nie jest łatwa do określenia, chociaż wydawałoby się, że jest to arytmetyczna suma kwot wpłaconych przez klientów z tytułu zawarcia umowy. Ale i w tym przypadku wiele zależy od sposobu zliczania, który może być i jest różny dla różnych działów (marketing będzie uwzględniał wszystkie umowy, aby zmaksymalizować wykazywaną sprzedaż, księgowość - tylko umowy, za które odnotowano płatność itd.).

W jednej z polskich firm zaistniała sytuacja, w której do raportu przeznaczonego dla zarządu spośród wszystkich dostępnych liczb na dany temat wybierana była... najwyższa, bez sprawdzenia dlaczego liczby opisujące ten sam wynik różnią się i która z nich jest prawdziwa. Podejście niewątpliwie praktyczne, ale z taką taktyką wiąże się ryzyko podjęcia błędnej decyzji, na przykład inwestycji w linię produktów, która w rzeczywistości jest nierentowna.

Błędy umyślne

Dane wpisywane do aplikacji mogą być obarczone błędami mechanicznymi, co jest zjawiskiem trudnym do uniknięcia. Okazuje się jednak, że mogą być również zniekształcone umyślnie. Przykład: w danych dostarczanych przez jeden z zespołów przeważająca liczba klientów (ponad 90%) należała do pierwszej z około dziesięciu możliwych grup przyporządkowania. W danych dostarczanych przez pozostałe zespoły rozkład był mniej więcej równomierny. Po dokładnej kontroli okazało się, że wpisane do bazy danych kody grup są niezgodne z kodami na arkuszach, na których były wpisane odręcznie wraz z pozostałymi informacjami o kliencie. Powód okazał się banalny - wybranie pierwszej pozycji z listy dostępnych grup było dużo szybsze, niż wyszukanie na liście pozycji odpowiadającej wartości z arkusza. Dopiero podczas agregacji danych zwrócono uwagę na bardzo dużą liczbę klientów z pierwszej grupy. Zjawisko to dotyczyło okresu, w którym z powodu krótkich terminów czasowo zatrudniano dodatkowy zespół wprowadzający dane.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200