Zmora integratora

Jeżeli jest rzecz w informatyce, z której się bardzo, bardzo cieszę, to z uwagi poświęcanej szeroko pojętej jakości. Można powiedzieć wręcz, że jakość stała się jednym z najczęściej pojawiających się tematów na konferencjach, w publikacjach, a także w dyskusjach. Wszyscy na gwałt uczą się terminów, takich jak ISO, ITIL, CMM, MTBF, SLA itd. Dziś już nie wystarczy klientowi dostarczyć produkt, który zamówił - produkt musi być odpowiedniej jakości, najlepiej wymierzonej konkretnymi parametrami.

Jeżeli jest rzecz w informatyce, z której się bardzo, bardzo cieszę, to z uwagi poświęcanej szeroko pojętej jakości. Można powiedzieć wręcz, że jakość stała się jednym z najczęściej pojawiających się tematów na konferencjach, w publikacjach, a także w dyskusjach. Wszyscy na gwałt uczą się terminów, takich jak ISO, ITIL, CMM, MTBF, SLA itd. Dziś już nie wystarczy klientowi dostarczyć produkt, który zamówił - produkt musi być odpowiedniej jakości, najlepiej wymierzonej konkretnymi parametrami.

O jednym aspekcie jakości mówi się trochę za mało. Myślę o jakości danych gromadzonych w systemach informatycznych. Aby w pełni zrozumieć, w jakiej sytuacji jesteśmy teraz, musimy cofnąć się o lat ok. 10, kiedy na dobre zaczęła się informatyzacja podstawowych dziedzin działalności przedsiębiorstw. Wtedy to firmy wdrażały pierwsze kompleksowe systemy informatyczne - obsługujące sprzedaż, zamówienia, księgowość. Potem obejmowały stopniowo kolejne obszary - obieg dokumentów, płatności i wreszcie kontakty z klientami.

Dopóki systemy wzrastały "przez pączkowanie", tj. do istniejącego systemu dobudowywano kolejne klocki, a informatycy, którzy to robili, mieli łeb na karku - problemu jakości danych nie było. W pewnym momencie jednak nieomal każde przedsiębiorstwo dochodziło do poziomu integracji, w którym następowało połączenie dwóch zbiorów danych opisujących ten sam przedmiot, tylko w różny sposób. Na przykład w systemie sprzedażowym oraz księgowym występują dane klienta. Niestety ich zakres jest nieco różny, szczegółowość opisu poszczególnych pól jest inna, zaś poziomy normalizacji nie mają ze sobą nic wspólnego.

Weźmy hipotetyczną firmę, której nazwa wpisana w rejestrze przedsiębiorców brzmi: "Enter" Handel Częściami Komputerowymi sp. z o.o. Idę o zakład, że zapisana przez trzy różne osoby w trzech różnych systemach będzie wyglądała zupełnie inaczej: będzie np. raz: Enter sp. z o.o., innym razem "ENTER" Handel Częściami Komputerowymi, a jeszcze kiedy indziej ENTER Hand. Częściami Komp. sp. z o.o. Oczywiście są identyfikatory, takie jak np. NIP, REGON czy numer KRS, ale nasze państwo skrzętnie zadbało, by były one bezużyteczne w dużych zbiorach danych - np. przedsiębiorca niebędący płatnikiem VAT nie będzie miał NIP-u, zaś numeru KRS nie posiadają osoby fizyczne.

Problem jakości danych pojawia się najpóźniej wtedy, kiedy następuje migracja z jednego systemu do innego albo wdrożenie narzędzia analitycznego. W tym ostatnim przypadku jest on szczególnie niebezpieczny: jeżeli firma założyła, że wdrożenie jakiegoś narzędzia analitycznego pozwoli jej na lepsze podejmowanie decyzji zarządczych, zaś jakość zgromadzonych danych jest niedostateczna, to ryzykuje nieświadome podejmowanie błędnych decyzji. Posiadanie złych danych zarządczych jest znacznie groźniejsze niż nieposiadanie żadnych. Jeżeli ktoś dojdzie do wniosku, że "Enter sp. z o.o." to dobry klient, któremu należy udzielić kredytu kupieckiego, a "ENTER Handel Częściami Komputerów." ma cztery niezapłacone faktury, to kłopoty są murowane.

To, co dla jednych jest kłopotem, dla innych jest szansą. Namnożyło się firm oferujących narzędzia lub usługi nazywane data quality, data integrity, data improvment itd. Radzę poszukać w Internecie - wygląda to na niezły biznes, co powinno nam dać do myślenia.

Mam więc dwie wiadomości: dobrą i złą. Aby móc skorzystać w pełni ze zintegrowanych systemów, do kosztu integracji trzeba zawsze dodać koszt poprawienia jakości gromadzonych danych. I niech każdy sam zdecyduje, czy informacja ta jest dla niego akurat korzystna czy nie.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200