Włóczęga za systemem

Jakość danych po konwersji zależy od czasu i wysiłku, jaki włożyło się w analizę znaczenia danych źródłowych oraz ich wzajemnych zależności. Wleczenie danych za systemem ma sens, jeśli poznamy rzeczywistą naturę danych i będziemy w stanie zapewnić właściwe algorytmy przetwarzające także dla oldtimerów. W nowym systemie mogą pojawić się odmienne reguły, nie przystające nie tylko do struktury danych, ale do niegdysiejszej logiki reguł biznesowych, co jest powodem braku pojęciowej przekładni i wymienialności, gdyż oba systemy mówią innym językiem. Jeśli chcemy z danych uczynić "evergreeny", to trzeba zaiste włożyć wiele czasu w ich zasiedlenie w nowym systemie, czasami nawet znacznie rozszerzając sferę usług aplikacji o "łaskawe" traktowanie danych z brodą.

Zmiana zasad kodyfikacji

Utrudnienia powstałe w wyniku migracji danych do innego systemu przetwarzania są często skutkiem nieco odmiennej logiki zastosowanej w nowym systemie, co dotyczy zwłaszcza sposobów kodowania słownikowego, czyli przypisywania wartościom liczbowych lub znakowym wartości znaczeniowych. Nie zawsze utrata odwzorowania wynika z niedbałości czy niedostatecznej analizy przypadku. Często jest ona skutkiem technicznej niemożności takiej transformacji.

Wskutek konwersji systemów, zmiana zasad kodyfikacji danych zwykle rozgrywa się według jednego ze scenariuszy:

- Odwzorowanie jeden do jednego - stare kody otrzymują nowe brzmienie, ale nie ulega zmianie zakres wartości, którym są przypisane, co daje możliwość algorytmicznego podstawienia nowych wartości kodów

- Wzbogacenie - oprócz dotychczasowych wartości kodów pojawiają się dodatkowo nowe, które znaczeniowo nie kolidują z dotychczas stosowanymi; traktowane są opcjonalnie i są równoprawne z dotychczas stosowanymi

- Poszerzenie znaczeniowe - jeden kod grupuje większą ilość znaczeń niż do tej pory, co powoduje redukcję informacji słownikowej i grupowanie jest możliwe do przeprowadzenia na drodze algorytmicznej

- Zawężenie znaczeniowe - kody ulegają rozbudowaniu ze względu na zwiększenie się szczegółowości reprezentowanej przez nie informacji; algorytmiczna zamiana jest zazwyczaj niemożliwa do przeprowadzenia, pozostaje więc tylko ręczna korekta.

- Brak odwzorowania - stare i nowe dane muszą ze względów trudności klasyfikacyjnej stanowić odrębne byty w nowym systemie, co wymusza konieczność stworzenia dodatkowych mechanizmów zapewniających w sposób sztuczny kompatybilność wsteczną.

Nieprzystawalność danych

Nieprzystawalność danych przeniesionych do nowego systemu można sklasyfikować pod kątem miejsca, sposobu i czasu ich wpływu na błędny procesu przetwarzania.

Co do miejsca:

- Wpływ bezpośredni - aplikacja wykazuje błędne działanie, obserwowalne na poziomie interfejsu użytkownika. W tym przypadku zdecydowanie łatwiejsza jest identyfikacja przyczyn, między innymi dlatego, że skutki są lepiej kojarzone z przyczynami.

- Wpływ oddalony - błędy pojawiają się nie w macierzystej aplikacji, ale w systemach współpracujących powiązanych przez interfejsy danych, co powoduje, że znacznie trudniejsza staje się diagnostyka przyczyn. Czasami tego rodzaju błędy pozostają niezauważone przez systemy kooperujące, co w praktyce może generować zafałszowania wyników, które nigdy nie zostaną zidentyfikowane.

Co do sposobu:

- Wpływ jawny, kiedy wynikające z nieprzystających danych błędy są sygnalizowane w sposób czytelny stosownym komunikatem bądź powodują pojawienie się nieoczekiwanych lub nieinterpretowalnych rezultatów.

- Wpływ utajniony, gdy błędy danych w sposób niezauważalny na pierwszy rzut oka zmieniają wartość wyniku. Może to skutkować zafałszowaniem informacji w raportach, statystykach zbiorczych lub w innych algorytmach korzystających z tych danych.

Co do czasu:

- Wpływ natychmiastowy pojawia się wówczas, gdy aplikacja sięga po określone dane w sposób ustawiczny. Diagnostyka przyczyn jest o tyle ułatwiona, że nie rozmywa się w czasie odległym od momentu migracji.

- Wpływ opóźniony jest funkcją czasu i powstaje wtedy, gdy z partii danych korzysta się w sposób sporadyczny. Może on pojawić się na przykład dopiero przy sporządzaniu rocznego raportu lub nawet po jeszcze dłuższym okresie uzależnionym od doraźnej potrzeby. Tego rodzaju niespodzianki są o tyle niebezpieczne, że zazwyczaj zaskakują w najmniej oczekiwanym momencie, a poszukiwanie przyczyn często przypomina mało racjonalne śledztwo, w którym z tytułu długiego upływu czasu od momentu migracji, winy zaczyna się szukać zazwyczaj w nieodpowiednim miejscu.


TOP 200