Dane pewne, spójne, prawdziwe

Zasób strategiczny

Na jakość danych wpływa szereg czynników, począwszy od sposobu ich gromadzenia, przez projekt bazy danych i mechanizmy ładowania danych oraz sposób działania aplikacji biznesowych, aż po szereg czynników organizacyjno-biznesowych. Nie bez znaczenia są przyzwyczajenia pracowników, zakorzenione w firmie uproszczenia procesów biznesowych oraz procesy konsolidacyjne czy migracje danych.

Z analiz Data Warehousing Institute wynika, że w trzech na cztery przypadki niska jakość danych jest wynikiem błędów popełnianych przez pracowników. Wobec tego optymalizacji w zakresie procesów zarządzania jakością danych należy szukać już na etapie ich gromadzenia i ładowania do środowiska bazodanowego.

Mechanizmy kontroli jakości informacji powinny być też wykorzystywane w samej bazie danych. "Wiele systemów nie implementuje weryfikacji na poziomie bazy danych - robi to dopiero na poziomie aplikacji, a przecież dane czasem przychodzą spoza niej. Pokutują tu pewne mity - że taka weryfikacja znacznie pogorszy wydajność albo że trudniej będzie przenieść środowisko na inną bazę danych" - mówi Michał Kuratczyk, konsultant w Dziale Integracji Danych Oracle EMEA. Tego typu podejście ma pozwolić na poprawę jakości informacji niezależnie od stosowanych później aplikacji biznesowych. Jednak także w obrębie systemów transakcyjnych i rozwiązań analitycznych winny znaleźć się mechanizmy weryfikacji poprawności i zgodności ze schematem danych - oprogramowanie powinno uniemożliwiać wstawienie niepoprawnych wartości.

Zapewnieniu spójności i wysokiej jakości danych sprzyja standaryzacja danych i budowa scentralizowanej hurtowni bądź repozytorium. Wymaga to jednak ustandaryzowania procesów biznesowych oraz jednolitego podejścia do tych samych informacji. "Często różne działy tej samej organizacji zbierają dane i na własne potrzeby zapisują je w odmienny sposób. Brak standardu i wspólnego repozytorium skutecznie utrudnia efektywne działanie, zwłaszcza w bardziej rozwiniętych organizacjach" - dodaje Olgierd Kobyliński.

Takie działanie powoduje powstawanie różniących się zakresem duplikatów danych, a w efekcie skutkuje niespójnością informacji w kolejnych etapach procesów biznesowych. "Może się okazać, że w hurtowni mamy kilka rekordów opisujących tego samego klienta w nieco inny sposób.


TOP 200