Na straży wejścia

Powszechnie stosowane mechanizmy automatycznej weryfikacji danych niosą z jednej strony pomoc, a z drugiej tłumią tempo wprowadzania danych. Ich stosowanie powinno zależeć od tego, dla jakiego użytkownika i dla jakiego rodzaju oprogramowania są dedykowane.

Na straży wejścia
Niesforne skróty

W projekcie oprogramowania służącego do ewidencji kursów założyłem, że tytuł kursu będzie automatycznie formatowany tak, aby zawsze zaczynał się z wielkiej litery. Natomiast pozostałe litery algorytm zamieniał na małe - tak na wszelki wypadek, gdyby operator wprowadził coś nie po myśli założeń. W końcu jakiś porządek w danych opisowych także musi panować. Było to wygodne o tyle, że człowiek mógł pisać jak chciał, a program i tak sformatował zgodnie z przykazanym wzorcem. Użytkownicy cieszyli się, dopóki w tematach kursów nie zaczęły pojawiać się skróty w rodzaju: UE, B2B, PR, ZOZ. Trzeba przyznać, że temat zapisany jako "Fundusze ue" wygląda trochę dziwnie. W związku z tym zdjęto tę część algorytmu, który narzucał zamianę na litery małe (początkowo myślałem jeszcze o ratowaniu "wiekopomnego" algorytmu i wprowadzeniu bramki przepuszczającej bez zmian krótkie wyrazy, ale poległem przy skrócie UNESCO). Tak więc program przestał wreszcie dogadzać użytkownikom na siłę, z czego się też cieszyli, jakby nie zrażając się tym, że w związku z brakiem automatycznej korekty trzeba liczyć się z zaistnieniem wpisów "Fundusze uE", "FunduszE UE" itd.

Automatyczna kontrola danych wejściowych stanowi istotnie wspomagający czynnik w batalii o jakość danych. Wiele systemów nie mogłoby poprawnie funkcjonować, gdyby z ich formularzami nie były połączone funkcje sprawdzające co, gdzie i jak zostało wprowadzone. Ten pierwszy element filtracji treści jest tym istotniejszy, im większe znaczenie mają dane.

Truizmem będzie twierdzenie, że ze względu na stopień złożoności znacznie łatwiej takiej algorytmicznej obróbce poddają się dane liczbowe niż teksty. Zauważmy jednak, że ze względu na format, dane liczbowe rzeczywiście poddają się lepiej standaryzacji niż tekst, natomiast co do zakresu wartości nie ma zwycięzcy w tej kategorii. Uwarunkowania dla danych numerycznych mogą być tak złożone i niejednorodne, że przy nich dziecinnie łatwe okazuje się kontrolowanie zawartości niektórych pól tekstowych.

Powszechnie stosowane mechanizmy automatycznej weryfikacji danych, działające w trybie bezpośrednim, niosą z jednej strony pomoc, a z drugiej tłumią tempo procesu wprowadzania. Ich zastosowanie zależy bardzo od tego, dla jakiego użytkownika i dla jakiego rodzaju oprogramowania są dedykowane. Dbałość o jakość pozyskiwanych danych warto wykazywać wówczas, gdy zbierane informacje mają istotny charakter dla budowania zbioru informacyjnego bądź biorą udział w dalszym przetwarzaniu. Metody kontroli tej jakości bywają różne: od osobistego wglądu i podpisania akceptacji zgodności z sytuacją rzeczywistą, po mechanizmy stricte ograniczające automatycznie "fantazję" użytkownika.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200