Integracja w pakiecie

Ascential Software łączy zestaw ETL, narzędzia do profilowania baz i oczyszczania danych w jednym uniwersalnym zestawie.

Ascential Software łączy zestaw ETL, narzędzia do profilowania baz i oczyszczania danych w jednym uniwersalnym zestawie.

Projektanci Ascential Software postawili sobie za cel rozwiązanie dwóch najtrudniejszych problemów, przed którymi stają zespoły informatyczne starające się opracować kompleksowy system zarządzania danymi w przedsiębiorstwie - jak połączyć wyniki pracy różnych, niekompatybilnych narzędzi i jak sprawnie i możliwie szybko przeprowadzić zadanie integracji danych. Na początku października br. na rynek trafił zestaw narzędzi Enterprise Integration Suite (EIS), który - zdaniem Ascential Software - ułatwi osiągnięcie tego celu.

Składniki zestawu

EIS składa się z trzech głównych produktów: MetaRecon 6.0 do profilowania istniejących baz danych i tworzenia struktury bazy docelowej, Integrity 6.0 do oceny jakości i oczyszczania danych oraz DataStage XE 6.0 - zestaw ETL (Extraction, Transformation, Loading) do pobierania danych z baz źródłowych, transformacji i ładowania ich do bazy docelowej.

Programy wchodzące w skład EIS korzystają z danych zawartych w relacyjnych bazach, aplikacjach biznesowych ERP i CRM, hurtowniach danych i innych źródłach. W trakcie pracy zestawu Ascential jest tworzone repozytorium metadanych, w którym przechowuje się wyniki analiz, schematy baz docelowych oraz skrypty ETL do pobierania, przekształcania i ładowania danych do bazy docelowej.

Profilowanie danych

Profilowanie danych to inwentaryzacja zasobów oraz ocena złożoności baz. Ascential MetaRecon wykonuje wieloetapową analizę danych ze wskazanych baz źródłowych i przedstawia jej wyniki w celu potwierdzenia zgodności z istniejącą dokumentacją i wiedzą użytkowników.

W trakcie analizy MetaRecon tworzy testową bazę danych, wierną kopię bazy źródłowej, zawierającą próbkę danych. Po przeprowadzeniu analizy otrzymuje się szczegółowe informacje na temat:

  • zakresu danych i wyjątków;

  • wartości unikatowych;

  • rozkładu i częstości występowania wartości, wartości NULL (czasem zastępowanych spacją lub zerem);

  • zależności między tabelami;

  • transformacji danych, kolumn wyliczeniowych, występowania reguł biznesowych w tabelach.

    Zapisane w repozytorium wyniki analizy są podstawą do opracowania modelu danych bazy docelowej, zaproponowania normalizacji lub struktury gwiazdowej (jeśli celem jest hurtownia danych) i odwzorowania baz źródłowych na bazę docelową w formie skryptów ETL do pakietu DataStage. Model danych może być eksportowany w formatach popularnych narzędzi do modelowania baz, tam przetworzony i wczytany z powrotem do repozytorium Ascential w celu modyfikacji.

    Pobieranie, ładowanie, czyszczenie

    DataStage jest typowym narzędziem ETL do pobierania danych i ładowania ich do bazy docelowej z możliwością dokonywania transformacji w trakcie przesyłania. Zakres zadań określają skrypty, które można tworzyć zarówno ręcznie, jak i automatycznie w narzędziu MetaRecon.

    Rozszerzony DataStage XE zawiera m.in. moduł do zarządzania metadanymi, moduł do oceny jakości danych w procesie transformacji (pokazuje np. gdzie dane są niezgodne z zadanymi regułami, gdzie jest naruszona integralność referencyjna, czy występuje niezgodność typów lub formatów). Istnieje również moduł do analizy ruchu na witrynach Web i moduł do eksportu/importu danych z plików XML.

    Integrity jest narzędziem do "czyszczenia" danych w bazach źródłowych. Automatycznie wykrywa i poprawia niezgodności i anomalie, eliminuje powtarzające się rekordy, umożliwia wzajemne przyporządkowanie rekordów pochodzących z różnych źródeł i standaryzację danych. Do weryfikacji danych wykorzystuje się metody statystyczne, rozpoznawanie brzmienia słów (soundex) oraz zewnętrzne biblioteki adresowe i geograficzne (GIS). Obecnie Integrity potrafi poprawiać dane adresowe dla Ameryki Północnej i Europy Zachodniej. Firma Ascen, polski dystrybutor Ascential, obiecuje lokalizację tej biblioteki danych.

    Integrity jest jedyną częścią pakietu Ascential, która w czasie rzeczywistym poprawia dane z systemów transakcyjnych w trakcie operacji.

    Zestaw Ascential Enterprise Integration Suite kosztuje ok. 400 tys. USD. Ceny poszczególnych części kształtują się od 50 tys. USD.

    Krótka historia Ascential

    Na początku lat 90. istniała firma Vmark, usiłująca, zresztą mało skutecznie, zająć dogodną niszę rynkową, oferując małe relacyjne i "postrelacyjne" bazy danych. Po przejęciu Dovetail Software i Prism Solutions oraz kilku mniejszych producentów baz danych, firma zmieniła nazwę na Ardent. Równocześnie zaczęła oferować produkty ETL, stając liczącym się partnerem dużych firm informatycznych i integratorów systemów w zakresie narzędzi do integracji aplikacji na poziomie danych.

    Wkrótce Ardent stał się łakomym kąskiem dla przeżywającego kłopoty Informixa. Od marca 2000 r. produkty firmy znakomicie uzupełniały bazodanową ofertę Informixa, pozwalając mu na równych prawach konkurować z firmami Oracle i IBM. Jednakże to mały Ardent "połknął" dużego Informixa, a nie odwrotnie. Szefowie Ardenta przejęli kierownictwo i w 2001 r. sprzedali za 1 mld USD bazy danych Informix firmie IBM. Pozostałość przyjęła nazwę Ascential Software i zajmuje się tym, na czym Ardent znał się najlepiej - integracją danych.

    Gotówka od IBM pozwoliła Ascential na zakupienie kilku firm: Metagenix z pakietem do profilowania danych MetaRecon; Vality z programem do oceny jakości i "czyszczenia" danych Integrity oraz Torrent Systems z wysoce skalowalną platformą do obsługi systemów wieloprocesorowych. Spowolnienie rozwoju gospodarczego spowodowało, że podobnie jak wiele innych firm, Ascential ostatnio boryka się z trudnościami. Szefowie firmy mają nadzieję odzyskać zyskowność pod koniec roku.

    W Polsce firma Ascential Software jest reprezentowana przez działającą od kwietnia br. spółkę Ascen.

  • W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

    TOP 200