Integracja wyszukiwarki z inteligencją biznesową

Mariaż inteligencji biznesowej (BI) i technologii wyszukiwania ma zapewniać szybszy i lepszy sposób dotarcia do wszystkich danych w przedsiębiorstwie.

Mariaż inteligencji biznesowej (BI) i technologii wyszukiwania ma zapewniać szybszy i lepszy sposób dotarcia do wszystkich danych w przedsiębiorstwie.

Integracja wyszukiwarki z inteligencją biznesową

Google Search Appliance. Lider wyszukiwania webowego ma również rozwiązanie wyszukiwania dla przedsiębiorstw, które sprzedaje w postaci urządzenia. Nowy mechanizm Google Search Appliance, o nazwie Google OneBox for Enterprise, dostarcza informacji z systemów BI, takich jak Cognos, Employease, Netsuite, Oracle, Salesforce.com i SAS.

W ciągle ewoluującym świecie business intelligence szybki i ukierunkowany dostęp do raportów i analiz jest podstawą rozwoju. Jednak problemy z lokalizowaniem rezultatów działania aplikacji BI, które często mają potrzebujący danych pracownicy, zachęca niektórych dostawców narzędzi wyszukiwania do wejścia w ten obszar zastosowań.

BI opiera się na danych generowanych przez działy księgowości i sprzedaży, systemy CRM i inne aplikacje zaplecza przetwarzania przedsiębiorstwa, reprezentuje więc ogromne wolumeny danych. Działy IT, które poczyniły istotne inwestycje w pakiety BI takich dostawców, jak m.in. Cognos, Information Builder, Oracle czy SAP, poszukują sposobów na lepszą ekspozycję takich danych i szersze ich udostępnianie na żądanie. Tymczasem liczba pracowników oczekujących, aby codzienny dostęp do danych BI miał większy wpływ na efektywność ich pracy, stale rośnie.

Uzyskiwanie właściwych danych

W wielu systemach BI raporty są zaprojektowane przez analityków dobrze znających się na oprogramowaniu do tworzenia raportów. Takie raporty są katalogowane jako szablony i generalnie generowane w sposób powtarzalny, np. na koniec miesiąca. Utworzone dokumenty są następnie dystrybuowane do użytkowników według specyficznych list wysyłkowych.

W takiej sytuacji problemy z odnalezieniem tych danych dla użytkowników nieznajdujących się na regularnej liście wysyłkowej, są dwojakiej natury. Po pierwsze, jak mogą się dowiedzieć, czy raport w ogóle istnieje? I po drugie, jeżeli taki raport istnieje, to jak można się do niego dostać? Ten drugi problem jest szczególnie powszechny, ponieważ raporty często znajdują się na serwerach pod dość zagadkowymi nazwami nadawanymi przez oprogramowanie BI.

Integracja wyszukiwarki z inteligencją biznesową

Kompleksowe wyszukiwanie w sieci przedsiębiorstwa na przykładzie X1 Enterprise Platform

Bez motoru wyszukiwań, który może zlokalizować taki raport lub związane z nim dane, użytkownik ma niewielką szansę na szybkie uzyskanie tej informacji. Sytuacja ta prowadzi do niepożądanych efektów: pracownicy rezygnują z wyszukiwania lub poświęcają czas na wyciągnięcie tych danych z innych źródeł i ponowne utworzenie raportu. W tym drugim wypadku wynikiem jest powielenie wysiłku stworzenia raportu i ryzyko, że dwa raporty, w założeniu prezentujące te same dane, mogą mieć odmienne wyniki końcowe. Nawet wtedy, kiedy użytkownik może odnaleźć raport, dokumenty te często nie zawierają potrzebnych danych. A ponieważ raporty te najczęściej są szablonowe, to użytkownicy nie mogą w łatwy sposób ich modyfikować w celu zapewniania sobie potrzebnych danych.

Wymóg zgodności z różnego rodzaju normami i regulacjami prawnymi także stwarza potrzebę przeszukiwania w ramach BI. Osoba odpowiedzialna za spełnianie wymogów musi mieć możliwość przeszukiwania baz danych CRM i poczty elektronicznej, poszukując niebezpiecznych, z punktu widzenia wycieku danych, fraz.

Specyfika wyszukiwania w ramach BI

Jednym z czynników, który powoduje, że wyszukiwanie ułatwia szerszy dostęp do BI, jest to, że użytkownicy już wiedzą jak się nim posługiwać z uwagi na dość powszechną znajomość webowych motorów przeszukujących. Przy niewielkim zakresie szkolenia użytkownikom można przekazać wiedzę o tym, jak korzystać z dodatkowych opcji, podobnych do mechanizmów "wyszukiwanie zaawansowane" z motorów webowych.

Jednak sposób działania wyszukiwarek dla przedsiębiorstw różni się znacząco od operacji wykonywanych przez wyszukiwarki webowe. Większość kwerend webowych dotyczy danych niestrukturalizowanych, takich jak HTML, prezentacje PowerPoint czy pliki PDF. Ponieważ zasoby te mają charakter dokumentów, motor wyszukujący może podejmować inteligentne decyzje co do znaczenia danych (strony WWW mają nawet specyficzne znaczniki ułatwiające ten proces).

Integracja wyszukiwarki z inteligencją biznesową

Cognos 8 Business Intelligence. Połączenie ESP norweskiej firmy Fast Search and Transfer (FAST) oraz Cognos 8 BI z Cognos Go! Search Service umożliwia szybkie odnajdywanie raportów, analiz i innych zasobów BI wraz z korporacyjną zawartością oraz innymi formami strukturalizowanych i niestrukturalizowanych informacji biznesowych. Produkt FAST może także wykonywać analizy danych wygenerowanych przez Cognos w czasie procesu zwracania wyników wyszukiwań.

Dane strukturalizowane dla odmiany generalnie nie zapewniają takiej kontekstowej informacji. Jeżeli otworzymy bazę danych i czytamy kolumnę liczb o nazwie "parts", to mamy niewielkie pojęcie, czego dotyczą te liczby (numer części, koszt części, liczba części, lokalizacja części?). Problem ten może być ostatecznie rozwiązany poprzez użycie metadanych i ma to miejsce w bazach danych obsługujących XML. Ale patrząc na znaczną większość strukturalizowanych danych dzisiaj, musimy dojść do wniosku, że rozwiązanie tego problemu nie jest wcale łatwe.

Oprogramowanie BI rozwiązuje ten problem częściowo przez użycie szablonów i definiowanie, przez doświadczonych analityków, powiązań danych. Z tego powodu wiele dzisiejszych motorów wyszukiwań w przedsiębiorstwie, takich jak Google czy X1, automatyzuje przeszukiwanie strukturalizowanych danych oprogramowania BI i następnie łączy te rezultaty z pozycjami swoich własnych indeksów wyszukiwań.

Niestrukturalizowane dane mają swoje własne wyzwania. Pierwszym jest ich znaczny wolumen. Według różnych danych, przeciętny użytkownik biznesowy ma do czynienia z kilkudziesięcioma wiadomościami pocztowymi w ciągu dnia roboczego (odbieranymi i wysyłanymi). W dużej firmie, zatrudniającej tysiące pracowników, przesyłki takie, liczone w setkach milionów, muszą być archiwizowane (wymogi regulacji prawnych) w sposób umożliwiający ich przeszukiwanie. Do tego dodać trzeba wszystkie inne dokumenty (HTML, edytory tekstu czy prezentacje), aby w rezultacie otrzymać olbrzymi zakres spraw, które same w sobie przekładają się na jeszcze inne wyzwania. Przy rezultatach wyszukiwań idących w tysiące pozycji jak można uszeregować je pod względem ważności?

W algorytmie proponowanym przez IBM używa się np. mieszanki czynników wagowych określających znaczenie danego dokumentu w ramach przedsiębiorstwa. Obejmują one: wzorzec kliknięć użytkownika, format i miejsce pozycji w dokumencie (nagłówek ma większe znaczenie niż pozycja w tekście), metadane (tekst w łączniku ma być oceniany inaczej niż tekst w treści dokumentu) itp.

Większość dzisiejszych produktów zapewnia pewien sposób zwiększania znaczenia dla poszczególnych dokumentów lub URL, tak aby zajmowały początkowe pozycje w danym wyszukiwaniu. Ponadto wiele produktów umożliwia dostosowanie do specyfiki używanego w danej firmie języka. Zapewnia to motorom wyszukującym wiedzę na temat tego, że np. zapytanie o "region 1" dotyczy ściśle określonego rejonu kraju.

Bezpieczeństwo na pierwszym planie

Integracja wyszukiwarki z inteligencją biznesową

BM OmniFind. IBM WebSphere Information Integration OmniFind, komponent rozwiązania WebSphere Content Discovery for Business Intelligence, charakteryzuje się znacznym zakresem skalowalności i wbudowanym dostępem do wiodących aplikacji BI. W zależności od konfiguracji wyniki wyszukiwań OmniFind mogą być wywołane dla dalszego drążenia danych. Mechanizm ten wywodzi się z rozwiązań IBM do przeszukiwania hurtowni danych. Kontrola dostępu do wyszukiwanych danych jest wymuszana przez oprogramowania OmniFind.

Kontrola dostępu jest centralnym aspektem wyszukiwań BI. Problem ten pojawia się w dwóch aspektach: jak pracownicy uzyskują dostęp do wszystkich danych niezbędnych dla raportu oraz jak zablokować możliwość oglądania poufnych danych dla niektórych pracowników? W świecie idealnym model SSO (Single Sign-On) powinien rozwiązywać pierwszy problem, a dostęp do serwera katalogowego LDAP ten drugi. W rzeczywistości jednak problem tkwi w implementacji: większość danych jest zlokalizowana w systemach, których kontrola dostępu nie jest zbyt starannie zdefiniowana poprzez ogólny mechanizm dostępu w korporacji.

Problem jest w rzeczywistości poważniejszy niż się wydaje. Często po zastosowaniu narzędzi wyszukiwania w skali całego przedsiębiorstwa okazuje się, że zakres i ilość poufnych danych, które są szeroko dostępne i kompletnie niechronione w jego intranetach, jest olbrzymi.

Schematy bezpieczeństwa są różne i organizacje rozważające dołączenie wyszukiwania do BI powinny określić, jak kontrola dostępu jest obsługiwana przez brany pod uwagę produkt. Wiele produktów po prostu przepuszcza referencje użytkownika do pakietu BI lub innego oprogramowania zaplecza i zdaje się na te aplikacje w zakresie ograniczania zwracanych rezultatów wyszukiwań - zgodnie z wbudowanymi w nie mechanizmami dostępu. Ten aspekt jest szczególnie akcentowany w produkcie Oracle Secure Enterprise Search.

Co na horyzoncie

Integracja wyszukiwarki z inteligencją biznesową

Oracle Secure Enterprise Search. Z uwagi na skalowalność i bezpieczeństwo indeksy wyszukiwań są przechowywane w bezpiecznej bazie danych, a do kontroli dostępu wykorzystywane są rozwiązania zarządzania tożsamością Oracle. Oferuje możliwość wyszukiwania w systemach zarządzania dokumentami, aplikacjach BI i portalach. Wyszukiwania mogą być audytowane i rejestrowane.

Według ocen specjalistów integracja BI i funkcji wyszukiwania będzie stawać się coraz ściślejsza. Motory wyszukiwań będą uzyskiwać lepszy dostęp do danych BI, a dostawcy narzędzi BI będą ulepszać ten proces. Na przykład Information Builder może dzisiaj pobierać dane z przetwarzania transakcji i udostępniać je dla motoru wyszukującego Google Enterprise.

Information Builder ma oddział, który zapewnia około trzystu konektorów do różnych źródeł danych i używa ich do poszerzenia możliwości wyszukiwań we własnych produktach BI. Dzisiaj BI ciągle jeszcze wymaga od użytkowników wiedzy o tym, gdzie znajdują się interesujące go dane.

Kolejnym krokiem jest włączenie funkcji analitycznych zintegrowanych z wyszukiwaniem i będących zdolnych do kwerendowania danych w różnorodny sposób. Jednak do tej pory większość przedsiębiorstw będzie zadowolona, mając lepszy dostęp do danych inteligencji biznesowej, które aktualnie generuje.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200