Gdzieś jest, lecz nie wiadomo gdzie

Według badań przeprowadzonych przez jedną z firm analitycznych w USA prawie 30% użytkowników systemów informatycznych w firmach spędza co najmniej 8 godz. tygodniowo na poszukiwaniu potrzebnych informacji. Dalsze 40% poświęca temu zajęciu co najmniej 7 godz. w tygodniu. Oznacza to, że pracownik poświęca jeden dzień pracy w tygodniu na poszukiwanie potrzebnych mu informacji. Do tego trzeba dodać spadek wydajności pracy spowodowany frustracją pracowników wynikającą z tego, że sprawa tak podstawowa jak wyszukiwanie informacji jest męką. Choć analogicznych badań dla Polski brak, każdy wyczuwa chyba, że poszukiwanie informacji to jedno z trudniejszych zadań codziennych.

Systemy pozwalające przeszukiwać wiele różnorodnych zasobów danych jednocześnie określa się mianem Enterprise Search (ES). Od narzędzi desktopowych różni je przede wszystkim to, że pozwalają na przeszukiwanie dokumentów zgromadzonych na dysku lokalnym, ale także znajdujących się na dyskach w sieci korporacyjnej czy w sieci WWW oraz bazach danych i aplikacjach. Druga ważna różnica to fakt, że narzędzia korporacyjne integrują się z infrastrukturą do bezpiecznego uwierzytelniania, kontroli praw dostępu i szyfrowania informacji. To absolutne minimum, by duże firmy mogły wdrożyć usługi wyszukiwania.

Szewc w butach

Rynek narzędzi tego typu od dawna istnieje w USA i krajach Europy Zachodniej. Działają na nim dziesiątki firm oferujących rozwiązania ES, m.in. wspomniany już Copernic, brytyjska Autonomy, Fast Search & Transfer czy Convera. W Polsce rynek dopiero zaczyna się tworzyć. Wspomniane firmy są na nim nieobecne. IBM oferujący od września br. narzędzie DB2 Information Integrator OmniFind Edition 8.2 rozpoczyna właśnie projekt stworzenia systemu wyszukiwania informacji w jednej z dużych polskich firm.

Rozwiązanie wykorzystywane jest również wewnętrznie w IBM. Korzystają z niego pracownicy w oddziałach na całym świecie. System indeksuje zasoby intranetu (w tym m.in. dokumenty w formatach HTML, PDF, DOC i PPT) oraz bazy danych o pracownikach. Możliwości OmniFind obejmują m.in. serwery newsów (NNTP), systemy plików, foldery publiczne Microsoft Exchange, bazy danych Lotus Domino, bazy danych Oracle oraz repozytoria systemów obiegu dokumentów firm Documentum czy FileNet.

System został tak zaprojektowany, by możliwe było objęcie nim co najmniej 20 mln dokumentów. W IBM OmniFind indeksuje aktualnie 6 mln dokumentów w intranecie i 500 tys. rekordów w systemie kadrowym (w formacie XML). Pełne "przejście" crawlera przez zasoby intranetowe zabiera tydzień. Objętość indeksu wynosi 50 GB danych (połowa objętości indeksowanych zasobów). Przy tym użytkownicy zadają dziennie ok. 80 tys. zapytań. Średni czas oczekiwania na odpowiedź wynosi pół sekundy.

Polska myśl

Aplikacja IBM jest jednak stosunkowo droga. Przedstawiciele firmy mówią wprost, że mogą sobie na nią pozwolić wyłącznie duże firmy. Z drugiej strony dodają, że tylko takie właśnie firmy naprawdę jej potrzebują. Cena licencji DB2 Information Integrator OmniFind Edition 8.2 wynosi 50 tys. euro na procesor. Do uruchomienia systemu potrzeba jednak komputera wyposażonego w co najmniej od 2 do 4 procesorów.

Z założenia, że Polski rynek nie jest przygotowany na wykorzystanie narzędzi ES w takiej cenie, wyszła firma Netsprint (twórca wyszukiwarki internetowej o tej samej nazwie), przygotowując serię produktów Netsprint Intranet.

Podobnie jak IBM, firma realizuje projekt wdrożenia swoich narzędzi w dużej polskiej firmie. Znajduje się jednak na znacznie bardziej zaawansowanym etapie. Pod koniec grudnia uruchomiła u klienta testową wersję rozwiązania. Po zakończeniu tego projektu linia produktów Netsprint Intranet trafi na rynek.

Firma nie ujawnia na razie konkretnych cen, ale mają być one na tyle atrakcyjne, żeby z narzędzi mogły skorzystać polskie firmy średniej wielkości.

Znajdź i przeanalizuj

Obserwując zachodzące na rynku zmiany, można dojść do wniosku, że już wkrótce mechanizmy przeszukiwania zasobów staną się kolejnym elementem rozwiązań analitycznych. Przeszukiwanie danych z różnych źródeł może stać się ważnym kierunkiem rozwoju narzędzi do raportowania, zwłaszcza w kontekście koncepcji w rodzaju BAM (Business Activity Monitoring). Podobny trend wiąże się z narzędziami analitycznymi i oprogramowaniem do analizy statystycznej.

Niedawno firmy Cognos i Composite Software poinformowały, że będą pracować wspólnie nad połączeniem aplikacji BI (Business Intelligence) do raportowania z oprogramowaniem typu EII (Enterprise Information Integration). Cognos wykorzysta technologię Composite 3.0 we własnym oprogramowaniu ReportNet. Współpraca obu firm nie jest bynajmniej wyjątkowa. Kilka tygodni wcześniej Business Objects podpisał podobne porozumienie z Attunity. Synergię pomiędzy BI oraz EII potwierdzają analitycy. "EII daje BI większe możliwości dostępu do informacji i lepszą technologię do wykonywania rozproszonych zapytań. Pomaga także wyeliminować niektóre wady narzędzi raportujących" - przekonuje Phillip Russom z Forrester Research.

Nie to, co Internet

W odróżnieniu od wyszukiwarki internetowej, w której główny problem zwykle stanowią kwestie wydajnościowe, narzędzia do przeszukiwania zasobów firmowych napotykają problemy z precyzją wyszukiwania. O ile bowiem zasoby Internetu są bardzo zróżnicowane, zawartość dokumentów firmowych jest, wbrew pozorom, bardzo zbliżona, a różnice między nimi - nieznaczne.


TOP 200