ESP ułatwiają wyszukiwanie informacji
- NetWorld,
- 01.03.2005
Nowe, wyposażone w inteligencję platformy wyszukiwawcze zwiększają precyzję wyników, wykorzystując różne silosy danych istniejące w przedsiębiorstwach.
Nowe, wyposażone w inteligencję platformy wyszukiwawcze zwiększają precyzję wyników, wykorzystując różne silosy danych istniejące w przedsiębiorstwach.
Ekstrakcja użytecznej informacji z wielu istniejących repozytoriów danych, z których każde ma własny motor wyszukiwań, wciąż pozostaje dużym wyzwaniem w przedsiębiorstwach. Toną one w rosnącej górze strukturalizowanych i niestrukturalizowanych danych, której eksploracja, mimo stosowania różnych metod etykietowania dokumentów, nadal jest zajęciem bardzo czasochłonnym.
ESP (Enterprise Search Platform) mają zmienić ten stan. Te nowe, kompletne zestawy technologii wyszukiwania i integracji ujawniają informację ukrytą w danych przechowywanych w pamięciach masowych całej sieci przedsiębiorstwa. ESP agregują wiele pojawiających się technologii, takich jak automatyczna klasyfikacja i NLP (Natural Language Processing). Przyjmując ESP za podstawę, przedsiębiorstwa mogą budować przystosowywane aplikacje wyszukujące, automatyzując jednocześnie proces przygotowywania dokumentów do archiwizacji i indeksowania.
Takie zaawansowane platformy wyszukujące ustanawiają skomplikowane bramy na wejściu do silosów informacji, również tych z własnymi motorami wyszukującymi. ESP zapewniają także wspólny zestaw danych i logikę wyszukiwania, która może być strojona z aplikacji na aplikację w celu polepszenia wyników wyszukiwania.
W ubiegłym roku IBM zaprezentował DB2 Information Integrator o nazwie kodowej Masala, który zawiera zaawansowany motor wyszukiwań zaprojektowany pod kątem uzupełnienia innego hitu firmy w dziedzinie zarządzania zawartością - DB2 Content Manager i Web-Fountain. Masala pozwoliła IBM dołączyć do grona firm, takich jak Autonomy, Convera, EasyAsk, Endeca, FastSearch & Transfer (FAST), iPhrase oraz Verity - z których każda ma w swojej ofercie platformę wyszukiwawczo-aplikacyjną z różną mieszanką mechanizmów.
Burzenie murów
ESP zmieniają sposób, w jaki przedsiębiorstwa prowadzą "sfederowane" wyszukiwanie - proces, w którym pojedyncza kwerenda jest przekazywana do wielu motorów wyszukiwań, a użytkownikowi prezentowany jest zagregowany rezultat. Sfederowane wyszukiwanie może powiększać zakres wyszukiwań o podobne magazyny danych, nie sprawdza się jednak uruchamiane w odniesieniu do zewnętrznych baz danych, wymagających specyficznych składni.Podstawowe sfederowane wyszukiwanie, które istnieje już od kilku lat, nie chroni też użytkownika przed "papką informacyjną" uzyskiwaną zamiast skondensowanego wyniku, z wielu motorów wyszukujących. Bez pewnych dodatków, nadających sens danym, są to instrumenty nie dość precyzyjne.
Sprawę komplikuje to, że przedsiębiorstwa zazwyczaj mają wiele motorów wyszukiwań zagnieżdżonych w różnych aplikacjach - jeden np. w systemie zarządzania zawartością, inny w środowisku Microsoft Office, a jeszcze inny w systemie poczty elektronicznej. ESP wychodzi poza te silosy motorów wyszukiwań i związane z nimi repozytoria danych (zob. rys.) oraz narzuca w kwerendzie - przed eksploracją magazynów danych - translację składni i inne operacje językowe, takie jak wykrywanie fraz.
Na poziomie procesów indeksowania ESP wspomaga użytkownika, przedkładając mu listy ulepszonych kwerend do wyboru - tworzonych według kontekstu pochodzenia kwerendy, który często jest niejasny. Jako przykład można podać działanie ESP firmy FAST w ośrodku publikacyjnym Scirus.com. Po napisaniu słowa "nuclear" (nuklearny), w celu wyszukania w magazynach naukowych publikacji związanych z tym słowem, otrzymuje się ponad 700 000 pozycji. Wzbogacone słowo kluczowe - "nuclear facility" (urządzenia nuklearne), wybrane z listy sugestii pokazujących się z prawej strony ekranu, skraca wybór do ok. tysiąca pozycji. Dalsze zanurzenie i wybranie pozycji "uranium enrichment" (wzbogacanie uranu) pozwala skrócić listę do dziesięciu pozycji.
Z kolei firma Endea oferuje technologię, która łączy wyszukiwanie z czymś co nazywa Guided Navigation. Tutaj wyszukiwanie wg słów kluczowych generuje w locie katalog wyszukiwań, który użytkownik może wykorzystać do progresywnego udoskonalania wyników.
Strojenie pod użytkownika
Tworzenie efektywnego interfejsu wyszukiwania dla użytkowników w przedsiębiorstwach obejmuje projektowanie zorientowanych biznesowo aplikacji wyszukiwania.
W celu osiągnięcia dużej dokładności oprogramowanie wyszukujące musi być dostrajane do kontekstu, w którym pracuje. Jest to strategia projektowa zorientowana na procesy biznesowe, pozwalająca na dostosowywanie rozwiązań do specyficznych potrzeb poszczególnych użytkowników.
Aplikacje budowane nad ESP umożliwiają tworzenie interfejsów związanych z wyszukiwaniem, które mogą docierać do zawartości: poczty elektronicznej, stron webowych konkurencji czy baz danych CRM. Mechanizmy klasyfikacji w tych platformach pozwalają specjalistom na eksploracje zawartości poprzez szablony znaczeniowe lub tematyczne.
Odmienne podejście w swojej ofercie dla przedsiębiorstw prezentuje Google (Google Search Appliance) - umieszcza za zaporą ogniową technologię, która zasila jej publiczne produkty. Innymi słowy, urządzenie jest w zasadzie motorem wyszukiwań, a nie kompletną platformą.
Specjaliści z Delphi Group uważają jednak, że działy IT nie powinny inwestować w ogólne narzędzia wyszukiwań, a raczej koncentrować się na specyfice zastosowań, inwestując w aplikacje wyszukujące przystosowane do biznesowych potrzeb użytkowników.
Rozważając cechy produktów wyszukiwania, powinno się brać pod uwagę możliwość składania rozwiązań dla przedsiębiorstw z elementów, które: zbierają dane z wielu źródeł bezpiecznie i efektywnie; rozpoznają różne języki naturalne i wyrażenia językowe; formatują rezultaty w praktyczne katalogi czy reguły klasyfikacji, a także są skalowalne w warunkach zwiększającej się objętości pamięci masowych. Dostawcy, których oferta spełnia niektóre lub wszystkie te postulaty, to m.in.
Autonomy -http://autonomy.com
Atomz -http://atomz.com
Convera -http://convera.com
EasyAsk -http://easyask.com
Endea -http://endea.com
Entopia -http://entopia.com
Fast Search and Transfer (FAST) -http://fastsearch.com
Google -http://google.com
Hummingbird -http://hummingbird.com
Intelliseek -http://intelliseek.com
InQuira -http://inquira.com
IPhrase -http://iphrae.com
Kanisa -http://kanisa.com
Mercado Software -http://mercado.com
Mondosoft -http://mondosoft.com
Open Text -http://opentext.com
Recommind -http://recommind.com
Thunderstone -http://thunderstone.com
Verity -http://verity.com
ZyLAB - http://www.zylab.com