ESP ułatwiają wyszukiwanie informacji

Nowe, wyposażone w inteligencję platformy wyszukiwawcze zwiększają precyzję wyników, wykorzystując różne silosy danych istniejące w przedsiębiorstwach.

Nowe, wyposażone w inteligencję platformy wyszukiwawcze zwiększają precyzję wyników, wykorzystując różne silosy danych istniejące w przedsiębiorstwach.

Ekstrakcja użytecznej informacji z wielu istniejących repozytoriów danych, z których każde ma własny motor wyszukiwań, wciąż pozostaje dużym wyzwaniem w przedsiębiorstwach. Toną one w rosnącej górze strukturalizowanych i niestrukturalizowanych danych, której eksploracja, mimo stosowania różnych metod etykietowania dokumentów, nadal jest zajęciem bardzo czasochłonnym.

ESP (Enterprise Search Platform) mają zmienić ten stan. Te nowe, kompletne zestawy technologii wyszukiwania i integracji ujawniają informację ukrytą w danych przechowywanych w pamięciach masowych całej sieci przedsiębiorstwa. ESP agregują wiele pojawiających się technologii, takich jak automatyczna klasyfikacja i NLP (Natural Language Processing). Przyjmując ESP za podstawę, przedsiębiorstwa mogą budować przystosowywane aplikacje wyszukujące, automatyzując jednocześnie proces przygotowywania dokumentów do archiwizacji i indeksowania.

Takie zaawansowane platformy wyszukujące ustanawiają skomplikowane bramy na wejściu do silosów informacji, również tych z własnymi motorami wyszukującymi. ESP zapewniają także wspólny zestaw danych i logikę wyszukiwania, która może być strojona z aplikacji na aplikację w celu polepszenia wyników wyszukiwania.

W ubiegłym roku IBM zaprezentował DB2 Information Integrator o nazwie kodowej Masala, który zawiera zaawansowany motor wyszukiwań zaprojektowany pod kątem uzupełnienia innego hitu firmy w dziedzinie zarządzania zawartością - DB2 Content Manager i Web-Fountain. Masala pozwoliła IBM dołączyć do grona firm, takich jak Autonomy, Convera, EasyAsk, Endeca, FastSearch & Transfer (FAST), iPhrase oraz Verity - z których każda ma w swojej ofercie platformę wyszukiwawczo-aplikacyjną z różną mieszanką mechanizmów.

Burzenie murów

ESP ułatwiają wyszukiwanie informacji

Połączone silosy danych

ESP zmieniają sposób, w jaki przedsiębiorstwa prowadzą "sfederowane" wyszukiwanie - proces, w którym pojedyncza kwerenda jest przekazywana do wielu motorów wyszukiwań, a użytkownikowi prezentowany jest zagregowany rezultat. Sfederowane wyszukiwanie może powiększać zakres wyszukiwań o podobne magazyny danych, nie sprawdza się jednak uruchamiane w odniesieniu do zewnętrznych baz danych, wymagających specyficznych składni.

Podstawowe sfederowane wyszukiwanie, które istnieje już od kilku lat, nie chroni też użytkownika przed "papką informacyjną" uzyskiwaną zamiast skondensowanego wyniku, z wielu motorów wyszukujących. Bez pewnych dodatków, nadających sens danym, są to instrumenty nie dość precyzyjne.

Sprawę komplikuje to, że przedsiębiorstwa zazwyczaj mają wiele motorów wyszukiwań zagnieżdżonych w różnych aplikacjach - jeden np. w systemie zarządzania zawartością, inny w środowisku Microsoft Office, a jeszcze inny w systemie poczty elektronicznej. ESP wychodzi poza te silosy motorów wyszukiwań i związane z nimi repozytoria danych (zob. rys.) oraz narzuca w kwerendzie - przed eksploracją magazynów danych - translację składni i inne operacje językowe, takie jak wykrywanie fraz.

Na poziomie procesów indeksowania ESP wspomaga użytkownika, przedkładając mu listy ulepszonych kwerend do wyboru - tworzonych według kontekstu pochodzenia kwerendy, który często jest niejasny. Jako przykład można podać działanie ESP firmy FAST w ośrodku publikacyjnym Scirus.com. Po napisaniu słowa "nuclear" (nuklearny), w celu wyszukania w magazynach naukowych publikacji związanych z tym słowem, otrzymuje się ponad 700 000 pozycji. Wzbogacone słowo kluczowe - "nuclear facility" (urządzenia nuklearne), wybrane z listy sugestii pokazujących się z prawej strony ekranu, skraca wybór do ok. tysiąca pozycji. Dalsze zanurzenie i wybranie pozycji "uranium enrichment" (wzbogacanie uranu) pozwala skrócić listę do dziesięciu pozycji.

Z kolei firma Endea oferuje technologię, która łączy wyszukiwanie z czymś co nazywa Guided Navigation. Tutaj wyszukiwanie wg słów kluczowych generuje w locie katalog wyszukiwań, który użytkownik może wykorzystać do progresywnego udoskonalania wyników.

Strojenie pod użytkownika

Tworzenie efektywnego interfejsu wyszukiwania dla użytkowników w przedsiębiorstwach obejmuje projektowanie zorientowanych biznesowo aplikacji wyszukiwania.

W celu osiągnięcia dużej dokładności oprogramowanie wyszukujące musi być dostrajane do kontekstu, w którym pracuje. Jest to strategia projektowa zorientowana na procesy biznesowe, pozwalająca na dostosowywanie rozwiązań do specyficznych potrzeb poszczególnych użytkowników.

Aplikacje budowane nad ESP umożliwiają tworzenie interfejsów związanych z wyszukiwaniem, które mogą docierać do zawartości: poczty elektronicznej, stron webowych konkurencji czy baz danych CRM. Mechanizmy klasyfikacji w tych platformach pozwalają specjalistom na eksploracje zawartości poprzez szablony znaczeniowe lub tematyczne.

Odmienne podejście w swojej ofercie dla przedsiębiorstw prezentuje Google (Google Search Appliance) - umieszcza za zaporą ogniową technologię, która zasila jej publiczne produkty. Innymi słowy, urządzenie jest w zasadzie motorem wyszukiwań, a nie kompletną platformą.

Specjaliści z Delphi Group uważają jednak, że działy IT nie powinny inwestować w ogólne narzędzia wyszukiwań, a raczej koncentrować się na specyfice zastosowań, inwestując w aplikacje wyszukujące przystosowane do biznesowych potrzeb użytkowników.

Dostawcy platform wyszukiwania dla przedsiębiorstw

Rozważając cechy produktów wyszukiwania, powinno się brać pod uwagę możliwość składania rozwiązań dla przedsiębiorstw z elementów, które: zbierają dane z wielu źródeł bezpiecznie i efektywnie; rozpoznają różne języki naturalne i wyrażenia językowe; formatują rezultaty w praktyczne katalogi czy reguły klasyfikacji, a także są skalowalne w warunkach zwiększającej się objętości pamięci masowych. Dostawcy, których oferta spełnia niektóre lub wszystkie te postulaty, to m.in.

Autonomy -http://autonomy.com

Atomz -http://atomz.com

Convera -http://convera.com

EasyAsk -http://easyask.com

Endea -http://endea.com

Entopia -http://entopia.com

Fast Search and Transfer (FAST) -http://fastsearch.com

Google -http://google.com

Hummingbird -http://hummingbird.com

Intelliseek -http://intelliseek.com

InQuira -http://inquira.com

IPhrase -http://iphrae.com

Kanisa -http://kanisa.com

Mercado Software -http://mercado.com

Mondosoft -http://mondosoft.com

Open Text -http://opentext.com

Recommind -http://recommind.com

Thunderstone -http://thunderstone.com

Verity -http://verity.com

ZyLAB - http://www.zylab.com

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200