ESP ułatwiają wyszukiwanie informacji

Wszystko w jednym ciągu

Od lat przedsiębiorstwa zmagają się z problemem wyszukiwania w danych niestrukturalizowanych (informacji rezydujących poza aplikacjami przedsiębiorstwa i bazami danych) - osiągnięcia stopnia trafności i precyzji, jakiej oczekuje się od danych strukturalizowanych. Według prognoz Delphi Group ESP umożliwi ewolucję procesów przeszukiwania indeksującego w kierunku "linii technologicznej", składającej się z różnych algorytmów przeszukiwań i zaawansowanych technologii. Pozwoli to na umiejscowienie dynamicznej klasyfikacji lub analizy wybranych tekstów wewnątrz procesów, które analizują składniowo dokumenty w momencie przejmowania ich przez platformy wyszukujące, oraz wewnątrz procesów oceniających kwerendy i zwracających istotną informację.

Relatywnie nowym rozszerzeniem takiej linii technologicznej jest ekstrakcja istotnych elementów, w której motor wyszukujący dynamicznie wyciąga terminy z indeksowanej zawartości w locie. Poprzez analizę składniową proces ten dokonuje identyfikacji właściwych rzeczowników i tworzy listy osób, miejsc i innych elementów z dokumentu, a następnie umieszcza nowy poziom metadanych w dokumencie.

Innym jest użycie NLP, który pomaga przekształcać ubogie kwerendy w poszerzone. Stan sztuki w zakresie platform wyszukiwania obejmuje wiele algorytmów, reguł wzbogacania danych, profilowania pod kątem użytkownika i zawartości - wszystko po to, aby umożliwić użytkownikowi koncentrację na tym, co go interesuje i odpowiada na jego problemy.

Stary sposób "ręcznego" definiowania właściwości dokumentów jest niewspółmiernie mało efektywny w porównaniu z możliwościami automatycznego etykietowania, jakimi dysponują inteligentne platformy wyszukiwawcze, oparte na logikach dostosowanych do użytkownika.

ESP może wykrywać wzorce w zawartości i wzbogacać jej wartość w ramach infrastruktury platformy wyszukiwania drogą automatycznego tworzenia elementów metadanych. Dzięki wykładniczej wręcz szybkości rozpowszechniania się XML w środowiskach wyszukiwania, takie metadane mogą być używane do poszerzania zakresu przetwarzania aplikacyjnego, wzbogacania kwerend i opcji prezentacji.

Do gry wchodzą: wzbogacona klasyfikacja i taksonomia (zasady klasyfikacji), pozwalając użytkownikom przeglądać informacje w obszarach tematycznych zamiast pozostawiania ich sam na sam z pustym oknem kwerendy wyszukiwań i niewielkimi możliwościami konstruowania efektywnych kwerend. Dynamiczna klasyfikacja może modyfikować prezentację w obszarach tematycznych według kontekstu kwerendy.

Te nowe technologie pozwalają na poruszanie się w świecie danych strukturalizowanych i niestrukturalizowanych.

Z ochroną w tle

Aczkolwiek rozgraniczenie między wyszukiwaniem konsumenckim i wyszukiwaniem w przedsiębiorstwach ciągle jest dość mgliste, kluczowy element wyróżniający tkwi w architekturze ochronnej przedsiębiorstwa.

Bezpieczeństwo jest dużym wyzwaniem, ponieważ system nie może ujawniać wyników zawierających dokumenty, do których użytkownik nie ma uprawnień. Na poziomie platformy jednak zachowanie bezpieczeństwa jest dość proste. Jeżeli istnieje ochrona na poziomie dokumentów i repozytoriów, to motory wyszukiwań mogą używać jej do indeksowania dokumentów z uwzględnieniem uprawnień dostępu. Mogą także korzystać z usług katalogowych LDAP, aby przyglądać się uprawnieniom dostępu na poziomie gromadzenia danych.

Na poziomie dokumentów stosowane mogą być także tokeny powiązane z bezpieczeństwem oraz interfejsy pozwalające aplikacjom na wykonywanie wyszukiwań ze specyficznymi referencjami bezpieczeństwa, które gwarantują zwracanie jedynie tej zawartości, do której użytkownik ma upoważnienia.

Można więc przyjąć, że środowisko wyszukiwania nie narzuca biznesowi specjalnego schematu bezpieczeństwa w przedsiębiorstwie.

Fachowość nadal niezbędna

Oczekiwanie, że przeciętny pracownik będzie mógł uzyskiwać dobre rezultaty w eksploracji danych przedsiębiorstwa jest przedwczesne.

Dostawcy mechanizmów wyszukiwań muszą zakładać pewne doświadczenie użytkownika, mogą jednak zapewniać ukrycie faktu istnienia różnych motorów, różnego indeksowania i różnych możliwości zdarzeń w tle.

ESP wymaga, aby korzystający z niej zaznajamiali się z bardziej inteligentnymi metodami wyszukiwań. Według analityków IDC puste pole kwerendy i wyszukiwanie "po słowach" powoli odchodzić będzie do lamusa, w miarę jak ESP tworzyć będzie nowe interfejsy. Platformy wyszukiwania muszą być jednak ściślej zintegrowane z narzędziami współdziałania danej organizacji.


TOP 200