Z indeksem po pieniądze

Technologie indeksowania informacji dojrzały, by zastosować je w korporacyjnych systemach informatycznych, ale rynek samodzielnych rozwiązań indeksujących raczej nie powstanie.

Technologie indeksowania informacji dojrzały, by zastosować je w korporacyjnych systemach informatycznych, ale rynek samodzielnych rozwiązań indeksujących raczej nie powstanie.

Od czasu powstania efektywnych mechanizmów indeksujących treści publikowane w Internecie, wyszukiwanie bieżąco potrzebnych informacji na dowolny temat stało się banalnie proste i weszło do codziennych nawyków setek milionów ludzi. Sfera informacji niepublicznej, dostępnej w zbiorach utrzymywanych na wewnętrzne potrzeby, nie nadążała za Internetem. Pierwsze próby indeksowania treści wewnętrznych ograniczały się jedynie do intranetów, w których można było zastosować nieco zmodyfikowane rozwiązania internetowe - z bardzo różnymi skutkami.

Indeksowanie treści dokumentów biurowych w wielu formatach, często zamkniętych, binarnych, dopiero niedawno przestało być niszą. Szybka popularyzacja programu Google Desktop, wbudowanie mechanizmów dynamicznego wyszukiwania w system Mac OS X, powrót Microsoftu do niegdyś rozwiniętych, lecz mocno "zaniedbanych" koncepcji indeksowania treści i ich udoskonalenie w formie MSN Toolbar, czy udostępnienie wersji beta systemu plików WinFS dla Windows Vista... tak powstała masa krytyczna, która może wiele zmienić na rynku.

Potrzebę zarządzania dokumentami, indeksowania ich treści i przeszukiwania mają nie tylko wielkie organizacje. W takim samym zakresie, choć w nieco innej skali, mają ją także firmy średnie i małe. To jednak nie oznacza, że mamy do czynienia z powstaniem samodzielnej gałęzi przemysłu informatycznego, która sama jest zdolna przynieść wielkie zyski. Klasyfikowanie, indeksowanie, wyszukiwanie, analizowanie i filtrowanie wyników według uprawnień, dostarczanie ich w czytelnej formie i w odpowiedniej kolejności - to funkcjonalność dostępna w rozwiązaniach informatycznych od lat. A zatem, gdzie kryją się pieniądze i kto je zarobi?

Wszyscy chcą szukać

Internetowy biznes Google (oraz kopiujących go Yahoo!, Microsoftu i kilku innych) polega na sprzedaży reklam tekstowych sąsiadujących z wynikami wyszukiwania. Proste, tyle że w środowisku korporacyjnym taki model się nie sprawdza. Jak zaproponować pracownikowi reklamę online, skoro nie ma uprawnień do korzystania z Internetu, lecz jedynie z sieci wewnętrznej? A gdyby nawet, jakie reklamy mu przedstawić - oparte na zainteresowaniach zawodowych czy prywatnych? Gdzie przechowywać profile? Takich problemów jest znacznie więcej.

Licencjonowanie oprogramowania wyszukiwawczego oparte na liczbie użytkowników prawie na pewno jest skazane na finansowe niepowodzenie. Prędzej czy później Microsoft zamierza uczynić z wyszukiwania usługę dostępną w ramach rodziny systemów Windows Server. Po drugie, producenci baz danych odczuwają silną presję, by zwiększyć ich atrakcyjność. Lansowane dziś przez IBM, Oracle, Sybase, BEA Systems, SAS i innych konsolidowanie informacji z wielu źródeł przekształci się w dłuższym okresie w propozycję zarządzania informacją w dowolnej postaci. Zakup młodej, wyspecjalizowanej firmy i integracja jej rozwiązania z dotychczasowym produktem spełni tę obietnicę bardzo szybko.

Postawienie na klientelę o niewygórowanych potrzebach i przyjęcie strategii opartej na niskiej cenie nie spełni oczekiwań funkcjonalnych, a w dłuższym okresie nie wytrzyma konkurencji z rozwiązaniami open source. Nie wytrzyma, ponieważ już dziś ich funkcjonalność jest bardzo bogata, a wykorzystanie jest powszechne i stawia cały pomysł biznesowy pod znakiem zapytania. Dla niezorientowanych, mowa tu przede wszystkim o oprogramowaniu rozwijanym przez Apache Foundation w ramach projektu Jakarta-Lucene i dziesiątek opartych na nim rozwiązań specjalizowanych (http://wiki.apache.org/jakarta-lucene/PoweredBy ).

Niszowe skrzywienie

Jedynym obszarem, w którym na zarządzaniu informacją będzie można zarobić, będą rozwiązania dedykowane do obsługi wąsko zdefiniowanych problemów biznesowych. W takich rozwiązaniach indeksowanie będzie jedynie elementem szerszego procesu, skracającym pewien jego etap, czy też ułatwiającym wykonanie pewnego zakresu czynności. Przykłady są dostępne już dziś. W Stanach Zjednoczonych samodzielną klasę rozwiązań stanowi compliance, czyli utrzymanie zgodności z wymogami prawa, np. słynną ustawą Sarbanes-Oxley. To jednak tylko wierzchołek góry lodowej.

Obszarem nadającym się do tworzenia samodzielnych rozwiązań są systemy do archiwizacji danych, ale także np. CRM analityczny, w którym znaczenie ma nie tylko analiza baz danych, ale również zawartość podpisanych umów, treść korespondencji itp. Idealnie nadają się do tego dziedzina zarządzania dokumentacją techniczną i produktową (PLM - Product Lifecycle Management), zarządzanie katalogiem produktów oraz długookresowa archiwizacja danych.

Samodzielną dziedzinę zastosowań dla technologii wyszukiwawczych bez wątpienia stanowić będą rozwiązania branżowe, opierające się na specjalistycznych nomenklaturach czy też umiejętnie łączące wyszukiwanie uniwersalne z niszową specjalizacją, np. formatami czy protokołami specyficznym dla automatyki albo dla sieci. Poza tym jak zwykle o sukcesie decydować będzie dobre zrozumienie problemów branży, a tylko w pewnym stopniu biegłość w technologii wyszukiwawczej - a nie odwrotnie.

Całkiem możliwe, że technologia wyszukiwawcza rozwinie się w kierunku indeksowania w czasie rzeczywistym. Nie będzie to specjalizacja, ale raczej klasa rozwiązań, możliwa do realizacji w dowolnym zastosowaniu czy dowolnej branży - szybkość działania będzie podstawą do żądania wyższej ceny. Jest też możliwe, a nawet całkiem prawdopodobne, że powstaną systemy hierarchiczne, zarządzające "indeksami" indeksów specjalistycznych i że umiejętne zarządzanie heterogenicznymi środowiskami indeksującymi poszczególne obszary okaże się z biegiem czasu bardzo atrakcyjną niszą.

Innowatorzy górą

Ponieważ ludzkość przekształca informację do coraz nowych postaci i wykorzystuje w coraz nowy sposób, indeksowanie i wyszukiwanie nadal będzie rozwijać się jako dziedzina na pograniczu nauki i technologii. Efektywne algorytmy stwarzać będą warunki do wyprzedzania konkurencji, ale tylko na pewien czas - widać to doskonale na przykładzie Google, którego algorytmy, choć niewątpliwie wciąż wiodące, tracą powoli swoją unikalność. Google, Yahoo! i inni znajdą jednak zapewne jeszcze inne metody zarabiania na wytworach intelektu swoich pracowników. Nie będzie to jednak proponowanie klientom korporacyjnym pudełek z napisem "serwer indeksujący" - tym zajmą się "doły" rynku.

ODF zmieni wiele

Jeśli Open Document Format (ODF) upowszechni się jako standardowy format dokumentów na całym świecie, indeksowanie zbiorów dokumentów i ich przeszukiwanie powinno stać się o wiele prostsze niż dotychczas. Jeden format, w pełni tekstowy, wydaje się wręcz idealny do takich celów. Oczywiście, dokumenty w formatach binarnych nie znikną z dnia na dzień, ale samo istnienie ODF powinno doprowadzić do marginalizacji przynajmniej części z nich, a to z kolei jeszcze bardziej uprości zarządzanie informacją w organizacjach. Ten, kto w porę zorientuje się, jak ten fakt wykorzystać komercyjnie, zarobi duże pieniądze.