Smart Tag - znaczki między wierszami

SDK ma ułatwić tworzenie ''inteligentnego'' systemu rozpoznawania treści dokumentów Office XP.

SDK ma ułatwić tworzenie ''inteligentnego'' systemu rozpoznawania treści dokumentów Office XP.

Projektanci Microsoftu stwierdzili, że w większości dokumentów firmowych korzysta się z określonego zasobu słów - w nagłówkach znajduje się nazwa firmy, a w treści występują nazwy produktów czy usług. Znaczniki Smart Tag przekształcają tego typu elementy w encje, którym następnie mogą być przypisywane role. Możliwe jest także powiązanie znaczników z innymi aplikacjami, tak by po kliknięciu na nazwę produktu w dokumencie Worda automatycznie otwierał się raport, prezentujący wyniki sprzedaży.

Moduł Smart Tag SDK przypomina rozwiązanie automatycznego poprawiania tekstu z Worda 97. Wprowadzony przez użytkownika błędny ciąg znaków jest automatycznie zastępo-wany poprawnym. Smart Tag działa podobnie, tyle że fraza tekstu nie jest zastępowana, ale oznaczana za pomocą znacznika, który określa rolę tej frazy w dokumencie, a także to, jakie działania można wykonać, klikając na to wyrażenie.

Chcąc zbudować rozwiązanie wykorzystujące Smart Tag, programista musi utworzyć obiekty COM implementujące dwa interfejsy: ISmartTagRecog- nizer i ISmartTagAction. Pierwszy odpowiada za rozpoznawanie fraz, drugi współpracuje z jądrem Smart Tag wbudowanym w Office XP i odpowiada za wykonanie określonych operacji.

Rozpoznawanie

Obiekt implementujący interfejs ISmartTagRecognizer rozpoznaje znaczniki Smart Tag. Metoda odpowiedzialna za ich rozpoznawanie otrzymuje pewien fragment dokumentu - znak, słowo, wyrażenie regularne, zawartość komórki w Excelu albo akapit.

ISmartTagRecognizer analizuje składnię tekstu i wyszukuje zaznaczone elementy. Interfejs określa, w jakim fragmencie nastąpi przeszukiwanie. Znacznik należy do określonej przestrzeni nazw XML. Interfejs, po rozpoznaniu znacznika, dodaje do tzw. PropertyBag propozycje, w jaki sposób można oznaczyć wybrany tekst. Sugeruje przestrzeń nazw, a także pozycję początku i końca tekstu w znaczniku (względem wyrażenia przekazanego do metody wyszukującej elementy Smart Tag).

Problemy pojawiają się w momencie, gdy dwa interfejsy ISmartTagRecognizer rozpoznają w danej frazie dwa znaczniki, których tekst nakłada się na siebie. Załóżmy, że jest moduł, który rozpoznaje adresy i wiąże je automatycznie z systemem adresowym. Jeżeli jeden interfejs rozpozna ul. Tytoniowa i przypisze mu znacznik Adres, a drugi rozpozna ul. Tytoniowa 20 i także oznaczy ten element jako Adres, to w wersji Smart Tag 1.0 nie ma jasno określonych zasad, jak ostatecznie znacznik zostanie zdefiniowany. Powyższy problem dotyczy tylko Worda, ponieważ w Excelu zawsze rozpoznawane są całe komórki. Nic nie stoi na przeszkodzie, by różne znaczniki nakładały się na siebie (czyli w obrębie znacznika Adres mogą istnieć znaczniki Ulica czy Numer Domu). System rozpoznawania może mieć dodatko- wy interfejs i umożliwiać np. poprawianie błędnie wpisanej nazwy produktu czy wręcz, po wpisaniu akronimu, może wyświetlić podpowiedź w postaci listy elementów do wstawienia do dokumentu.

Znaczniki Smart Tag są w rzeczywistości znacznikami XML. Można je w dowolny sposób przetwarzać, manipulując dokumentem Worda czy Excela, jak plikiem z "wyspami" XML. Łatwo można utworzyć system indeksowania czy automatycznego tworzenia odnośników do innych prac, w których występują określone znaczniki. Bez trudu aktualizuje się zawartość znaczników.

Akcje

Ze znacznikiem związane są tzw. akcje. Terminem "akcja" jest określane to, co dzieje się w momencie, gdy użytkownik kliknie lub w inny sposób uaktywni element Smart Tag.

Obiekt musi implementować interfejs ISmartTagAction i ma dwa zadania. Po pierwsze, pozwala, by Office XP wyświetlił listę dostępnych czynności do wyboru przez użytkownika. Po drugie, odpowiada za wykonanie operacji.

Smart Tag (a w zasadzie motor automatyzacji wbudowany w Office XP) zawiera zaawansowane metody podpisywania rozwiązań. Można stosować zarówno wewnętrzne firmowe sygnatury, świadczące o źródle pochodzenia modułu, jak i podpisy firm trzecich.

Warto podkreślić, że nie trzeba samodzielnie tworzyć parsera ISmartTag-Recognizer czy określać akcji. Microsoft dostarczył narzędzie Office Smart Tag List (MOSTL), które jest ogólnym mechanizmem rozpoznawania i wykonywania określonych czynności. Do MOSTL należy przekazać specjalny plik XML, zawierający listę słów, które parser ma rozpoznawać. Każde słowo musi być powiązane ze znacznikiem (przestrzeń nazw). Następnie z każdym jego typem trzeba powiązać URL, wywoływany, gdy użytkownik kliknie na zaznaczony automatycznie tekst w dokumencie. MOSTL pozwala na centralne składowanie rozpoznawanych wyrażeń i adresów URL. Można określać też, jak często będą one uaktualniane na stacjach klienckich.

Poszczególne moduły rozpoznające Smart Tag mogą być blokowane - albo za pośrednictwem rejestru, albo przy użyciu interfejsu Office XP.

Zaledwie kilka ruchów

Mechanizm Smart Tag daje duże możliwości usprawnienia pracy biurowej bez konieczności pisania złożonych i kosztownych aplikacji. Tak naprawdę proste rozpoznawanie słów kluczowych polega na stworzeniu odpowiedniego pliku XML, przetwarzanego następnie przez MOSTL. Bardziej złożone rozpoznawanie, np. kontekstowe, to w zasadzie implementacja nie więcej niż 10 metod.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200