Rozmowa z serwerem

Microsoft opublikował wersję beta serwera usług głosowych Speech Server i towarzyszącego mu pakietu narzędzi Speech Application SDK. Ostateczne wersje trafią na rynek w pierwszym kwartale 2004 r.

Microsoft opublikował wersję beta serwera usług głosowych Speech Server i towarzyszącego mu pakietu narzędzi Speech Application SDK. Ostateczne wersje trafią na rynek w pierwszym kwartale 2004 r.

Speech Server to platforma serwerowa dla aplikacji głosowych działająca na zasadzie podobnej do serwera WWW - akcja ze strony użytkownika powoduje przesłanie w jego kierunku nagranego wcześniej pliku głosowego pobranego z bazy danych lub pliku tekstowego w języku SALT (Speech Application Language Tags), interpretowanego przez oprogramowanie klienckie. Język SALT jest rozszerzeniem języka XHTML, znacznie uproszczonym w porównaniu z pełnym językiem Voice XML używanym w "dużych" aplikacjach głosowych, np. serwisach opartych na technice IVR.

Sercem pakietu Speech Server jest oprogramowanie rozpoznawania mowy i do zamiany tekstu na głos. Speech Server został jednak zaprojektowany w taki sposób, aby móc współpracować z istniejącymi aplikacjami działającymi na serwerze WWW. Klientem aplikacji wykorzystujących Speech Server ma być zwykły telefon, PDA i przeglądarka.

Oprócz prostych aplikacji, w których serwer reaguje na komendy wydawane głosem przez użytkownika, Speech Server pozwala budować aplikacje "mieszane", w których komendy wydawane przy użyciu klawiatury i myszy współistnieją z komendami głosowymi. Podobnie reakcja serwera może polegać na równoległym wysyłaniu informacji głosowych i wyświetlaniu kontekstowych informacji na ekranie pochodzących z istniejących aplikacji WWW. Przykładowo, użytkownik może zażądać od aplikacji wyświetlenia określonego raportu, a jednocześnie odsłuchać związanego z nim komentarza.

W ramach pakietu SDK Microsoft przygotował komponenty integrujące Speech Server z pakietem Visual Studio.Net. Przykładowo, istnieją w nim gotowe komponenty do obsługi podawanych tonowo lub głosowo "wrażliwych" danych, takich jak hasła czy numery kart kredytowych. W SDK znalazł się także symulator serwera Speech Server umożliwiający lokalne testowanie rozproszonych aplikacji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200