Rozmowa z serwerem
- 21.07.2003
Microsoft opublikował wersję beta serwera usług głosowych Speech Server i towarzyszącego mu pakietu narzędzi Speech Application SDK. Ostateczne wersje trafią na rynek w pierwszym kwartale 2004 r.
Microsoft opublikował wersję beta serwera usług głosowych Speech Server i towarzyszącego mu pakietu narzędzi Speech Application SDK. Ostateczne wersje trafią na rynek w pierwszym kwartale 2004 r.
Speech Server to platforma serwerowa dla aplikacji głosowych działająca na zasadzie podobnej do serwera WWW - akcja ze strony użytkownika powoduje przesłanie w jego kierunku nagranego wcześniej pliku głosowego pobranego z bazy danych lub pliku tekstowego w języku SALT (Speech Application Language Tags), interpretowanego przez oprogramowanie klienckie. Język SALT jest rozszerzeniem języka XHTML, znacznie uproszczonym w porównaniu z pełnym językiem Voice XML używanym w "dużych" aplikacjach głosowych, np. serwisach opartych na technice IVR.
Sercem pakietu Speech Server jest oprogramowanie rozpoznawania mowy i do zamiany tekstu na głos. Speech Server został jednak zaprojektowany w taki sposób, aby móc współpracować z istniejącymi aplikacjami działającymi na serwerze WWW. Klientem aplikacji wykorzystujących Speech Server ma być zwykły telefon, PDA i przeglądarka.
Oprócz prostych aplikacji, w których serwer reaguje na komendy wydawane głosem przez użytkownika, Speech Server pozwala budować aplikacje "mieszane", w których komendy wydawane przy użyciu klawiatury i myszy współistnieją z komendami głosowymi. Podobnie reakcja serwera może polegać na równoległym wysyłaniu informacji głosowych i wyświetlaniu kontekstowych informacji na ekranie pochodzących z istniejących aplikacji WWW. Przykładowo, użytkownik może zażądać od aplikacji wyświetlenia określonego raportu, a jednocześnie odsłuchać związanego z nim komentarza.
W ramach pakietu SDK Microsoft przygotował komponenty integrujące Speech Server z pakietem Visual Studio.Net. Przykładowo, istnieją w nim gotowe komponenty do obsługi podawanych tonowo lub głosowo "wrażliwych" danych, takich jak hasła czy numery kart kredytowych. W SDK znalazł się także symulator serwera Speech Server umożliwiający lokalne testowanie rozproszonych aplikacji.