Rozmowa po polsku z maszyną

Mimo że systemy rozpoznawania mowy i sterowania funkcjami komputerów za pomocą głosu są rozwijane od co najmniej kilkunastu lat, dopiero ostatnio zaczynają znajdować praktyczne zastosowania - zarówno jako głosowe interfejsy użytkownika aplikacji biurowych, jak i zautomatyzowane systemy odpowiedzi w call center.

Mimo że systemy rozpoznawania mowy i sterowania funkcjami komputerów za pomocą głosu są rozwijane od co najmniej kilkunastu lat, dopiero ostatnio zaczynają znajdować praktyczne zastosowania - zarówno jako głosowe interfejsy użytkownika aplikacji biurowych, jak i zautomatyzowane systemy odpowiedzi w call center.

Większość znanych firm, opracowujących tego typu oprogramowanie, takich jak IBM lub Lernout & Hauspie, nie decydowała się dotąd na jego polską lokalizację - przede wszystkim ze względu na brak perspektywy szybkiego zwrotu takiej inwestycji. Również Microsoft, który do najnowszego pakietu aplikacji biurowych Office XP wprowadził moduł rozpoznawania i generowania mowy, nie oferuje tej funkcji w wersji polskiej. Pierwsze próby zastosowania tej technologii podjął kilka lat temu IBM, standardowo wyposażając system operacyjny OS/2 w moduł rozpoznawania mowy. Natomiast pierwszą firmą, która opracowała wersję systemu rozpoznawania dźwięków wykorzystywanych w języku polskim, jest Philips.

Philips

Technologia Philipsa jest wykorzystywana przez Wind Telecom, polską firmę specjalizującą się w tworzeniu oprogramowania i integrowania systemów telefonii komputerowej. Wind Telecom oferuje m.in. aplikacje do automatycznej dystrybucji połączeń telefonicznych, automatycznego, interaktywnego udostępniania informacji z baz danych, poczty elektronicznej itd., które wykorzystują technologie rozpoznawania i generowania mowy.

Systemy te składają się z oprogramowania oraz specjalizowanych kart instalowanych w serwerach. Są przeznaczone dla firm, które zamierzają zbudować lub zwiększyć efektywność centrów obsługi klientów.

Ważnym produktem Wind Telecom jest Contactis - system typu Contact Center, który umożliwia budowę zinteg-rowanego systemu obsługującego połączenia telefoniczne, faksowe, pocztę elektroniczną, wspólne z klientem przeglądanie stron WWW i oferującego funkcje automatycznego kierowania połączeń wewnętrznych, rejestracji rozmów, udostępniania informacji z baz danych, a także generowania raportów wspomagających zarządzanie firmą.

Jak twierdzi Krzysztof Cegielski, dyrektor ds. sprzedaży i marketingu w Wind Telecom, jest to jedyna w Polsce kompleksowa oferta systemu Contact Center, chociaż pojedyncze moduły o podobnym zestawie funkcji są też sprzedawane przez inne firmy, np. Neurosoft, która od lat rozwija i sprzedaje programy do generowania mowy syntetycznej - SynTalk.

Wspomaganie programistów

Najnowszym produktem firmy jest platforma VoiceXML - zestaw funkcji i bibliotek dźwięków, przeznaczony dla programistów budujących strony WWW. VoiceXML ułatwi tworzenie portali głosowych. Tego typu rozwiązanie zostanie prawdopodobnie wkrótce wykorzystane w jednym ze znanych polskich portali internetowych - byłby to jeden z pierwszych systemów tego typu w Europie.

Wind Telecom przygotowuje również system identyfikacji osób za pomocą analizy głosu. Tego typu technologia jest znana - teoretycznie może być wykorzystana np. do weryfikowania i logowania użytkownika komputera PC. Ale wydaje się, że najpierw znajdzie ona zastosowanie w systemach łączności telefonicznej, umożliwiając identyfikację np. osoby wydającej przez telefon dyspozycję wykonania operacji bankowej.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200