Więcej głosu

Nuance Communications kontynuuje strategię budowy pozycji na europejskim rynku systemów rozpoznawania mowy. Rozszerza też działalność w Polsce.

Moją osobistą ambicją było, aby pojawiła się polska wersja Dragon Dictation i Dragon Search. Przekonywałem zarząd, że jest to niezbędne, aby rozwiać wątpliwości wokół możliwości tej technologii.

Peter Martis, dyrektor regionu CEE w Nuance Communications

Struktura Nuance Communications, odpowiedzialna wyłącznie za region europejski, została powołana w I połowie 2010 r. Peter Martis dyrektor regionu CEE w Nuance twierdzi, że niedługo pojawią się efekty jego pracy z polskimi klientami z branży finansowej i telekomunikacyjnej. "Operatorzy i banki wyraziły zainteresowanie systemami rozpoznawania mowy i biometrii głosowej" - mówi. Wdrożenia systemów biometrii głosowej umieściło już w planach inwestycyjnych 10 banków w Polsce!

Biometria głosowa i...

Pierwsze zapytania ofertowe pojawią się do końca tego roku, kolejne w I kwartale 2012 r. Do końca roku powinny zostać zrealizowane dwa projekty wykorzystujące biometrię. Jeden w banku, drugi u operatora komórkowego, gdzie biometria głosowa będzie stosowana do zmiany hasła przez pracowników. Z kolei technologia rozpoznawania mowy (ASR) jest w fazie pilotażu w jednej z polskich firm.

Nuance opiera się na ścisłej współpracy z wąskim gronem partnerów, mających dobre relacje z klientami w kluczowych branżach. Największe doświadczenie zdobył w tej chwili w Polsce Qumak-Sekom. Docelowo każdy partner będzie samodzielnie realizować projekt z zakresu ASR czy biometrii. Dziś potrzebne jest jeszcze wsparcie ekspertów Nuance.

Systemy wspomagające obsługę klienta to jeden z czterech głównych obszarów działalności tej firmy. W Polsce to, jak na razie, największe źródło przychodów firmy. Drugie to obszar zarządzania dokumentami. Od minionego lata na polskim rynku w ofercie Tech Data dostępne są aplikacje do pracy, m.in. z plikami pdf. Technologia Nuance wykorzystywana jest także przez dostawców systemów zarządzania drukiem i obiegiem dokumentów.

... przetwarzanie słowa na tekst

Trzeci obszar to aplikacje przepisujące mowę na tekst - Dragon Dictation i Dragon Search. Właśnie pojawiła się ich polska wersja na platformę iOS. Peter Martis ujawnia, że jego osobistą ambicją było, aby pojawiła się polska wersja. "Przekonywałem zarząd, że jest to niezbędne, aby rozwiać wątpliwości wokół możliwości tej technologii" - dodaje. Teraz polski partner Nuance pracuje nad wersją na platformę Android i Windows Mobile. Pierwsza z tych wersji powinna być dostępna jeszcze w tym roku. Z kolei w roku 2012 dostępne mają być wersje aplikacji Dragon dla komputerów desktop. Rozwiązanie to wprowadzone zostanie wraz ze słownikami branżowymi dla trzech grup zawodowych - prawników, lekarzy i dziennikarzy. Koszt wersji na komputery desktop to ok. 100 USD.

Dragon może służyć do dyktowania SMS-ów, maili, poleceń wyszukiwania informacji na różnych serwisach, w tym Google i YouTube. Zapytanie, czy też dyktowane zdanie, jest przesyłane na serwer Nuance, gdzie jest analizowane, a następnie odpowiedź (np. zapisane zdanie) jest z powrotem przekazywana do modułu klienta urządzenia działającego pod kontrolą systemu iOS. Najczęściej użytkownicy Dragon Dictation dyktują komunikaty SMS.

Czwarty obszar działalności Nuance to licencjonowanie technologii producentom elektroniki użytkowej. Firma oferuje bezpłatnie pakiet SDK do systemu Dragon Dictation dla partnerów tworzących na bazie nieswoich rozwiązań. Rozwiązanie to zastosował m.in. Apple w nowej wersji systemu iOS5 (Siri). W Polsce zaś rozwiązania Nuance do systemów nawigacyjnych wprowadziła firma Bury Technologies. Dzięki rozpoznawaniu mowy łatwiej jest odnaleźć poszukiwany adres i zlecić wyznaczenie trasy, zwłaszcza podczas kierowania samochodem. Z kolei w Niemczech rozwiązania Nuance zostały wprowadzone do ekspresów do kawy firmy Miele. Natomiast w Wlk. Brytanii korzysta z niej Aviva w swoim call center.

Jednocześnie Nuance Communications cały czas rozbudowuje portfolio rozwiązań. Służyć mają temu m.in. niedawne zakupy firmy obejmujące izraelski Persay, włoskie Loquendo, szwajcarski SVOX i amerykański Swype.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200