Telefon zamiast komputera

Rozpoznawanie mowy

Najbardziej technologicznie zaawansowanymi rozwiązaniami CTI są systemy wykorzystujące moduły rozpoznawania mowy.

Technologie rozpoznawania mowy są rozwijane od dziesiątków lat przez np. IBM, Lernout & Hauspie, Philips i wiele innych firm. Od lat dostępne jest też oprogramowanie dla PC, umożliwiające rozpoznawanie mowy, ale dopiero ostatnio zaczyna wzrastać jego popularność. Microsoft zdecydował się np. wprowadzić tego typu moduł, jako standardowy element pakietu Office XP (niestety, brak jego polskiej wersji). Zdaniem wielu analityków rynku, w najbliższych latach nastąpi kolejna wielka rewolucja związana właśnie z upowszechnieniem interfejsów głosowych. Przyczyni się do niej przede wszystkim integracja funkcji komputerowych i telefonicznych oraz popularyzacja dostępu do informacji przechowywanych w serwerach za pomocą małych urządzeń przenośnych, takich jak telefony komórkowe.

Do niedawna istotną barierą w implementacji zaawansowanych systemów rozpoznawania mowy był brak ich polskich wersji. A jest to brak o zasadniczym znaczeniu, praktycznie uniemożliwiający zastosowanie. Jedną z pierwszych firm, która zdecydowała się na przygotowanie motoru rozpoznawania obsługującego język polski, był Philips. Jego oprogramowanie wykorzystuje m.in. firma Wind Telecom, oferująca implementacje systemów CTI wyposażone w moduł rozpoznawania języka polskiego.

Najważniejsza jest efektywność

Choć lista zalet i możliwości zastosowań nowych technologii jest duża, to należy pamiętać o istniejących ograniczeniach, a także oczekiwaniach użytkowników, które nie zawsze są zgodne z realiami. W niektórych przypadkach prostsze i mniej zaawansowane technologicznie rozwiązania mogą pracować efektywniej. Na przykład dość powszechnie wykorzystywane systemy IVR z funkcjami wybierania tonowego DTMF mogą być dobrym rozwiązaniem, gdy użytkownik ma do dyspozycji niewielki zakres wyboru funkcji lub połączeń. W przypadku gdy ich liczba wzrasta, konwersacja z automatycznym systemem staje się uciążliwa. Dobrym rozwiązaniem będzie wówczas system rozpoznawania mowy, który na podstawie analizy fraz lub słów zapytania może szybko udzielić odpowiedzi lub odpowiednio przekierować połączenie. Tego typu "inteligentne" systemy sprawdzają się najlepiej w zastosowaniach specjalizowanych. Na przykład automatyczny, telefoniczny informator może szybko i dokładnie informować o giełdowych kursach firm interesujących użytkownika na podstawie analizy zapytania, ale nie udzieli sensownej odpowiedzi na pytanie o jutrzejszą pogodę lub połączenia kolejowe.

Moduły rozpoznawania mowy z reguły oferują dokładność ponad 95%. Choć liczba ta wydaje się dość wysoka, to w praktycznych zastosowaniach system, który będzie miał problemy z identyfikacją co 20. słowa, może się okazać trudny do zaakceptowania. Specjalizacja, a więc ograniczenie liczby analizowanych słów i fraz, umożliwia przyspieszenie reakcji lub wykorzystanie mocy obliczeniowej systemu np. do zwiększenia dokładności rozpoznawania mowy o różnym akcencie.

Telefoniczne surfowanie

Mimo dynamicznego rozwoju Internetu, telefony wciąż są najpowszechniejszym środkiem telekomunikacji. Nowym, interesującym rozwiązaniem są tzw. portale głosowe, udostępniające informacje ze stron internetowych użytkownikom zwykłych telefonów. Choć tego typu systemy mogą być tworzone bezpośrednio w przedsiębiorstwie, jest to dość kosztowne - wymaga zarezerwowania odpowiedniej liczby linii telefonicznych, zakupu systemów IVR, TTS, AVR, ich konfigurowania oraz opracowania aplikacji udostępniającej informacje.

W USA pojawiły się firmy oferujące outsourcing obsługi portali głosowych. Obsługują one numery umożliwiające telefoniczny dostęp do portalu, oprogramowanie obsługujące kody DTMF i rozpoznające mowę (jest ono wykorzystywane np. do nawigacji po różnych poziomach menu, wprowadzania nume-rów kart kredytowych itp.) oraz moduł syntezy mowy, przetwarzający informacje tekstowe na głos. Usługobiorca opracowuje jedynie aplikację w formacie VoiceXML, zawierającą odpowiedni zestaw informacji. Plik VoiceXML może być przechowywany na stronie portalu lub dynamicznie pobierany z firmowego serwera przez Internet.


TOP 200