Czas na wolność wypowiedzi
- Andrzej Maciejewski,
- 31.10.2011
Rozpoznawanie mowy może zmienić oblicze telefonicznej (samo)obsługi klientów.
W systemie IVR korzystającym z rozpoznawania mowy trzeba zaprojektować umiejętne i dynamiczne reagowanie systemu, m.in. właściwe odpowiadanie na sytuacje niejednoznaczne. Jest to wyzwanie interdyscyplinarne, a zespół inżynierów uzupełnia polonistka. Być może przydałby się także psycholog.
Jan Goliński, wiceprezes zarządu, dyrektor Pionu Aplikacji Biznesowych, Qumak-Sekom
Rozpoznawanie mowy zamiast DTMF
Do obsługi IVR wykorzystywana jest technologia DTMF. Wybieranie tonowe funkcjonuje już od 25 lat ograniczając wybór do wciśnięcia klawiszy od 0 do 9. Tymczasem wachlarz usług i związana z nimi kompleksowość spraw rosną. Coraz trudniej jest rozpisać je na drzewie IVR bez ryzyka wywołania zniechęcenia u klienta. Gdyby nie stanowiło to jednego z kluczowych wskaźników obsługi, o który firmy muszą dbać, jeszcze długo błądzilibyśmy w gąszczu opcji, szukając bezpośredniego połączenia do agenta. Dodatkowo coraz popularniejsze stają się telefony dotykowe i przywołanie klawiatury na ekran staje się uciążliwe. Dla firm IVR stał się jeszcze bardziej wygodnym narzędziem od czasu zastosowania technologii TTS (Text-to-Speech). Syntezator mowy umożliwia błyskawiczne nagranie lub zmianę treści menu samoobsługowego, eliminuje koszty lektora etc.
Nową jakość dla firm i klientów w kanale telefonicznym ma wprowadzić technologia rozpoznawania naturalnej mowy ludzkiej. Dzwoniący, zamiast wciskać klawisze numeryczne, może po prostu powiedzieć, w jakiej sprawie dzwoni. Rozwiązania wykorzystujące ASR (Automatic Speech Recognition) buduje m.in. Qumak-Sekom, wykorzystując technologię Nuance Communications. Automat można nauczyć rozumienia ludzkiej mowy w dwojaki sposób. Służy do tego odpowiednio przygotowana gramatyka - Robust Parsing lub SpeakFreely. Pierwsza polega na tym, że klient powtarza zdefiniowane wcześniej frazy, proponowane przez system IVR. Metoda ta wymaga jednak opracowania listy możliwych wypowiedzi klienta i jest mało przyjazna dla rozmówcy, ponieważ osoba dzwoniąca nadal musi skupiać uwagę na wysłuchaniu listy opcji wyboru.
Dopiero technika SpeakFreely - dzięki zaawansowanej gramatyce - daje klientom swobodę wypowiedzi. Nie ma mowy o konieczności posługiwania się listą wcześniej zdefiniowanych fraz. "Z naszych doświadczeń wynika, że Robust Parsing dobrze sprawdza się w przypadku pytań zamkniętych, z mniejszą liczbą opcji do wyboru. Z kolei metoda SpeakFreely powinna być używana w przypadku pytań otwartych, pociągających za sobą wiele opcji do wyboru, np. na początku interakcji" - mówi Jan Goliński, wiceprezes zarządu, dyrektor Pionu Aplikacji Biznesowych w Qumak-Sekom. Spółka, na bazie technologii Nuance, samodzielnie buduje już systemy ASR wykorzystujące gramatyki Robust Parsing. W przypadku SpeakFreely opracowała własne oprogramowanie wspierające kolejne etapy wdrożenia tej gramatyki. Pilotażowy projekt SpeakFreely toczy się u jednego z polskich operatorów.
Interdyscyplinarne podejście do klienta
Opracowanie gramatyki SpeakFreely wymaga więcej pracy i czasu. Wynika to z faktu, że zbiór fraz, które może wypowiedzieć klient, powstaje m.in. na podstawie przesłuchania nagranych wypowiedzi klientów, obok wstępnych propozycji określonych przez samą firmę. Konieczne jest także zdefiniowanie tzw. intencji, czyli określenie spraw, z którymi mogą dzwonić klienci. W przypadku operatora telekomunikacyjnego ich liczba może sięgać nawet 120 różnych zagadnień. Następnie dokonuje się transkrypcji zebranych wypowiedzi i przyporządkowania im wcześniej zdefiniowanych intencji poprzez odpowiednie oznaczanie (tagowanie). Później następuje etap projektowania dialogów, aby odpowiednio poprowadzić rozmówcę. "Dialog powinien być przyjazny, aby rozmówca odnosił wrażenie kontaktu z człowiekiem. W systemie IVR korzystającym z rozpoznawania mowy trzeba zaprojektować umiejętne i dynamiczne reagowanie systemu, m.in. właściwe odpowiadanie na sytuacje niejednoznaczne. Jest to wyzwanie interdyscyplinarne, a zespół inżynierów uzupełnia polonistka. Być może przydałby się także psycholog" - mówi Jan Goliński.
Zwieńczeniem prac jest wygenerowanie gramatyki dla systemu ASR i jej wdrożenie. Wówczas rozpoczyna się etap "tuningu", obejmujący obserwację zachowania klientów, weryfikację poziomu rozpoznania ich intencji przez ASR oraz analizę zebranych danych. Na tym etapie Qumak-Sekom współpracuje ze specjalistami Nuance, ale zamierza poszerzyć kompetencje, aby i ten etap wykonywać samodzielnie. Bardzo interesujące są obserwacje z pilotażowego wdrożenia. Wielu rozmówców, słysząc nowe, inne powitanie, nie odzywało się z powodu konsternacji lub oczekiwania na dalszy ciąg obsługi. Fraza powitalna odgrywa dużą rolę i należy zachować ostrożność z umieszczaniem w niej konkretnych przykładów, gdyż niektórzy dzwoniący powtarzają je bezrefleksyjnie zamiast wyartykułować swoją sprawę. Część osób nie miała z tym żadnego kłopotu, część zaś nie potrafiła jasno zdefiniować problemu, z którym dzwoni. "Wprowadzeniu systemu ASR powinna towarzyszyć edukacja klientów, jak korzystać z nowego systemu" - podkreśla Jan Goliński.
$Computerworld był patronem medialnym konferencji "Nowe trendy w obsłudze i samoobsłudze klienta" organizowanej przez Qumak-Sekom.