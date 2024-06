SoftBank (japoński gigant technologiczny) informuje, że pracuje nad ciekawym rozwiązaniem obsługiwanych przez sztuczną inteligencję, które zostało opracowane z myślą o zapewnieniu większego komfortu pracy osobom pracującym w dziale obsługi klientów.

Technologia została opracowana w ramach firmowego projektu SoftBanku noszącego nazwę SoftBank Innoventure, we współpracy z The Institute for AI and Beyond, który jest wspólnym instytutem badawczym AI założonym przez Uniwersytet Tokijski. Technologia modyfikacji głosu w czasie rzeczywistym ma na celu zmniejszenie stresu wśród pracowników call center. Rozwiązanie będzie zmieniać głos dzwoniących do tego działu klientów – którzy są zdenerwowani i pełni złości - w taki sposób, aby był stonowany i brzmiał spokojnie. Jest to specyficznego rodzaju wyciszacz emocji. Projekt ma na celu zmniejszenie obciążenia psychicznego operatorów, którzy mają często do czynienie ze sfrustrowanymi i zdenerwowanymi klientami.

Na przykład wysoki, donośny głos może zostać obniżony, podczas gdy głęboki męski głos może zostać podniesiony do wyższej tonacji. Według doniesień technologia ta nie zmienia treści ani sformułowań mowy klienta i zachowuje niewielki element słyszalnego gniewu, aby operator mógł nadal ocenić stan emocjonalny klienta. Model AI monitoruje również długość i treść rozmowy, wysyłając komunikat ostrzegawczy, jeśli uzna, że interakcja jest zbyt długa lub obraźliwa.

Zobacz również:

Jak podają japońskie serwisy, projekt SoftBanku opiera się na modelu sztucznej inteligencji, który zmienia ton i wysokość głosu klienta w czasie rzeczywistym podczas rozmowy telefonicznej. Programiści przeszkolili system przy użyciu zbioru danych zawierającego ponad 10 tys. próbek głosu. Są to głosy nagrane przez aktorów, wyrażających różnego rodzaju emocje, w tym krzyki i oskarżenia.

Analizując próbki głosu, model sztucznej inteligencji SoftBank nauczył się rozpoznawać i modyfikować charakterystykę głosu wyrażającą złość i wrogość. Kiedy klient rozmawia z operatorem call center, model przetwarza przychodzący dźwięk i dostosowuje wysokość i fleksję głosu klienta, aby brzmiał spokojniej i mniej groźnie.

Technologia klonowania i syntezy głosu poczyniła ogromne postępy w ciągu ostatnich trzech lat. Microsoft opracował np. system, który jest w stanie klonować głos mając do dyspozycji trzysekundową próbkę dźwięku. Podobne narzędzia opracowała też firma Adobe. Softbank zapowiada, że system zostanie wdrożony w jego dziale obsługi klientów w pierwszym kwartale 2026 roku.