Microsoft: nowy system rozpoznawania mowy

Microsoft ogłosił, że najnowsza wersja opracowanego przez firmę systemu rozpoznawania i zamieniania mowy na tekst pracuje lepiej i dokładniej niż zespół ludzi realizujących podobne zadanie.

Warto przypomnieć, że Microsoft zaprezentował ten system równo rok temu. Odbierał on rozmowy telefoniczne i zamieniał wypowiadane słowa na tekst. I chociaż system sprawdził się, to specjaliści zarzucali mu, że popełnia więcej błędów niż człowiek.

Microsoft wziął sobie to do serca i pracował przez ostatnie miesiące nad udoskonaleniem systemu. Kilka dni ogłosił, że osiągnął cel, gdyż stopa błędów popełnianych przez najnowszą wersję systemu jest niższa od popełnianych przez człowieka przy rozpoznawaniu głosu.

Zobacz również:

  • Oficjalna premiera modelu Llama 3
  • Były programista Microsoftu: wydajność Windows 11 jest "komicznie zła" nawet na potężnym PC

W przypadku wcześniejszej wersji systemu – zaprojektowanego we wrześniu 2016 roku – stopa błędów wynosiła 6.3%. Oznacza to, że na sto wypowiadanych słów system nie rozpoznawał poprawnie nieco ponad sześciu.

Dla porównania – przeciętna stopa błędów w przypadku jednej osoby słuchającej mowy i zamieniającej ją na tekst współczynnik ten wynosi przeciętnie 5,9%. W przypadku tego samego zadania wykonywanego przez zespół składający się z kilku osób stopa błędów oscyluje w granicy 5,1%.

Microsoft ogłosił kilka dni temu, że nowa wersja systemu może obecnie rywalizować nie tylko z jedną osobą, ale z zespołem ludzi specjalizujących się w wykonywaniu tego rodzaju czynności, gdyż nie rozpoznaje poprawnie mniej niż 5 na 100 wypowiadanych słów.

W opinii specjalistów jest to duże osiągnięcie, gdyż w 2015 roku prognozowali, iż system taki powstanie najwcześniej za pięć lat.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200