Rozpoznawanie głosu

Być może już wkrótce praca z komputerem nie będzie się nam kojarzyć z uciążliwym wklepywaniem danych na klawiaturze, a polegać będzie raczej na wydawaniu mu poleceń ustnie czy odczytywaniu listów na głos, które procesor tekstu automatycznie przetworzy i wydrukuje. A wszystko to za sprawą coraz doskonalej pracujących produktów typu AVR (Automatic Voice Recognition - automatyczne rozpoznawanie mowy).

Być może już wkrótce praca z komputerem nie będzie się nam kojarzyć z uciążliwym wklepywaniem danych na klawiaturze, a polegać będzie raczej na wydawaniu mu poleceń ustnie czy odczytywaniu listów na głos, które procesor tekstu automatycznie przetworzy i wydrukuje. A wszystko to za sprawą coraz doskonalej pracujących produktów typu AVR (Automatic Voice Recognition - automatyczne rozpoznawanie mowy).

Na rynku pojawiło się ostatnio sporo nowych systemów AVR, które są z reguły dziełem mniej znanych, niezależnych producentów oprogramowania. Jednak postęp techniczny w tej dziedzinie i zwiększone zainteresowanie użytkowników spowodowały, że produkcją systemów AVR zajęły się też firmy z pierwszego szeregu. Szczególnie duże zainteresowanie klientów wzbudzają, wprowadzone w 1994 r. na rynek, systemy AVR pracujące pod OS/2 i Windows.

Systemem AVR pracującym pod Windows jest pakiet Kurzweil Voice for Windows 1.2, opracowany przez Kurzweil Applied Intelligence. Jednym z jego użytkowników jest Phil Terry, pracownik techniczny firmy Investors Service w Nowym Jorku. Terry cierpi na przewlekłą chorobę reumatyczną, która uniemożliwia mu wykonywanie jakichkolwiek czynności manualnych. Dzięki systemowi AVR może on jednak dalej pracować z komputerem, bez potrzeby używania klawiatury i myszy. Może on uruchamiać te same aplikacje systemu Windows, które są używane przez pozostałych pracowników w biurze.

IBM też dostrzegł zwiększony popyt na systemy AVR i oferuje od początku 1994 r. pakiet VoiceType Dictation for OS/2, a pod koniec 1994 r. wprowadził na rynek ten sam pakiet w wersji dla systemu Windows. Wielu innych producentów oprogramowania dla komputerów stołowych, w tym WordPerfect i Novell, nawiązuje współpracę z firmami specjalizującymi się w systemach AVR, celem wbudowania ich do swoich znanych aplikacji użytkowych. Z kolei Microsoft poinformował, że pracuje nad interfejsem dla Windows 96, który umożliwi komunikowanie się z tym systemem za pomocą głosu.

Oprócz wymienionej już firmy Kurzweil, przodującymi producentami systemów AVR są: Kolvox Communications Inc. i Verbex Voice Systems. Technologie opracowane przez te firmy (tak oprogramowanie, jak i specjalizowane karty) pozwolą już wkrótce porozumiewać się głosem z procesorami tekstu firmy WordPerfect czy arkuszami kalkulacyjnymi Excel firmy Microsoft.

Ważne jest to, że systemy te nie są już postrzegane jako pewnego rodzaju ciekawostka, czy niedoskonała jeszcze techniczna nowinka, ale jako normalne narzędzie pracy, zastępujące coraz częściej klawiaturę i mysz. Jest to możliwe dzięki zastosowaniu nowych technologii, dzięki którym systemy AVR są coraz tańsze i spełniają w coraz większym stopniu oczekiwania klientów.

Niższe ceny, lepsza jakość

Firmą, która zamierza wyposażyć swoje aplikacje linii Irma w system rozpoznawania mowy opracowany przez Verbex Voice Systems jest Digital Communication Associates Inc. Pakiet rozpoznawania mowy Listen for Irma dołączany jest już bezpłatnie do aplikacji Quick App i QuickPeer. W pierwszym kwartale 1995 r. Listen for Irma sprzedawany będzie oddzielnie. Cena - 49 USD.

Droga do tak tanich i w miarę niezawodnie pracujących systemów, jakim jest Listen for Irma, była jednak długa i wypełniona trudnościami. Jeszcze dwa lata temu za system AVR płaciło się co najmniej 5 tys. USD. Podobnego typu system, składający się z oprogramowania i karty, pracujący nieporównanie lepiej i co ważne niezawodnie, kosztuje obecnie mniej niż 1 tys. USD.

Voice Information Associates szacuje, że obroty na rynku systemów AVR osiągną w 1997 r. poziom 647 mln USD. Jest to ponad czterokrotny wzrost w porównaniu z 1992 r. (159 mln USD). Nie jest jednak do końca pewne, na ile ten sposób komunikowania się z komputerem zastąpi tradycyjne metody. Dużo zależy od nowych rozwiązań technicznych, jak i od przekonania klientów, że jest to narzędzie rzeczywiście ułatwiające im codzienną pracę.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200