Mów mi procesor

Być może już za rok aplikacje wykorzystujące procesory nowej generacji będą obsługiwane głosem.

Być może już za rok aplikacje wykorzystujące procesory nowej generacji będą obsługiwane głosem.

Technologia obsługi mowy ma znaleźć się w procesorach Katmai, których premierę Intel zapowiedział na początek przyszłego roku. Eksperci przewidują, że do roku 2000 będzie ona umożliwiała nie tylko przetwarzanie mowy na tekst. "Będziemy mogli zapytać komputer, jaka była sprzedaż we wrześniu ubiegłego roku, porównując ją z rokiem bieżącym" - twierdzi Steven Rondel, prezes firmy Conversational Computing. Microsoft prawdopodobnie zastąpi lub uzupełni obecnie stosowany graficzny interfejs Windows interfejsem dźwiękowym. Opracowane przez Microsoft narzędzie Whistler, przetwarzające tekst na mowę, przeznaczone będzie do udostępniania danych, takich jak e-mail za pośrednictwem linii telefonicznych. Zostanie ono zastosowane w Windows NT 5.0 i kolejnych systemach operacyjnych tej firmy.

Sekretarka bez pracy

Intel utworzył osobny dział, wydzielony z grupy tworzącej Katmai, który jest odpowiedzialny wyłącznie za technologie obsługi mowy. Opracowano już nowy zestaw instrukcji Katmai, pracujących według "ukrytego modelu Markova" - zestaw algorytmów wykorzystywanych przez programistów do poprawienia dokładności i szybkości rozpoznawania mowy. Zdaniem Raphaela Wonga, odpowiedzialnego w Intelu za ten program, obecnie stosowane algorytmy mowy są doskonałe. Dotychczasową przeszkodą w ich zastosowaniu były niedostateczne parametry procesorów. Wszystko ma się zmienić w przyszłym roku, kiedy na rynku pojawią się jednostki z zegarem szybszym niż 450 MHz. Nowy zestaw instrukcji Katmai ma też umożliwić przetwarzanie bez zniekształceń głosu i danych za pośrednictwem linii telefonicznych.

Zdaniem Davida Nahamoo z działu IBM zajmującego się technologiami wykorzystującymi głos ludzki, w przyszłym roku aplikacje reagujące na głos i obsługiwane za pośrednictwem telefonu stworzą drogę do powstania nowych usług korporacyjnych.

Nie tylko Intel

Intel nie jest jedyną firmą planującą zastosowanie mowy w swoich rozwiązaniach. Konsorcjum powołane przez IBM i Sun Microsystems planuje udostępnić w I kwartale 1999 r. pierwsze interfejsy API dla Javy, wykorzystujące technologie mowy. IBM na bazie Javy opracowuje przeglądarkę, która ma być obsługiwana głosem.

Historia i przyszłość rozpoznawania mowy

1993 r.

Microsoft umożliwił uruchamianie aplikacji za pomocą jednowyrazowych komend

1997 r.

Dragon Systems opracował pierwszy program pozwalający na ciągłe dyktowanie tekstu

1998 r.

Specyfikacja sprzętowa PC 99 Microsoftu wymaga stosowania wejścia audio do rozpoznawania mowy

Microsoft Speech API 4.0 zostaje wyposażone w moduł do rozpoznawania mowy

I kw. 1999

Instrukcje procesorowe Katmai z możliwością rozpoznawania mowy

API dla Javy stosujące aplikacje obsługujące mowę w różnych środowiskach i systemach operacyjnych

IV kw. 1999 r.

Rozpoznawanie mowy jako element standardowy większości pakietów biurowych

II kw. 2000 r.

Pojawienie się pierwszych aplikacji rozpoznawania głosu dla komputerów naręcznych

II kw. 2002 r.

Rozpoznawanie mowy jako standardowy element systemu Windows