Rozmowy z komputerem

Układy rozpoznawania mowy zaczynają coraz szerzej trafiać na rynki związane z komputerami PC.

Układy rozpoznawania mowy zaczynają coraz szerzej trafiać na rynki związane z komputerami PC.

Po zainstalowaniu odpowiedniej karty, mikrofonu, i oprogramowania możemy słuchać tego, co ma do powiedzenia komputer i wydawać mu polecenia przy użyciu głosu. Systemy rozpoznawania głosu na razie nie zastąpią klawiatury czy myszy, jednak w przypadku niektórych zastosowań są na pewno wygodniejsze od nich w użyciu. Możemy np. wydać polecenie uruchomienia jakiejś aplikacji spod systemu Windows (mówiąc np. delete, cut, paste) lub, po wprowadzeniu danych do arkusza kalkulacyjnego, sprawdzić jakość swojej pracy przesłuchując odczytywane przez komputer szeregi cyfr, nie odejmując przy tym wzroku od dokumentów źródłowych. Istnieje już szereg systemów rozpoznawania mowy przeznaczonych do komputerów osobistych. Przedstawiamy niektóre z nich w załączonej tabeli.

Microsoft był jedną z pierwszych firm, które wprowadziłya na rynek system rozpoznawania mowy przeznaczony dla Windows.

Jest to część Windows Sound System, który składa się z zestawu sprzętowo-software'owego i używa w swej pracy głosu, muzyki i efektów dźwiękowych, wykorzystując w pełni możliwości Windows 3.1 w tym zakresie. Zestaw ten umożliwia także korzystanie z technik łaczenia i osadzania obiektów (OLE) co pozwala na jego współpracę ze wszystkimi aplikacjami zgodnymi z OLE, jak: procesory tekstu, arkusze kalkulacyjne, poczta elektroniczna czy grafika prezentacyjna.

Rozpoznawanie mowy zawarte jest w jednej z aplikacji nazwanej Voice Pilot. Wyposażono ją w słownik poleceń, wydawanych przy użyciu głosu, dla 15 najbardziej popularnych aplikacji, pracujących w środowisku Windows, włączając w to Word for Windows, PageMaker i WordPerfect for Windows oraz Excel. Aby przenieść fragment tekstu napisanego przy użyciu edytora wystarczy zaznaczyć blok myszą i głośno powiedzieć "cut". Następnie, po przesunięciu do nowej pozycji mówimy "paste" i tekst pojawia się w nowym miejscu.

Co więcej, przy użyciu Voice Pilot możemy tworzyć własne makropolecenia, wykonujące serię czynności w reakcji na głośno wypowiedziany jednowyrazowy rozkaz. Warto bowiem wiedzieć, że dostarczony słownik przyjmuje nowe słowa, a system Windows Sound System będzie je umiał rozpoznawać. Możemy w ten sposób tak "wytrenować" system, aby rozumiał np. komendy wypowiadane po polsku.

Kolejna aplikacja, ProofReader, to korektor odczytujący zawartość arkusza, którą możemy porównać np. z materiałem źródłowym. Uruchamiamy go z dodatkowego menu umieszczonego w Excelu. Po zaznaczeniu bloku myszą i ustaleniu, w jakiej kolejności mają być czytane wartości (wg wierszy czy kolumn), słyszymy w słuchawkach głos czytający po angielsku kolejne liczby. Możemy ustalić jego prędkość i odstępy między liczbami.

Dostarczone razem z kartą oprogramowanie pozwala wstawiać komentarze głosowe w odpowiednie miejsce arkusza czy poczty elektronicznej, obróbkę zapisanego dźwięku, dodawanie efektów specjalnych czy stopniowe wyciszanie (aplikacja Quick Recorder).

Karta audio posiada również wejście stereo, do którego da się podłączyć odtwarzacz CD. Możemy słuchać muzyki z płyt CD, sterować poziom dźwięków, wprowadzać i zmieniać na inne pliki zapis dźwięków w formatach *.wav, *.voc, *.mid, *.rmi, a także pliki z systemów NEXT i Macintosh.

Windows Sound System możemy używać z komputerem 386 SX/16 MHz lub lepszym, posiadającym zainstalowany system operacyjny Windows 3.1, pamięć operacyjną 640 + 256 kB RAM (optymalnie 2048 kB RAM), kartę VGA oraz DOS 3.3 lub więcej (najlepiej DOS 5.0).

Wszystkie atrakcje, które zapewnia Windows Sound System można było podziwiać na stoisku firmy Mikrokom-Soft z Wrocławia (tel. (071) 44 21 69) na targach Komputer-Expo '93, gdzie zestaw ten był prezentowany po raz pierwszy w Polsce. Jak się niedawno dowiedzieliśmy, omawiany zestaw jest od marca dostępny na rynku krajowym w cenie 289 USD.


TOP 200