Oferta firmy Dragon Systems jest przeznaczona dla programistów systemów przetwarzania mowy.

Oferta firmy Dragon Systems jest przeznaczona dla programistów systemów przetwarzania mowy.

Oferta firmy Dragon Systems jest przeznaczona dla programistów systemów przetwarzania mowy.

NaturallySpeaking SDK ma gotowe do użycia elementy ActiveX realizujące takie zadania, jak odczytywanie sygnałów z mikrofonu, przetwarzanie tekstu na głos i edycja danych audio.

Dzięki Dragon Systems rywalizacja o opanowanie na rynku aplikacji przetwarzających mowę nabiera nowej formy. Firma ta wprowadziła na rynek nowy pakiet dla programistów - NaturallySpeaking SDK (Software Development Kit), przeznaczony do tworzenia aplikacji klasy AVR (Automatic Voice Recognition - automatyczne rozpoznawanie mowy). Bazuje on na technologii ActiveX. Dragon NaturallySpeaking otrzymał już wiele prestiżowych nagród, w tym tytuł Best of Comdex na jesiennych targach komputerowych w Las Vegas. Natomiast kolejnych nowości w dziedzinie aplikacji do przetwarzania mowy można oczekiwać za kilka miesięcy. IBM Speech Systems i Lernout and Hauspie (L&H) kończą obecnie prace nad nowymi programami do komputerowego przetwarzania tekstów na mowę. Na przykład pakiet L&H Voice Express ma zawierać funkcję wyboru tzw. fontu mowy, który - podobnie jak fonty określające kroje czcionek - pozwoli na definiowanie rodzaju syntetycznego głosu odtwarzającego tekst.

NaturallySpeaking SDK ma gotowe do użycia elementy ActiveX realizujące takie zadania, jak odczytywanie sygnałów z mikrofonu, przetwarzanie tekstu na głos i edycja danych audio. W jego skład wchodzi również moduł do rozpoznawania mowy (AVR - wersja run time). Narzędzia te mogą być wykorzystywane do budowania aplikacji zastępujących dyktafony, programów używanych w medycynie lub pozwalających na szybkie wprowadzanie danych do pamięci komputera bez użycia klawiatury.

Analitycy rynku podkreślają, że wprowadzenie elementów ActiveX do pakietu klasy SDK jest ważnym działaniem, który niewątpliwie przyspieszy rozwój aplikacji korzystających z technologii przetwarzania mowy. W najbliższym czasie można też oczekiwać znacznego rozszerzenia zastosowań tej technologii w wielu nowych dziedzinach.

Już na lutowych targach Demo '98 w Kalifornii firma Actioneer zaprezentowała system Action Messenger do zarządzania komunikatami głosowymi. Oprogramowanie oferuje mechanizmy, dzięki którym użytkownik może wydawać głosowe polecenia przy pracy z takimi aplikacjami, jak Outlook, Lotus Notes i PalmPilot Desktop. Przy tworzeniu Action Messenger, firma korzystała z technologii opracowanej przez Dragon Systems. Jak twierdzą przedstawiciele Actioneer, dzięki zastosowaniu pakietu NaturallySpeaking SDK z elementami ActiveX możliwe było szybsze ukończenie prac nad tą aplikacją niż przy zastosowaniu klasycznych narzędzi programistycznych.

Dotychczas zarówno IBM, jak i Lernout and Hauspie nie ujawniają, kiedy technologia ActiveX zostanie wykorzystana w oferowanych przez te firmy pakietach ViaVoice i Voice Express. Wiadomo jednak, że nowe wersje tych aplikacji na pewno będą korzystać z ActiveX.

Specjaliści zwracają uwagę na korzyści płynące z użycia tzw. fontów mowy, które pozwalają nie tylko na odtwarzanie charakterystycznych cech mowy użytkownika, ale również przetwarzanie lub przesyłanie plików dźwiękowych w postaci skompresowanej. Dzięki temu cyfrowe pliki audio mogą mieć znacznie mniejszą objętość niż zapisane techniką analogową.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200