Komputer z ludzkim głosem

Jeszcze kilka lat temu komputerowa synteza polskiej mowy wydawała się nie do zrealizowania.

Jeszcze kilka lat temu komputerowa synteza polskiej mowy wydawała się nie do zrealizowania.

SynTalk 1.1 jest kolejną, ulepszoną wersją oprogramowania do syntezy mowy opracowywanego przez Neurosoft. Pakiet zawiera sześć 32-bitowych aplikacji - które powodują, że niemy komputer zaczyna przemawiać we w miarę poprawnej polszczyźnie - SynTalk, OLETalk, EditTalk, NetTalk, ClockTalk i TrueTalk.

SynTalk to główny moduł służący do generowania mowy, który zamienia tekst z postaci graficznej na akustyczną. OLETalk jest serwerem OLE umożliwiającym dołączanie do dokumentów z innych aplikacji obiektów stanowiących "komentarz słowny". EditTalk pozwala odczytywać na bieżąco informacje wprowadzane przez użytkownika za pomocą klawiatury. NetTalk umożliwia wysyłanie przez sieć (MS Networks - NetDDE) komunikatów dźwiękowych, tzn. informacji, które są odczytywane syntetycznym głosem przez komputery wyposażone w SynTalk. ClockTalk - to mówiący po polsku zegar, a TrueTalk jest doradcą serwującym użytkownikowi, dowolnie dobrane, przekazywane syntetycznym głosem prawdy życiowe.

SynTalk 1.1 umożliwia odczytywanie tekstów przechowywanych w schowku Windows 95, a także współpracuje z aplikacjami Microsoft Word oraz Excel w wersjach 6.0, 7.0. Po instalacji pakiet dołącza do programów odpowiedni zestaw makrokomend oraz dodatkowe paski narzędzi służące do obsługi syntezy mowy. Niestety, program nie jest w stanie odczytywać dużych, ponad 100-stronicowych dokumentów z edytora, natomiast zupełnie dobrze sobie radzi z tekstami kilkustronicowymi. Program jest wyposażony w funkcję zapewniającą poprawną zamianę dat na słowa, o ile zapisano je w formacie zgodnym ze standardem zdefiniowanym w ustawieniach regionalnych. Dodatkowe opcje obejmują także: odczytywanie pełnych liczb z uwzględnieniem pozycji cyfry w liczbie, słownik skrótów i wyjątków (z możliwością rozbudowy), wskaźnik regulacji prędkości czytania, oraz funkcje służące do literowania słów złożonych z wielkich liter, akcentowania każdego słowa i stosowania wymowy potocznej.

Syntetyczna mowa generowana przez SynTalk jest bardzo sucha i gardłowa, a gadający komputer czasami zacina się. Trochę brakuje możliwości lepszego dopasowania brzmienia głosu do upodobań użytkownika - brzmienie ma zupełnie bezosobowy charakter. Komputer mówi zrozumiale i w miarę wyraźnie (oprócz nieznacznych kłopotów z głoską r), nawet korzystając z wewnętrznego głośnika komputera PC.

SynTalk może być bardzo przydatny dla osób niewidomych bądź niedowidzących, które pracują z komputerem. Oprócz tego pakiet można wykorzystać, w ograniczonym zakresie, do porównywania tekstów bądź danych dostępnych w formie elektronicznej z informacjami zapisanymi na innym nośniku. SynTalk jest dużym technologicznym krokiem naprzód w zakresie poprawnej syntezy mowy dla języka polskiego. Może w przyszłości doczekamy się systemu rozpoznawania mowy (obsługującego język rodzimy), który umożliwiałby sprawowanie kontroli nad aplikacjami, czy systemem operacyjnym, bądź pozwalał dyktować teksty bezpośrednio do edytora.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200