SynTalk dla Windows

SynTalk to program służący do odczytywania (przekształcania na dźwięki) tekstów napisanych w języku polskim.

SynTalk to program służący do odczytywania (przekształcania na dźwięki) tekstów napisanych w języku polskim.

Aplikacja jest przeznaczona do pracy w środowisku Windows 3.1x, a jej cechą wyróżniającą jest to, że do generowania dźwięku używa standardowych mechanizmów - Multimedia Control Interface. Pozwala to okienkowym aplikacjom na odwoływanie się w sposób jednolity do różnego rodzaju urządzeń dźwiękowych. Nie ma więc obawy, że SynTalk odmówi współpracy z jakimkolwiek standardowym oprogramowaniem, kartą dźwiękową lub nawet głośniczkiem wewnętrznym komputera.

Instrukcja i instalacja

SynTalk mieści się na jednej 3,5" dyskietce, a do poprawnego działania wymaga komputera wyposażonego w procesor 386SX/25 lub lepszy, posiadającego co najmniej 2 MB pamięci operacyjnej RAM, 1 MB wolnego miejsca na dysku oraz wyposażonego w dowolne urządzenie dźwiękowe obsługiwane przez system Windows. Oznacza to, że program może działać także na maszynach, które nie posiadają specjalnych kart dźwiękowych. Wystarcza obecność standardowego wewnętrznego głośnika komputera i jakiś program jego obsługi - np. łatwo dostępny sterownik speaker.drv.

Instalacja programu nie jest skomplikowana. Została ona bardzo dokładnie opisana w instrukcji. W praktyce, po podaniu danych personalnych, użytkownik musi jedynie zadeklarować, które z elementów pakietu pragnie zainstalować w komputerze. Wraz z programem dostarczane są m.in. zestawy automatycznie instalowanych makropoleceń dla MS Word i MS Excel, kod źródłowy wersji demonstracyjnej itp.

Najważniejsza jest metoda

Przekształcenie języka pisanego na postać dźwiękową, szczególnie w przypadku języków słowiańskich, nie jest sprawą prostą. Z tego powodu w programie SynTalk zastosowana została tzw. alofoniczna metoda syntezy mowy, w której wypowiedź - w tym przypadku przekształcenie tekstu pisanego na postać słowną - generowane jest w drodze składania pewnych dźwięków elementarnych - tzw. alofontów.

W najprostszym przypadku, aby odczytać jakieś słowo np. "dom", wystarczy spowodować szybkie "wymówienie" przez komputer uprzednio zarejestrowanych głosek "d", "o" i "m". Nie wszystkie słowa dadzą się jednak zsyntetyzować w ten sposób. W języku polskim wyróżniamy 44 głoski, które dzielą się na dźwięczne i bezdźwięczne, a te z kolei mogą występować w kilku wariantach. Okazuje się bowiem, iż fonem (zespół cech wyróżniający jedne głoski od innych), może zmieniać niektóre ze swych cech w różnych otoczeniach fonetycznych, np. w zależności od kontekstu w jakim występują głoski. SynTalk do syntezy mowy wykorzystuje warianty fonemów, które są nazywane alofontami. Jest ich dokładnie 69.

W praktyce

SynTalk potrafi poprawnie i dość wyraźnie odczytać większość słów, choć syntetyczny głos jest bardzo monotonny. Dla poprawienia efektów działania program ma możliwość wyboru kilku opcji konfiguracyjnych, takich jak zmiana szybkości czytania, zamiana dat i długich liczb na postać słowną czy literowanie wyrazów napisanych dużymi literami. Jego adaptacja dla potrzeb konkretnego użytkownika wymaga jednak sporo pracy. Po wykonaniu standardowej instalacji program popełnia wiele pomyłek w odczytywaniu słów specjalistycznych, skrótów itd.

SynTalk zawiera w pełni edytowalny słownik wyjątków. Pozwala to na dostosowanie programu do potrzeb użytkownika, choć niestety, wymaga to najczęściej wielu godzin żmudnych doświadczeń. SynTalk czyta ponadto "kropki" i "przecinki", gdyż jest pozbawiony umiejętności intonowania, co nieco utrudnia rozumienie generowanej mowy. Można się jednak do tego przyzwyczaić.

Możliwości zastosowań

Program jest serwerem DDE, a producent dostarcza wraz z nim makropolecenia dla programów MS Word, MS Excel i AmiPro. Potrafi on więc odczytywać nie tylko tekst umieszczony w schowku systemu Windows, lecz również np. blok zaznaczony w edytorze czy arkuszu kalkulacyjnym. Program może też wymawiać na bieżąco słowa wprowadzane z klawiatury stanowiąc znakomitą aplikację do wspomagania osób wprowadzających teksty, jak np. sekretarki, kontystki, czy maszynistki. Nie wydaje się jednak na tyle dobry, by mógł być zastosowany np. do zdalnego odczytywania pism napływających np. do serwerów poczty elektronicznej czy innych, podobnych zastosowań.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200