Mów do mnie

Celem projektu Speecon jest stworzenie takich baz danych dla wybranych osiemnastu języków, głównie europejskich z ich amerykańskimi odmianami oraz japońskiego i chińskiego. Na podstawie ich analizy zostaną następnie opracowane odpowiednie algorytmy zapewniające głosową obsługę urządzeń. Każdy uczestnik projektu musiał przygotować zbiory tekstów typowych dla swojego języka, np. artykułów z gazet czy fragmentów książek. Spośród nich losowo będą wybierane zdania, które zostaną odczytane przed mikrofonem przez różne osoby. W bazach ma się znaleźć także słownictwo typowe dla czynności związanych ze sterowaniem sprzętem elektronicznym (np. włącz/wyłącz). Przygotowana została lista typowych komend i poleceń w języku angielskim. Zostanie ona uzupełniona ich odpowiednikami w językach wytypowanych do zastosowania w projekcie.

Tworzenie baz danych ma się zakończyć do połowy przyszłego roku. Uczelnie biorące udział w projekcie będą mogły wykorzystywać je do celów badawczo-naukowych i edukacyjnych. Firmy wymienią między sobą zbiory, by mieć możliwość korzystania z nich w celach komercyjnych. Przewidywana jest także współpraca uczestników projektu z firmą ELRA, która zajmuje się rynkową dystrybucją tego typu baz danych.

Urzędnicy i rolnicy

Naukowcy z Polsko-Japońskiej Wyższej Szkoły Technik Komputero- wych będą musieli nagrać wypowiedzi 550 dorosłych mieszkańców Polski i 50 dzieci. Nie mogą to być jednak przypadkowe osoby. Ich dobór musi uwzględniać podziały regionalne, wiekowe, zawodowe czy społeczne, wpływające na sposób mówienia ludzi. "Uczestnicząca w nagraniach grupa musi być reprezentatywna dla sposobu posługiwania się danym językiem w różnych jego odmianach" - twierdzi Ryszard Gubrynowicz. - "W Polsce nie mamy aż tak wielu regionalizmów, ale np. w Wlk. Brytanii jest już z tym problem". Z powodu różnic występujących w poszczególnych krajach dla języ-ków: angielskiego, niemieckiego czy hiszpańskiego będzie tworzonych po kilka baz danych. Niemiecki używany w Austrii jest inny od niemieckiego, którym posługują się mieszkańcy Szwajcarii. Angielski z Wysp Brytyjskich musi być potraktowany inaczej niż jego odmiana amerykańska.

Nagrania będą dokonywane w różnych warunkach - w studiu, miejscu pracy, mieszkaniu, na ulicy, w samochodzie i miejscu

ogólnodostępnym, np. w urzędzie czy na dworcu kolejowym. Oprócz czytania gotowych tekstów i wyrażeń, uczestnicy nagrań będą mieli też za zadanie wyobrazić sobie sytuacje związane z używaniem sprzętu elektronicznego i sformułować własne wypowiedzi i polecenia. Chodzi o to, by możliwe było stworzenie takich rozwiązań, które pozwolą na komunikowanie się człowieka z urządzeniami w naturalnych warunkach, z jakimi mamy do czynienia na co dzień. W bazie danych będą też odnotowane zauważone podczas nagrań błędy i zakłócenia. Nie wolno ich będzie jednak usuwać ani korygować. Na podstawie informacji o nich system rozpoznawania mowy ma automatycznie tworzyć mechanizmy korygujące. "System musi działać niezawodnie, nie może się mylić" - podkreśla Ryszard Gubrynowicz.


TOP 200