Czytaj z ruchu moich ust

Inżynierowie Intela opracowali i udostępnili na zasadach open source oprogramowanie pozwalające tworzyć aplikacje zdolne do "czytania z ruchu ust". Umożliwia ono synchronizację analizy dźwięków z analizą ruchów ust, co w znacznym stopniu ma zwiekszać skuteczność rozpoznawania mowy w środowiskach o podwyższonym poziomie hałasu.

Czytaj z ruchu moich ust
Współczesne algorytmy rozpoznawania mowy osiągają zadowalającą skuteczność tylko przy minimalnym natężeniu szumów tła lub przy bardzo dobrze dostrojonym sprzęcie. Obecność zakłóceń, np. hałasu powszechnego w miejscach publicznych znacznie obniża ich skuteczność.

Nowe oprogramowanie Audio Visual Speech Recognition (AVSR) umożliwia synchronizację analizy dźwięków z analizą ruchów ust, co w znacznym stopniu ma zwiekszać skuteczność rozpoznawania mowy w środowiskach o podwyższonym poziomie hałasu. Oprogramowanie AVSR wchodzi w skład biblioteki Intel OpenCV, stanowiącej zestaw ponad 500 funkcji przetwarzania obrazu, pomocnych w tworzeniu aplikacji umożliwiających komputerom "widzenie" otoczenia.

"Intel zamierza rozwijać technologie pozwalające komputerom naturalną, zbliżoną do ludzkiej, interakcję z otaczającym światem. Wykorzystywane przez człowieka sposoby percepcji rzadko opierają się na pojedynczych zmysłach. Człowiek postrzega otoczenie i podejmuje decyzje łącząc informacje pochodzące z różnych źródeł" - mówi Justin Rattner, senior fellow w Intel Enterprise Platform Group i dyrektor Intel Microprocessor Research Labs.

Szybsze mikroprocesory, spadek cen kamer wideo i dziesięciokrotnie większa szybkość transmisji zapewniana przez interfejsy takie jak USB 2.0 czy FireWire umożliwiają wykorzystanie algorytmów analizy obrazu w czasie rzeczywistym podczas korzystania z popularnych komputerów PC. Biblioteka OpenCV została opracowana z myślą o ułatwieniu tworzenia nowych rozwiązań w tej dziedzinie dzięki dostępności kodu źródłowego rozmaitych funkcji przetwarzania i analizy obrazu. Od momentu jej udostępnienia w roku 2000, bibliotekę OpenCV pobrało ponad 500000 osób, zaś grupa zarejestrowanych użytkowników liczy obecnie ponad 5000 członków.

Twórcy oprogramowania wykorzystują funkcje OpenCV w najróżniejszych zastosowaniach, od zabawek po instalacje przemysłowe. Biblioteka zawiera kod źródłowy wszystkich funkcji w języku C i opatrzona jest bezpłatną licencją redystrybucyjną. Więcej informacji o AVSR można znaleźć pod adresemhttp://www.intel.com/research/mrl/research/avcsr.htm . Strona internetowa poświęcona OpenCV dostępna jest pod adresemhttp://www.intel.com/research/mrl/research/opencv/ .

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200