Uśmiech symulowany

Realistyczna, dynamiczna wizualizacja ludzkiej twarzy, w połączeniu z syntetyzatorem mowy, może uatrakcyjnić interakcję człowieka z komputerem.

Realistyczna, dynamiczna wizualizacja ludzkiej twarzy, w połączeniu z syntetyzatorem mowy, może uatrakcyjnić interakcję człowieka z komputerem.

Stworzenie realistycznej animacji twarzy człowieka stanowi ogromne wyzwanie dla specjalistów od grafiki komputerowej. Mimika czy chociażby samo mówienie angażuje tak wiele mięśni, że kinetyka procesów zmieniających wygląd ludzkiej fizjonomii wymyka się formalnym opisom. Skóra twarzy jest powierzchnią daleką od jednorodności, pod wpływem ruchu znajdujących się pod nią mięśni zmienia wygląd. Człowiek zaś ma tak ukształtowany zmysł obserwacyjny, że dostrzega każdy szczegół na twarzy swego rozmówcy. W efekcie najmniejsza niedokładność graficznej symulacji, uproszczenie czy brak wystarczającej dynamiki ruchu poszczególnych części twarzy zostają natychmiast zauważone. Wówczas powstaje wrażenie sztuczności. Komputerową animację ludzkiej twarzy ciągle łatwo rozszyfrować.

W e-mailu

Najnowsze osiągnięcia specjalistów od grafiki komputerowej w zakresie wizualizacji twarzy stara się wykorzystać amerykańska firma LifeFX. Przygotowała ona już pierwsze prototypowe produkty, pozwalające na wysyłanie listów elektronicznych, w których zamiast tekstu pojawia się animowana trójwymiarowa głowa, która ten list odczytuje (oczywiście w języku angielskim).

Prezentowane przez tę firmę wirtualne twarze, dzięki drobnym niedoskonałościom, wyglądają bardziej realistycznie niż dotychczasowe wymuskane "plastikowe" fizjonomie. Paradoksalnie okazało się, że aby coś wyglądało jak obiekt rzeczywisty, nie może prezentować się idealnie. Prawidłowość tę odkryli specjaliści od gier wideo, stwierdzając, że znacznie lepiej wyglądają obiekty pozbawione plastelinowej homogeniczności.

Początkowo LifeFX miała wytwarzać oprogramowanie graficzne z myślą o przemyśle rozrywkowym, jednak z czasem okazało się, że dzięki rozpowszechnieniu Internetu komputerowe twarze można wykorzystać jako element nowego interfejsu użytkownika - również w telemedycynie czy nauczaniu na odległość. Z firmą współpracują naukowcy, zajmujący się badaniami medycznymi, a w szczególności fizjologią i motoryką tkanek podskórnych i mięśniowych. Dzięki temu budowanie wirtualnych modeli ludzkich twarzy odbywa się poprzez nakładanie kolejnych warstw: najpierw definiuje się położenie i zakres ruchów gałek ocznych oraz języka, potem zęby i szczęki, a wreszcie czaszki. Do niej są przymocowywane mięśnie i ostatecznie całość pokrywa się skórą. Oczywiście wszystko w postaci cyfrowej.

Mruganie z bazy

Kiedy wirtualny model mruga okiem, aplikacja sięga do bazy danych trójwymiarowych, dzięki którym wiadomo jak wyświetlić ten ruch (poprzez określenie ruchu mięśnia i przesunięcia skóry). W wyniku dodania informacji o wieku - to jest o tym, w jaki sposób wiek wpływa na ułożenie i wygląd skóry czy pracę mięśni, moż- na dowolnie postarzyć wirtualny model ludzkiej twarzy. Dołączenie interfejsu syntetyzatora sprawia, że model zaczyna mówić. Oczywiście sztuka polega na odpowiedniej synchronizacji odczytywania poszczególnych fonemów (fragmentów wyrazów) z właściwą mimiką twarzy i ruchem ust.

FaceMail - pierwszy produkt firmy LifeFX - dostępny za darmo pod adre- semhttp://www.lifefx.com, pozwala na dołączenie do oprogramowania pocztowego modułu, w którym użytkownik może zdefiniować jednego z pięciu lektorów. Trójwymiarowy, realistyczny obraz jego twarzy odczyta na głos wskazane listy elektroniczne. Niestety, pewne kompromisy, wynikłe z powodu konieczności ograniczenia liczby transmitowanych danych, sprawiły, że wizualizowany obraz twarzy lektora ma dość małą rozdzielczość. Jeszcze w tym roku ma się pojawić rozszerzenie, pozwalające użytkownikowi na wprowadzenie własnego zdjęcia jako postaci lektora.

Listy uzupełniane charakterystycznymi dla elektronicznej komunikacji uśmieszkami (smileys, czyli emotikony - ;-), :-o, itd.) zostają dodatkowo zobrazowane wizualnie mimiką lektora (ten we wskazanych momentach uśmiecha się bądź mruga okiem).

Firma liczy, że jej rozwią- zania znajdą zastosowanie w aplikacjach przeznaczonych do prowadzenia handlu elektronicznego, gdzie miałyby przede wszystkim poprawić interakcję klienta z personelem wirtualnego sklepu.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200