Coraz bliżej fotorealizmu

Z prof. Markiem Hołyńskim z Massachusetts Institute of Technology (MIT) i pracownikiem firmy Silicon Graphics rozmawia Marian Łakomy

Z prof. Markiem Hołyńskim z Massachusetts Institute of Technology (MIT) i pracownikiem firmy Silicon Graphics rozmawia Marian Łakomy

W Polsce jest Pan znany jako przykład naukowca, któremu udało się osiągnąć znaczący sukces w USA. Ponieważ jednak nie wszyscy nasi czytelnicy Pana znają czy zechce Pan powiedzieć kilka słów o sobie i swej pracy?

Oficjalnie jestem jeszcze pracownikiem MIT, gdzie pracowałem od 1981 r. i gdzie zajmowałem się grafiką komputerową. Jednakże od dłuższego czasu już nie wykładam, zajmując się głównie projektami dla przemysłu. Wprawdzie wcześniej też się tym zajmowałem, ale od 1989 r. ich liczba, zmusiła mnie do rezygnacji z wykładów. Od tej pory zajmuję się grafiką komputerową, to jest tworzeniem oprogramowania i sprzętu.

Znajduje się Pan w samym centrum problemów grafiki. Jak Pan widzi jej rozwój?

Przez ostatnie 30 lat wyszła od zera - wyświetlania na ekranie nieskomplikowanych elementów: punktów, linii prostych (co nie jest łatwym problemem), wielokątów itp. znaczący krok do przodu stanowił kolor. Podobnie transformacje, rotacje i zmiany pozycji na ekranie aż po wprowadzenie modeli oświetlenia. Te ostatnie, choć kosztowne, doprowadziły do tego, że w tej chwili fotorealizm w grafice jest już prawie pełny: obraz na ekranie do złudzenia przypomina rzeczywistość.

Jest jeszcze wiele rzeczy do zrobienia w grafice. Obecnie główne kierunki działań to doprowadzenie do perfekcji tworzenia tekstury, czyli nakładania różnych powierzchni na bryły. Jeszcze trochę jest do zrobienia w animacji. Dynamika obiektów ożywionych o wielu stopniach swobody jest tak skomplikowana, że trzeba włożyć wiele wysiłku zanim zacznie się dobrze oddawać ruch osób i zwierząt.

Można jednak powiedzieć, że w dziedzinie grafiki doszliśmy do poziomu pełnego, realistycznego odwzorowania na ekranie rzeczywistości, która nas otacza.

Obecnie prace skupiają się głównie na zastosowaniach grafiki, np. w zakresie wirtualnej rzeczywistości. Trójwymiarowa grafika komputerowa jest podstawowym narzędziem dla wirtualnej rzeczywistości. Typowe rozwiązania graficzne na PC nie są w stanie oddać w pełni z powodu ograniczeń sprzętowych.

Bardzo ważnym zastosowaniem grafiki są aplikacje sieciowe, korzystające z multimediów (grafiki i cyfrowego wideo). Rozwój Internetu jest największym wydarzeniem w świecie informatycznym. Przerósł on oczekiwania wszystkich, także nasze. Grafika jest tam używana w sposób niezwykle intensywny. Dotyczy to m.in. upakowanych obrazów i filmów.

Jest tu jeszcze wiele rzeczy do zrobienia, zwłaszcza w zakresie kompresji danych.

Czy zwykły użytkownik PC ma szansę napotkać tak wyrafinowaną grafikę w swych aplikacjach, jeśli objętość danych multimedialnych jest tak duża, że kilkusekundowy film zapełni całkowicie jego dysk?

Prace w zakresie kompresji danych są w toku. Po kilkunastu latach uzyskano zadowalające wyniki kompresji obrazów statycznych, co znalazło odzwierciedlenie w ustanowieniu standardu kompresji JPEG (Joint Photographer's Expert Group). Uzyskano dostateczną jakość wierności kompresji i dekompresji.

A kompresja fraktalna?

Jest to ciekawy pomysł teoretyczny, ale jest ona bardzo skomplikowana algorytmicznie. Fraktale odegrały znaczącą rolę na pewnym etapie rozwoju grafiki komputerowej. W pewnym momencie były bowiem jedynym narzędziem do modelowania zjawisk naturalnych, takich jak liście na drzewach czy obiekty naturalne.

Czy dostępne są teraz lepsze narzędzia?

Trudno powiedzieć. Do wielu zastosowań nadal używa się geometrii fraktalnej. Do wielu zastosowań nie jest ona konieczna, gdyż podobne efekty można uzyskać za pomocą techniki alfa blending lub depth cueing. Dają one możliwość wprowadzenia niejednoznaczności w zakresie trójwymiarowości, przenikalności obiektów czy pokazania pewnego chaosu w uporządkowanej strukturze, w celu oddania jej naturalności.

Przełamanie deterministycznego obrazu świata, pokazanie że mogą istnieć obiekty o innej liczbie rozmiarów niż tylko dwa (obiekty płaskie) lub trzy (obiekty przestrzenne) jest znaczącym osiągnięciem geometrii fraktalnej w naszym odbiorze rzeczywistości. Nie jest to jednak narzędzie na tyle proste i uniwersalne, żeby nadawało się do wszystkich zastosowań.

Powróćmy na chwilę do kompresji obrazów.

Nadal jest problem z kompresją obrazów ruchomych. Wprawdzie istnieje standard MPEG (Motion Picture Expert Group), ale sama ilość informacji, którą trzeba odtworzyć i przekazać, stwarza poważne problemy techniczne. Ponadto, kompresja MPEG nie jest bezstratna, co oznacza że po odtworzeniu nie otrzymuje się obrazu początkowego. Czasami nie ma to znaczenia, ale jeśli ma to znaczenie, to powstaje poważny kłopot. Obecnie pojawił się lepszy standard kompresji MPEG-2, zwłaszcza jeśli chodzi o wierność oddania obrazu, dający ponad 40-krotną kompresję danych.

Ma to duże znaczenie jeśli chodzi o zajmowanie miejsca na dysku, ale o wiele ważniejsze jest w przypadku przesyłania obrazów w sieci.

To chyba właśnie te zastosowania będą decydować o kierunkach rozwoju grafiki?

Ponieważ teraz zastosowania telekonferencyjne i browsery Internetowe (Mosaic, NetScape) korzystają z grafiki w sposób interakcyjny, to przesyłanie nawet małych obrazów, niedostatecznie upakowanych, spowoduje kompletne zablokowanie sieci. Na szczęście standard MPEG-2 nadaje się do realizacji sprzętowej, co daje szansę wyprodukowania taniego układu scalonego realizującego ten algorytm. Umieszczenie go między siecią a komputerem PC może zmniejszyć ilość przesyłanych danych. Oczywiście, istnieje możliwość programowej realizacji algorytmu, ale będzie to znacznie wolniejsze. Tak więc nawet korzystanie z łącz o małej przepustowości spowoduje, że zanikną niemiłe efekty migotania obrazu i efektów statycznych, niekorzystnych dla efektywnego przeprowadzenia wideokoferencji.

Jakie są najbardziej preferowane zastosowania grafiki - czy może wirtualna rzeczywistość?

Obecnie wirtualna rzeczywistość ma zastosowanie głównie w salonach gier, chociaż istnieje wiele zastosowań wojskowych do symulacji lotu, wozów bojowych itp.

Pan pracuje teraz w Silicon Graphics, a obecna wizyta w kraju jest związana z prezentacją sprzętu i rozwiązań tej firmy?

Przyjąłem zaproszenie Silicon Graphics Europe głównie dlatego, że Targi te zbierają w Warszawie wszystkich z dziedziny grafiki komputerowej. Była to także okazja do spotkania moich znajomych i przyjaciół. Na stoisku ATM prezentowaliśmy najnowsze rozwiązania sprzętowe i programowe w dziedzinie grafiki, jakie oferuje Silicon Graphics.

Poczynając od maszyny Indigo, nasze rozwiązania oparte są głównie na programowej realizacji algorytmów graficznych. Pozwoliło to na usunięcie specjalizowanych układów scalonych, w celu obniżenia jej ceny do poziomu ceny zwykłego PC. Ja zresztą zacząłem ścisłą współpracę z firmą właśnie od maszyny Indigo, na którą przenosiłem algorytmy sprzętowe do jej oprogramowania. Nad bardzo podobnym projektem pracowałem wcześniej na uczelni.

Potem zajmowałem się jeszcze mniejszą i jeszcze tańszą maszyną - Indy, która jest na rynku od półtora roku.

W czasie naszej rozmowy przez cały czas przewijało się słowo Internet. Jaka jest Pańska opinia na modny ostatnio temat powszechnego dostępu do informacji poprzez Information Highway?

Ja na ten temat nie mam co spekulować, ja z tego korzystam.

Korzysta Pan w swojej pracy, ale czy będzie Pan korzystał w domu?

Nie będę, ja z tego korzystam! Mam w domu komputer połączony przez ISDN do sieci, pozwalającej mi na korzystanie zarówno z telewizji kablowej, jak i z takich usług, jak prognoza pogody czy zakupy przez sieć.

Jest Pan w uprzywilejowanej sytuacji. Może Pan sobie pozwolić na posiadanie komputera o dostatecznej mocy obliczeniowej. Czy jest szansa, że zwykły użytkownik PC też będzie z tych usług korzystał?

Ja korzystam z maszyny firmowej i uczestniczę w testowaniu systemu. Biorąc jednak pod uwagę wszystkie aspekty, nie ulega dla mnie wątpliwości, że ta forma dostępu do informacji będzie coraz powszechniejsza.

Czy nie istnieje jednak niebezpieczeństwo, że Internet zostanie zalany informacją czysto handlową?

To jest decyzja użytkownika co ma zamiar używać. Równie dobrze można przez sieć grać np. w Go, jak brać udział na różnym forum dyskusyjnym czy dokonywać zakupów.

Ostatnie pytanie: czy gra Pan jeszcze w Go?

Tak, teraz może nieco rzadziej, ale gdy pracowałem w MIT byłem nawet prezesem lokalnego klubu Go.


TOP 200