SZMARAGD-owa rozmowa

George Mason University (GMU) w Fairfax pod Waszyngtonem ma opinię najszybciej rozwijającej się wyższej uczelni w Ameryce. Dziesięć lat temu był to mały, prowincjonalny college. Dziś George Mason ma nowe budynki i laureatów nagrody Nobla, zaprasza na wykłady pracowników Departamentu Stanu i prezesów banków z Waszyngtonu, daje doktoraty w nowych, nie istniejących rok temu dyscyplinach - np. conflict resolution - i zajmuje się sztuczną inteligencją.

George Mason University (GMU) w Fairfax pod Waszyngtonem ma opinię najszybciej rozwijającej się wyższej uczelni w Ameryce. Dziesięć lat temu był to mały, prowincjonalny college. Dziś George Mason ma nowe budynki i laureatów nagrody Nobla, zaprasza na wykłady pracowników Departamentu Stanu i prezesów banków z Waszyngtonu, daje doktoraty w nowych, nie istniejących rok temu dyscyplinach - np. conflict resolution - i zajmuje się sztuczną inteligencją.

Drenaż mózgów również z Warszawy

Dyrektorem Center for Artifical Intelligence jest profesor Ryszard Michalski, absolwent Politechniki Warszawskiej. Michalski wyemigrował z Polski w 1970 r. mając już doktorat Uniwersytetu ?ląskiego i dyplom Politechniki Leningradzkiej. Ostatnio był dyrektorem Artifical Intelligence Laboratory w Uniwersytecie Illinois at Urbana Champaign, a od niespełna czterech lat kieruje grupą badawczą w GMU. Stworzył tam prawdziwie międzynarodowy ośrodek - tak ze względu na zakres oddziaływania jak i pochodzenie zatrudnionych w nim pracowników. Na przykład, Hugo de Garis ukończył Wydział Matematyki Stosowanej i Fizyki Teoretycznej na Uniwersytecie w Melbourne - doktorat zrobił w Brukseli. Yves Kondratoff uzyskał tytuł doktora w Instytucie Badań nad Katalizą w Lyonie i do niedawna był przewodniczącym oddziału automatycznego programowania przy Europejskim Kongresie Sztucznej Inteligencji. Gheorghe Tecuci jest absolwentem Politechniki w Bukareszcie, zdobył dwa doktoraty - jeden z Paris-Sud, a drugi w swej macierzystej uczelni. Lev Vekker ukończył fizykę w Leningradzie, po kilku latach na tym samym uniwersytecie uzyskał doktorat i stopień kandydata nauk z psychologii. Przed przyjazdem do Stanów wykładał psychologię ogólną na uniwersytecie w Lipsku.

Głównie jednak pracują u Michalskiego Amerykanie i Polacy. Robią niemal wszystko, co się liczy w artificial inteligence (AI). Deborah Boehm Davis zajmuje się systemami rozpoznawania ręcznego pisma, Kenneth De Jong bada algorytmy genetyczne, Larry Kerschberg jest specjalistą od analizy baz danych, Michael Tanner zajmuje się systemami poszerzania wiedzy.

Zenon Kulpa jest zatrudniony jako Senior Research Associate, czyli zajmuje stanowisko jakby docenta. Ma tytuł magistra inżyniera z Politechnikii Warszawskiej i doktorat z Polskiej Akademii Nauk. W Warszawie zajmował się biocybernetyką i medycyną. Jego specjalnością była grafika komputerowa, rozpoznawanie wzorców (pattern recognition) i przesyłanie obrazów. Był zapraszany do Szwecji, Bułgarii, Szwajcarii, Włoch i ZSRR. Zajmował się "niemożliwymi figurami". Obecnie opracował moduł graficznej prezentacji wydzielonego zbioru danych.

Piotr Pachowicz ma na GMU stanowisko Assistant Professor, czyli funkcję jakby docenta, ale jego główny obowiązek to nauczanie. Jest absolwentem Akademii Górniczo-Hutniczej w Krakowie, i tam też otrzymał doktorat. W 1986 r. uzyskał stypendium Fundacji Humboldta na badania w zakresie zdolności do adaptacji w systemach widzenia instalowanych w robotach. Następnie zajmował się podobnymi problemami na Uniwersytecie w Hamburgu i ostatnio w GMU. Ośrodek Sztucznej Inteligencji przy GMU niewątpliwie przyczynia się do tego, co z ubolewaniem określane jest jako drenaż mózgów (brain drain) - najlepsi naukowcy wyjeżdżają do pracy w Ameryce i nie wracają do własnego kraju. Zjawisko takie niewątpliwie istnieje, ale warto postawić sobie pytanie, po czyjej stronie leży wina? Prof. Michalski patrzy na te sprawy trzeźwo. Przede wszystkim nikogo nie przepłaca. W Ameryce żyje się, rzecz jasna, znacznie lepiej i łatwiej niż w wielu innych krajach, ale pracowników GMU nie stać na luksusy. Głównie dlatego, że nie mają czasu na rozrywki. Michalski mówi z rozbrajającą szczerością: Jest niemożliwe, żebym jednocześnie ludzi podkupywał i wyzyskiwał. A mówi się o mnie jedno i drugie.

Ma niewątpliwie rację. Trafiają do niego przede wszystkim ci obcokrajowcy, którzy we własnym kraju nie mają warunków do pracy. Większość z nich nie zrobi w Fairfax zawrotnej kariery i nie zdobędzie pieniędzy. Wiedzą o tym, a jednak pracują wytrwale. W ciągu pół roku będą mieli pierwsze osiągnięcia naukowe, za następne pół - staną się specjalistami w jakiejś wąskiej dziedzinie. Będą mieli publikacje w pismach fachowych o światowym zasięgu i kilka razy w miesiącu wezmą udział w seminariach, na które zjeżdżają się najlepsi specjaliści z całego świata.

Reguły z chaosu

Prof. Michalski chętnie demonstruje, na czym polega sztuczna inteligencja.

W GMU opracowano program Szmaragd. Nazwa jest akronimem EMERALD zbudowanym z pierwszych liter charakterystyki programu: Experimental Machine Example-based Reasoning And Learning Disciple - Maszynowy uczeń do eksperymentalnego rozumowania i uczenia się z przykładów. Program zawiera kilka funkcji. Najprostsza nazywa się 'cluster', czyli zbitka.

Na ekranie pojawia się 12 kolorowych stworków, ustawionych po 6 w dwu rzędach. Mają okrągły lub kwadratowy tułów, uśmiechniętą lub smutną minę, trójkątną lub rombowatą głowę, szmaragdową lub rubinową koszulkę. W jednej ręce trzymają maczugę lub tarczę, w drugiej miecz albo szablę. Komputer daje głosem polecenie, by ustawić kolorowe roboty w dwuszeregu na dole ekranu przydzielając je do jednego lub drugiego szeregu, wedle jakiejś reguły. Reguła może być dowolnie skomplikowana - komputer i tak zinterpretuje ją prawidłowo.

Komputer włącza ścieżkę dźwiękową, na której nagrane jest "mruczenie pod nosem". Po chwili ogłasza czystym, namaszczonym głosem: "Stosowałeś następujacą zasadę: w pierwszym szeregu stoją roboty mające rombowatą głowę, szmaragdową koszulkę i wesołą minę pod warunkiem jednak, że w jednej ręce mają maczugę, a w drugiej szablę. Albo stosowałeś zasadę: w drugim szeregu stoją roboty mające trójkątną głowę, rubinową koszulkę i tarczę, pod warunkiem jednak, że mają smutną minę. Albo...." Gdy komputer skończy wyliczanie reguł, prof. Michalski pyta: "I którą z nich Pan zastosował?" Mówimy wtedy np.: "Drugą". Prof. Michalski na to: "No widzi Pan, mogłaby być nawet bardziej skomplikowana. Program i tak by ją odnalazł." To prawda. Niezwykłość programu polega na tym, że potrafi się on uczyć, tzn. budować reguły na podstawie dostarczonego mu materiału.

SZMARAGD jest bowiem nie tylko zabawką. Był jednym z pierwszych urządzeń multimedialnych i poważnym instrumentem edukacyjnym. Pokazuje, w jaki sposób maszyny mogą wyprowadzać wnioski z podanych im przykładów i jak odkrywają stosowane przez kogoś reguły przekształcania danych. Program ten udawadnia, że uczenie polega nie tylko na zapamiętywaniu, lecz również na odkrywaniu i weryfikowaniu reguł.

Stacje robocze

Sztuczna inteligencja jest kolejną dziedziną nauki, w której mainframes zastępowane są przez stacje robocze. To samo daje się obserwować w zastosowaniach użytkowych. Zmiany te mają wielkie znaczenie i są bardzo korzystne dla nauki na całym świecie. Można obecnie stworzyć poważny ośrodek badań nad sztuczną inteligencją mając do dyspozycji kilka stacji roboczych SUN lub IBM, a więc za sumę 100 - 200 tys. USD. Dziesięć lat temu koszt był co przynajmniej dziesięć razy wyższy, a do tego dochodziła konieczność opłacenia transportu dużych komputerów i ich serwisu. Dzisiaj każdy średniej wielkości uniwersytet na świecie może mieć dobry ośrodek AI, zwłaszcza, że nie istnieją żadne politycznie motywowane ograniczenia zakupu stacji roboczych. Podstawowa literatura jest też dość łatwo dostępna. Kraj, który nie rozwija tego działu badań, jest sam sobie winien, i przekona się o tym za następne dziesięć lat.

Urządzenia wykorzystywane przez Ośrodek Sztucznej Inteligencji w George Mason University to niemal wyłącznie stacje robocze

W stacjach roboczych można opracowywać poważne programy użytkowe, np. rozpoznanie faktury sfotografowanego przedmiotu. Przy pomocy kamery telewizyjnej lub aparatu fotograficznego robi się zdjęcie jakiegoś obiektu, a potem poddaje się je analizie. Program powinien rozpoznać cechy charakterystyczne sfotografowanej powierzchni. Funkcja ta może służyć do wielu celów, ale głównie przydaje się do interpretacji zdjęć satelitarnych i lotniczych.

Program identyfikujący faktury jest jeszcze w trakcie opracowań w GMU, ale już teraz potrafi poprawnie rozpoznać rozmaite powierzchnie i to nawet wtedy, gdy 50% odczytów jest dokonanych błędnie - np. na skutek ruchu kamery, lub w wyniku przesłonięcia części obrazu przez chmury.

Dotąd zamazany sygnał można było traktować jako słaby, ledwie wybijający się ponad poziom szumów. Tą metodą interpretowało się np. wiele odczytów w astronomii, medycynie, telekomunikacji, itp. Stosuje się wtedy tzw. metodę uśredniania. Ten sam sygnał odczytywany jest wielokrotnie, a następnie nakładany na siebie. Przypadkowe szumy częściowo się kasują, zaś poszukiwany sygnał ulega wzmocnieniu. Jest to jednak metoda, którą można stosować tylko pod warunkiem, że sygnał nadawany jest wielokrotnie bez żadnej zmiany. Natomiast nie da się tym sposobem np. "oczyścić" raz wykonanej melodii, która została nagrana z szumami.

Podobnie, jeśli mamy do dyspozycji jedno zdjęcie i musi być ono szybko zinterpretowane. Uśrednianie nie wystarcza. Konieczne jest wykorzystanie sztucznej inteligencji. W Ośrodku AIC.GMU można to zrobić. Prace prowadzone są na stacji roboczej z ekranem o wysokiej rozdzielczości. Wczytuje się do niego 6 obrazów. Na każdym widać wyraźnie inną fakturę powierzchni. Jest to, w przybliżeniu, fragment swetra, powierzchnia deski, rozciągnięta pończocha, biała koszula, betonowa ściana i tył samodziałowej marynarki z dużą plamą. Program najpierw znajduje jakieś cechy charakterystyczne w każdym badanym obszarze, czyli rozpoznaje wzorce. Ekran jest podzielony na 6 części.

W drugim eksperymencie zdjęcia zostają celowo zamazane. W niektórych swych fragmentach obraz jest w ogóle nierozpoznawalny, w innych tylko zamglony lub częściowo pokryty biało-czarnym telewizyjnym szumem. Zaburzenia mają w sumie powierzchnię 50% ekranu. Program powinien teraz wybrać fragmenty dające się rozpoznać pomimo zakłóceń i poprawnie je zidentyfikować oraz odróżnić od fragmentów, które zostały już całkiem zamazane.

Zamazane odczyty są zabarwione na kilka jaskrawych kolorów. Widać gołym okiem, że barwne plamy zajmują mniej więcej pół ekranu. Gdyby wszystkie były w jednym kolorze, komputer uznałby je za nową gładką powierzchnię, którą powinien rozpoznać. Tego chcemy uniknąć. Program jest puszczony w ruch. Komputer najpierw potwierdza podział ekranu na 6 części. To dobry znak. Nie uznał zabarwienia za nowy rodzaj powierzchni. Następnie dla każdej powierzchni otoczonej przez jaskrawe plamy wylicza funkcję prawdopodobieństwa, opartą na przyjętym założeniu o jednolitości wzorca. Działa tak, jakby "w wyobraźni" ustalał, co powinno się znaleźć w otoczeniu czysto sfotografowanego fragmentu. Potem porównuje swoją projekcję z odczytem na ekranie. Jeśli odczyt jest dostatecznie podobny, to komputer odtwarza brakujące fragmenty zgodnie z przyjętym wzorcem. Działa przy tym elastycznie. Dopuszcza przesunięcie wzoru o kilka punktów lub jaskrawość przesuniętą o kilka odcieni szarości.

Po pierwszej próbie znika ponad 30% barwnych plam. Obraz został odtworzony przy wykorzystaniu wszystkich wiarygodnych informacji. Teraz program dodatkowo wykorzystuje dodane przez siebie informacje. Ma bogatszy zbiór danych do ekstrapolacji, i na nowo poszukuje śladów na ekranie, zakładając dalsze rozciąganie się wzoru pod fałszywymi odczytami. Próba powtórzona jest jeszcze kilkakrotnie. Za każdym razem powierzchnia barwnych plam wyraźnie się zmniejsza. Po siódmym czy ósmym przebiegu ekran się stabilizuje. Program zakończył rekonstrukcję zamazanego obrazu. Blisko 20% powierzchni ekranu pokrywają nadal jaskrawe plamy. Składają się one z tych obszarów, gdzie fałszywe odczyty były szczególnie zagęszczone oraz z obszaru plamy na powierzchni samodziałowej marynarki. Program nie umie zdecydować, czy plama ta pochodzi z bazy źródłowej, czyli z fotografii, czy też wniesiona została przez zły odczyt danych.

To niezdecydowanie komputera jest w istocie sukcesem autora programu. Program powinien odgadywać, co zostało zamazane tak długo, jak długo ma podstawy do rekonstrukcji pierwotnych danych. Nie powinien jednak bezkrytycznie rozciągać zaobserwowanego wzorca na całą nierozpoznaną przez siebie powierzchnię, gdyż nie ma prawa "zmyślać", powinien tylko "czytać i porównywać".

Organizacja badań

U prof. Michalskiego pracują tylko fachowcy najwyższej klasy. Okazuje się jednak, że łatwiej można znaleźć dobrego programistę i specjalistę od sztucznej inteligencji niż inteligentnego organizatora badań. Tym zajmuje się sam dyrektor. W Ameryce podstawą prac badawczych jest znalezienie źródła finansowania. Niemal wszystkie prace prowadzone w Ośrodku Sztucznej Inteligencji finansowane są z zewnątrz. Uniwersytet daje sprzęt komputerowy i kilka etatów administracyjnych.

By zachować swą pozycję zawodową AIC. GMU musi dbać o reputację. Musi zdobywać zamówienia rządowe i wojskowe, ściągać najlepszych fachowców, publikować i zapraszać. Ośrodek publikuje rocznie 30 do 40 poważnych prac naukowych. Utrzymuje żywe kontakty zagraniczne. Sam prof. Michalski dość regularnie bierze udział w konferencjach organizowanych przez Centrum Banacha w Warszawie. Chętnie też zaprasza specjalistów z zagranicy. W ostatnich trzech latach byli u niego występujący gościnnie profesorowie z Algierii, Włoch, Belgii, Egiptu, Korei, Jugosławii, Kanady, Rumunii i Niemiec. Z Polski współpracował z nim Tadeusz Piotrowski, a jeden wykład wygłosił niegdyś Klemens Szaniawski.

Do Fairfax przyjeżdżają także wybitni doktoranci z wielu krajów. Z Polski byli tam ostatnio lub są jeszcze Jerzy Bala, Tomasz Dybala i Janusz Wnęk. Większość doktorantów wraca z nowymi umiejętnościami i nadziejami. Dopiero gdy te nadzieje rozwieją się, zaczynają poważniej myśleć o tym, by szukać pracy poza krajem. Warto dać im szansę zanim podejmą decyzję o zerwaniu z polską nauką.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200