Człowiek czy komputer?

Doroczne zawody w dziedzinie sztucznej inteligencji o nagrodę im. dr. Hugh O. Loebnera

Doroczne zawody w dziedzinie sztucznej inteligencji o nagrodę im. dr. Hugh O. Loebnera

"Czy komputery potrafią myśleć?" - takie pytanie zadał w 1950 r. matematyk angielski Alan Turing, proponując jednocześnie prosty test na ocenę podobieństw w rozumowaniu komputerów i ludzi. Test ten, nazwany od nazwiska autora testem Turinga (patrz też CW 17/93 str. 10), polega na rozmowie z bliżej nieokreślonym osobnikiem (z pomocą klawiatury i ekranu komputerowego), a następnie ocenie - czy "osoba po drugiej stronie" to człowiek, czy komputer? Jak długo jednak musiałaby trwać taka rozmowa i jakie tematy należałoby podejmować, aby móc obiektywnie stwierdzić, że test zakończył się sukcesem lub porażką.

Warto jednak zauważyć, że programy mające na celu "udawać ludzi" muszą zostać wyposażone w typowo ludzkie cechy, nawet te niepożądane. Jakże przekonywujący jest program, który wysyła litery na ekran stosunkowo powoli i w nieregularnych odstępach czasu, a do tego robi błędy ortograficzne i przeklina... Czy więc test Turinga ma na celu ocenę inteligencji komputera czy jego podobieństwa do istoty ludzkiej?

Trzy lata temu w USA zauważono wartość komercyjną testu Turinga i ogłoszono pierwsze zawody (nazwane turniejem o nagrodę im. pomysłodawcy dr. Hugh O. Loebnera) korzystające z nieco zmodyfikowanej wersji tego testu. Twórcy oprogramowania AI (Artificial Intelligence - sztucznej inteligencji), zarówno firmy komercyjne jak i amatorzy, zgłaszają swoje produkty do konkursu, w którym sędziami sązazwyczaj osoby nie mające nic wspólnego z informatyką. Równolegle z programami, przy pozostałych terminalach ("po drugiej stronie monitora") umiejscowieni są studenci i absolwenci okolicznych uniwersytetów. Zadaniem sędziów jest ocena, który z początkowo anonimowych uczestników konkursu jest człowiekiem, a który jest komputerem.

Ku zaskoczeniu, na zawodach o nagrodę Loebnera w 1991 i 1992 r., niektóre programy "oszukały" sędziów i zostały mylnie wzięte za ludzi. Sytuacja odwrotna (ludzi wzięto za komputery) także miała miejsce. Jednakże w zeszłym roku żaden z programów komputerowych nie zdołał skutecznie udawać człowieka. Wynika to prawdopodobnie z faktu, że na sędziów tym razem wybrano renomowanych przedstawicieli mass-mediów, którzy świetnie znają typowe ludzkie zachowania.

W 1993 r. turniej odbył się 8 grudnia w San Diego, w Kalifornii. Sponsorami imprezy były m.in. tak renomowane firmy jak Apple Computer, Computerland, IBM i Motorola. Uczestnicy to trójka twórców programów AI, zajmujących miejsce obok pięciu studentów lub absolwentów kilku wydziałów uniwersyteckich z okolicy San Diego. Ośmiu sędziów miało w wyniku wizyt przy wszystkich terminalach (po 15 min przy każdym) ocenić je w skali 1 do 8. Według tej punktacji terminal "najbardziej ludzki" miałby otrzymać 1 punkt, a "najbardziej komputerowy" 8 punktów. Dodatkowo należało zgadnąć przy ilu terminalach siedzieli ludzie a ile obsługują komputery (wiedząc, że w konkursie bierze udział od 2 do 6 programów AI).

Przy każdym stanowisku widniał ściśle określony temat rozmowy. Obowiązkiem zarówno sędziów jak i uczestników miało być trzymanie się tematu i prowadzenie jak najbardziej naturalnej konwersacji (oczywiście posłusznym programom komputerowym nie trzeba było tego powtarzać dwa razy). Tematy rozmowy były następujące (wg kolejności terminali): przerywanie ciąży (człowiek), samochody (człowiek), konflikty małżeńskie (komputer), gotowanie (człowiek), wschodnie sztuki walki (człowiek), baseball (człowiek), polityka - "liberał czy konserwatysta" (komputer) i zwierzęta domowe (komputer). Zainstalowano także dodatkowy terminal, przy którym pobawić mogła się zgromadzona publiczność.

Po podsumowaniu wyników okazało się, że tym razem sędziowie byli wyjątkowo dociekliwi. Średnia liczba punktów przyznanych programom komputerowym była znacznie wyższa niż oceny uczestników rodzaju ludzkiego. Zdarzyły się jednak pojedyncze "oszustwa". Tak więc pracujący przy terminalu nr 1, student Steven Kemp został wzięty za komputer, aż przez 5 sędziów. Zwycięzca zaś, zainstalowany na terminalu 7 program Josepha Weintrauba (zwycięzcy konkursów z 1991 i 1992 r.), został oceniony przez sędziego nr 2 (dziennikarza Roberta Binghama z PBS Television) jako bardziej ludzki od dwóch studentów. J. Weintraub otrzymał za swój produkt nagrodę w postaci 2 tys. USD. Na drugim miejscu ulokował się wytwór firmy Malibu Artifactual Intelligence Works, zaś na trzecim - program dr. Michaela L. Mauldina.

Organizator imprezy, Cambridge Center for Behavioral Studies, planuje test bez ograniczeń tematycznych. Jego zwycięzca ma otrzymać nagrodę 100 tys. USD.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200