Szersza perspektywa

Zatarte bariery

Jednak prawdziwa rewolucja dopiero dojrzewa. Przyzwyczajeni do standardowego, okienkowego interfejsu użytkownika z myszką, ikonami, rozwijanymi menu kontekstowymi, przywykliśmy myśleć o nich jako o najdoskonalszej formie komunikacji z użytkownikiem. Nie widzimy, że między człowiekiem a maszyną nadal istnieje przepaść komunikacji, którą zniwelować może nowa generacja urządzeń peryferyjnych w większym stopniu zintegrowanych z ciałem człowieka. Przedsmak daje nam ekran dotykowy. W Polsce jest on już standardem w restauracjach szybkiej obsługi, ale np. za granicą można go zobaczyć w samoobsługowych kasach biletowych komunikacji miejskiej i kolei, w bankomatach, centrach informacji turystycznej. Ale powstają nowe urządzenia - np. kamera śledząca wzrok człowieka i potrafiąca zidentyfikować, na który obiekt patrzy w danej chwili, może zastąpić komputerową myszkę. Na razie brakuje jej dokładności i rozdzielczości, ale przenoszenie wzroku z punktu na punkt na ekranie działa bez porównania szybciej niż przemieszczanie myszki. Projektanci współczesnych urządzeń peryferyjnych argumentują, że komputer z klawiaturą i myszką został wymyślony dla trzyrękiej istoty, a nie człowieka, bo u ludzi pracujących z klawiaturą zbyt często następuje kosztowna (pod względem ergonomicznym) potrzeba przenoszenia ręki z klawiszy na myszkę.

Kilka firm jednocześnie wypuściło na rynek wyświetlane klawiatury. Urządzenie nie większe niż standardowy telefon komórkowy wyświetla na dowolnej powierzchni laserowy obraz klawiatury, na której można "pisać". Do komunikacji z jednostką macierzystą służy Bluetooth, zaś wirtualne klawisze widoczne są nawet w dzień i w jasnym pomieszczeniu.

Ciekawostką ergonomiczną można nazwać wersję uproszczoną tego produktu, która klawiaturę (w wersji uproszczonej) wyświetla na podłodze i każe naciskać jej klawisze nogami. Jakkolwiek jej zastosowanie w pomieszczeniach biurowych wydaje się niezbyt szczęśliwym pomysłem (choć z pewnością dałoby odrobinę ruchu tak potrzebnego "białym kołnierzykom"), to jednak jej pojawienie się zwiastuje nową generację rozrywki komputerowej. Gry i zabawy połączone z aktywnością fizyczną na pewno ucieszą mieszczuchów i rodziców, nader często narzekających na ich pociechy spędzające czas przed monitorem zamiast na dworze.

Laboratoria badawcze, m.in. Microsoftu, bez wytchnienia pracują nad systemami analizy głosu i języka naturalnego. Wydawanie głosem poleceń maszynie jest marzeniem ludzkości od dawna, jednak dotychczas takie systemy nie znalazły komercyjnego zastosowania przede wszystkim z dwóch powodów. Po pierwsze, zestaw komend był ściśle ograniczony - polecenie można było wydać jednym, ściśle określonym słowem, którego wcześniej trzeba było komputer "nauczyć". Drugi powód to duża niepewność w oczyszczaniu dźwięku z szumu i identyfikacji właściwego polecenia. Dwoje ludzi prowadzących przyciszoną rozmowę w gwarnej poczekalni dworcowej słyszy się nie tyle dzięki narządowi słuchu, ile intensywnej pracy mózgu filtrującego szum i łączącego bodźce dźwiękowe ze wzrokowymi (śledzeniem ust rozmówcy). Niestety, tak doskonałego hardware nie posiadają komputery i dlatego zdane są na modele probabilistyczne - niestety, nadal zawodne.

Uwolniony umysł

Jednak wielu badaczy twierdzi, że główne problemy nie tkwią w sprzęcie, a w sposobie myślenia i przyzwyczajeniach ludzi. Jef Raskin, zmarły niedawno twórca interfejsu użytkownika Macintosha i najbardziej chyba prominentna postać HCI, mówił nawet, że potrzeba rewolucji. Pojęcie GUI chciał zastąpić pojęciem THE - od The Humane Environment. Poddawał krytyce podstawowe pojęcia, bez których użytkownicy nie wyobrażają sobie świata komputerów i... patrząc z dzisiejszej perspektywy trudno nie przyznać mu racji.

Przede wszystkim, argumentował Raskin, trzeba zrezygnować z koncepcji aplikacji. Jedna tylko czynność - wykonanie własnej strony internetowej - wymaga kilkunastu różnych "aplikacji". Najpierw potrzebujemy oprogramowania komunikującego się z aparatem cyfrowym, potem Photoshopa, w którym obrabiamy zdjęcia, następnie projektujemy stronę za pomocą graficznego edytora HTML i ewentualnie aplikacji Macromedia Flash, wreszcie umieszczamy jeszcze innym narzędziem (np. FTP) na serwerze i na koniec włączamy przeglądarkę, by zobaczyć, jak nasze dzieło wygląda. Znaczna część czasu poświęcona jest na uczenie się obsługi każdej aplikacji osobno i przenoszenie zawartości pomiędzy nimi. Zamiast aplikacji producenci powinni dostarczać polecenia (commands) działające na dowolnej zawartości (content). Abstrakcja polecenie-zawartość daje znacznie większą uniwersalność i łatwiejszą integrację komponentów w rozwiązania służące użytkownikowi do jego celów i w jego sposób. Nawiasem mówiąc, tak właśnie skonstruowany był komputer NeXT i system operacyjny NextStep.

Kolejna abstrakcja, z której dziś korzystamy, a której istnienie nas ogranicza, to okno. Okno izoluje fragment świata, oddzielając to co w środku od otoczenia, gdy tymczasem świat jest jednolity i ciągły. Zamiast okna Raskin proponuje możliwość ciągłego i dowolnego przybliżania i oddalania. Najlepiej posłużyć się analogią przestrzeni geograficznej - patrząc z bardzo wysoka widzimy miasto jako jednolitą strukturę, stopniowo obniżając się spostrzegamy domy, potem pomieszczenia, ludzi i biurka; na biurkach zaś - dokumenty różnego rodzaju, a w nich litery oraz cyfry powiązane zależnościami. Cały czas operujemy na przestrzeni, nie na "wydzielonych oknach tematycznych". Gdyby np. Google Maps było zaimplementowane tak jak okienkowy system operacyjny, istniałyby osobne kategorie: kraje, miasta, ulice, zabytki, restauracje. Zamiast tego mamy płaszczyznę, na której obiekty różnego rodzaju, zapewniające nam różne usługi (np. pozwalające zamówić jedzenie), widoczne są z różnej "wysokości".

Kilka schematów myślowych, w których dziś tkwimy, a które ograniczają nasze myślenie, można usunąć niemal od zaraz. Taki schemat myślowy to np. ulotna zawartość pamięci. Ileż to razy traciliśmy pracę przez błędnie zapisany plik Worda lub nagłe wyłączenie prądu. Rozdzielenie pamięci ulotnej i trwałej (konieczność wykonywania zapisu zawartości, bez którego zostanie ona utracona) to pozostałość z czasów, gdy stosowano dyskietki. We współczesnych komputerach wszystko to, co użytkownik wpisze, powinno być trwałe - i jest to technicznie wykonalne praktycznie od zaraz. Dodatkowo Raskin proponuje włączenie "undo" do każdej akcji (polecenia) dla każdej zawartości (dokumentu). Możliwość odwrócenia każdej akcji sprawi, że bezsensowne staną się ostrzeżenia ("czy na pewno chcesz nadpisać plik?"); da też każdemu użytkownikowi komfort pracy i obniży barierę wejścia w technologie informatyczne.

Raskin w ogóle proponuje zrezygnować z pojęcia pliku. Bardzo radykalnie wypowiada się o nazwach plików jako czymś bezużytecznym. Plik to abstrakcja potrzebna systemom operacyjnym, nie ludziom. Dokument to po prostu jego zawartość i powinniśmy być w stanie wyszukać go w ciągłej przestrzeni, o której była mowa powyżej, albo według wielowymiarowej kategoryzacji lub poprzez jego zawartość. Ciekawym potwierdzeniem prawdziwości myślenia twórcy Macintosha jest popularność narzędzi do wyszukiwania pełnotekstowego na dysku - coraz więcej osób dociera do dokumentów czy poczty elektronicznej nie poprzez hierarchię systemu plików, a poprzez wyszukiwanie po zawartości, tj. stosując narzędzia takie jak Google Desktop Search.

Nie każdy zgodzi się pewnie ze zdaniem Jefa Raskina, ale trudno nie spostrzec, że pole rozwoju HCI jest nadal bardzo szerokie. Zaś wiele ograniczeń tkwi w nas samych i trzeba odrzucić schematy, by od nowa spojrzeć na zagadnienie komunikacji między człowiekiem a maszyną.

Naukowcy próbują dziś także spojrzeć na działania użytkownika w szerszym kontekście, tj. celu, dla którego działa, a nie tylko czynności, którą wykonuje.

W laboratoriach Microsoftu opracowano prototypowe technologie pozwalające wizualnie przeszukiwać wielowymiarowe zbiory danych (np. dane analityczne z hurtowni). Pracująca tam grupa VIBE (Visualization and Interaction for Business and Entertainment) prowadzi projekty, których celem mają być także nowe urządzenia peryferyjne oraz nowe sposoby organizacji i wizualizacji danych. Istnieją komercyjne produkty (np. MindManager firmy MindJet), które pozwalają reprezentować pomysły, zdarzenia oraz wiązać je ze sobą i z dokumentami. Analogiczne produkty z grupy open source i free-ware są do ściągnięcia z Internetu.

Komputer po ludzku

W najbliższych latach trudno spodziewać się w interfejsach użytkownika podobnej rewolucji do tej, jaka miała miejsce w latach 80. i 90. za sprawą interfejsu okienkowego.

Aktualnie projektanci skoncentrowani są na bardzo niedoskonałych urządzeniach mobilnych i zapewne im właśnie będą poświęcać swoją uwagę przez najbliższe lata.

Najważniejsze, byśmy jako projektanci, programiści i użytkownicy aplikacji nigdy nie zaakceptowali punktu widzenia, w myśl którego to człowiek ma "gadać po robociemu". To komputer ma dopasowywać się do użytkownika, nigdy odwrotnie.

Tylko fakty

Ciekawe miejsca:

  • http://www.raskincenter.org - centrum badawcze Jefa Raskina, można stamtąd ściągnąć edytor Archy, który da nam przedsmak THE

  • http://research.microsoft.com/research /detail.aspx?id=2 - laboratoria Microsoftu zajmujące się HCI

  • http://en.wikipedia.org/wiki/Mind_map ping - strona z Wikipedii o tzw. mindmappingu, czyli reprezentacji idei

  • http://homepage.mac.com/bradster/iar chitect/ - fascynująca strona o projektowaniu interfejsu użytkownika, m.in. o typowych błędach popełnianych przez projektantów interfejsu użytkownika, obowiązkowa lektura dla każdego programisty


  • TOP 200