Klucz z palca

Prosto w oczy

Tęczówka ludzkiego oka to ponad 200 różnych cech biologicznych, których kombinacja jest praktycznie niepowtarzalna. Tę właściwość wykorzystano podczas olimpiady w Nagano - biatloniści mieli dostęp do swoich karabinków dopiero po biometrycznej kontroli oczu. Kamera dokonywała skanowania tęczówki z odległości ok. 20 cm, dzieląc ją na osiem koncentrycznych pierścieni. Pierwszym dużym klientem, który postanowił zastosować nowy system w swoich bankomatach, stała się firma NCR. W ostatnich miesiącach podobne rozwiązania zaczął stosować bank NBS (Nationwide Building Society) w Anglii.

Wystarczy zrobić "perskie oko" do bankomatu ustawionego w filii banku w Swindon, aby otrzymać pieniądze. Technicznie system nie stwarza problemów i jeśli testy zakończą się pomyślnie, już wkrótce NBS zamierza zainstalować setki takich "wzrokowych" urządzeń. Nie jest wszakże pewne, czy użytkownicy zechcą zaaprobować nową technologię. Oczywiście, producenci zapewniają, że czytniki tęczówki są całkowicie bezpieczne dla naszego zdrowia, ale niepokój, że podczas skanowania dostajemy "laserem po oczach", pozostaje.

Tym bardziej że w ostatnim okresie zanotowano przypadki uszkodzeń wzroku spowodowane przez wskaźniki laserowe, używane podczas szkolno-biurowych prezentacji (laser pointer). Powiedzmy do końca, iż chodzi tu o użycie przyrządów o zbyt dużej mocy do celowego naświetlania oczu podczas nierozważnych zabaw czy wręcz chuligańskich wybryków. Sprawa ma zatem inny wymiar niż urządzenia biometryczne, ale niepewność powoduje powstawanie znaków zapytania - pierwsze kuchenki mikrofalowe również były mniej doskonałe i bezpieczne niż obecnie.

Proszę mówić

Inną metodą biometrycznego rozpoznawania osób jest analiza głosu, której zastosowania znacznie wykraczają poza problemy identyfikacyjne. W ostatnich latach informatyka poczyniła na tym polu duże postępy. Nie jest to zagadnienie trywialne, ale na rynku są już dostępne systemy z dźwiękowym interfejsem do edycji tekstów za stosunkowo niewielką cenę. Największą popularnością cieszą się produkty dwóch firm: IBM i Dragon Systems. Pomińmy rozwiązania w tzw. technologii dyskretnej, która wymaga dyktowania słów z niewielkimi przerwami między nimi. Komputerowi łatwiej, ale my musimy nauczyć się mówić z dykcją robota. Taki towar kupimy i za 20-30 USD. Dla tych, którzy zmuszeni są do "wklepywania" dużej ilości tekstu, inwestycja się opłaci, jakość jest również na akceptowalnym poziomie, przekraczającym 90% trafień.

Ale nie tędy droga do zastępowania klawiatury mikrofonem. Rzecz w normalnym, płynnym mówieniu. Komputer i to potrafi za nieco wyższą cenę stosownego pakietu: 150-250 USD. Efekty są tym lepsze, im więcej "pary" i pamięci ma nasza konfiguracja. I tak Naturally Speaking Dragona potrzebuje Pentium 166 MHz z 48 MB RAM, 80 MB na dysku to już drobnostka. Program operuje słownikiem 50 tys. aktywnych wyrazów. Liczba słów pasywnych (w tle) jest ponad 5 razy wyższa. W ofercie IBM podobnym produktem jest ViaVoice.

Parametry techniczne i cenowe tego oprogramowania zmieniają się szybko i użytkownik z przyjemnością dostrzeże, iż te pierwsze są coraz lepsze, te ostatnie coraz niższe. Dla nas w tym kontekście istotne pozostaje pytanie o możliwość dyktowania w jęz. polskim. Na razie dominują języki bardziej w świecie popularne niż nasz: angielski, francuski, hiszpański, niemiecki, włoski, a także chiński i japoński. Niezależnie od tego, należy oczekiwać dalszego rozwoju i rozpowszechniania technologii interfejsów głosowych.

Gadająca pralka

Karykaturalne wizje biur, w których użytkownicy przekrzykują się, usiłując "wytłumaczyć" coś komputerowi, to lekka przesada. Oczywiście, trudno byłoby pracować w kilkuosobowym pomieszczeniu, po przejściu od myszki i klawiatury na dźwiękowe wprowadzanie danych. Nie chodzi jednak o bezwzględne i pełne zastępowanie tradycyjnej nawigacji software'owej akustycznymi urządzeniami wejściowymi. Komend o charakterze sterującym nie jest dużo i takie systemy próbowano wprowadzać na rynek już przed kilkoma laty (Compaq) jako alternatywę, która nie mogła przecież wyprzeć bardziej efektywnych, w ogólnym przypadku, rozwiązań klasycznych.

Znamienny jest tu także przykład znanego od 5 lat modułu PlainTalk firmy Apple, który nie stał się przełomem w dialogu człowieka z maszyną cyfrową. Jest jednak wiele obszarów, gdzie taka rozmowa z komputerem wydaje się być idealną koncepcją. Mogą to być systemy specjalizowane, informacyjne w miejscach publicznych czy przemysłowe. Inny przykład to komputerowa telefonia integrowana w dystrybucji standardowych towarów z dostawą do domu (produkty spożywcze) czy zamawianie usług. Również prostota automatycznych sekretarek może być rozszerzona o bardziej złożone funkcje.

I wreszcie samochód. Auta szpikowane są coraz bardziej skomplikowaną elektroniką. Ale jak to wszystko obsługiwać? Wystarczy jedno słowo do urządzenia, które nas się "słucha" i sprawa załatwiona! Może kiedyś będziemy wydawać naszym pojazdom polecenia typu "wrzuć trójkę" bez obawy o nieporozumienia. Na razie jednak realia to AutoPC Microsoftu - kombajn z Windows CE łączący radio, telefon, odtwarzacz CD, system nawigacyjny GPS i opcje rozszerzeń. A wszystko czujnie nasłuchujące "głosu swego pana". Również komunikaty dla kierowcy podawane są w sposób dźwiękowy. Jest zatem z kim, a raczej z czym pogadać podczas jazdy.

Inne pole zastosowań to tzw. inteligentny dom. Firma Home Automated Living proponuje możliwość głosowego sterowania oświetleniem i drzwiami, choć elektronik wzruszy tu pewnie ramionami - lampy reagujące na klaskanie znane są od wielu lat. No ale "bicie brawa" żarówce to zupełnie coś innego niż pogawędka z pralką czy lodówką. Zresztą równie dobrze może to być aparat fotograficzny czy mikroskop, maszyna budowlana bądź urządzenie medyczne - głos przyjdzie nam z pomocą wszędzie tam, gdzie ręce są już zajęte.


TOP 200