Captha

Subskrybuj RSS A A A
11 grudnia 2007
Bogdan Pilawski

Tytuł tego felietonu to nieco naciągany skrót, bo - jak liczne informatyczne skróty - ma też, jako całość, kojarzyć się z jakimś pojęciem.

Tytuł tego felietonu to nieco naciągany skrót, bo - jak liczne informatyczne skróty - ma też, jako całość, kojarzyć się z jakimś pojęciem.

W tym przypadku jego rozwinięcie to Completely Automated Turing Test To Tell Computers And Humans Apart, czego sens sprowadza się do wykrywania, czy mamy do czynienia z człowiekiem, czy z komputerem. Jednocześnie, aż nader oczywiste jest skojarzenie ze słowem "capture", używanym m.in. na określenie czynności przejmowania i wprowadzania danych.

Sam skrót CAPTCHA oznacza w praktyce zapis kilku znaków, np. słowa, celowo zniekształcony graficznie, by utrudnić automatyczne rozpoznanie go przez program komputerowy. Jak to ktoś obrazowo objaśnił - to tak, jakby zapisać słowo na płaskim kawałku gumy i rozciągnąć ją później, w różnym stopniu i w różnych kierunkach naraz.

Wymyślono to na Uniwersytecie Carnegie Mellon, dla serwisu internetowego Yahoo, po to, by utrudnić dostęp komputerowych automatów, próbujących, na zasadzie kukułczego jaja, podrzucać własne treści reklamowe (np. jako głosy w dyskusji), bądź polować na adresy poczty elektronicznej, które można później wykorzystać do rozsyłania spamu.

Z rozwiązaniem tym spotkał się zapewne każdy, kto próbował zarejestrować się w jakimś internetowym serwisie, uwierzytelnić się w nim, bądź wysłać własną opinię w jakiejś sprawie. Polega ono zawsze na żądaniu odczytania takiego niekształtnego tekstu i wpisania go w polu przeznaczonym na hasło.

Takie zabezpieczenie przed automatami jest obecnie stosowane powszechnie (ocenia się, że ok. 60 mln razy każdego dnia). Zakładając, że jeżeli odczytanie i wpisanie zniekształconych liter zajmuje tylko 10 sekund, to łącznie zabiera to ludziom ok. 150 tys. godzin dziennie. Sądzę jednak, że jest to rachunek zaniżony, bo sam jestem jakoś mało rozgarnięty i udaje mi się przejść taką kontrolę za trzecim, a czasem nawet - dopiero za czwartym podejściem.

Ten sam Uniwersytet Carnegie Mellon prowadzi akcję o nazwie Internet Archive, której częścią jest sporządzanie elektronicznej wersji książek, dla których wygasły już prawa autorskie. Ma to umożliwić nie tylko ich czytanie w tej wersji, ale również przeszukiwanie ich tekstu, do czego nie wystarczy przenieść do komputera same obrazy stron, ale trzeba jeszcze zamienić tekst na postać elektroniczną.

Okazuje się, że to ostatnie zadanie wcale nie jest łatwe dla komputerów, szczególnie gdy uwzględnić książki stare, podniszczone czasopisma i wyblakłe rękopisy, gdzie komputery nie radzą sobie przeciętnie z co dziesiątym słowem. A do "przerobu" ma ten Uniwersytet ponad 100 mln egzemplarzy, co - jak się tam ocenia - przy obecnym tempie prac zajęłoby jakieś 400 lat.

No i wpadł tam ktoś na pomysł, aby zatrudnić do tego żmudnego zadania użytkowników popularnych serwisów internetowych. Stosuje się w tym celu CAPTCHA składający się z dwóch słów, z których jedno jest znane systemowi i pełni dotychczasową rolę kontrolną, drugie zaś pochodzi spośród tych z obrabianych tekstów książek, z których odczytaniem komputery mają problem. Tym razem, zamiast bezradnego komputera, nad sprawą głowi się człowiek. Aby wyeliminować wątpliwości i błędy, każde takie drugie słowo wysyła się co najmniej do dwóch osób, wyniki od których są przyjmowane w przypadku zgodności. System ten pomaga podobno rozszyfrować dziennie około miliona słów, z którymi komputery sobie radzą.

A mnie zastanawia bardziej organizacja całości, bo przecież cały system, najpierw rozsyłania, a potem zbierania tych słów i ich wstawiania we właściwe miejsca, w tekstach do których należą, musi być wysoce zautomatyzowany i zarazem pewny. A to potrafią już jednak tylko komputery...

Oceń artykuł

średnio: 0 liczba ocen: 0

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88