Jak sztuczna inteligencja zaczyna naśladować sposób ludzkiego rozumowania?

Systemy wykorzystujące sztuczną inteligencję towarzyszą nam od dawna choć nie zawsze o tym wiemy, a producenci oprogramowania zaczynają tworzyć rozwiązania, które pozwalają naśladować ludzkie rozumowanie.

Sztuczna inteligencja towarzyszy nam w codziennym życiu już od dawna. Wiele rozwiązań stworzonych w tej technologii ma jednak bardzo wąskie zastosowanie lub jest ukierunkowanych na wykonywanie ściśle określonych zadań, stąd często nie są one postrzegane przez użytkowników jako element sztucznej inteligencji.

Dobrym przykładem rozwiązań odwzorowujących sposób, w jaki myślą ludzie, są rekomendacje produktowe wyświetlane użytkownikom takich serwisów, jak Netflix i Amazon. Jak to działa? Otóż, w pierwszej kolejności analizowane są wszystkie dotychczasowe „polubienia” użytkownika (zapisane w historii wyświetlanych stron lub dokonywanych zakupów), a następnie wyszukiwani są inni użytkownicy o podobnym profilu. W wyniku porównania obu profili tworzona jest lista rekomendacji, na której znajdują się produkty, z którymi dany użytkownik jeszcze nie miał styczności. Co ciekawe, taki sposób postępowania nie różni się wcale dużo od zachowania ludzi poza internetem. W rzeczywistości, także porównują oni upodobania dwóch podobnych do siebie osób, np. znajomych, chociażby po to, by wybrać dla jednego z nich odpowiedni upominek lub prezent urodzinowy.

Zobacz również:

  • Sztuczna inteligencja sprawdza się w bankowości
  • Odkryto nową metodę atakowania głosowych asystentów
  • Dzięki tej nowej opcji, Cortana wkracza śmielej do świata biznesu
  • By lepiej zrozumieć, na jakim etapie rozwoju znajduje się obecnie sztuczna inteligencja, warto przyjrzeć się poszczególnym jej komponentom i ludzkiemu zachowaniu, które ta technologia stara się naśladować. A zatem, jak przejawia się ludzka inteligencja?

    Rozpoznawanie, rozumowanie i porozumiewanie się

    Ogólnie rzecz biorąc, inteligencję i umiejętności poznawcze można rozważać w trzech kategoriach: rozpoznawania, rozumowania i porozumiewania się. W obrębie tych obszarów głównych rozróżnia się dodatkowo rozpoznawanie mowy i obrazu, odmiennie sposoby myślenia (np. indukcyjne, dedukcyjne) i generowanie mowy w celach komunikacyjnych. Innymi słowy, inteligencja sprowadza się do umiejętności absorbowania informacji, ich przetwarzania, a komunikowania na zewnątrz końcowych wniosków.

    Badania nad sztuczną inteligencją zwykle odrębnie zajmują się poszczególnymi aspektami ludzkiej inteligencji. Mimo to, większość stosowanych obecnie rozwiązań łączy w sobie wszystkie trzy wymienione umiejętności poznawcze, szczególnie w segmencie produktów konsumenckich.

    Rozpoznawanie mowy

    Współcześni asystenci mobilni – Siri, Cortana i Google Now – wykorzystują technologie rozpoznawania mowy, by identyfikować słowa wypowiadane przez użytkownika, a następnie przechwytują dźwięk i wyodrębniają pełne zbiory słów na podstawie przebiegu drgań. Podstawą funkcjonowania wszystkich wspomnianych asystentów mobilnych są technologie rozpoznawania mowy. O ile Apple wykorzystuje produkty stworzone przez firmę Nuance, o tyle Microsoft i Google opracowują własne rozwiązania. Co ważne, na obecnym etapie rozwoju sztucznej inteligencji, asystenci mobilni nie rozumieją identyfikowanych przez siebie słów. Ich działanie polega na przechwytywaniu informacji w taki sam sposób, jak wtedy, gdy użytkownik wystukuje słowa na klawiaturze smartfona lub komputera.

    Zadaniem systemu rozpoznawania mowy jest przetworzenie rejestrowanych sygnałów na tekst.

    Zadaniem systemu rozpoznawania mowy jest przetworzenie rejestrowanych sygnałów na tekst.

    Rozumowanie

    Wynikiem rozpoznawania mowy są pełne ciągi wyrazów. By móc je skutecznie wykorzystywać, asystenci muszą „domyślić się” stojących za nimi intencji i znaleźć sposób na wsparcie użytkownika w osiągnięciu zamierzonego celu. Na tym etapie do akcji wkraczają techniki przetwarzania języka naturalnego NLP (Natural Language Processing).

    Warto zauważyć, że każde ze wspomnianych rozwiązań prezentuje inne podejście do problemu, ale wszystkie wykorzystują technologie NLP w podobny sposób. Przykładowo, jeśli użytkownik wypowiada słowo „pizza”, asystenci identyfikują to słowo jako oznaczające żywność i jednocześnie odnotowują, że nie użyto np. słowa „przepis”. W ten sposób „domyślają się”, że celem użytkownika nie jest wyszukanie informacji, o tym jak przygotować pizzę, lecz znalezienie restauracji serwujących to danie.

    To przykład procesu przetwarzania prostego języka, którego podstawą są nieskomplikowane definicje i zależności. W rezultacie, asystenci „dowiadują się”, że użytkownik szuka pizzerii, a dokładniej, wnioskują, że chce on wiedzieć, gdzie takie miejsca się znajdują.

    Porozumiewanie się

    Dzięki przekształceniu dźwięku w słowa asystenci pozyskują informacje o rzeczywistych potrzebach użytkownika i planują działania zmierzającego do spełnienia tych potrzeb. W przypadku „pizzy” pobierają dane GPS, wyszukują restauracje serwujące pizzę i tworzą ich listę sortowaną według odległości dzielącej pizzerie od użytkownika, opinii na ich temat i cen. Co więcej, jeżeli użytkownik wyszukiwał takie informacje już wcześniej, sugerują lubiane przez niego miejsca.

    Po wykonaniu wszystkich powyższych czynności system segreguje wyniki wyszukiwania, tworząc jedno lub dwa zdania w tzw. procesie NLG (Natural Language Generation), który polega na tłumaczeniu danych na język naturalny. Następnie zdania są przekształcane w dźwięki przez system generowania mowy.

    Szeroka i wąska sztuczna inteligencja

    Opisywane systemy łączą w sobie zarówno szerokie, jak i wąskie podejście do sztucznej inteligencji. Rozpoznawanie mowy oraz jej generowanie to zadania dość ogóle i większość rozwiązań świetnie sobie z nimi radzi.

    Tego rodzaju systemy operują jednak zwykle dość wąskim zakresem zadań, które mogą zostać wykonane, a ich rozumowanie polega przede wszystkim na decydowaniu, jakie z możliwych zadań należy wykonać w danej sytuacji (na przykład wyszukiwać restauracje czy przepisy). Zadania te są ukierunkowane na wyszukiwanie informacji zgodnych z intencjami użytkownika przez wysyłanie zapytań o dane w oparciu o elementy tekstowe utworzone przez mechanizm rozpoznawania mowy. Rzeczywista inteligencja takich asystentów polega na pozyskiwaniu instrukcji od użytkownika przez identyfikowanie haseł wskazujących na jego intencje. Jeśli jednak użytkownik prześle zapytanie wykraczające poza wiedzę i umiejętności systemu (czyli zakres wykonalnych zadań), z reguły nie wie on, jak w takiej sytuacji się zachować. Najczęściej stosowanym rozwiązaniem jest wówczas skorzystanie ze standardowych odpowiedzi, które są generowane przez wyszukiwarki po wpisaniu słów podanych przez użytkownika.

    Podstawowe elementy inteligentnego systemu interakcji z użytkownikami.

    Podstawowe elementy inteligentnego systemu interakcji z użytkownikami.

    Wysokiej klasy technologie rozpoznawania i generowania mowy wspomagają i wzbogacają interakcję z użytkownikiem. Kombinacja inteligentnych funkcji daje możliwość tworzenia zintegrowanych systemów, które potrafią zrozumieć intencje i potrzeby użytkownika, a następnie dostarczyć mu pożądaną odpowiedź. Dlatego też warto śledzić rozwój technologii i możliwości sztucznej inteligencji w zakresie rozpoznawania mowy, rozumowania i porozumiewania się.


    TOP 200