Ta wszędobylska sztuczna inteligencja

Siri i pozostali wirtualni asystenci wkrótce zrewolucjonizują absolutnie każdy aspekt naszego życia. Przygotujmy się na niebywałą rewolucję.

Wirtualni asystenci nie cieszą się zbyt dobrą sławą – tego typu rozwiązania są często postrzegane jako zbędne dodatki albo tanie chwyty marketingowe. Zupełnie pomija się fakt, że właśnie te rozwiązania mogą zrewolucjonizować sposób, w jaki dziś żyjemy.

Spektakularne wpadki podczas prezentacji najnowszych rozwiązań z pewnością nie pomagają w budowaniu pozytywnego wizerunku wirtualnych asystentów. Wystarczy wspomnieć tutaj o kompletnym fiasku Cortany– wirtualnej asystentki od Microsoft – podczas wrześniowej konferencji Dreamforce organizowanej w San Francisco przez firmę Salesforce.com. Pytanie zadane przez prezesa Microsoft Satya Nadellę, które brzmiało „Show me my most at-risk opportunities” (Pokaż szanse najbardziej obarczone ryzykiem), zostało zrozumiane przez tę biznesową aplikację jako „Show me to buy milk at this opportunity” (Pokaż, gdzie mogę kupić mleko).

Zobacz również:

  • IDC CIO Summit – potencjał drzemiący w algorytmach
  • Relacja z WWDC 2023 - najważniejszej konferencji Apple w roku

Demonstracja nie powiodła się, ale przyczyny tego niepowodzenia są zupełnie inne niż błędne zaprogramowanie Cortany czy też ogólna słabość wirtualnych asystentów jako interfejsów. Demonstracja nie powiodła się ze względu na warunki akustyczne. Możliwości tego systemu głosowego były prezentowane za pośrednictwem mikrofonu, na scenie w zatłoczonej hali, w której cała widownia korzysta z urządzeń bezprzewodowych – to po prostu nie mogło się udać.

Takie wpadki – będące skutkiem błędu ludzkiego, nie technologicznego – sprawiają, że mało kto zdaje sobie sprawę z potencjału, jaki niosą ze sobą wirtualni asystenci w rodzaju Cortany. W przyszłości to właśnie te rozwiązania zrewolucjonizują nasze życie i prawdopodobnie zmienią świat nie do poznania. Będzie to jednocześnie cudowna i przerażająca transformacja, która otworzy przed nami wspaniałe możliwości.

W najlepszych przypadkach, korzystanie z dobrze zaprojektowanego wirtualnego asystenta odbywa się tak, jak rozmowa z drugim człowiekiem. I chociaż wydaje się, że jest to pojedyncze zjawisko technologiczne, wymaga ono zastosowania wielu różnych, często wyjątkowych technologii, takich jak:

• Rozpoznawanie mowy (umiejętność rozpoznawania tekstu mówionego, wyrażeń potocznych i akcentów przy jednoczesnym ignorowaniu mowy w tle i dźwięków niebędących mową – w czasie rzeczywistym, czyli równocześnie z mową użytkownika).

• Kompresja i transfer plików (szybkość pakowania plików głosowych i ich transferu do centrum danych w celu przetworzenia).

• Sztuczna inteligencja (umiejętność „rozumienia” informacji przekazywanych przez użytkownika przez serwery i oprogramowania, a następnie decydowania, które informacje należy przekazać użytkownikowi jako odpowiedź).

• Źródła danych (dostęp do baz wiedzy, silników obliczeniowych i pozostałych danych niezbędnych do tworzenia odpowiedzi).

• Kontekst użytkownika (dane użytkownika pobierane z wiadomości e-mail, kalendarzy, list kontaktów, lokalizacji, historii i pozostałych informacji wyświetlanych na ekranie).

• Silnik konwersacyjny (umiejętność tworzenia wypowiedzi o różnorodnych cechach, zawierających elementy mowy potocznej i wyrażenia humorystyczne, a także uwzględniających kontekst).

• Pośrednictwo (umiejętność wykonywania operacji w imieniu użytkownika, takich jak dokonywanie rezerwacji, zarządzanie kontaktami, zakupy, pobieranie aplikacji i wykonywanie poleceń w ramach tych aplikacji).

• Proaktywność (umiejętność decydowania o tym, jaką operację należy wykonać, bez informacji ze strony użytkownika).

Każdy z wyżej wymienionych elementów należy rozpatrywać osobno, gdyż poszczególne rozwiązania bazują na różnych koncepcjach, technologiach i metodach. Co najważniejsze, każda z tych technologii rozwija się w zatrważającym tempie. Rośnie także rynek, na którym dostępne są już dowolne aplikacje możliwe do wdrożenia w dowolnym produkcie lub usłudze.

Wyobraźmy sobie na przykład asystentkę Siri, która jest o 25% wydajniejsza w każdym swoim zadaniu – lepiej rozpoznaje mowę, szybciej przetwarza żądania, ma bardziej rozwiniętą sztuczną inteligencję, gromadzi więcej danych, itd.

Tak się składa, że wszystko to stanie się faktem pewnie za kilka miesięcy, a technologie będą się na pewno nieustannie rozwijać.

W konsekwencji, wirtualni asystenci szybko przestają być gadżetami, które na dodatek mało kto używa. Za rok albo za dwa lata będą już służyć jako główny interfejs dający użytkownikowi dostęp do wszystkiego, co ma na swoim komputerze.

Właśnie dlatego technologie, na których bazują wirtualni asystenci, są idealnym interfejsem również dla takich rozwiązań jak Amazon Fire TV czy najnowsza wersja Apple TV, która wkrótce się ukaże.

Na horyzoncie pojawiają się także nowe, zaawansowane aplikacje, takie jak chociażby Hound.

Wirtualni asystenci będą dodawani do coraz większej liczby różnorodnych aplikacji, czego przykładem jest „M” w aplikacji Facebook Messenger.

Coraz liczniejszą grupę stanowią także urządzenia z wbudowanymi wirtualnymi asystentami, jak chociażby Amazon Echo.

A to i tak dopiero początek. Nim się obejrzymy, wirtualni asystenci pojawią się w wielu różnorodnych produktach, gdzie będą służyć jako główny interfejs użytkownika.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200