Powstał algorytm zdolny rozpoznawać aktywność osób widocznych na przekazach wideo

Dwaj naukowcy (Hamed Pirsiavashz z Massachusetts Institute of Technology i Deva Ramanan z University of California) opracowali komputerową technologię, która analizuje obrazy wideo i z określa z dużą dokładnością ( jakiej nie oferują dostępne obecnie narzędzia tego typu) co widoczne na nich osoby robią. Naukowcy zapowiadają, ż zaprezentują opracowany przez siebie algorytm w następnym miesiącu w Ohio (USA) na konferencji Computer Vision and Pattern Recognition.

Opracowany przez naukowców algorytm bazuje na technikach używanych do analizowania języka naturalnego (podobnych do tych, które IBM zastosował w superkomputerze Watson) oraz na innych technologiach, dzięki którym komputer analizuje obrazy wideo i cały czas „uczy”, jak lepiej rozpoznawać aktywność widocznych na nich osób.

Istotną cechą (czytaj zaletą) rozwiązania jest to, czas potrzebny na wyszukanie na obrazach wideo określonej sytuacji czy akcji jest proporcjonalny do długości danego zapisu. Oznacza to, że jeśli w przypadku zapisu wideo trwającego np. 10 sekund czas ten wynosi x sekund, to w przypadku zapisu wideo trwającego 100 sekund czas ten wydłuży się tylko 10 razy. Stosowane obecnie technologie, używane do analizowania obrazów wideo, potrzebują na wykonanie takiej operacji dużo więcej czasu. Trwa ona wtedy nie 10 razy dłużej, ale setki (niekiedy nawet tysiąc) razy dłużej.

Zobacz również:

  • Trendy technologiczne 2024 według AWS

Algorytm opracowany przez naukowców potrafi dzielić bardzie złożone akcje widoczne na obrazach wideo na mniejsze części i analizować je oddzielnie, dokonując na końcu syntezy pozwalającej precyzyjnie określić, z jaka aktywnością mamy do czynienia.

Naukowcy opisali tę metodę w obrazowy sposób. Gdy robimy np. herbatę, nie ma znaczenia to czy wkładamy najpierw torebkę z herbatą do kubka czy też najpierw stawiamy czajnik z wodą na kuchence. Ważne jest to, że przed wlaniem wody do kubka musimy postawić czajnik na kuchence. Algorytm jest to w stanie wychwycić, zapamiętać i zastosować przy analizowaniu kolejnych dostarczonych mu obrazów wideo.

Naukowcy nie potrafią odpowiedzieć na pytanie, kiedy opracowana przez nich technologia może trafić do komercyjnych rozwiązań. Biorąc pod uwagę fakt, że zapotrzebowanie na tego rodzaju rozwiązania (które potrafią dokładanie analizować zdarzenia widoczne na przekazach wideo) jest bardzo duże, może to nastąpić w niedługim czasie.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200