Facebook kładzie podwaliny pod rozwój internetu przyszłości

Korporacja uważa, że do prawidłowego funkcjonowania rozszerzonej i wirtualnej rzeczywistość niezbędne będzie opracowanie sztucznej inteligencji zdolnej wspierać specyficznego rodzaju technologię, która będzie w stanie w odpowiedni sposób analizować i interpretować przekazy wideo. To technologia, której Facebook nadał roboczą nazwę perspektywy egocentrycznej (egocentric perspective) lub perspektywy pierwszej osoby.

Grafika: Patrick Schneider/Unsplash

Wpisuje się ono dobrze w szerszy projekt nad którym pracuje Facebook, który nosi nazwę metaverse. Metaverse to coś więcej niż technologie VR i AR. Mówiąc najprościej chodzi o nową wersję internetu czy też kolejną wersję rozszerzonej rzeczywistości, w której świat rzeczywisty i wirtualny przenikają się wzajemnie, kreując zupełnie nową przestrzeń zbudowaną z trójwymiarowych, wchodzących ze sobą w interakcję obiektów.

Facebook Reality Labs pracuje nad technologią perspektywy egocentrycznej razem z naukowcami z kilkunastu instytucji naukowych i zaprezentował kilka dni temu pierwszy efekt tej współpracy. Jest nim pakiet Ego4D (wyrażenie 4D informuje, że mamy tu czynienia z dodatkowym, czwartym wymiarem), w skład którego wchodzą dwa komponenty. Pierwszym jest otwarty zbór danych będący zapisem trwającego prawie 2880 godzin przekazu wideo, pokazującego czym jest perspektywa pierwszej osoby.

Zobacz również:

  • Microsoft zapowiada nową linię małych modeli językowych AI
  • Meta będzie znakować szkodliwe treści generowane przez AI
  • Vids, czyli nowa jakość tworzenia przekazów wideo

Drugim elementem pakietu jest zestaw testów porównawczych zaprojektowanych dla sieci neuronowych, które w zamyśle jego twórców mają uczyć sztuczną inteligencję, jak powinna postrzegać i interpretować zapisy wideo z perspektywy pierwszej osoby. Szczegóły tego nowatorskiego projektu zastały zaprezentowane w dokumencie zatytułowanym "Ego4D: Around the World in 2.8K Hours of Egocentric Video”, którego autorem jest pracujący w Facebooku naukowiec Kristen Grauman.

Wspomniany zbiór danych ma pomóc naukowcom projektować sieci neuronowe, które z racji swoich olbrzymich możliwości mogą z powodzeniem wspomagać sztuczną inteligencję w procesie budowania perspektywy pierwszej osoby, podobnie jak robią to inne zbiory danych (takie jak np. ImageNet), które wspomagają również sztuczną inteligencję, ale wyłącznie w procesie budowania zwykłej perspektywy.

Facebook wyjaśnia, że podstawowym celem egocentrycznej percepcji jest próba rozwiązania problemów, z którymi obecnie sieci neuronowe nie mogą sobie poradzić. Występują one wtedy, gdy w przekazie wideo punkt widzenia obrazu ulega zmianie. Większość dostępnych obecnie systemów rozpoznawania obrazu, które mają do czynienia z takimi sytuacjami, ma wysoki wskaźnik niepowodzeń. Nowa inicjatywa Facebooka i takie pakiety jak Ego4D mają temu zaradzić.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200