Ten model AI potrafi identyfikować obiekty widoczne na zdjęciach

Firma Meta poinformowała, że opracowała bazującą na sztucznej inteligencji technologię segmentowania obrazów i zdjęć, co pozwala identyfikować znajdujące się na nich obiekty w podobny sposób, jak robi to ludzki mózg.

Grafika: Meta

Jest to możliwe dzięki dwóm rozwiązaniom AI kryjącym się za skrótami SAM i SA-1B. Pierwsze rozwiązanie (skrót od nazwy Segment Anything Model) to opracowany przez firmę Meta specjalny model AI, a drugie ( skrót od nazwy Segment Anything 1-Billion) to nic innego jak olbrzymi zbiór danych używany do uczenia sztucznej inteligencji, jak ma rozpoznawać poszczególne obiekty widoczne na zaprezentowanej jej grafice czy zdjęciu.

Na zademonstrowanym ostatnio przez firmę materiale omawiającym tę technologię widać zdjęcie przedstawiające pudełko pełne różnych owoców oraz efekt działania technologii noszącej nazwę Segment Anything. A była ona w stanie wskazać i nazwać poszczególne obiekty widoczne na zdjęciu, a więc zarówno samo pudełko, jak i znajdujące się w nim owoce, wymieniając po kolei ich nazwy.

Zobacz również:

Nazwa Segment Anything 1-Billion wzięła się stąd, że zbiór danych zawiera tzw. ponad miliard tzw. masek reprezentujących różne obiekty zidentyfikowane na 11 milionach obrazach, które zostały zaprezentowanych sztucznej inteligencji w trakcie jej szkolenia . Technologię segmentowania obrazów można wykorzystać do edytowania zdjęć, do naukowego analizowania obrazów i grafik, jak również można ja integrować z aplikacjami AR (rozszerzona rzeczywistość) i VR (wirtualna rzeczywistość.

Poprzednie modele segmentowania obrazów wymagały szkolenia sztucznej inteligencji z wykorzystaniem obiektów, którym towarzyszą naniesione na nie odręczne adnotacje. Natomiast Segment Anything to pojedynczy model, który może z łatwością identyfikować poszczególne obiekty widoczne na obrazie i następnie dokonywać segmentacji. Dlatego deweloperzy zajmujący się tym tematem i stosujący technologię firmy Meta nie muszą już posiłkować się własnymi danymi, oszczędzając w ten sposób dużo czasu. Mogą też przetestować tę technologię, odwiedzając witrynę demonstracyjną Segment Anything, przesyłając wtedy własny obraz lub wykorzystując te widoczne w galerii.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200