GenAI zamienia tekst na przekaz wideo

Janusz Chustecki,
16.02.2024, godz. 09:43

Firma OpenAI zaprezentowała kilka dni temu swój następny model GenAI, który zamienia tekst na wideo. Rozwiązanie nosi nazwę Sora i jest w stanie wygenerować przekaz wideo mający rozdzielczość 1080p, który składa się z tła oraz do kilkunastu animowanych postaci czy obiektów.

Narzędzie może też jak to określa OpenAI „rozszerzać” istniejące klipy o nowe obiekty, jak również uzupełniać brakujące szczegóły. Może również renderować gry wideo. Sora wydaje się dość dobrze interpretować tekst i tworzyć niekiedy bardzo interesujące oraz żywe postacie. Co ciekawe model rozumie nie tylko to, o co użytkownik prosi w opisie, ale dodawać do przekazu postacie istniejące w świecie fizycznym.

Strona demonstracyjna opublikowana przez OpenAI zawiera wiele przykładów tego, jak działa narzędzie. Sora może generować filmy mające różne style. Może to być więc bardzo realistyczny film, animowany, czarno-biały czy też kolorowy. Filmy prezentują się przy tym realistycznie i Sora nie generuje różnego rodzaju dziwnych i surrealistycznych przekazów, jak ma miejsce często w przypadku innych narzędzi tego typu.

Zobacz również:

OpenAI informuje, że współpracuje z ekspertami, aby zbadać model pod kątem exploitów i zbudować narzędzia umożliwiające wykrycie, czy film został wygenerowany przez Sorę. Twierdzi również, że jeśli zdecyduje się na wbudowanie modelu w produkt dostępny publicznie, zapewni aby metadane dotyczące pochodzenia były uwzględnione w wygenerowanych wynikach.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem IDGLicensing@theygsgroup.com