Powstał model sztucznej inteligencji, który potrafi replikować głos konkretnej osoby

Meta zaprojektowała specyficzny model sztucznej inteligencji, który może replikować głos dowolnej, wskazanej mu osoby (przetwarzając tekst na przekaz audio), odtwarzając go na razie w sześciu różnych językach, w tym w języku polskim.

Grafika: Jack Moreh/freerangestock

Narzędzie nie zostało jednak jak dotąd udostępnione użytkownikom, gdyż firma uważa takie posunięcie za nierozsądne z wiadomych względów. W opublikowanym z tej okazji komunikacie prasowym, twórcy narzędzia noszącego nazwę Voicebox chwalą się, że jest to przełomowe rozwiązanie które może być jednak wykorzystywane nie tylko do tworzenia nowych i innowacyjnych aplikacji (np. takich, które pozwolą osobom niedowidzącym odsłuchiwać wiadomości od przyjaciół wypowiadanych ich własnym głosem lub pozwolą im mówić w obcych językach własnym głosem), ale może też posłużyć hakerom i różnego rodzaju oszustom do rozpowszechniania fałszywych treści.

I właśnie ze względu na potencjalne ryzyko niewłaściwego użycia oprogramowania Voicebox, nie została ono udostępnione publiczne. To trudna decyzja, ponieważ Meta stara się być otwarta na społeczność AI i dzielić się z nią swoimi dokonaniami, jednak jednocześnie czuje się zobowiązana w zachowania właściwej proporcji między otwartością a odpowiedzialnością. Firma nie wyklucza natomiast, że użyje narzędzia do edytowania ścieżek audio do wideo do tworzenia bardziej naturalnie brzmiących przekazów audio wypowiadanych przez wirtualnych asystentów.

Zobacz również:

  • Microsoft zapowiada nową linię małych modeli językowych AI
  • Rzecznik Mety skazany przez rosyjski sąd na sześć lat więzienia
W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200