OpenAI wystarczy 15 sekundowa próbka, aby sklonować głos

OpenAI nie zwalnia i cały czas rozwija nowe usługi oparte o sztuczną inteligencję. Firma pochwaliła się właśnie możliwościami klonowania głosu na podstawie zaledwie 15-sekundowej próbki.

Jeszcze zaledwie dwa-trzy lata temu, aby skutecznie sklonować czyjś głos konieczne było dostarczenie kilkuminutowej próbki, na której znajdowały się wszystkie głoski wypowiadane w danym języku.

OpenAI skutecznie sklonuje nasz głos
Źródło: Shantanu Kumar / Unsplash

OpenAI skutecznie sklonuje nasz głos

Źródło: Shantanu Kumar / Unsplash

Aktualnie wystarczy zalewie kilkanaście sekund, aby skutecznie sklonować czyjś głos.

Według OpenAI rozwijana przez firmę wspieraną przez Microsoft sztuczna inteligencja jest w stanie skutecznie klonować głos po przeanalizowaniu zaledwie 15 sekundowego materiału próbnego.

Zobacz również:

  • Blaski i cienie AI
  • Sztuczna inteligencja od Apple wymagać może nowych procesorów
  • Ta technika rozwiązuje problem ograniczonej wielkości okien kontekstowych obsługujących modele językowe LLM

Firma od końca 2022 roku rozwija autorską usługę klonowania głosu o nazwie Voice Engine. Rozwiązanie to działa poprzez dostarczenie co najmniej 15-sekundowej próbki materiału mówionego. Użytkownik może następnie wprowadzić tekst, aby stworzyć materiał głosowy. OpenAI opisuje go jako "emocjonalną i realistyczną" mowę, która "bardzo przypomina oryginalnego mówcę".

OpenAI zdaje sobie sprawę z ryzyka, jakie niesie wdrożenie na światową skalę tego rozwiązania. Organizacja przyjmuje "ostrożne i świadome podejście do szerszego wydania ze względu na możliwość niewłaściwego użycia syntetycznego głosu", dodając, że chce "rozpocząć dialog na temat odpowiedzialnego wdrażania syntetycznych głosów i tego, w jaki sposób społeczeństwo może dostosować się do tych nowych możliwości".

Programiści pracujący nad Voice Engine chcieliby wykorzystać to rozwiązanie do rozwiązywania problemów osób niepełnosprawnych oraz w badaniach związanych z rozwojem medycyny.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200