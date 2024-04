OpenAI nie zwalnia i cały czas rozwija nowe usługi oparte o sztuczną inteligencję. Firma pochwaliła się właśnie możliwościami klonowania głosu na podstawie zaledwie 15-sekundowej próbki.

Jeszcze zaledwie dwa-trzy lata temu, aby skutecznie sklonować czyjś głos konieczne było dostarczenie kilkuminutowej próbki, na której znajdowały się wszystkie głoski wypowiadane w danym języku.

OpenAI skutecznie sklonuje nasz głos Źródło: Shantanu Kumar / Unsplash

Aktualnie wystarczy zalewie kilkanaście sekund, aby skutecznie sklonować czyjś głos.

Według OpenAI rozwijana przez firmę wspieraną przez Microsoft sztuczna inteligencja jest w stanie skutecznie klonować głos po przeanalizowaniu zaledwie 15 sekundowego materiału próbnego.

Firma od końca 2022 roku rozwija autorską usługę klonowania głosu o nazwie Voice Engine. Rozwiązanie to działa poprzez dostarczenie co najmniej 15-sekundowej próbki materiału mówionego. Użytkownik może następnie wprowadzić tekst, aby stworzyć materiał głosowy. OpenAI opisuje go jako "emocjonalną i realistyczną" mowę, która "bardzo przypomina oryginalnego mówcę".

OpenAI zdaje sobie sprawę z ryzyka, jakie niesie wdrożenie na światową skalę tego rozwiązania. Organizacja przyjmuje "ostrożne i świadome podejście do szerszego wydania ze względu na możliwość niewłaściwego użycia syntetycznego głosu", dodając, że chce "rozpocząć dialog na temat odpowiedzialnego wdrażania syntetycznych głosów i tego, w jaki sposób społeczeństwo może dostosować się do tych nowych możliwości".

Programiści pracujący nad Voice Engine chcieliby wykorzystać to rozwiązanie do rozwiązywania problemów osób niepełnosprawnych oraz w badaniach związanych z rozwojem medycyny.