To nowe narzędzie AI zamienia tekst na muzykę
- Janusz Chustecki,
- 04.08.2023, godz. 11:02
Firma Meta zaprezentowała w tym tygodniu nowe narzędzie AI potrafiące zamieniać zaprezentowany mu tekst na utwór muzyczny. Rozwiązanie nosi nazwę AudioCraft i będzie na rynku konkurować przede wszystkim z podobną aplikacją opracowaną swego czasu przez Google.
Tym samym sztuczna inteligencja krok po kroku wkracza również do szeroko pojętego przemysłu rozrywkowego, tworząc np. utwory muzyczne i utwory śpiewane przez wirtualnych twórców, którzy w perfekcyjny sposób imitują głosy znanych artystów, co wzbudza w świecie show biznesu coraz większe kontrowersje. Niektórzy nawet uważają, że bliska jest chwila w której tacy wirtualni twórcy zaczną startować w konkursach piosenki i zdobywać nagrody.
Zaprezentowane przez Metę rozwiązanie zawiera trzy generatywne modele sztucznej inteligencji Meta: MusicGen, AudioGen i EnCodec. Dwa pierwsze (MusicGen, jak i AudioGen) zajmują się generowanie zasobu audio, przy czym MusicGen zajmuje się muzyką, a AudioGen generuje towarzysze muzyce efekty dźwiękowe. Może to być pianie np. pianie koguta, odgłosy wodospadu czy skrzypienie otwieranych drzwi. Trzeci model koduje muzykę.
Zobacz również:
- Copilot znaczy po polsku wsparcie
- Tajemnicze chatboty gpt2
- Rzecznik Mety skazany przez rosyjski sąd na sześć lat więzienia
Wersja demonstracyjna rozwiązanie znajduje się na tej witrynie. Można na niej określić, jaki rodzaj muzyki chcemy posłuchać, deklarując np. iż ma to być muzyka rockowa z końca zeszłego wieku. Po skomponowaniu muzyki do akcji wkracza model EnCodec. Korzysta on usług sieci neuronowej, która które kompresuje zapis audio.