To nowe narzędzie AI zamienia tekst na muzykę

Firma Meta zaprezentowała w tym tygodniu nowe narzędzie AI potrafiące zamieniać zaprezentowany mu tekst na utwór muzyczny. Rozwiązanie nosi nazwę AudioCraft i będzie na rynku konkurować przede wszystkim z podobną aplikacją opracowaną swego czasu przez Google.

Grafika: StuartMiles/freerangestock

Tym samym sztuczna inteligencja krok po kroku wkracza również do szeroko pojętego przemysłu rozrywkowego, tworząc np. utwory muzyczne i utwory śpiewane przez wirtualnych twórców, którzy w perfekcyjny sposób imitują głosy znanych artystów, co wzbudza w świecie show biznesu coraz większe kontrowersje. Niektórzy nawet uważają, że bliska jest chwila w której tacy wirtualni twórcy zaczną startować w konkursach piosenki i zdobywać nagrody.

Zaprezentowane przez Metę rozwiązanie zawiera trzy generatywne modele sztucznej inteligencji Meta: MusicGen, AudioGen i EnCodec. Dwa pierwsze (MusicGen, jak i AudioGen) zajmują się generowanie zasobu audio, przy czym MusicGen zajmuje się muzyką, a AudioGen generuje towarzysze muzyce efekty dźwiękowe. Może to być pianie np. pianie koguta, odgłosy wodospadu czy skrzypienie otwieranych drzwi. Trzeci model koduje muzykę.

Zobacz również:

Wersja demonstracyjna rozwiązanie znajduje się na tej witrynie. Można na niej określić, jaki rodzaj muzyki chcemy posłuchać, deklarując np. iż ma to być muzyka rockowa z końca zeszłego wieku. Po skomponowaniu muzyki do akcji wkracza model EnCodec. Korzysta on usług sieci neuronowej, która które kompresuje zapis audio.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200