To nowe narzędzie AI zamienia tekst na muzykę

Firma Meta zaprezentowała w tym tygodniu nowe narzędzie AI potrafiące zamieniać zaprezentowany mu tekst na utwór muzyczny. Rozwiązanie nosi nazwę AudioCraft i będzie na rynku konkurować przede wszystkim z podobną aplikacją opracowaną swego czasu przez Google.

Grafika: StuartMiles/freerangestock

Tym samym sztuczna inteligencja krok po kroku wkracza również do szeroko pojętego przemysłu rozrywkowego, tworząc np. utwory muzyczne i utwory śpiewane przez wirtualnych twórców, którzy w perfekcyjny sposób imitują głosy znanych artystów, co wzbudza w świecie show biznesu coraz większe kontrowersje. Niektórzy nawet uważają, że bliska jest chwila w której tacy wirtualni twórcy zaczną startować w konkursach piosenki i zdobywać nagrody.

Zaprezentowane przez Metę rozwiązanie zawiera trzy generatywne modele sztucznej inteligencji Meta: MusicGen, AudioGen i EnCodec. Dwa pierwsze (MusicGen, jak i AudioGen) zajmują się generowanie zasobu audio, przy czym MusicGen zajmuje się muzyką, a AudioGen generuje towarzysze muzyce efekty dźwiękowe. Może to być pianie np. pianie koguta, odgłosy wodospadu czy skrzypienie otwieranych drzwi. Trzeci model koduje muzykę.

Zobacz również:

  • System MS-DOS wrócił po latach w postaci open source
  • Sztuczna inteligencja wkroczyła do aplikacji Speaking Practice
  • Rzecznik Mety skazany przez rosyjski sąd na sześć lat więzienia

Wersja demonstracyjna rozwiązanie znajduje się na tej witrynie. Można na niej określić, jaki rodzaj muzyki chcemy posłuchać, deklarując np. iż ma to być muzyka rockowa z końca zeszłego wieku. Po skomponowaniu muzyki do akcji wkracza model EnCodec. Korzysta on usług sieci neuronowej, która które kompresuje zapis audio.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200