技術(shù)編號(hào):39346279
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒(méi)有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明屬于人工智能音樂(lè)生成,具體涉及一種基于用戶通俗口語(yǔ)表達(dá)的端到端歌曲生成方法和系統(tǒng)。背景技術(shù)、文本到歌曲生成旨在根據(jù)描述性文本創(chuàng)建歌曲。先前研究通常側(cè)重于歌曲創(chuàng)作的特定方面,例如文本到音樂(lè)、歌詞到旋律和樂(lè)譜到歌曲,但并未涵蓋整個(gè)歌曲創(chuàng)作過(guò)程。在文本到音樂(lè)生成方面,諸如musiclm和musicgen等模型利用基于采用單階段transformer語(yǔ)言模型通過(guò)基于量化的音頻編解碼器,進(jìn)行文本到音樂(lè)的生成,并采用高效的碼本交織模式,并采用大語(yǔ)言模型和擴(kuò)散模型來(lái)生成高質(zhì)量的音頻。對(duì)于歌詞到旋律生成...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。