模型訓(xùn)練方法、視頻配樂方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號：40282432發(fā)布日期：2024-12-11 13:23閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)>模型訓(xùn)練方法、視頻配樂方法、裝置、設(shè)備及介質(zhì)與流程

技術(shù)特征：

1.一種模型訓(xùn)練方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的模型訓(xùn)練方法，其特征在于，所述樣本多模態(tài)數(shù)據(jù)包括樣本文本類數(shù)據(jù)、樣本語音類數(shù)據(jù)和樣本視頻類數(shù)據(jù)，所述樣本文本類數(shù)據(jù)用于表征樣本音視頻的主題信息，所述樣本語音類數(shù)據(jù)用于表征樣本音視頻的氛圍信息，所述樣本視頻類數(shù)據(jù)用于表征樣本音視頻的環(huán)境信息。

3.根據(jù)權(quán)利要求1所述的模型訓(xùn)練方法，其特征在于，從所述影視音視頻數(shù)據(jù)中提取出樣本音視頻片段，包括：

4.根據(jù)權(quán)利要求3所述的模型訓(xùn)練方法，其特征在于，從所述樣本音視頻片段中提取樣本多模態(tài)數(shù)據(jù)和樣本背景音樂數(shù)據(jù)，包括：

5.根據(jù)權(quán)利要求3所述的模型訓(xùn)練方法，其特征在于，基于所述存在背景音樂的片段的時間點信息，從所述影視音視頻數(shù)據(jù)中提取出樣本音視頻片段，包括：

6.一種視頻配樂方法，其特征在于，所述方法包括：

7.根據(jù)權(quán)利要求6所述的視頻配樂方法，其特征在于，在將所述多模態(tài)數(shù)據(jù)和候選背景音樂庫輸入預(yù)先訓(xùn)練的背景音樂匹配模型之前，所述方法還包括：

8.一種模型訓(xùn)練裝置，其特征在于，所述裝置包括：

9.一種視頻配樂裝置，所述裝置包括：

10.一種電子設(shè)備，其特征在于，包括處理器、通信接口、存儲器和通信總線，其中，處理器，通信接口，存儲器通過通信總線完成相互間的通信；

11.一種計算機(jī)可讀存儲介質(zhì)，所述計算機(jī)可讀存儲介質(zhì)中存儲有指令，當(dāng)其在計算機(jī)上運(yùn)行時，使得計算機(jī)執(zhí)行權(quán)利要求1-5任一項所述的模型訓(xùn)練方法或者權(quán)利要求6或7所述的視頻配樂方法。

技術(shù)總結(jié)
本發(fā)明實施例提供了一種模型訓(xùn)練方法、視頻配樂方法、裝置、設(shè)備及介質(zhì)，涉及視頻處理技術(shù)領(lǐng)域，本發(fā)明提供的模型訓(xùn)練方法中，基于影視音視頻數(shù)據(jù)構(gòu)建訓(xùn)練樣本，影視音視頻中的背景音樂是專業(yè)人員根據(jù)視頻內(nèi)容需要進(jìn)行匹配的，其背景音樂和對應(yīng)的視頻內(nèi)容具有較高的匹配度。本發(fā)明中，從影視音視頻中提取出樣本音視頻片段，再從樣本音視頻片段中提取樣本多模態(tài)數(shù)據(jù)和樣本背景音樂數(shù)據(jù)，因此，該樣本多模態(tài)數(shù)據(jù)和樣本背景音樂數(shù)據(jù)也是相匹配的。本發(fā)明中，再基于該樣本多模態(tài)數(shù)據(jù)和樣本背景音樂數(shù)據(jù)對多模態(tài)模型進(jìn)行訓(xùn)練，得到背景音樂匹配模型，因此，該背景音樂匹配模型也可以基于目標(biāo)視頻的主題信息、氛圍信息、環(huán)境信息匹配出合適的背景音樂。

技術(shù)研發(fā)人員：周晨
受保護(hù)的技術(shù)使用者：北京奇藝世紀(jì)科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/10

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

訓(xùn)練模型相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

模型訓(xùn)練方法、視頻配樂方法、裝置、設(shè)備及介質(zhì)與流程

模型訓(xùn)練方法、視頻配樂方法、裝置、設(shè)備及介質(zhì)與流程