1.一種模型訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的模型訓(xùn)練方法,其特征在于,所述樣本多模態(tài)數(shù)據(jù)包括樣本文本類數(shù)據(jù)、樣本語音類數(shù)據(jù)和樣本視頻類數(shù)據(jù),所述樣本文本類數(shù)據(jù)用于表征樣本音視頻的主題信息,所述樣本語音類數(shù)據(jù)用于表征樣本音視頻的氛圍信息,所述樣本視頻類數(shù)據(jù)用于表征樣本音視頻的環(huán)境信息。
3.根據(jù)權(quán)利要求1所述的模型訓(xùn)練方法,其特征在于,從所述影視音視頻數(shù)據(jù)中提取出樣本音視頻片段,包括:
4.根據(jù)權(quán)利要求3所述的模型訓(xùn)練方法,其特征在于,從所述樣本音視頻片段中提取樣本多模態(tài)數(shù)據(jù)和樣本背景音樂數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求3所述的模型訓(xùn)練方法,其特征在于,基于所述存在背景音樂的片段的時間點信息,從所述影視音視頻數(shù)據(jù)中提取出樣本音視頻片段,包括:
6.一種視頻配樂方法,其特征在于,所述方法包括:
7.根據(jù)權(quán)利要求6所述的視頻配樂方法,其特征在于,在將所述多模態(tài)數(shù)據(jù)和候選背景音樂庫輸入預(yù)先訓(xùn)練的背景音樂匹配模型之前,所述方法還包括:
8.一種模型訓(xùn)練裝置,其特征在于,所述裝置包括:
9.一種視頻配樂裝置,所述裝置包括:
10.一種電子設(shè)備,其特征在于,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
11.一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)中存儲有指令,當(dāng)其在計算機(jī)上運(yùn)行時,使得計算機(jī)執(zhí)行權(quán)利要求1-5任一項所述的模型訓(xùn)練方法或者權(quán)利要求6或7所述的視頻配樂方法。