本公開涉及多媒體,尤其涉及一種多媒體文件的播放方法、裝置和電子設(shè)備。
背景技術(shù):
1、目前,用戶在車載終端播放多媒體文件時(shí),可以采用兩種播放方式,一種是伴奏模式,另一種是原唱模式;其中,伴奏模式是僅播放多媒體文件的伴奏音樂的模式,而原唱模式則同時(shí)播放多媒體文件的人聲和伴奏音樂的模式。
2、車載終端在播放多媒體文件時(shí),如果用戶需要進(jìn)行伴奏模式和原唱模式的模式切換時(shí),通常是通過手動(dòng)操作實(shí)現(xiàn)的,即通過點(diǎn)擊車載終端上的切換控件來進(jìn)行切換伴奏模式和原唱模式的切換,操作繁瑣。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本公開提供了一種多媒體文件的播放方法、裝置和電子設(shè)備。
2、為達(dá)到上述目的,本公開采用如下技術(shù)方案:
3、第一方面,本公開提供了一種多媒體文件的播放方法,包括:在播放多媒體文件的情況下,獲取艙內(nèi)的艙內(nèi)語音數(shù)據(jù);其中,多媒體文件包括實(shí)際配音數(shù)據(jù)和實(shí)際背景聲數(shù)據(jù);對(duì)實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)進(jìn)行相似度計(jì)算,得到艙內(nèi)語音數(shù)據(jù)和實(shí)際配音數(shù)據(jù)的相似度;在相似度大于或等于相似度閾值的情況下,獲取多媒體文件的伴唱參數(shù);其中,伴唱參數(shù)包括實(shí)際配音數(shù)據(jù)的音量值,和實(shí)際背景聲數(shù)據(jù)的音量值;按照伴唱參數(shù)播放多媒體文件。
4、在一些可實(shí)施的示例中,對(duì)實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)進(jìn)行相似度計(jì)算,得到艙內(nèi)語音數(shù)據(jù)和實(shí)際配音數(shù)據(jù)的相似度,包括:對(duì)艙內(nèi)語音數(shù)據(jù)進(jìn)行語音轉(zhuǎn)文本操作,得到艙內(nèi)語音數(shù)據(jù)對(duì)應(yīng)的艙內(nèi)文本數(shù)據(jù);在艙內(nèi)文本數(shù)據(jù)包含字符的情況下,分別提取實(shí)際配音數(shù)據(jù)和艙內(nèi)文本數(shù)據(jù)對(duì)應(yīng)的實(shí)際文本數(shù)據(jù)的文本特征,得到艙內(nèi)文本數(shù)據(jù)對(duì)應(yīng)的第一文本特征向量和實(shí)際文本數(shù)據(jù)對(duì)應(yīng)的第二文本特征向量;計(jì)算第一文本特征向量和第二文本特征向量之間的第一關(guān)系,并將第一關(guān)系作為實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)的相似度;其中,第一關(guān)系包括余弦相似度和預(yù)設(shè)距離中的任一項(xiàng),預(yù)設(shè)距離包括歐式距離、曼哈頓距離中的任一項(xiàng)。
5、在一些可實(shí)施的示例中,本公開實(shí)施例提供的多媒體文件的播放方法還包括:在艙內(nèi)文本數(shù)據(jù)不包含字符的情況下,分別提取實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)的音頻特征,得到艙內(nèi)語音數(shù)據(jù)對(duì)應(yīng)的第一音頻特征向量和實(shí)際配音數(shù)據(jù)對(duì)應(yīng)的第二音頻特征向量;計(jì)算第一音頻特征向量和第二音頻特征向量之間的第二關(guān)系,并將第二關(guān)系作為實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)的相似度;其中,第二關(guān)系包括余弦相似度和預(yù)設(shè)距離中的任一項(xiàng),預(yù)設(shè)距離包括歐式距離、曼哈頓距離中的任一項(xiàng)。
6、在一些可實(shí)施的示例中,在播放多媒體文件的情況下,獲取艙內(nèi)的艙內(nèi)語音數(shù)據(jù)包括:在播放多媒體文件的情況下,對(duì)多媒體文件進(jìn)行聲源分離,得到多媒體文件對(duì)應(yīng)的實(shí)際配音數(shù)據(jù)和實(shí)際背景聲數(shù)據(jù)。
7、在一些可實(shí)施的示例中,在相似度大于或等于相似度閾值的情況下,獲取多媒體文件的伴唱參數(shù),包括:在相似度大于或等于相似度閾值的情況下,獲取多媒體文件的文件類型;基于文件類型查詢預(yù)設(shè)關(guān)系表,得到文件類型對(duì)應(yīng)的伴唱參數(shù);其中,不同的文件類型對(duì)應(yīng)的伴唱參數(shù)不同。
8、在一些可實(shí)施的示例中,按照伴唱參數(shù)播放多媒體文件后,本公開實(shí)施例提供的多媒體文件的播放方法還包括:在相似度小于相似度閾值的情況下,按照預(yù)設(shè)參數(shù)播放多媒體文件;其中,預(yù)設(shè)參數(shù)為播放多媒體文件時(shí)設(shè)置的播放參數(shù)。
9、在一些可實(shí)施的示例中,艙內(nèi)包含至少一個(gè)功能區(qū)域,一個(gè)功能區(qū)域包含至少一個(gè)音頻播放裝置和至少一個(gè)燈光裝置,伴唱參數(shù)還包括燈光參數(shù);按照伴唱參數(shù)播放多媒體文件,包括:對(duì)艙內(nèi)語音數(shù)據(jù)進(jìn)行位置分析,得到發(fā)出艙內(nèi)語音數(shù)據(jù)的功能區(qū)域;在功能區(qū)域內(nèi)按照伴唱參數(shù)播放多媒體文件。
10、第二方面,本公開提供了一種多媒體文件的播放裝置,包括:處理單元,用于在播放多媒體文件的情況下,控制獲取單元獲取艙內(nèi)的艙內(nèi)語音數(shù)據(jù);其中,多媒體文件包括實(shí)際配音數(shù)據(jù)和實(shí)際背景聲數(shù)據(jù);處理單元,還用于對(duì)實(shí)際配音數(shù)據(jù)和獲取單元獲取的艙內(nèi)語音數(shù)據(jù)進(jìn)行相似度計(jì)算,得到艙內(nèi)語音數(shù)據(jù)和實(shí)際配音數(shù)據(jù)的相似度;處理單元,還用于在相似度大于或等于相似度閾值的情況下,控制獲取單元獲取多媒體文件的伴唱參數(shù);其中,伴唱參數(shù)包括實(shí)際配音數(shù)據(jù)的音量值,和實(shí)際背景聲數(shù)據(jù)的音量值;處理單元,還用于按照獲取單元獲取的伴唱參數(shù)播放多媒體文件。
11、在一些可實(shí)施的示例中,處理單元,具體用于對(duì)獲取單元獲取的艙內(nèi)語音數(shù)據(jù)進(jìn)行語音轉(zhuǎn)文本操作,得到艙內(nèi)語音數(shù)據(jù)對(duì)應(yīng)的艙內(nèi)文本數(shù)據(jù);處理單元,具體用于在艙內(nèi)文本數(shù)據(jù)包含字符的情況下,分別提取實(shí)際配音數(shù)據(jù)和獲取單元獲取的艙內(nèi)文本數(shù)據(jù)對(duì)應(yīng)的實(shí)際文本數(shù)據(jù)的文本特征,得到艙內(nèi)文本數(shù)據(jù)對(duì)應(yīng)的第一文本特征向量和實(shí)際文本數(shù)據(jù)對(duì)應(yīng)的第二文本特征向量;處理單元,具體用于計(jì)算第一文本特征向量和第二文本特征向量之間的第一關(guān)系,并將第一關(guān)系作為實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)的相似度;其中,第一關(guān)系包括余弦相似度和預(yù)設(shè)距離中的任一項(xiàng),預(yù)設(shè)距離包括歐式距離、曼哈頓距離中的任一項(xiàng)。
12、在一些可實(shí)施的示例中,處理單元,還用于在艙內(nèi)文本數(shù)據(jù)不包含字符的情況下,分別提取實(shí)際配音數(shù)據(jù)和獲取單元獲取的艙內(nèi)語音數(shù)據(jù)的音頻特征,得到艙內(nèi)語音數(shù)據(jù)對(duì)應(yīng)的第一音頻特征向量和實(shí)際配音數(shù)據(jù)對(duì)應(yīng)的第二音頻特征向量;處理單元,還用于計(jì)算第一音頻特征向量和第二音頻特征向量之間的第二關(guān)系,并將第二關(guān)系作為實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)的相似度;其中,第二關(guān)系包括余弦相似度和預(yù)設(shè)距離中的任一項(xiàng),預(yù)設(shè)距離包括歐式距離、曼哈頓距離中的任一項(xiàng)。
13、在一些可實(shí)施的示例中,處理單元,具體用于在播放多媒體文件的情況下,對(duì)多媒體文件進(jìn)行聲源分離,得到多媒體文件對(duì)應(yīng)的實(shí)際配音數(shù)據(jù)和實(shí)際背景聲數(shù)據(jù)。
14、在一些可實(shí)施的示例中,處理單元,具體用于在相似度大于或等于相似度閾值的情況下,控制獲取單元獲取多媒體文件的文件類型;處理單元,具體用于基于獲取單元獲取的文件類型查詢預(yù)設(shè)關(guān)系表,得到文件類型對(duì)應(yīng)的伴唱參數(shù);其中,不同的文件類型對(duì)應(yīng)的伴唱參數(shù)不同。
15、在一些可實(shí)施的示例中,處理單元,還用于在相似度小于相似度閾值的情況下,按照預(yù)設(shè)參數(shù)播放多媒體文件;其中,預(yù)設(shè)參數(shù)為播放多媒體文件時(shí)設(shè)置的播放參數(shù)。
16、在一些可實(shí)施的示例中,艙內(nèi)包含至少一個(gè)功能區(qū)域,一個(gè)功能區(qū)域包含至少一個(gè)音頻播放裝置和至少一個(gè)燈光裝置,伴唱參數(shù)還包括燈光參數(shù);處理單元,具體用于對(duì)獲取單元獲取的艙內(nèi)語音數(shù)據(jù)進(jìn)行位置分析,得到發(fā)出艙內(nèi)語音數(shù)據(jù)的功能區(qū)域;處理單元,具體用于在功能區(qū)域內(nèi)按照伴唱參數(shù)播放多媒體文件。
17、第三方面,本公開提供一種電子設(shè)備,包括:存儲(chǔ)器和處理器,存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序;處理器用于在執(zhí)行計(jì)算機(jī)程序時(shí),使得電子設(shè)備實(shí)現(xiàn)如上述第一方面提供的多媒體文件的播放方法。
18、第四方面,本公開提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括:計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)計(jì)算機(jī)程序被計(jì)算設(shè)備執(zhí)行時(shí),使得計(jì)算設(shè)備實(shí)現(xiàn)如上述第一方面提供的多媒體文件的播放方法。
19、第五方面,本公開提供一種車輛,包括如第二方面提供的任一項(xiàng)多媒體文件的播放裝置。
20、在本公開中,上述多媒體文件的播放裝置的名字對(duì)設(shè)備或功能模塊本身不構(gòu)成限定,在實(shí)際實(shí)現(xiàn)中,這些設(shè)備或功能模塊可以以其他名稱出現(xiàn)。只要各個(gè)設(shè)備或功能模塊的功能和本公開類似,屬于本公開權(quán)利要求及其等同技術(shù)的范圍之內(nèi)。
21、本公開的這些方面或其他方面在以下的描述中會(huì)更加簡明易懂。
22、本公開提供的技術(shù)方案與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):
23、將本公開提供的多媒體文件的播放方法應(yīng)用于汽車時(shí),汽車在播放多媒體文件的情況下,獲取艙內(nèi)的艙內(nèi)語音數(shù)據(jù)。之后,汽車通過對(duì)實(shí)際配音數(shù)據(jù)和艙內(nèi)語音數(shù)據(jù)進(jìn)行相似度計(jì)算,得到艙內(nèi)語音數(shù)據(jù)和實(shí)際配音數(shù)據(jù)的相似度;在相似度大于或等于相似度閾值的情況下,獲取多媒體文件的伴唱參數(shù);按照伴唱參數(shù)播放多媒體文件。這樣,無需用戶手動(dòng)地點(diǎn)擊車載終端上的切換控件來進(jìn)行切換伴奏模式和原唱模式的切換,而是可以根據(jù)用戶在汽車的艙內(nèi)發(fā)出的艙內(nèi)語音數(shù)據(jù),判別是否采用伴唱參數(shù)播放該多媒體文件,簡化了用戶的操作,解決了現(xiàn)有技術(shù)中車載終端在播放多媒體文件時(shí),如果用戶需要進(jìn)行伴奏模式和原唱模式的模式切換時(shí),通常是通過手動(dòng)操作實(shí)現(xiàn)的,即通過點(diǎn)擊車載終端上的切換控件來進(jìn)行切換伴奏模式和原唱模式的切換,操作繁瑣的問題。