即時(shí)視頻的媒體特效發(fā)送方法和裝置的制造方法
【專(zhuān)利摘要】本發(fā)明提供了一種即時(shí)視頻中媒體特效的發(fā)送方法,包括:檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音;識(shí)別所述輸入語(yǔ)音,獲得音頻特征參數(shù);根據(jù)所述音頻特征參數(shù)索引到與所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效;發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻。此外,還提供了一種與該方法匹配的即時(shí)視頻中媒體特效的發(fā)送裝置。上述即時(shí)視頻中媒體特效的發(fā)送方法和裝置能夠提高媒體特效的發(fā)送效率。
【專(zhuān)利說(shuō)明】
即時(shí)視頻的媒體特效發(fā)送方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及視頻應(yīng)用技術(shù)領(lǐng)域,特別涉及一種即時(shí)視頻中媒體特效的發(fā)送方法和
目.0
【背景技術(shù)】
[0002]近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,包括在線(xiàn)娛樂(lè)與游戲直播在內(nèi)的眾多真人秀互聯(lián)網(wǎng)應(yīng)用得到了空前的發(fā)展。用戶(hù)可以通過(guò)上述真人秀互聯(lián)網(wǎng)應(yīng)用發(fā)布實(shí)時(shí)視頻,進(jìn)行真人秀表演,展示自身在唱歌、跳舞、解說(shuō)等方面的才能。
[0003]現(xiàn)有的即時(shí)視頻發(fā)布中,為實(shí)現(xiàn)較佳的互動(dòng)性能,進(jìn)行即時(shí)視頻發(fā)布的用戶(hù)在發(fā)送即時(shí)視頻的同時(shí),還將進(jìn)行特效的發(fā)送,以在發(fā)布的即時(shí)視頻中加載發(fā)送的特效。
[0004]對(duì)于進(jìn)行即時(shí)視頻發(fā)布的用戶(hù)而言,需要進(jìn)行特效的選取,并對(duì)選取的特效觸發(fā)發(fā)送之后,方可實(shí)現(xiàn)即時(shí)視頻中特效的加載。
[0005]例如,用戶(hù)打開(kāi)特效窗口,點(diǎn)擊一款特效并發(fā)送,便使得最終獲得的即時(shí)視頻能夠加載所點(diǎn)擊的特效。
[0006]然而,上述即時(shí)視頻中特效發(fā)送的實(shí)現(xiàn)隨著可供選取使用的特效越來(lái)越多,無(wú)論是在智能手機(jī)等移動(dòng)設(shè)備中,還是在筆記本電腦等終端設(shè)備中,查找所需要的特效均存在著非常大的成本,由此使得即時(shí)視頻中特效發(fā)送的最大成本在于查找特效。
[0007]較大的特效查找成本往往會(huì)使得即時(shí)視頻發(fā)布中不能夠快速實(shí)現(xiàn)特效的加載,進(jìn)而使得特效的發(fā)送效率非常低。
【發(fā)明內(nèi)容】
[0008]基于此,有必要提供一種即時(shí)視頻的媒體特效發(fā)送方法,所述方法能夠提高即時(shí)視頻發(fā)布中媒體特效的發(fā)送效率。
[0009]另外,還有必要提供一種即時(shí)視頻的媒體特效發(fā)送裝置,所述裝置能夠提高即時(shí)視頻發(fā)布中媒體特效的發(fā)送效率。
[0010]
【發(fā)明內(nèi)容】
如下:
第一方面,提供了一種即時(shí)視頻中媒體特效的發(fā)送方法,包括:
檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音;
識(shí)別所述輸入語(yǔ)音,獲得音頻特征參數(shù);
根據(jù)所述音頻特征參數(shù)索引到與所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效;
發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻。
[0011]結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音的步驟包括:
所述即時(shí)視頻的采集中觸發(fā)進(jìn)行的媒體特效加載;
響應(yīng)于所述媒體特效的加載,檢測(cè)即時(shí)視頻的輸入操作,通過(guò)檢測(cè)得到的所述輸入操作獲得標(biāo)示媒體特效發(fā)送命令的輸入語(yǔ)音。
[0012]結(jié)合第一方面,在第二種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述音頻特征參數(shù)索引到所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效的步驟包括:
在與樣本音頻特征參數(shù)關(guān)聯(lián)存儲(chǔ)的媒體特效中,進(jìn)行所述音頻特征參數(shù)和樣本音頻特征參數(shù)之間的比對(duì),得到與所述音頻特征參數(shù)匹配的樣本音頻特征參數(shù);
根據(jù)匹配的所述樣本音頻特征參數(shù)得到所述音頻特征參數(shù)索引的媒體特效。
[0013]結(jié)合第一方面,在第三種可能的實(shí)現(xiàn)方式中,所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效為多個(gè),所述發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻的步驟之前,所述方法還包括:
獲取所述輸入語(yǔ)音對(duì)應(yīng)的音量信息;
在所述音頻特征參數(shù)對(duì)應(yīng)的多個(gè)媒體特效中提取所述音量信息對(duì)應(yīng)的媒體特效。
[0014]結(jié)合第一方面第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述方法還包括:
在所述輸入操作的檢測(cè)中,根據(jù)所述音量信息進(jìn)行輸入音量的實(shí)時(shí)顯示。
[0015]第二方面,提供了一種即時(shí)視頻中媒體特效的發(fā)送裝置,包括:
檢測(cè)模塊,用于檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音;
識(shí)別模塊,用于識(shí)別所述輸入語(yǔ)音,獲得音頻特征參數(shù);
確定模塊,根據(jù)所述音頻特征參數(shù),確定與所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效;
發(fā)送模塊,用于發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻。
[0016]結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述檢測(cè)模塊包括:
加載觸發(fā)單元,用于觸發(fā)媒體特效的加載;
輸入檢測(cè)單元,用于響應(yīng)媒體特效的加載,檢測(cè)即時(shí)視頻的輸入操作,獲取輸入語(yǔ)音。
[0017]結(jié)合第二方面,在第二種可能的實(shí)現(xiàn)方式中,所述確定模塊包括:
對(duì)比單元,用于對(duì)比所述音頻特征參數(shù)和樣本音頻特征參數(shù),得到與所述音頻特征參數(shù)匹配的樣本音頻特征參數(shù);
定位單元,用于確定與所述樣本音頻特征參數(shù)對(duì)應(yīng)的媒體特效。
[0018]結(jié)合第二方面,在第三種可能的實(shí)現(xiàn)方式中,還包括音量處理單元,所述音量處理單元包括:
音量識(shí)別單元,用于獲取所述輸入語(yǔ)音對(duì)應(yīng)的音量信息;
音量定位單元,用于在所述音頻特征參數(shù)對(duì)應(yīng)的多個(gè)媒體特效中提取所述音量信息對(duì)應(yīng)的媒體特效。
[0019]結(jié)合第二方面第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述音量識(shí)別單元包括:
音量獲取子單元,用于獲取的所述輸入語(yǔ)音的音量信息;
音量顯示子單元,用于在所述輸入操作的檢測(cè)中,根據(jù)所述音量信息進(jìn)行輸入音量的實(shí)時(shí)顯不O
[0020]為解決上述技術(shù)問(wèn)題,將采用如下技術(shù)方案:
在對(duì)當(dāng)前的即時(shí)視頻進(jìn)行媒體特效加載中,檢測(cè)即時(shí)視頻發(fā)布中觸發(fā)的輸入操作,由輸入操作獲得輸入語(yǔ)音,輸入語(yǔ)音將作為語(yǔ)音發(fā)送命令而用于觸發(fā)進(jìn)行媒體特效的選取和發(fā)送,具體的,識(shí)別輸入語(yǔ)音獲得音頻特征參數(shù),根據(jù)音頻特征參數(shù)索引到對(duì)應(yīng)的媒體特效,將對(duì)應(yīng)的媒體特效發(fā)送出去,進(jìn)而使得發(fā)送的媒體特效能夠加載至發(fā)布的即時(shí)視頻中,使用戶(hù)不用查找所需要發(fā)送的媒體特效就能快速實(shí)現(xiàn)媒體特效的加載,大大提高了即時(shí)視頻中媒體特效的發(fā)送效率,也節(jié)省了媒體特效的發(fā)送成本。
【附圖說(shuō)明】
[0021]圖1是一個(gè)實(shí)施例中即時(shí)視頻中媒體特效發(fā)送方法的流程圖;
圖2是圖1中檢測(cè)即時(shí)視頻的輸入操作,由輸入操作獲得輸入語(yǔ)音的方法流程圖;
圖3是一個(gè)實(shí)施例中根據(jù)輸入語(yǔ)音的音頻特征參數(shù)索引到對(duì)應(yīng)的媒體特效的方法流程圖;
圖4是另一個(gè)實(shí)施例的即時(shí)視頻中媒體特效發(fā)送方法的流程圖;
圖5是一個(gè)實(shí)施例中即時(shí)視頻的媒體特效發(fā)送裝置的結(jié)構(gòu)示意圖;
圖6是圖5中檢測(cè)模塊的結(jié)構(gòu)示意圖;
圖7是一個(gè)實(shí)施例中即時(shí)視頻的媒體特效發(fā)送裝置中確定模塊的結(jié)構(gòu)示意圖;
圖8是一個(gè)實(shí)施例中針對(duì)樣本音頻特征參數(shù)對(duì)應(yīng)的媒體特效為多個(gè)時(shí)音量處理模塊的結(jié)構(gòu)示意圖;
圖9是圖8中音量識(shí)別單元的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0022]體現(xiàn)本發(fā)明特征與優(yōu)點(diǎn)的典型實(shí)施方式將在以下的說(shuō)明中詳細(xì)敘述。應(yīng)理解的是本發(fā)明能夠在不同的實(shí)施方式上具有各種的變化,其皆不脫離本發(fā)明的范圍,且其中的說(shuō)明及圖示在本質(zhì)上是當(dāng)作說(shuō)明之用,而非用以限制本發(fā)明。
[0023]基于此,為提高即時(shí)視頻中媒體特效的發(fā)送效率,特提出一種即時(shí)視頻中媒體特效的發(fā)送方法,該即時(shí)視頻中媒體特效的發(fā)送方法由計(jì)算機(jī)程序?qū)崿F(xiàn),與之相對(duì)應(yīng)的,所構(gòu)建的即時(shí)視頻中媒體特效的發(fā)送裝置則被存儲(chǔ)于帶有屏幕的終端設(shè)備中,以在該終端設(shè)備中運(yùn)行,進(jìn)而實(shí)現(xiàn)即時(shí)視頻中媒體特效的發(fā)送。
[0024]在一個(gè)實(shí)施例中,具體的,該即時(shí)視頻的媒體特效發(fā)送方法如圖1所示,包括:
步驟SI 10,檢測(cè)即時(shí)視頻的輸入操作,由輸入操作獲得輸入語(yǔ)音。
[0025]即時(shí)視頻是基于互聯(lián)網(wǎng)應(yīng)用的實(shí)時(shí)視頻,通過(guò)即時(shí)視頻,可以和其他用戶(hù)進(jìn)行實(shí)時(shí)互動(dòng)和交流。用戶(hù)側(cè)在進(jìn)行即時(shí)視頻發(fā)布的過(guò)程中,還將觸發(fā)輸入操作。其中,輸入操作用于在即時(shí)視頻發(fā)布的過(guò)程中觸發(fā)進(jìn)行相應(yīng)媒體特效的獲取和發(fā)送,其實(shí)質(zhì)為發(fā)起媒體特效獲取和發(fā)送的語(yǔ)音輸入操作。
[0026]在用戶(hù)層面,其可通過(guò)界面中預(yù)置的按鈕觸發(fā)輸入操作,并輸入相關(guān)的語(yǔ)音,進(jìn)而使得終端設(shè)備在檢測(cè)得到輸入操作后獲得輸入語(yǔ)音。
[0027]例如,在即時(shí)視頻中,用戶(hù)輸入“好郁悶”的語(yǔ)音,對(duì)于終端設(shè)備而言可以獲得“好郁悶”的輸入語(yǔ)音。
[0028]步驟SI20,識(shí)別輸入語(yǔ)音,獲得音頻特征參數(shù)。
[0029]輸入語(yǔ)音作為語(yǔ)音發(fā)送命令,在獲得輸入語(yǔ)音后,對(duì)輸入語(yǔ)音進(jìn)行語(yǔ)音識(shí)別,獲取音頻特征參數(shù)。
[0030]音頻特征參數(shù)是表示聲波的各種參數(shù),不同語(yǔ)音的音頻特征參數(shù)是不一樣的。例如,說(shuō)話(huà)時(shí),“郁悶”和“開(kāi)心”這兩個(gè)詞語(yǔ)的音頻特征參數(shù)是不一樣的。
[0031 ]步驟S130,根據(jù)音頻特征參數(shù)索引到與該音頻特征參數(shù)對(duì)應(yīng)的媒體特效。
[0032]媒體特效是用于為即時(shí)視頻增添特殊效果,其效果將體現(xiàn)于視覺(jué)和聽(tīng)覺(jué)上,因此,媒體特效包括視頻特效和/或音頻特效。
[0033]媒體特效是以樣本音頻特征參數(shù)為索引進(jìn)行存儲(chǔ)的,也就是說(shuō),每一個(gè)媒體特效預(yù)先都有唯一的樣本音頻特征參數(shù)與其對(duì)應(yīng)。如果輸入語(yǔ)音所獲得的音頻特征參數(shù)與某一樣本音頻特征參數(shù)相匹配,就能夠通過(guò)該樣本音頻特征參數(shù)索引到對(duì)應(yīng)的媒體特效。
[0034]步驟S140,發(fā)送媒體特效,通過(guò)進(jìn)行媒體特效的發(fā)送將該媒體特效加載至發(fā)布的即時(shí)視頻。
[0035]根據(jù)輸入語(yǔ)音的音頻特征參數(shù)索引到媒體特效后,用戶(hù)側(cè)發(fā)送媒體特效,服務(wù)器將媒體特效隨即時(shí)視頻一起發(fā)送給其他用戶(hù),從而媒體特效被加載在發(fā)布的即時(shí)視頻中。例如,根據(jù)輸入語(yǔ)音的音頻特征參數(shù)索引到媒體特效“烏鴉從屏幕左側(cè)飛到屏幕右側(cè)并在右側(cè)消失”(后續(xù)簡(jiǎn)稱(chēng)“烏鴉飛”)后,客戶(hù)端發(fā)送“烏鴉飛”這一特效,服務(wù)器將“烏鴉飛”特效隨即時(shí)視頻一起發(fā)送至與該客戶(hù)端正進(jìn)行互動(dòng)的其他的客戶(hù)端,從而將“烏鴉飛”特效加載到即時(shí)視頻中。
[0036]由此用戶(hù)無(wú)需在媒體特效庫(kù)中一個(gè)一個(gè)地查找媒體特效,只需通過(guò)輸入語(yǔ)音就能將想要發(fā)送的特效加載至即時(shí)視頻中,提高了即時(shí)視頻中媒體特效的發(fā)送效率。
[0037]進(jìn)一步的,如圖2所示,在一個(gè)實(shí)施例中,步驟SI10包括如下步驟:
步驟Slll,即時(shí)視頻的采集中觸發(fā)進(jìn)行的媒體特效加載。
[0038]如前所述的,進(jìn)行即時(shí)視頻的采集,以實(shí)現(xiàn)即時(shí)視頻發(fā)布的過(guò)程中,通過(guò)用戶(hù)側(cè)觸發(fā)進(jìn)行媒體特效的加載。具體的,用戶(hù)將在即時(shí)視頻的發(fā)布界面中觸發(fā)即時(shí)視頻的輸入操作,以此即可在即時(shí)視頻的采集中觸發(fā)進(jìn)行媒體特效加載。
[0039]其中,輸入操作可以是施加于即時(shí)視頻的發(fā)布界面的相關(guān)動(dòng)作,例如,用戶(hù)可以通過(guò)對(duì)相關(guān)標(biāo)簽的點(diǎn)擊來(lái)觸發(fā)媒體特效的加載。
[0040]步驟SI12,響應(yīng)于媒體特效的加載,檢測(cè)即時(shí)視頻的輸入操作,通過(guò)檢測(cè)得到的輸入操作獲得標(biāo)示媒體特效發(fā)送命令的輸入語(yǔ)音。
[0041]通過(guò)如上所述的過(guò)程,將在使得即時(shí)視頻的發(fā)布中,通過(guò)一鍵操作便能夠發(fā)起媒體特效的加載,由此自動(dòng)獲得所期望的媒體特效,并將其加載于發(fā)布的即時(shí)視頻中,極大地提高了即時(shí)視頻中實(shí)現(xiàn)媒體特效加載的簡(jiǎn)易性,并且對(duì)于智能手機(jī)等移動(dòng)便攜設(shè)備而言,極大地降低了輸入和查找成本,能夠?qū)崿F(xiàn)即時(shí)視頻中媒體特效的快速獲得和發(fā)送。
[0042]在一個(gè)實(shí)施例中,如圖3所示,步驟SI30包括:
步驟S131,在與樣本音頻特征參數(shù)關(guān)聯(lián)存儲(chǔ)的媒體特效中,對(duì)輸入語(yǔ)音的音頻特征參數(shù)和樣本音頻特征參數(shù)進(jìn)行對(duì)比,得到與輸入語(yǔ)音音頻特征參數(shù)匹配的樣本音頻特征參數(shù)。
[0043]樣本音頻特征參數(shù)時(shí)預(yù)先設(shè)置好的與某一個(gè)或幾個(gè)媒體特效相對(duì)應(yīng)的音頻特征參數(shù)。因此媒體特效是以樣本音頻特征參數(shù)為索引而進(jìn)行關(guān)聯(lián)存儲(chǔ)的,并且存儲(chǔ)了多個(gè)樣本音頻特征參數(shù)。通過(guò)將獲取的輸入語(yǔ)音的音頻特征參數(shù)與存儲(chǔ)的多個(gè)樣本音頻特征參數(shù)逐一比對(duì),得到與輸入語(yǔ)音音頻特征參數(shù)匹配的樣本音頻特征參數(shù)。
[0044]例如,存儲(chǔ)的樣本音頻特征參數(shù)中有對(duì)應(yīng)語(yǔ)音“開(kāi)心”的樣本音頻特征參數(shù)“A”,對(duì)應(yīng)語(yǔ)音“悲傷”的樣本音頻特征參數(shù)“B”,對(duì)應(yīng)語(yǔ)音“郁悶”的樣本音頻特征參數(shù)“C”……,當(dāng)輸入語(yǔ)音為“郁悶”時(shí)后,就會(huì)將其對(duì)應(yīng)的音頻特征參數(shù)與“A”、“B”、“C”……逐一進(jìn)行比對(duì),最后得到與之匹配的樣本音頻特征參數(shù)。
[0045]進(jìn)一步的,在一個(gè)實(shí)施例中,判斷輸入聲音的音頻特征參數(shù)與樣本語(yǔ)音的音頻特征參數(shù)是否匹配時(shí),采用的標(biāo)準(zhǔn)是利用傅里葉變換方法對(duì)音頻特征參數(shù)進(jìn)行處理,提取多種特征值,計(jì)算它們的相似度,判斷計(jì)算出的相似度數(shù)據(jù)是否落入預(yù)設(shè)的范圍。比如最小歐氏平均距離小于等于1.5則判斷相似,當(dāng)然也可以是其他判定標(biāo)準(zhǔn)。
[0046]步驟S132,根據(jù)匹配的樣本音頻特征參數(shù)得到對(duì)應(yīng)的媒體特效。
[0047]由于每一個(gè)媒體特效是以樣本音頻特征參數(shù)為索引而進(jìn)行關(guān)聯(lián)存儲(chǔ)的,因此根據(jù)匹配的樣本音頻特征參數(shù)可以查找到與其相對(duì)應(yīng)的媒體特效。
[0048]例如,樣本語(yǔ)音“好郁悶”的樣本音頻特征參數(shù)與媒體特效“烏鴉從屏幕左側(cè)飛到屏幕右側(cè)并在右側(cè)消失”相對(duì)應(yīng),當(dāng)輸入語(yǔ)音的音頻參數(shù)與樣本音頻特征參數(shù)“好郁悶”的音頻特征參數(shù)匹配時(shí),就能夠確定準(zhǔn)備發(fā)送的媒體特效為“烏鴉從屏幕左側(cè)飛到屏幕右側(cè)并在右側(cè)消失”。
[0049]由此可以快速查找到想要發(fā)送的媒體特效,提高媒體特效的查找效率。
[0050]需要注意的是,在一個(gè)樣本音頻特征參數(shù)對(duì)應(yīng)的媒體特效為多個(gè)時(shí),所進(jìn)行的選取可以通過(guò)音量信息或音色信息實(shí)現(xiàn),也可以在此通過(guò)用戶(hù)實(shí)現(xiàn)選取,進(jìn)而在此情況下,由于一個(gè)樣本音頻特征參數(shù)對(duì)于的媒體特效僅為若干幾個(gè),因此,并不會(huì)造成查找成本的增加,也能夠保證媒體特效的發(fā)送效率。
[0051 ]在一個(gè)實(shí)施例中,樣本音頻特征參數(shù)對(duì)應(yīng)的媒體特效為多個(gè),如圖4所示,在S140步驟之前,如上所述的方法還包括:
步驟S210,獲取所述輸入語(yǔ)音對(duì)應(yīng)的音量信息。
[0052]音量信息指的輸入語(yǔ)音聲音振幅的大小。
[0053]樣本語(yǔ)音的音頻特征參數(shù)中并不包含聲音本身特征,如音色、音量等信息。根據(jù)樣本語(yǔ)音本身特征的不同,對(duì)應(yīng)不同的媒體特效。如果輸入語(yǔ)音的音頻特征參數(shù)與樣本語(yǔ)音的音頻特征參數(shù)匹配,就獲取輸入語(yǔ)音的本身特征信息,如音色、音量等。
[0054]例如,大笑1、大笑2、大笑3是三個(gè)不同的音頻特效,用戶(hù)錄入“開(kāi)心”作為這三個(gè)音頻特效的語(yǔ)音發(fā)送命令,并將這三個(gè)音頻特效的發(fā)送音量分貝范圍分別設(shè)置為3_4(不包含最大值端點(diǎn),后同),4-5,5-6,當(dāng)用戶(hù)輸入“開(kāi)心”的聲音時(shí),則獲取輸入聲音“開(kāi)心”的音量?目息O
[0055]又例如,大笑A和大笑B是二個(gè)不同的音頻特效,用戶(hù)錄入“開(kāi)心”作為這二個(gè)音頻特效的語(yǔ)音發(fā)送命令,并將這二個(gè)音頻特效的發(fā)送音色分別設(shè)置為男聲和女聲,當(dāng)用戶(hù)輸入“開(kāi)心”的聲音時(shí),則獲取輸入聲音“開(kāi)心”的音量信息。
[0056]步驟S220,在輸入語(yǔ)音音頻特征參數(shù)對(duì)應(yīng)的多個(gè)媒體特效中提取所述音量信息對(duì)應(yīng)的媒體特效。
[0057]樣本音頻特征參數(shù)對(duì)應(yīng)的媒體特效為多個(gè),而這多個(gè)媒體特效分別對(duì)應(yīng)的樣本音頻特征參數(shù)的音量不一樣。提取輸入語(yǔ)音的音量信息后,根據(jù)此音量信息索引到對(duì)應(yīng)的某一個(gè)媒體特效。
[0058]例如,大笑1、大笑2、大笑3是三個(gè)不同的音頻特效,用戶(hù)錄入“開(kāi)心”作為這三個(gè)音頻特效的語(yǔ)音發(fā)送命令,并將這三個(gè)音頻特效的發(fā)送音量分貝范圍分別設(shè)置為3_4(不包含最大值端點(diǎn),后同),4-5,5-6,當(dāng)用戶(hù)以音量分貝值為4.6輸入“開(kāi)心”的聲音時(shí),則確定音頻特效“大笑2”為準(zhǔn)備發(fā)送的音頻特效。
[0059]又例如,大笑A和大笑B是二個(gè)不同的音頻特效,用戶(hù)錄入“開(kāi)心”作為這二個(gè)音頻特效的語(yǔ)音發(fā)送命令,并將這二個(gè)音頻特效的發(fā)送音色分別設(shè)置為男聲和女聲,當(dāng)用戶(hù)以男聲輸入“開(kāi)心”的聲音時(shí),則確定音頻特效“大笑A”為準(zhǔn)備發(fā)送的音頻特效。
[0060]由此通過(guò)不同音量大小或音色的輸入操作將不同的媒體特效加載至即時(shí)視頻中,增加了媒體特效加載至即時(shí)視頻中的多樣性。
[0061]進(jìn)一步的,在檢測(cè)即時(shí)視頻的輸入操作獲取輸入語(yǔ)音的音量信息進(jìn)行實(shí)時(shí)顯示。
[0062]檢測(cè)輸入語(yǔ)音的音量信息后,即時(shí)視頻界面實(shí)時(shí)顯示用戶(hù)當(dāng)前輸入語(yǔ)音的音量信息,方便用戶(hù)實(shí)時(shí)了解輸入語(yǔ)音的音量信息。
[0063]其中,音量信息可以轉(zhuǎn)換成分貝值,也可以將音量大小通過(guò)振幅波形描述,振幅的高低體現(xiàn)音量的大小。例如,用戶(hù)的當(dāng)前輸入語(yǔ)音音量為40分貝時(shí),即時(shí)視頻界面可以顯示“40”的分貝數(shù)值,也可以顯示代表40分貝的振幅波形。
[0064]通過(guò)音量信息在即時(shí)視頻界面的實(shí)時(shí)顯示,為用戶(hù)將特定音量大小的特效加載至即時(shí)視頻帶來(lái)較好的便利性。
[0065]在一個(gè)實(shí)施例中,還相應(yīng)地提供了一種即時(shí)視頻的媒體特效發(fā)送裝置,如圖5所示,該裝置包括檢測(cè)模塊110、識(shí)別模塊120、確定模塊130和發(fā)送模塊140,其中:
檢測(cè)模塊110,用于檢測(cè)即時(shí)視頻的輸入操作,由輸入操作獲得輸入語(yǔ)音。
[0066]識(shí)別模塊120,用于識(shí)別輸入語(yǔ)音,獲得音頻特征參數(shù)。
[0067]確定模塊130,根據(jù)音頻特征參數(shù),確定與該音頻特征參數(shù)對(duì)應(yīng)的媒體特效。
[0068]發(fā)送模塊140,用于發(fā)送媒體特效,通過(guò)進(jìn)行媒體特效的發(fā)送將該媒體特效加載至發(fā)布的即時(shí)視頻。
[0069]進(jìn)一步的,在本實(shí)施例中,如圖6所示,檢測(cè)模塊110包括加載觸發(fā)單元111和輸入檢測(cè)單元112,其中:
加載觸發(fā)單元111,用于即時(shí)視頻的采集中觸發(fā)進(jìn)行的媒體特效加載。
[0070]輸入檢測(cè)單元112,用于響應(yīng)媒體特效的加載,檢測(cè)即時(shí)視頻的輸入操作,通過(guò)檢測(cè)得到的輸入操作獲得標(biāo)示媒體特效發(fā)送命令的輸入語(yǔ)音。
[0071 ]在一個(gè)實(shí)施例中,如圖7所示,確定模塊130包括:
對(duì)比單元131,用于在與樣本音頻特征參數(shù)關(guān)聯(lián)存儲(chǔ)的媒體特效中,進(jìn)行輸入語(yǔ)音的音頻特征參數(shù)和樣本音頻特征參數(shù)之間的比對(duì),得到與該輸入語(yǔ)音音頻特征參數(shù)匹配的樣本音頻特征參數(shù)。
[0072]定位單元132,用于根據(jù)匹配的樣本音頻特征參數(shù)得到與該樣本音頻特征參數(shù)對(duì)應(yīng)的媒體特效。
[0073]在一個(gè)實(shí)施例中,如圖8所示,在發(fā)送模塊140之前還包括音量處理模塊210,用于對(duì)輸入語(yǔ)音的音量的信息進(jìn)行處理,音量處理模塊210包括音量識(shí)別單元211和音量定位單元212,其中: 音量識(shí)別單元211,用于獲取輸入語(yǔ)音對(duì)應(yīng)的音量信息。
[0074]音量定位單元212,用于在與輸入語(yǔ)音音頻特征參數(shù)對(duì)應(yīng)的多個(gè)媒體特效中提取與其音量信息對(duì)應(yīng)的媒體特效。
[0075]進(jìn)一步的,在本實(shí)施例中,如圖9所示,音量識(shí)別單元211包括音量獲取子單元2111和音量顯示子單元2112,其中:
音量獲取子單元2111,用于獲取的所述輸入語(yǔ)音的音量信息;
音量顯示子單元2112,用于在對(duì)輸入操作的檢測(cè)中,對(duì)輸入語(yǔ)音的音量信息進(jìn)行實(shí)時(shí)顯不O
[0076]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
[0077]雖然已參照幾個(gè)典型實(shí)施方式描述了本發(fā)明,但應(yīng)當(dāng)理解,所用的術(shù)語(yǔ)是說(shuō)明和示例性、而非限制性的術(shù)語(yǔ)。由于本發(fā)明能夠以多種形式具體實(shí)施而不脫離發(fā)明的精神或?qū)嵸|(zhì),所以應(yīng)當(dāng)理解,上述實(shí)施方式不限于任何前述的細(xì)節(jié),而應(yīng)在隨附權(quán)利要求所限定的精神和范圍內(nèi)廣泛地解釋?zhuān)虼寺淙霗?quán)利要求或其等效范圍內(nèi)的全部變化和改型都應(yīng)為隨附權(quán)利要求所涵蓋。
【主權(quán)項(xiàng)】
1.一種即時(shí)視頻中媒體特效的發(fā)送方法,其特征在于,所述方法包括: 檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音; 識(shí)別所述輸入語(yǔ)音,獲得音頻特征參數(shù); 根據(jù)所述音頻特征參數(shù)索引到與所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效; 發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音的步驟包括: 所述即時(shí)視頻的采集中觸發(fā)媒體特效加載; 響應(yīng)于所述媒體特效加載,檢測(cè)即時(shí)視頻的輸入操作,通過(guò)檢測(cè)得到的所述輸入操作獲得標(biāo)示媒體特效發(fā)送命令的輸入語(yǔ)音。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述音頻特征參數(shù)索引到所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效的步驟包括: 在與樣本音頻特征參數(shù)關(guān)聯(lián)存儲(chǔ)的媒體特效中,進(jìn)行所述音頻特征參數(shù)和樣本音頻特征參數(shù)之間的比對(duì),得到與所述音頻特征參數(shù)匹配的樣本音頻特征參數(shù); 根據(jù)匹配的所述樣本音頻特征參數(shù)得到所述音頻特征參數(shù)索引的媒體特效。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效為多個(gè),所述發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻的步驟之前,所述方法還包括: 獲取所述輸入語(yǔ)音對(duì)應(yīng)的音量信息; 在所述音頻特征參數(shù)對(duì)應(yīng)的多個(gè)媒體特效中提取所述音量信息對(duì)應(yīng)的媒體特效。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括: 在所述輸入操作的檢測(cè)中,根據(jù)所述音量信息進(jìn)行輸入音量的實(shí)時(shí)顯示。6.—種即時(shí)視頻中媒體特效的發(fā)送裝置,其特征在于,所述裝置包括: 檢測(cè)模塊,用于檢測(cè)即時(shí)視頻的輸入操作,由所述輸入操作獲得輸入語(yǔ)音; 識(shí)別模塊,用于識(shí)別所述輸入語(yǔ)音,獲得音頻特征參數(shù); 確定模塊,用于根據(jù)所述音頻特征參數(shù)索引到與所述音頻特征參數(shù)對(duì)應(yīng)的媒體特效; 發(fā)送模塊,用于發(fā)送所述媒體特效,通過(guò)進(jìn)行所述媒體特效的發(fā)送將所述媒體特效加載至發(fā)布的即時(shí)視頻。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述檢測(cè)模塊包括: 加載觸發(fā)單元,用于所述即時(shí)視頻的采集中觸發(fā)媒體特效加載; 輸入檢測(cè)單元,用于響應(yīng)于所述媒體特效加載,檢測(cè)即時(shí)視頻的輸入操作,通過(guò)檢測(cè)得到的所述輸入操作獲得標(biāo)示媒體特效發(fā)送命令的輸入語(yǔ)音。8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述確定模塊包括: 對(duì)比單元,用于在與樣本音頻特征參數(shù)關(guān)聯(lián)存儲(chǔ)的媒體特效中,進(jìn)行所述音頻特征參數(shù)和樣本音頻特征參數(shù)之間的比對(duì),得到與所述音頻特征參數(shù)匹配的樣本音頻特征參數(shù);定位單元,用于根據(jù)匹配的所述樣本音頻特征參數(shù)得到所述音頻特征參數(shù)索引的媒體特效。9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括音量處理單元,所述音量處理單元包括: 音量識(shí)別單元,用于獲取所述輸入語(yǔ)音對(duì)應(yīng)的音量信息; 音量定位單元,用于在所述音頻特征參數(shù)對(duì)應(yīng)的多個(gè)媒體特效中提取所述音量信息對(duì)應(yīng)的媒體特效。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述音量識(shí)別單元包括: 音量獲取子單元,用于獲取的所述輸入語(yǔ)音的音量信息; 音量顯示子單元,用于在所述輸入操作的檢測(cè)中,根據(jù)所述音量信息進(jìn)行輸入音量的實(shí)時(shí)顯不O
【文檔編號(hào)】H04N21/4788GK105872838SQ201610274581
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2016年4月28日
【發(fā)明人】徐文波
【申請(qǐng)人】徐文波