本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及一種視頻處理方法、裝置和存儲(chǔ)介質(zhì)。
背景技術(shù):
增強(qiáng)現(xiàn)實(shí)技術(shù)(ar,augmentedreality),是一種能夠?qū)崟r(shí)地計(jì)算攝影機(jī)影像的位置及角度并加上相應(yīng)圖像的技術(shù),這種技術(shù)可以在屏幕上把虛擬世界和現(xiàn)實(shí)世界結(jié)合,并進(jìn)行互動(dòng)。近年來(lái),隨著計(jì)算機(jī)技術(shù)的發(fā)展,ar的應(yīng)用越來(lái)越為廣泛。以視頻處理為例,在現(xiàn)有技術(shù)中,為了增加視頻的趣味性,一般可以在用戶進(jìn)行攝像時(shí),在各幀圖像上添加實(shí)時(shí)的二維(2d,2dimensions)動(dòng)態(tài)貼紙效果。例如,具體可以利用人臉識(shí)別技術(shù)獲取相機(jī)中當(dāng)前幀的人像的五官點(diǎn),然后利用這些五官點(diǎn),在指定點(diǎn)位繪制二維貼紙,比如繪制一二維的兔子耳朵、貓耳朵、或胡子,等等。
在對(duì)現(xiàn)有技術(shù)的研究和實(shí)踐過(guò)程中,本發(fā)明的發(fā)明人發(fā)現(xiàn),現(xiàn)有方案所添加的二維動(dòng)態(tài)貼紙效果雖然具有一定趣味性,但與原圖的融合度較差,視頻處理質(zhì)量不佳。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種視頻處理方法、裝置和存儲(chǔ)介質(zhì);可以在圖像上添加三維圖像效果,提高所添加效果與原圖的融合度,改善視頻處理質(zhì)量。
本發(fā)明實(shí)施例提供一種視頻處理方法,包括:
采集視頻數(shù)據(jù),并從所述視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象;
檢測(cè)所述對(duì)象的特征點(diǎn)、以及所述對(duì)象預(yù)設(shè)部位的歐拉角;
根據(jù)所述特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維(3d,3dimensions)圖像的深度信息;
基于所述三維圖像的深度信息在所述對(duì)象上繪制所述三維圖像。
相應(yīng)的,本發(fā)明實(shí)施例還提供一種視頻處理裝置,包括:
采集單元,用于采集視頻數(shù)據(jù),并從所述視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象;
檢測(cè)單元,用于獲取所述對(duì)象的特征點(diǎn)、以及所述對(duì)象預(yù)設(shè)部位的歐拉角;
獲取單元,用于根據(jù)所述特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息;
繪制單元,用于基于所述三維圖像的深度信息在所述對(duì)象上繪制所述三維圖像。
此外,本發(fā)明實(shí)施例還提供一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行本發(fā)明實(shí)施例所提供的任一種視頻處理方法中的步驟。
本發(fā)明實(shí)施例可以從采集到的視頻數(shù)據(jù)中,確定需要進(jìn)行處理的對(duì)象,然后,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)這些特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,并基于該深度信息在該對(duì)象上繪制三維圖像,從而達(dá)到在該圖像上添加三維圖像,比如三維物品效果的目的;該方案相對(duì)于現(xiàn)有方案只能添加二維動(dòng)態(tài)貼紙效果的方案而言,可以大大提高所添加效果與原圖的融合度,從而從整體上改善視頻處理質(zhì)量。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1a是本發(fā)明實(shí)施例提供的視頻處理方法的場(chǎng)景示意圖;
圖1b是本發(fā)明實(shí)施例提供的視頻處理方法的場(chǎng)景示意圖;
圖1c是本發(fā)明實(shí)施例提供的視頻處理方法的流程圖;
圖1d是本發(fā)明實(shí)施例提供的視頻處理方法中人臉檢測(cè)的示意圖;
圖2a是本發(fā)明實(shí)施例提供的視頻處理方法的另一流程圖;
圖2b是本發(fā)明實(shí)施例提供的視頻處理方法中人頭姿勢(shì)歐拉角的示意圖;
圖2c是本發(fā)明實(shí)施例提供的視頻處理方法中歐拉角的示例圖;
圖3a是本發(fā)明實(shí)施例提供的視頻處理方法的又一流程圖;
圖3b是本發(fā)明實(shí)施例提供的視頻處理方法中遮擋模型的示意圖;
圖3c是本發(fā)明實(shí)施例提供的視頻處理方法中寫入遮擋模型深度信息的示意圖;
圖3d是本發(fā)明實(shí)施例提供的視頻處理方法中寫入三維頭盔深度信息的示意圖;
圖3e是本發(fā)明實(shí)施例提供的視頻處理方法中三維頭盔的繪制效果圖;
圖4a是本發(fā)明實(shí)施例提供的視頻處理裝置的結(jié)構(gòu)示意圖;
圖4b是本發(fā)明實(shí)施例提供的視頻處理裝置的另一結(jié)構(gòu)示意圖;
圖5是本發(fā)明實(shí)施例提供的網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例提供一種視頻處理方法、裝置和存儲(chǔ)介質(zhì)。
該視頻處理裝置具體可以集成在網(wǎng)絡(luò)設(shè)備,比如服務(wù)器或終端等設(shè)備中。
例如,以該視頻處理裝置集成在終端中為例,則參見(jiàn)圖1a,終端可以采集視頻數(shù)據(jù),從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,并檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,比如,可以檢測(cè)視頻幀中某人像的五官特征點(diǎn)、以及頭部姿勢(shì)的歐拉角,等等,然后,根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像,比如,在該人像上添加一個(gè)三維的頭盔,等等。
又例如,以該視頻處理裝置集成在服務(wù)器中為例,則見(jiàn)圖1b,終端在采集到視頻數(shù)據(jù)后,可以將該視頻數(shù)據(jù)提供給服務(wù)器,由服務(wù)器從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,并檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,然后,服務(wù)器根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像;可選的,此后,服務(wù)器還可以將繪制了三維圖像后的視頻數(shù)據(jù)返回給終端。
通過(guò)本發(fā)明實(shí)施例的方案,可以實(shí)現(xiàn)一種增強(qiáng)現(xiàn)實(shí)技術(shù)(ar,augmentedreality)的效果。所謂ar,是一種能夠?qū)崟r(shí)地計(jì)算攝影機(jī)影像的位置及角度并加上相應(yīng)圖像、視頻、或三維模型的技術(shù),這種技術(shù)可以在屏幕上把虛擬世界和現(xiàn)實(shí)世界結(jié)合,并進(jìn)行互動(dòng)。以下將對(duì)本發(fā)明所提供的方案分別進(jìn)行詳細(xì)說(shuō)明。
本實(shí)施例將從視頻處理裝置的角度進(jìn)行描述,該視頻處理裝置具體可以集成在網(wǎng)絡(luò)設(shè)備,比如服務(wù)器或終端等設(shè)備中;其中,該終端具體可以為手機(jī)、平板電腦、筆記本電腦、和/或pc等。
一種視頻處理方法,包括:采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像。
如圖1c所示,該視頻處理方法的具體流程可以如下:
101、采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象。
例如,以該視頻處理裝置集成在終端中為例,則此時(shí),具體可以由終端采集視頻數(shù)據(jù),比如通過(guò)攝像頭進(jìn)行拍攝,或從本地(即終端)讀取視頻數(shù)據(jù),等等。
又例如,以該視頻處理裝置集成在服務(wù)器中為例,則此時(shí),服務(wù)器具體接收終端發(fā)送的視頻數(shù)據(jù),譬如,具體可以由終端采集視頻數(shù)據(jù),比如通過(guò)攝像頭進(jìn)行拍攝,或從終端所存儲(chǔ)的視頻庫(kù)中直接讀取視頻數(shù)據(jù),等等,然后,由終端將該視頻數(shù)據(jù)提供給服務(wù)器。
在采集到視頻數(shù)據(jù)后,便可以從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,其中,該對(duì)象可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,可以是人、動(dòng)物、甚至是物體,等等,此外,該對(duì)象的數(shù)量也可以根據(jù)實(shí)際應(yīng)用的需求而定,可以是單個(gè),也可以是多個(gè),在此不再贅述。需說(shuō)明的是,為了描述方便,在本發(fā)明實(shí)施例中,將均以該對(duì)象具體為人,且數(shù)量為單個(gè)為例進(jìn)行說(shuō)明。
102、檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角。
其中,特征點(diǎn)的設(shè)置和預(yù)設(shè)部位可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,以該對(duì)象為人像,則此時(shí),可以將特征點(diǎn)設(shè)置為人的五官,如眉毛、眼睛、鼻子、嘴巴和耳朵,以及人的臉部輪廓等,即步驟“檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角”具體可以如下:
采用人臉檢測(cè)技術(shù)對(duì)該對(duì)象的面部進(jìn)行人臉識(shí)別,得到該對(duì)象的面部特征點(diǎn),以及對(duì)該對(duì)象的頭部姿勢(shì)進(jìn)行檢測(cè),得到該對(duì)象的頭部的歐拉角。
其中,該面部特征點(diǎn)可以包括五官、以及臉部輪廓等特征點(diǎn),例如,參見(jiàn)圖1d。
其中,歐拉角是用來(lái)確定定點(diǎn)轉(zhuǎn)動(dòng)剛體位置的3個(gè)一組獨(dú)立角參量,由章動(dòng)角θ、旋進(jìn)角(即進(jìn)動(dòng)角)ψ和自轉(zhuǎn)角
103、根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息;例如,具體可以如下:
(1)根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行調(diào)整,使得該三維圖像與該對(duì)象能夠匹配。
例如,具體根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配。
其中,該三維圖像可以根據(jù)實(shí)際應(yīng)用的需求或用戶的喜好進(jìn)行選擇,比如,可以是一個(gè)三維頭盔、三維兔子耳朵、三維貓耳朵、三維眼鏡、或三維頭巾,等等。
其中,匹配的方式可以有多種,比如,可以設(shè)置當(dāng)該三維圖像與該對(duì)象在大小、位置和角度上滿足一定函數(shù)關(guān)系時(shí),確定該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配;或者,也可以設(shè)置當(dāng)該三維圖像與該對(duì)象在大小、位置和角度上一致或大體上一致(即誤差小于預(yù)設(shè)范圍)時(shí),確定該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配,等等。
譬如,以該對(duì)象為人像,且三維圖像具體為三維的眼鏡為例,則此時(shí),具體可以根據(jù)該人的面部特征點(diǎn)和頭部的歐拉角對(duì)該三維眼鏡進(jìn)行位移,使得該三維眼鏡與該人的面部的位置大體上一致,以及根據(jù)該人的面部特征點(diǎn)和頭部的歐拉角對(duì)該三維眼鏡進(jìn)行縮放和旋轉(zhuǎn),使得該三維眼鏡與該人的面部大小和角度大體上一致,等等。
(2)提取該三維圖像在匹配狀態(tài)下的深度信息,得到該三維圖像的深度信息。
即當(dāng)三維圖像與該對(duì)象在大小、位置和角度上匹配時(shí),提取該三維圖像在該狀態(tài)下的深度信息(物體在不同的狀態(tài)下都有其對(duì)應(yīng)的深度信息),得到該三維圖像的深度信息。
其中,深度信息是讓人類產(chǎn)生立體視覺(jué)的前提。眾所周知,透視投影是多對(duì)一的關(guān)系,投影線上的任何一點(diǎn)都可對(duì)應(yīng)同一個(gè)像點(diǎn),而如果用兩個(gè)攝像機(jī)(相當(dāng)于人的雙眼),則可以消除這種多對(duì)一的情況,從而能夠確定第三維坐標(biāo)z的值,而該值即稱為深度信息。
104、基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像。
例如,具體可以根據(jù)該三維圖像的深度信息在該對(duì)象所在的幀上對(duì)該三維圖像進(jìn)行渲染,比如在頭像上繪制一個(gè)三維眼鏡、三維頭盔、或三維兔子耳朵,等等。
可選的,為了避免所繪制的三維圖像對(duì)該對(duì)象造成遮擋,還可以根據(jù)該對(duì)象需要裸露的部分(即避免被三維圖像遮擋的部分)設(shè)置相匹配的遮擋模型(occluder),以便該三維圖像在繪制時(shí),能夠相應(yīng)地避開(kāi)該對(duì)象需要裸露的部分;即,在步驟“基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像”之前,該視頻處理方法還可以包括:
獲取預(yù)設(shè)遮擋模型的深度信息,根據(jù)該預(yù)設(shè)遮擋模型的深度信息和三維圖像的深度信息對(duì)該遮擋模型和三維圖像進(jìn)行疊加,并將重合部分的顏色設(shè)置為透明,得到處理后深度信息;
則此時(shí),步驟“基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像”包括:根據(jù)處理后深度信息在該對(duì)象上繪制該三維圖像。
其中,獲取預(yù)設(shè)遮擋模型的深度信息與獲取三維圖像的深度信息類似,例如,具體可以如下:
獲取預(yù)設(shè)的遮擋模型,根據(jù)該特征點(diǎn)和歐拉角對(duì)該遮擋模型進(jìn)行調(diào)整,使得該遮擋模型與該對(duì)象能夠匹配,提取該遮擋模型在匹配狀態(tài)下的深度信息,得到該遮擋模型的深度信息。
比如,具體可以根據(jù)該特征點(diǎn)和歐拉角對(duì)該遮擋模型進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該遮擋模型與該對(duì)象在大小、位置和角度上均能夠匹配。
其中,該遮擋模型可以根據(jù)該對(duì)象需要裸露的部分(即避免被三維圖像遮擋的部分)進(jìn)行設(shè)置,比如,以需要裸露的部分為人臉為例,則具體可以建立一個(gè)人頭的模型來(lái)作為該遮擋模型,等等。
需說(shuō)明的是,為了使得算法更為簡(jiǎn)便,以及提高處理效率,多個(gè)類型相同的不同對(duì)象可以使用同一遮擋模型;比如,還是以需要裸露的部分為人臉,且需要繪制的三維圖像為三維頭盔為例,若該對(duì)象為用戶甲的頭像,則此時(shí),可以采用遮擋模型a,來(lái)避免繪制三維頭盔時(shí),用戶甲的臉部被遮擋;若該對(duì)象為用戶乙的頭像,則此時(shí),也同樣可以采用遮擋模型a,來(lái)避免繪制三維頭盔時(shí),用戶乙的臉部被遮擋,以此類推,等等。
可選的,為了提高繪制的精確度,以及提高處理效果,還可以根據(jù)具體的對(duì)象來(lái)建立該遮擋模型;比如,還是以需要裸露的部分為人臉,且需要繪制的三維圖像為三維頭盔為例,若該對(duì)象為用戶甲的頭像,則此時(shí),可以根據(jù)用戶甲的頭部建立遮擋模型a,然后,采用遮擋模型a來(lái)避免繪制三維頭盔時(shí),用戶甲的臉部被遮擋;若該對(duì)象為用戶乙的頭像,則此時(shí),可以根據(jù)用戶乙的頭部建立遮擋模型b,然后,采用遮擋模型b來(lái)避免繪制三維頭盔時(shí),用戶乙的臉部被遮擋,以此類推,等等。
由于并不是所有需要繪制的三維圖像均會(huì)對(duì)該對(duì)象造成遮擋,因此,可選的,為了提高靈活性,在獲取預(yù)設(shè)遮擋模型的深度信息之前,還可以對(duì)該三維圖像進(jìn)行判斷,若屬于預(yù)設(shè)類型,則需要遮擋模型,否則,則可以直接對(duì)該三維圖像進(jìn)行繪制;即,在步驟“獲取預(yù)設(shè)遮擋模型的深度信息”之前,該視頻處理方法還可以包括:
確定該三維圖像的類型是否滿足預(yù)設(shè)條件,若是,則執(zhí)行獲取預(yù)設(shè)遮擋模型的深度信息的步驟;否則,若不滿足預(yù)設(shè)條件,則執(zhí)行基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像的步驟。
由上可知,本實(shí)施例可以從采集到的視頻數(shù)據(jù)中,確定需要進(jìn)行處理的對(duì)象,然后,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)這些特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,并基于該深度信息在該對(duì)象上繪制三維圖像,從而達(dá)到在該圖像上添加三維圖像,比如三維物品效果的目的;該方案相對(duì)于現(xiàn)有方案只能添加二維動(dòng)態(tài)貼紙效果的方案而言,一方面,可以大大提高所添加效果與原圖的融合度,從而從整體上改善視頻處理質(zhì)量,另一方面,也可以實(shí)現(xiàn)ar的效果。
根據(jù)上述實(shí)施例所描述的方法,以下將舉例作進(jìn)一步詳細(xì)說(shuō)明。
在本實(shí)施例中,將以該視頻處理裝置具體集成在網(wǎng)絡(luò)設(shè)備中為例進(jìn)行說(shuō)明,其中,該網(wǎng)絡(luò)設(shè)備具體可以是終端,也可以是服務(wù)器等設(shè)備。
如圖2a所示,一種視頻處理方法,具體流程可以如下:
201、網(wǎng)絡(luò)設(shè)備采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要處理的對(duì)象。
其中,該對(duì)象可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,可以是人、動(dòng)物、甚至是物體,等等,此外,該對(duì)象的數(shù)量也可以根據(jù)實(shí)際應(yīng)用的需求而定,可以是單個(gè),也可以是多個(gè),在此不再贅述。
例如,以該網(wǎng)絡(luò)設(shè)備具體為終端,且需要處理的對(duì)象為“人像”為例,則此時(shí),終端可以通過(guò)攝像頭對(duì)用戶的面部進(jìn)行拍攝,以采集視頻數(shù)據(jù),然后,由終端從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,比如需要添加三維圖像的“人像”。
又例如,以該網(wǎng)絡(luò)設(shè)備具體為服務(wù)器為例,則此時(shí),具體可以由終端采集視頻數(shù)據(jù),比如通過(guò)攝像頭進(jìn)行拍攝,然后,由終端將該視頻數(shù)據(jù)提供給服務(wù)器,由服務(wù)器從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,比如需要添加三維圖像的“人像”,等等。
可選的,為了提高視頻數(shù)據(jù)的有效性,終端在采集視頻數(shù)據(jù)時(shí),還可以生成相應(yīng)的提示信息,以提示用戶需要拍攝人臉,以便用戶可以以更好的姿態(tài)進(jìn)行拍攝,從而使得可以獲取到有效性更高的視頻數(shù)據(jù)。
202、網(wǎng)絡(luò)設(shè)備檢測(cè)該對(duì)象的特征點(diǎn)。
例如,還是以需要處理的對(duì)象為“人像”為例,則如圖1d所示,網(wǎng)絡(luò)設(shè)備具體采用人臉檢測(cè)技術(shù)對(duì)該對(duì)象的面部進(jìn)行人臉識(shí)別,得到該對(duì)象的面部特征點(diǎn)。
其中,該面部特征點(diǎn)可以包括五官、以及臉部輪廓等特征點(diǎn),而五官可以包括該人像的眉毛、眼睛、鼻子、嘴巴和耳朵等。而該人臉檢測(cè)技術(shù)可以包括opencv(一個(gè)跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù))人臉檢測(cè)技術(shù)、各個(gè)移動(dòng)終端系統(tǒng)自帶人臉檢測(cè)技術(shù)、face++的人臉檢測(cè)技術(shù)、sensetime人臉檢測(cè)技術(shù),等等。
203、網(wǎng)絡(luò)設(shè)備檢測(cè)該對(duì)象預(yù)設(shè)部位的歐拉角。
例如,還是以需要處理的對(duì)象為“人像”,且該預(yù)設(shè)部位為“頭部”為例,則此時(shí),網(wǎng)絡(luò)設(shè)備具體對(duì)該人像的頭部姿勢(shì)進(jìn)行實(shí)時(shí)檢測(cè),得到該人像的頭部的歐拉角。比如,參見(jiàn)圖2b,具體可以以人像的鼻尖作為定點(diǎn)“o”來(lái)進(jìn)行轉(zhuǎn)動(dòng),得到基于該定點(diǎn)“o”(即鼻尖)進(jìn)行轉(zhuǎn)動(dòng)人像頭部的一組獨(dú)立角參量:章動(dòng)角θ、旋進(jìn)角(即進(jìn)動(dòng)角)ψ和自轉(zhuǎn)角
如圖2c所示,可以基于定點(diǎn)o作出固定坐標(biāo)系oxyz(x軸、y軸和z軸的位置、以及這三坐標(biāo)軸之間關(guān)系還可參見(jiàn)圖2b),以及固連于該人像頭部的坐標(biāo)系ox'y'z'。其中,平面zoz'的垂線on稱為節(jié)線,它又是基本平面ox'y'和oxy的交線。以軸oz和oz'為基本軸,其垂直面oxy和ox'y'為基本平面,計(jì)算由軸oz到oz'的角度,便可以得到章動(dòng)角θ。在該坐標(biāo)系中,由on的正端看,章動(dòng)角θ應(yīng)按逆時(shí)針?lè)较蛴?jì)量。此外,可以測(cè)量由固定軸ox量到節(jié)線on的角度,得到進(jìn)動(dòng)角ψ,以及測(cè)量由節(jié)線on到動(dòng)軸ox'的角度,得到自轉(zhuǎn)角φ。由軸oz和oz'正端看,角ψ和φ也都按逆時(shí)針?lè)较蛴?jì)量。
需說(shuō)明的是,其中,該歐拉角可以隨著人像頭部姿勢(shì)的變化而變化,而后續(xù)所需要的添加的三維圖像的角度取決于該歐拉角,因此,可以使得該三維圖像也可以隨著人像頭部姿勢(shì)的變化而變化,這在步驟204中將進(jìn)行詳細(xì)描述,在此不再贅述。
其中,步驟202和203的執(zhí)行可以不分先后。
204、網(wǎng)絡(luò)設(shè)備根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配。
其中,該三維圖像可以根據(jù)實(shí)際應(yīng)用的需求或用戶的喜好進(jìn)行選擇,比如,可以是一個(gè)三維兔子耳朵、三維貓耳朵、三維眼鏡、或三維頭巾,等等。
其中,匹配的方式可以有多種,比如,可以設(shè)置當(dāng)該三維圖像與該對(duì)象在大小、位置和角度上滿足一定函數(shù)關(guān)系時(shí),確定該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配;或者,也可以設(shè)置當(dāng)該三維圖像與該對(duì)象在大小、位置和角度上一致或大體上一致(即誤差小于預(yù)設(shè)范圍)時(shí),確定該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配,等等。為了描述方便,在本實(shí)施例中,將均以該三維圖像與該對(duì)象在大小、位置和角度上一致或大體上一致作為匹配條件為例進(jìn)行說(shuō)明。
譬如,以該對(duì)象為人像,且三維圖像具體為三維眼鏡為例,則此時(shí),具體可以根據(jù)該人的面部特征點(diǎn)和頭部的歐拉角對(duì)該三維眼鏡進(jìn)行位移,使得該三維眼鏡與該人的面部的位置大體上一致,以及根據(jù)該人的面部特征點(diǎn)和頭部的歐拉角對(duì)該三維眼鏡進(jìn)行縮放和旋轉(zhuǎn),使得該三維眼鏡與該人的面部大小和角度大體上一致,等等。
205、網(wǎng)絡(luò)設(shè)備提取該三維圖像在匹配狀態(tài)下(即當(dāng)三維圖像與該對(duì)象在大小、位置和角度上匹配時(shí))的深度信息,得到該三維圖像的深度信息。
例如,還是以該需要處理的對(duì)象為“人像”,且需要添加的三維圖像為三維眼鏡為例,則當(dāng)該三維眼鏡與該人的面部的位置、大小和角度大體上一致時(shí)網(wǎng)絡(luò)設(shè)備提取該三維眼鏡此時(shí)的深度信息,并執(zhí)行步驟206。
206、網(wǎng)絡(luò)設(shè)備根據(jù)三維圖像的深度信息在該對(duì)象上繪制該三維圖像。
例如,還是以該需要處理的對(duì)象為“人像”,且需要添加的三維圖像為三維眼鏡為例,則此時(shí),網(wǎng)絡(luò)設(shè)備可以根據(jù)步驟205中得到的三維眼鏡的深度信息,在該人像的面部繪制三維眼鏡。
由上可知,本實(shí)施例可以從采集到的視頻數(shù)據(jù)中,確定需要進(jìn)行處理的對(duì)象,然后,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)這些特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,并基于該深度信息在該對(duì)象上繪制三維圖像,從而達(dá)到在該圖像上添加三維圖像,比如三維物品效果的目的;該方案相對(duì)于現(xiàn)有方案只能添加二維動(dòng)態(tài)貼紙效果的方案而言,可以大大提高所添加效果與原圖的融合度,從而從整體上改善視頻處理質(zhì)量。
與上一個(gè)實(shí)施例相同的是,在本實(shí)施例中,同樣以該視頻處理裝置具體集成在網(wǎng)絡(luò)設(shè)備中為例進(jìn)行說(shuō)明,與上一個(gè)實(shí)施例不同的是,在本實(shí)施例中,將以繪制另一種類型的三維圖像,如三維頭盔為例進(jìn)行說(shuō)明。
如圖3a所示,一種視頻處理方法,具體流程可以如下:
301、網(wǎng)絡(luò)設(shè)備采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要處理的對(duì)象。
其中,該網(wǎng)絡(luò)設(shè)備可以是終端,也可以是服務(wù)器,具體可參見(jiàn)上一個(gè)實(shí)施例中的步驟201,在此不再贅述。
302、網(wǎng)絡(luò)設(shè)備檢測(cè)該對(duì)象的特征點(diǎn)。
303、網(wǎng)絡(luò)設(shè)備檢測(cè)該對(duì)象預(yù)設(shè)部位的歐拉角。
其中,步驟301~303的具體執(zhí)行可參見(jiàn)上一個(gè)實(shí)施例中的步驟201~203,在此不再贅述。
304、網(wǎng)絡(luò)設(shè)備獲取預(yù)設(shè)的遮擋模型,然后執(zhí)行步驟305。
其中,該遮擋模型可以根據(jù)該對(duì)象需要裸露的部分(即避免被三維圖像遮擋的部分)進(jìn)行設(shè)置,比如,以需要裸露的部分為人臉為例,則如圖3b所示,具體可以建立一個(gè)人頭的模型來(lái)作為該遮擋模型,等等。
需說(shuō)明的是,為了使得算法更為簡(jiǎn)便,以及提高處理效率,多個(gè)類型相同的不同對(duì)象可以使用同一遮擋模型;比如,還是以需要裸露的部分為人臉,且需要繪制的三維圖像為三維頭盔為例,若該對(duì)象為用戶甲的頭像,則此時(shí),可以采用遮擋模型a,來(lái)避免繪制三維頭盔時(shí),用戶甲的臉部被遮擋;而若該對(duì)象為用戶乙的頭像,則同樣也可以采用遮擋模型a,來(lái)避免繪制三維頭盔時(shí),用戶乙的臉部被遮擋,以此類推,等等。
可選的,為了提高繪制的精確度,以及提高處理效果,還可以根據(jù)具體的對(duì)象來(lái)建立該遮擋模型;比如,還是以需要裸露的部分為人臉,且需要繪制的三維圖像為三維頭盔為例,若該對(duì)象為用戶甲的頭像,則可以根據(jù)用戶甲的頭部建立遮擋模型a,然后,采用遮擋模型a來(lái)避免繪制三維頭盔時(shí),用戶甲的臉部被遮擋;而若該對(duì)象為用戶乙的頭像,則可以根據(jù)用戶乙的頭部建立遮擋模型b,然后,采用遮擋模型b來(lái)避免繪制三維頭盔時(shí),用戶乙的臉部被遮擋,以此類推,等等。
由于并不是所有需要繪制的三維圖像均會(huì)對(duì)該對(duì)象造成遮擋,因此,可選的,為了提高靈活性,在獲取預(yù)設(shè)的遮擋模型之前,還可以對(duì)該三維圖像進(jìn)行判斷,若屬于預(yù)設(shè)類型,比如若需要繪制的三維圖像為三維頭盔,則需要遮擋模型,否則,若不屬于預(yù)設(shè)類型,比如若需要繪制的三維圖像為三維眼鏡,則可以直接對(duì)該三維圖像進(jìn)行繪制,可參見(jiàn)上一個(gè)實(shí)施例中的相關(guān)描述,在此不再贅述。
305、網(wǎng)絡(luò)設(shè)備根據(jù)該特征點(diǎn)和歐拉角對(duì)該遮擋模型進(jìn)行調(diào)整,使得該遮擋模型與該對(duì)象能夠匹配,提取該遮擋模型在匹配狀態(tài)下的深度信息,得到該遮擋模型的深度信息。例如,具體可以如下:
網(wǎng)絡(luò)設(shè)備根據(jù)該特征點(diǎn)和歐拉角對(duì)該遮擋模型進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該遮擋模型與該對(duì)象在大小、位置和角度上均能夠匹配,然后,提取該遮擋模型在匹配狀態(tài)下的深度信息,得到該遮擋模型的深度信息,比如,參見(jiàn)圖3c,該圖為寫入遮擋模型的深度信息的示意圖。
其中,匹配的方式可以有多種,比如,可以設(shè)置當(dāng)該遮擋模型與該對(duì)象在大小、位置和角度上滿足一定函數(shù)關(guān)系時(shí),確定該遮擋模型與該對(duì)象在大小、位置和角度上均能夠匹配;或者,也可以設(shè)置當(dāng)該遮擋模型與該對(duì)象在大小、位置和角度上一致或大體上一致(即誤差小于預(yù)設(shè)范圍)時(shí),確定該遮擋模型與該對(duì)象在大小、位置和角度上均能夠匹配,等等。
306、網(wǎng)絡(luò)設(shè)備根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配,提取該三維圖像在匹配狀態(tài)下的深度信息,得到該三維圖像的深度信息。
其中,匹配的方式可以有多種,具體可參見(jiàn)上一個(gè)實(shí)施例中的步驟204和205,在此不再贅述。
比如,參見(jiàn)圖3d,該圖為寫入三維頭盔的深度信息的示意圖,由圖3d可以看出,若直接根據(jù)三維頭盔的深度信息來(lái)繪制該三維頭盔,則將會(huì)對(duì)該人像的面部造成遮擋,因此,需要將面部“裸露”出來(lái),而這個(gè)操作,可以通過(guò)執(zhí)行步驟307來(lái)實(shí)現(xiàn),詳見(jiàn)步驟307。
需說(shuō)明的是,步驟304和306的執(zhí)行可以不分先后。
307、網(wǎng)絡(luò)設(shè)備根據(jù)該遮擋模型的深度信息和三維圖像的深度信息對(duì)該遮擋模型和三維圖像進(jìn)行疊加,并將重合部分的顏色設(shè)置為透明,得到處理后深度信息。
例如,網(wǎng)絡(luò)設(shè)備可以在將該遮擋模型和三維圖像進(jìn)行疊加后,將重合部分的顏色設(shè)置為vec(0.0.0.0),并寫入三維頭盔的深度信息(即對(duì)步驟306得到的三維頭盔的深度信息進(jìn)行更新),得到處理后深度信息,這樣,后續(xù)在繪制頭盔時(shí),頭盔被該遮擋模型遮擋的像素就會(huì)被丟棄,相當(dāng)于在繪制的頭盔上挖出來(lái)個(gè)洞把人像的面部顯露出來(lái)。
308、網(wǎng)絡(luò)設(shè)備根據(jù)處理后深度信息在該對(duì)象上繪制該三維圖像。
例如,還是以該需要處理的對(duì)象為“人像”,且需要添加的三維圖像為三維頭盔為例,則此時(shí),網(wǎng)絡(luò)設(shè)備可以根據(jù)步驟307中得到的三維頭盔的深度信息,在該人像的面部繪制三維頭盔。
由于此時(shí)所依據(jù)的三維頭盔的深度信息是“處理后深度信息”,因此,在繪制該三維頭盔時(shí),被遮擋模型遮擋的像素會(huì)被丟棄,從而避免了人像的面部被繪制的三維頭盔遮擋的情況的發(fā)生,比如,參見(jiàn)圖3e,該圖為三維頭盔的繪制效果圖,可見(jiàn),在該人像的頭部,添加了一個(gè)三維頭盔,且該人像的面部已顯露出來(lái),清晰可見(jiàn)。
由上可知,本實(shí)施例可以從采集到的視頻數(shù)據(jù)中,確定需要進(jìn)行處理的對(duì)象,然后,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)這些特征點(diǎn)和歐拉角,獲取遮擋模型的深度信息和預(yù)設(shè)三維圖像的深度信息,并基于這些深度信息在該對(duì)象上繪制三維圖像,從而達(dá)到在該圖像上添加三維圖像,比如三維物品效果的目的;該方案相對(duì)于現(xiàn)有方案只能添加二維動(dòng)態(tài)貼紙效果的方案而言,可以大大提高所添加效果與原圖的融合度,從而從整體上改善視頻處理質(zhì)量。
此外,該方案還可以通過(guò)設(shè)置遮擋模型,來(lái)改善三維圖像的添加效果,避免對(duì)原對(duì)象的遮擋情況的發(fā)生,因此,可以提高實(shí)現(xiàn)的靈活性、以及進(jìn)一步提高所添加效果與原圖的融合度、以及視頻處理質(zhì)量。
為了更好地實(shí)施以上方法,本發(fā)明實(shí)施例還提供一種視頻處理裝置,該視頻處理裝置具體可以集成在網(wǎng)絡(luò)設(shè)備,比如服務(wù)器或終端等設(shè)備中;其中,該終端具體可以為手機(jī)、平板電腦、筆記本電腦、和/或pc等。
例如,如圖4a所示,該視頻處理裝置可以包括采集單元401、檢測(cè)單元402、獲取單元403和繪制單元404,如下:
(1)采集單元401;
采集單元401,用于采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象。
例如,該采集單元401,具體可以用于通過(guò)攝像頭進(jìn)行拍攝,或從本地(即終端)讀取視頻數(shù)據(jù)等,并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象。
或者,該采集單元401,具體可以用于接收終端發(fā)送的視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象。
其中,該對(duì)象可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,可以是人、動(dòng)物、甚至是物體,等等,此外,該對(duì)象的數(shù)量也可以根據(jù)實(shí)際應(yīng)用的需求而定,可以是單個(gè),也可以是多個(gè),在此不再贅述。
(2)檢測(cè)單元402;
檢測(cè)單元402,用于獲取該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角。
其中,特征點(diǎn)的設(shè)置和預(yù)設(shè)部位可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,以該對(duì)象為人像,則此時(shí),可以將特征點(diǎn)設(shè)置為人的五官,如眉毛、眼睛、鼻子、嘴巴和耳朵,以及人的臉部輪廓等,即當(dāng)該對(duì)象為人像,預(yù)設(shè)部位為頭部時(shí),該檢測(cè)單元402,具體可以用于:
采用人臉檢測(cè)技術(shù)對(duì)該對(duì)象的面部進(jìn)行人臉識(shí)別,得到該對(duì)象的面部特征點(diǎn);以及,對(duì)該對(duì)象的頭部姿勢(shì)進(jìn)行檢測(cè),得到該對(duì)象的頭部的歐拉角。
其中,該面部特征點(diǎn)可以包括五官、以及臉部輪廓等特征點(diǎn),具體可參見(jiàn)前面的方法實(shí)施例,在此不再贅述。
(3)獲取單元403;
獲取單元403,用于根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息。
例如,該獲取單元403可以包括調(diào)整子單元和提取子單元,如下:
該調(diào)整子單元,可以用于根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行調(diào)整,使得該三維圖像與該對(duì)象能夠匹配。
該提取子單元,可以用于提取該三維圖像在匹配狀態(tài)下的深度信息,得到該三維圖像的深度信息。
比如,該調(diào)整子單元,具體可以用于根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行縮放、旋轉(zhuǎn)和/或位移,使得該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配。
其中,該三維圖像可以根據(jù)實(shí)際應(yīng)用的需求或用戶的喜好進(jìn)行選擇,比如,可以是一個(gè)三維頭盔、三維兔子耳朵、三維貓耳朵、三維眼鏡、或三維頭巾,等等。
其中,匹配的方式可以有多種,比如,可以設(shè)置當(dāng)該三維圖像與該對(duì)象在大小、位置和角度上滿足一定函數(shù)關(guān)系時(shí),確定該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配;或者,也可以設(shè)置當(dāng)該三維圖像與該對(duì)象在大小、位置和角度上一致或大體上一致(即誤差小于預(yù)設(shè)范圍)時(shí),確定該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配,等等。
(4)繪制單元404;
繪制單元404,用于基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像。
例如,繪制單元404,具體可以用于根據(jù)該三維圖像的深度信息在該對(duì)象所在的幀上對(duì)該三維圖像進(jìn)行渲染,比如在頭像上繪制一個(gè)三維眼鏡、三維頭盔、或三維兔子耳朵,等等。
可選的,為了避免所繪制的三維圖像對(duì)該對(duì)象造成遮擋,還可以根據(jù)該對(duì)象需要裸露的部分(即避免被三維圖像遮擋的部分)設(shè)置相匹配的遮擋模型(occluder),以便該三維圖像在繪制時(shí),能夠相應(yīng)地避開(kāi)該對(duì)象需要裸露的部分;即如圖4b所示,該視頻處理裝置還可以包括遮擋獲取單元405和遮擋調(diào)整單元406,如下:
該遮擋獲取單元405,可以用于獲取預(yù)設(shè)遮擋模型的深度信息。
該遮擋調(diào)整單元406,可以用于根據(jù)該預(yù)設(shè)遮擋模型的深度信息和三維圖像的深度信息對(duì)該遮擋模型和三維圖像進(jìn)行疊加,并將重合部分的顏色設(shè)置為透明,得到處理后深度信息。
則此時(shí),該繪制單元404,具體可以用于根據(jù)遮擋調(diào)整單元得到的處理后深度信息在該對(duì)象上繪制該三維圖像。
其中,獲取預(yù)設(shè)遮擋模型的深度信息與獲取三維圖像的深度信息類似,例如,具體可以如下:
該遮擋獲取單元405,具體可以用于獲取預(yù)設(shè)的遮擋模型,根據(jù)該特征點(diǎn)和歐拉角對(duì)該遮擋模型進(jìn)行調(diào)整,使得該遮擋模型與該對(duì)象能夠匹配;提取該遮擋模型在匹配狀態(tài)下的深度信息,得到該遮擋模型的深度信息。
比如,該遮擋獲取單元405,具體可以用于獲取預(yù)設(shè)的遮擋模型,根據(jù)該特征點(diǎn)和歐拉角對(duì)該遮擋模型進(jìn)行縮放、旋轉(zhuǎn)和/或位移,使得該遮擋模型與該對(duì)象在大小、位置和角度上均能夠匹配。
其中,該遮擋模型可以根據(jù)該對(duì)象需要裸露的部分(即避免被三維圖像遮擋的部分)進(jìn)行設(shè)置,比如,以需要裸露的部分為人臉為例,則具體可以建立一個(gè)人頭的模型來(lái)作為該遮擋模型,等等。
需說(shuō)明的是,為了使得算法更為簡(jiǎn)便,以及提高處理效率,多個(gè)類型相同的不同對(duì)象可以使用同一遮擋模型。可選的,為了提高繪制的精確度,以及提高處理效果,還可以根據(jù)具體的對(duì)象來(lái)建立該遮擋模型,具體可參見(jiàn)前面的方法實(shí)施例,在此不再贅述。
由于并不是所有需要繪制的三維圖像均會(huì)對(duì)該對(duì)象造成遮擋,因此,可選的,為了提高靈活性,在獲取預(yù)設(shè)遮擋模型的深度信息之前,還可以對(duì)該三維圖像進(jìn)行判斷,若屬于預(yù)設(shè)類型,則需要遮擋模型,否則,則可以直接對(duì)該三維圖像進(jìn)行繪制;即如圖4b所示,該視頻處理裝置還可以包括確定單元407,如下:
該確定單元407,可以用于確定該三維圖像的類型是否滿足預(yù)設(shè)條件,若是,則觸發(fā)遮擋獲取單元405執(zhí)行獲取預(yù)設(shè)遮擋模型的深度信息的操作;若否,則觸發(fā)繪制單元404執(zhí)行基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像的操作。
具體實(shí)施時(shí),以上各個(gè)單元可以作為獨(dú)立的實(shí)體來(lái)實(shí)現(xiàn),也可以進(jìn)行任意組合,作為同一或若干個(gè)實(shí)體來(lái)實(shí)現(xiàn),以上各個(gè)單元的具體實(shí)施可參見(jiàn)前面的方法實(shí)施例,在此不再贅述。
由上可知,本實(shí)施例可以從采集到的視頻數(shù)據(jù)中,確定需要進(jìn)行處理的對(duì)象,然后,由檢測(cè)單元402檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,由獲取單元403根據(jù)這些特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,并由繪制單元404基于該深度信息在該對(duì)象上繪制三維圖像,從而達(dá)到在該圖像上添加三維圖像,比如三維物品效果的目的;該方案相對(duì)于現(xiàn)有方案只能添加二維動(dòng)態(tài)貼紙效果的方案而言,可以大大提高所添加效果與原圖的融合度,從而從整體上改善視頻處理質(zhì)量。
相應(yīng)的,本發(fā)明實(shí)施例還提供一種網(wǎng)絡(luò)設(shè)備,該網(wǎng)絡(luò)設(shè)備可以是終端,也可以是服務(wù)器。例如,如圖5所示,其示出了本發(fā)明實(shí)施例所涉及的網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖,具體來(lái)講:
該網(wǎng)絡(luò)設(shè)備可以包括一個(gè)或者一個(gè)以上處理核心的處理器501、一個(gè)或一個(gè)以上計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的存儲(chǔ)器502、電源503和輸入單元504等部件。本領(lǐng)域技術(shù)人員可以理解,圖5中示出的網(wǎng)絡(luò)設(shè)備結(jié)構(gòu)并不構(gòu)成對(duì)網(wǎng)絡(luò)設(shè)備的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。其中:
處理器501是該網(wǎng)絡(luò)設(shè)備的控制中心,利用各種接口和線路連接整個(gè)網(wǎng)絡(luò)設(shè)備的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器502內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)器502內(nèi)的數(shù)據(jù),執(zhí)行網(wǎng)絡(luò)設(shè)備的各種功能和處理數(shù)據(jù),從而對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行整體監(jiān)控。可選的,處理器501可包括一個(gè)或多個(gè)處理核心;優(yōu)選的,處理器501可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無(wú)線通信??梢岳斫獾氖牵鲜稣{(diào)制解調(diào)處理器也可以不集成到處理器501中。
存儲(chǔ)器502可用于存儲(chǔ)軟件程序以及模塊,處理器501通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器502的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲(chǔ)器502可主要包括存儲(chǔ)程序區(qū)和存儲(chǔ)數(shù)據(jù)區(qū),其中,存儲(chǔ)程序區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲(chǔ)數(shù)據(jù)區(qū)可存儲(chǔ)根據(jù)網(wǎng)絡(luò)設(shè)備的使用所創(chuàng)建的數(shù)據(jù)等。此外,存儲(chǔ)器502可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。相應(yīng)地,存儲(chǔ)器502還可以包括存儲(chǔ)器控制器,以提供處理器501對(duì)存儲(chǔ)器502的訪問(wèn)。
網(wǎng)絡(luò)設(shè)備還包括給各個(gè)部件供電的電源503,優(yōu)選的,電源503可以通過(guò)電源管理系統(tǒng)與處理器501邏輯相連,從而通過(guò)電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。電源503還可以包括一個(gè)或一個(gè)以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測(cè)電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。
該網(wǎng)絡(luò)設(shè)備還可包括輸入單元504,該輸入單元504可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號(hào)輸入。
盡管未示出,網(wǎng)絡(luò)設(shè)備還可以包括顯示單元等,在此不再贅述。具體在本實(shí)施例中,網(wǎng)絡(luò)設(shè)備中的處理器501會(huì)按照如下的指令,將一個(gè)或一個(gè)以上的應(yīng)用程序的進(jìn)程對(duì)應(yīng)的可執(zhí)行文件加載到存儲(chǔ)器502中,并由處理器501來(lái)運(yùn)行存儲(chǔ)在存儲(chǔ)器502中的應(yīng)用程序,從而實(shí)現(xiàn)各種功能,如下:
采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像。
例如,具體可以根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配,然后,提取該三維圖像在匹配狀態(tài)下的深度信息,得到該三維圖像的深度信息。
其中,特征點(diǎn)的設(shè)置和預(yù)設(shè)部位可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,以該對(duì)象為人像,則此時(shí),可以將特征點(diǎn)設(shè)置為人的五官,如眉毛、眼睛、鼻子、嘴巴和耳朵,以及人的臉部輪廓等,即處理器501還可以運(yùn)行存儲(chǔ)在存儲(chǔ)器502中的應(yīng)用程序,從而實(shí)現(xiàn)如下功能:
采用人臉檢測(cè)技術(shù)對(duì)該對(duì)象的面部進(jìn)行人臉識(shí)別,得到該對(duì)象的面部特征點(diǎn),以及對(duì)該對(duì)象的頭部姿勢(shì)進(jìn)行檢測(cè),得到該對(duì)象的頭部的歐拉角。其中,該面部特征點(diǎn)可以包括五官、以及臉部輪廓等特征點(diǎn)等。
可選的,為了避免所繪制的三維圖像對(duì)該對(duì)象造成遮擋,還可以根據(jù)該對(duì)象需要裸露的部分設(shè)置相匹配的遮擋模型,以便該三維圖像在繪制時(shí),能夠相應(yīng)地避開(kāi)該對(duì)象需要裸露的部分;即處理器501還可以運(yùn)行存儲(chǔ)在存儲(chǔ)器502中的應(yīng)用程序,從而實(shí)現(xiàn)如下功能:
獲取預(yù)設(shè)遮擋模型的深度信息,根據(jù)該預(yù)設(shè)遮擋模型的深度信息和三維圖像的深度信息對(duì)該遮擋模型和三維圖像進(jìn)行疊加,并將重合部分的顏色設(shè)置為透明,得到處理后深度信息,然后,根據(jù)處理后深度信息在該對(duì)象上繪制該三維圖像。
其中,獲取預(yù)設(shè)遮擋模型的深度信息與獲取三維圖像的深度信息類似,具體可參見(jiàn)前面的實(shí)施例,在此不再贅述。
以上各個(gè)操作的具體實(shí)施可參見(jiàn)前面的實(shí)施例,在此不再贅述。
由上可知,本實(shí)施例的網(wǎng)絡(luò)設(shè)備可以從采集到的視頻數(shù)據(jù)中,確定需要進(jìn)行處理的對(duì)象,然后,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)這些特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,并基于該深度信息在該對(duì)象上繪制三維圖像,從而達(dá)到在該圖像上添加三維圖像,比如三維物品效果的目的;該方案相對(duì)于現(xiàn)有方案只能添加二維動(dòng)態(tài)貼紙效果的方案而言,可以大大提高所添加效果與原圖的融合度,從而從整體上改善視頻處理質(zhì)量。
本領(lǐng)域普通技術(shù)人員可以理解,上述實(shí)施例的各種方法中的全部或部分步驟可以通過(guò)指令來(lái)完成,或通過(guò)指令控制相關(guān)的硬件來(lái)完成,該指令可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,并由處理器進(jìn)行加載和執(zhí)行。
為此,本發(fā)明實(shí)施例提供一種存儲(chǔ)介質(zhì),其中存儲(chǔ)有多條指令,該指令能夠被處理器進(jìn)行加載,以執(zhí)行本發(fā)明實(shí)施例所提供的任一種視頻處理方法中的步驟。例如,該指令可以執(zhí)行如下步驟:
采集視頻數(shù)據(jù),并從該視頻數(shù)據(jù)中確定需要進(jìn)行處理的對(duì)象,檢測(cè)該對(duì)象的特征點(diǎn)、以及該對(duì)象預(yù)設(shè)部位的歐拉角,根據(jù)該特征點(diǎn)和歐拉角獲取預(yù)設(shè)三維圖像的深度信息,基于該三維圖像的深度信息在該對(duì)象上繪制該三維圖像。
例如,具體可以根據(jù)該特征點(diǎn)和歐拉角對(duì)預(yù)設(shè)三維圖像進(jìn)行縮放、旋轉(zhuǎn)和/或位移等操作,使得該三維圖像與該對(duì)象在大小、位置和角度上均能夠匹配,然后,提取該三維圖像在匹配狀態(tài)下的深度信息,得到該三維圖像的深度信息。
其中,特征點(diǎn)的設(shè)置和預(yù)設(shè)部位可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,以該對(duì)象為人像,則此時(shí),可以將特征點(diǎn)設(shè)置為人的五官,如眉毛、眼睛、鼻子、嘴巴和耳朵,以及人的臉部輪廓等,即該指令還可以執(zhí)行如下步驟:
采用人臉檢測(cè)技術(shù)對(duì)該對(duì)象的面部進(jìn)行人臉識(shí)別,得到該對(duì)象的面部特征點(diǎn),以及對(duì)該對(duì)象的頭部姿勢(shì)進(jìn)行檢測(cè),得到該對(duì)象的頭部的歐拉角。其中,該面部特征點(diǎn)可以包括五官、以及臉部輪廓等特征點(diǎn)等。
可選的,為了避免所繪制的三維圖像對(duì)該對(duì)象造成遮擋,還可以根據(jù)該對(duì)象需要裸露的部分設(shè)置相匹配的遮擋模型,以便該三維圖像在繪制時(shí),能夠相應(yīng)地避開(kāi)該對(duì)象需要裸露的部分;即該指令還可以執(zhí)行如下步驟:
獲取預(yù)設(shè)遮擋模型的深度信息,根據(jù)該預(yù)設(shè)遮擋模型的深度信息和三維圖像的深度信息對(duì)該遮擋模型和三維圖像進(jìn)行疊加,并將重合部分的顏色設(shè)置為透明,得到處理后深度信息,然后,根據(jù)處理后深度信息在該對(duì)象上繪制該三維圖像。
以上各個(gè)操作的具體實(shí)施可參見(jiàn)前面的實(shí)施例,在此不再贅述。
其中,該存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器(rom,readonlymemory)、隨機(jī)存取記憶體(ram,randomaccessmemory)、磁盤或光盤等。
由于該存儲(chǔ)介質(zhì)中所存儲(chǔ)的指令,可以執(zhí)行本發(fā)明實(shí)施例所提供的任一種視頻處理方法中的步驟,因此,可以實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的任一種視頻處理方法所能實(shí)現(xiàn)的有益效果,詳見(jiàn)前面的實(shí)施例,在此不再贅述。
以上對(duì)本發(fā)明實(shí)施例所提供的一種視頻處理方法、裝置和存儲(chǔ)介質(zhì)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。