播放裝置及音效調(diào)整方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻播放領(lǐng)域,具體涉及一種播放裝置及音效調(diào)整方法。
【背景技術(shù)】
[0002]立體聲是指具有立體感的聲音,它是一個(gè)幾何概念,指在三維空間中占有位置的事物。因?yàn)槁曉从写_定的空間位置,聲音有確定的方向來(lái)源,人們的聽(tīng)覺(jué)有辨別聲源方位的能力。特別是有多個(gè)聲源同時(shí)發(fā)聲時(shí),人們可以憑聽(tīng)覺(jué)感知各個(gè)聲源在空間的位置分布狀況。
[0003]從這個(gè)意義上講,自然界所發(fā)出的一切聲音都是立體聲,如雷聲、火車(chē)聲、風(fēng)聲、雨聲等等。當(dāng)人們直接聽(tīng)到這些立體空間中的聲音時(shí),除了能感受到聲音的響度、音調(diào)和音色夕卜,還能感受到它們的方位和層次。這種人們直接聽(tīng)到的具有方位層次等空間分布特性的聲音,稱(chēng)為自然界中的立體聲。
[0004]但是,在室內(nèi)場(chǎng)景中,如果要通過(guò)音響裝置來(lái)播放立體聲,就會(huì)存在精準(zhǔn)播放的問(wèn)題,該問(wèn)題是由于在室內(nèi)場(chǎng)景中,播放裝置無(wú)法感知聽(tīng)眾的存在位置而無(wú)法實(shí)現(xiàn)精準(zhǔn)的立體聲播放控制而導(dǎo)致的。
【發(fā)明內(nèi)容】
[0005]本發(fā)明要解決的技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種播放裝置及音效調(diào)整方法,能精準(zhǔn)的感知聽(tīng)眾的存在位置而實(shí)現(xiàn)精準(zhǔn)的立體聲播放。
[0006]本發(fā)明實(shí)施方式提供的播放裝置,與攝像裝置及音響裝置通訊,用于調(diào)整所述音響裝置的音效,其特征在于,所述播放裝置包括映射模塊、圖像分析模塊、坐標(biāo)計(jì)算模塊、音效調(diào)節(jié)模塊。映射模塊用于建立人臉在真實(shí)場(chǎng)景與所述攝像裝置所獲取的場(chǎng)景圖像中的三維映射系數(shù);圖像分析模塊用于通過(guò)所述攝像裝置獲取聽(tīng)眾所在場(chǎng)景的實(shí)時(shí)圖像,并從所述實(shí)時(shí)圖像分析出聽(tīng)眾的人臉在實(shí)時(shí)圖像中的相對(duì)位置及大??;坐標(biāo)計(jì)算模塊用于依據(jù)所述三維映射系數(shù)、所述聽(tīng)眾的人臉在實(shí)時(shí)圖像中的相對(duì)位置及大小計(jì)算出聽(tīng)眾在真實(shí)場(chǎng)景中的實(shí)時(shí)三維空間坐標(biāo);音效調(diào)整模塊用于依據(jù)所述聽(tīng)眾在真實(shí)場(chǎng)景中的實(shí)時(shí)三維空間坐標(biāo)為聽(tīng)眾實(shí)時(shí)調(diào)整所述音響裝置的音效。
[0007]本發(fā)明實(shí)施方式提供的音效調(diào)節(jié)方法,用于播放裝置中,所述播放裝置與攝像裝置及音響裝置通訊,其特征在于,所述音效調(diào)節(jié)方法包括:建立人臉在真實(shí)場(chǎng)景與所述攝像裝置所獲取的場(chǎng)景圖像中的三維映射系數(shù);通過(guò)所述攝像裝置獲取聽(tīng)眾的實(shí)時(shí)圖像;從所述實(shí)時(shí)圖像分析出聽(tīng)眾的人臉在實(shí)時(shí)圖像中的相對(duì)位置及大小;依據(jù)所述三維映射系數(shù)、所述聽(tīng)眾的人臉在實(shí)時(shí)圖像中的相對(duì)位置及大小計(jì)算出聽(tīng)眾在真實(shí)場(chǎng)景中的實(shí)時(shí)三維空間坐標(biāo);及依據(jù)所述聽(tīng)眾在真實(shí)場(chǎng)景中的實(shí)時(shí)三維空間坐標(biāo)為聽(tīng)眾實(shí)時(shí)調(diào)整所述音響裝置的音效。
[0008]本發(fā)明的有益效果在于,通過(guò)人臉偵測(cè)的技術(shù)來(lái)精準(zhǔn)的感知聽(tīng)眾的存在位置,達(dá)到更加精準(zhǔn)的控制立體聲播放的效果。
【附圖說(shuō)明】
[0009]下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,附圖中:
[0010]圖1是本發(fā)明實(shí)施方式的播放裝置的運(yùn)行環(huán)境示意圖;
[0011]圖2是本發(fā)明實(shí)施方式的播放裝置的功能模塊圖;
[0012]圖3是本發(fā)明實(shí)施方式的音效調(diào)整方法的流程圖;
[0013]圖4是圖3所示的步驟S300的一實(shí)施例的細(xì)化流程圖;
[0014]圖5是圖3所示的步驟S308的一實(shí)施例的細(xì)化流程圖。
【具體實(shí)施方式】
[0015]現(xiàn)結(jié)合附圖,對(duì)本發(fā)明的較佳實(shí)施例作詳細(xì)說(shuō)明。
[0016]如圖1所示,本實(shí)施方式提供的播放裝置10與攝像裝置20及音響裝置30通訊,用于調(diào)整所述音響裝置30的音效。在本實(shí)施方式中,播放裝置10可以為家庭影院、電視機(jī)頂盒、唱戲機(jī)等產(chǎn)品,攝像裝置20可外接于播放裝置10,如擺放在播放裝置10的頂部,亦可內(nèi)嵌于播放裝置10。音響裝置30可為藍(lán)牙音箱、WIFI音箱等產(chǎn)品。音響裝置30可以為一個(gè),也可以為多個(gè)。本實(shí)施方式中的播放裝置10可根據(jù)聽(tīng)眾40的具體位置為聽(tīng)眾40調(diào)整音響裝置30的音效。其中,聽(tīng)眾40可以為一人,也可以為多人,播放裝置10會(huì)選擇一人為其調(diào)整音響裝置30的音效。
[0017]圖2是本發(fā)明實(shí)施方式的播放裝置10的功能模塊圖。在本實(shí)施方式中,播放裝置10包括映射模塊100、圖像分析模塊102、坐標(biāo)計(jì)算模塊104、音效調(diào)節(jié)模塊106。
[0018]映射模塊100用于建立人臉在真實(shí)場(chǎng)景與攝像裝置20所獲取的場(chǎng)景圖像中的三維映射系數(shù)。在本實(shí)施方式中,真實(shí)場(chǎng)景是指真實(shí)的環(huán)境。攝像裝置20獲取的場(chǎng)景圖像是指攝像裝置20所拍攝的場(chǎng)景的圖像,這圖像中包括人臉。
[0019]首先,播放裝置10的用戶(hù)需要先行在真實(shí)場(chǎng)景中選定一個(gè)三維空間,并為播放裝置10做初始化設(shè)置,用戶(hù)第一次使用播放裝置10時(shí)才需要做此設(shè)置,第二次使用時(shí)不需做此設(shè)置。在本實(shí)施方式中,三維空間可以依據(jù)播放裝置10所提供的方式來(lái)選擇,播放裝置10可以提供多種選擇方式,比如可以攝像裝置20所在的位置為基準(zhǔn)選擇播放裝置10所在的平面與房間地面所在的平面作為三維空間。當(dāng)然,在實(shí)際計(jì)算過(guò)程中,還有很多其他的方式來(lái)選擇三維空間,但具體的計(jì)算原則類(lèi)似,這里的選擇僅作舉例之用。
[0020]用戶(hù)以選擇的三維空間為基準(zhǔn),量測(cè)一個(gè)真實(shí)人臉在真實(shí)場(chǎng)景中的三維空間坐標(biāo)(XI,Yl, Zl),并輸入到播放裝置10。
[0021]映射模塊100接收到用戶(hù)輸入的一個(gè)真實(shí)人臉在真實(shí)場(chǎng)景中的預(yù)設(shè)置的三維空間坐標(biāo)(X1,Y1,Z1)。
[0022]映射模塊100通過(guò)攝像裝置20獲取所述真實(shí)人臉處于三維空間坐標(biāo)(XI,Yl, Zl)時(shí)的場(chǎng)景圖像。由于需要適應(yīng)使用者的不同姿勢(shì),所以需要實(shí)現(xiàn)多角度的人臉偵測(cè)。
[0023]映射模塊100依據(jù)所述真實(shí)人臉的場(chǎng)景圖像分析得出所述真實(shí)人臉在場(chǎng)景圖像中的相對(duì)位置(xl,yl)及大小(hi)。在本實(shí)施方式中,所述真實(shí)人臉在圖像中的相對(duì)位置(xl,yI)、人臉寬度及高度可通過(guò)常用的人臉偵測(cè)技術(shù)得出,在此不做贅述,其中,所述真實(shí)人臉在圖像中的大小(hi)可采用人臉寬度、人臉高度或人臉面積等數(shù)據(jù)。
[0024]映射模塊100依據(jù)所述真實(shí)人臉在圖像中的相對(duì)位置(xl,yl)及大小(hi)與所述真實(shí)人臉的預(yù)設(shè)置的三維空間坐標(biāo)(X1,Y1,Z1)計(jì)算出所述三維映射系數(shù)(αχ, ay, a z)。在本實(shí)施方式中,可以采用以下公式來(lái)計(jì)算三維映射系統(tǒng):a χ = Χ1/χ1,a y = Yl/yl,a z = Zl/hl。映射模塊100所完成的功能只在用戶(hù)設(shè)置后才運(yùn)行,并非每次打開(kāi)播放裝置10都需要運(yùn)行。
[0025]播放裝置10打開(kāi),進(jìn)入正常播放狀態(tài)。圖像分析模塊102通過(guò)攝像裝置20獲取聽(tīng)眾40的實(shí)時(shí)圖像。具體而言,攝像裝置20獲取視頻圖像,獲取的視頻圖像是普通的YUV數(shù)據(jù)或者RGB彩色圖像數(shù)據(jù),然后檢測(cè)視頻圖像中的人臉,檢測(cè)方法可以采用目前常用的人臉檢測(cè)方法,如SVM,ADAB00ST,膚色等。
[0026]聽(tīng)眾40從攝像裝置20前走過(guò)或者坐在某一特別位置,圖像分析模塊102會(huì)依據(jù)時(shí)間間隔獲取聽(tīng)眾40所在場(chǎng)景的圖像,產(chǎn)生一系列圖像。如果偵測(cè)到用戶(hù)在移動(dòng),則獲取時(shí)間間隔可以更小一些,而如果偵測(cè)到用戶(hù)位置變動(dòng)不大,則獲取時(shí)間間隔可以設(shè)置得大
——止匕
~、O
[0027]圖像分析模塊102從所述實(shí)時(shí)圖像分析出聽(tīng)眾的人臉在圖像中的相對(duì)位置(x2,y2)及大小(h2)。在本實(shí)施方式中,在有多個(gè)聽(tīng)眾40存在時(shí),攝像裝置20獲取到同時(shí)存在多個(gè)聽(tīng)眾40的實(shí)時(shí)圖像,圖像分析模塊102偵測(cè)出每一個(gè)聽(tīng)眾的人臉大小,然后選擇最大的人臉大小來(lái)計(jì)算聽(tīng)眾40的實(shí)時(shí)三維空間坐標(biāo)。
[0028]坐標(biāo)計(jì)算模塊104依據(jù)三維映射系數(shù)(ax, ay, a z)、聽(tīng)眾40的人臉在圖像中的相對(duì)位置(x2,y2)及大小(h2)計(jì)算出聽(tīng)眾40在真實(shí)場(chǎng)景中的實(shí)時(shí)三維空間坐標(biāo)(X2,Y2,Ζ2)。在本實(shí)施方式中,可以采用以下方式計(jì)算三維空間坐標(biāo):(Χ2 = a χ*χ2,Υ2 = a y*y2,Z2 = a z*h2) o
[0029]音效調(diào)整模塊106用于依據(jù)聽(tīng)眾40在真實(shí)場(chǎng)景中的實(shí)時(shí)三維空間坐標(biāo)(X2,Y2,Z2)為聽(tīng)眾40實(shí)時(shí)調(diào)整音響裝置30的音效。
[0030]在本實(shí)施方式中,用戶(hù)除了需要輸入真實(shí)人臉的三維空間坐標(biāo)(X1,Y1,Z1)之外,還需要量測(cè)每一個(gè)音響裝置30所在的三維空間坐標(biāo)(Χ3,Υ3, Ζ3)并輸入到播放裝置10,同時(shí),還可以依據(jù)三維空間原點(diǎn)的選擇來(lái)輸入攝像裝置20的三維坐標(biāo)。這次輸入也只是在用戶(hù)首次使用播放裝置10時(shí)才需要,再次使用不需設(shè)置,若變更了音響裝置30的位置就需要重新設(shè)置一下。
[0031]在本實(shí)施方式中,音效調(diào)整模塊106接收用戶(hù)輸入的音響裝置30的三維空間坐標(biāo)(Χ3, Υ3, Ζ3),然后根據(jù)音響裝置30的三維空間坐標(biāo)(Χ