一種基于多麥的視頻會議攝像頭定位方法
【專利摘要】本發(fā)明提供一種基于多麥的視頻會議攝像頭定位方法,所述多麥包括至少3個相對位置不變的通道,所述方法包括如下步驟:有遠(yuǎn)程的聲音發(fā)出時,采集各通道的回聲數(shù)據(jù),確定能量值最大的主回聲通道及其與主回聲線的位置關(guān)系;利用主回聲通道的位置確定麥克參考位置;有近端的聲音發(fā)出時,采集各通道的聲音能量值,置確定當(dāng)前發(fā)言者位置方向;根據(jù)當(dāng)前發(fā)言者位置方向確定攝像頭方向。本發(fā)明根據(jù)多麥各通道的位置信息以及當(dāng)前接收到的聲音能量,判斷發(fā)言人位置,設(shè)計簡單靈活,計算簡便,無性能方面的消耗,自動調(diào)節(jié)攝像頭的跟蹤角度,保證當(dāng)前會議主發(fā)言人在攝像頭的拾取范圍內(nèi),提升會議效果。
【專利說明】一種基于多麥的視頻會議攝像頭定位方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及視頻通訊【技術(shù)領(lǐng)域】,尤其涉及一種基于多麥的視頻會議攝像頭定位方 法。
【背景技術(shù)】
[0002] 目前視頻會議越來越普及,在遠(yuǎn)程會議或遠(yuǎn)程教育等商務(wù)活動中也發(fā)揮著越來越 重要的溝通作用,傳統(tǒng)的視頻會議系統(tǒng)的麥克與攝像頭是獨立的,為了達(dá)到與說話人面對 面的效果,經(jīng)常需要手動調(diào)整攝像頭的位置,造成不便。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明要解決的技術(shù)問題,在于提供一種基于多麥的視頻會議攝像頭定位方法, 實現(xiàn)攝像頭跟蹤說話人位置自動調(diào)整方向,保證當(dāng)前發(fā)言人能在攝像頭的拾取范圍內(nèi),提 升會議的體驗效果。
[0004] 本發(fā)明是這樣實現(xiàn)的:一種基于多麥的視頻會議攝像頭定位方法,所述多麥包括 至少3個通道,且各通道相對位置不變,所述方法包括如下步驟:
[0005] 步驟10、有遠(yuǎn)程的聲音發(fā)出時,聲音播放方向形成一不可見的主回聲線,采集各通 道的回聲數(shù)據(jù),確定能量值最大的通道為主回聲通道,計算主回聲通道與主回聲線的位置 關(guān)系;
[0006] 步驟20、利用主回聲通道的位置確定麥克參考位置;
[0007] 步驟30、有近端的聲音發(fā)出時,采集各通道的聲音能量值,確定能量最強(qiáng)的通道為 主通道,并根據(jù)麥克參考位置計算主通道位置,再根據(jù)主通道位置確定當(dāng)前發(fā)言者位置;
[0008] 步驟40、根據(jù)當(dāng)前發(fā)言者位置獲得攝像頭正確的位置,旋轉(zhuǎn)攝像頭到正確位置上 上。
[0009] 進(jìn)一步的,所述步驟10具體為:有電視上的音響發(fā)出聲音時,聲音播放方向形 成一不可見的主回聲線,采集各通道的回聲能量值,計算通道i的回聲能量值公式為: Engecho (i) = Σ cap (i, j)2,其中,cap (i, j)是通道i在采樣點j的采樣值;計算各個通道 的能量值后對能量值大小進(jìn)行排序,取能量值前3的通道L、I1和i 2,且取其中最大能量值 對應(yīng)的通道L為主回聲通道,根據(jù)這3個通道的能量值間的關(guān)系確定主回聲通道L到麥克 中心的連線與主回聲線的夾角τ為:
[0010]
【權(quán)利要求】
1. 一種基于多麥的視頻會議攝像頭定位方法,其特征在于:所述多麥包括至少3個通 道,且各通道相對位置不變,所述方法包括如下步驟: 步驟10、有遠(yuǎn)程的聲音發(fā)出時,聲音播放方向形成一不可見的主回聲線,采集各通道 的回聲數(shù)據(jù),確定能量值最大的通道為主回聲通道,計算主回聲通道與主回聲線的位置關(guān) 系; 步驟20、利用主回聲通道的位置確定麥克參考位置; 步驟30、有近端的聲音發(fā)出時,采集各通道的聲音能量值,確定能量最強(qiáng)的通道為主通 道,并根據(jù)麥克參考位置計算主通道位置,再根據(jù)主通道位置確定當(dāng)前發(fā)言者位置; 步驟40、根據(jù)當(dāng)前發(fā)言者位置獲得攝像頭正確的位置,旋轉(zhuǎn)攝像頭到正確位置上。
2. 根據(jù)權(quán)利要求1所述的一種基于多麥的視頻會議攝像頭定位方法,其特征在于:所 述步驟10具體為:有電視上的音響發(fā)出聲音時,聲音播放方向形成一不可見的主回聲線, 采集各通道的回聲能量值,計算通道i的回聲能量值公式為:Engecho(i)=Σcap(i,j)2, 其中,cap(i,j)是通道i在采樣點j的采樣值;計算各個通道的能量值后對能量值大小進(jìn) 行排序,取能量值前3的通道L、I1和i2,且取其中最大能量值對應(yīng)的通道L為主回聲通 道,根據(jù)這3個通道的能量值間的關(guān)系確定主回聲通道L到麥克中心的連線與主回聲線的 夾角τ為:
3. 根據(jù)權(quán)利要求2所述的一種基于多麥的視頻會議攝像頭定位方法,其特征在于:所 述多麥為4麥,即所述多麥有4個相對位置確定的通道,這4個通道關(guān)于麥克中心對稱。
4. 根據(jù)權(quán)利要求3所述的一種基于多麥的視頻會議攝像頭定位方法,其特征在于:所 述步驟20具體為:所述4個通道按逆時針方向標(biāo)為mic0、micl、mic2和mic3,以micO為其 他通道的麥克參考位置,根據(jù)τ確定micO到麥克中心的連線與主回聲線的夾角Θ為:Θ = 180° -((4-?〇)*90° +τ)0
5. 根據(jù)權(quán)利要求4所述的一種基于多麥的視頻會議攝像頭定位方法,其特征在于:所 述步驟30進(jìn)一步包括: 步驟31、有近端的聲音發(fā)出時,采集各通道的聲音能量值,計算通道i的回聲能量值公 式為:Engecho(i) =Σcap(i,j)2,其中,cap(i,j)是通道i在采樣點j的采樣值;對能量 值大小進(jìn)行排序,取能量值最大的通道'判斷通道i〇相對micO的位置,即micO到麥克中 心的連線與最大通道i〇的順時針方向的夾角為:Y= (4-iJ*90° ; 步驟32、根據(jù)γ的值與Θ的值計算主通道位置,從而確定當(dāng)前發(fā)言者位置,即當(dāng)前發(fā) 言者位置到麥克中心的連線與主回聲線的夾角α近似為:α=Υ +θ;把α的范圍調(diào)整 到-180?180度:
6. 根據(jù)權(quán)利要求5所述的一種基于多麥的視頻會議攝像頭定位方法,其特征在于:所 述步驟40中獲得攝像頭正確的位置具體為:假設(shè)當(dāng)前發(fā)言者到麥克的距離等于攝像頭到 麥克的距離,則根據(jù)α值計算攝像頭與主回聲線的夾角β,β值近似為:β=α/2。
【文檔編號】G05D3/12GK104238576SQ201410474230
【公開日】2014年12月24日 申請日期:2014年9月17日 優(yōu)先權(quán)日:2014年9月17日
【發(fā)明者】畢永建 申請人:廈門億聯(lián)網(wǎng)絡(luò)技術(shù)股份有限公司