国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      聲源定位方法和裝置的制作方法

      文檔序號(hào):5867615閱讀:184來源:國(guó)知局
      專利名稱:聲源定位方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及多媒體通信領(lǐng)域的音頻處理技術(shù),特別涉及一種聲源定位方法。

      背景技術(shù)
      聲源定位技術(shù)指的是估計(jì)除聲源所在的位置。聲源定位技術(shù)有著廣泛的應(yīng)用,例如在視頻會(huì)議系統(tǒng)中,可采樣聲源定位技術(shù)估計(jì)出說話人所在的位置,然后控制攝像機(jī)鏡頭指向說話人所在的位置,實(shí)行聲控切換功能。聲源定位技術(shù)也可以應(yīng)用到監(jiān)控、語音增強(qiáng)等領(lǐng)域。
      下面對(duì)現(xiàn)有的SRP(steered response power)以及SRP-PHAT(phasetrans form)聲源定位技術(shù)進(jìn)行介紹。
      如圖3所示,lps對(duì)應(yīng)聲源,l1和l2對(duì)應(yīng)兩個(gè)麥克風(fēng),如麥克風(fēng)。從聲源lps到兩個(gè)麥克風(fēng)l1和l2的時(shí)延分別用TOF(lps,l1)和TOF(lps,l1)表示。兩個(gè)麥克風(fēng)之間收到的信號(hào)分別為x1(t)和x2(t),則x1(t+TOF(lps,l1))∝x2(t+TOF(lps,l2)),其中 fs是采樣頻率,c是聲速。
      同時(shí),對(duì)應(yīng)的兩個(gè)麥克風(fēng)信號(hào)之間的時(shí)延τ有如下的定義,當(dāng)τ=TOF(lps,l1)-TOF(lps,l2)時(shí),x1(t)和x2(t)的時(shí)域互相關(guān)函數(shù)g(x1,x2)具有最大值,g(x1,x2)=∫Rx1(t)·x2(t+τ)dε。
      對(duì)于任一麥克風(fēng)對(duì)q,它們的位置對(duì)應(yīng)(laq,lbq),聲源lps到達(dá)麥克風(fēng)對(duì)q的理論到達(dá)時(shí)延差(TDOA,Time-difference of arrival)為 SRP方法通過估計(jì)空間上的功率譜分布,找出功率最大的空間位置,該位置即為聲源的位置。SRP最基本的公式如下 其中,在l位置的聲源被各個(gè)麥克風(fēng)拾取后,在時(shí)間上對(duì)齊并累加的和信號(hào)為 由于受到不同聲源之間的信號(hào)幅度、以及不同頻率成分大小的影響,采用上面方法的效果并不好。因此現(xiàn)有公開文獻(xiàn)中對(duì)該基本方法進(jìn)行了改進(jìn),改進(jìn)的方法是將各個(gè)聲源采集的時(shí)域信號(hào)變換到頻域,然后將各個(gè)頻譜的幅度進(jìn)行歸一化,這樣可以消除各個(gè)頻譜幅度大小不一致的影響,該改進(jìn)的算法在現(xiàn)有文獻(xiàn)中稱之為SRP-PHAT法,下面對(duì)該方法進(jìn)行描述。
      對(duì)采集到的t時(shí)刻開始的2NF個(gè)時(shí)域信號(hào)X(t)進(jìn)行FFT變換,得到 則公式(1)可以變換為 對(duì)公式(2)各個(gè)頻率成分的幅度進(jìn)行歸一化,則得到SRP-PHAT法的計(jì)算公式 上述SRP和SRP-PHAT法實(shí)際上都是在聲源陣列周圍的空間中放置多個(gè)預(yù)定點(diǎn),然后計(jì)算各個(gè)預(yù)定點(diǎn)的功率值或修正的功率值,其最大值處所在位置即為聲源所在位置。
      但是在實(shí)際應(yīng)用環(huán)境中,聲源定位的準(zhǔn)確性受到環(huán)境噪聲、干擾聲、混響等因素的影響較大,SRP和SRP-PHAT法均無法有效克服。


      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種更加穩(wěn)健的聲源定位方法和裝置,用以克服現(xiàn)有技術(shù)中的聲源定位的準(zhǔn)確性易受到環(huán)境噪聲等因素干擾的影響。
      本發(fā)明一個(gè)實(shí)施例提供一種聲源定位方法,包括采集聲源時(shí)域信號(hào);將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào);根據(jù)所述頻域信號(hào)確定頻率的空間功率譜;根據(jù)所述空間功率譜確定頻率的空間功率概率;根據(jù)空間概率分布確定概率最大的空間位置,作為聲源位置。
      本發(fā)明的另一個(gè)實(shí)施例提供一種生源定位裝置,包括采集單元,用于采集聲源時(shí)域信號(hào);轉(zhuǎn)換單元,用于將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào);功率確定單元,用于根據(jù)所述頻域信號(hào)確定頻率的空間功率譜;概率確定單元,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布;定位單元,用于根據(jù)空間概率分布確定概率最大的空間位置。
      本發(fā)明的實(shí)施例運(yùn)用空間功率概率分布確定聲源,可以提高聲源陣列在噪聲、混響等環(huán)境下的定位準(zhǔn)確性。



      圖1是本發(fā)明的聲源定位方法的流程圖; 圖2是本發(fā)明的聲源定位裝置的結(jié)構(gòu)示意圖; 圖3是現(xiàn)有聲源定位方法的說明圖。

      具體實(shí)施例方式 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清晰易懂,下面結(jié)合附圖,對(duì)本發(fā)明做進(jìn)一步詳細(xì)說明。在此,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,但并不作為對(duì)本發(fā)明的限定。
      實(shí)施例一 本實(shí)施例提供一種生源定位方法。如圖1所示,該方法包括 步驟101采集聲源時(shí)域信號(hào); 在該步驟中,可以通過多個(gè)麥克風(fēng)采集聲源的時(shí)域信號(hào)x1,x2,…,xNm。
      步驟102將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào); 在該步驟中,將多個(gè)麥克風(fēng)采集的時(shí)域信號(hào)為x1,x2,…,XNm轉(zhuǎn)換為頻域信號(hào)為X1,X2,…,XNm。時(shí)域信號(hào)到頻域信號(hào)的變換方法通常傅里葉變換(FFT),也可以采用其他常用變換,例如余弦變換(DCT)。
      步驟103根據(jù)所述頻域信號(hào)確定頻率的空間功率譜; 在該步驟中,根據(jù)下式確定頻率的空間功率譜, 步驟104根據(jù)所述空間功率譜確定頻率的空間功率概率分布; 在該步驟中,先確定單個(gè)頻率的空間功率概率分布,然后再確定多個(gè)頻率的空間功率概率分布。對(duì)于某個(gè)頻率來說,其功率在空間上呈一定的分布,不同的頻率分布差別較大,很顯然不同分布的頻率對(duì)定位的貢獻(xiàn)是不一樣??梢愿鶕?jù)下面的公式確定單個(gè)頻率的空間功率概率分布, 其中,

      表示第k個(gè)頻率l位置上出現(xiàn)聲源的概率。
      將各單個(gè)頻率的空間功率概率分布求和得到多個(gè)概率的空間功率分布。或者,將各單個(gè)頻率的空間功率概率分布加權(quán)求和得到多個(gè)頻率的空間功率分布,各單個(gè)頻率的空間功率概率分布的權(quán)重隨頻率受噪音干擾影響的程度增大而減小。具體可以根據(jù)下面的公式計(jì)算多個(gè)頻率的空間功率概率分布, 其中,wk是各單個(gè)頻率的空間功率概率分布的權(quán)重,隨單個(gè)頻率的信號(hào)幅值增大而增大。
      步驟105根據(jù)空間概率分布確定概率最大的空間位置。
      在該步驟中,可以根據(jù)下面的公式按當(dāng)前幀確定概率最大的空間位置, 或者,根據(jù)下面的公式按多幀確定概率最大的空間位置, 其中,

      是當(dāng)前幀的頻率的空間功率概率分布,

      是前一幀的頻率的空間功率概率分布,

      是前T幀的頻率的空間功率概率分布,α1為前一幀的衰減系數(shù),αT是前T幀的衰減系數(shù)。
      本發(fā)明實(shí)施例依據(jù)某個(gè)頻率在某個(gè)空間位置呈現(xiàn)尖銳的概率分布,則在該位置出現(xiàn)音源的概率較大,反之則出現(xiàn)的概率較小的現(xiàn)象,對(duì)現(xiàn)有的聲源定位方法進(jìn)行改進(jìn),從而減小了環(huán)境噪聲、干擾聲、混響等因素對(duì)定位準(zhǔn)確性的影響,提高了定位的準(zhǔn)確性。
      實(shí)施例二 本實(shí)施例提供一種聲源定位裝置。如圖2所示,該裝置200包括 采集單元201,用于采集聲源時(shí)域信號(hào); 轉(zhuǎn)換單元202,用于將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào); 功率確定單元203,用于根據(jù)所述頻域信號(hào)的確定頻率的空間功率譜; 概率確定單元204,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布; 定位單元205,用于根據(jù)空間概率分布確定概率最大的空間位置。
      采集單元201,如多個(gè)麥克風(fēng),采集聲源的時(shí)域信號(hào)x1,x2,…,xNm。轉(zhuǎn)換單元202,如邏輯電路,將多個(gè)麥克風(fēng)采集的時(shí)域信號(hào)為x1,x2,…,xNm轉(zhuǎn)換為頻域信號(hào)為X1,X2,…,XNm。時(shí)域信號(hào)到頻域信號(hào)的變換方法通常傅里葉變換(FFT),也可以采用其他常用變換(請(qǐng)舉例)。功率確定單元203根據(jù)下面公式將頻域信號(hào)X1,X2,…,XNm確定頻率的空間功率譜概率確定單元204包括單頻率概率確定模塊214和多頻率概率確定模塊224,在根據(jù)所述空間功率譜確定頻率的空間功率概率分布市,先由單頻率概率確定模塊214確定單個(gè)頻率的空間功率概率分布,再由多頻率概率確定模塊224確定多個(gè)頻率的空間功率概率分布。單頻率概率確定模塊214根據(jù)下面的公式確定單個(gè)頻率的空間功率概率分布, 其中,

      表示第k個(gè)頻率l位置上出現(xiàn)聲源的概率。
      多頻率概率確定模塊224可以將各單個(gè)頻率的空間功率概率分布求和得到多個(gè)概率的空間功率分布?;蛘撸囝l率概率確定模塊224可以將各單個(gè)頻率的空間功率概率分布加權(quán)求和得到多個(gè)頻率的空間功率分布,各單個(gè)頻率的空間功率概率分布的權(quán)重隨頻率受噪音干擾影響的程度增大而減小。多頻率概率確定模塊224具體可以根據(jù)下面的公式計(jì)算多個(gè)頻率的空間功率概率分布, 其中,wk是各單個(gè)頻率的空間功率概率分布的權(quán)重,隨單個(gè)頻率的信號(hào)幅值增大而增大。
      最后,定位單元205根據(jù)下面的公式按當(dāng)前幀確定概率最大的空間位置, 或者,定位單元205根據(jù)下面的公式按多幀確定概率最大的空間位置, 其中,

      是當(dāng)前幀的頻率的空間功率概率分布,

      是前一幀的頻率的空間功率概率分布,

      是前T幀的頻率的空間功率概率分布,α1為前一幀的衰減系數(shù),αT是前T幀的衰減系數(shù)。
      本發(fā)明實(shí)施例依據(jù)某個(gè)頻率在某個(gè)空間位置呈現(xiàn)尖銳的概率分布,則在該位置出現(xiàn)音源的概率較大,反之則出現(xiàn)的概率較小的現(xiàn)象,對(duì)現(xiàn)有的聲源定位方法進(jìn)行改進(jìn),從而減小了環(huán)境噪聲、干擾聲、混響等因素對(duì)定位準(zhǔn)確性的影響,提高了定位的準(zhǔn)確性。
      以上所述的具體描述,對(duì)發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實(shí)施例而已,并不用于限定本發(fā)明的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1.一種聲源定位方法,其特征在于,該方法包括
      采集聲源時(shí)域信號(hào);
      將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào);
      根據(jù)所述頻域信號(hào)確定頻率的空間功率譜;
      根據(jù)所述空間功率譜確定頻率的空間功率概率分布;
      根據(jù)空間概率分布確定概率最大的空間位置,以概率最大的空間位置作為聲源位置。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述空間功率譜確定頻率的空間功率概率分布的步驟包括
      確定單個(gè)頻率的空間功率概率分布;
      確定多個(gè)頻率的空間功率概率分布。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于根據(jù)下面的公式確定單個(gè)頻率的空間功率概率分布,
      其中,
      (k,l,X1t,...,XNmt)表示第k個(gè)頻率l位置上出現(xiàn)聲源的概率,表示k個(gè)頻率l位置上的空間功率譜。
      4.根據(jù)權(quán)利要求2所述的方法,其特征在于將各單個(gè)頻率的空間功率概率分布求和得到多個(gè)概率的空間功率分布。
      5.根據(jù)權(quán)利要求2所述的方法,其特征在于將各單個(gè)頻率的空間功率概率分布加權(quán)求和得到多個(gè)頻率的空間功率分布,各單個(gè)頻率的空間功率概率分布的權(quán)重隨頻率受噪音干擾影響的程度增大而減小。
      6.根據(jù)權(quán)利要求2所述的方法,其特征在于根據(jù)下面的公式計(jì)算多個(gè)頻率的空間功率概率分布,
      其中,wk是各單個(gè)頻率的空間功率概率分布的權(quán)重。
      7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于所述單個(gè)頻率的空間功率概率分布的權(quán)重隨單個(gè)頻率的信號(hào)幅值增大而增大。
      8.根據(jù)權(quán)利要求1所述的方法,其特征在于根據(jù)下面的公式按當(dāng)前幀確定概率最大的空間位置,
      9.根據(jù)權(quán)利要求1所述的方法,其特征在于根據(jù)下面的公式按多幀確定概率最大的空間位置,
      其中,
      (ALL,l,X1t,...,XNmt)是當(dāng)前幀的頻率的空間功率概率分布,
      (ALL,l,X1t-Δt,...,XNmt-Δt)是前一幀的頻率的空間功率概率分布,
      (ALL,l,X1t-Δt*T,...,XNmt-Δt*T)是前T幀的頻率的空間功率概率分布,α1為前一幀的衰減系數(shù),αT是前T幀的衰減系數(shù)。
      10.一種聲源定位裝置,其特征在于,該裝置包括
      采集單元,用于采集聲源時(shí)域信號(hào);
      轉(zhuǎn)換單元,用于將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào);
      功率確定單元,用于根據(jù)所述頻域信號(hào)確定頻率的空間功率譜;
      概率確定單元,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布;
      定位單元,用于根據(jù)空間概率分布確定概率最大的空間位置,以概率最大的空間位置作為聲源位置。
      11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述概率確定單元包括
      單頻率概率確定模塊,用于確定單個(gè)頻率的空間功率概率分布;
      多頻率概率確定模塊,用于確定多個(gè)頻率的空間功率概率分布。
      全文摘要
      本發(fā)明涉及一種聲源定位方法和裝置,方法包括采集聲源時(shí)域信號(hào);將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào);根據(jù)所述頻域信號(hào)確定頻率的空間功率譜;根據(jù)所述空間功率譜確定頻率的空間功率概率。裝置包括采集單元,用于采集聲源時(shí)域信號(hào);轉(zhuǎn)換單元,用于將所述時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào);功率確定單元,用于根據(jù)所述頻域信號(hào)確定頻率的空間功率譜;概率確定單元,用于根據(jù)所述空間功率譜確定頻率的空間功率概率分布;定位單元,用于根據(jù)空間概率分布確定概率最大的空間位置。本發(fā)明運(yùn)用空間功率概率分布確定聲源,可以提高聲源陣列在噪聲、混響等環(huán)境下的定位準(zhǔn)確性。
      文檔編號(hào)G01S5/18GK101762806SQ201010105118
      公開日2010年6月30日 申請(qǐng)日期2010年1月27日 優(yōu)先權(quán)日2010年1月27日
      發(fā)明者詹五洲, 王東琦 申請(qǐng)人:華為終端有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1