專(zhuān)利名稱(chēng):一種基于立體聲信號(hào)的移動(dòng)音源定位方法
技術(shù)領(lǐng)域:
本發(fā)明屬于聲學(xué)技術(shù)領(lǐng)域,特別是涉及一種基于立體聲信號(hào)的移動(dòng)音源定位方 法。
背景技術(shù):
聽(tīng)覺(jué)研究表明,在神經(jīng)中樞對(duì)輸入聲信息進(jìn)行整合時(shí),對(duì)音源定位最重要的依據(jù) 是兩耳之間聲音信號(hào)的差別,通常用空間線(xiàn)索ITD(耳間時(shí)間差)和ILD(耳間聲級(jí)差)兩 個(gè)概念來(lái)描述這種差別。從音源到達(dá)雙耳的音源信號(hào)由于聲波傳輸路程存在差異,從而產(chǎn)生到達(dá)雙耳的時(shí) 間偏移稱(chēng)為ITD(耳間時(shí)間差),其提供了有關(guān)音源方位角位置信息。此外,諸如人頭、軀干 和耳廓的衍射、折射及共振效應(yīng)等使得到達(dá)兩檢測(cè)器接收信號(hào)強(qiáng)度存在差異,稱(chēng)為ILD(耳 間聲級(jí)差),ILD隨著音源位置而系統(tǒng)變化,同樣提供了音源方位角位置信息。ITD和ILD以互補(bǔ)的方式工作,具體來(lái)說(shuō),對(duì)頻率小于1. 5kHz的低頻信號(hào)ITD對(duì)定 位起主要作用,而當(dāng)頻率大于1. 5kHz時(shí)ILD對(duì)定位起主要作用。ILD對(duì)高頻信號(hào)起主要作 用是因?yàn)楦哳l信號(hào)的衰減特性,在聲源信號(hào)傳至雙耳的路徑中,除了空氣的吸收外,人的頭 部就相當(dāng)于一個(gè)障礙物,高頻信號(hào)將因此被衰減。當(dāng)頻率低于約1. 5kHz時(shí),聲波波長(zhǎng)大于 人的頭部寬度,聲波將產(chǎn)生所謂的“頭部衍射”而沿著頭部表面彎曲,從而繞過(guò)了這一遮擋 物,使得聲音信號(hào)傳到左耳的強(qiáng)度比右耳沒(méi)有衰減或衰減很小,因此空間線(xiàn)索ILD的定位 作用就很不明顯了 ;ITD是基于頻率特性而產(chǎn)生兩耳信號(hào)時(shí)間上的差異,由于聽(tīng)覺(jué)系統(tǒng)所 感知的其實(shí)是耳間的相位差I(lǐng)PD(Interaural Phase Differences),所以ITD實(shí)際上通過(guò) IPD起作用,當(dāng)信號(hào)頻率小于1. 5kHz時(shí),由于其半波長(zhǎng)大于兩耳間的距離,所以人耳很容易 感知這種相位差并判別其相對(duì)關(guān)系,而當(dāng)頻率大于1. 5kHz時(shí),其波長(zhǎng)小于兩耳間距,此時(shí) 將會(huì)產(chǎn)生IPD判決模糊,人耳無(wú)法辨別信號(hào)相位從而導(dǎo)致ITD沒(méi)有明顯定位作用?;贗TD和ILD音源定位互補(bǔ)特性,目前國(guó)際上通?;贗TD和ILD對(duì)音源方位 進(jìn)行聯(lián)合估計(jì),即基于音源位置、ITD和ILD間的相關(guān)先驗(yàn)知識(shí),通過(guò)聯(lián)合學(xué)習(xí)方法以實(shí)現(xiàn) 音源方位定位,但這種方法只適用于靜止音源,對(duì)于移動(dòng)音源,當(dāng)其以較快速度移動(dòng)時(shí)由于 多普勒效應(yīng)的存在會(huì)使音源的接受頻率發(fā)生變化,而ILD與頻率緊密相關(guān),一旦音源頻率 發(fā)聲變化,原先的先驗(yàn)知識(shí)便不再適用,從而使對(duì)音源方位的估計(jì)產(chǎn)生偏差。因此目前本領(lǐng) 域一個(gè)比較重要的問(wèn)題是如何針對(duì)移動(dòng)音源設(shè)計(jì)相應(yīng)的ITD和ILD聯(lián)合音源定位修正方 法,消除由于多普勒效應(yīng)所帶來(lái)的定位偏差問(wèn)題。
發(fā)明內(nèi)容
考慮到上述現(xiàn)有技術(shù)的已知解決方案的缺陷,本發(fā)明的目的是提供一種根據(jù)立體 聲信號(hào)進(jìn)行移動(dòng)音源定位的改進(jìn)技術(shù)。為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為一種基于立體聲信號(hào)的移動(dòng)音源定位方 法,基于ITD測(cè)量和ILD測(cè)量實(shí)現(xiàn)移動(dòng)音源定位,所述ITD測(cè)量和ILD測(cè)量獲取方式為,對(duì)立體聲檢測(cè)器所生成的兩路時(shí)域信號(hào)進(jìn)行預(yù)處理,分別得到兩路頻域信號(hào),利用兩路頻域 信號(hào)分別計(jì)算各個(gè)頻帶的ITD測(cè)量和ILD測(cè)量;預(yù)先在各個(gè)已知的音源位置對(duì)ITD測(cè)量和 ILD測(cè)量分別進(jìn)行學(xué)習(xí),得到ITD頻率對(duì)位置矩陣和ILD頻率對(duì)位置矩陣;在對(duì)特定時(shí)間步 中的移動(dòng)音源進(jìn)行音源位置定位時(shí),進(jìn)行以下步驟,步驟1,獲取某特定時(shí)間步的ITD測(cè)量和ILD測(cè)量;步驟2,將步驟1所得特定時(shí)間步的ITD測(cè)量和ITD頻率對(duì)位置矩陣進(jìn)行比較,將 步驟ι所得特定時(shí)間步的ILD測(cè)量與ILD頻率對(duì)位置矩陣分別進(jìn)行比較,從而針對(duì)各個(gè)頻 帶獲得音源位置的概率分布,分別構(gòu)成ITD概率分布矩陣和ILD概率分布矩陣;步驟3,將步驟2所得ITD概率分布矩陣和ILD概率分布矩陣進(jìn)行組合,獲得用于 在該特定時(shí)間步進(jìn)行音源位置定位的聯(lián)合概率分布;步驟4,基于多普勒效應(yīng)對(duì)步驟3所得的聯(lián)合概率分布進(jìn)行修正,獲得修正結(jié)果;步驟5,應(yīng)用信息論過(guò)程,根據(jù)步驟4所得對(duì)聯(lián)合概率分布的修正結(jié)果,在該特定 時(shí)間步提取對(duì)于音源位置的最佳估計(jì)。而且,步驟3中,對(duì)ITD概率分布矩陣和ILD概率分布進(jìn)行組合取決于音源位置參數(shù)。而且,步驟4中,對(duì)聯(lián)合概率分布的修正實(shí)現(xiàn)方式為,通過(guò)音源移動(dòng)速度計(jì)算頻率 遷移量來(lái)修正用于音源定位的聯(lián)合概率分布。本發(fā)明技術(shù)方案使用信息論過(guò)程來(lái)產(chǎn)生可以與后續(xù)測(cè)量進(jìn)行組合的預(yù)測(cè),以改善 基于時(shí)間的移動(dòng)音源定位,并追蹤并跟隨移動(dòng)音源。
圖1為本發(fā)明實(shí)施例的流程圖;圖2為本發(fā)明實(shí)施例的學(xué)習(xí)步驟設(shè)置示意圖。
具體實(shí)施例方式下面以實(shí)施例結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案作進(jìn)一步說(shuō)明。本發(fā)明實(shí)施例提供的方位角移動(dòng)音源定位方法,參見(jiàn)附圖1,包括以下步驟Si. 1 雙耳檢測(cè);SL 2:預(yù)處理;Si. 3 計(jì)算 ITD 和 ILD 測(cè)量;Si. 4 基于ITD測(cè)量對(duì)頻率對(duì)位置矩陣進(jìn)行學(xué)習(xí);Si. 5 基于ILD測(cè)量對(duì)頻率對(duì)位置矩陣進(jìn)行學(xué)習(xí);Si. 6 ITD 矩陣比較;Si. 7 ILD 矩陣比較;Si. 8 將ITD和ILD概率分布矩陣進(jìn)行組合;Si. 9 聯(lián)合概率分布修正;Si. 10 位置估計(jì)。學(xué)習(xí)和定位都要獲取ITD和ILD測(cè)量,實(shí)施例通過(guò)Si. USl. 2和Si. 3實(shí)現(xiàn)。Si. 1 具體實(shí)施時(shí),參見(jiàn)附圖2,根據(jù)立體聲檢測(cè)器LO (即具有至少兩個(gè)獨(dú)立的聲音傳感器Ll和L2)檢測(cè)立體聲信號(hào)1,來(lái)對(duì)音源位置S進(jìn)行定位,得到立體聲檢測(cè)器所生成的兩路時(shí)域信 號(hào)。Si. 2具體實(shí)施時(shí),對(duì)立體聲信號(hào)1的兩路時(shí)域信號(hào)分別進(jìn)行時(shí)_頻變換,得到兩路頻 域信號(hào)2。Si. 3具體實(shí)施時(shí),利用相關(guān)算法基于兩路頻域信號(hào)2對(duì)每個(gè)時(shí)間步的ITD測(cè)量 3和ILD測(cè)量4進(jìn)行計(jì)算。對(duì)于ITD,可以通過(guò)SSD(方差和)或標(biāo)準(zhǔn)相關(guān)系數(shù)等方法來(lái)計(jì) 算點(diǎn)態(tài)比較;對(duì)于ILD,可以通過(guò)對(duì)頻域信號(hào)的對(duì)數(shù)預(yù)處理之后計(jì)算絕對(duì)值范數(shù)的差來(lái)進(jìn) 行該運(yùn)算。區(qū)別在于,學(xué)習(xí)過(guò)程所用的是不同已知音源位置的ITD和ILD測(cè)量結(jié)果;定位過(guò) 程只知道特定時(shí)間步的ITD和ILD測(cè)量結(jié)果,該特定時(shí)間步中的未知音源位置需通過(guò)比較 學(xué)習(xí)結(jié)果得到。實(shí)施例的學(xué)習(xí)過(guò)程包括Si. 4和Si. 5。Si. 4和Si. 5具體實(shí)施時(shí),對(duì)于不同的音源 位置S,對(duì)ITD頻率對(duì)位置矩陣和ILD頻率對(duì)位置矩陣進(jìn)行學(xué)習(xí),通過(guò)監(jiān)控的方式來(lái)進(jìn)行學(xué) 習(xí)而獲得先驗(yàn)知識(shí),這表示在學(xué)習(xí)過(guò)程中音源位置S是已知的。對(duì)ITD和ILD測(cè)量分別進(jìn) 行該學(xué)習(xí)步驟,并且得到ITD和ILD基準(zhǔn)頻率對(duì)位置矩陣,這些矩陣代表用于所有可能頻率 的特定位置S。附圖2給出了實(shí)際中是如何學(xué)習(xí)的,以特定方位位置(如圖2所示,實(shí)施例 取不同方位角)來(lái)布置音源S,然后從音源S播放聲音信號(hào),并且計(jì)算頻率對(duì)位置矩陣。對(duì) 相同位置的所有矩陣(每個(gè)位置包括ITD矩陣和ILD矩陣2個(gè)矩陣)取均值,以獲得通用 的ITD頻率對(duì)位置矩陣5和ILD頻率對(duì)位置矩陣6,這是一種貝葉斯處理過(guò)程。對(duì)于所有選 中的位置S進(jìn)行此過(guò)程,在學(xué)習(xí)步驟中只需處理少數(shù)用于學(xué)習(xí)的離散位置,例如平均分布 在方位角面上的離散位置。在預(yù)先進(jìn)行學(xué)習(xí)后,需要對(duì)某特定時(shí)間步中的移動(dòng)音源定位,以獲取未知的音源 位置時(shí),實(shí)施例的定位過(guò)程進(jìn)行以下步驟Si. 6和Si. 7具體實(shí)施時(shí),針對(duì)各個(gè)頻道,將所測(cè)得的位置未知的音源的ITD測(cè)量 3和ILD測(cè)量4與所學(xué)習(xí)的頻率對(duì)位置矩陣5、6分別進(jìn)行比較,以獲取音源位置的ITD概率 分布矩陣7和ILD概率分布矩陣8 ;Si. 8具體實(shí)施時(shí),將ITD概率分布矩陣7和ILD概率分布矩陣8進(jìn)一步進(jìn)行組合, 以獲得用于音源定位的聯(lián)合概率分布9??梢愿鶕?jù)音源位置參數(shù)來(lái)進(jìn)行ITD概率分布矩陣7 和ILD概率分布矩陣8的組合,為實(shí)現(xiàn)此目的,將矩陣中的每一個(gè)概率分布解釋為用于測(cè)量 的條件概率,該條件概率以頻率,提示(ITD/ILD)和位置為條件,即概率分布中包含3個(gè)變 量——頻率,ITD/ILD和音源位置;基于頻率和提示的邊緣化導(dǎo)致僅以位置為條件的概率;Si. 9具體實(shí)施時(shí),可以根據(jù)音源在各個(gè)時(shí)間步角度的變化估計(jì)音源的移動(dòng)速度, 進(jìn)而基于多普勒效應(yīng)公式計(jì)算音源的頻率遷移量,從而在用于音源定位的聯(lián)合概率分布9 中減去這部分頻率遷移量的影響,得到修正結(jié)果,即修正聯(lián)合概率分布10 ;Si. 10具體實(shí)施時(shí),將信息理論過(guò)程應(yīng)用于修正聯(lián)合概率分布10,以提取對(duì)于音 源位置的最佳估計(jì),即音源方位角估計(jì)11。例如,可以使用貝葉斯方法來(lái)獲取方位估計(jì)。為 此,必須利用先驗(yàn)(即學(xué)習(xí)所得ITD頻率對(duì)位置矩陣5和ILD頻率對(duì)位置矩陣6)和當(dāng)前用 作似然性的概率分布10來(lái)計(jì)算后驗(yàn)。然后可以利用諸如MAP(最大后驗(yàn))或匪SE(最小均 方誤差)的方法,根據(jù)后驗(yàn)來(lái)計(jì)算音源方位角估計(jì)11。具體實(shí)施時(shí),可以采用計(jì)算機(jī)軟件技術(shù)實(shí)現(xiàn)以上步驟的自動(dòng)執(zhí)行,也可以按照音 頻技術(shù)領(lǐng)域以硬件裝置形式提供實(shí)施應(yīng)用。凡符合本發(fā)明所提供技術(shù)方案精神的情況,包 括等同替換方案,都應(yīng)當(dāng)在本發(fā)明所要求保護(hù)范圍內(nèi)。
5
為便于實(shí)施參考起見(jiàn),本發(fā)明提供采用貝葉斯處理具體實(shí)現(xiàn)過(guò)程如下學(xué)習(xí)過(guò)程假定短時(shí)空間線(xiàn)索ITD構(gòu)成一個(gè)隨機(jī)過(guò)程,用隨機(jī)矢量^ (空間線(xiàn)索所在頻帶一 定時(shí)間上的集合)對(duì)其進(jìn)行描述,令Δ T,b為Bark帶b的ITD值(ITD測(cè)量),B為最高Bark 帶,即b取值為1至B,則ΔΓ=(ΔΓ1,ΔΓ2,...,ΔΓβ)⑴則ITD頻率對(duì)位置矩陣為PT,b(AT,b| λ) (1 彡 b 彡 B) (2)其中,λ標(biāo)識(shí)方向(如圖2所示音源位置S分別到聲音傳感器Ll和L2所構(gòu)成的 方向角),P用于標(biāo)識(shí)概率,Pt, b是表示在各個(gè)頻帶b上的ITD測(cè)量概率。公式(2)表達(dá)的 就是在每個(gè)頻帶上都有一個(gè)ITD的概率,共同構(gòu)成概率矩陣。假定短時(shí)空間線(xiàn)索ILD構(gòu)成一個(gè)隨機(jī)過(guò)程,用隨機(jī)矢量^ (空間線(xiàn)索所在頻帶一 定時(shí)間上的集合)對(duì)其進(jìn)行描述,令Δ u為Bark帶b的ILD值(ILD測(cè)量),B為最高Bark 帶,則⑶則ILD頻率對(duì)位置矩陣為PL,b(AL,b| λ) (1 彡 b 彡 B) (4)其中,Pu是表示在各個(gè)頻帶b上的ILD測(cè)量概率。定位過(guò)程^的概率密度函數(shù)基于統(tǒng)計(jì)音源在各個(gè)方向的空間線(xiàn)索而得。定義λ方向的概 率密度函數(shù)為μ),假設(shè)i的各個(gè)部分是統(tǒng)計(jì)獨(dú)立的,則ITD概率密度(ITD概率分布矩 陣)為Ρ(Ατ IΛ) = Υ\ΡΤ^(ΔΓι, μ)(5)
b=l的概率密度函數(shù)基于統(tǒng)計(jì)音源在各個(gè)方向的空間線(xiàn)索而得。定義λ方向的概 率密度函數(shù)為i^i I Λ),假設(shè)i的各個(gè)部分是統(tǒng)計(jì)獨(dú)立的,則ILD概率密度(ILD概率分布矩 陣)為P(AlIA) = flPL, (Al^A)(6)
b=\則聯(lián)合概率密度為Ρ(11 λ) = ρ(1τ I X)P(1L I a) = f\Pr,(Ar^ I X)f{PL,μ)(7)
b=\ b=\考慮到頻度對(duì)于空間線(xiàn)索ITD和ILD影響程度的不同,針對(duì)移動(dòng)音源,對(duì)聯(lián)合概率 密度計(jì)算方法進(jìn)行如下修正,以去除頻率對(duì)空間線(xiàn)索ILD的影響
B5_ADoppler=Π pLAKb \λ)(8)
其中,AD。pplCT為多普勒效應(yīng)帶來(lái)的頻率改變。根據(jù)信息論觀點(diǎn),通過(guò)空間線(xiàn)索來(lái)獲取方向信息可描述為貝葉斯最大后驗(yàn)概率似 然估計(jì),根據(jù)貝葉斯公式,在各個(gè)方向λ的條件概率密度為
權(quán)利要求
一種基于立體聲信號(hào)的移動(dòng)音源定位方法,其特征在于基于ITD測(cè)量和ILD測(cè)量實(shí)現(xiàn)移動(dòng)音源定位,所述ITD測(cè)量和ILD測(cè)量獲取方式為,對(duì)立體聲檢測(cè)器所生成的兩路時(shí)域信號(hào)進(jìn)行預(yù)處理,分別得到兩路頻域信號(hào),利用兩路頻域信號(hào)分別計(jì)算各個(gè)頻帶的ITD測(cè)量和ILD測(cè)量;預(yù)先在各個(gè)已知的音源位置對(duì)ITD測(cè)量和ILD測(cè)量分別進(jìn)行學(xué)習(xí),得到ITD頻率對(duì)位置矩陣和ILD頻率對(duì)位置矩陣;在對(duì)特定時(shí)間步中的移動(dòng)音源進(jìn)行音源位置定位時(shí),進(jìn)行以下步驟,步驟1,獲取某特定時(shí)間步的ITD測(cè)量和ILD測(cè)量;步驟2,將步驟1所得特定時(shí)間步的ITD測(cè)量和ITD頻率對(duì)位置矩陣進(jìn)行比較,將步驟1所得特定時(shí)間步的ILD測(cè)量與ILD頻率對(duì)位置矩陣分別進(jìn)行比較,從而針對(duì)各個(gè)頻帶獲得音源位置的概率分布,分別構(gòu)成ITD概率分布矩陣和ILD概率分布矩陣; 步驟3,將步驟2所得ITD概率分布矩陣和ILD概率分布矩陣進(jìn)行組合,獲得用于在該特定時(shí)間步進(jìn)行音源位置定位的聯(lián)合概率分布;步驟4,基于多普勒效應(yīng)對(duì)步驟3所得的聯(lián)合概率分布進(jìn)行修正,獲得修正結(jié)果;步驟5,應(yīng)用信息論過(guò)程,根據(jù)步驟4所得對(duì)聯(lián)合概率分布的修正結(jié)果,在該特定時(shí)間步提取對(duì)于音源位置的最佳估計(jì)。
2.根據(jù)權(quán)利要求1所述的移動(dòng)音源定位方法,其特征在于步驟3中,對(duì)ITD概率分布 矩陣和ILD概率分布進(jìn)行組合取決于音源位置參數(shù)。
3.根據(jù)權(quán)利要求1或2所述的移動(dòng)音源定位方法,其特征在于步驟4中,對(duì)聯(lián)合概率 分布的修正實(shí)現(xiàn)方式為,通過(guò)音源移動(dòng)速度計(jì)算頻率遷移量來(lái)修正用于音源定位的聯(lián)合概 率分布。
全文摘要
本發(fā)明為一種基于立體聲信號(hào)的移動(dòng)音源定位方法,包括對(duì)立體聲檢測(cè)器兩路時(shí)域信號(hào)進(jìn)行預(yù)處理得到兩路頻域信號(hào);利用兩路頻域信號(hào)計(jì)算各個(gè)頻帶的ITD和ILD測(cè)量;在各個(gè)音源位置對(duì)ITD和ILD測(cè)量分別進(jìn)行學(xué)習(xí),得到ITD頻率對(duì)位置學(xué)習(xí)矩陣和ILD頻率對(duì)位置學(xué)習(xí)矩陣;將所測(cè)得的ITD和ILD測(cè)量與所學(xué)習(xí)的矩陣分別進(jìn)行比較,將得到的ITD和ILD概率分布矩陣進(jìn)行組合,獲得用于音源定位的聯(lián)合概率分布;基于多普勒效應(yīng)對(duì)用于音源定位的聯(lián)合概率分布進(jìn)行修正;應(yīng)用信息論過(guò)程來(lái)提取音源位置的最佳預(yù)測(cè)。本發(fā)明針對(duì)移動(dòng)音源所獨(dú)有的多普勒效應(yīng)對(duì)基于ITD和ILD的音源方位聯(lián)合估計(jì)方法做出改進(jìn),可有效提升音源定位準(zhǔn)確率。
文檔編號(hào)G01S5/18GK101982793SQ20101051492
公開(kāi)日2011年3月2日 申請(qǐng)日期2010年10月20日 優(yōu)先權(quán)日2010年10月20日
發(fā)明者劉進(jìn)峰, 周成, 涂衛(wèi)平, 王國(guó)英, 王曉晨, 王松, 胡瑞敏, 董石, 高麗, 黃勇 申請(qǐng)人:武漢大學(xué)