一種麥克風陣列聲源空間實時定位方法
【專利摘要】本發(fā)明一種麥克風陣列聲源空間實時定位方法,以麥克風陣列作為信號采集和輸出設備,通過使用可控功率響應?相位變換法初步給出聲源空間位置候選點;通過先驗知識進行初步的候選點篩選,并使用可控功率響應?相位變換法計算候選點的可控功率響應輸出;用改進的隨機區(qū)域收縮重新確定搜索邊界,提高可控功率響應?相位變換法的效率;最后計算剩余候選點的可控功率響應,選取最大的位置作為最終的聲源估計位置;本發(fā)明聲源定位原理明確,實時性好,實驗證明該方法在平面上的定位誤差范圍可控制在厘米量級上,性能優(yōu)于基于現(xiàn)有技術(shù)的方法;具有較高的運算速度和魯棒性,可應用于智能家居和智能機器人等需要進行實時聲源定位的場景。
【專利說明】
一種麥克風陣列聲源空間實時定位方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于語音技術(shù)領(lǐng)域,特別涉及一種麥克風陣列聲源空間實時定位方法。
【背景技術(shù)】
[0002] 語音處理技術(shù)中通常需要掌握聲源的空間位置信息,為聲紋識別、語音內(nèi)容識別 等交互技術(shù)提供幫助。例如,當用戶與智能機器人進行語音對話時,通常要確定人的空間位 置并進行轉(zhuǎn)向和靠近,即使在黑暗中也可以僅僅根據(jù)聲音確定用戶的具體方位,并自動靠 近說話人附近,提供必要的服務和幫助;在視頻會議中一般需要自動調(diào)整會議攝像頭,朝向 發(fā)言人,并能夠?qū)Σ煌l(fā)言人進行視頻切換。
[0003] 常見的用于聲源定位的設備是麥克風陣列,一般定義為:由多個(通常大于三個) 麥克風按照指定的幾何規(guī)則擺放并完全同步采集聲音信號的設備。目前麥克風陣列定位的 常用方法主要包括:基于到達時間差(Time Delay of Arrival,TD0A)的聲源定位,定位首 先通過時延估計得到聲源信號到達不同陣元的時間差,再通過麥克風陣列的幾何構(gòu)造進行 聲源位置判斷;基于可控功率響應(Steered Response Power,SRP)的聲源定位以及基于高 分辨率譜估計(High-resolution Spectral Estimation)的聲源定位等。
[0004] 1、到達時間差(Time Delay of Arrival,TD0A)法:
[0005] 該方法首先通過時延估計得到聲源信號到達不同陣元的時間差,再通過麥克風陣 列的幾何構(gòu)造進行聲源位置判斷。常用的時延估計方法是基于廣義互相關(guān)(Generalized Cross Correlation,GCC)法,其具體步驟為,設Xi( ω )和Χ」(ω )分別代表第i個麥克風接收 信號Xl(t)和第j個麥克風接收信號&(t)的傅里葉變換,則有如下等式:
[0009] 其中Ψ^(ω)表示兩個信號的互功率譜密度,表示兩個信號的互相關(guān)函數(shù), 為聲源到第i個麥克風與第j個麥克風之間的延時估計,W^( ω )是頻域加權(quán)系數(shù),當此加權(quán) 系數(shù)為1時,就是基本互相關(guān)。常用的頻域加權(quán)函數(shù)還有相位變換(PhAse Transform,ΡΗΑΤ) 加權(quán)、ROTH加權(quán)、最大似然加權(quán)、SCOT加權(quán)等,其中PHAT加權(quán)較為常用,因為基于廣義互相關(guān) 的時延估計信息隱藏在互功率譜的相位信息中,與幅度無關(guān),PHAT加權(quán)法則去除了幅度信 息的影響,使得相關(guān)函數(shù)峰值更加尖銳。PHAT加權(quán)函數(shù)公式為Wij( ω ) = 1/| Ψ^( ω ) |。
[0010] 上述基于到達時間差的定位方法原理簡單,計算效率高,但在較大的噪聲或混響 干擾下其時延估計性能急劇下降,因此不適用于低信噪比或高混響的聲學場景。此外,還有 一些時延估計方法,比如利用信息論中聯(lián)合熵和互信息,使用迭代方法,或者考慮不同信道 的非對稱性等方法,但在強混響和噪聲條件下,結(jié)果都不太理想,且部分方法計算速度緩 慢,比如迭代法等。
[0011 ] 2、可控功率響應-相位變換(Steered Response Power-PhAse Transform,SRP_ PHAT)法
[0012] 基于可控功率響應-相位變換的定位方法通過對全局空間進行搜索,找到最大可 控功率輸出的點,網(wǎng)格越小,搜索分辨率越高。其聲源定位原理如下:
[0013] 假定聲源位于s處,τι表示聲源到第i個麥克風的傳輸延遲。聲源s的可控功率響 應-相位變換輸出P PHAT( s)為:
[0015] 其中=不(α>)Χ;(ω)表示兩個信號的互功率譜密度,表示s處聲源到第j個 麥克風和第i個麥克風的時延差。估計的聲源位置:?為:
[0016] s = argmax ρ1'1"1 (Λ)
[0017] 經(jīng)過以上分析可以知道,SRP-PHAT算法的思路是假定空間中某一位置存在聲源, 然后求出該位置的基于相位加權(quán)的可控功率輸出,最終選取使得P PHAT(S)最大的空間位置8 作為估計出的聲源位置。但是SRP-PHAT的思路是先假定空間中某一位置有聲源,為了精確 定位出聲源信息,一般需要用網(wǎng)格搜索法,遍歷空間中所有的網(wǎng)格位置。假設搜索空間c長 寬高分別為X,Y,Z,網(wǎng)格間隔為δ,則網(wǎng)格點數(shù)N為:
[0019] 假定X = 3m,Y = 3m,Z = 2m,網(wǎng)格間隔δ = 〇·〇1πι,則網(wǎng)格點數(shù)Ν=301*301*201 = 18210801,也就是說要計算接近1800多萬個點的⑷,即使只有二維,也要計算301*301 = 90601次,因此效率很低。
[0020] 3、隨機區(qū)域收縮法
[0021 ]基于SRP-PHAT的隨機區(qū)域收縮(Stochastic Region Contraction,SRC)方法是Do H,Si lverman H F為了提高SRP-PHAT效率在2007年提出的一種算法,該算法主要思路是通 過隨機采樣,選取基于PHAT可控功率響應最大的一部分點,根據(jù)這部分點重新確定搜索邊 界,然后在新的區(qū)域內(nèi)重復上面操作,直至找到全局最大值。該算法魯棒性的前提是隨機采 樣時,錯失最高峰的概率幾乎為零,也就是沒有采樣到聲源所在位置的概率幾乎為零。假設 聲源體積為Vs,房間體積為Vr。?,則每次隨機米樣米到峰值的概率Phit為Phit = Vs/Vr。?,錯失 峰值概率pmis^phit = Vs/Vr_。假設第一次采樣共采集到Μ個點,則錯失峰值概率Pmiss(N)為 (從)=Λ!,同時,為了確保第一次采樣錯失峰值概率低于某個閾值Pthre,采樣點個數(shù)Μ 要滿足pmiss(Μ)彡pthre的條件,所以可以得到Μ 2 logp_ (Λ&?)。在一般情況下,取pthre = 0.005pthre3 = 0.001就能滿足魯棒性的需要。但是在該算法中由于采樣點完全是隨機的,對 于每個隨機采樣點都要計算相關(guān)向量,因此比計算該點的可控功率響應還要付出更多計算 代價。
[0022] 4、高分辨率譜估計法
[0023] 基于高分辨率譜估計的聲源定位方法借鑒了雷達陣列中的定位技術(shù),但是雷達信 號多為窄帶信號,相比之下語音信號頻帶較寬,因此這種方法的效果不盡理想。
[0024] 聲源定位在人機交互技術(shù)中有廣泛的應用,但是傳統(tǒng)方法無法同時達到高魯棒性 和實時的效果。
[0025] 可見,基于麥克風陣列的聲源定位方法已被廣泛研究,與其他方法相比,基于可控 功率響應的定位方法具有抗環(huán)境噪聲和混響干擾的優(yōu)勢,但其計算實時性較差,在實際應 用場景中難以發(fā)揮作用。
【發(fā)明內(nèi)容】
[0026] 為了克服上述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供一種麥克風陣列聲源空間 實時定位方法,其聲源定位原理明確,實時性好,實驗證明該方法在平面上的定位誤差范圍 可控制在厘米量級上,性能優(yōu)于基于現(xiàn)有技術(shù)的方法;本發(fā)明提出的基于麥克風陣列的聲 源空間實時定位方法具有較高的運算速度和魯棒性,可應用于智能家居和智能機器人等需 要進行實時聲源定位的場景。
[0027] 為了實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:
[0028] -種麥克風陣列聲源空間實時定位方法,包括以下步驟:
[0029] 首先,以麥克風陣列作為信號采集和輸出設備,通過使用可控功率響應-相位變換 (SRP-PHAT)法初步給出聲源空間位置候選點;
[0030] 其次,通過先驗知識進行初步的候選點篩選,并使用可控功率響應-相位變換 (SRP-PHAT)法計算候選點的可控功率響應輸出;
[0031] 隨后,用改進的隨機區(qū)域收縮(Stochastic Region Contraction,SRC)重新確定 搜索邊界,提高可控功率響應-相位變換法的效率;
[0032]最后,計算剩余候選點的可控功率響應,選取最大的位置作為最終的聲源估計位置。
[0033] 所述初步給出聲源空間位置候選點是指確定全部聲源的空間位置候選點,方法如下:
[0034] 假設待搜索空間c的長寬高分別為X,Y,Z,網(wǎng)格間隔為δ,則網(wǎng)格點數(shù) 即聲源空間位置的候選點為Ν個。
[0035] 所述初步的候選點篩選是指初步降低候選點數(shù)目,方法如下:
[0036] 假設麥克風陣列包含m個麥克風,則可得到位于s處的聲源到麥克風陣列的到達時 延向量TD0As= ,Tus,T2,3,s,T2,4,s,T3,4,s,......]丁,其中 , j, s = (di,s_dj, s )/V 為位于s處的聲源到第i個麥克風和第j個麥克風的時延,V表示空氣中聲音傳播速度,心^表 示位于S處的聲源到第i個麥克風的物理距離,dp表示位于S處的聲源到第j個麥克風的物 理距離;
[0037] 定義采樣點個數(shù)差(Sample number Difference,SD)向量為:
[0038] SDs= [sdl,2,s,sdl,3,s,sdl,4,s,sd2,3,s,sd2,4,s,sd3,4,s,......]τ
[0039] 當信號采樣頻率為fs時,有:
[0040] sdi,j,s = round(fs · Ti,j,s)
[0041] 其中round表示對每個元素向最近的方向取整,如果某些候選點所求出的采樣點 差向量SD等同,則只保留其中任意一個候選點,刪除其他候選點,避免重復計算;
[0042] 進一步求出每兩個候選點si,s2之間的采樣點個數(shù)差:
[0043] SDsi)s2 = abs(SDsi-SDs2)
[0044] 其中abs表示求取絕對值,并選出所有滿足max(SDsi,s2Xthreshold的候選點,只 保留其中任意一個候選點,刪除其他候選點,避免重復計算,Threshold定義為:
[0046] 其中,λ表示聲音波長。在采樣頻率fs為16000Hz時,設置threshold=l可以有效降 低候選點的個數(shù)。
[0047]在實際應用中,上述TD0A向量和采樣點差SD向量的計算,以及候選點的挑選需要 預先做好并存儲在一個查找表中,這樣在聲源定位時,只需根據(jù)索引查找即可,不用重復計 算。預先建立查找表也是提速的關(guān)鍵。
[0048] 所述候選點的可控功率響應輸出計算方法如下:
[0049] 假定篩選得到的候選點位于空間位置s處,Xd ω )和心(ω )分別代表第i個麥克風 接收信號Xi(t)和第j個麥克風接收信號Xj(t)的傅里葉變換表示聲源到第i個麥克風的 傳輸延遲,τ#表示s處聲源到第j個麥克風和第i個麥克風的時延差,根據(jù)可控功率響應-相 位變換法的定義,可得聲源s的可控功率響應輸出P PHAT(s)為:
[0051 ]其中'⑷)= ??)<(?)表示兩者之間的互功率譜密度,m為麥克風的總個數(shù),對 所有篩選得到的候選點計算P?AT(s)。
[0052]所述重新確定搜索邊界是指用快速隨機區(qū)域收縮算法搜索全局最大值,方法如 下:
[0053]并非通過隨機采樣,而是對篩選得到的候選點(且其TD0A向量和采樣點差SD向量 都可以在第二步的查找表中直接得到)通過計算得到對應的可控功率響應輸出,選取前N個 最大值,在其對應的候選點中隨機選取Μ個,隨后從這些點出發(fā)重新確定搜索邊界,然后在 新的區(qū)域內(nèi)重復進行這種選取和搜索,直至滿足精度要求。
[0054] 所述Ν的值的選擇以及之后的隨機采樣Μ值的確定與具體的麥克風陣列形狀及房 間尺寸等有關(guān),Μ和Ν的選擇有很多策略,可選擇采用如下方式:
[0055] 方式一,選為定值,Μ也選為定值;例如在四元麥克風陣列條件下,一般來說Ν= 100 時效率和準確度達到最好,性能最佳。
[0056] 方式二,每次都根據(jù)上一次的Ν個候選點對應的可控功率響應輸出,挑選出其中比 均值大的可控功率響應輸出對應的候選點,其總數(shù)為Ν',如果N-Ν' <Ν',則在這些候選點中 隨機挑選N-Ν'個作為候選點;如果Ν-Ν'>Ν',則保留全部Ν'個候選點,這樣可以保證每次區(qū) 域收縮后,均值不斷增加,當這些候選點的可控功率響應輸出計算次數(shù)多于某個給定的閾 值時停止選取和搜索。
[0057] 通過這樣的方法得到的定位結(jié)果能夠滿足一般的精度要求。如果要更精確的定 位,則可以在最終確定的聲源結(jié)果附近小范圍內(nèi)使用網(wǎng)格法精確搜索;或者根據(jù)查找表,首 先得到若干可控功率響應輸出最大值的對應區(qū)域,找到這些區(qū)域附近網(wǎng)格中的所有候選 點,然后計算這些候選點的可控功率響應,選取最大的位置作為最終的聲源估計位置。 [0058]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
[0059] (1)本發(fā)明提出的通過先驗信息進行候選點初步篩除的方法,很大程度上降低了 基于候選點上的可控功率響應輸出的計算代價,可以適用于多種場景;
[0060] (2)本發(fā)明提出的將候選點位置相關(guān)向量預先保存在查找表中的方法,原理簡單, 計算代價低,可有效提高實時效果;
[0061] (3)本發(fā)明提出的兩種基于候選點再次精確搜索聲源位置的方法,可進一步提高 聲源定位的分辨率和精度,且計算復雜度較低,適用于硬件環(huán)境配置較低的設備和場景中。
[0062] 本發(fā)明提出基于麥克風陣列的聲源空間實時定位方法在對聲源信號進行空間定 位時,計算代價優(yōu)于現(xiàn)有技術(shù)水平。本發(fā)明的聲源定位方法具有應用廣泛、響應實時等優(yōu) 點,適用于智能機器人和智能家居等需要使用聲音進行準確定位的場景。
【附圖說明】
[0063] 圖1是基于麥克風陣列的聲源空間實時定位方法總體示意圖。
【具體實施方式】
[0064]下面結(jié)合附圖和實施例詳細說明本發(fā)明的實施方式。
[0065] 如圖1所示,本發(fā)明實施例的整個計算過程細節(jié)構(gòu)成如下:
[0066] 1、確定全部聲源的空間位置候選點
[0067] 假設待搜索空間c長寬高分別為X,Y,Z,網(wǎng)格間隔為δ,則網(wǎng)格點數(shù)N為:
[0069] 即聲源空間位置的候選點為Ν個。
[0070] 2、計算到達時延向量和采樣點差向量
[0071] 假設麥克風陣列包含m多4個麥克風,則可得到位于s處的聲源到麥克風陣列的到 達時延向量TD0As為:
[0072] TD0As= [Ti,2,s,T:i,3,s,T:i,4,s,T2,3,s,T2,4,s,T3,4,s,......]丁 (公式 2)
[0073] 其中11^5=((11,5-山,5)八為位于 8處的聲源到第1個麥克風和第」個麥克風的時延, 其中ν表示空氣中聲音傳播速度,cU,s表示位于s處的聲源到第i個麥克風的物理距離,山, s表 示位于s處的聲源到第j個麥克風的物理距離。
[0074]定義采樣點個數(shù)差向量SDsS:
[0075] SDs= [sdl,2,s,sdl,3,s,sdl,4,s,sd2,3,s,sd2,4,s,sd3,4,s,......]τ (公式 3)
[0076] 當信號采樣頻率為fs時,有:
[0077] SDi,j,s = round(fs · Ti,j,s) (公式4)
[0078] 其中round表示對每個元素向最近的方向取整,fs為采樣頻率。進一步求出每兩個 候選點si,s2之間的采樣點個數(shù)差:
[0079] SDsi,s2 = abs(SDsi-SDs2) (公式 5)
[0080] 其中abs表示求取絕對值。
[0081] 3、刪除部分候選點
[0082] 在上述第二步計算中,如果某些候選點用公式4所求出的采樣點差向量SD等同,則 只保留其中任意一個候選點,刪除其他候選點,避免重復計算。并對剩下的候選點通過公式 5再次計算,選出所有滿足max(SD si,S2Xthreshold的候選點,只保留其中任意一個候選點, 刪除其他候選點,避免重復計算。此處Threshold定義為:
[0084] 其中,λ表示聲音波長。在采樣頻率fs為16000Hz時,設置threshold=l可以有效降 低候選點的個數(shù)。
[0085]另外,在實際應用中,上述TD0A向量和采樣點差SD向量的計算,以及候選點的挑選 需要預先做好并存儲在一個查找表中,這樣在聲源定位時,只需根據(jù)索引查找即可,不用重 復計算。預先建立查找表也是提速的關(guān)鍵。
[0086] 4、計算候選點的可控功率響應輸出
[0087] 假定上述步驟完成后得到的候選點位于空間位置s處,&( ω )和心(ω )分別代表第 i個麥克風接收信號Xi(t)和第j個麥克風接收信號Xj(t)的傅里葉變換表示聲源到第i個 麥克風的傳輸延遲,τ#表示s處聲源到第j個麥克風和第i個麥克風的時延差。根據(jù)可控功率 響應-相位變換法的定義,可得聲源s的可控功率輸出P PHAT(s)為:
[0089] 其中1/(叻=夂(叫<(?)表示兩者之間的互功率譜密度。對所有第二步得到的候 選點計算P PHAT(S)。
[0090] 5、確定Μ和N,重新確定搜索邊界
[0091] 對通過上述步驟計算得到對應的PPHAT(s),選取前Ν個最大值,在其對應的候選點 中隨機選取Μ個,隨后從這些點出發(fā)重新確定搜索邊界。
[0092] Ν的值如何選擇以及之后的隨機采樣Μ和Ν值的確定與具體的麥克風陣列形狀及房 間尺寸等有關(guān)。Μ和Ν的選擇有很多策略,最簡單的是固定Μ和Ν為確定值。例如在四元麥克風 陣列條件下,一般來說Ν=100時效率和準確度達到最好,性能最佳。另一種選擇Ν的策略是, 每次都根據(jù)上一次的Ν個候選點對應的P PHAT(s)挑選出其中比均值大的PPHAT(s)對應的候選 點,其總數(shù)為N ',如果N-N '彡N',則在這些候選點中隨機挑選N-N '個作為候選點;如果N-N ' > Ν',則保留全部Ν'個候選點。這樣可以保證每次區(qū)域收縮后,均值不斷增加。當這些候選點 的PPHAT(s)計算次數(shù)多于某個給定的閾值時停止選取和搜索。
[0093] 6、重復進行這種選取和搜索,直至滿足精度要求后輸出候選點
[0094] 在上述步驟完成后,得到新的搜素區(qū)域,在此區(qū)域內(nèi)重復進行這種選取和搜索,直 至滿足精度要求,隨后輸出這些滿足要求的候選點。通過這樣的方法得到的定位結(jié)果能夠 滿足一般的精度要求。
[0095] 7、進一步用網(wǎng)格法或查表法實現(xiàn)更精細的定位
[0096] 如果要更精確的定位,則可以在最終確定的聲源結(jié)果附近小范圍內(nèi)使用網(wǎng)格法精 確搜索;或者根據(jù)查找表,首先得到若干PPHAT(s)最大值的對應區(qū)域,找到這些區(qū)域附近網(wǎng) 格中的所有候選點,然后計算這些候選點的可控功率響應,選取最大的位置作為最終的聲 源估計位置。
【主權(quán)項】
1. 一種麥克風陣列聲源空間實時定位方法,其特征在于,包括W下步驟: 首先,W麥克風陣列作為信號采集和輸出設備,通過使用可控功率響應-相位變換 (SRP-PHAT)法初步給出聲源空間位置候選點; 其次,通過先驗知識進行初步的候選點篩選,并使用可控功率響應-相位變換(SRP- PHAT)法計算候選點的可控功率響應輸出; 隨后,用改進的隨機區(qū)域收縮(Stochastic Region Contraction,SRC)重新確定捜索 邊界,提高可控功率響應-相位變換法的效率; 最后,計算剩余候選點的可控功率響應,選取最大的位置作為最終的聲源估計位置。2. 根據(jù)權(quán)利要求1所述麥克風陣列聲源空間實時定位方法,其特征在于,所述初步給出 聲源空間位置候選點是指確定全部聲源的空間位置候選點,方法如下: 假設待捜索空間C的長寬高分別為Χ,Υ,Ζ,網(wǎng)格間隔為δ,則網(wǎng)格點曼即聲源空間位置的候選點為Ν個。3. 根據(jù)權(quán)利要求1所述麥克風陣列聲源空間實時定位方法,其特征在于,所述初步的候 選點篩選是指初步降低候選點數(shù)目,方法如下: 假設麥克風陣列包含m個麥克風,則可得到位于S處的聲源到麥克風陣列的到達時延向 重 TDOAs 二[Tl,2,s,T!,3,s,Tl,4,s,T2,3,s,T2,4,s,T3,4,s,......]了,其中 Ti,j,s = ( cli, ji-dj, s )/v為位 于S處的聲源到第i個麥克風和第j個麥克風的時延,V表示空氣中聲音傳播速度,di,s表示位 于S處的聲源到第i個麥克風的物理距離,山,S表示位于S處的聲源到第j個麥克風的物理距 離; 定義采樣點個數(shù)差(Sample number Difference,SD)向量為: SDs= [sdl,2,s,sdl,3,s,sdl,4,s,sd2,3,s,sd2,4,s,sd3,4,s,......]了 當信號采樣頻率為fs時,有: sdi,j,s = round(fs · Ti'j's) 其中round表示對每個元素向最近的方向取整,如果某些候選點所求出的采樣點差向 量SD等同,則只保留其中任意一個候選點,刪除其他候選點,避免重復計算; 進一步求出每兩個候選點si,s2之間的采樣點個數(shù)差: SDsi, s2 二 abs (SDs 廣 SDs2 ) 其中abs表示求取絕對值,并選出所有滿足max(SDsl,s2)《threshold的候選點,只保留 其中任意一個候選點,刪除其他候選點,避免重復計算,Threshold定義為:其中,λ表示聲音波長。4. 根據(jù)權(quán)利要求3所述麥克風陣列聲源空間實時定位方法,其特征在于,所述采樣頻率 f S為 16000Hz時,設置 threshold = 1。5. 根據(jù)權(quán)利要求3所述麥克風陣列聲源空間實時定位方法,其特征在于,所述TD0A向量 和采樣點差SD向量的計算W及候選點的挑選,預先做好并存儲在一個查找表中,在聲源定 位時,直接根據(jù)索引查找,不用重復計算。6. 根據(jù)權(quán)利要求3所述麥克風陣列聲源空間實時定位方法,其特征在于,所述候選點的 可控功率響應輸出計算方法如下: 假定篩選得到的候選點位于空間位置S處,Xi( ω )和、(ω )分別代表第i個麥克風接收 信號xi(t)和第j個麥克風接收信號x^t)的傅里葉變換,τι表示聲源到第i個麥克風的傳輸 延遲,表示S處聲源到第j個麥克風和第i個麥克風的時延差,根據(jù)可控功率響應-相位變 換法的定義,可得聲源S的可控功率響應輸出pPHAT(s)為:其中寧,,加')=抑蛛1>'")表示兩者之間的互功率譜密度,"1為麥克風的總個數(shù),對所有 篩選得到的候選點計算pPHAT(s)。7. 根據(jù)權(quán)利要求1所述麥克風陣列聲源空間實時定位方法,其特征在于,所述重新確定 捜索邊界是指用快速隨機區(qū)域收縮算法捜索全局最大值,方法如下: 對篩選得到的候選點通過計算得到對應的可控功率響應輸出,選取前N個最大值,在其 對應的候選點中隨機選取Μ個,隨后從運些點出發(fā)重新確定捜索邊界,然后在新的區(qū)域內(nèi)重 復進行運種選取和捜索,直至滿足精度要求。8. 根據(jù)權(quán)利要求7所述麥克風陣列聲源空間實時定位方法,其特征在于,所述Ν的值的 選擇W及之后的隨機采樣Μ值的確定與具體的麥克風陣列形狀及房間尺寸有關(guān),Ν的值的選 擇采用如下方式: 方式一,選為定值,Μ也選為定值; 方式二,每次都根據(jù)上一次的Ν個候選點對應的可控功率響應輸出,挑選出其中比均值 大的可控功率響應輸出對應的候選點,其總數(shù)為Ν',如果Ν-Ν'《Ν',則在運些候選點中隨機 挑選Ν-Ν'個作為候選點;如果Ν-Ν'〉Ν',則保留全部Ν'個候選點,當運些候選點的可控功率 響應輸出計算次數(shù)多于某個給定的闊值時停止選取和捜索。9. 根據(jù)權(quán)利要求8所述麥克風陣列聲源空間實時定位方法,其特征在于,所述方式一 中,在四元麥克風陣列條件下,選擇Ν=100時。10. 根據(jù)權(quán)利要求1所述麥克風陣列聲源空間實時定位方法,其特征在于,在最終確定 的聲源結(jié)果附近小范圍內(nèi)使用網(wǎng)格法精確捜索;或者根據(jù)查找表,首先得到若干可控功率 響應輸出最大值的對應區(qū)域,找到運些區(qū)域附近網(wǎng)格中的所有候選點,然后計算運些候選 點的可控功率響應,選取最大的位置作為最終的聲源估計位置。
【文檔編號】G01S5/18GK106093864SQ201610391351
【公開日】2016年11月9日
【申請日】2016年6月3日 公開號201610391351.9, CN 106093864 A, CN 106093864A, CN 201610391351, CN-A-106093864, CN106093864 A, CN106093864A, CN201610391351, CN201610391351.9
【發(fā)明人】楊毅, 孫甲松
【申請人】清華大學