一種基于麥克風(fēng)陣列的聲目標(biāo)分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于麥克風(fēng)陣列的聲目標(biāo)分類方法,特別是涉及一種采用麥克風(fēng) 陣列將聲目標(biāo)的聲音信號(hào)特征和聲目標(biāo)的空間特征相結(jié)合的分類方法。屬于聲目標(biāo)識(shí)別分 類技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 利用聲音信號(hào)來對(duì)目標(biāo)進(jìn)行分類一直是模式識(shí)別領(lǐng)域一個(gè)十分重要的課題。相 比較單麥克風(fēng),麥克風(fēng)陣列富含更多的信息。利用這些信息可以實(shí)現(xiàn)聲目標(biāo)的定位,聲信 號(hào)的增強(qiáng)以及干擾的抑制。在目前的利用麥克風(fēng)陣列來對(duì)聲目標(biāo)進(jìn)行分類的方法大部分 集中于這樣的架構(gòu):先用波束形成對(duì)聲音信號(hào)進(jìn)行增強(qiáng),然后將增強(qiáng)后的信號(hào)送入分類器。 在這種架構(gòu)下,用于波束形成的方法的主要有最小方差無畸變響應(yīng)(Minimum variance distortionless response, MVDR)和延時(shí)-求和(Delay and Sum)等。
[0003] MVDR雖然能夠較好的抑制來自其它方向上的干擾,但是一方面由于有矩陣求逆操 作,計(jì)算量相對(duì)較大,另一方面經(jīng)過MVDR處理后的信號(hào),其分類效果有時(shí)候會(huì)反而不如延 時(shí)-求和算法。延時(shí)-求和主要是利用目標(biāo)聲信號(hào)在各個(gè)通道存在不同延時(shí)的特點(diǎn),通過 算法估計(jì)出各個(gè)通道的延時(shí),然后將各個(gè)通道按各自的延時(shí)在時(shí)間上進(jìn)行移位,最后將移 位后的各個(gè)通道信號(hào)疊加相加,從而對(duì)目標(biāo)聲信號(hào)進(jìn)行增強(qiáng)。但由于移位的長(zhǎng)度等于延時(shí) 除以采樣周期,這種算法受采樣率制約,需要較高的采樣率。與延時(shí)-求和方法是通過時(shí)間 上的移位來彌補(bǔ)各個(gè)通道之間聲信號(hào)的時(shí)間差從而受限于采樣率這一特點(diǎn)相比,本發(fā)明針 對(duì)這種信號(hào)增強(qiáng)后接分類器的分類算法架構(gòu),在波束形成的信號(hào)增強(qiáng)端采用常規(guī)波速形成 (CBF)的方法,通過調(diào)整各通道的相位來彌補(bǔ)通道間的時(shí)間差。
[0004] 此外,當(dāng)利用麥克風(fēng)陣列對(duì)聲目標(biāo)進(jìn)行分類的時(shí)候?,F(xiàn)有的分類器利用目標(biāo)的空 間特征鮮有報(bào)道。然而目標(biāo)角度變化量Λ Θ本身則是一個(gè)十分重要的空間特征,富含大量 的信息,例如當(dāng)分類目標(biāo)為運(yùn)動(dòng)車輛的時(shí)候,如果相鄰兩段聲音信號(hào)時(shí)間間隔較短(比如 125ms),車輛離麥克風(fēng)陣列較遠(yuǎn)時(shí),Λ Θ趨于〇,當(dāng)車輛離麥克風(fēng)陣列較近時(shí),Λ Θ變大,但 其值仍然在一個(gè)較小的區(qū)間中,且滿足一定的函數(shù)關(guān)系。而噪聲信號(hào)的角度變化量△ Θ的 特點(diǎn)是,即使相鄰兩段聲音信號(hào)的時(shí)間間隔較短,定向角度Θ隨時(shí)間的變化常常出現(xiàn)波動(dòng) 甚至震蕩現(xiàn)象,即Δ Θ取值很大且不滿足運(yùn)動(dòng)車輛的Λ Θ所滿足的函數(shù)關(guān)系。這是噪聲 信號(hào)與運(yùn)動(dòng)車輛的信號(hào)一個(gè)差異十分顯著的特征。所以將目標(biāo)角度變化量Δ Θ作為一個(gè) 空間特征用于分類器可以提高聲目標(biāo)和噪聲間的分類準(zhǔn)確率。本發(fā)明擬首先通過常規(guī)波束 形成對(duì)各通道聲音信號(hào)進(jìn)行加權(quán)求和,以通過調(diào)整各個(gè)通道的信號(hào)相位來彌補(bǔ)其到達(dá)時(shí)間 差,然后再提取經(jīng)常規(guī)波束形成后的信號(hào)的特征,將其再加上定向角度變化量的空間特征 一起作為新的特征,可望有效提高分類器的分類準(zhǔn)確率及抗噪能力。從而構(gòu)筑成本發(fā)明的 構(gòu)思。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于麥克風(fēng)陣列的聲目標(biāo)分類方法,也就是說本發(fā)明 所要解決的技術(shù)問題是提供一種基于麥克風(fēng)陣列的,環(huán)境適應(yīng)能力強(qiáng)、性能可靠,具有較強(qiáng) 抗噪能力的聲目標(biāo)分類方法。
[0006] 本發(fā)明所提供的一種采用麥克風(fēng)陣列的結(jié)合目標(biāo)空間特征的聲目標(biāo)分類方法,具 體包括以下步驟:
[0007] (1)麥克風(fēng)陣列對(duì)聲目標(biāo)進(jìn)行定向,通過定向算法的結(jié)果對(duì)聲音信號(hào)進(jìn)行常規(guī)波 束形成;
[0008] (2)將常規(guī)波束形成后的信號(hào)所提取到的特征和定向角度變化量一起送入分類器 進(jìn)行分類。
[0009] 所述的麥克風(fēng)陣列的麥克風(fēng)數(shù)量為2個(gè)或2個(gè)以上,排列方式為均勻排列或隨機(jī) 排列。
[0010] 所述步驟(1)中的定向算法為現(xiàn)有的聲陣列定向算法之一??蛇x用的算法有很 多,現(xiàn)有的能定向的算法均可選用,包括多重信號(hào)分類算法(MUSIC)、旋轉(zhuǎn)不變子空間法 (ESPRIT)以及最大似然算法等。
[0011] 所述步驟(1)中的波束形成方法為常規(guī)波束形成(參見王永良"空間譜估計(jì)理論 與算法" P59,清華大學(xué)出版社),這實(shí)際上也是一個(gè)基本的算法,具體算法如下:
【主權(quán)項(xiàng)】
1. 一種基于麥克風(fēng)陣列的聲目標(biāo)分類方法,其特征在于,包括以下步驟: (1) 麥克風(fēng)陣列對(duì)聲目標(biāo)進(jìn)行定向,通過定向算法的結(jié)果對(duì)聲音信號(hào)進(jìn)行常規(guī)波束形 成; (2) 將常規(guī)波束形成后的信號(hào)所提取到的特征和定向角度變化量一起送入分類器進(jìn)行 分類。
2. 根據(jù)權(quán)利要求1所述的分類方法,其特征在于所述麥克風(fēng)陣列的麥克風(fēng)數(shù)量為2個(gè) 或2個(gè)以上,排列方式為均勻排列或隨機(jī)排列。
3. 根據(jù)權(quán)利要求1所述的分類方法,其特征在于步驟(1)中所述的定向算法為現(xiàn)有的 聲陣列定向算法之一。
4. 根據(jù)權(quán)利要求3所述的分類方法,其特征在于所述的定向算法包括多重信號(hào)分類算 法MUSIC、旋轉(zhuǎn)不變子空間法ESPRIT或最大似然算法。
5. 根據(jù)權(quán)利要求1所述的分類方法,其特征在于步驟(1)中所述的常規(guī)波束形成算法 如下:
其中,c為一個(gè)調(diào)節(jié)信號(hào)幅度的常數(shù),M為麥克風(fēng)數(shù)目,Wi為第i個(gè)麥克風(fēng)的加權(quán)值, Xi (t)為第i個(gè)麥克風(fēng)所采集的信號(hào),Ah表示流型矩陣A的共軛轉(zhuǎn)置,X為麥克風(fēng)陣列采集 信號(hào)的矩陣形式表達(dá),Q ci為進(jìn)行常規(guī)波束形成所選取的參考頻點(diǎn),τ i表示聲音信號(hào)在第i 個(gè)陣元處的時(shí)移;常規(guī)波束形成的方向?yàn)槎ㄏ蛩惴ㄋ贸龅哪繕?biāo)方向。
6. 根據(jù)權(quán)利要求5所述的分類方法,其特征在于將波束形成使用常規(guī)波束形成的方法 對(duì)各個(gè)通道直接乘以一個(gè)加權(quán)值用以調(diào)整相位的方式來彌補(bǔ)時(shí)間差。
7. 根據(jù)權(quán)利要求1所述的分類方法,其特征在于步驟(2)中所述的定向角度變化量 等于當(dāng)前信號(hào)的定向角度減去其前一段信號(hào)的定向角度,提交分類算法的準(zhǔn)確率和抗噪能 力。
8. 根據(jù)權(quán)利要求1所述的分類方法,其特征在于步驟(2)中所述的提取常規(guī)波束形成 后信號(hào)特征的特征提取方法為現(xiàn)有的特征提取算法之一。
9. 根據(jù)權(quán)利要求1所述的分類方法,其特征在于步驟(2)中所述的分類算法為現(xiàn)有的 分類算法之一。
10. 根據(jù)權(quán)利要求1-9任一項(xiàng)所述的分類方法,其特征在于直徑為12cm的6陣元均勻 圓陣排列的麥克風(fēng)陣列采集聲音信號(hào),利用麥克風(fēng)陣列采集到的聲響信號(hào)進(jìn)行常規(guī)波束形 成,用相位差來彌補(bǔ)各個(gè)通道的時(shí)間差以增強(qiáng)信號(hào),然后在傳統(tǒng)特征提取算法所提取到的 特征的基礎(chǔ)上,增加了一維描述空間變化的特征即定向角度的變化量,以提高分類器性能; 具體步驟是: (1) 麥克風(fēng)陣列對(duì)聲目標(biāo)采用Music算法進(jìn)行定向,t時(shí)刻定向出的角度為Θ t; (2) 根據(jù)定向出的角度0t對(duì)各個(gè)通道聲音信號(hào)進(jìn)行常規(guī)波束形成;即先按下式進(jìn)行 加權(quán):
C為一個(gè)調(diào)節(jié)信號(hào)幅度的常數(shù)取1/M,M = 6表示麥克風(fēng)數(shù)目,Wi為第i個(gè)麥克風(fēng) 的加權(quán)值,Xi(t)為第i個(gè)麥克風(fēng)所采集的信號(hào),Otl為進(jìn)行常規(guī)波束形成所選取的參 考頻點(diǎn)取340Hz,T i表示聲音信號(hào)在第i個(gè)陣元處的時(shí)移,在俯仰角為0°的時(shí)候有
?其中r表示圓陣半徑,為6cm,V表示聲音在空氣中的速度,常取 340m/s ; (3) 將常規(guī)波束形成后的信號(hào)y(t)提取其梅爾倒譜系數(shù)MFCC,其中梅爾濾波器組包含 24個(gè)濾波器,可以得到24維的梅爾倒譜系數(shù),由于第一維表示直流分量,在取均值的條件 下,第一維數(shù)值很小將其去掉,最后得到23維的梅爾倒譜系數(shù); (4) 將步驟(3)得到的23維的梅爾倒譜系數(shù)和定向角度變化量△ Θ -起構(gòu)成一個(gè)24 維的包含信號(hào)特征以及目標(biāo)空間特征的特征向量,將最后得到的特征向量送入高斯混合模 型GMM進(jìn)行分類,式中Δ θ = θ^θ^。
【專利摘要】本發(fā)明涉及一種基于麥克風(fēng)陣列的聲目標(biāo)分類方法,其特征在于包括以下步驟:(1)麥克風(fēng)陣列對(duì)聲目標(biāo)進(jìn)行定向,通過定向算法的結(jié)果對(duì)聲音信號(hào)進(jìn)行常規(guī)波束形成;(2)將常規(guī)波束形成后的信號(hào)所提取到的特征和定向角度變化量一起送入分類器進(jìn)行分類。本發(fā)明充分利用麥克風(fēng)陣列的優(yōu)勢(shì),不但提高了目標(biāo)信號(hào)的信噪比而且提升分類算法的準(zhǔn)確率和抗噪能力。具有環(huán)境適應(yīng)能力強(qiáng)、性能可靠等優(yōu)點(diǎn),特別適用于需要對(duì)聲目標(biāo)進(jìn)行連續(xù)監(jiān)控的場(chǎng)合。
【IPC分類】G01S3-14, G06K9-62
【公開號(hào)】CN104766093
【申請(qǐng)?zhí)枴緾N201510151851
【發(fā)明人】郭峰, 黃景昌, 祖興水, 程勇博, 劉華巍, 李寶清, 袁曉兵
【申請(qǐng)人】中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所
【公開日】2015年7月8日
【申請(qǐng)日】2015年4月1日