本發(fā)明涉及噪聲檢測(cè),尤其涉及一種噪聲區(qū)域檢測(cè)識(shí)別方法。
背景技術(shù):
1、在建筑垃圾治理環(huán)境中,由于建筑垃圾處置設(shè)備數(shù)量眾多,噪聲問(wèn)題往往較為復(fù)雜,可能來(lái)源于各種設(shè)備的運(yùn)作,例如破碎機(jī)、上料機(jī)、挖機(jī)等工程設(shè)備;這些設(shè)備在運(yùn)行時(shí)會(huì)產(chǎn)生不同頻率和強(qiáng)度的噪聲,進(jìn)而影響到周?chē)h(huán)境;為了有效解決因噪聲引發(fā)的糾紛,如企業(yè)內(nèi)部的投訴、企業(yè)之間的噪聲爭(zhēng)端,或企業(yè)與周?chē)幼^(qū)之間的噪聲問(wèn)題,準(zhǔn)確測(cè)量和評(píng)估噪聲的來(lái)源顯得尤為重要;通過(guò)對(duì)噪聲源進(jìn)行詳細(xì)的分析和定位,可以明確噪聲的具體來(lái)源及其對(duì)周?chē)h(huán)境的影響,并幫助制定相應(yīng)的噪聲控制措施;因此,對(duì)噪聲產(chǎn)生的區(qū)域進(jìn)行準(zhǔn)確定位是非常必要的。
2、傳統(tǒng)的噪聲源定位方法是基于信號(hào)模型和信號(hào)處理技術(shù);盡管這些方法在該領(lǐng)域取得了顯著進(jìn)展,但在噪聲源較多以及混響等常見(jiàn)且復(fù)雜的場(chǎng)景中,它們的表現(xiàn)較差,噪聲定位準(zhǔn)確性較差;在過(guò)去幾年中,數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)技術(shù)在處理這些困難場(chǎng)景方面的潛力引起了越來(lái)越多的關(guān)注;因此,近年來(lái)逐漸提出了基于深度神經(jīng)網(wǎng)絡(luò)的噪聲源定位方法;而且根據(jù)已有的研究表明,基于深度神經(jīng)網(wǎng)絡(luò)的噪聲源定位方法優(yōu)于傳統(tǒng)的基于信號(hào)處理的噪聲源定位方法。
3、雖然深度神經(jīng)網(wǎng)絡(luò)在噪聲源定位中具有良好的表現(xiàn),但在實(shí)際的建筑垃圾治理環(huán)境中,多種噪聲與正常生活中聲音混雜在一起,建筑垃圾處置設(shè)備工作的環(huán)境以及所處位置也在不斷變化,在一種工作環(huán)境下訓(xùn)練的噪聲源定位深度模型應(yīng)用于不同的工作環(huán)境時(shí)效果變差,噪聲識(shí)別以及定位準(zhǔn)確性會(huì)顯著降低;因此,需要提供一種具有較強(qiáng)環(huán)境適應(yīng)能力,并且能夠準(zhǔn)確進(jìn)行多個(gè)噪聲源定位的噪聲區(qū)域檢測(cè)識(shí)別方法。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有方法的不足,本發(fā)明解決現(xiàn)有技術(shù)中噪聲源定位方法環(huán)境適應(yīng)性差、難以同時(shí)準(zhǔn)確進(jìn)行多個(gè)噪聲源定位等問(wèn)題。
2、本發(fā)明所采用的技術(shù)方案是:一種噪聲區(qū)域檢測(cè)識(shí)別方法包括以下步驟:
3、步驟一、采集建筑垃圾處置設(shè)備運(yùn)行時(shí)的音頻信號(hào),并進(jìn)行短時(shí)傅里葉變換,得到音頻信號(hào)的功率譜和相位譜;
4、作為本發(fā)明的一種優(yōu)選實(shí)施方式,音頻信號(hào)采用麥克風(fēng)陣列采集。
5、步驟二、構(gòu)建多層次音頻特征提取器,提取源域和目標(biāo)域中建筑垃圾處置設(shè)備的多層次音頻特征;
6、多層次音頻特征提取器包括:由第一卷積層和多層次卷積塊組成;其中,
7、第一卷積層的卷積核大小為7×7,通道數(shù)為16,步長(zhǎng)為2,并采用bn和relu函數(shù);
8、多層次卷積塊采用三個(gè)卷積分支;其中,第一個(gè)分支卷積層數(shù)為1,卷積核大小為1×1,通道數(shù)為512;第二個(gè)分支卷積層數(shù)為2,第1層卷積核大小為1×1,通道數(shù)為64,第2層卷積核大小為3×3,通道數(shù)為512;第三個(gè)分支卷積層數(shù)為3,第1層卷積核大小為1×1,通道數(shù)為64,第2層卷積核大小為5×5,通道數(shù)為128,第3層卷積核大小為5×5,通道數(shù)為512;
9、對(duì)每個(gè)分支得到的512個(gè)通道中各個(gè)通道的特征圖進(jìn)行全局平均池化;對(duì)三個(gè)分支特征向量進(jìn)行拼接,輸出特征向量大小為1×1536。
10、步驟三、建立聲源位置識(shí)別器,預(yù)測(cè)音頻的聲源位置;
11、作為本發(fā)明的一種優(yōu)選實(shí)施方式,聲源位置識(shí)別器由三層全連接層和sigmoid激活函數(shù)組成,三層全連接層中的神經(jīng)元數(shù)量分別為1024,1024,360;輸出為一個(gè)360維度的預(yù)測(cè)概率={ g1、 g2、… g i…、 g360};其中, gi對(duì)應(yīng)于平面360維度第 i個(gè)方位上出現(xiàn)聲源的概率。
12、步驟四、建立噪聲判別器,對(duì)各方位聲源音頻是否屬于噪聲進(jìn)行判別;
13、作為本發(fā)明的一種優(yōu)選實(shí)施方式,噪聲判別器由三層全連接層和sigmoid激活函數(shù)組成,三層全連接層中的神經(jīng)元數(shù)量分別為2048,2048,360;輸出為一個(gè)360維度的預(yù)測(cè)概率={ u1、 u2、… u i…、 u360};其中, u i對(duì)應(yīng)于平面360維度第 i個(gè)方位上的聲源屬于噪聲的概率。
14、步驟五、將多層次音頻特征提取器、聲源位置識(shí)別器和噪聲判別器組合為噪聲區(qū)域檢測(cè)模型,通過(guò)優(yōu)化算法對(duì)模型進(jìn)行訓(xùn)練;
15、作為本發(fā)明的一種優(yōu)選實(shí)施方式,步驟五具體包括:
16、步驟51、將多層次音頻特征提取器與聲源位置識(shí)別器組成第一前饋神經(jīng)網(wǎng)絡(luò),多層次音頻特征提取器與噪聲判別器組成第二前饋神經(jīng)網(wǎng)絡(luò);
17、步驟52、多層次音頻特征提取器用于提取源域特征,聲源位置識(shí)別器用于識(shí)別特征的聲源位置并使預(yù)測(cè)結(jié)果正確擬合真實(shí)的音頻方位;噪聲判別器用于識(shí)別特征是否屬于噪聲;利用最小化聲源位置識(shí)別器預(yù)測(cè)結(jié)果的損失 l c和噪聲判別器預(yù)測(cè)結(jié)果的損失 l d來(lái)優(yōu)化模型,公式為:
18、;
19、式中, l c為聲源位置識(shí)別器預(yù)測(cè)結(jié)果的平均絕對(duì)誤差損失, l d為噪聲判別器預(yù)測(cè)結(jié)果的平均絕對(duì)誤差損失,表示平均絕對(duì)誤差值,表示絕對(duì)值,和分別是聲源位置識(shí)別器的預(yù)測(cè)概率和真實(shí)的聲源位置,和分別是在第 i個(gè)維度方位上噪聲判別器的預(yù)測(cè)概率和真實(shí)的噪聲結(jié)果,是權(quán)重參數(shù);
20、步驟53、對(duì)多層次音頻特征提取器提取的源域和目標(biāo)域特征進(jìn)行協(xié)方差對(duì)齊;
21、作為本發(fā)明的一種優(yōu)選實(shí)施方式,協(xié)方差對(duì)齊損失的公式為:
22、;
23、式中,表示frobenius范數(shù),表示協(xié)方差計(jì)算,和分別表示源域和目標(biāo)域的特征矩陣,表示特征維度。
24、步驟54、結(jié)合優(yōu)化目標(biāo)函數(shù)損失和協(xié)方差對(duì)齊損失得到總的損失函數(shù),利用總的損失函數(shù)進(jìn)行反向傳播優(yōu)化;
25、作為本發(fā)明的一種優(yōu)選實(shí)施方式,總的損失函數(shù)的公式為:
26、
27、式中,為損失函數(shù)權(quán)衡參數(shù), ls為優(yōu)化目標(biāo)函數(shù)損失,為協(xié)方差對(duì)齊損失。
28、步驟六、將目標(biāo)域測(cè)試樣本集輸入訓(xùn)練完成的噪聲區(qū)域檢測(cè)模型,在線預(yù)測(cè)建筑垃圾處置設(shè)備噪聲方位。
29、作為本發(fā)明的一種優(yōu)選實(shí)施方式,步驟六具體包括:
30、通過(guò)結(jié)合聲源位置識(shí)別器和噪聲判別器的預(yù)測(cè)結(jié)果,設(shè)定一個(gè)預(yù)測(cè)閾值,將高于預(yù)測(cè)閾值的預(yù)測(cè)結(jié)果作為噪聲檢測(cè)識(shí)別的輸出;
31、;
32、式中,和分別表示在第 i個(gè)維度方位上聲源位置識(shí)別器和噪聲判別器的預(yù)測(cè)概率,為在第 i個(gè)維度方向上的噪聲聲源,為高于預(yù)測(cè)閾值的噪聲。
33、作為本發(fā)明的一種優(yōu)選實(shí)施方式,噪聲區(qū)域檢測(cè)識(shí)別系統(tǒng),包括:存儲(chǔ)器,用于存儲(chǔ)可由處理器執(zhí)行的指令;處理器,用于執(zhí)行指令以實(shí)現(xiàn)噪聲區(qū)域檢測(cè)識(shí)別方法。
34、作為本發(fā)明的一種優(yōu)選實(shí)施方式,存儲(chǔ)有計(jì)算機(jī)程序代碼的計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)程序代碼在由處理器執(zhí)行時(shí)實(shí)現(xiàn)噪聲區(qū)域檢測(cè)識(shí)別方法。
35、本發(fā)明的有益效果:
36、1、引入深度遷移學(xué)習(xí)技術(shù),建立了建筑垃圾處置設(shè)備噪聲區(qū)域檢測(cè)模型,利用多層次音頻特征提取器提取包含豐富信息的多層次音頻特征,并構(gòu)造了聲源位置識(shí)別器和噪聲判別器來(lái)同時(shí)預(yù)測(cè)在360維度方位上多個(gè)音頻的聲源位置并對(duì)音頻是否屬于噪聲進(jìn)行判別,克服了傳統(tǒng)方法難以進(jìn)行多個(gè)噪聲源定位的問(wèn)題;
37、2、引入?yún)f(xié)方差對(duì)齊來(lái)將一個(gè)環(huán)境下的噪聲識(shí)別知識(shí)遷移到不同環(huán)境下的噪聲識(shí)別,提高了建筑垃圾處置設(shè)備噪聲區(qū)域檢測(cè)模型在不同環(huán)境下的適應(yīng)性;
38、3、能夠準(zhǔn)確地同時(shí)進(jìn)行多個(gè)建筑垃圾處置設(shè)備噪聲源定位;
39、4、應(yīng)用于不同環(huán)境下建筑垃圾處置設(shè)備噪聲檢測(cè)識(shí)別時(shí)準(zhǔn)確性較高,應(yīng)用范圍廣。