本發(fā)明涉及工業(yè)智能診斷與質(zhì)量控制,尤其涉及一種基于多感受野的神經(jīng)網(wǎng)絡(luò)的異音檢測方法及系統(tǒng)。
背景技術(shù):
1、隨著工業(yè)領(lǐng)域?qū)β曇粜盘柗治龅男枨笕找嬖鲩L,傳統(tǒng)的異音檢測方法,如基于統(tǒng)計分析、傅里葉變換及譜分析的技術(shù),在一定程度上已無法滿足復(fù)雜聲學(xué)環(huán)境下的檢測要求。這些傳統(tǒng)方法通常依賴于手工設(shè)計的特征,且在面對非平穩(wěn)和復(fù)雜噪聲背景時,表現(xiàn)出檢測精度不足的問題。此外,這些方法往往需要大量的領(lǐng)域知識和經(jīng)驗,難以在不熟悉特定應(yīng)用場景的情況下取得理想的檢測效果。
2、近年來,基于深度學(xué)習(xí)的技術(shù)迅速發(fā)展,尤其是在計算機視覺、自然語言處理等領(lǐng)域取得了顯著成效,深度學(xué)習(xí)提供了新的數(shù)據(jù)表示,自動提取特征,包括非線性結(jié)構(gòu)。異音檢測作為一種典型的分類問題,已開始引入深度學(xué)習(xí)的方法進行改進。盡管深度學(xué)習(xí)技術(shù)在異音檢測中展示了巨大的潛力,但其性能往往受到特征提取模塊的影響,尤其是在處理復(fù)雜且多樣化的數(shù)據(jù)時。不同的音頻特征可能具有不同的時間尺度和頻率特征。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(cnn)通常使用固定大小的感受野,這可能無法充分捕捉異音中涉及的多尺度特征,同時,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)使用標(biāo)量來表示特征,往往會忽略樣本的結(jié)構(gòu)信息(如位置、方向、大小等)。
3、因此,亟需一種特征提取精確性高、魯棒性強的異音檢測方法。
技術(shù)實現(xiàn)思路
1、為此,本發(fā)明實施例提供了一種基于多感受野的神經(jīng)網(wǎng)絡(luò)的異音檢測方法及系統(tǒng),用于解決現(xiàn)有技術(shù)中傳統(tǒng)異音檢測方法精度不足,且深度學(xué)習(xí)技術(shù)在處理復(fù)雜異音數(shù)據(jù)時特征提取受限的問題。
2、為了解決上述問題,本發(fā)明實施例提供一種基于多感受野的神經(jīng)網(wǎng)絡(luò)的異音檢測方法,該方法包括:
3、步驟s1:采集工業(yè)設(shè)備在各種工作狀態(tài)下的音頻信號數(shù)據(jù),涵蓋工業(yè)設(shè)備在正常和異常運行條件下的音頻信號,并對采集的音頻信號數(shù)據(jù)進行標(biāo)注;
4、步驟s2:基于標(biāo)注好的數(shù)據(jù)構(gòu)建數(shù)據(jù)集,并將數(shù)據(jù)集劃分為訓(xùn)練集和驗證集;
5、步驟s3:對數(shù)據(jù)集中的音頻信號進行預(yù)處理,從預(yù)處理后的音頻信號中提取梅爾頻譜特征;
6、步驟s4:將梅爾頻譜特征輸入到提前構(gòu)建好的異音檢測模型中進行訓(xùn)練,得到訓(xùn)練好的異音檢測模型,具體包括:
7、將梅爾頻譜特征輸入到提前構(gòu)建好的異音檢測模型中,首先通過卷積神經(jīng)網(wǎng)絡(luò)提取初級特征,再利用選擇性卷積核網(wǎng)絡(luò)模塊進行多尺度特征提取與融合,接著通過特征降維與軟注意力機制實現(xiàn)特征的自適應(yīng)選擇,最后通過膠囊網(wǎng)絡(luò)模塊完成分類任務(wù);
8、在訓(xùn)練過程中,使用五折交叉驗證對異音檢測模型的性能進行評估,優(yōu)化其參數(shù),最終得到訓(xùn)練好的異音檢測模型;
9、步驟s5:將待測音頻信號樣本輸入到訓(xùn)練好的異音檢測模型中進行預(yù)測,得到預(yù)測結(jié)果,并依據(jù)預(yù)測結(jié)果對工業(yè)設(shè)備進行分類。
10、優(yōu)選地,所述對數(shù)據(jù)集中的音頻信號預(yù)處理的方法,包括去除背景噪聲和歸一化處理。
11、優(yōu)選地,所述從預(yù)處理后的音頻信號中提取梅爾頻譜特征的方法為:
12、將連續(xù)的音頻信號分割成多個短時幀,對每一幀信號進行加窗處理;
13、對每一幀加窗后的信號進行快速傅里葉變換,將時間域信號轉(zhuǎn)換為頻率域信號,得到該幀的頻譜表示;
14、對快速傅里葉變換得到的頻譜進行平方運算,計算每個頻率分量的功率譜;
15、將功率譜通過一組梅爾濾波器進行處理;
16、對梅爾濾波器組輸出的能量進行對數(shù)運算,得到對數(shù)能量譜。
17、優(yōu)選地,所述將梅爾頻譜特征輸入到提前構(gòu)建好的異音檢測模型中進行訓(xùn)練,得到訓(xùn)練好的異音檢測模型的方法為:
18、將連續(xù)的音頻信號分割成多個短時幀,對每一幀信號進行加窗處理;
19、對每一幀加窗后的信號進行快速傅里葉變換,將時間域信號轉(zhuǎn)換為頻率域信號,得到該幀的頻譜表示;
20、對快速傅里葉變換得到的頻譜進行平方運算,計算每個頻率分量的功率譜;
21、將功率譜通過一組梅爾濾波器進行處理;
22、對梅爾濾波器組輸出的能量進行對數(shù)運算,得到對數(shù)能量譜。
23、優(yōu)選地,所述通過卷積神經(jīng)網(wǎng)絡(luò)提取初級特征的方法為:
24、使用一層卷積神經(jīng)網(wǎng)絡(luò)對梅爾頻譜特征進行初步處理,得到初級特征,,其中h、c、w分別代表特征的高度、通道數(shù)和寬度,代表實數(shù)集。
25、優(yōu)選地,所述利用選擇性卷積核網(wǎng)絡(luò)模塊進行多尺度特征提取與融合的方法為:
26、使用不同大小的卷積核和relu激活函數(shù),對初級特征進行多尺度特征提取,得到不同的特征映射和,,;
27、將特征映射和進行融合,得到綜合特征;
28、對融合后的綜合特征進行全局平均池化操作,得到全局特征表示。
29、優(yōu)選地,所述通過特征降維與軟注意力機制實現(xiàn)特征的自適應(yīng)選擇的方法為:
30、通過全連接層對全局特征表示進行降維,得到壓縮后的特征向量,其中為壓縮向量的長度;
31、利用壓縮后的特征向量引導(dǎo)跨通道的軟注意力機制,自適應(yīng)地調(diào)整對不同空間尺度信息的關(guān)注程度,得到軟注意力向量和;
32、根據(jù)軟注意力向量和,對和進行加權(quán)融合,得到張量特征。
33、優(yōu)選地,所述通過膠囊網(wǎng)絡(luò)模塊完成分類任務(wù)的方法為:
34、將張量特征轉(zhuǎn)換為向量特征,并封裝為初級膠囊單元;
35、利用動態(tài)路由機制對初級膠囊單元進行聚合,生成分類概率向量,其中向量的模長表示某個類別的概率;
36、通過反向傳播更新膠囊單元內(nèi)的權(quán)重參數(shù),直至權(quán)重參數(shù)固定,完成整個網(wǎng)絡(luò)模型的訓(xùn)練。
37、優(yōu)選地,所述動態(tài)路由機制具體包括:
38、每個初級膠囊單元??是一個向量,表示輸入數(shù)據(jù)中局部特征的不同屬性;
39、對于每個初級膠囊單元?和每個目標(biāo)膠囊單元?,計算預(yù)測向量?;
40、將路由系數(shù)?初始化為相等的值,表示初級膠囊單元??和目標(biāo)膠囊單元?之間的連接強度;
41、根據(jù)路由系數(shù)?和預(yù)測向量?,計算目標(biāo)膠囊單元的輸入;
42、對目標(biāo)膠囊單元的輸入應(yīng)用?squash?激活函數(shù),得到目標(biāo)膠囊單元的輸出?;
43、根據(jù)目標(biāo)膠囊單元的輸出?和預(yù)測向量?之間的內(nèi)積,更新路由系數(shù)。
44、優(yōu)選地,在訓(xùn)練網(wǎng)絡(luò)時,異音檢測模型的損失包括重建損失和邊際損失,其中重建損失,是由三層全連接層根據(jù)??重建得到的梅爾頻譜特征和原始的梅爾頻譜特征計算得出,具體損失如下:
45、;
46、其中,為邊際損失;?為重建損失,為損失系數(shù)。
47、本發(fā)明實施例還提供了一種基于多感受野的神經(jīng)網(wǎng)絡(luò)的異音檢測系統(tǒng),該系統(tǒng)用于實現(xiàn)上述所述的基于多感受野的神經(jīng)網(wǎng)絡(luò)的異音檢測方法,具體包括:
48、音頻信號采集模塊,用于采集工業(yè)設(shè)備在各種工作狀態(tài)下的音頻信號數(shù)據(jù),涵蓋工業(yè)設(shè)備在正常和異常運行條件下的音頻信號,并對采集的音頻信號數(shù)據(jù)進行標(biāo)注;
49、數(shù)據(jù)集劃分模塊,用于基于標(biāo)注好的數(shù)據(jù)構(gòu)建數(shù)據(jù)集,并將數(shù)據(jù)集劃分為訓(xùn)練集和驗證集;
50、音頻預(yù)處理與特征提取模塊,用于對數(shù)據(jù)集中的音頻信號進行預(yù)處理,從預(yù)處理后的音頻信號中提取梅爾頻譜特征;
51、模型訓(xùn)練與優(yōu)化模塊,用于將梅爾頻譜特征輸入到提前構(gòu)建好的異音檢測模型中進行訓(xùn)練,得到訓(xùn)練好的異音檢測模型,具體包括:
52、將梅爾頻譜特征輸入到提前構(gòu)建好的異音檢測模型中,首先通過卷積神經(jīng)網(wǎng)絡(luò)提取初級特征,再利用選擇性卷積核網(wǎng)絡(luò)模塊進行多尺度特征提取與融合,接著通過特征降維與軟注意力機制實現(xiàn)特征的自適應(yīng)選擇,最后通過膠囊網(wǎng)絡(luò)模塊完成分類任務(wù);
53、在訓(xùn)練過程中,使用五折交叉驗證對異音檢測模型的性能進行評估,優(yōu)化其參數(shù),最終得到訓(xùn)練好的異音檢測模型;
54、模型預(yù)測與應(yīng)用模塊,用于將待測音頻信號樣本輸入到訓(xùn)練好的異音檢測模型中進行預(yù)測,得到預(yù)測結(jié)果,并依據(jù)預(yù)測結(jié)果對工業(yè)設(shè)備進行分類。
55、從以上技術(shù)方案可以看出,本發(fā)明申請具有以下有益效果:
56、(1)多尺度特征捕捉能力:本發(fā)明通過結(jié)合選擇性卷積核網(wǎng)絡(luò)模塊,實現(xiàn)了對音頻信號中不同尺度特征的動態(tài)捕捉。利用多個具有不同核大小的分支處理輸入信號,并將這些分支的信息融合在一起,該方法能夠靈活調(diào)整神經(jīng)元的感受野大小,有效捕捉到從細(xì)微變化到復(fù)雜頻率特征的各種音頻特征。這種能力特別適用于處理復(fù)雜且多樣化的工業(yè)設(shè)備音頻信號,提高了異音檢測的準(zhǔn)確性和適用性。
57、(2)豐富的特征表示能力:通過引入膠囊網(wǎng)絡(luò)模塊,本發(fā)明實現(xiàn)了對音頻信號特征的多維向量表示。每個膠囊不僅能夠捕捉不同特征之間的關(guān)系,還包含了結(jié)構(gòu)信息(如位置、方向、大小等),這種表示方式使得網(wǎng)絡(luò)能夠更好地保留和利用音頻信號中的空間信息和方向性。這種豐富的特征表示能力顯著增強了模型在異音檢測過程中的準(zhǔn)確性和魯棒性,使得模型能夠更好地區(qū)分正常和異常的音頻信號。
58、(3)高效的異音檢測性能:結(jié)合選擇性卷積核網(wǎng)絡(luò)和膠囊網(wǎng)絡(luò)的優(yōu)勢,本發(fā)明構(gòu)建了一種高效的異音檢測模型。該模型通過多尺度特征提取與融合、特征自適應(yīng)選擇以及分類任務(wù)的完成,實現(xiàn)了對工業(yè)設(shè)備音頻信號的準(zhǔn)確檢測。在訓(xùn)練過程中,使用五折交叉驗證對模型性能進行評估,并優(yōu)化其參數(shù),確保了模型的穩(wěn)定性和可靠性。最終,該模型能夠在實際應(yīng)用中實現(xiàn)對工業(yè)設(shè)備的快速、準(zhǔn)確分類,為工業(yè)設(shè)備的狀態(tài)監(jiān)測和故障診斷提供了有力的技術(shù)支持。