本發(fā)明涉及音頻信號處理,尤其是指基于機器學(xué)習(xí)的揚聲器異音檢測方法、系統(tǒng)及存儲介質(zhì)。
背景技術(shù):
1、隨著智能手機、智能音箱、車載音響及家庭影院等電子設(shè)備的普及,揚聲器市場需求激增,我國已成為揚聲器生產(chǎn)和出口大國。面對市場對高品質(zhì)音頻體驗的不斷提升,揚聲器生產(chǎn)企業(yè)面臨著在擴大產(chǎn)量的同時,還需提升產(chǎn)品質(zhì)量的挑戰(zhàn)。然而,在揚聲器制造過程中,常出現(xiàn)影響音質(zhì)的結(jié)構(gòu)和機械故障,這些故障直接影響用戶體驗。
2、當(dāng)前,揚聲器異音檢測主要依賴傳統(tǒng)方法,即通過專業(yè)聽音員在隔音環(huán)境中以人耳判斷揚聲器聲音是否正常。此方法存在顯著弊端:一是高度依賴聽音員的主觀感受,易受年齡、健康狀況及疲勞程度等個體因素影響,導(dǎo)致檢測結(jié)果的主觀性和不確定性;二是缺乏統(tǒng)一的評價標(biāo)準(zhǔn),難以被自動化裝置替代;三是對于大規(guī)模生產(chǎn)而言,不僅勞動成本高,且長時間重復(fù)性工作易導(dǎo)致人員疲勞和誤判,增加了產(chǎn)品不合格風(fēng)險。
3、因此,探索一種更加精準(zhǔn)高效、客觀且標(biāo)準(zhǔn)化的揚聲器異音檢測方法顯得尤為迫切,以滿足市場對高質(zhì)量揚聲器的需求,同時降低生產(chǎn)成本,提高生產(chǎn)效率。
技術(shù)實現(xiàn)思路
1、為解決上述技術(shù)問題,本發(fā)明提供了一種基于機器學(xué)習(xí)的揚聲器異音檢測方法,包括以下步驟:
2、s1:采集揚聲器音頻信號,對所述音頻信號進行預(yù)處理,得到多視圖數(shù)據(jù)集;
3、s2:對所述多視圖數(shù)據(jù)集進行無監(jiān)督特征選擇,得到特征選擇后的數(shù)據(jù)集;
4、s3:將所述特征選擇后的數(shù)據(jù)集劃分成訓(xùn)練集和測試集,通過所述訓(xùn)練集對分類器進行迭代訓(xùn)練,得到訓(xùn)練后的分類器;
5、s4:基于所述訓(xùn)練后的分類器對待測揚聲器進行異音檢測,得到檢測結(jié)果。
6、在本發(fā)明的一個實施例中,在s1中,所述得到多視圖數(shù)據(jù)集的方法如下:
7、s11:對所述音頻信號x(t)進行歸一化處理,將所述音頻信號x(t)的幅度縮放至指定范圍內(nèi),得到歸一化后的音頻信號x′(t):
8、
9、s12:對所述歸一化后的音頻信號進行預(yù)加重分幀加窗處理,得到多個加窗后的幀信號;
10、s13:對所述加窗后的幀信號進行短時傅里葉變換,得到音頻信號的線性頻譜x(k),取所述音頻信號的線性頻譜x(k)的模的平方,得到每幀的功率譜;其中,所述音頻信號的線性頻譜x(k)的計算公式如下:
11、
12、其中,k≤n-1,n表示加窗后的幀信號的總數(shù)量,j表示虛數(shù)單位,x(n)表示第n個加窗后的幀信號;
13、s14:基于所述音頻信號的線性頻譜x(k),通過mel濾波器組進行加權(quán)求和,將給定頻率f轉(zhuǎn)換成所對應(yīng)的梅爾刻度頻譜mel(f):
14、
15、s15:對所述梅爾刻度頻譜mel(f)取對數(shù),得到對數(shù)頻譜,對所述對數(shù)頻譜進行離散余弦變換,得到梅爾頻率倒譜系數(shù)特征;對所述音頻信號的線性頻譜x(k)的模的平方除以幀長度,得到功率譜,對所述功率譜取平方,得到語譜圖特征;
16、s16:對所述梅爾頻率倒譜系數(shù)特征和所述語譜圖特征進行均值歸一化處理后組合,得到所述多視圖數(shù)據(jù)集。
17、在本發(fā)明的一個實施例中,在s2中,所述得到特征選擇后的數(shù)據(jù)集的方法如下:
18、s21:對于所述多視圖數(shù)據(jù)集中的每個視圖,計算數(shù)據(jù)點之間的相似度矩陣,將多個視圖的相似度矩陣融合成一個相似度矩陣,在融合后的相似度矩陣上應(yīng)用譜聚類算法,得到聚類結(jié)果,聚類結(jié)果將作為數(shù)據(jù)點的偽標(biāo)簽,以此為各個數(shù)據(jù)點分配偽標(biāo)簽,生成偽標(biāo)簽矩陣;
19、s22:基于所述偽標(biāo)簽矩陣,通過特征選擇矩陣的l2,1稀疏正則化項構(gòu)建特征選擇損失函數(shù),將所述偽標(biāo)簽矩陣的訓(xùn)練過程和所述特征選擇矩陣的訓(xùn)練過程集成到同一學(xué)習(xí)框架中,構(gòu)建無監(jiān)督特征選擇目標(biāo)函數(shù);
20、s23:以最小化所述無監(jiān)督特征選擇目標(biāo)函數(shù)值為目標(biāo),求解所述無監(jiān)督特征選擇目標(biāo)函數(shù),得到偽標(biāo)簽矩陣和特征選擇矩陣的最優(yōu)解;
21、s24:基于所述特征選擇矩陣的最優(yōu)解,計算每個特征的重要值,即計算特征選擇矩陣的每行的l2范數(shù),并對每個特征重要值進行排序,選擇前k個特征構(gòu)成多視圖特征子集,多個所述多視圖特征子集組合得到所述特征選擇后的數(shù)據(jù)集。
22、在本發(fā)明的一個實施例中,所述無監(jiān)督特征選擇目標(biāo)函數(shù)floss包括偽標(biāo)簽學(xué)習(xí)的損失項loss1和特征選擇矩陣學(xué)習(xí)的損失項loss2,其表達(dá)式如下:
23、
24、其中,α(v)均為可迭代權(quán)值參數(shù),v為視圖的索引號,v取1~v之間的整數(shù),v為所述多視圖數(shù)據(jù)集中每個樣本的視圖總數(shù)。
25、在本發(fā)明的一個實施例中,所述偽標(biāo)簽學(xué)習(xí)的損失項loss1基于非負(fù)約束條件下構(gòu)造而成,其表達(dá)式為:
26、
27、其中,p(v)∈rn×c表示第v個視圖的偽標(biāo)簽矩陣,v取1~v之間的整數(shù),v為所述多視圖數(shù)據(jù)集中每個樣本的視圖總數(shù),i∈rc×c是單位矩陣,c是類別數(shù),tr(·)為求取矩陣的跡的運算操作;l(v)表示拉普拉斯矩陣。
28、在本發(fā)明的一個實施例中,所述特征選擇矩陣學(xué)習(xí)的損失項loss2的表達(dá)式為:
29、
30、其中,β(v)為可迭代權(quán)值參數(shù),為第v個視圖的音頻數(shù)據(jù)集,dv表示第v個視圖的維度,p(v)∈rn×c表示第v個視圖的偽標(biāo)簽矩陣,n為所述多視圖數(shù)據(jù)集的樣本數(shù),c是類別數(shù),q(v)為第v個視圖的特征選擇矩陣,為求取f范數(shù)的平方的運算操作,||q(v)||2,1表示q(v)的l2,1范數(shù),λ為預(yù)設(shè)參數(shù)。
31、在本發(fā)明的一個實施例中,所述得到偽標(biāo)簽矩陣和特征選擇矩陣的最優(yōu)解的方法如下:
32、由于所述特征選擇矩陣學(xué)習(xí)的損失項loss2不可微,將所述特征選擇矩陣學(xué)習(xí)的損失項loss2的表達(dá)式轉(zhuǎn)化為以下等價表達(dá)式:
33、
34、其中,d(v)表示對角矩陣,第i個對角元素為表示對角矩陣d(v)的第i個樣本;
35、固定p(v)、α(v)、β(v)的值,對所述等價表達(dá)式進行求導(dǎo)并將導(dǎo)數(shù)設(shè)為0,得到q(v)的求解公式:
36、
37、固定q(v)、α(v)、β(v)的值,將所述偽標(biāo)簽學(xué)習(xí)的損失項loss1轉(zhuǎn)換為以下等價表達(dá)式:
38、
39、其中,ρ表示權(quán)重參數(shù);
40、根據(jù)所述q(v)的求解公式,所述等價表達(dá)式(9)可以轉(zhuǎn)換成如下表達(dá)式:
41、
42、其中,i表示單位矩陣;
43、公式(10)的拉格朗日函數(shù)為:
44、
45、其中,ψ(v)是拉格朗日乘子,根據(jù)卡魯什-庫恩-塔克條件,可得對公式(11)進行求導(dǎo)并將導(dǎo)數(shù)設(shè)為0,得到更新偽標(biāo)簽矩陣p(v)中第i行j列的元素的公式如下:
46、
47、固定p(v)、q(v)、β(v)的值,更新α(v)的公式為:
48、
49、固定p(v)、q(v)、α(v)的值,更新β(v)的公式為:
50、
51、以最小化所述無監(jiān)督特征選擇目標(biāo)函數(shù)值為目標(biāo),不斷調(diào)整偽標(biāo)簽矩陣和特征選擇矩陣的元素,得到偽標(biāo)簽矩陣和特征選擇矩陣的最優(yōu)解。
52、在本發(fā)明的一個實施例中,在s3中,所述得到訓(xùn)練后的分類器的方法如下:
53、以線性支持向量機作為分類器的基本框架,其超平面使用分類函數(shù)為:
54、f(x)=ω·x+b?????????????????(15)
55、其中,ω表示超平面的法向量,b為分類偏值,x為由所述特征選擇后的數(shù)據(jù)集劃分出的訓(xùn)練集;
56、引入拉格朗日乘子α對公式(15)中ω和b進行求解,定義拉格朗日函數(shù)為:
57、
58、其中,xi為所述特征選擇后的數(shù)據(jù)集中第i個樣本,i取1~n之間的整數(shù),n為所述特征選擇后的數(shù)據(jù)集中的樣本總數(shù);
59、固定拉格朗日乘子α的值,分別計算公式(16)對ω和b的偏導(dǎo)數(shù),并將其結(jié)果置為0,可以得到以下公式:
60、
61、將公式(17)代入公式(16),化簡后可得:
62、
63、將公式(18)轉(zhuǎn)化成對偶問題,通過求解以下公式(19),得到αi的最優(yōu)解:
64、
65、
66、基于所述αi的最優(yōu)解,即可代入公式(16)依次求解,得到ω、b的最優(yōu)解,根據(jù)αi、ω、b的最優(yōu)解,最終得到一個最優(yōu)的分類平面和分類函數(shù)。
67、基于同一發(fā)明構(gòu)思,本發(fā)明還提供了一種基于機器學(xué)習(xí)的揚聲器異音檢測系統(tǒng),用于所述的基于機器學(xué)習(xí)的揚聲器異音檢測方法,包括以下模塊:
68、數(shù)據(jù)預(yù)處理模塊,所述數(shù)據(jù)預(yù)處理模塊用于采集揚聲器音頻信號,對所述音頻信號進行預(yù)處理,得到多視圖數(shù)據(jù)集;
69、特征選擇模塊,所述特征選擇模塊用于對所述多視圖數(shù)據(jù)集進行無監(jiān)督特征選擇,得到特征選擇后的數(shù)據(jù)集;
70、分類器訓(xùn)練模塊,所述分類器訓(xùn)練模塊用于將所述特征選擇后的數(shù)據(jù)集劃分成訓(xùn)練集和測試集,通過所述訓(xùn)練集對分類器進行迭代訓(xùn)練,得到訓(xùn)練后的分類器;
71、異音檢測模塊,所述異音檢測模塊用于基于所述訓(xùn)練后的分類器對待測揚聲器進行異音檢測,得到檢測結(jié)果。
72、本發(fā)明還提供了一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)所述的基于機器學(xué)習(xí)的揚聲器異音檢測方法的步驟。
73、本發(fā)明的上述技術(shù)方案相比現(xiàn)有技術(shù)具有以下優(yōu)點:
74、1、多視圖數(shù)據(jù)處理:通過從音頻信號中提取梅爾頻率倒譜系數(shù)和語譜圖等多種特征,形成多視圖數(shù)據(jù)集,這種方法能夠更全面地捕捉音頻信號中的信息,提高異音檢測的準(zhǔn)確性和魯棒性。多視圖特征的結(jié)合有助于從不同角度解析音頻信號,減少單一特征可能帶來的信息缺失或誤導(dǎo)。
75、2、無監(jiān)督特征選擇:將偽標(biāo)簽學(xué)習(xí)與特征選擇融合在同一個學(xué)習(xí)框架中,采用無監(jiān)督特征選擇方法,能夠在沒有標(biāo)簽信息的情況下,自動選擇對分類任務(wù)最有用的特征,旨在保留原始數(shù)據(jù)中的判別信息,剔除冗余以及信息含量低的特征,用于提高后續(xù)分類模型的性能以及訓(xùn)練速度。
76、3、高度自動化與低人工干預(yù):整個檢測流程高度自動化,從數(shù)據(jù)預(yù)處理、特征提取到分類器訓(xùn)練,大部分檢測步驟都可以自動完成,減少了人工干預(yù)的需求,提高了檢測效率和可靠性。