本發(fā)明主要涉及音頻處理,尤其涉及一種基于ai控制的音頻信號補償方法及相關裝置。
背景技術:
1、隨著聲學技術的快速發(fā)展,人們對音響系統(tǒng)的音頻效果也越來越關注,對此,為了提高音頻播放的質量,通常會對音頻信號進行補償以滿足人們所需的聽覺效果。音頻信號的音頻類別識別是音頻信號補償方法中重要的一環(huán),目前音頻信號的音頻類別識別通常是通過相關人員進行標簽標注來劃分音頻類別,但該方式過于依賴相關人員的專業(yè)素養(yǎng),無法保障音頻類別識別的準確性,同時所投入的人力成本也過高。在目前的音頻信號補償中,較少會考慮將用戶習慣加入至音頻信號補償參數的生成中,導致最終所播放的補償后的音頻仍需要用戶自行調整,導致對音頻信號補償的智能化程度不足,無法為用戶帶來更為便捷的音頻播放體驗。同時在目前的音頻信號補償中,由于揚聲器自身的頻率響應不夠平坦,并且音頻播放空間存在音頻信號反射和吸收等問題,而為了解決這些問題,目前通常是通過在音頻播放空間內加裝吸音材料等來改善音頻播放效果,但該方法的成本較高,并且對音頻信號的補償效果也較差,導致音頻信號補償未能達到預期效果,無法為用戶提供高質量的音頻播放體驗。
技術實現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術的不足,本發(fā)明提供了一種基于ai控制的音頻信號補償方法及相關裝置,提高了用戶的聽覺感受,使音頻信號補償達到更為理想的效果。
2、為了解決上述技術問題,本發(fā)明提供了一種基于ai控制的音頻信號補償方法,應用于音頻拾取器、嵌入式實時操作系統(tǒng)和揚聲器,所述嵌入式實時操作系統(tǒng)分別與所述音頻拾取器和揚聲器連接;所述方法包括:
3、基于音頻拾取器獲取待補償音頻信號,并將所述待補償音頻信號傳輸至嵌入式實時操作系統(tǒng)中,所述嵌入式實時操作系統(tǒng)通過人工智能引擎對所述待補償音頻信號進行特征提取,獲得音頻特征信息;
4、計算所述待補償音頻信號的頻譜波動,并基于所述頻譜波動和音頻特征信息對所述待補償音頻信號進行音頻類別識別,獲得待補償音頻信號對應的音頻類別;
5、獲取與所述音頻類別對應的用戶習慣信息,基于所述用戶習慣信息利用均衡器補償分析確定所述待補償音頻信號的第一補償參數;
6、獲取所述待補償音頻信號的頻率響應數據,基于所述頻率響應數據結合環(huán)境頻響參數利用脈沖響應分析生成目標校正系數,并基于所述目標校正系數對所述第一補償參數進行調整,獲得第二補償參數;
7、基于所述第二補償參數對所述待補償音頻信號進行補償,獲得目標音頻信號,并將所述目標音頻信號傳輸至揚聲器中,所述揚聲器播放所述目標音頻信號。
8、可選的,所述對所述待補償音頻信號進行特征提取,獲得音頻特征信息,包括:
9、對所述待補償音頻信號進行預處理,獲得預處理后的待補償音頻信號;
10、對預處理后的待補償音頻信號進行分割處理,獲得分割處理后的待補償音頻信號;
11、對分割處理后的待補償音頻信號進行短時音頻特征提取,獲得短時音頻特征信息;
12、對分割處理后的待補償音頻信號進行長時音頻特征提取,獲得長時音頻特征信息,并基于所述短時音頻特征信息和長時音頻特征信息生成音頻特征信息。
13、可選的,所述計算所述待補償音頻信號的頻譜波動,并基于所述頻譜波動和音頻特征信息對所述待補償音頻信號進行音頻類別識別,獲得待補償音頻信號對應的音頻類別,包括:
14、獲取所述待補償音頻信號中各音頻幀的頻譜高頻帶峰度;
15、獲取所述待補償音頻信號中各音頻幀的頻譜,計算各音頻幀的頻譜在中低頻帶頻譜上的對數能量差;
16、獲取所述待補償音頻信號中各音頻幀的梅爾頻率倒譜系數,基于所述梅爾頻率倒譜系數進行自然對數計算處理,獲得對數能量向量,并基于所述對數能量向量生成能量波動數據;
17、基于所述頻譜高頻帶峰度、對數能量差和能量波動數據生成頻譜波動;
18、將所述頻譜波動和音頻特征信息輸入至音頻分類模型中,所述音頻分類模型基于所述頻譜波動和音頻特征信息進行音頻類別識別,獲得待補償音頻信號對應的音頻類別,其中,所述音頻分類模型包括基于通道注意力機制的殘差門控卷積神經網絡和雙向長短期記憶網絡。
19、可選的,所述基于所述用戶習慣信息利用均衡器補償分析確定所述待補償音頻信號的第一補償參數,包括:
20、基于所述音頻類別確定對應的補償濾波器,并基于所述用戶習慣信息獲取所述補償濾波器的第一增益系數;
21、基于所述用戶習慣信息結合所述音頻特征信息計算音色增益因子和音量增益因子;
22、獲取所述待補償音頻信號的頻率分布曲線,確定所述頻率分布曲線中各頻點的幅度值,并基于所述用戶習慣信息結合各頻點的幅度值確定第二增益系數;
23、基于所述第一增益系數和第二增益系數計算均衡器增益系數,并基于所述均衡器增益系數、音色增益因子和音量增益因子確定所述待補償音頻信號的第一補償參數。
24、可選的,所述獲取所述待補償音頻信號的頻率響應數據,包括:
25、對所述待補償音頻信號進行短時傅里葉變換,獲得短時頻域信息;
26、基于所述短時頻域信息計算所述待補償音頻信號的自相關函數,并基于所述自相關函數確定線性預測誤差濾波器系數;
27、基于所述線性預測誤差濾波器系數利用滑動窗口和隨機抑制曲線進行頻率響應計算,獲得頻率響應數據。
28、可選的,所述基于所述頻率響應數據結合環(huán)境頻響參數利用脈沖響應分析生成目標校正系數,包括:
29、所述嵌入式實時操作系統(tǒng)控制所述音頻拾取器采集當前環(huán)境的測試音頻信號,并獲取所述測試音頻信號的音頻參數;
30、基于測試音頻信號的音頻參數結合預設標準音頻信號的音頻參數生成環(huán)境頻響參數;
31、獲取所述測試音頻信號的波峰出現(xiàn)時間,基于所述波峰出現(xiàn)時間結合預設頭相關傳輸函數進行脈沖響應分析,獲得脈沖響應數據;
32、基于所述頻率響應數據、環(huán)境頻響參數和脈沖響應數據進行計算,獲得目標校正系數。
33、可選的,所述基于所述第二補償參數對所述待補償音頻信號進行補償,獲得目標音頻信號,包括:
34、基于所述第二補償參數結合濾波器系數對所述待補償音頻信號進行動態(tài)校正,獲得目標音頻信號。
35、另外,本發(fā)明還提供了一種基于ai控制的音頻信號補償裝置,應用于音頻拾取器、嵌入式實時操作系統(tǒng)和揚聲器,所述嵌入式實時操作系統(tǒng)分別與所述音頻拾取器和揚聲器連接;所述裝置包括:
36、音頻特征提取模塊:用于基于音頻拾取器獲取待補償音頻信號,并將所述待補償音頻信號傳輸至嵌入式實時操作系統(tǒng)中,所述嵌入式實時操作系統(tǒng)通過人工智能引擎對所述待補償音頻信號進行特征提取,獲得音頻特征信息;
37、音頻類別識別模塊:用于計算所述待補償音頻信號的頻譜波動,并基于所述頻譜波動和音頻特征信息對所述待補償音頻信號進行音頻類別識別,獲得待補償音頻信號對應的音頻類別;
38、第一補償參數獲取模塊:用于獲取與所述音頻類別對應的用戶習慣信息,基于所述用戶習慣信息利用均衡器補償分析確定所述待補償音頻信號的第一補償參數;
39、第二補償參數獲取模塊:用于獲取所述待補償音頻信號的頻率響應數據,基于所述頻率響應數據結合環(huán)境頻響參數利用脈沖響應分析生成目標校正系數,并基于所述目標校正系數對所述第一補償參數進行調整,獲得第二補償參數;
40、音頻信號補償模塊:用于基于所述第二補償參數對所述待補償音頻信號進行補償,獲得目標音頻信號,并將所述目標音頻信號傳輸至揚聲器中,所述揚聲器播放所述目標音頻信號。
41、另外,本發(fā)明還提供了一種基于ai控制的音頻信號補償系統(tǒng),所述系統(tǒng)包括音頻拾取器、嵌入式實時操作系統(tǒng)和揚聲器,所述嵌入式實時操作系統(tǒng)分別與所述音頻拾取器和揚聲器連接,所述系統(tǒng)被配置為用于執(zhí)行上述的基于ai控制的音頻信號補償方法。
42、另外,本發(fā)明還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲計算機指令,當所述計算機指令在電子設備上運行時,使得所述電子設備執(zhí)行上述的基于ai控制的音頻信號補償方法。
43、在本發(fā)明實施例中,基于頻譜波動和音頻特征信息對待補償音頻信號進行音頻類別識別,能夠提高音頻類別識別的準取性,極大地減少了人力成本的投入。基于用戶習慣信息利用均衡器補償分析確定待補償音頻信號的第一補償參數,考慮到用戶習慣信息對音頻信號補償的影響,提高音頻信號補償的智能性,使最終所播放的音頻更為貼合用戶的日常習慣。獲取待補償音頻信號的頻率響應數據,基于頻率響應數據結合環(huán)境頻響參數利用脈沖響應分析生成目標校正系數以對第一補償參數進行調整,生成第二補償參數,通過分析待補償音頻信號的頻率響應數據能夠使音頻輸出更為平坦,同時結合環(huán)境頻響參數利用脈沖響應分析來生成最終的補償參數,能夠最大幅度地避免空間環(huán)境對音頻信號的干擾。通過第二補償參數對待補償音頻信號進行補償以生成目標音頻信號,更好地實現(xiàn)音頻信號的智能化控制,使最終所播放的音頻能夠更為貼近理想播放效果,提高了用戶的聽覺感受,使音頻信號補償達到更為理想的效果。