本發(fā)明涉及音頻處理,尤其涉及一種音量顯示方法、裝置、設備及存儲介質(zhì)。
背景技術:
1、傳統(tǒng)音頻設備通常采用固定的標準顯示實時音量水平,這種方法反映了音頻信號的電平大小。在早期模擬音頻設備中,這種固定音量表顯示方式表現(xiàn)良好,但隨著數(shù)字音頻技術的發(fā)展和智能設備的普及,其局限性日益凸顯。固定音量表顯示無法適應不同音頻內(nèi)容的動態(tài)范圍差異,導致在某些情況下音量顯示不夠精確或不能反映真實的聽感。同時,它也無法考慮環(huán)境噪聲的影響,在不同環(huán)境下可能導致音量顯示與實際感知不符。此外,不同用戶對音量顯示的偏好存在差異,固定音量表難以滿足個性化顯示需求。因此,傳統(tǒng)固定音量表顯示方式難以充分適應現(xiàn)有音頻內(nèi)容和用戶需求,導致音量顯示的準確性較低。
技術實現(xiàn)思路
1、本發(fā)明的主要目的在于解決傳統(tǒng)固定音量表顯示方式難以充分適應現(xiàn)有音頻內(nèi)容和用戶需求,導致音量顯示的準確性較低的問題。
2、本發(fā)明第一方面提供了一種音量顯示方法,包括:獲取音頻設備的音頻信號、環(huán)境噪聲和初始音量顯示設置;基于所述音頻信號進行分析,得到音頻類型和第一音量值;將所述音頻類型、所述環(huán)境噪聲和所述初始音量顯示設置輸入預置的用戶偏好模型,得到第二音量值;計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值;對所述第一音量值、所述第二音量值和所述第三音量值分配對應的權重;基于所述第一音量值、所述第二音量值和所述第三音量值及對應的權重計算出綜合音量值;將所述綜合音量值進行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果。
3、在一種可行的實施方式中,所述基于所述音頻信號進行分析,得到音頻類型和第一音量值,包括:將所述音頻信號輸入預置的音頻分類模型,得到所述音頻信號對應的音頻類型;計算所述音頻信號的動態(tài)范圍;對所述音頻信號進行頻譜分析,得到頻譜分析結(jié)果;基于所述動態(tài)范圍和所述頻譜分析結(jié)果確定第一音量值。
4、在一種可行的實施方式中,所述計算所述音頻信號的動態(tài)范圍,包括:計算所述音頻信號的峰值電平和均方根電平;計算所述峰值電平和所述均方根電平之間的差值,得到音頻信號的動態(tài)范圍。
5、在一種可行的實施方式中,所述對所述音頻信號進行頻譜分析,得到頻譜分析結(jié)果,包括:計算所述音頻信號中各頻段的能量;對各頻段的能量進行權重分配;基于各頻段的能量和分配的權重計算出頻譜能量總和。
6、在一種可行的實施方式中,所述基于所述動態(tài)范圍和所述頻譜分析結(jié)果確定第一音量值,包括:對所述動態(tài)范圍進行標準化,得到目標動態(tài)范圍;基于所述頻譜能量總和、所述目標動態(tài)范圍及預設的調(diào)整系數(shù)計算出第一音量值。
7、在一種可行的實施方式中,所述計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值,包括:計算所述環(huán)境噪聲的短時rms值;計算所述短時rms值的平均值,得到噪聲水平;根據(jù)所述噪聲水平,通過預設的映射關系查詢對應的第三音量值。
8、在一種可行的實施方式中,所述基于所述第一音量值、所述第二音量值和所述第三音量值及對應的權重計算出綜合音量值,包括:分別計算所述第一音量值、所述第二音量值和所述第三音量值與對應權重的乘積,并將計算結(jié)果進行加和,得到綜合音量值。
9、在一種可行的實施方式中,在所述獲取音頻設備的音頻信號、環(huán)境噪聲和初始音量顯示設置之前,還包括:獲取所述音頻設備的歷史使用記錄,所述歷史使用記錄包括歷史音頻類型、歷史環(huán)境噪聲水平、歷史初始音量顯示設置和歷史最終音量;將所述歷史音頻類型、所述歷史環(huán)境噪聲水平和所述歷史初始音量顯示設置作為輸入,所述歷史最終音量顯示作為輸出,對預置的學習模型進行訓練,得到用戶偏好模型。
10、在一種可行的實施方式中,在獲取音頻設備的音頻信號、音頻類型、環(huán)境噪聲和初始音量顯示設置之前,還包括:構(gòu)建不同音頻類型的音量標準曲線,并基于所述音量標準曲線創(chuàng)建查找表。
11、在一種可行的實施方式中,所述將所述綜合音量值進行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果,包括:在所述查找表中查找所述綜合音量值對應的映射條目,得到音量顯示值;基于所述音量顯示值更新用戶界面上的音量顯示元素。
12、在一種可行的實施方式中,在所述將所述綜合音量值進行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果之后,還包括:當接收到標準修改指令時,通過預置的標準轉(zhuǎn)換矩陣字典對顯示標準進行轉(zhuǎn)換;實時監(jiān)測設備的性能指標,根據(jù)所述性能指標的變化對音量顯示的刷新率進行調(diào)整。
13、在一種可行的實施方式中,所述通過預置的標準轉(zhuǎn)換矩陣字典對顯示標準進行轉(zhuǎn)換,包括:解析所述標準修改指令,提取出原顯示標準和目標顯示標準;基于所述原顯示標準和目標顯示標準在預置的標準轉(zhuǎn)換矩陣字典中查找對應的轉(zhuǎn)換矩陣;基于所述轉(zhuǎn)換矩陣,根據(jù)目標顯示標準對當前顯示數(shù)據(jù)進行轉(zhuǎn)換,以使顯示數(shù)據(jù)在目標顯示標準下顯示。
14、本發(fā)明第二方面提供了一種音量顯示裝置,包括:第一獲取模塊,用于獲取音頻設備的音頻信號、環(huán)境噪聲和初始音量顯示設置;分析模塊,用于基于所述音頻信號進行分析,得到音頻類型和第一音量值;處理模塊,用于將所述音頻類型、所述環(huán)境噪聲和所述初始音量顯示設置輸入預置的用戶偏好模型,得到第二音量值;第一計算模塊,用于計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值;分配模塊,用于對所述第一音量值、所述第二音量值和所述第三音量值分配對應的權重;第二計算模塊,用于基于所述第一音量值、所述第二音量值和所述第三音量值及對應的權重計算出綜合音量值;映射模塊,用于將所述綜合音量值進行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果。
15、在一種可行的實施方式中,所述分析模塊包括:輸入單元,用于將所述音頻信號輸入預置的音頻分類模型,得到所述音頻信號對應的音頻類型;計算單元,用于計算所述音頻信號的動態(tài)范圍;分析單元,用于對所述音頻信號進行頻譜分析,得到頻譜分析結(jié)果;確定單元,用于基于所述動態(tài)范圍和所述頻譜分析結(jié)果確定第一音量值。
16、在一種可行的實施方式中,所述計算單元具體用于:計算所述音頻信號的峰值電平和均方根電平;計算所述峰值電平和所述均方根電平之間的差值,得到音頻信號的動態(tài)范圍。
17、在一種可行的實施方式中,所述分析單元具體用于:計算所述音頻信號中各頻段的能量;對各頻段的能量進行權重分配;基于各頻段的能量和分配的權重計算出頻譜能量總和。
18、在一種可行的實施方式中,所述確定單元具體用于:對所述動態(tài)范圍進行標準化,得到目標動態(tài)范圍;基于所述頻譜能量總和、所述目標動態(tài)范圍及預設的調(diào)整系數(shù)計算出第一音量值。
19、在一種可行的實施方式中,所述處理模塊具體用于:計算所述環(huán)境噪聲的短時rms值;計算所述短時rms值的平均值,得到噪聲水平;根據(jù)所述噪聲水平,通過預設的映射關系查詢對應的第三音量值。
20、在一種可行的實施方式中,所述第二計算模塊具體用于:分別計算所述第一音量值、所述第二音量值和所述第三音量值與對應權重的乘積,并將計算結(jié)果進行加和,得到綜合音量值。
21、在一種可行的實施方式中,所述音量顯示裝置還包括:第二獲取模塊,用于獲取所述音頻設備的歷史使用記錄,所述歷史使用記錄包括歷史音頻類型、歷史環(huán)境噪聲水平、歷史初始音量顯示設置和歷史最終音量;訓練模塊,用于將所述歷史音頻類型、所述歷史環(huán)境噪聲水平和所述歷史初始音量顯示設置作為輸入,所述歷史最終音量顯示作為輸出,對預置的學習模型進行訓練,得到用戶偏好模型。
22、在一種可行的實施方式中,所述音量顯示裝置還包括:創(chuàng)建模塊,用于構(gòu)建不同音頻類型的音量標準曲線,并基于所述音量標準曲線創(chuàng)建查找表。
23、在一種可行的實施方式中,所述映射模塊具體用于:在所述查找表中查找所述綜合音量值對應的映射條目,得到音量顯示值;基于所述音量顯示值更新用戶界面上的音量顯示元素。
24、在一種可行的實施方式中,所述音量顯示裝置還包括:轉(zhuǎn)換模塊,用于當接收到標準修改指令時,通過預置的標準轉(zhuǎn)換矩陣字典對顯示標準進行轉(zhuǎn)換;調(diào)整模塊,用于實時監(jiān)測設備的性能指標,根據(jù)所述性能指標的變化對音量顯示的刷新率進行調(diào)整。
25、在一種可行的實施方式中,所述轉(zhuǎn)換模塊具體用于:解析所述標準修改指令,提取出原顯示標準和目標顯示標準;基于所述原顯示標準和目標顯示標準在預置的標準轉(zhuǎn)換矩陣字典中查找對應的轉(zhuǎn)換矩陣;基于所述轉(zhuǎn)換矩陣,根據(jù)目標顯示標準對當前顯示數(shù)據(jù)進行轉(zhuǎn)換,以使顯示數(shù)據(jù)在目標顯示標準下顯示。
26、本發(fā)明第三方面提供了一種音量顯示設備,包括:存儲器和至少一個處理器,所述存儲器中存儲有指令;所述至少一個處理器調(diào)用所述存儲器中的所述指令,以使得所述音量顯示設備執(zhí)行上述的音量顯示方法。
27、本發(fā)明的第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)中存儲有指令,當其在計算機上運行時,使得計算機執(zhí)行上述的音量顯示方法。
28、本發(fā)明提供的技術方案中,獲取音頻設備的音頻信號、環(huán)境噪聲和初始音量顯示設置;基于所述音頻信號進行分析,得到音頻類型和第一音量值;將所述音頻類型、所述環(huán)境噪聲和所述初始音量顯示設置輸入預置的用戶偏好模型,得到第二音量值;計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值;對所述第一音量值、所述第二音量值和所述第三音量值分配對應的權重;基于所述第一音量值、所述第二音量值和所述第三音量值及對應的權重計算出綜合音量值;將所述綜合音量值進行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果。本發(fā)明實施例中,通過多因素融合和權重分配機制,使得音量計算更加精確和符合實際需求,提高了音量顯示的準確性和可靠性。