本發(fā)明涉及耳機(jī)降噪,特別涉及一種耳機(jī)降噪的控制方法。
背景技術(shù):
1、隨著電子技術(shù)的快速發(fā)展,無線耳機(jī)已經(jīng)成為人們?nèi)粘3鲂斜夭豢缮俚奈锲?。在面對各種相對嘈雜的環(huán)境時(shí),人們通常會選擇佩戴無線耳機(jī)來降低環(huán)境噪聲的影響。
2、不同的噪聲環(huán)境對于降噪程度的需求是不同的,為更好地應(yīng)對多變的噪聲環(huán)境,現(xiàn)有的部分無線耳機(jī)采用了自適應(yīng)降噪的方式來降低環(huán)境噪聲的影響。然而,現(xiàn)有的自適應(yīng)降噪的方法并不能相對精準(zhǔn)高效地識別出噪聲場景,這導(dǎo)致了降噪程度需求的匹配度低,且現(xiàn)有的自適應(yīng)降噪的功耗較高,進(jìn)而影響用戶的使用體驗(yàn)。
3、鑒于此,有必要提供耳機(jī)降噪的控制方法以解決上述的問題。
技術(shù)實(shí)現(xiàn)思路
1、鑒于現(xiàn)有技術(shù)存在的不足,本發(fā)明提供一種耳機(jī)降噪的控制方法,其旨在解決耳機(jī)自適應(yīng)降噪的場景識別效率與精確性較低,且功耗配置不合理,對用戶多樣的使用需要求和復(fù)雜使用場景的適配性低的技術(shù)問題。
2、為實(shí)現(xiàn)上述的目的,本發(fā)明的第一方面提供一種耳機(jī)降噪的控制方法,其包括:
3、獲取耳機(jī)當(dāng)前的所處場景的環(huán)境音頻信號;
4、檢測是否可獲取到耳機(jī)當(dāng)前的位置信息;
5、若否,則根據(jù)環(huán)境音頻信號,確定出目標(biāo)場景類型;
6、若是,則獲取耳機(jī)當(dāng)前的位置信息和剩余電量參數(shù);
7、檢測剩余電量參數(shù)是否大于預(yù)設(shè)的電量閾值;
8、若否,則根據(jù)位置信息與環(huán)境音頻信號,確定出目標(biāo)場景類型;
9、若是,則獲取耳機(jī)當(dāng)前的姿態(tài)信息;
10、基于環(huán)境音頻信號、位置信息、姿態(tài)信息與預(yù)設(shè)的配置了代理注意力機(jī)制的改進(jìn)transformer模型,確定出目標(biāo)場景類型;
11、獲取目標(biāo)場景類型對應(yīng)的降噪?yún)?shù),作為目標(biāo)降噪?yún)?shù)。
12、在一個(gè)優(yōu)選的實(shí)施方式中,根據(jù)環(huán)境音頻信號,確定出目標(biāo)場景類型的步驟包括:
13、根據(jù)環(huán)境音頻信號,得到第一頻譜與第二頻譜;
14、基于第一頻譜與預(yù)設(shè)的第一提取模式,得到幅值特征矩陣;
15、基于第二頻譜與預(yù)設(shè)的第二提取模式,得到若干能量特征值;
16、獲取幅值特征矩陣與預(yù)設(shè)的場景類型的比較矩陣的相似系數(shù);
17、基于相似系數(shù),從場景類型中篩選出特定場景類型;
18、根據(jù)能量特征值、相似系數(shù)與特定場景類型,確定出目標(biāo)場景類型
19、在一個(gè)優(yōu)選的實(shí)施方式中,基于第一頻譜與預(yù)設(shè)的第一提取模式,得到幅值特征矩陣的步驟包括:
20、獲取預(yù)設(shè)的截取時(shí)寬、第一截取頻寬與初始矩陣;
21、基于第一頻譜、截取時(shí)寬與第一截取頻寬,得到若干第一目標(biāo)頻譜;
22、依序?qū)⒌谝荒繕?biāo)頻譜與初始矩陣的元素一一對應(yīng)關(guān)聯(lián);
23、分別計(jì)算第一目標(biāo)頻譜的幅值特征參數(shù);
24、根據(jù)幅值特征參數(shù)的大小,調(diào)整初始矩陣中同一預(yù)設(shè)目標(biāo)維度上對應(yīng)元素的位置,得到幅值特征矩陣。
25、在一個(gè)優(yōu)選的實(shí)施方式中,根據(jù)能量特征值、相似系數(shù)與特定場景類型,確定出目標(biāo)場景類型的步驟包括:
26、獲取特定場景類型預(yù)設(shè)的能量區(qū)間;
27、依次判定能量特征值是否落入于對應(yīng)的能量區(qū)間;
28、獲取能量特征值落入各個(gè)特定場景類型的能量區(qū)間的落入數(shù)量;
29、基于落入數(shù)量與相似系數(shù),從特定場景類型中確定出目標(biāo)場景類型。
30、在一個(gè)優(yōu)選的實(shí)施方式中,根據(jù)位置信息與環(huán)境音頻信號,確定出目標(biāo)場景類型的步驟包括:
31、從位置信息中獲取關(guān)鍵位置信息;
32、從環(huán)境音頻信號中獲取環(huán)境音頻頻譜;
33、基于關(guān)鍵位置信息,確定出初始場景類型與關(guān)聯(lián)場景類型;
34、根據(jù)環(huán)境音頻頻譜與預(yù)設(shè)的提取模式,得到若干的能量特征值;
35、根據(jù)能量特征值,從初始場景類型與關(guān)聯(lián)場景類型中確定出目標(biāo)場景類型。
36、在一個(gè)優(yōu)選的實(shí)施方式中,基于關(guān)鍵位置信息,確定出初始場景類型與關(guān)聯(lián)場景類型的步驟包括:
37、獲取關(guān)鍵位置信息與預(yù)設(shè)的場景類型的適配值;
38、基于適配值,從預(yù)設(shè)的場景類型中確定出初始場景類型;
39、獲取初始場景類型與余下的場景類型的關(guān)聯(lián)值;
40、基于關(guān)聯(lián)值與預(yù)設(shè)的第一閾值,從余下的場景類型中得到關(guān)聯(lián)場景類型。
41、在一個(gè)優(yōu)選的實(shí)施方式中,根據(jù)能量特征值,從初始場景類型與關(guān)聯(lián)場景類型中確定出目標(biāo)場景類型的步驟包括:
42、獲取初始場景類型的能量區(qū)間與關(guān)聯(lián)場景類型的能量區(qū)間;
43、獲取能量特征值落入于初始場景類型的能量區(qū)間與關(guān)聯(lián)場景類型的能量區(qū)間的落入數(shù)量;
44、基于落入數(shù)量,得到目標(biāo)場景類型。
45、在一個(gè)優(yōu)選的實(shí)施方式中,基于環(huán)境音頻信號、位置信息、姿態(tài)信息與預(yù)設(shè)的配置了代理注意力機(jī)制的改進(jìn)transformer模型,確定出目標(biāo)場景類型的步驟包括:
46、從環(huán)境音頻信號中提取出音頻特征序列;
47、從位置信息與姿態(tài)信息中提取出輔助特征序列;
48、將音頻特征序列與輔助特征序列輸入到配置了代理注意力機(jī)制的改進(jìn)transformer模型中,得到各場景類型的匹配值;
49、根據(jù)匹配值的大小,得到目標(biāo)場景類型。
50、在一個(gè)優(yōu)選的實(shí)施方式中,將音頻特征序列與輔助特征序列輸入到配置了代理注意力機(jī)制的改進(jìn)transformer模型中,得到各場景類型的匹配值的步驟包括:
51、對音頻特征序列與輔助特征序列進(jìn)行映射與編碼,分別得到音頻增強(qiáng)序列與輔助增強(qiáng)序列;
52、基于音頻增強(qiáng)序列、輔助增強(qiáng)序列與預(yù)設(shè)的代理注意力機(jī)制,得到增強(qiáng)特征矩陣;
53、基于預(yù)設(shè)的全連接層與增強(qiáng)特征矩陣,得到各場景類型的匹配值。
54、在一個(gè)優(yōu)選的實(shí)施方式中,基于音頻增強(qiáng)序列、輔助增強(qiáng)序列與預(yù)設(shè)的代理注意力機(jī)制,得到增強(qiáng)特征矩陣的步驟包括:
55、根據(jù)音頻增強(qiáng)序列與預(yù)設(shè)的轉(zhuǎn)換權(quán)重矩陣,分別得到第一矩陣、第二矩陣與第三矩陣;
56、根據(jù)輔助增強(qiáng)序列與預(yù)設(shè)的代理轉(zhuǎn)換矩陣,得到代理矩陣;
57、將代理矩陣、第二矩陣與第三矩陣進(jìn)行交互計(jì)算,得到融合矩陣;
58、將第一矩陣、代理矩陣與融合矩陣進(jìn)行交互計(jì)算,得到注意力權(quán)重矩陣;
59、將注意力權(quán)重矩陣與第三矩陣進(jìn)行加權(quán)求和,得到增強(qiáng)特征矩陣。
60、本發(fā)明的第二方面提供一種耳機(jī),其包括存儲器、處理器以及存儲在存儲器中并可在處理器上運(yùn)行的計(jì)算機(jī)程序,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述任一項(xiàng)的耳機(jī)降噪的控制方法的步驟。
61、本發(fā)明的第三方面提供一種計(jì)算機(jī)可讀存儲介質(zhì),計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一項(xiàng)的耳機(jī)降噪的控制方法的步驟。
62、本發(fā)明的有益效果在于:其通過耳機(jī)當(dāng)前的位置信息與剩余電量,劃分出根據(jù)不同參數(shù)信息獲取降噪?yún)?shù)的模式,在未獲取到位置信息時(shí),則直接利用環(huán)境音頻信號進(jìn)行場景識別,實(shí)現(xiàn)對場景類型的快速確定;在獲取到位置信息后,若電量未滿足要求,則結(jié)合環(huán)境音頻信號與位置信息,實(shí)現(xiàn)對場景類型的快速初篩與側(cè)重復(fù)篩;若電量滿足要求,則利用改進(jìn)transformer模型和多源特征信息,在保持較低計(jì)算復(fù)雜性的同時(shí),實(shí)現(xiàn)對復(fù)雜音頻場景類型的別與分類;合理配置了耳機(jī)的降噪功耗,優(yōu)化了降噪?yún)?shù)的獲取方式,提高了自適應(yīng)降噪的效率與精確性,提高了耳機(jī)應(yīng)對用戶多樣使用需求與使用場景的適配性,改善用戶的使用體驗(yàn)。