語音活動檢測方法和頭戴式耳機與流程

文檔序號：40386052發(fā)布日期：2024-12-20 12:08閱讀：4來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本技術(shù)涉及降噪領(lǐng)域，具體而言，涉及一種語音活動檢測方法、語音活動檢測方法、頭戴式耳機。

背景技術(shù)：

1、隨著遠(yuǎn)程會議的普及，用戶在嘈雜的開放式環(huán)境中進(jìn)行通話、會議的需求也越來越高，這對耳機降噪能力的要求也越來越高。

2、目前，降噪耳機在工作時，需要對麥克風(fēng)對采集到的語音信號幀進(jìn)行語音活動檢測，也即判斷該語音信號幀為噪聲幀或語音幀，再對噪聲幀進(jìn)行抑制。

3、現(xiàn)有的不同語音活動檢測方式在檢測區(qū)分時噪聲幀和語音幀存在檢測準(zhǔn)確性較低的問題。例如，部分檢測方法無法跟蹤噪聲譜的快速變化，在嘈雜的環(huán)境中檢測準(zhǔn)確性較低；部分檢測方法無法區(qū)分用戶自身的語音和旁人的語音，在環(huán)境噪聲較大時的準(zhǔn)確性較低。

技術(shù)實現(xiàn)思路

1、有鑒于此，本技術(shù)旨在提供一種語音活動檢測方法和頭戴式耳機，以提高語音活動的檢測準(zhǔn)確性，進(jìn)而提高耳機的降噪效果。

2、首先，本技術(shù)實施例提供一種語音活動檢測方法，應(yīng)用于耳機的處理單元，所述語音活動檢測方法包括：獲取同一幀聲音對應(yīng)的多路麥克語音信號，一幀所述多路麥克語音信號包括所述同一幀聲音對應(yīng)的前向語音信號和后向語音信號，所述前向語音信號為預(yù)設(shè)用戶聲音傳播方向上的語音信號，所述后向語音信號為與預(yù)設(shè)用戶聲音傳播方向的反方向上的語音信號；計算所述前向語音信號和所述后向語音信號的相關(guān)性和第一能量比值；基于所述相關(guān)性和所述第一能量比值確定所述多路麥克語音信號的類型，所述多路麥克語音信號的類型為語音幀或噪聲幀。

3、本技術(shù)實施例中，對每幀聲音進(jìn)行語音活動檢測，可以實現(xiàn)對噪聲譜的快速變化進(jìn)行跟蹤，從而在嘈雜的環(huán)境中也能夠具有較高的檢測準(zhǔn)確性。前向語音信號為預(yù)設(shè)用戶聲音傳播方向上的語音信號，其能有效抑制噪聲的特征，體現(xiàn)出用戶發(fā)出的語音的特征，反之，反向語音信號為傳播方向反方向上的信號，能夠較好地抑制用戶語音的特征，更好地體現(xiàn)出噪聲的特征，利用前向語音信號和后向語音信號進(jìn)行噪聲幀和語音幀的判斷，能夠有效提高檢測準(zhǔn)確性。相應(yīng)地，在判斷是否為語音幀和噪聲幀時，前向語音信號和后向語音信號的第一能量比值的過大或過小能夠有效表征二者是否同為噪聲幀或語音幀。前向語音信號和后向語音信號所抑制的方向不同，突出的語音特征不同，因此，在二者的第一能量比值無法區(qū)分噪聲幀和語音幀時，再結(jié)合相關(guān)性進(jìn)行判斷，可以得到更為準(zhǔn)確的檢測結(jié)果。

4、一實施例中，所述耳機為頭戴式耳機，所述頭戴式耳機包括咪桿，所述咪桿上設(shè)置第一麥克風(fēng)和第二麥克風(fēng)；所述獲取同一幀聲音對應(yīng)的多路麥克語音信號，包括：獲取對所述同一幀聲音進(jìn)行采集時，所述咪桿上所述第一麥克風(fēng)采集的第一語音信號和所述第二麥克風(fēng)采集的第二語音信號；對所述第一語音信號和所述第二語音信號進(jìn)行前向波束成形處理，得到所述前向語音信號；對所述第一語音信號和所述第二語音信號進(jìn)行后向波束成形處理，得到所述后向語音信號。

5、本技術(shù)實施例中，相較于耳機腔體設(shè)置的麥克風(fēng)，咪桿上設(shè)置的麥克風(fēng)能夠更靠近音源，也即用戶嘴部，咪桿上麥克風(fēng)采集的語音信號具有更高的信噪比，利用咪桿上麥克風(fēng)采集的第一語音信號和第二語音信號進(jìn)行語音活動檢測，可以有效提高語音活動檢測的準(zhǔn)確性。

6、一實施例中，在所述咪桿上，所述第一麥克風(fēng)和所述第二麥克風(fēng)間隔預(yù)設(shè)距離。

7、本技術(shù)實施例中，波束成形處理需使用差分信號，若第一麥克風(fēng)和第二麥克風(fēng)距離過近，則可能使得二者采集的語音信號的區(qū)別較小，無法用于波束成形，因此，使第一麥克風(fēng)和第二麥克風(fēng)間隔一定的距離，可以使得二者各自采集的語音信號具有較為明顯的差異，有助于提高波束成形的效果，進(jìn)而提高基于波束成形的前向語音信號和后向語音信號進(jìn)行語音活動檢測的準(zhǔn)確性。

8、一實施例中，所述預(yù)設(shè)距離的取值范圍為2厘米至4厘米。

9、本實施例中，對于頭戴式耳機，使得預(yù)設(shè)距離在2厘米至4厘米的范圍內(nèi)，可以使得第一語音信號和第二語音信號具有明顯差異的同時，避免距離過大使得第一語音信號和第二語音信號差異多大而無法通過波束成形準(zhǔn)確確定出共同的前向或后向特征的情況。

10、一實施例中，所述基于所述相關(guān)性和所述第一能量比值確定語音活動檢測結(jié)果，包括：若所述第一能量比值小于或等于第一預(yù)設(shè)能量比閾值，則確定所述多路麥克語音信號中各語音信號對應(yīng)的類型為所述噪聲幀；若所述第一能量比值大于或等于第二預(yù)設(shè)能量比閾值，則確定所述多路麥克語音信號各語音信號對應(yīng)的類型為所述語音幀；所述第二預(yù)設(shè)能量比閾值大于所述第一預(yù)設(shè)能量比閾值；若所述第一能量比值在所述第一預(yù)設(shè)能量比閾值和所述第二預(yù)設(shè)能量比閾值之間，則判斷：若所述相關(guān)性小于預(yù)設(shè)相關(guān)性閾值，則確定所述多路麥克語音信號各語音信號對應(yīng)的類型為所述噪聲幀；若所述相關(guān)性大于所述預(yù)設(shè)相關(guān)性閾值，則確定所述多路麥克語音信號各語音信號對應(yīng)的類型為所述語音幀。

11、本技術(shù)實施例中，第一能量比值為前向語音信號和后向語音信號的能量比值，前向語音信號和后向語音信號所體現(xiàn)的特征不同，分別為前向和后向的聲音特征，若第一能量比值較小，則表征后向語音信號較大，進(jìn)而意味著噪聲信號較大，因此，可以在第一能量比值大于第二預(yù)設(shè)能量比閾值的情況下直接確定為噪聲幀，反之，若第一能量比值較大，大于第一預(yù)設(shè)能量比閾值甚至接近于1，則意味著后向語音信號與前向語音信號相似，則大概率為語音幀。對于第一能量比值在第一預(yù)設(shè)能量比閾值和第二預(yù)設(shè)能量比閾值之間時，則存在干擾影響，但干擾的大小不確定，無法直接確定語音幀或噪聲幀，因此，在該情況下，可以結(jié)合相關(guān)性進(jìn)行判斷，在第一能量比值處于第一預(yù)設(shè)能量比閾值和第二預(yù)設(shè)能量比閾值之間時，若二者相關(guān)性較小，則表征噪聲較大，可以判斷為噪聲幀，反之，若二者相關(guān)性較大，則表征噪聲較小，可以判斷為語音幀。通過上述方式，可以準(zhǔn)確判斷不同情況下的語音活動，得到較為準(zhǔn)確的檢測結(jié)果。

12、一實施例中，所述頭戴式耳機包括左耳機、右耳機、第三麥克風(fēng)和第四麥克風(fēng)；所述第三麥克風(fēng)設(shè)置于所述左耳機上，所述第四麥克風(fēng)設(shè)置于所述右耳機上；所述多路麥克語音信號還包括所述第三麥克風(fēng)采集的第三語音信號和所述第四麥克風(fēng)采集的第四語音信號；所述語音活動檢測方法，還包括：在所述第一能量比值大于或等于所述第一預(yù)設(shè)能量比閾值的情況下，獲取并確定所述第三語音信號和所述第四語音信號之間的第二能量比值；若所述第二能量比值大于第五能量閾值，或，所述第二能量比值小于第六能量閾值，則重新確定所述多路麥克語音信號的類型為所述噪聲幀；所述第五能量閾值大于所述第六能量閾值。

13、本技術(shù)實施例中，在第一能量比值大于或等于所述第一預(yù)設(shè)能量比閾值的情況下，其有可能是用戶兩側(cè)的噪聲信號較大的原因，兩側(cè)的噪聲在前向和后向的能量比值是相似的，因此，在該情況下，可以在結(jié)合耳機兩側(cè)的第三麥克風(fēng)和第四麥克風(fēng)采集的語音信號計算第二能量比值，通過第二能量比值表征用戶兩側(cè)的聲音大小，輔助判斷是否為噪聲幀，若第二能量比值過大或過小，均表征為噪聲幀，由此，通過第二能量比值進(jìn)一步對噪聲幀進(jìn)行判斷，可以提高語音活動檢測的準(zhǔn)確性。

14、一實施例中，所述計算所述前向語音信號和所述后向語音信號的相關(guān)性和第一能量比值，包括：基于所述前向語音信號和所述后向語音信號中預(yù)設(shè)頻率范圍的語音信號計算所述相關(guān)性和所述第一能量比值；所述預(yù)設(shè)頻率范圍與人聲的頻率范圍匹配。

15、本實施例中，預(yù)設(shè)頻率范圍與人聲的頻率范圍匹配，截取人聲頻率范圍的語音信號計算相關(guān)性和能量比值，可以更為準(zhǔn)確地截取到前向語音信號和后向語音信號中的人聲特征，特別是耳機用戶的聲音，基于該預(yù)設(shè)頻率范圍的語音信號計算相關(guān)性和第一能量比值，使得相關(guān)性和第一能量比值與人聲之間的關(guān)聯(lián)性更大，進(jìn)而基于相關(guān)性和第一能量比值確定的噪聲幀和語音幀更準(zhǔn)確。

16、一實施例中，所述處理單元中配置有具有不同噪聲抑制方式的多個噪聲抑制模塊；所述基于所述相關(guān)性和所述第一能量比值確定所述多路麥克語音信號的類型之后，所述語音活動檢測方法還包括：基于具有不同噪聲抑制方式的多個所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理，得到各所述噪聲抑制模塊輸出的增益；基于預(yù)設(shè)的增益選取條件，從各所述噪聲抑制模塊輸出的增益中確定出目標(biāo)增益；使用所述目標(biāo)增益對所述前向語音信號進(jìn)行降噪。

17、本實施例中，通過設(shè)置多個噪聲抑制模塊確定多個降噪的增益，由此，在針對不同場景下的語音信號，能夠確定出更為合適的目標(biāo)增益進(jìn)行降噪，以提高降噪效果。

18、一實施例中，所述處理單元還包括自適應(yīng)濾波器，多個所述噪聲抑制模塊包括：單麥克噪聲抑制模塊，以及殘余非線性回聲消除模塊；所述基于具有不同噪聲抑制方式的多個所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理之前，所述方法還包括：將所述前向語音信號輸入所述自適應(yīng)濾波器，得到自適應(yīng)濾波后的前向語音信號；其中，若所述前向語音信號為所述噪聲幀時，所述自適應(yīng)濾波器基于所述噪聲幀調(diào)整自身的濾波器系數(shù)；所述基于具有不同噪聲抑制方式的多個所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理，得到各所述噪聲抑制模塊輸出的增益，包括：將所述自適應(yīng)濾波后的前向語音信號輸入所述殘余非線性回聲消除模塊進(jìn)行殘余非線性回聲消除處理，得到第一增益；將所述自適應(yīng)濾波后的前向語音信號輸出至所述單麥克噪聲抑制模塊，得到所述單麥克噪聲抑制模塊進(jìn)行噪聲抑制后輸出的第二增益。

19、耳機中的自適應(yīng)濾波器會調(diào)整自身的濾波器系數(shù)，以調(diào)整對噪聲的濾波能力，而若輸入自適應(yīng)濾波器的語音信號為語音幀，則可能使得語音信號幀中的人聲出現(xiàn)失真，因此，本技術(shù)實施例中，在將前向語音信號輸入自適應(yīng)濾波器及各噪聲抑制模塊計算增益前，先判斷是否為噪聲幀，在噪聲幀的情況下，再更新自適應(yīng)濾波器的系數(shù)，濾波器更新后，再計算第一增益能更實時追蹤噪聲的變化，改善降噪效果，減少語音失真的情況。無論殘余非線性回聲消除或是單麥克噪聲抑制，均能夠?qū)η跋蛘Z音信號中的噪聲進(jìn)行較好的抑制，得到具有較好降噪效果的增益。

20、一實施例中，多個所述噪聲抑制模塊還包括：能量差噪聲抑制模塊；所述耳機還包括噪聲估計模塊；所述噪聲估計模塊還與所述處理單元連接；所述基于具有不同噪聲抑制方式的多個所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理，得到各所述噪聲抑制模塊輸出的增益，還包括：基于所述能量差噪聲抑制模塊對所述噪聲估計模塊輸出的噪聲估計和所述自適應(yīng)濾波后的前向語音信號進(jìn)行處理，得到第三增益；其中，所述耳機還包括左耳機、右耳機、第三麥克風(fēng)和第四麥克風(fēng)；所述第三麥克風(fēng)設(shè)置于所述左耳機上，所述第四麥克風(fēng)設(shè)置于所述右耳機上；所述多路麥克語音信號還包括所述第三麥克風(fēng)采集的第三語音信號和所述第四麥克風(fēng)采集的第四語音信號；所述方法還包括：在基于能量差噪聲抑制模塊對所述噪聲估計模塊輸出的噪聲估計和所述自適應(yīng)濾波后的前向語音信號進(jìn)行處理之前，獲取所述同一幀聲音對應(yīng)的第三語音信號和第四語音信號，并從二者中確定出能量更高的最大輔麥克信號；計算所述前向語音信號和所述最大輔麥克信號的第三能量差值；若所述第三能量差值大于或等于第三預(yù)設(shè)能量差值閾值，則不更新所述噪聲估計模塊中的噪聲估計；若所述第三能量差值小于或等于第四預(yù)設(shè)能量差值閾值，則基于所述最大輔麥克信號更新所述噪聲估計模塊中的噪聲估計；若所述第三能量差值在所述第三預(yù)設(shè)能量差值閾值和所述第四預(yù)設(shè)能量差值閾值之間，則基于所述前向語音信號更新所述噪聲估計模塊中的噪聲估計。

21、前向語音信號經(jīng)過殘余非線性回聲消除和單麥克噪聲抑制雖然能抑制一部分干擾語音，但難以完全消除干擾信號。因此，在本實施例中，將第三麥克風(fēng)和第四麥克風(fēng)采集的語音信號作為輔助麥克風(fēng)信號，確定出最大輔麥克信號，以前向語音信號和最大輔麥克信號的第三能量差值更新確定更新噪聲估計的方式，從而得到更適合當(dāng)前所采集語音信號的噪聲估計，以使用該噪聲估計對前向語音信號進(jìn)行噪聲抑制時，可以提高噪聲抑制效果。

22、一實施例中，預(yù)設(shè)的增益選取條件為從多個增益中選取最小增益為所述目標(biāo)增益。

23、本實施例中，使用最小增益進(jìn)行降噪已經(jīng)具有一定的降噪效果，而由于增益最小，可以有效減少因增益過大導(dǎo)致降噪時語音信號失真的可能性。

24、第二方面，本技術(shù)實施例還提供一種頭戴式耳機，包括：麥克風(fēng)，用于對聲音進(jìn)行采集；處理單元，與所述麥克風(fēng)連接，用于執(zhí)行如第一方面任一項所述的語音活動檢測方法。

25、一實施例中，所述頭戴式耳機還包括咪桿，所述咪桿上設(shè)置第一麥克風(fēng)和第二麥克風(fēng)；對所述同一幀聲音進(jìn)行采集時，所述第一麥克風(fēng)用于采集第一語音信號和所述第二麥克風(fēng)用于采集第二語音信號；所述處理單元用于對所述第一語音信號和所述第二語音信號進(jìn)行前向波束成形處理，得到所述前向語音信號；以及，對所述第一語音信號和所述第二語音信號進(jìn)行后向波束成形處理，得到所述后向語音信號。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：涂維娟,朱志豪,李倩
技術(shù)所有人：恒玄科技（上海）股份有限公司
我是此專利的發(fā)明人

上一篇：一種安瓿瓶密封性測試裝置的制作方法
上一篇：一種PVC型材用轉(zhuǎn)送裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

語音活動檢測方法和頭戴式耳機與流程