本技術涉及通信領域,特別是涉及一種回聲消除方法、裝置、電子設備及介質。
背景技術:
1、在雙工通話的場景中,通常來自遠端的經過揚聲器放出來的聲音會和本端說話人的信號混在一起被傳遞至遠端,因此遠端的人會聽到自己的回聲,這種回聲對一些通信設備來說降低了體驗感。
2、目前大體分為兩種類型實現回聲消除來提高通信設備的體驗感,一種為經典信號處理方法,另一種為人工智能(artificial?intelligence,ai)信號處理。對于經典信號處理方法來說:使用不同的自適應濾波算法調整濾波器的權值向量,估計一個近似的回聲路徑來逼近真實回聲路徑,從而得到估計的回聲信號,并在純凈語音和回聲的混合信號中除去此信號來實現線性回聲的消除。但是信號傳輸的環(huán)境通常復雜多樣,且一般系統(tǒng)非線性度較高,采用這類方法無法很好地消除非線性部分回聲;并且該類方法在非線性部分抑制過程中,通常采用判斷當前是否處于雙講狀態(tài)來設置不同的抑制值,又因為未消除干凈的回聲作為噪聲,極易造成狀態(tài)的誤判,導致出現雙講效果差的問題。對于ai信號處理來說:ai的回聲消除算法通常采用深度神經網絡結構,具有非常大的計算量,在很多并不具備強大的專用ai運算單元的處理器上,或是需要多路回聲消除場景下,難以達到實時處理的要求,并且ai算法的效果還嚴重依賴于訓練數據,難以適應各種不同的環(huán)境,以及采用專用ai運算單元還涉及到數據搬移問題,在中央處理器(central?processing?unit,cpu)和專用ai運算單元之間搬移數據通常還會加大音頻信號的延時。
3、鑒于上述技術,尋求一種回聲消除方法是本領域技術人員亟待解決的問題。
技術實現思路
1、本技術的目的是提供一種回聲消除方法、裝置、電子設備及介質。可以解決現有技術中經典信號處理方法帶來的誤判以及人工智能信號處理帶來的延時和計算量大的問題。
2、為解決上述技術問題,本技術提供一種回聲消除方法,包括:
3、獲取本端的第一語音信號及對端的第二語音信號;并對第一語音信號和第二語音信號進行對齊,以得第一語音信號對應的本端初始語音信號和第二語音信號對應的對端初始語音信號;
4、根據本端初始語音信號和對端初始語音信號確定對應的殘留回聲信號;
5、確定殘留回聲信號對應的殘留回聲功率譜;
6、根據殘留回聲信號和殘留回聲功率譜確定殘差信號;
7、根據殘差信號確定對應的本端目標語音信號。
8、優(yōu)選地,根據本端初始語音信號和對端初始語音信號確定對應的殘留回聲信號,包括:
9、對本端初始語音信號進行頻域轉換,以得本端頻域語音信號;
10、對對端初始語音信號進行頻域轉換,以得對端頻域語音信號;
11、對對端頻域語音信號進行濾波,以得濾波對端語音信號;
12、將本端頻域語音信號與濾波對端語音信號的差值作為殘留回聲信號。
13、優(yōu)選地,確定殘留回聲信號對應的殘留回聲功率譜,包括:
14、獲取不同時刻下對端初始信號對應的功率譜強度;
15、獲取預設時間間隔和殘留回聲衰減系數;
16、基于殘留回聲分段頻譜公式確定不同時刻下功率譜強度、預設時間間隔和殘留回聲衰減系數對應的殘留回聲信號在對應時刻下的功率譜強度;
17、根據不同時刻下殘留回聲信號對應的功率譜強度確定殘留回聲功率譜;
18、其中,殘留回聲分段頻譜公式的表達式為:
19、;
20、其中,resid(s,k)為殘留回聲信號在s時刻下,第k個頻點的功率譜強度;power_spectrum(s-t,k)為對端初始信號在s-t時刻下,第k個頻點的功率譜強度;t為預設時間間隔,resid_decay為殘留回聲衰減系數。
21、優(yōu)選地,根據殘留回聲信號和殘留回聲功率譜強度確定殘差信號,包括:
22、獲取不同時刻下,本端初始信號對應的功率譜強度;
23、獲取不同時刻下,殘留回聲信號在不同點的數值;
24、獲取預設非負值;
25、基于系數公式,確定不同時刻下,本端初始信號對應的功率譜強度、殘留回聲信號在不同頻點的數值和預設非負值對應的系數;
26、基于殘差數值公式,確定不同時刻下,殘留回聲信號和對應的系數確定不同時刻下,殘差信號在不同頻點的數值;
27、其中,系數公式的表達式為:
28、;
29、殘差數值公式的表達式為:
30、;
31、其中,d(s,k)為系數;x(s,k)為殘留回聲信號在時刻s下,第k個頻點的數值;resid(s,k)為殘留回聲信號在s時刻下,第k個頻點的功率譜強度;為預設非負值;為殘差信號在時刻s下,第k個頻點的數值。
32、優(yōu)選地,根據殘差信號確定對應的本端目標語音信號,包括:
33、獲取殘差信號對應的殘差頻譜自相關系數、本端初始語音信號對應的本端頻譜自相關系數和殘差信號的頻譜與本端初始語音信號的頻譜之間的相關值;
34、獲取更新速率,并根據更新速率和殘差頻譜自相關系數確定殘差平滑系數;根據更新速率和本端頻譜自相關系數確定本端平滑系數;根據更新速率和相關值確定相關平滑系數;
35、根據殘差平滑系數、本端平滑系數和相關平滑系數確定增益系數;
36、根據殘差信號和增益系數確定目標頻域語音信號;
37、將目標頻域語音信號進行反傅里葉變換,以得本端目標語音信號。
38、優(yōu)選地,殘差頻譜自相關系數的表達式為:
39、;
40、本端頻譜自相關系數的表達式為:
41、;
42、相關值的表達式為:
43、;
44、其中,pee為殘差頻譜自相關系數;e為殘差信號;pyy為本端頻譜自相關系數;y為本端初始語音信號;pey為相關值;
45、相應的,殘差平滑系數的表達式為:
46、;
47、本端平滑系數的表達式為:
48、;
49、相關平滑系數的表達式為:
50、;
51、其中,pee_avg為殘差平滑系數;pyy_avg為本端平滑系數;pey_avg為相關平滑系數;alpha為更新速率。
52、優(yōu)選地,增益系數的表達式為:
53、;
54、其中,pee_avg為殘差平滑系數;pyy_avg為本端平滑系數;pey_avg為相關平滑系數;為增益系數。
55、另一方面,本技術還提供一種回聲消除裝置,包括:
56、獲取模塊,用于獲取本端的第一語音信號及對端的第二語音信號;并對第一語音信號和第二語音信號進行對齊,以得第一語音信號對應的本端初始語音信號和第二語音信號對應的對端初始語音信號;
57、第一確定模塊,用于根據本端初始語音信號和對端初始語音信號確定對應的殘留回聲信號;
58、第二確定模塊,用于確定殘留回聲信號對應的殘留回聲功率譜;
59、第三確定模塊,用于根據殘留回聲信號和殘留回聲功率譜確定殘差信號;
60、第四確定模塊,用于根據殘差信號確定對應的本端目標語音信號。
61、另一方面,本技術還提供一種電子設備,包括存儲器,用于存儲計算機程序;
62、處理器,用于執(zhí)行計算機程序時實現上述的回聲消除方法的步驟。
63、另一方面,本技術還提供一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現上述的回聲消除方法的步驟。
64、本技術所提供的一種回聲消除方法,包括:獲取本端的第一語音信號及對端的第二語音信號;并對第一語音信號和第二語音信號進行對齊,以得第一語音信號對應的本端初始語音信號和第二語音信號對應的對端初始語音信號;根據本端初始語音信號和對端初始語音信號確定對應的殘留回聲信號;確定殘留回聲信號對應的殘留回聲功率譜;根據殘留回聲信號和殘留回聲功率譜確定殘差信號;根據殘差信號確定對應的本端目標語音信號??梢姡炯夹g對獲取的第一語音信號和第二語音信號進行對齊,可以降低后級處理時所需的抽頭數,降低整體的算法復雜度;并且本技術中獲取的殘留回聲信號為第一次消除回聲后的信號,而殘差信號為第二次消除回聲后的信號,整體上本技術消除了兩次回聲,進一步提高最終確定的本端目標語音信號的準確性。也就是說本技術提供的回聲消除方法滿足在低復雜度的情況下,將回聲消除干凈,并達到好的雙講效果。