一種消除混響的方法、裝置和設(shè)備的制作方法
【專利摘要】本發(fā)明實施例提供了一種消除混響的方法、裝置和設(shè)備,能夠準確消除語音信號中的混響信號。該方法包括:獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L幀的語音信號的能量,第1幀至第L-1幀的純凈語音信號的混響能量系數(shù)和第L幀的語音信號能量的系數(shù),以及第i個語音輸入設(shè)備的第1幀至第L-1幀的純凈語音信號的能量;對所述第i個語音輸入設(shè)備的第1幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)進行更新;估算第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響能量;獲得所述第L幀信號的純凈語音信號的能量。該方法適用于音頻【技術(shù)領(lǐng)域】。
【專利說明】一種消除混響的方法、裝置和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻【技術(shù)領(lǐng)域】,尤其涉及一種消除混響的方法、裝置和設(shè)備。
【背景技術(shù)】
[0002]聲波在室內(nèi)傳播時,要被墻壁、天花板、地板等障礙物反射,每反射一次都要被障礙物吸收一些。這樣,當(dāng)聲源停止發(fā)聲后,聲波在室內(nèi)要經(jīng)過多次反射和吸收,最后才消失,我們就感覺到聲源停止發(fā)聲后聲音還繼續(xù)一段時間,這種現(xiàn)象叫做混響,這段時間叫做混響時間。
[0003]在一些場景下,比如在會議系統(tǒng)中,混響的影響會導(dǎo)致語音清晰度的下降。為了提升用戶體驗,需要對混響進行抑制,以改善語音的清晰度。
[0004]現(xiàn)有技術(shù)針對這一問題提出了如下兩種解決方案:
[0005]第一種方案:在時域?qū)溈孙L(fēng)獲得的信號的相位進行分析,估計出自適應(yīng)濾波系數(shù),通過估計得到的自適應(yīng)濾波系數(shù)對信號進行濾波,得到消除混響后的信號。
[0006]但是,采用這種方法容易受到聲源與麥克風(fēng)距離的影響,比如人在說話時,隨著人的身體、頭部的移動,聲源與麥克風(fēng)的距離也會發(fā)生變化,這樣,麥克風(fēng)獲得的信號的相位也在發(fā)生變化,導(dǎo)致估計出的自適應(yīng)濾波系數(shù)是不準確的。
[0007]第二種方案:在頻域基于統(tǒng)計模型去除混響,估計出前一幀語音信號能量的混響能量系數(shù),從而估計出當(dāng)前幀的語音能量中的混響能量,但是,基于統(tǒng)計模型獲得的前一幀語音信號能量的混響能量系數(shù)可能會不準確,造成去混響的效果不夠理想。
【發(fā)明內(nèi)容】
[0008]本發(fā)明的實施例提供一種消除混響的方法、裝置和系統(tǒng),能夠準確的消除語音信號中的混響信號,得到純凈的語音信號。
[0009]為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
[0010]第一方面,本發(fā)明實施例提供了一種消除混響的方法,該方法包括:
[0011]獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于I ;
[0012]根據(jù)所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)進行更新;[0013]根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,和所述第i個語音輸入設(shè)備的更新后的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響能量;
[0014]根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的能量和所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。
[0015]在第一種可能的實施方式中,結(jié)合第一方面,所述獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)具體包括:
[0016]根據(jù)預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)gpgfgn以及第L幀的語音信號能量的系數(shù)&,其中,所述第一公式為:
[0017]
【權(quán)利要求】
1.一種消除混響的方法,其特征在于,該方法包括: 獲取第i個以及其他M-ι個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于I ; 根據(jù)所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)進行更新; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,和所述第i個語音輸入設(shè)備的更新后的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響能量; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的能量和所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)具體包括: 根據(jù)預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)gpgfgn以及第L幀的語音信號能量的系數(shù)&,其中,所述第一公式為: g/^l IOi* I ,其中,1<=1<=1^。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述L為混響時間T與幀的預(yù)設(shè)時間長度的比值取整,其中,所述混響時間T為根據(jù)所述預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,估計的所述沖激信號的能量衰減至預(yù)設(shè)能量的時間。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,其特征在于,對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)進行更新具體包括: 根據(jù)第二公式獲得第i個語音輸入設(shè)備和第j個語音輸入設(shè)備的連續(xù)L幀信號的能量的差,其中,所述第二公式為: LL ~ =Σ&.,£μ,其中,當(dāng)I <= I <=L_1時,所述8」,也,1為第」_個語音輸
/—I入設(shè)備的第I幀的純凈語音信號的混響能量系數(shù)與第i個語音輸入設(shè)備的第I幀的信號能量的卷積,所述guEu為第i個語音輸入設(shè)備的第I幀的純凈語音信號的混響能量系數(shù)與第j個語音輸入設(shè)備的第I幀的信號能量的卷積,當(dāng)I = L時,所述S11Eu為第j個語音輸入設(shè)備的第L幀的語音信號能量的系數(shù)與第i個語音輸入設(shè)備的第L幀的信號能量的卷積,所述guEu為第i個語音輸入設(shè)備的第L幀的語音信號能量的系數(shù)與第j個語音輸入設(shè)備的第L幀的信號能量的卷積; 根據(jù)所述第二公式獲得所述第i個語音輸入設(shè)備和其他M-1個語音輸入設(shè)備兩兩之間的連續(xù)L幀信號的能量的差; 根據(jù)所述第i個語音輸入設(shè)備和其他M-1個語音輸入設(shè)備兩兩之間的連續(xù)L幀信號的能量的差,獲得三公式,所述第三公式為: fy =%土,其中,當(dāng)I < = I < = L-1時,所述,為第i個語音輸入設(shè)備第I中貞純凈語音信號的混響能量系數(shù)的更新值,所述gia為第i個語音輸入設(shè)備第I幀純凈語音信號的混響能量系數(shù),所述μ !為預(yù)設(shè)置的第I幀的更新系數(shù),所述WeiA1)為根據(jù)第i個語音輸入設(shè)備和其他M-1個語音輸入設(shè)備兩兩之間的連續(xù)L幀信號的能量的差,以及其他M-1個語音輸入設(shè)備的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量得到的值; 根據(jù)所述第三公式,獲得所述第i個語音輸入設(shè)備的所述連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)的更新值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述μι>= μ η,其中,所述U1為預(yù)設(shè)置的第I幀的更新系數(shù),所述μ n為預(yù)設(shè)置的第1-ι幀的更新系數(shù),所述第1-ι幀是第I幀的前一幀,所述I < = 1-1。
6.一種消除混響的方法,其特征在于,該方法包括: 獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的幅度,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于I ; 根據(jù)所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù)進行更新; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的幅度,和所述第i個語音輸入設(shè)備的更新后的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響幅度; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的幅度和所述混響幅度,獲得所述第L幀信號的純凈語音信號的幅度。
7.一種消除混響的裝置,其特征在于,該裝置包括:第一獲得單元,第一更新單元,第一估算單元和第二獲得單元;所述第一獲得單元,用于獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于I ; 所述第一更新單元,用于根據(jù)所述第一獲得單元發(fā)送的所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)進行更新; 所述第一估算單元,用于根據(jù)所述第一獲得單元發(fā)送的所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,和所述第一更新單元發(fā)送的所述第i個語音輸入設(shè)備的更新后的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響能量; 所述第二獲得單元,用于根據(jù)所述第一獲得單元發(fā)送的所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的能量和所述第一估算單元發(fā)送的所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一獲得單元具體用于: 根據(jù)預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)gpgfgn以及第L幀的語音信號能量的系數(shù)&,其中,所述第一公式為:
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述L為混響時間T與幀的預(yù)設(shè)時間長度的比值取整,其中,所述混響時間T為根據(jù)所述預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,估計的所述沖激信號的能量衰減至預(yù)設(shè)能量的時間。
10.根據(jù)權(quán)利要求7-9任一項所述的裝置,其特征在于,所述第一更新單元具體用于: 根據(jù)第二公式獲得第i個語音輸入設(shè)備和第j個語音輸入設(shè)備的連續(xù)L幀信號的能量的差,其中,所述第二公式為:
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述>=μ η,其中,所述U1為預(yù)設(shè)置的第1幀的更新系數(shù),所述μ n為預(yù)設(shè)置的第1-1幀的更新系數(shù),所述第1-1幀是第1幀的前一幀,所述1 < = 1-1。
12.—種消除混響的裝置,其特征在于,該裝置包括:第三獲得單元,第二更新單元,第二估算單元和第四獲得單元: 所述第三獲得單元,用于獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于1; 所述第二更新單元,用于根據(jù)所述第三獲得單元發(fā)送的所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù)進行更新; 所述第二估算單元,用于根據(jù)所述第三獲得單元發(fā)送的所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,和所述第二更新單元發(fā)送的所述第i個語音輸入設(shè)備的更新后的第1幀至第L-1幀的純凈語音信號的混響幅度系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響幅度; 所述第四獲得單元,用于根據(jù)所述第三獲得單元發(fā)送的所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的幅度和所述第二估算單元發(fā)送的所述混響幅度,獲得所述第L幀信號的純凈語音信號的幅度。
13.一種消除混響的設(shè)備,其特征在于,該設(shè)備包括:第一收發(fā)器和第一處理器;所述第一收發(fā)器用于:接收第i個語音輸入設(shè)備以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號; 所述第一處理器用于:獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于I ; 根據(jù)所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)以及第L幀的語音信號能量的系數(shù)進行更新; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的能量,和所述第i個語音輸入設(shè)備的更新后的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響能量; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的能量和所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。
14.根據(jù)權(quán)利要求13所述的設(shè)備,其特征在于,所述第一處理器具體用于: 根據(jù)預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響能量系數(shù)gpgfgn以及第L幀的語音信號能量的系數(shù)&,其中,所述第一公式為:
15.根據(jù)權(quán)利要求13或14所述的設(shè)備,其特征在于,所述L為混響時間T與幀的預(yù)設(shè)時間長度的比值取整,其中,所述混響時間T為根據(jù)所述預(yù)設(shè)的沖激信號的能量衰減曲線的斜率q,估計的所述沖激信號的能量衰減至預(yù)設(shè)能量的時間。
16.根據(jù)權(quán)利要求13-15任一項所述的設(shè)備,其特征在于,所述第一處理器具體用于: 根據(jù)第二公式獲得第i個語音輸入設(shè)備和第j個語音輸入設(shè)備的連續(xù)L幀信號的能量的差,其中,所述第二公式為:
17.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,所述μι>= μ η,其中,所述U1為預(yù)設(shè)置的第I幀的更新系數(shù),所述μ n為預(yù)設(shè)置的第1-ι幀的更新系數(shù),所述第1-ι幀是第I幀的前一幀,所述I < = 1-1。
18.一種消除混響的設(shè)備,其特征在于,該設(shè)備包括:第二收發(fā)器和第二處理器; 所述第二收發(fā)器用于:接收第i個語音輸入設(shè)備以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號; 所述第二處理器用于:獲取第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù),以及第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的幅度,其中,所述語音信號包含純凈語音信號和混響信號,所述連續(xù)L幀語音信號為頻域信號,所述L大于I ; 根據(jù)所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù),對所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù)以及第L幀的純凈語音信號幅度的系數(shù)進行更新; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號的幅度,和所述第i個語音輸入設(shè)備的更新后的第I幀至第L-1幀的純凈語音信號的混響幅度系數(shù),估算所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第I幀至第L-1幀的純凈語音信號對所述第L幀語音信號產(chǎn)生的混響信號的混響幅度; 根據(jù)所述第i個語音輸入設(shè)備輸入的連續(xù)L幀語音信號的第L幀信號的幅度和所述混響幅度,獲得所述第L幀信號的純凈語音信號的幅度。
【文檔編號】G10L21/02GK103956170SQ201410160159
【公開日】2014年7月30日 申請日期:2014年4月21日 優(yōu)先權(quán)日:2014年4月21日
【發(fā)明者】詹五洲, 鄔鑫鋒 申請人:華為技術(shù)有限公司