一種應(yīng)用于語音識別的信號增益方法和裝置的制造方法
【專利摘要】本發(fā)明提供一種應(yīng)用于語音識別的信號增益方法和裝置,以在對語音信號放大時防止過載失真,提高語音識別的準(zhǔn)確率。所述方法包括:刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信號;求取第一語音信號中每幀信號存在語音的概率PRatio;修正第一語音信號的增益,使概率PRatio小于第一判決門限的信號的增益減小并且概率PRatio大于第一判決門限的信號的增益增大,得到增益修正后的第二語音信號;限制第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極值。本發(fā)明提供的技術(shù)方案可防止后期語音識別時語音識別引擎工作的中止,提高語音識別的有效性,有效提高后期語音識別的準(zhǔn)確率,并防止語音識別過程中過載失真情況的發(fā)生。
【專利說明】
一種應(yīng)用于語音識別的信號増益方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于語音識別領(lǐng)域,尤其涉及一種應(yīng)用于語音識別的信號增益方法和裝 置。
【背景技術(shù)】
[0002] 自動增益控制是數(shù)字接收端重要的組成部分,其功能是針對輸入信號的強(qiáng)弱自動 調(diào)整增益,得到符合期望的信號強(qiáng)度輸出結(jié)果,使得對不同強(qiáng)度的信號,輸出信號的差距縮 小。在語音識別前處理階段,遠(yuǎn)程拾音的過程中,自動增益控制的目標(biāo)是從接收到的語音中 提取出感興趣的信號,盡可能地對語音信號進(jìn)行增強(qiáng),同時削弱噪聲對識別結(jié)果的影響。與 一般的對話系統(tǒng)不同,針對語音識別的自動增益控制系統(tǒng),其輸出結(jié)果并不以獲得滿意的 聽覺效果為目標(biāo),而是要針對語音識別的特性,盡可能地保證目標(biāo)語音無失真地放大。
[0003] 然而,在語音識別領(lǐng)域,現(xiàn)有的增益控制方法無法達(dá)到上述效果,主要原因在于沒 有對語音信號進(jìn)行差別化處理。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種應(yīng)用于語音識別的信號增益方法和裝置,以在對語音 信號放大時防止過載失真,提高語音識別的準(zhǔn)確率。
[0005] 本發(fā)明第一方面提供一種應(yīng)用于語音識別的信號增益方法,所述方法包括:
[0006] 刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信號;
[0007] 求取所述第一語音信號中每幀信號存在語音的概率PRatio;
[0008]修正所述第一語音信號的增益,使所述概率PRatio小于第一判決門限的信號的增 益減小并且所述概率PRatio大于所述第一判決門限的信號的增益增大,得到增益修正后的 第二語音信號;
[0009] 限制所述第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極值。
[0010] 本發(fā)明第二方面提供一種應(yīng)用于語音識別的信號增益裝置,所述裝置包括:
[0011]話段處理模塊,用于刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信 號;
[0012]語音存在概率求取模塊,用于求取所述第一語音信號中每幀信號存在語音的概率 PRatio;
[0013]增益修正模塊,用于修正所述第一語音信號的增益,使所述概率PRatio小于第一 判決門限的信號的增益減小并且所述概率PRatio大于所述第一判決門限的信號的增益增 大,得到增益修正后的第二語音信號;
[0014] 增益控制模塊,用于限制所述第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極 值。
[0015] 從上述本發(fā)明技術(shù)方案可知,一方面,由于在控制增益的前期首先對經(jīng)過預(yù)處理 后的語音信號中的無話段進(jìn)行了刪除,后期的處理只針對有話段的語音信號,如此,可防止 后期語音識別時語音識別引擎工作的中止,提高語音識別的有效性;另一方面,對語音存在 概率較高的信號和語音存在概率較低的信號分別進(jìn)行增益增強(qiáng)和增益抑制,如此,可以進(jìn) 一步有效提高后期語音識別的準(zhǔn)確率;第三方面,對增益增強(qiáng)和抑制的信號的增益進(jìn)行一 定程度的限制,可以防止語音識別過程中過載失真情況的發(fā)生。
【附圖說明】
[0016] 圖1是本發(fā)明實施例一提供的應(yīng)用于語音識別的信號增益方法的實現(xiàn)流程示意 圖;
[0017] 圖2是本發(fā)明實施例二提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu)示意圖;
[0018] 圖3是本發(fā)明實施例三提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu)示意圖;
[0019] 圖4是本發(fā)明實施例四提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu)示意圖; [0020]圖5-a是本發(fā)明實施例五提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu)示意圖;
[0021] 圖5-b是本發(fā)明實施例六提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu)示意圖;
[0022] 圖5-c是本發(fā)明實施例七提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0023] 為了使本發(fā)明的目的、技術(shù)方案及有益效果更加清楚明白,以下結(jié)合附圖及實施 例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā) 明,并不用于限定本發(fā)明。
[0024] 本發(fā)明實施例提供一種應(yīng)用于語音識別的信號增益方法和裝置,所述方法包括: 刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信號;求取所述第一語音信號中 每幀信號存在語音的概率PRatio;修正所述第一語音信號的增益,使所述概率PRatio小于 第一判決門限的信號的增益減小并且所述概率PRatio大于所述第一判決門限的信號的增 益增大,得到增益修正后的第二語音信號;限制所述第二語音信號的增益,使其小于系統(tǒng)設(shè) 定的增益極值。本發(fā)明實施例還提供相應(yīng)的應(yīng)用于語音識別的信號增益裝置。以下分別進(jìn) 行詳細(xì)說明。
[0025] 請參閱附圖1,是本發(fā)明實施例一提供的應(yīng)用于語音識別的信號增益方法的實現(xiàn) 流程示意圖,主要包括以下步驟S101至步驟S104,詳細(xì)說明如下:
[0026] S101,刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信號。
[0027] 語音信號包含有話段和無話段,有話段和無話段的檢測對語音識別的意義重大; 當(dāng)將有話段和無話段檢測出來之后,刪除無話段的部分,對剩下的有話段語音部分進(jìn)行增 益等處理,可以提高語音識別的準(zhǔn)確率。在本發(fā)明實施例中,對語音信號的預(yù)處理主要是包 括對語音信號進(jìn)行回聲抑制和噪聲的消除。
[0028] 作為本發(fā)明一個實施例,刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語 音信號可以通過如下步驟S1011和步驟S1012實現(xiàn):
[0029] S1011,采用倒譜雙門限端點檢測算法檢測經(jīng)過預(yù)處理后的語音信號中的無話段 和有話段。
[0030]在采用倒譜雙門限端點檢測算法檢測之前,可以對經(jīng)過預(yù)處理后的語音信號進(jìn)行 預(yù)加重、分幀、加窗處理,并進(jìn)行快速傅里葉變換和計算語音信號的能量譜。具體地,采用倒 譜雙門限端點檢測算法檢測經(jīng)過預(yù)處理后的語音信號中的無話段和有話段可以包括如下 步驟S1至S3:
[0031] S1,計算預(yù)處理后的語音信號中每幀信號的倒譜系數(shù)與噪聲倒譜系數(shù)估計值的倒 譜距離(7):(n、、: 〇
[0032] 公式〇) = /^丨,'(/?}-中,p為Mel頻率倒譜系數(shù)(Mel Frequency Cep strum Coefficient,MFCC)的階,me1 (n)為第i幀信號的離散余弦變換(Discrete Cosine Transform,DCT)倒譜系數(shù),可通過計算通過Mel濾波器的能量得到,而mcns(n)為噪 聲的DCT倒譜系數(shù)初始估計值。在本發(fā)明實施例中,對于第i幀信號,可通過取第i幀信號之 前的5幀信號的MFCC的均值作為噪聲的DCT倒譜系數(shù)初始估計值mc ns(n)。
[0033] S2,采用第二判決門限,將倒譜距離大于第二判決門限所對應(yīng)的信號幀確定為基 本語音段的粗略起始端點和結(jié)束端點。
[0034] S3,采用第三判決門限,將所述基本語音段中倒譜距離大于所述第三判決門限的 信號幀確定為語音段的起始端點和結(jié)束端點。
[0035] 需要說明的是,在本發(fā)明實施例中,由于步驟S2是粗略判決,S3是精確判決,因此, 第三判決門限小于第二判決門限。例如,若以0 2表示第二判決門限,以03表示第三判決門限, 則兩者的關(guān)系可以是〇3 = 0 ? 2〇2。
[0036] 步驟S3之后,基本上可以確定語音信號中語音段的起始端點和結(jié)束端點。
[0037] S1012,對預(yù)處理后的語音信號中的無話段進(jìn)行截除或置零。
[0038]在經(jīng)過步驟S3之后,也就是確定了語音信號中語音段的起始端點和結(jié)束端點,語 音信號的其余部分就是無話段部分了,對這些無話段部分,可以進(jìn)行截除或置零,剩下的部 分就是語音信號的語音段部分。
[0039] S102,求取第一語音信號中每幀信號存在語音的概率PRatio。
[0040]雖然經(jīng)過步驟S101,已經(jīng)刪除了無話段,但是并不意味著每幀信號都存在語音。因 此,在本發(fā)明實施例中,可以通過求取第一語音信號中每幀信號存在語音的概率PRatio,然 后,對存在語音概率較高的部分和存在語音概率較低的部分差別化處理。
[0041]作為本發(fā)明一個實施例,求取第一語音信號中每幀信號存在語音的概率PRatio可 通過如下步驟S1021和步驟S1022實現(xiàn):
[0042] S1021,通過對第一語音信號中每幀信號的均值進(jìn)行標(biāo)準(zhǔn)化處理,計算得到每幀信 號的均值mS、所述第一語音信號的總均值mL和每幀信號的標(biāo)準(zhǔn)差stL。
[0043]在計算得到每幀信號的均值mS后,例如,求取任意第i幀信號的均值mS后,可以求 取第i幀信號的均值平方vS = mS*mS,進(jìn)而對第i幀信號的mS、vS和第i幀信號之前的信號進(jìn) 行平滑,得到第一語音信號的總均值mL和總平方值vL。然后按照公式stL=(vL-mL*mL) - 0.5計算得到每幀彳目號的標(biāo)準(zhǔn)差stL。
[0044] S1022,按照公式PRatio=(mS-mL)/stL計算得到第一語音信號中每幀信號存在語 音的概率PRatio。
[0045]經(jīng)過步驟S1021之后,得到每幀信號的均值mS、第一語音信號的總均值mL和每幀信 號的標(biāo)準(zhǔn)差stL,可以按照公式PRatio=(mS-mL)/stL計算得到第一語音信號中每幀信號存 在語音的概率PRatio。
[0046] S103,修正第一語音信號的增益,使概率PRatio小于第一判決門限的信號的增益 減小并且概率PRatio大于第一判決門限的信號的增益增大,得到增益修正后的第二語音信 號。
[0047]例如,若在設(shè)計系統(tǒng)的增益時,設(shè)計的值用gainOri表示,則將第一語音信號中存 在語音的概率PRatio小于第一判決門限的信號的增益可修正為gaim = gainOri*PRatio, gaini為修正后的增益;將第一語音信號中存在語音的概率PRatio大于第一判決門限的信 號的增益可修正為gain2 = gainOri*(1+PRatio),gain2為修正后的增益。
[0048]在本發(fā)明實施例中,第一判決門限是一個經(jīng)驗值。若以〇1表示第一判決門限,以 pmin表示全部信號存在語音的概率的最小值,以pmax表示全部信號存在語音的概率的最大 值,貝丨J〇1可取為〇1 = Pmin+ ( Pmax-Pmin ) *0 ? 2。
[0049] S104,限制第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極值。
[0050] 具體地,可以將第二語音信號的幅度標(biāo)準(zhǔn)值與經(jīng)過步驟S103修正后的增益相乘, 若相乘后的語音信號發(fā)生過載失真,則微調(diào)相乘后的語音信號的增益直至小于系統(tǒng)設(shè)定的 增益極值。例如,若相乘后的語音信號的增益為g,在判斷這一增益下的語音信號發(fā)生過載 失真時,則可以將該增益乘以〇 . 95得到0.95g,再判斷增益為0.95g的語音信號是否發(fā)生過 載,若發(fā)生過載,則再次微調(diào),直至小于系統(tǒng)設(shè)定的增益極值。需要說明的是,在本發(fā)明實施 例中,增益極值可以根據(jù)系統(tǒng)的需求設(shè)定,例如,根據(jù)系統(tǒng)的需求,可以將增益極值設(shè)定為〇 (dB);對輸入的信號,其增益一般設(shè)定為5(dB),接近極值部分信號的增益逐漸減小,保證放 大后信號值小于目標(biāo)極值。
[0051] 顯然,對第二語音信號的增益的限制是一個以舊代新的迭代過程,直至最后獲得 的增益小于系統(tǒng)設(shè)定的增益極值。
[0052] 從上述附圖1示例的應(yīng)用于語音識別的信號增益方法可知,一方面,由于在控制增 益的前期首先對經(jīng)過預(yù)處理后的語音信號中的無話段進(jìn)行了刪除,后期的處理只針對有話 段的語音信號,如此,可防止后期語音識別時語音識別引擎工作的中止,提高語音識別的有 效性;另一方面,對語音存在概率較高的信號和語音存在概率較低的信號分別進(jìn)行增益增 強(qiáng)和增益抑制,如此,可以進(jìn)一步有效提高后期語音識別的準(zhǔn)確率;第三方面,對增益增強(qiáng) 和抑制的信號的增益進(jìn)行一定程度的限制,可以防止語音識別過程中過載失真情況的發(fā) 生。
[0053]請參閱附圖2,是本發(fā)明實施例二提供的應(yīng)用于語音識別的信號增益裝置的結(jié)構(gòu) 示意圖。為了便于說明,附圖2僅示出了與本發(fā)明實施例相關(guān)的部分。附圖2示例的應(yīng)用于語 音識別的信號增益裝置可以是附圖1示例的應(yīng)用于語音識別的信號增益方法的執(zhí)行主體。 附圖2示例的應(yīng)用于語音識別的信號增益裝置主要包括話段處理模塊201、語音存在概率求 取模塊202、增益修正模塊203和增益控制模塊204,其中:
[0054]話段處理模塊201,用于刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音 信號;
[0055]語音存在概率求取模塊202,用于求取第一語音信號中每幀信號存在語音的概率 PRatio;
[0056]增益修正模塊203,用于修正第一語音信號的增益,使概率PRatio小于第一判決門 限的信號的增益減小并且概率PRatio大于所述第一判決門限的信號的增益增大,得到增益 修正后的第二語音信號;
[0057]增益控制模塊203,用于限制第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極 值。
[0058]需要說明的是,以上附圖2示例的應(yīng)用于語音識別的信號增益裝置的實施方式中, 各功能模塊的劃分僅是舉例說明,實際應(yīng)用中可以根據(jù)需要,例如相應(yīng)硬件的配置要求或 者軟件的實現(xiàn)的便利考慮,而將上述功能分配由不同的功能模塊完成,即將所述應(yīng)用于語 音識別的信號增益裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部 分功能。而且,實際應(yīng)用中,本實施例中的相應(yīng)的功能模塊可以是由相應(yīng)的硬件實現(xiàn),也可 以由相應(yīng)的硬件執(zhí)行相應(yīng)的軟件完成,例如,前述的語音存在概率求取模塊,可以是具有執(zhí) 行前述求取第一語音信號中每幀信號存在語音的概率PRatio的硬件,例如語音存在概率求 取器,也可以是能夠執(zhí)行相應(yīng)計算機(jī)程序從而完成前述功能的一般處理器或者其他硬件設(shè) 備;再如前述的增益修正模塊,可以是執(zhí)行修正第一語音信號的增益的硬件,例如增益修正 器,也可以是能夠執(zhí)行相應(yīng)計算機(jī)程序從而完成前述功能的一般處理器或者其他硬件設(shè)備 (本說明書提供的各個實施例都可應(yīng)用上述描述原則)。
[0059]附圖2示例的話段處理模塊201可以包括檢測單元301和截零單元302,如附圖3所 示本發(fā)明實施例三提供的應(yīng)用于語音識別的信號增益裝置,其中:
[0060] 檢測單元301,用于采用倒譜雙門限端點檢測算法檢測預(yù)處理后的語音信號中的 無話段和有話段;
[0061] 截零單元302,用于對預(yù)處理后的語音信號中的無話段進(jìn)行截除或置零。
[0062]附圖3示例的檢測單元301可以包括倒譜距離計算單元401、第一確定單元402和第 二確定單元403,如附圖4所示本發(fā)明實施例四提供的應(yīng)用于語音識別的信號增益裝置,其 中:
[0063]倒譜距離計算單元401,用于計算預(yù)處理后的語音信號中每幀信號的倒譜系數(shù)與 噪聲倒譜系數(shù)估計值的倒譜距離(/) = mc' (n)f,其中,mcl( n)為第i幀 信號的離散余弦變換DCT倒譜系數(shù),mcns(n)為噪聲的DCT倒譜系數(shù)初始估計值,p為Mel頻率 倒譜系數(shù)的階;
[0064]第一確定單元402,用于采用第二判決門限,將倒譜距離dmfcc(i)大于第二判決門 限所對應(yīng)的信號幀確定為基本語音段的粗略起始端點和結(jié)束端點;
[0065]第二確定單元403,用于采用第三判決門限,將基本語音段中倒譜距離大于所述第 三判決門限的信號幀確定為語音段的起始端點和結(jié)束端點,其中,第三判決門限小于第二 判決門限,例如,第三判決門限可以取為第二判決門限的0.2倍。
[0066]附圖2至4任一示例的增益控制模塊201可以包括相乘單元501和增益微調(diào)單元 502,如附圖5-a至附圖5-c所示本發(fā)明實施例五至實施例七提供的應(yīng)用于語音識別的信號 增益裝置,其中:
[0067]相乘單元501,用于將第二語音信號的幅度標(biāo)準(zhǔn)值與增益修正模塊203修正后的增 益相乘;
[0068]增益微調(diào)單元503,用于若相乘后的語音信號發(fā)生過載失真,則微調(diào)相乘后的語音 信號的增益直至小于系統(tǒng)設(shè)定的增益極值。
[0069] 需要說明的是,上述裝置各模塊/單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與 本發(fā)明方法實施例基于同一構(gòu)思,其帶來的技術(shù)效果與本發(fā)明方法實施例相同,具體內(nèi)容 可參見本發(fā)明方法實施例中的敘述,此處不再贅述。
[0070] 本領(lǐng)域普通技術(shù)人員可以理解上述實施例的各種方法中的全部或部分步驟是可 以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于一計算機(jī)可讀存儲介質(zhì)中,存儲 介質(zhì)可以包括:只讀存儲器(R〇M,Read Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁盤或光盤等。
[0071] 以上對本發(fā)明實施例所提供的應(yīng)用于語音識別的信號增益方法和裝置進(jìn)行了詳 細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進(jìn)行了闡述,以上實施例的說 明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù) 本發(fā)明的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不 應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項】
1. 一種應(yīng)用于語音識別的信號增益方法,其特征在于,所述方法包括: 刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信號; 求取所述第一語音信號中每幀信號存在語音的概率PRati0; 修正所述第一語音信號的增益,使所述概率PRatio小于第一判決門限的信號的增益減 小并且所述概率PRatio大于所述第一判決門限的信號的增益增大,得到增益修正后的第二 語音信號; 限制所述第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極值。2. 如權(quán)利要求1所述的方法,其特征在于,所述刪除經(jīng)過預(yù)處理后的語音信號中的無話 段,得到第一語音信號,包括: 采用倒譜雙門限端點檢測算法檢測所述預(yù)處理后的語音信號中的無話段和有話段; 對所述預(yù)處理后的語音信號中的無話段進(jìn)行截除或置零。3. 如權(quán)利要求2所述的方法,其特征在于,所述采用倒譜雙門限端點檢測算法檢測所述 預(yù)處理后的語音信號中的無話段和有話段,包括: 計算所述預(yù)處理后的語音信號中每幀信號的倒譜系數(shù)與噪聲倒譜系數(shù)估計值的倒譜 距離所述Hic1(Ii)為第i幀信號的離散余弦變換DCT倒譜 系數(shù),所述mcns(n)為噪聲的DCT倒譜系數(shù)初始估計值,所述p為Mel頻率倒譜系數(shù)的階; 采用第二判決門限,將所述倒譜距離大于所述第二判決門限所對應(yīng)的信號幀確定為基 本語音段的粗略起始端點和結(jié)束端點; 采用第三判決門限,將所述基本語音段中倒譜距離大于所述第三判決門限的信號幀確 定為語音段的起始端點和結(jié)束端點,所述第三判決門限小于所述第二判決門限。4. 如權(quán)利要求1所述的方法,其特征在于,所述求取所述第一語音信號中每幀信號存在 語音的概率PRatio,包括: 通過對所述第一語音信號中每幀信號的均值進(jìn)行標(biāo)準(zhǔn)化處理,計算得到每幀信號的均 值mS、所述第一語音信號的總均值mL和每幀信號的標(biāo)準(zhǔn)差stL; 按照公式PRat io = (mS-mL) /s tL計算得到所述第一語音信號中每幀信號存在語音的概 率PRatio。5. 如權(quán)利要求1至4任意一項所述的方法,其特征在于,所述限制所述第二語音信號的 增益,包括: 將所述第二語音信號的幅度標(biāo)準(zhǔn)值與所述修正后的增益相乘; 若相乘后的語音信號發(fā)生過載失真,則微調(diào)所述相乘后的語音信號的增益直至小于系 統(tǒng)設(shè)定的所述增益極值。6. -種應(yīng)用于語音識別的信號增益裝置,其特征在于,所述裝置包括: 話段處理模塊,用于刪除經(jīng)過預(yù)處理后的語音信號中的無話段,得到第一語音信號; 語音存在概率求取模塊,用于求取所述第一語音信號中每幀信號存在語音的概率 PRatio; 增益修正模塊,用于修正所述第一語音信號的增益,使所述概率PRatio小于第一判決 門限的信號的增益減小并且所述概率PRatio大于所述第一判決門限的信號的增益增大,得 到增益修正后的第二語音信號; 增益控制模塊,用于限制所述第二語音信號的增益,使其小于系統(tǒng)設(shè)定的增益極值。7. 如權(quán)利要求6所述的裝置,其特征在于,所述話段處理模塊包括: 檢測單元,用于采用倒譜雙門限端點檢測算法檢測所述預(yù)處理后的語音信號中的無話 段和有話段; 截零單元,用于對所述預(yù)處理后的語音信號中的無話段進(jìn)行截除或置零。8. 如權(quán)利要求7所述的裝置,其特征在于,所述檢測單元包括: 倒譜距離計算單元,用于計算所述預(yù)處理后的語音信號中每幀信號的倒譜系數(shù)與噪聲 倒譜系數(shù)估計值的倒譜距?f所述mcUn)為第i幀信號的 離散余弦變換DCT倒譜系數(shù),所述mcns (η)為噪聲的DCT倒譜系數(shù)初始估計值,所述p為Me 1頻 率倒譜系數(shù)的階; 第一確定單元,用于采用第二判決門限,將所述倒譜距離CUc^i)大于所述第二判決門 限所對應(yīng)的信號幀確定為基本語音段的粗略起始端點和結(jié)束端點; 第二確定單元,用于采用第三判決門限,將所述基本語音段中倒譜距離大于所述第三 判決門限的信號幀確定為語音段的起始端點和結(jié)束端點,所述第三判決門限小于所述第二 判決門限。9. 如權(quán)利要求6所述的裝置,其特征在于,所述語音存在概率求取模塊包括: 第一計算單元,用于通過對所述第一語音信號中每幀信號的均值進(jìn)行標(biāo)準(zhǔn)化處理,計 算得到每幀信號的均值mS、所述第一語音信號的總均值mL和每幀信號的標(biāo)準(zhǔn)差stL; 第二計算單元,用于按照公式PRatio = (mS-mL)/stL計算得到所述第一語音信號中每 幀信號存在語音的概率PRatio。10. 如權(quán)利要求6至9任意一項所述的裝置,其特征在于,所述增益控制模塊包括: 相乘單元,用于將所述第二語音信號的幅度標(biāo)準(zhǔn)值與所述修正后的增益相乘; 增益微調(diào)單元,用于若相乘后的語音信號發(fā)生過載失真,則微調(diào)所述相乘后的語音信 號的增益直至小于系統(tǒng)設(shè)定的所述增益極值。
【文檔編號】G10L15/04GK105895084SQ201610191920
【公開日】2016年8月24日
【申請日】2016年3月30日
【發(fā)明人】李敬源
【申請人】Tcl集團(tuán)股份有限公司