国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語(yǔ)音信號(hào)處理的方法及裝置的制造方法

      文檔序號(hào):10490240閱讀:481來(lái)源:國(guó)知局
      語(yǔ)音信號(hào)處理的方法及裝置的制造方法
      【專利摘要】本發(fā)明涉及一種語(yǔ)音信號(hào)處理的方法及裝置。其中所述方法包括以下步驟:將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊;計(jì)算當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列;根據(jù)諧波峰值序列應(yīng)用梳狀濾波器對(duì)原始頻譜進(jìn)行處理,得到當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜;對(duì)當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào);將當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。其通過梳狀濾波器對(duì)語(yǔ)音信號(hào)諧波進(jìn)行增強(qiáng)處理,壓制非諧波部分分量。提升輸出語(yǔ)音的質(zhì)量。語(yǔ)音信號(hào)處理的裝置也具有上述優(yōu)點(diǎn)。
      【專利說(shuō)明】
      語(yǔ)音信號(hào)處理的方法及裝置
      技術(shù)領(lǐng)域
      [0001]本發(fā)明涉及信號(hào)處理技術(shù)領(lǐng)域,特別是涉及一種語(yǔ)音信號(hào)處理的方法及裝置。
      【背景技術(shù)】
      [0002]—般語(yǔ)音信號(hào)由基波和多個(gè)諧波組成。在環(huán)境噪音強(qiáng)烈或者麥克風(fēng)音腔設(shè)計(jì)不當(dāng)時(shí),會(huì)導(dǎo)致語(yǔ)音信號(hào)的諧波被噪聲淹沒或減弱。此時(shí)會(huì)造成語(yǔ)音音質(zhì)不同程度的下降,影響輸出語(yǔ)音信號(hào)的質(zhì)量。

      【發(fā)明內(nèi)容】

      [0003]基于此,有必要針對(duì)上述技術(shù)問題,提供一種能夠提高語(yǔ)音信號(hào)輸出質(zhì)量的語(yǔ)音信號(hào)處理的方法及裝置。
      [0004]—種語(yǔ)音信號(hào)處理的方法,所述方法包括以下步驟:
      [0005]將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊;
      [0006]計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列;
      [0007]根據(jù)所述諧波峰值序列應(yīng)用梳狀濾波器對(duì)所述原始頻譜進(jìn)行處理,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜;
      [0008]對(duì)所述當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào);
      [0009]將所述當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。
      [0010]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,還包括以下步驟:
      [0011]以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡所述輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平。
      [0012]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,在將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊步驟之前,還包括以下步驟:
      [0013]計(jì)算所述當(dāng)前輸入信號(hào)幀的最大峰值能量;
      [0014]判斷所述最大峰值能量是否大于能量預(yù)設(shè)值,若是,則繼續(xù)執(zhí)行所述將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊的步驟;若否,則判定所述當(dāng)前輸入信號(hào)幀為非語(yǔ)音信號(hào)。
      [0015]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,還包括以下步驟:
      [0016]求取所述當(dāng)前數(shù)據(jù)塊的線性預(yù)測(cè)殘差;
      [0017]計(jì)算所述線性預(yù)測(cè)殘差歸一化自相關(guān)序列,得到歸一化殘差序列,并查找所述歸一化殘差序列中的最大幅值;
      [0018]判斷所述最大幅值是否大于幅值預(yù)設(shè)值,若是,則判定所述當(dāng)前數(shù)據(jù)塊為語(yǔ)音信號(hào),并繼續(xù)執(zhí)行所述計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列的步驟;若否,則判定所述當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào);
      [0019]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述計(jì)算所述當(dāng)前數(shù)據(jù)塊的諧波峰值序列包括以下步驟:
      [0020]計(jì)算所述當(dāng)前數(shù)據(jù)塊的功率譜;
      [0021 ]選取所述最大幅值對(duì)應(yīng)的最大值頻率點(diǎn),以及所述最大值頻率點(diǎn)前后頻率點(diǎn);
      [0022]根據(jù)所述最大值頻率點(diǎn)對(duì)應(yīng)的功率幅值,以及所述最大值頻率點(diǎn)前后頻率點(diǎn)對(duì)應(yīng)的功率幅值,采用二次插值算法計(jì)算所述當(dāng)前數(shù)據(jù)塊的基頻;
      [0023]根據(jù)所述基頻在所述功率譜上進(jìn)行查找,得到所述當(dāng)前數(shù)據(jù)塊的所述諧波峰值序列。
      [0024]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述能量預(yù)設(shè)值為52。
      [0025]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述幅值預(yù)設(shè)值為0.4。
      [0026]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡所述輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平;包括:
      [0027]根據(jù)所述當(dāng)前數(shù)據(jù)塊的IKHz以下諧波的平均功率水平與IKHz?3KHz的諧波平均水平功率之比,應(yīng)用在IKHz增益為OdB,特定滾降Kdb/oct的高通濾波器,平衡低次諧波與高次諧波的能量水平。
      [0028]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述計(jì)算所述當(dāng)前數(shù)據(jù)塊的功率譜時(shí),采用漢寧窗對(duì)所述當(dāng)前數(shù)據(jù)塊進(jìn)行截取,再使用截取后的信號(hào)求取所述當(dāng)前數(shù)據(jù)塊的功率譜。
      [0029]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,判定所述當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)后,還包括以下步驟:
      [0030]判斷當(dāng)前數(shù)據(jù)塊的前一數(shù)據(jù)塊以及后一數(shù)據(jù)塊是否均為語(yǔ)音信號(hào);
      [0031]若是,則進(jìn)行進(jìn)一步計(jì)算所述當(dāng)前數(shù)據(jù)塊的基頻,若否,則不對(duì)所述當(dāng)前數(shù)據(jù)塊進(jìn)行處理;
      [0032]判斷所述基頻與所述當(dāng)前數(shù)據(jù)塊的前一數(shù)據(jù)塊的基頻之間的第一誤差,以及與所述當(dāng)前數(shù)據(jù)塊的后一數(shù)據(jù)塊的基頻之間的第二誤差是否均在預(yù)設(shè)范圍內(nèi),若是,則將所述當(dāng)前數(shù)據(jù)塊進(jìn)行與語(yǔ)音信號(hào)相同的處理;若否,則不對(duì)所述當(dāng)前數(shù)據(jù)塊進(jìn)行處理。
      [0033]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述當(dāng)前輸入信號(hào)幀長(zhǎng)度為64時(shí),所述第一誤差與所述第二誤差的預(yù)設(shè)范圍相同,均為20Hz。
      [0034]作為一種語(yǔ)音信號(hào)處理的方法的可實(shí)施方式,所述歸一化殘差序列中最大幅值的位置序號(hào)在(100?800)/Fs范圍內(nèi),其中Fs為所述語(yǔ)音信號(hào)的采樣率。
      [0035]基于相同的發(fā)明構(gòu)思的一種語(yǔ)音信號(hào)處理的裝置,包括數(shù)據(jù)塊構(gòu)成模塊,用于將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊;
      [0036]諧波計(jì)算模塊,用于計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列;
      [0037]諧波處理模塊,用于根據(jù)所述諧波峰值序列應(yīng)用梳狀濾波器對(duì)所述原始頻譜進(jìn)行處理,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜;
      [0038]時(shí)域變換模塊,用于對(duì)所述當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào);
      [0039]信號(hào)整合模塊,用于將所述當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。
      [0040]作為一種語(yǔ)音信號(hào)處理的裝置的可實(shí)施方式,還包括能量平衡模塊,用于以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡所述輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平。
      [0041]本發(fā)明的有益效果包括:本發(fā)明提供的一種語(yǔ)音信號(hào)處理的方法,使用梳狀濾波器對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行諧波增強(qiáng)處理,避免諧波被噪聲淹沒或減弱,提升輸出語(yǔ)音質(zhì)量。同時(shí)提供的語(yǔ)音信號(hào)處理的裝置也具有前述優(yōu)點(diǎn)。
      【附圖說(shuō)明】
      [0042]圖1為語(yǔ)音信號(hào)處理的方法一個(gè)實(shí)施例的流程圖;
      [0043]圖2為語(yǔ)音信號(hào)處理的方法另一個(gè)實(shí)施例的流程圖;
      [0044]圖3為語(yǔ)音信號(hào)處理的方法再一個(gè)實(shí)施例的流程圖;
      [0045]圖4為語(yǔ)音信號(hào)處理的方法又一個(gè)實(shí)施例的流程圖;
      [0046]圖5為語(yǔ)音信號(hào)處理的方法一個(gè)實(shí)施例中步驟S200執(zhí)行的流程圖;
      [0047]圖6為語(yǔ)音信號(hào)處理的方法一個(gè)實(shí)施例中非語(yǔ)音信號(hào)處理的流程圖;
      [0048]圖7為語(yǔ)音信號(hào)處理的方法一個(gè)具體實(shí)例的流程圖;
      [0049]圖8為語(yǔ)音信號(hào)處理的裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
      [0050]圖9為語(yǔ)音信號(hào)處理的裝置另一實(shí)施例的結(jié)構(gòu)構(gòu)成示意圖;
      [0051 ]圖10為語(yǔ)音信號(hào)處理的裝置又一實(shí)施例的結(jié)構(gòu)構(gòu)成示意圖;
      [0052]圖11為語(yǔ)音信號(hào)處理的裝置再一實(shí)施例的結(jié)構(gòu)構(gòu)成示意圖。
      【具體實(shí)施方式】
      [0053]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖對(duì)本發(fā)明的語(yǔ)音信號(hào)處理的方法及裝置的【具體實(shí)施方式】進(jìn)行說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
      [0054]本發(fā)明語(yǔ)音信號(hào)處理的方法的一實(shí)施例中,如圖1所示,包括以下步驟:
      [0055]S100,將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊。
      [0056]假設(shè)當(dāng)前輸入信號(hào)幀為第η幀語(yǔ)音信號(hào),記為Xn,則其前一幀的語(yǔ)音信號(hào)為第n-1幀語(yǔ)音信號(hào),記為Xn-1。將第η幀語(yǔ)音信號(hào)和第n-1幀語(yǔ)音信號(hào)按照時(shí)間順序組合,即輸入時(shí)間靠前的語(yǔ)音信號(hào)放在前面,時(shí)間靠后的語(yǔ)音信號(hào)放在后面,組成一個(gè)更長(zhǎng)的語(yǔ)音信號(hào)。且一般每個(gè)輸入的語(yǔ)音信號(hào)幀長(zhǎng)度是一定的。假設(shè)本實(shí)施例中輸入的語(yǔ)音信號(hào)幀長(zhǎng)度為M,則將兩幀語(yǔ)音信號(hào)組合構(gòu)成的當(dāng)前數(shù)據(jù)塊長(zhǎng)度為2M。其中,幀長(zhǎng)度M可根據(jù)實(shí)際設(shè)備對(duì)語(yǔ)音信號(hào)處理的速度確定。如M可選擇64,80等。
      [0057]S200,計(jì)算當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列。
      [0058]S300,根據(jù)諧波峰值序列應(yīng)用梳狀濾波器對(duì)原始頻譜進(jìn)行處理,得到當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜。
      [0059]本步驟中,根據(jù)當(dāng)前數(shù)據(jù)塊的諧波峰值序列構(gòu)建梳狀濾波器,并使用梳狀濾波器對(duì)當(dāng)前數(shù)據(jù)塊的頻譜(當(dāng)前數(shù)據(jù)塊的頻率表現(xiàn)形式)進(jìn)行濾波處理。加深諧波波谷部分,突出諧波結(jié)構(gòu)。如此,則通過梳狀濾波器對(duì)當(dāng)前數(shù)據(jù)塊的諧波峰值部分進(jìn)行加強(qiáng),而壓制當(dāng)前數(shù)據(jù)塊的非諧波部分,降低外界環(huán)境等因素造成的噪聲的影響。
      [0060]S400,對(duì)當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào)。
      [0061]對(duì)頻域的當(dāng)前數(shù)據(jù)塊進(jìn)行諧波峰值增強(qiáng)后,再進(jìn)行反變換,得到處理(或諧波增強(qiáng))后的當(dāng)前數(shù)據(jù)塊的時(shí)域信號(hào),即所述的當(dāng)前時(shí)域處理信號(hào)。
      [0062]當(dāng)然,在本實(shí)施例中,輸入的當(dāng)前數(shù)據(jù)塊的時(shí)域長(zhǎng)度為2M,經(jīng)過兩次時(shí)域和頻域之間的變換后,最終得到的當(dāng)前時(shí)域處理信號(hào)長(zhǎng)度依然為2M。
      [0063]S500,將當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。
      [0064]根據(jù)本步驟可知,本發(fā)明實(shí)施例的語(yǔ)音信號(hào)處理的方法中,最終輸出的前一幀輸入信號(hào)幀對(duì)應(yīng)的語(yǔ)音信號(hào)。而且,進(jìn)一步的,為了后續(xù)輸入信號(hào)幀語(yǔ)音信號(hào)的處理,對(duì)當(dāng)前數(shù)據(jù)塊進(jìn)行分析處理得到當(dāng)前時(shí)域處理信號(hào)后,需要對(duì)所述當(dāng)前時(shí)域處理信號(hào)進(jìn)行存儲(chǔ),以便在對(duì)下一當(dāng)前數(shù)據(jù)塊進(jìn)行語(yǔ)音信號(hào)處理時(shí),對(duì)兩個(gè)數(shù)據(jù)塊的時(shí)域處理信號(hào)進(jìn)行交錯(cuò)相加,得到一幀輸入信號(hào)幀對(duì)應(yīng)的語(yǔ)音輸出信號(hào)。
      [0065]本發(fā)明實(shí)施例的語(yǔ)音信號(hào)處理的方法,其在頻域根據(jù)語(yǔ)音信號(hào)諧波峰值,使用梳狀濾波器對(duì)語(yǔ)音信號(hào)進(jìn)行處理,從而增強(qiáng)語(yǔ)音信號(hào)諧波結(jié)構(gòu),突出諧波分量,壓制非諧波部分分量。避免語(yǔ)音信號(hào)受噪聲影響而導(dǎo)致諧波被淹沒或者諧波減弱的情況。提高語(yǔ)音輸出的質(zhì)量。
      [0066]如圖2所示,在本發(fā)明另一語(yǔ)音信號(hào)處理的實(shí)施例中,除包括上述實(shí)施例中的5個(gè)步驟之外,還包括下面的步驟S600。
      [0067]S600,以預(yù)設(shè)頻率的諧波為基礎(chǔ),使用預(yù)設(shè)系數(shù)的滾降系數(shù)的濾波器對(duì)輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平。
      [0068]其中,所述預(yù)設(shè)頻率與語(yǔ)音信號(hào)本身的頻率范圍,以及某些特殊使用環(huán)境有關(guān)(如真實(shí)語(yǔ)音信號(hào)與機(jī)器語(yǔ)音會(huì)有一定差別)??筛鶕?jù)具體使用環(huán)境確定所述預(yù)設(shè)頻率。
      [0069]具體地,在一個(gè)具體實(shí)例中,根據(jù)IKHz以下諧波的平均功率水平與IKHz?3KHz的諧波平均水平功率之比,應(yīng)用在IKHz增益為OdB,特定滾降Kdb/oct的高通濾波器到所述長(zhǎng)度為M的語(yǔ)音信號(hào)上。以平衡低次諧波與高次諧波的能量水平,提升聽感。
      [0070]在另一實(shí)施例的語(yǔ)音信號(hào)處理的方法中,如圖3所示,在將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊步驟之前,還包括以下步驟:
      [0071]S011,計(jì)算當(dāng)前輸入信號(hào)幀的最大峰值能量。
      [0072]S012,判斷最大峰值能量是否大于能量預(yù)設(shè)值,若是,則繼續(xù)執(zhí)行S100,將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊;若否,則判斷當(dāng)前輸入信號(hào)幀為非語(yǔ)音信號(hào),并返回對(duì)下一輸入信號(hào)幀進(jìn)行最大峰值能量技進(jìn)行判斷。
      [0073]本實(shí)施例中,首先對(duì)輸入信號(hào)的能量進(jìn)行判斷,對(duì)于能量較小的信號(hào)則直接判定為非語(yǔ)音信號(hào),不再進(jìn)行任何處理,避免占用系統(tǒng)的內(nèi)存,也避免處理時(shí)間的浪費(fèi)。在另一角度上能夠提高本發(fā)明的語(yǔ)音信號(hào)處理的方法的處理速度。
      [0074]當(dāng)然,具體的能量值大小的判斷可根據(jù)具體處理環(huán)境確定。如對(duì)于一般音量較高的環(huán)境,所述能量預(yù)設(shè)值會(huì)設(shè)置較高的數(shù)值;而對(duì)于大部分語(yǔ)音信號(hào)都較小的使用環(huán)境,所述能量預(yù)設(shè)值要設(shè)置的較低一些。
      [0075]較佳地,在其中一個(gè)實(shí)施例中,選擇能量預(yù)設(shè)值為52,作為一般麥克風(fēng)輸出信號(hào)是否為語(yǔ)音信號(hào)的判斷。
      [0076]具體的,最大峰值能量Engn = 20*logl0(Max(abs(Xn)))。其中,abs(Xn)為當(dāng)前輸入信號(hào)幀幅值序列,且所述最大峰值能量為最大絕對(duì)值峰值能量。
      [0077]在另一實(shí)施例中,如圖4所示,還包括另一是否語(yǔ)音信號(hào)的判斷步驟。該步驟分幾步進(jìn)行,均執(zhí)行在步驟S200之前具體如下:
      [0078]S021,求取所述當(dāng)前數(shù)據(jù)塊的線性預(yù)測(cè)殘差。
      [0079]在步驟SlOO將兩幀輸入信號(hào)組成當(dāng)前數(shù)據(jù)塊Sn后,本步驟進(jìn)一步的進(jìn)行線性預(yù)測(cè),得到所述當(dāng)前數(shù)據(jù)塊Sn的線性預(yù)測(cè)LPC( I inear predictive coding,線性預(yù)測(cè)編碼)殘差 ESn 0
      [0080]更佳的,可以對(duì)輸入信號(hào)先做降采樣,降低運(yùn)算負(fù)載。且也可要限制線性預(yù)測(cè)LPC的階次,如LPC階數(shù)在SKHz采樣率下選為6階。此時(shí)對(duì)殘差計(jì)算精確度較高,而且計(jì)算量小。
      [0081]S022,計(jì)算線性預(yù)測(cè)殘差歸一化自相關(guān)序列,得到歸一化殘差序列,并查找歸一化殘差序列中的最大幅值。
      [0082]步驟S021得到當(dāng)前數(shù)據(jù)塊的殘差ESn后,本步驟對(duì)殘差進(jìn)行歸一化處理,尋找ESn的歸一化自相關(guān)序列最大點(diǎn)的幅度MAX_AESAn,序號(hào)記為MAX_AESn。
      [0083]其中,本步驟中對(duì)線性預(yù)測(cè)殘差進(jìn)行歸一化處理,使本發(fā)明的語(yǔ)音信號(hào)處理的方法具有通用性,對(duì)每一幀輸入信號(hào)都能采用相同的步驟進(jìn)行處理。且歸一化后的序列在數(shù)值大小方面較為統(tǒng)一(在O?I之間),便于后續(xù)根據(jù)數(shù)值大小直接進(jìn)行判斷操作。
      [0084]S023,判斷最大幅值MAX_AESAn是否大于幅值預(yù)設(shè)值,若是,則判定當(dāng)前數(shù)據(jù)塊為語(yǔ)音信號(hào),并繼續(xù)執(zhí)行步驟S200,計(jì)算當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列;若否,則判定當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)。
      [0085]其中,因?yàn)閷?duì)線性預(yù)測(cè)殘差進(jìn)行了歸一化處理,歸一化之后,取值會(huì)在O?I之間,所以,較為容易確定所述幅值預(yù)設(shè)值。較佳地,根據(jù)語(yǔ)音信號(hào)的特點(diǎn),在其中一個(gè)實(shí)施例中設(shè)定所述幅值預(yù)設(shè)值為0.4。此幅值預(yù)設(shè)值能夠較好的對(duì)語(yǔ)音信號(hào)進(jìn)行粗過濾。
      [0086]本實(shí)施例中,再次對(duì)是否為語(yǔ)音信號(hào)進(jìn)行判斷,進(jìn)一步排除非語(yǔ)音信號(hào),避免非語(yǔ)音信號(hào)的處理造成處理時(shí)間及器件占用造成的浪費(fèi)。且對(duì)于一些非語(yǔ)音信號(hào)可直接做不輸出處理,也能避免非語(yǔ)音信號(hào)輸出的造成輸出信號(hào)噪聲影響。
      [0087]具體的,如圖5所示,作為一種諧波峰值序列求取的方法,步驟S200中計(jì)算當(dāng)前數(shù)據(jù)塊的諧波峰值序列包括以下步驟:
      [0088]S201,計(jì)算當(dāng)前數(shù)據(jù)塊的功率譜。
      [0089]S202,選取最大幅值對(duì)應(yīng)的最大值頻率點(diǎn),以及最大值頻率點(diǎn)前后頻率點(diǎn)。
      [0090]S203,根據(jù)最大值頻率點(diǎn)對(duì)應(yīng)的功率幅值,以及最大值頻率點(diǎn)前后頻率點(diǎn)對(duì)應(yīng)的功率幅值,采用二次插值算法計(jì)算當(dāng)前數(shù)據(jù)塊的基頻。
      [0091]本實(shí)施例中,對(duì)當(dāng)前數(shù)據(jù)塊加窗,較佳地選用漢寧窗,然后當(dāng)前數(shù)據(jù)塊的功率譜Pn,并根據(jù)MAX_AESn對(duì)應(yīng)的頻率fn點(diǎn)。選取Pn中對(duì)應(yīng)的頻率點(diǎn)以及前后的頻率點(diǎn)的幅度,利用二次插值計(jì)算準(zhǔn)確基頻Fpitchn。
      [0092]根據(jù)已經(jīng)計(jì)算出的歸一化殘差序列中的最大幅值的位置,在當(dāng)前數(shù)據(jù)塊的功率譜上確定當(dāng)前數(shù)據(jù)塊的基頻。其中,進(jìn)一步利用所述最大值頻率點(diǎn)兩側(cè)的頻率點(diǎn)利用二次插值進(jìn)行基頻的求取,使當(dāng)前數(shù)據(jù)塊基頻確定更加準(zhǔn)確。
      [0093]此處需要說(shuō)明的是,步驟S200計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜時(shí),也可采用漢寧窗對(duì)當(dāng)前數(shù)據(jù)塊進(jìn)行加窗處理后,再求取頻譜Fn。當(dāng)然,在其他實(shí)施例中,也可采用其他類型的窗對(duì)當(dāng)前數(shù)數(shù)據(jù)塊進(jìn)行加窗處理。
      [0094]S204,根據(jù)基頻在功率譜上進(jìn)行查找,得到當(dāng)前數(shù)據(jù)塊的諧波峰值序列。
      [0095]需要說(shuō)明的是,本實(shí)施例說(shuō)明了一種特定的當(dāng)前數(shù)據(jù)塊基頻和諧波峰值序列的求取方式。尤其是還采用了二次插值計(jì)算了準(zhǔn)確的基頻。在其他實(shí)施例中,本領(lǐng)域技術(shù)人員也可采用其他算法或者方案求取當(dāng)前數(shù)據(jù)塊的基頻以及諧波峰值序列。且采用其他算法進(jìn)行基頻及諧波峰值序列的求取不影響本發(fā)明的語(yǔ)音信號(hào)處理的方法的實(shí)施。
      [0096]在其中一個(gè)實(shí)施例中,當(dāng)通過歸一化殘差序列最大幅值判定當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)后,如圖6所示,對(duì)所述非語(yǔ)音信號(hào)還要進(jìn)行以下判斷處理:
      [0097]SOOl,判斷當(dāng)前數(shù)據(jù)塊的前兩數(shù)據(jù)塊以及后兩數(shù)據(jù)塊是否均為語(yǔ)音信號(hào);
      [0098]S002,若是,則進(jìn)行進(jìn)一步計(jì)算當(dāng)前數(shù)據(jù)塊的基頻;S103,若否,則不對(duì)當(dāng)前數(shù)據(jù)塊進(jìn)行處理,即放棄當(dāng)前數(shù)據(jù)塊,也不對(duì)當(dāng)前數(shù)據(jù)塊的處理結(jié)果進(jìn)行保存。
      [0099]S003,判斷當(dāng)前數(shù)據(jù)塊的基頻與當(dāng)前數(shù)據(jù)塊的前一數(shù)據(jù)塊的基頻之間的第一誤差,以及與當(dāng)前數(shù)據(jù)塊的后一數(shù)據(jù)塊的基頻之間的第二誤差是否均在預(yù)設(shè)范圍內(nèi),若是,則將當(dāng)前數(shù)據(jù)塊進(jìn)行與語(yǔ)音信號(hào)相同的處理;若否,則不對(duì)當(dāng)前數(shù)據(jù)塊進(jìn)行處理。
      [0100]本發(fā)明實(shí)施例中,當(dāng)語(yǔ)音幀與語(yǔ)音幀之間出現(xiàn)無(wú)語(yǔ)音幀時(shí),根據(jù)上兩幀和下兩幀的基頻檢測(cè)結(jié)果,判斷是否補(bǔ)充上本幀或者當(dāng)前數(shù)據(jù)塊的基頻或者跳過當(dāng)前數(shù)據(jù)塊的處理。而當(dāng)連續(xù)出現(xiàn)多幀輸入信號(hào)通過歸一化殘差序列最大幅值判定當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)時(shí),則可以斷定當(dāng)前輸入信號(hào)幀無(wú)需再進(jìn)行保存(其之前的兩個(gè)數(shù)據(jù)塊均為非語(yǔ)音信號(hào))。從而語(yǔ)音幀和語(yǔ)音幀之間無(wú)語(yǔ)音幀信號(hào)保存的長(zhǎng)度被限制在一定范圍內(nèi)。
      [0101]在另一實(shí)施中,還對(duì)同一基頻檢測(cè)結(jié)果的語(yǔ)音幀長(zhǎng)度進(jìn)行限制。將其限制在一定范圍內(nèi)。具體的,當(dāng)檢測(cè)到連續(xù)多幀輸入信號(hào)幀的基頻均相同時(shí),則判定之后輸入的輸入信號(hào)幀為非語(yǔ)音信號(hào),不再對(duì)其進(jìn)行諧波增強(qiáng)的處理。語(yǔ)音信號(hào)的處理速度更快。
      [0102]具體的,在其中一個(gè)實(shí)施例中,當(dāng)前輸入信號(hào)幀長(zhǎng)度為64時(shí),第一誤差與第二誤差的預(yù)設(shè)范圍相同,均為20Hz。
      [0103]更佳地,歸一化殘差序列中最大幅值的位置序號(hào)MAX_AESn(最大值頻率點(diǎn))在(100?800)/Fs范圍內(nèi),其中Fs為語(yǔ)音信號(hào)的采樣率。
      [0104]如圖7所示,為本發(fā)明的語(yǔ)音信號(hào)處理的方法一個(gè)具體實(shí)例流程圖。對(duì)輸入信號(hào)的處理按照以下步驟進(jìn)行:
      [0105]S1001,在時(shí)刻η時(shí)輸入M點(diǎn)信號(hào)幀Xn。
      [0106]S1002,計(jì)算Xn的絕對(duì)值最大峰值能量Engn = 20*logl0(Max(abs(Xn)))。
      [0?07] S1003,判斷Engn是否大于設(shè)定閾值Thr_Eng,若是,則執(zhí)行步驟S1004,如否則返回步驟S1001,輸入下一幀數(shù)據(jù)。
      [0108]S1004,計(jì)算Xn與Xn-1組成的數(shù)據(jù)塊Sn的線性預(yù)測(cè)LPC殘差ESn。,
      [0109]S1005,計(jì)算ESn的歸一化自相關(guān)序列,尋找歸一化自相關(guān)序列的最大幅度位置MAX_AESn與其最大幅度MAX_AESAn,并確定對(duì)應(yīng)基頻頻率Fpitchn。
      [0110]S1006,判斷最大幅度位置MAX_AESn是否在設(shè)定范圍100/Fs?800/Fs內(nèi),以及ESn的歸一化自相關(guān)序列的最大值MAX_AESAn是否大于Thr_AESA,以及基頻Fpitchn = Fs/MAX_AESn與上一幀基頻Fpitchn-1之差小于第一誤差Thr_pitchdiff,若滿足所有條件,則執(zhí)行步驟S1007;若否,則當(dāng)前數(shù)據(jù)塊待定(步驟S1013)
      [0111]S1007,計(jì)算Sn的加窗功率譜Pn和頻譜Fn。
      [ΟΙ12] S1008,根據(jù)Fpitchn在Pn對(duì)應(yīng)位置的附近數(shù)據(jù)進(jìn)行插值修正,得到準(zhǔn)確Fpitchn。
      [0113]S1009,根據(jù)Fpitchn在功率譜Pn中根據(jù)一定規(guī)則尋找諧波峰值位置,得到諧波峰值位置序列Harmon icnD
      [0114]S1010,根據(jù)諧波峰值位置序列Harmonicn對(duì)Fn應(yīng)用相應(yīng)梳狀濾波器。
      [0115]SlOll,把經(jīng)梳狀濾波器處理后的Fn反變換到時(shí)域,得到2M點(diǎn)數(shù)據(jù)塊,并取前一半長(zhǎng)度數(shù)據(jù)與上一次結(jié)果的后一半長(zhǎng)度數(shù)據(jù)相加得到M點(diǎn)輸出on。
      [0116]SI 012,計(jì)算IKHz以上諧波的平均功率水平與IKHz?3KHz的諧波平均水平功率之比,應(yīng)用在IKHz增益為OdB,特定滾降Kdb/oct的濾波器到M點(diǎn)輸出On上。
      [0117]S1013,根據(jù)前兩幀以及后兩幀的語(yǔ)音幀判斷結(jié)果決定是否對(duì)本幀進(jìn)行諧波增強(qiáng)處理。
      [0118]該實(shí)施例通過平衡低次諧波與高次諧波的能量水平,提升聽感。
      [0119]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例提供一種語(yǔ)音信號(hào)處理的裝置,由于此裝置解決問題的原理與前述一種語(yǔ)音信號(hào)處理的方法相似,因此,該系統(tǒng)的實(shí)施可以按照前述方法的具體步驟實(shí)現(xiàn),重復(fù)之處不再贅述。
      [0120]如圖8所示,其中一個(gè)實(shí)施例的語(yǔ)音信號(hào)處理的裝置包括數(shù)據(jù)塊構(gòu)成模塊100、諧波計(jì)算模塊200、諧波處理模塊300、時(shí)域變換模塊400以及信號(hào)整合模塊500。
      [0121]其中,數(shù)據(jù)塊構(gòu)成模塊100,用于將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊;諧波計(jì)算模塊200,用于計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列;諧波處理模塊300,用于根據(jù)所述諧波峰值序列應(yīng)用梳狀濾波器對(duì)所述原始頻譜進(jìn)行處理,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜;時(shí)域變換模塊400,用于對(duì)所述當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào);信號(hào)整合模塊500,用于將所述當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。
      [0122]該實(shí)施例的語(yǔ)音信號(hào)處理的裝置,通過使用梳狀濾波器對(duì)語(yǔ)音信號(hào)的諧波進(jìn)行處理,增強(qiáng)語(yǔ)音信號(hào)的諧波分量壓制信號(hào)中的非諧波分量(噪聲),提升語(yǔ)音信號(hào)的辨識(shí)度。
      [0123]在另一實(shí)施例中,如圖9所示,語(yǔ)音信號(hào)處理的裝置還包括能量平衡模塊600,用于以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平。
      [0124]具體的,根據(jù)語(yǔ)音信號(hào)的特點(diǎn),可以以IKHz作為基礎(chǔ)頻率點(diǎn)(高次諧波和低次諧波分界點(diǎn)),采用當(dāng)前數(shù)據(jù)塊的IKHz以下諧波的平均功率水平與IKHz?3KHz的諧波平均水平功率之比,應(yīng)用在IKHz處增益為OdB,帶有滾降系數(shù)的特定滾降Kdb/oct的高通濾波器對(duì)輸出的語(yǔ)音信號(hào)進(jìn)行再次處理,平衡低次諧波與高次諧波的能量水平。
      [0125]如圖10所示,語(yǔ)音信號(hào)處理的裝置中還可以包括能量值計(jì)算模塊010,以及第一信號(hào)判斷模塊011。
      [0126]其中,能量值計(jì)算模塊010,用于計(jì)算當(dāng)前輸入信號(hào)幀的最大峰值能量;第一信號(hào)判斷模塊011,用于判斷最大峰值能量是否大于能量預(yù)設(shè)值,若是,則繼續(xù)執(zhí)行數(shù)據(jù)塊構(gòu)成模塊100;若否,則判定當(dāng)前輸入信號(hào)幀為非語(yǔ)音信號(hào)。
      [0127]本領(lǐng)域技術(shù)人員可以理解,該實(shí)施例中,能量值計(jì)算模塊010和第一信號(hào)判斷模塊011均執(zhí)行在前述的數(shù)據(jù)塊構(gòu)成模塊100之前,先對(duì)輸入的當(dāng)前信號(hào)幀進(jìn)行一次判斷,這樣可以避免對(duì)明顯非語(yǔ)音信號(hào)的復(fù)雜處理,提高語(yǔ)音信號(hào)處理的整體速度。
      [0128]如圖11所示,一實(shí)施例的語(yǔ)音信號(hào)處理的裝置中還包括殘差求取模塊020、最大幅值查找模塊021以及第二判斷模塊022。
      [0129]其中,殘差求取模塊020,用于求取當(dāng)前數(shù)據(jù)塊的線性預(yù)測(cè)殘差;最大幅值查找模塊021,用于計(jì)算線性預(yù)測(cè)殘差歸一化自相關(guān)序列,得到歸一化殘差序列,并查找歸一化殘差序列中的最大幅值;第二判斷模塊022,用于判斷最大幅值是否大于幅值預(yù)設(shè)值,若是,則判定當(dāng)前數(shù)據(jù)塊為語(yǔ)音信號(hào),并繼續(xù)執(zhí)行諧波計(jì)算模塊200,計(jì)算當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列;若否,則判定當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)。
      [0130]該實(shí)施例中,再次對(duì)輸入的信號(hào)進(jìn)行是否語(yǔ)音信號(hào)的判斷,也能縮短非語(yǔ)音信號(hào)對(duì)處理程序的占用。
      [0131]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,如本發(fā)明實(shí)施例中,該程序可存儲(chǔ)于計(jì)算機(jī)系統(tǒng)的存儲(chǔ)介質(zhì)中,并被該計(jì)算機(jī)系統(tǒng)中的至少一個(gè)處理器執(zhí)行,以實(shí)現(xiàn)包括如上述各方法的實(shí)施例的流程。其中,所述存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(Read-Only Memory,R0M)或隨機(jī)存儲(chǔ)記憶體(Random AccessMemory,RAM)等。
      [0132]以上所述實(shí)施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡(jiǎn)潔,未對(duì)上述實(shí)施例中的各個(gè)技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說(shuō)明書記載的范圍。
      [0133]以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
      【主權(quán)項(xiàng)】
      1.一種語(yǔ)音信號(hào)處理的方法,其特征在于,所述方法包括以下步驟: 將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊; 計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列; 根據(jù)所述諧波峰值序列應(yīng)用梳狀濾波器對(duì)所述原始頻譜進(jìn)行處理,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜; 對(duì)所述當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào); 將所述當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。2.根據(jù)權(quán)利要求1所述的語(yǔ)音信號(hào)處理的方法,其特征在于,還包括以下步驟: 以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡所述輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平。3.根據(jù)權(quán)利要求1所述的語(yǔ)音信號(hào)處理的方法,其特征在于,在將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊步驟之前,還包括以下步驟: 計(jì)算所述當(dāng)前輸入信號(hào)幀的最大峰值能量; 判斷所述最大峰值能量是否大于能量預(yù)設(shè)值,若是,則繼續(xù)執(zhí)行所述將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊的步驟;若否,則判定所述當(dāng)前輸入信號(hào)幀為非語(yǔ)音信號(hào)。4.根據(jù)權(quán)利要求1所述的語(yǔ)音信號(hào)處理的方法,其特征在于,還包括以下步驟: 求取所述當(dāng)前數(shù)據(jù)塊的線性預(yù)測(cè)殘差; 計(jì)算所述線性預(yù)測(cè)殘差歸一化自相關(guān)序列,得到歸一化殘差序列,并查找所述歸一化殘差序列中的最大幅值; 判斷所述最大幅值是否大于幅值預(yù)設(shè)值,若是,則判定所述當(dāng)前數(shù)據(jù)塊為語(yǔ)音信號(hào),并繼續(xù)執(zhí)行所述計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列的步驟;若否,則判定所述當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)。5.根據(jù)權(quán)利要求4所述的語(yǔ)音信號(hào)處理的方法,其特征在于,所述計(jì)算所述當(dāng)前數(shù)據(jù)塊的諧波峰值序列包括以下步驟: 計(jì)算所述當(dāng)前數(shù)據(jù)塊的功率譜; 選取所述最大幅值對(duì)應(yīng)的最大值頻率點(diǎn),以及所述最大值頻率點(diǎn)前后頻率點(diǎn); 根據(jù)所述最大值頻率點(diǎn)對(duì)應(yīng)的功率幅值,以及所述最大值頻率點(diǎn)前后頻率點(diǎn)對(duì)應(yīng)的功率幅值,采用二次插值算法計(jì)算所述當(dāng)前數(shù)據(jù)塊的基頻; 根據(jù)所述基頻在所述功率譜上進(jìn)行查找,得到所述當(dāng)前數(shù)據(jù)塊的所述諧波峰值序列。6.根據(jù)權(quán)利要求2所述的語(yǔ)音信號(hào)處理的方法,其特征在于,所述以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡所述輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平;包括: 根據(jù)所述當(dāng)前數(shù)據(jù)塊的IKHz以下諧波的平均功率水平與I KHz?3KHz的諧波平均水平功率之比,應(yīng)用在IKHz增益為OdB,特定滾降Kdb/oct的高通濾波器,平衡低次諧波與高次諧波的能量水平。7.根據(jù)權(quán)利要求5所述的語(yǔ)音信號(hào)處理的方法,其特征在于,所述計(jì)算所述當(dāng)前數(shù)據(jù)塊的功率譜時(shí),采用漢寧窗對(duì)所述當(dāng)前數(shù)據(jù)塊進(jìn)行截取,再使用截取后的信號(hào)求取所述當(dāng)前數(shù)據(jù)塊的功率譜。8.根據(jù)權(quán)利要求4所述的語(yǔ)音信號(hào)處理的方法,其特征在于,判定所述當(dāng)前數(shù)據(jù)塊為非語(yǔ)音信號(hào)后,還包括以下步驟: 判斷當(dāng)前數(shù)據(jù)塊的前一數(shù)據(jù)塊以及后一數(shù)據(jù)塊是否均為語(yǔ)音信號(hào); 若是,則進(jìn)行進(jìn)一步計(jì)算所述當(dāng)前數(shù)據(jù)塊的基頻,若否,則不對(duì)所述當(dāng)前數(shù)據(jù)塊進(jìn)行處理; 判斷所述當(dāng)前數(shù)據(jù)塊的基頻與所述當(dāng)前數(shù)據(jù)塊的前一數(shù)據(jù)塊的基頻之間的第一誤差,以及與所述當(dāng)前數(shù)據(jù)塊的后一數(shù)據(jù)塊的基頻之間的第二誤差是否均在預(yù)設(shè)范圍內(nèi),若是,則將所述當(dāng)前數(shù)據(jù)塊進(jìn)行與語(yǔ)音信號(hào)相同的處理;若否,則不對(duì)所述當(dāng)前數(shù)據(jù)塊進(jìn)行處理。9.根據(jù)權(quán)利要求1所述的語(yǔ)音信號(hào)處理的方法,其特征在于,所述歸一化殘差序列中最大幅值的位置序號(hào)在100/Fs?800/Fs/Fs范圍內(nèi),其中Fs為所述語(yǔ)音信號(hào)的采樣率。10.一種語(yǔ)音信號(hào)處理的裝置,其特征在于,包括: 數(shù)據(jù)塊構(gòu)成模塊,用于將當(dāng)前輸入信號(hào)幀與相鄰前一輸入信號(hào)幀組合構(gòu)成當(dāng)前數(shù)據(jù)塊; 諧波計(jì)算模塊,用于計(jì)算所述當(dāng)前數(shù)據(jù)塊的原始頻譜和諧波峰值序列; 諧波處理模塊,用于根據(jù)所述諧波峰值序列應(yīng)用梳狀濾波器對(duì)所述原始頻譜進(jìn)行處理,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前數(shù)據(jù)塊頻譜; 時(shí)域變換模塊,用于對(duì)所述當(dāng)前數(shù)據(jù)塊頻譜進(jìn)行時(shí)域反變換,得到所述當(dāng)前數(shù)據(jù)塊的當(dāng)前時(shí)域處理信號(hào); 信號(hào)整合模塊,用于將所述當(dāng)前時(shí)域處理信號(hào)的前一半長(zhǎng)度數(shù)據(jù),與相鄰前一數(shù)據(jù)塊的前一時(shí)域處理信號(hào)的后一半長(zhǎng)度數(shù)據(jù)求和,得到輸出語(yǔ)音信號(hào)。11.根據(jù)權(quán)利要求10所述的語(yǔ)音信號(hào)處理的裝置,其特征在于,還包括能量平衡模塊,用于以預(yù)設(shè)頻率的諧波為基準(zhǔn),使用帶有滾降系數(shù)的高通濾波器對(duì)所述輸出語(yǔ)音信號(hào)進(jìn)行處理,平衡所述輸出語(yǔ)音信號(hào)的高次諧波與低次諧波的能量水平。
      【文檔編號(hào)】G10L25/21GK105845146SQ201610348302
      【公開日】2016年8月10日
      【申請(qǐng)日】2016年5月23日
      【發(fā)明人】黃榮均
      【申請(qǐng)人】珠海市杰理科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1