国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      電話線質(zhì)量語(yǔ)音的基音周期提取方法

      文檔序號(hào):8283480閱讀:371來源:國(guó)知局
      電話線質(zhì)量語(yǔ)音的基音周期提取方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及數(shù)字化語(yǔ)音通信技術(shù)領(lǐng)域,特別涉及一種電話線質(zhì)量語(yǔ)音的基音周期 提取方法。
      【背景技術(shù)】
      [0002] 基音周期是語(yǔ)音壓縮編碼中非常重要的參數(shù),也是很多語(yǔ)音相關(guān)技術(shù)用到的參 數(shù),基音周期參數(shù)的正確提取是保證數(shù)字化語(yǔ)音正常通信的前提。
      [0003] 目前的基音周期參數(shù)提取技術(shù)對(duì)于頻譜完整的語(yǔ)音,也就是60-4000HZ的語(yǔ)音, 可以達(dá)到較高的提取準(zhǔn)確度。對(duì)于電話線質(zhì)量語(yǔ)音,其并不單純指電話系統(tǒng)的語(yǔ)音,也包括 其它由于經(jīng)過了 300-3400HZ帶通濾波器而導(dǎo)致語(yǔ)音頻譜缺失的語(yǔ)音,比如模擬對(duì)講機(jī)的 語(yǔ)音。因此,電話線質(zhì)量語(yǔ)音大部分的基頻被濾掉了(人的基頻范圍是60-400HZ),會(huì)造成 基音周期對(duì)應(yīng)的不是自相關(guān)函數(shù)的最大值,甚至不會(huì)出現(xiàn)在候選值當(dāng)中,但是目前的提取 技術(shù)嚴(yán)重依賴于自相關(guān)函數(shù),因此提取的準(zhǔn)確度不高,會(huì)出現(xiàn)很嚴(yán)重的錯(cuò)誤,比如男聲變得 尖細(xì),女聲變得粗重,不僅影響聽感,也影響說話人的識(shí)別和說話內(nèi)容的辨別,影響很大。

      【發(fā)明內(nèi)容】

      [0004] 本發(fā)明旨在至少在一定程度上解決上述相關(guān)技術(shù)中的技術(shù)問題之一。
      [0005] 為此,本發(fā)明的目的在于提出一種電話線質(zhì)量語(yǔ)音的基音周期提取方法,該方法 將時(shí)域與頻域相結(jié)合,在對(duì)電話線質(zhì)量語(yǔ)音提取時(shí),具有準(zhǔn)確度高的優(yōu)點(diǎn)。
      [0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)施例提出了一種電話線質(zhì)量語(yǔ)音的基音周期提取 方法,包括以下步驟:對(duì)輸入的原始語(yǔ)音進(jìn)行非線性處理,并計(jì)算所述原始語(yǔ)音的第一時(shí)域 自相關(guān)函數(shù)和非線性處理后的語(yǔ)音的第二時(shí)域自相關(guān)函數(shù);融合所述第一時(shí)域自相關(guān)函數(shù) 和所述第一時(shí)域自相關(guān)函數(shù)得到第三時(shí)域自相關(guān)函數(shù);計(jì)算原始語(yǔ)音中每一幀的長(zhǎng)時(shí)基音 周期,并根據(jù)所述長(zhǎng)時(shí)基音周期對(duì)所述第三時(shí)域自相關(guān)函數(shù)進(jìn)行修正;對(duì)所述原始語(yǔ)音進(jìn) 行LPC逆濾波得到余量信號(hào),并對(duì)所述余量信號(hào)進(jìn)行FFT變換,并根據(jù)變換結(jié)果計(jì)算頻域 自相關(guān)函數(shù);根據(jù)所述第三時(shí)域自相關(guān)函數(shù)和所述頻域自相關(guān)函數(shù)計(jì)算基音周期候選值的 時(shí)域權(quán)重和頻域權(quán)重,并根據(jù)所述時(shí)域權(quán)重和頻域權(quán)重得到所述基音周期候選值的最終權(quán) 重;根據(jù)所述基音周期候選值以及所述基音周期候選值的最終權(quán)重進(jìn)行路徑規(guī)劃,以確定 最終的基音周期值。
      [0007] 根據(jù)本發(fā)明實(shí)施例的電話線質(zhì)量語(yǔ)音的基音周期提取方法,將時(shí)域與頻域相結(jié) 合,時(shí)域上,引進(jìn)一個(gè)新的參數(shù)一一長(zhǎng)時(shí)基音周期,并根據(jù)語(yǔ)音短時(shí)平穩(wěn)特性,對(duì)自相關(guān)函 數(shù)進(jìn)行時(shí)域修正,去除不可能成為基音周期的延時(shí)值;頻域上,計(jì)算頻域自相關(guān)函數(shù),將基 音周期候選值所對(duì)應(yīng)的頻域自相關(guān)值也作為候選值權(quán)重的一部分,以增大真正基音周期的 權(quán)重。進(jìn)而,該方法能夠提高電話線質(zhì)量語(yǔ)音的基音周期提取的準(zhǔn)確度。
      [0008] 另外,根據(jù)本發(fā)明上述實(shí)施例的電話線質(zhì)量語(yǔ)音的基音周期提取方法還可以具有 如下附加的技術(shù)特征:
      [0009] 在一些示例中,通過以下公式計(jì)算所述第三時(shí)域自相關(guān)函數(shù):
      【主權(quán)項(xiàng)】
      1. 一種電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,包括w下步驟: 對(duì)輸入的原始語(yǔ)音進(jìn)行非線性處理,并計(jì)算所述原始語(yǔ)音的第一時(shí)域自相關(guān)函數(shù)和非 線性處理后的語(yǔ)音的第二時(shí)域自相關(guān)函數(shù); 融合所述第一時(shí)域自相關(guān)函數(shù)和所述第一時(shí)域自相關(guān)函數(shù)得到第=時(shí)域自相關(guān)函 數(shù); 計(jì)算原始語(yǔ)音中每一帖的長(zhǎng)時(shí)基音周期,并根據(jù)所述長(zhǎng)時(shí)基音周期對(duì)所述第=時(shí)域自 相關(guān)函數(shù)進(jìn)行修正; 對(duì)所述原始語(yǔ)音進(jìn)行LPC逆濾波得到余量信號(hào),并對(duì)所述余量信號(hào)進(jìn)行FFT變換,并根 據(jù)變換結(jié)果計(jì)算頻域自相關(guān)函數(shù); 根據(jù)所述第=時(shí)域自相關(guān)函數(shù)和所述頻域自相關(guān)函數(shù)計(jì)算基音周期候選值的時(shí)域權(quán) 重和頻域權(quán)重,并根據(jù)所述時(shí)域權(quán)重和頻域權(quán)重得到所述基音周期候選值的最終權(quán)重; 根據(jù)所述基音周期候選值W及所述基音周期候選值的最終權(quán)重進(jìn)行路徑規(guī)劃,W確定 最終的基音周期值。
      2. 根據(jù)權(quán)利要求1所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,通過W 下公式計(jì)算所述第=時(shí)域自相關(guān)函數(shù):
      其中,Rc?b( T )為所述第S時(shí)域自相關(guān)函數(shù),T )為原始語(yǔ)音的第一時(shí)域自相關(guān)函 數(shù),Rabs( T )為非線性處理后的語(yǔ)音的第二時(shí)域自相關(guān)函數(shù)。
      3. 根據(jù)權(quán)利要求1所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,所述計(jì) 算原始語(yǔ)音中每一帖的長(zhǎng)時(shí)基音周期,具體包括:
      其中,1為帖號(hào),Pwg(l)為當(dāng)前帖的長(zhǎng)時(shí)基音周期,pa-1)是上一帖的長(zhǎng)時(shí)基音周期, Pmid位于男聲和女聲基音周期范圍重合的部分,Vl_l為0和1時(shí)分別表示上一帖是清音和濁 音,Gi_i為上一帖的能量,G。為能量的口限值。
      4. 根據(jù)權(quán)利要求3所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,其中,如 果上一帖語(yǔ)音信號(hào)是濁音,且其能量大于口限值G。,則用上一帖的長(zhǎng)時(shí)基音周期來更新當(dāng) 前帖的長(zhǎng)時(shí)基音周期,否則用Pmid更新當(dāng)前帖的長(zhǎng)時(shí)基音周期。
      5. 根據(jù)權(quán)利要求4所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,其中,通 過W下公式對(duì)所述第=時(shí)域自相關(guān)函數(shù)進(jìn)行修正:
      其中,Pthl和P th2為兩個(gè)口限闊值。
      6. 根據(jù)權(quán)利要求5所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,其中, Pthl 二 45, P 化2 二 26。

      7. 根據(jù)權(quán)利要求5所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,其中,如 果位于Pmi。到P 之間T值的長(zhǎng)時(shí)基音周期大于P thi,則將該T的自相關(guān)函數(shù)值置為0。
      8. 根據(jù)權(quán)利要求1所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,對(duì)所述 余量信號(hào)進(jìn)行FFT變換,并根據(jù)變換結(jié)果計(jì)算頻域自相關(guān)函數(shù),具體包括:
      其中,氏f(f)為頻域自相關(guān)函數(shù),s(m)為余量信號(hào)的FFT變換結(jié)果。
      9. 根據(jù)權(quán)利要求1所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,通過W 下公式計(jì)算所述基音周期候選值的最終權(quán)重: Rsx(T,f) = aR_b(T) + (l-a)Rsf(f), 其中,Rsx(T,f)為基音周期候選值T的最終權(quán)重,aRe"mb(T)為時(shí)域權(quán)重,(1-a) Rsf(f)為頻域權(quán)重,T與f成對(duì)應(yīng)關(guān)系,Rc"b(T)為時(shí)域自相關(guān)值,Rsf(f)是頻域自相關(guān)值, a為加權(quán)因子。
      10. 根據(jù)權(quán)利要求9所述的電話線質(zhì)量語(yǔ)音的基音周期提取方法,其特征在于,其中, a 為 0. 5。
      【專利摘要】本發(fā)明提出一種電話線質(zhì)量語(yǔ)音的基音周期提取方法,包括以下步驟:對(duì)原始語(yǔ)音進(jìn)行非線性處理,計(jì)算原始語(yǔ)音的第一時(shí)域自相關(guān)函數(shù)和非線性處理后的語(yǔ)音的第二時(shí)域自相關(guān)函數(shù);融合第一時(shí)域自相關(guān)函數(shù)和第一時(shí)域自相關(guān)函數(shù)得到第三時(shí)域自相關(guān)函數(shù);計(jì)算原始語(yǔ)音中每一幀的長(zhǎng)時(shí)基音周期,并據(jù)此對(duì)第三時(shí)域自相關(guān)函數(shù)進(jìn)行修正;對(duì)原始語(yǔ)音進(jìn)行LPC逆濾波得到余量信號(hào),并進(jìn)行FFT變換,根據(jù)變換結(jié)果計(jì)算頻域自相關(guān)函數(shù);根據(jù)第三時(shí)域自相關(guān)函數(shù)和頻域自相關(guān)函數(shù)計(jì)算基音周期候選值的時(shí)域權(quán)重和頻域權(quán)重,并進(jìn)一步得到最終權(quán)重;根據(jù)最終權(quán)重進(jìn)行路徑規(guī)劃,以確定最終的基音周期值。本發(fā)明的方法在對(duì)電話線質(zhì)量語(yǔ)音提取時(shí),具有準(zhǔn)確度高的優(yōu)點(diǎn)。
      【IPC分類】G10L19-09, G10L25-90
      【公開號(hào)】CN104599682
      【申請(qǐng)?zhí)枴緾N201510017199
      【發(fā)明人】常亮, 唐昆, 崔慧娟
      【申請(qǐng)人】清華大學(xué)
      【公開日】2015年5月6日
      【申請(qǐng)日】2015年1月13日
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1