較高精度。在使用時(shí),可根據(jù)實(shí)際的效率或精度要求進(jìn)行靈活選取。
[0044](2)將谷值位置的信息提取出來,可以得到相應(yīng)的氣音信息頻譜圖。
[0045]具體來說,設(shè)FFT窗對(duì)應(yīng)位置的基頻被測(cè)定為z赫茲,F(xiàn)FT的點(diǎn)數(shù)為2n^lJFFT結(jié)果中的多個(gè)位置s=2nz/a*(m-0.5)均為谷值所在的位置,其中,m>0,m為整數(shù),(KsUn+1,Ef!,f2,fr..為FFT結(jié)果的各個(gè)分量。由上述公式計(jì)算出的位置s不一定為整數(shù),而FFT結(jié)果中的分量位置為整數(shù),故還應(yīng)采取一定方法進(jìn)行取數(shù),以得到所需的氣音信息,本發(fā)明所采用的方法有以下兩種:
方法1:使用四舍五入法取整下標(biāo),則取得的數(shù)值(即提取出的氣音信息)為k =f[s],其中[S]表示對(duì)S進(jìn)行四舍五入。
[0046]方法2:如圖3所示,使用線性插值取數(shù)方式,記rSs向下取整的結(jié)果;則取得的數(shù)值卿提取出的氣音信息)*!^!-^-!.))*;^+^-!.)*;^。
[0047]以上兩種方法中,方法I的效率較高,而方法2則能獲得較高精度。在使用時(shí),可根據(jù)實(shí)際的效率或精度要求進(jìn)行靈活選取。
[0048](五)分別對(duì)聲音信息和氣音信息進(jìn)行修改。
[0049]經(jīng)過步驟(四)可以得到兩張獨(dú)立的頻譜圖,可根據(jù)實(shí)際需要在這兩張頻譜圖上分別對(duì)聲音信息和氣音信息進(jìn)行修改。
[0050](六)合成修改后的聲音信息和氣音信息,得到最終的人聲語(yǔ)音信號(hào)。
[0051]聲音信息和氣音信息的單獨(dú)修改結(jié)束后,可根據(jù)聲音信息和氣音信息相互之間的位置關(guān)系進(jìn)行排序?qū)蓮堫l譜圖合成,以還原為語(yǔ)音信號(hào)。
[0052]本實(shí)施例具有的有益效果是:
I)能夠?qū)⒙曇粜畔⑴c氣音信息進(jìn)行分離,從而能實(shí)現(xiàn)對(duì)這兩者的單獨(dú)修改操作。
[0053]2)可以將修改后的聲音信息與氣音信息合成,以恢復(fù)成正常的人類聲音語(yǔ)音信號(hào),更加方便和全面。
[0054]以上是對(duì)本發(fā)明的較佳實(shí)施進(jìn)行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實(shí)施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請(qǐng)權(quán)利要求所限定的范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種聲氣信號(hào)分離與合成的方法,其特征在于:包括: A、將采樣的人聲語(yǔ)音信號(hào)由時(shí)域轉(zhuǎn)換到頻域,得到原始的頻譜圖; B、根據(jù)原始的頻譜圖測(cè)定人聲語(yǔ)音信號(hào)的基頻; C、在原始的頻譜圖上將與基頻成整數(shù)倍距離的位置標(biāo)記為峰值的位置,以兩峰之間的位置作為谷值的位置; D、從原始的頻譜圖中分別將峰值的位置信息和谷值的位置信息提取出來,進(jìn)而得到峰值的位置信息對(duì)應(yīng)的聲音信息頻譜圖以及谷值的位置信息對(duì)應(yīng)的氣音信息頻譜圖; E、分別對(duì)聲音信息頻譜圖中的聲音信息和氣音信息頻譜圖中的氣音信息進(jìn)行處理; F、將處理后的聲音信息和處理后的氣音信息頻進(jìn)行合成,得到最終的人聲語(yǔ)音信號(hào)。2.根據(jù)權(quán)利要求1所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述步驟A,其具體為: 采用至少0.02322*a點(diǎn)的重疊加窗快速傅里葉變換對(duì)采樣的人聲語(yǔ)音信號(hào)進(jìn)行處理,得到原始的頻譜圖,其中,a為設(shè)定的采樣頻率。3.根據(jù)權(quán)利要求2所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述步驟A,其具體為:所述步驟B,其具體為: 通過分片段重疊加窗測(cè)定時(shí)域信號(hào)周期序列的方法,準(zhǔn)確測(cè)定出人聲語(yǔ)音信號(hào)的信號(hào)流在不同時(shí)間點(diǎn)的基頻,其中,片段的長(zhǎng)度在快速傅里葉變換窗口長(zhǎng)度的I到4倍的范圍內(nèi),重疊加窗的間距小于等于快速傅里葉變換的窗間距。4.根據(jù)權(quán)利要求2所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述步驟D,其包括: 將峰值的位置信息從原始的頻譜圖中提取出來,進(jìn)而得到聲音信息頻譜圖; 將峰谷的位置的信息從原始的頻譜圖中提取出來,進(jìn)而得到聲音信息頻譜圖。5.根據(jù)權(quán)利要求4所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述將峰值的位置信息提取出來,得到聲音信息頻譜圖這一步驟,其包括: D11、計(jì)算快速傅里葉變換結(jié)果中的理論峰值位置P,所述理論峰值位置P的計(jì)算公式為:p=2nz/a*m,其中,2n為快速傅里葉變換的點(diǎn)數(shù),η和m均為正整數(shù),z為快速傅里葉變換窗口對(duì)應(yīng)位置所測(cè)定的基頻,0〈p〈2n—1; D12、判斷理論峰值位置P是否為整數(shù),若是,則以理論峰值位置P對(duì)應(yīng)的信息作為提取出的聲音信息;反之,則采用四舍五入法或線性插值法進(jìn)行處理,得到提取出的聲音信息。6.根據(jù)權(quán)利要求5所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述步驟D12中采用四舍五入法或線性插值法進(jìn)行處理,得到提取出的聲音信息這一步驟,其具體為: 若采用四舍五入法,則對(duì)理論峰值位置P進(jìn)行四舍五入,然后以P四舍五入后的結(jié)果對(duì)應(yīng)的信息作為提取出的聲音信息; 若采用線性插值法,則提取出的聲音信息1的計(jì)算公式為^=(1-(口-9))*€9+(口-9)*仇,其中,q為P向下取整的結(jié)果,fjPfP分別為快速傅里葉變換結(jié)果中位置q和位置P對(duì)應(yīng)的分量。7.根據(jù)權(quán)利要求4所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述將峰谷的位置的信息從原始的頻譜圖中提取出來,進(jìn)而得到聲音信息頻譜圖這一步驟,其包括: D21、計(jì)算快速傅里葉變換結(jié)果中的理論谷值位置s,所述理論谷值位置s的計(jì)算公式為:s=2nz/a* (m-0.5),其中,2n為快速傅里葉變換的點(diǎn)數(shù),η和m均為正整數(shù),z為快速傅里葉變換窗口對(duì)應(yīng)位置所測(cè)定的基頻,0<s<2n-1; D22、判斷理論谷值位置s是否為整數(shù),若是,則以理論谷值位置s對(duì)應(yīng)的信息作為提取出的氣音信息;反之,則采用四舍五入法或線性插值法進(jìn)行處理,得到提取出的氣音信息。8.根據(jù)權(quán)利要求7所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述步驟D22中采用四舍五入法或線性插值法進(jìn)行處理,得到提取出的氣音信息這一步驟,其具體為: 若采用四舍五入法,則對(duì)理論谷值位置s進(jìn)行四舍五入,然后以s四舍五入后的結(jié)果對(duì)應(yīng)的信息作為提取出的氣音信息; 若采用線性插值法’則提取出的氣音信息沾勺計(jì)算公式為:!^=!^-^-!.))*;^+^-!.)*;^,其中,r為S向下取整的結(jié)果,fdPfr分別為快速傅里葉變換結(jié)果中位置S和位置r對(duì)應(yīng)的分量。9.根據(jù)權(quán)利要求1-8任一項(xiàng)所述的一種聲氣信號(hào)分離與合成的方法,其特征在于:所述步驟D在將峰值的位置信息和谷值的位置信息提取出來得到兩張頻譜圖后,還需對(duì)這兩張頻譜圖分別執(zhí)行插值處理才能得到完整的聲音信息頻譜圖和氣音信息頻譜圖。10.一種聲氣信號(hào)分離與合成的系統(tǒng),其特征在于:包括: 轉(zhuǎn)換模塊,用于將采樣的人聲語(yǔ)音信號(hào)由時(shí)域轉(zhuǎn)換到頻域,得到原始的頻譜圖; 測(cè)定模塊,用于根據(jù)原始的頻譜圖測(cè)定人聲語(yǔ)音信號(hào)的基頻; 標(biāo)記模塊,用于在原始的頻譜圖上將與基頻成整數(shù)倍距離的位置標(biāo)記為峰值的位置,以兩峰之間的位置作為谷值的位置; 提取模塊,用于從原始的頻譜圖中分別將峰值的位置信息和谷值的位置信息提取出來,進(jìn)而得到峰值的位置信息對(duì)應(yīng)的聲音信息頻譜圖以及谷值的位置信息對(duì)應(yīng)的氣音信息頻譜圖; 單獨(dú)處理模塊,用于分別對(duì)聲音信息頻譜圖中的聲音信息和氣音信息頻譜圖中的氣音信息進(jìn)行處理; 合成模塊,用于將處理后的聲音信息和處理后的氣音信息頻進(jìn)行合成,得到最終的人聲語(yǔ)音信號(hào); 所述轉(zhuǎn)換模塊的輸出端依次通過測(cè)定模塊、標(biāo)記模塊、提取模塊和單獨(dú)處理模塊進(jìn)而與合成模塊的輸入端連接。
【專利摘要】本發(fā)明公開了一種聲氣信號(hào)分離與合成的方法及系統(tǒng),方法包括:將采樣的人聲語(yǔ)音信號(hào)由時(shí)域轉(zhuǎn)換到頻域,得到原始的頻譜圖;根據(jù)原始的頻譜圖測(cè)定人聲語(yǔ)音信號(hào)的基頻;在原始的頻譜圖上將與基頻成整數(shù)倍距離的位置標(biāo)記為峰值的位置,以兩峰之間的位置作為谷值的位置;從原始的頻譜圖中分別將峰值的位置信息和谷值的位置信息提取出來,進(jìn)而得到對(duì)應(yīng)的聲音信息頻譜圖以及對(duì)應(yīng)的氣音信息頻譜圖;分別對(duì)聲音信息和氣音信息進(jìn)行處理;將處理后的聲音信息和處理后的氣音信息頻進(jìn)行合成,得到最終的人聲語(yǔ)音信號(hào)。本發(fā)明能將聲音信息與氣音信息進(jìn)行分離,以單獨(dú)對(duì)聲音信號(hào)或氣音信號(hào)進(jìn)行修改等后續(xù)處理,可廣泛應(yīng)用于信號(hào)處理領(lǐng)域。
【IPC分類】G10L21/028, G10L25/18, G10L13/07, G10L21/0272
【公開號(hào)】CN105679331
【申請(qǐng)?zhí)枴緾N201511033483
【發(fā)明人】滕少華, 霍穎翔, 張巍
【申請(qǐng)人】廣東工業(yè)大學(xué)
【公開日】2016年6月15日
【申請(qǐng)日】2015年12月30日