基于超完備傅里葉基的語(yǔ)音信號(hào)稀疏表示方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及數(shù)字信號(hào)處理和模式分類技術(shù),特別設(shè)及一種基于超完備傅里葉基的 語(yǔ)音信號(hào)稀疏表示方法,即利用計(jì)算機(jī)對(duì)語(yǔ)音信號(hào)進(jìn)行稀疏表示的方法。
【背景技術(shù)】
[0002] 語(yǔ)音信號(hào)稀疏表示在語(yǔ)音信號(hào)處理中有重要地位,它能降低信號(hào)處理成本,提高 壓縮效率。廣泛使用的稀疏變換有傅里葉變換、離散余弦變換等。該些方法的缺點(diǎn)在于稀 疏表示基固定,有時(shí)不能取得好的稀疏表示效果?;诔陚渥值涞男盘?hào)稀疏表示方法用 超完備的冗余函數(shù)系統(tǒng)代替?zhèn)鹘y(tǒng)的正交函數(shù)基,為信號(hào)的稀疏展開(kāi)提供了極大的靈活性, 利用字典的冗余特性可W捕捉原始信號(hào)的自然特征,取得很好的信號(hào)稀疏表示效果。
[0003] 語(yǔ)音信號(hào)是人的發(fā)聲器官所發(fā)出的聲音。由于人的發(fā)聲系統(tǒng)的特殊性,語(yǔ)音在頻 譜上會(huì)呈現(xiàn)共振峰結(jié)構(gòu),在二維的語(yǔ)譜圖上則表現(xiàn)為緩慢變化的帶狀結(jié)構(gòu)。該說(shuō)明語(yǔ)音信 號(hào)在頻域上具有稀疏性,具備稀疏展開(kāi)條件。針對(duì)傅里葉變換基固定所造成的頻率分辨率 固定的缺點(diǎn),本發(fā)明利用超完備的傅里葉基對(duì)語(yǔ)音信號(hào)進(jìn)行稀疏表示,W提高語(yǔ)音信號(hào)的 稀疏表示性能。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種利用語(yǔ)音信號(hào)的頻域稀疏特性并利用超完備傅里葉 基對(duì)語(yǔ)音信號(hào)進(jìn)行稀疏表示的方法。
[0005] 本發(fā)明的目的是該樣實(shí)現(xiàn)的:
[0006] 一種基于超完備傅里葉基的語(yǔ)音信號(hào)稀疏表示方法,其內(nèi)容包括如下步驟:
[0007] (1)根據(jù)需要構(gòu)造超完備傅里葉基;
[000引 似將輸入信號(hào)進(jìn)行分帖,進(jìn)行線性預(yù)測(cè)估計(jì),獲得線性預(yù)測(cè)系數(shù);
[0009] (3)利用所獲得的線性預(yù)測(cè)系數(shù)求線性預(yù)測(cè)譜;
[0010] (4)捜索線性預(yù)測(cè)譜的局部極大值,獲得當(dāng)前帖語(yǔ)音的共振峰數(shù)目;
[ocm] (5)將步驟(4)所獲得的共振峰數(shù)作為依據(jù),利用超完備傅里葉基進(jìn)行稀疏逼近,W獲得稀疏表示系數(shù),即獲得語(yǔ)音信號(hào)的稀疏表示;
[0012] (6)重復(fù)步驟(2)-巧),直至任務(wù)結(jié)束。
[0013] 作為人類特有的聲音,語(yǔ)音在頻譜上具有共振峰結(jié)構(gòu),是語(yǔ)音信號(hào)在頻域上具有 稀疏性的體現(xiàn),能夠在頻域上對(duì)語(yǔ)音信號(hào)進(jìn)行稀疏表示。用超完備傅里葉基對(duì)語(yǔ)音信號(hào)進(jìn) 行稀疏表示,彌補(bǔ)了離散傅里葉變換中基函數(shù)固定導(dǎo)致頻譜能量泄露的不足,可W在頻域 上對(duì)語(yǔ)音信號(hào)進(jìn)行更好的稀疏逼近。線性預(yù)測(cè)譜的局部極大值與語(yǔ)譜中的共振峰具有對(duì)應(yīng) 關(guān)系,通過(guò)捜索線性預(yù)測(cè)譜局部極大值獲得的共振峰數(shù)目,為稀疏系數(shù)中非零元的數(shù)目提 供了依據(jù),提高了語(yǔ)音稀疏逼近性能。
[0014] 本發(fā)明將輸入的語(yǔ)音信號(hào)進(jìn)行線性預(yù)測(cè)估計(jì),獲得線性預(yù)測(cè)系數(shù),然后計(jì)算線性 預(yù)測(cè)譜,通過(guò)捜索線性預(yù)測(cè)譜的局部極大值獲得共振峰數(shù)目,W此作為稀疏系數(shù)中非零元 數(shù)目的依據(jù),最后用超完備傅里葉基對(duì)語(yǔ)音信號(hào)進(jìn)行稀疏逼近w獲得稀疏系數(shù),完成語(yǔ)音 信號(hào)的稀疏表示。
[0015] 由于采用上述技術(shù)方案,本發(fā)明提供的一種基于超完備傅里葉基的語(yǔ)音信號(hào)稀疏 表示方法,與現(xiàn)有技術(shù)相比具有該樣的有益效果:
[0016] 現(xiàn)有的稀疏表示技術(shù),要么W能量殘余作為稀疏表示的終止條件,要么W固定的 稀疏表示系數(shù)數(shù)目作為稀疏表示的終止,沒(méi)有充分考慮語(yǔ)音信號(hào)本身特點(diǎn)。本發(fā)明利用線 性預(yù)測(cè)譜的局部極大值與語(yǔ)譜中的共振峰之間的對(duì)應(yīng)關(guān)系,通過(guò)捜索線性預(yù)測(cè)譜局部極大 值獲得的共振峰數(shù)目,為稀疏系數(shù)中非零元的數(shù)目提供了依據(jù),提高了語(yǔ)音稀疏逼近的性 能。
【附圖說(shuō)明】
[0017] 圖1是語(yǔ)音稀疏表示流程圖。
【具體實(shí)施方式】
[001引下面結(jié)合附圖舉例對(duì)本發(fā)明做詳細(xì)的描述:
[0019] 一種基于超完備傅里葉基的語(yǔ)音信號(hào)稀疏表示方法,其實(shí)施例流程圖如圖1所 示,現(xiàn)根據(jù)圖1對(duì)本發(fā)明方法做詳細(xì)說(shuō)明如下:
[0020] (1)根據(jù)需要的頻率分辨率構(gòu)造超完備傅里葉基;設(shè)待稀疏表示信號(hào)的帖長(zhǎng)為N, 令
[0021]
[0022] 式中的《為離散頻率點(diǎn),設(shè)所需的頻率分辨率為A= 231/M,式中M是頻率分辨 率控制參數(shù),為整數(shù),M決定超完備傅里葉基的頻率分辨率,M>N,M的值越大,則頻率分辨 率越局;則超完備傅里基A為 [002引A = [e (0) e ( A )…e (2 31 - A )]
[0024]A的維數(shù)為NXM;
[0025] (2)將輸入信號(hào)進(jìn)行分帖,分帖后的信號(hào)為s(n),長(zhǎng)度為N,建立P階線性預(yù)測(cè)模 型,使用Durbin遞推算法進(jìn)行線性預(yù)測(cè)估計(jì),獲得P個(gè)線性預(yù)測(cè)系數(shù),并組成線性預(yù)測(cè)系數(shù) 向量a=[ai32 …ap];
[0026] 做利用所獲得的線性預(yù)測(cè)系數(shù)向量a求線性預(yù)測(cè)譜H(ej'u)
[0027]
[002引式中的G為增益因子,可W設(shè)為1 ;
[0029] (4)對(duì)數(shù)字頻帶[0,31)進(jìn)行抽樣,抽樣間隔為0 = 31/L,式中L為抽樣間隔控制 參數(shù),L> 0,且為整數(shù),L決定所得到的線性預(yù)測(cè)譜的光滑程度,L的大小可W根據(jù)需要進(jìn) 行設(shè)定,L越大,所得到的線性預(yù)測(cè)譜幅值越光滑,將《 =ejw(0《n<L)代入|H(ej'u)I, 可得離散化的線性預(yù)測(cè)譜幅值,捜索線性預(yù)測(cè)譜幅值的局部極大值,根據(jù)預(yù)先設(shè)定的終止 條件,可獲得線性預(yù)測(cè)譜幅值的m個(gè)局部極大值,即為當(dāng)前帖語(yǔ)音的共振峰數(shù)目;
[0030] (5)將步驟(4)所獲得共振峰數(shù)m作為依據(jù),利用超完備傅里葉基進(jìn)行稀疏逼近, W獲得稀疏表示系數(shù),即獲得語(yǔ)音信號(hào)的稀疏表示;
【主權(quán)項(xiàng)】
1. 一種基于超完備傅里葉基的語(yǔ)音信號(hào)稀疏表示方法,其特征在于該方法內(nèi)容包括如 下步驟: (1) 根據(jù)需要的頻率分辨率構(gòu)造超完備傅里葉基;設(shè)待稀疏表示信號(hào)的幀長(zhǎng)為N,令 Θ(ω) = [I eJUeJU …eJN"T 式中的ω為離散頻率點(diǎn),設(shè)所需的頻率分辨率為△ =2π/Μ,式中M是頻率分辨率控 制參數(shù),為整數(shù),M決定超完備傅里葉基的頻率分辨率,M > N,M的值越大,則頻率分辨率越 尚;則超完備傅里基A為 A = [e (O) e ( Δ ) ... e (2 π - Δ )] A的維數(shù)為NXM ; (2) 將輸入信號(hào)進(jìn)行分幀,分幀后的信號(hào)為s (η),長(zhǎng)度為N,建立P階線性預(yù)測(cè)模型,使 用Durbin遞推算法進(jìn)行線性預(yù)測(cè)估計(jì),獲得P個(gè)線性預(yù)測(cè)系數(shù),并組成線性預(yù)測(cè)系數(shù)向量 B - [£li 七··· £lp]; (3) 利用所獲得的線性預(yù)測(cè)系數(shù)向量a求線性預(yù)測(cè)譜H(e>)式中的G為增益因子,可以設(shè)為1 ; (4) 對(duì)數(shù)字頻帶[0, π)進(jìn)行抽樣,抽樣間隔為Θ = π/L,式中L為抽樣間隔控制參數(shù), L > 0,且為整數(shù),L決定所得到的線性預(yù)測(cè)譜的光滑程度,L的大小可以根據(jù)需要進(jìn)行設(shè)定, L越大,所得到的線性預(yù)測(cè)譜幅值越光滑,將ω = (〇 < n < L)代入|H(e>) I,可得離 散化的線性預(yù)測(cè)譜幅值,搜索線性預(yù)測(cè)譜幅值的局部極大值,根據(jù)預(yù)先設(shè)定的終止條件,可 獲得線性預(yù)測(cè)譜幅值的m個(gè)局部極大值,即為當(dāng)前幀語(yǔ)音的共振峰數(shù)目; (5) 將步驟(4)所獲得共振峰數(shù)m作為依據(jù),利用超完備傅里葉基進(jìn)行稀疏逼近,以獲 得稀疏表示系數(shù),即獲得語(yǔ)音信號(hào)的稀疏表示; (6) 重復(fù)步驟(2)-(5),直至任務(wù)結(jié)束。
【專利摘要】本發(fā)明公開(kāi)了一種基于超完備傅里葉基的語(yǔ)音信號(hào)稀疏表示方法,其步驟是:根據(jù)需要構(gòu)造超完備傅里葉基;將輸入信號(hào)進(jìn)行分幀,進(jìn)行線性預(yù)測(cè)估計(jì),獲得線性預(yù)測(cè)系數(shù);利用所獲得的線性預(yù)測(cè)系數(shù)求線性預(yù)測(cè)譜;搜索線性預(yù)測(cè)譜的局部極大值,獲得當(dāng)前幀語(yǔ)音的共振峰數(shù)目;將所獲得共振峰數(shù)作為依據(jù),利用超完備傅里葉基進(jìn)行稀疏逼近,以獲得稀疏表示系數(shù),即獲得語(yǔ)音信號(hào)的稀疏表示,從而完成語(yǔ)音信號(hào)的稀疏表示。本發(fā)明利用線性預(yù)測(cè)譜的局部極大值與語(yǔ)譜中的共振峰之間的對(duì)應(yīng)關(guān)系,通過(guò)搜索線性預(yù)測(cè)譜局部極大值獲得的共振峰數(shù)目,為稀疏系數(shù)中非零元的數(shù)目提供了依據(jù),提高了語(yǔ)音稀疏逼近的性能。
【IPC分類】G10L25/27
【公開(kāi)號(hào)】CN104978972
【申請(qǐng)?zhí)枴緾N201510229462
【發(fā)明人】劉冠群, 張汝波, 楊大偉, 唐莉莉, 吳俊偉
【申請(qǐng)人】大連民族學(xué)院
【公開(kāi)日】2015年10月14日
【申請(qǐng)日】2015年5月7日