国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于字典分類的音頻匹配追蹤裝置及其追蹤方法與流程

      文檔序號:11097983閱讀:601來源:國知局
      一種基于字典分類的音頻匹配追蹤裝置及其追蹤方法與制造工藝

      本發(fā)明涉及音頻編碼領(lǐng)域,具體是一種基于字典分類的音頻匹配追蹤裝置。



      背景技術(shù):

      稀疏表示一般指用盡量少的基函數(shù)來準確地表示原始信號,從而抓住信號的主要特征,進而從本質(zhì)上降低信號處理成本。匹配追蹤(MP:Matching pursuit)作為使用較廣的稀疏表示算法之一,其基本思路是在迭代過程中依次從過完備字典中選擇最優(yōu)原子,使得信號的逼近更為優(yōu)化。由于MP算法用來表示信號的過完備字典基可以自適應(yīng)根據(jù)信號本身的特點來靈活地選??;并且其在原子選擇過程中采取的是一種重復迭代逼近的貪婪算法,保證了最終得到的原子系數(shù)個數(shù)較少,MP算法被廣泛應(yīng)用于信號分析的各個領(lǐng)域,如圖像處理、生物醫(yī)學信號處理、音頻處理等。

      隨著人們對流媒體質(zhì)量要求的提高以及移動終端用戶數(shù)量的不斷增加,音視頻編碼效率的要求也日漸提高。傳統(tǒng)匹配追蹤算法因其計算復雜度較高,不適應(yīng)于實時處理。目前已提出多種快速匹配追蹤算法,但大都涉及耗時的優(yōu)化,或是犧牲稀疏表示效率為補償,計算速度也難以滿足大規(guī)模問題的需要。



      技術(shù)實現(xiàn)要素:

      本發(fā)明的目的在于提供一種基于字典分類的音頻匹配追蹤裝置,以解決上述背景技術(shù)中提出的問題。

      為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:

      一種基于字典分類的音頻匹配追蹤裝置,包括信號分解單元和信號重構(gòu)單元,信號分解單元包括字典建立模塊、信號分類模塊、權(quán)值比較模塊、殘差計算模塊和閾值控制模塊,信號重構(gòu)單元包括重構(gòu)系數(shù)提取模塊和信號合成模塊。

      所述基于字典分類的音頻匹配追蹤裝置的追蹤方法,包括信號分解方法和信號重構(gòu)方法;所述信號分解方法的具體步驟如下:

      步驟一,根據(jù)不同處理信號類型選擇對應(yīng)的稀疏字典;

      步驟二,判斷待處理信號的類型,根據(jù)其類型選擇與之相適應(yīng)的稀疏字典,對原始信號進行分類預處理,計算其與步驟一中所建立的稀疏字典的匹配度;

      步驟三,將步驟二中得出的稀疏字典記為D,為求各字典中各原子在待處理信號上的權(quán)重系數(shù),將稀疏字典中的原子依次與待處理信號做內(nèi)積,計算內(nèi)積絕對值的最大值;

      步驟四,由步驟三可得待處理信號在字典中最大原子處的分量,則此次迭代后信號殘差為信號與該分量的矢量差值,同時在稀疏系數(shù)矢量中記錄更新的稀疏系數(shù);

      步驟五,匹配追蹤算法處理信號是通過累計迭代,將原始信號表示成權(quán)重與對應(yīng)原子相乘的疊加與殘差之和,當信號殘差減少至一定值時可以終止迭代,該一定值可由迭代次數(shù)和信噪比共同決定;

      所述信號重構(gòu)方法的具體步驟如下:

      步驟一,從稀疏系數(shù)碼流中提取重構(gòu)信號要使用到的原子權(quán)重、原子標號和所用字典類型標號;

      步驟二,根據(jù)字典類型標號確定編碼時采用稀疏字典類型,將步驟一中所得原子權(quán)重與其對應(yīng)稀疏字典中的原子做乘積,并依次累加,得輸出信號為此次匹配追蹤算法最終對原始信號的擬合信號。

      作為本發(fā)明進一步的方案:信號分解方法中步驟二計算待處理信號與步驟一中所建立的稀疏字典的匹配度的具體計算步驟如下:計算待處理信號對應(yīng)的頻域值,將待處理信號的時域值與頻域值分別歸一化后劃分成j個長度為a的小段(a≤N/2),再計算各小段的能量值,a個連續(xù)樣本的能量值可近似計算式如下:分別計算時頻域能量的和的兩倍,并比較其大小,

      作為本發(fā)明進一步的方案:信號分解方法中步驟三所述的內(nèi)積絕對值最大值的計算公式為:iopt∈[1,M]為字典中原子標號,為各原子與S的內(nèi)積值,為字典中原子在S上的最大權(quán)重系數(shù)。

      作為本發(fā)明進一步的方案:信號分解方法中步驟五中所述的信噪比簡化計算公式為:S為稀疏表示處理前的原始信號幅度值,S′為此次稀疏表示恢復后的信號幅度值。

      與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明通過對信號進行分類,對不同類型的信號采取不同的稀疏字典進行MP算法,減少了無關(guān)遍歷次數(shù),降低了計算復雜度;在分類預處理過程中,通過計算原始信號的能量分布區(qū)間判斷其適應(yīng)的稀疏字典;本方法縮小了所需字典的維度,提高了編碼速率,使用效果好。

      附圖說明

      圖1為基于字典分類的音頻匹配追蹤裝置中信號分解方法的流程圖。

      圖2為基于字典分類的音頻匹配追蹤裝置中信號重構(gòu)方法的流程圖。

      圖3為基于字典分類的音頻匹配追蹤裝置中信號分解單元的結(jié)構(gòu)示意圖。

      圖4為基于字典分類的音頻匹配追蹤裝置中信號重構(gòu)單元的結(jié)構(gòu)示意圖。

      其中:101-字典建立模塊,102-信號分類模塊,103-權(quán)值比較模塊,104-殘差計算模塊,105-閾值控制模塊,201-重構(gòu)系數(shù)提取模塊,202-信號合成模塊。

      具體實施方式

      下面結(jié)合具體實施方式對本專利的技術(shù)方案作進一步詳細地說明。

      請參閱圖1-4,一種基于字典分類的音頻匹配追蹤裝置,包括信號分解單元和信號重構(gòu)單元,信號分解單元包括字典建立模塊101、信號分類模塊102、權(quán)值比較模塊103、殘差計算模塊104和閾值控制模塊105,信號重構(gòu)單元包括重構(gòu)系數(shù)提取模塊201和信號合成模塊202。

      字典建立模塊101用于構(gòu)建適用于不同類型信號的稀疏字典。例如對于語音處理系統(tǒng),選擇具有語音特性的字典;對于瞬變信號處理系統(tǒng),選擇相對瞬態(tài)的字典;而對于一些特征并不明顯或者是同時需要處理多種類型信號的系統(tǒng)而言,則選擇普適性較強的字典。信號分類模塊102用于判斷待處理信號的類型,根據(jù)其類型選擇與之相適應(yīng)的稀疏字典,對原始信號進行分類預處理,計算其與字典建立模塊中所建立的稀疏字典的匹配度。具體計算步驟如下:首先計算待處理信號對應(yīng)的頻域值,將待處理信號的時域值與頻域值分別歸一化后劃分成一定個數(shù)的定長小段,再計算各小段的能量值;由于信號的幅度平方之和與信號幅度之和存在類正比關(guān)系,同時計算信號幅度之和的計算量遠遠小于計算信號的幅度平方之和,因此以信號幅度之和來近似。再分別計算時頻域能量的和,并比較其大小,能量和越大,信號能量分布越密集。假設(shè)時域能量的和大于頻域能量的和,選擇時域能量較為集中的Gabor字典,反之,選擇頻域能量較為集中的余弦字典,記錄稀疏字典類型。權(quán)值比較模塊103用于求各原子在待處理信號上的權(quán)重系數(shù),從信號分類模塊102中得出的稀疏字典,將稀疏字典中的原子依次與待處理信號做內(nèi)積,計算內(nèi)積絕對值的最大值。殘差計算模塊104用于計算待處理信號與權(quán)值比較模塊中所得原子方向分量的殘差值,由于原子方向分量等于權(quán)值絕對值的最大值與該原子的乘積,該殘差值等于信號與原子方向分量的矢量差值,同時將更新的稀疏系數(shù)記錄在稀疏系數(shù)矢量中,原子標號對應(yīng)于稀疏系數(shù)矢量中該稀疏系數(shù)所在位置,該位置的值為原子權(quán)重。閾值控制模塊105用于利用控制信噪比(SNR)閾值與迭代次數(shù)共同監(jiān)督循環(huán)匹配的精度,匹配追蹤算法處理信號是通過累計迭代,將原始信號表示成權(quán)重與對應(yīng)原子相乘的疊加與殘差之和,當信號殘差減少至一定值時可以終止迭代,該一定值可由迭代次數(shù)、信噪比(SNR)共同決定,當達到目標SNR或者預設(shè)迭代次數(shù)時終止循環(huán)迭代,輸出稀疏系數(shù)矢量,反之重復預處理模塊至殘差計算模塊直至滿足終止條件,由于信號的幅度平方之和與信號幅度之和存在類正比關(guān)系,同時計算信號幅度之和的計算量遠遠小于計算信號的幅度平方之和,因此信噪比可近似計算為原始信號與殘差信號幅度絕對值的比值的對數(shù)。重構(gòu)系數(shù)提取模塊201用于提取稀疏系數(shù)碼流中重構(gòu)信號要使用到的原子權(quán)重(稀疏系數(shù))、原子標號(對應(yīng)于稀疏系數(shù)矢量中該稀疏系數(shù)所在位置)和所用字典類型標號。信號合成模塊202用于合成信號,使用重構(gòu)系數(shù)提取模塊201中得到的字典類型標號確定編碼時采用稀疏字典類型,將原子權(quán)重與其對應(yīng)稀疏字典中的原子做乘積,并依次累加,得輸出信號為此次匹配追蹤算法最終對原始信號的擬合信號

      所述基于字典分類的音頻匹配追蹤裝置的追蹤方法,包括信號分解方法和信號重構(gòu)方法;所述信號分解方法的具體步驟如下:

      步驟一,根據(jù)不同處理信號類型選擇對應(yīng)的稀疏字典,例如對于語音處理系統(tǒng),選擇具有語音特性的字典;對于瞬變信號處理系統(tǒng),選擇相對瞬態(tài)的字典;而對于一些特征并不明顯或者是同時需要處理多種類型信號的系統(tǒng)而言,則選擇普適性較強的字典,常用的是時域能量較為集中的Gabor字典和頻域能量較為集中的余弦字典;Gabor字典:其中,w表示頻率尺度;μ表示時間偏移量;σ表示時間尺度;λ表示原子能量。假設(shè)時間尺度的變化范圍為1到N,N為待處理信號的長度。頻率尺度w、時間尺度σ、原子能量λ共有M1個組合形式,則字典大小為M1×N;余弦字典:其中,m表示分析窗索引,u表示頻率收縮系數(shù),k表示頻率尺度,L0表示初始步長,也就是首個分析窗長度的一半。假設(shè)頻率尺度的變化范圍為1到N,分析窗索引m、頻率收縮系數(shù)u共有M2個組合形式,則字典大小為M2×N。

      步驟二,判斷待處理信號的類型,根據(jù)其類型選擇與之相適應(yīng)的稀疏字典,對原始信號進行分類預處理,計算其與步驟一中所建立的稀疏字典的匹配度,匹配度的具體計算步驟如下:計算待處理信號對應(yīng)的頻域值,將待處理信號的時域值與頻域值分別歸一化后劃分成j個長度為a的小段(a≤N/2),再計算各小段的能量值,由于信號的幅度平方之和與信號幅度之和存在類正比關(guān)系,同時計算信號幅度之和的計算量遠遠小于計算信號的幅度平方之和,a個連續(xù)樣本的能量值可近似計算式如下:分別計算時

      頻域能量的和的兩倍,并比較其大小,能量和越大,信號能量分布越密集,假設(shè)時域能量的和大于頻域能量的和Energyt,j>Energyf,j,選擇時域能量集中的Gabor字典,反之選擇頻域能量集中的余弦字典,記錄稀疏字典類型;

      步驟三,將步驟二中得出的稀疏字典記為D,為求各字典中各原子在待處理信號上的權(quán)重系數(shù),將稀疏字典中的原子依次與待處理信號做內(nèi)積,計算內(nèi)積絕對值的最大值,內(nèi)積絕對值最大值的計算公式為:iopt∈[1,M]為字典中原子標號,為各原子與S的內(nèi)積值,為字典中原子在S上的最大權(quán)重系數(shù);

      步驟四,由步驟三可得待處理信號在字典中最大原子處的分量,則此次迭代后信號殘差為信號與該分量的矢量差值,同時在稀疏系數(shù)矢量中記錄更新的稀疏系數(shù),S在字典中最大原子處的分量為則可知此次迭代后信號殘差為:

      同時記錄更新稀疏系數(shù):

      其中,為稀疏系數(shù)矢量,原子標號對應(yīng)于稀疏系數(shù)矢量中該稀疏系數(shù)所在位置,該位置的值為原子權(quán)重

      步驟五,匹配追蹤算法處理信號是通過累計迭代,將原始信號表示成權(quán)重與對應(yīng)原子相乘的疊加與殘差之和,信號殘差為S′later,當S′later減少至一定值時可以終止迭代,該一定值可由迭代次數(shù)、信噪比(SNR)共同決定,當達到目標SNR或者預設(shè)迭代次數(shù)時終止循環(huán)迭代,輸出稀疏系數(shù)矢量與步驟一得到的稀疏字典類型標號,反之重復步驟二至步驟五直至滿足終止條件,信噪比的定義如下:

      由于信號的幅度平方之和與信號幅度之和存在類正比關(guān)系,同時計算信號幅度之和的計算量遠遠小于計算信號的幅度平方之和,因此信噪比簡化計算公式為:其中,S為稀疏表示處理前的原始信號幅

      度值,S′為此次稀疏表示恢復后的信號幅度值;

      所述信號重構(gòu)方法的具體步驟如下:

      步驟一,從稀疏系數(shù)碼流中提取重構(gòu)信號要使用到的原子權(quán)重、原子標號和所用字典類型標號;

      步驟二,根據(jù)字典類型標號確定編碼時采用稀疏字典類型,將步驟一中所得原子權(quán)重與其對應(yīng)稀疏字典中的原子gi做乘積,并依次累加,得Sout為此次匹配追蹤算法最終對原始信號S的擬合信號,

      其中,k為稀疏系數(shù)個數(shù)。

      對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。

      此外,應(yīng)當理解,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一個獨立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當將說明書作為一個整體,各實施例中的技術(shù)方案也可以經(jīng)適當組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實施方式。

      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1