国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法

      文檔序號(hào):2833070閱讀:824來源:國知局
      專利名稱:信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于聲信號(hào)分析處理技術(shù)領(lǐng)域,具體涉及到按音樂信號(hào)的信號(hào)復(fù)雜度對(duì)音樂信號(hào)進(jìn)行分級(jí),為編碼速率選擇提供依據(jù),提高編碼傳輸效率。
      背景技術(shù)
      隨著通信技術(shù)的發(fā)展,數(shù)字化通信越來越受到人們的重視,現(xiàn)代通信的一個(gè)重要標(biāo)志就是通信的數(shù)字化。數(shù)字信號(hào)最突出的優(yōu)點(diǎn)是受信道噪聲干擾小,易于再生與存儲(chǔ),易于誤碼保護(hù)和加密以及易于多路復(fù)用、分組和組合。但音頻信號(hào)若是經(jīng)過A/D轉(zhuǎn)換后直接編碼,將產(chǎn)生大量的數(shù)據(jù),這不利于傳輸或存儲(chǔ),因此為了提高效率,必須對(duì)音頻信號(hào)進(jìn)行壓縮處理;而原始的音頻信號(hào)在時(shí)間和空間上存在著大量的冗余度可供壓縮,并且可以在解碼環(huán)節(jié)加以恢復(fù)。音頻編碼屬于信源編碼,由于音頻信號(hào)的最終使用者是用戶,所以只要音頻信號(hào)解碼后在人耳可接受的或是不能察覺的范圍內(nèi),就允許對(duì)數(shù)字音頻信號(hào)進(jìn)行壓縮以換取較高的編碼速率。現(xiàn)代衛(wèi)星通信、數(shù)字移動(dòng)通信和個(gè)人通信網(wǎng)的迅猛發(fā)展,日益增加的客戶需求量與現(xiàn)有通信信道容量之間的矛盾日益突出。如何提高信道的傳輸效率、有效地利用現(xiàn)有帶寬是目前亟待解決的問題之一。對(duì)于音樂信號(hào)來說,如何在現(xiàn)有的信道資源條件下,選擇適當(dāng)?shù)木幋a速率而又不影響信號(hào)質(zhì)量,提高傳輸效率,即利用信源信號(hào)的特征來指導(dǎo)編碼速率的選擇并提高傳輸效率是近幾年比較需要的。但此類研究還剛起步,成果并不多。本發(fā)明研究的正是基于音頻本身性質(zhì)來選擇編碼速率的模型機(jī)制,提出按音樂信號(hào)的信號(hào)復(fù)雜度對(duì)音樂信號(hào)進(jìn)行分類,區(qū)別于傳統(tǒng)音樂信號(hào)分類,能為編碼速率選擇提供依據(jù),提高編碼傳輸效率。在學(xué)術(shù)上,基于信號(hào)復(fù)雜度的分類和傳統(tǒng)意義上的音樂類型分類(music genre classification) [I]和音樂情緒分類(music mode/emotion classification)是有本質(zhì)區(qū)別的。后者是從音樂信號(hào)的內(nèi)容(例如主題,韻律,旋律,類別,樂器,情緒等)出發(fā),多用于數(shù)字音樂庫的整理和檢索;而前者是從應(yīng)用和聲音信號(hào)傳輸速率和質(zhì)量出發(fā)。初步實(shí)驗(yàn)表明,傳統(tǒng)音樂信號(hào)分類對(duì)音樂信號(hào)的復(fù)雜度有一定的指導(dǎo)作用,但不意味著同一類的音樂信號(hào)在同樣傳輸速率下所達(dá)到的傳輸質(zhì)量是一致的,并不是所有的復(fù)雜有用聲音信號(hào)都需要同樣高的碼率來傳輸。參考文獻(xiàn)George Tzanetakis, Perry Cook, “Musical Genre Classification of Audio Signals,,IEEE Transactions On Speech And Audio Processing, VOL 10,NO. 5,July 2002.Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland, “The HTK Book ” .Olivier Lartillot,Petri Toiviainen,Tuomas Eerola.,,MIRtoolbox” Qin Yan,Saeed Vasegi. ^Modelling and Synthesis of Formants ofBritish, American and Australian Accents.,,Proc. IEEE Conference on Acoustics Speech and Signal Processing (ICASSP),2003.pp. 712-755.Qin Yan,Saeed Vaseghi, Dimitrios Rentzos, Ching-Hsiang Ho.,,Analysis by Synthesis of Acoustic Correlates of British,Australian and American Accents. Proc (ICASSP) pp. 621-624(2004) 韓紀(jì)慶,馮濤,鄭貴濱,馬翼平.“音頻信息處理技術(shù)北京清華大學(xué)出版社 2007.

      發(fā)明內(nèi)容
      本發(fā)明研究的是復(fù)雜有用聲音信號(hào)復(fù)雜度和編碼速率之間的映射關(guān)系。目的是提出一組能表征音樂信號(hào)復(fù)雜度的特征參數(shù)集,并以此為分類依據(jù),為傳輸速率選擇提供依據(jù)。本發(fā)明的信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法包含如下五個(gè)過程
      A.特征提取提取音頻輸入信號(hào)的特征參數(shù)集,基于該特征參數(shù)集為輸入音頻信號(hào)導(dǎo)出特征矢量;
      B.MOS值提取建立編碼質(zhì)量的MOS值數(shù)據(jù)庫;
      C.聚類對(duì)A步驟得到的特征矢量樣本進(jìn)行聚類處理,得到特征聚類碼本;
      D.對(duì)應(yīng)建立C步驟得到的類別與編碼速率的對(duì)應(yīng)關(guān)系,得到信號(hào)復(fù)雜度與編碼速率的映射關(guān)系碼本;
      E.測(cè)試測(cè)試D步驟得到的碼本是否有效。通過對(duì)本發(fā)明信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法的正確使用,一方面可以進(jìn)一步用于音樂的分類研究,另一方面對(duì)音樂復(fù)雜度的分級(jí),在保證編碼質(zhì)量的前提下, 用不同的速率對(duì)不同復(fù)雜度的音樂進(jìn)行編碼,使得音質(zhì)與文件體積之間達(dá)到平衡,實(shí)現(xiàn)指導(dǎo)編碼速率的自動(dòng)選擇,提高編碼傳輸效率。


      圖I是特征提取流程圖。圖2是MOS值提取過程中用到的ITU-R標(biāo)準(zhǔn)BS. 1387定義的PEAQ算法示意圖。圖3是對(duì)應(yīng)過程流程圖。圖4是信號(hào)復(fù)雜度與編碼速率選擇的映射實(shí)現(xiàn)方法流程圖。圖5是短時(shí)特征的第一類各個(gè)MOS值區(qū)間的樣本數(shù)占總樣本數(shù)統(tǒng)計(jì)結(jié)果圖。圖6是長時(shí)特征的第一類各個(gè)MOS值區(qū)間的樣本數(shù)占總樣本數(shù)統(tǒng)計(jì)結(jié)果圖。
      具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明方法作進(jìn)一步詳細(xì)說明。信號(hào)復(fù)雜度與編碼速率選擇的映射實(shí)現(xiàn)方法包含如下步驟
      A、特征提取提取音頻輸入信號(hào)的特征參數(shù)集,基于該特征參數(shù)集為輸入音頻信號(hào)導(dǎo)

      特征矢量。特征提取過程(如圖I所示)包含以下步驟
      Al.在提取特征之前,首先將音頻信號(hào)轉(zhuǎn)換成數(shù)字形式,即將wav形式的音頻文件通過一定的采樣率對(duì)其進(jìn)行采樣,得到一系列離散的采樣點(diǎn)。A2.將數(shù)字形式的音頻信號(hào)分幀,即通過計(jì)算一定時(shí)間內(nèi)包含多少個(gè)采樣點(diǎn)來劃
      5分幀。根據(jù)對(duì)語音信號(hào)的研究,音頻信號(hào)特性是隨時(shí)間而變化的,所以是一個(gè)非穩(wěn)態(tài)過程。 但從另一方面來看的話,雖然音頻信號(hào)具有時(shí)變特性,但在一個(gè)短時(shí)間范圍內(nèi)其特性基本保持不變即相對(duì)穩(wěn)定,因而可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程。因此本發(fā)明中分幀的時(shí)間隨特征的特性而定,總體上有長時(shí)特征和短時(shí)特征之分。長時(shí)特征的幀長一般以秒為數(shù)量級(jí), 而短時(shí)特征的巾貞長一般以暈秒為數(shù)量級(jí);
      A3.從數(shù)字形式的音頻信號(hào)樣本幀中計(jì)算要提取的特征;
      A4.把該特征參數(shù)集轉(zhuǎn)換成該幀的特征矢量輸出。B、MOS值提取建立編碼質(zhì)量的MOS值數(shù)據(jù)庫。MOS值提取過程包含的步驟如下 BI.為了使音頻文件能夠被 AMR-WB+ (Extended Adaptive Multi-Rate audio codec
      Wideband寬帶自適應(yīng)多速率音頻擴(kuò)展壓縮編碼)編碼器識(shí)別,需要轉(zhuǎn)換音頻格式,包括音頻的位速、采樣大小、采樣頻率和音頻格式等。B2.將每段音樂切割成若干片段片段。在matlab環(huán)境下,使用帝國理工大學(xué)電子工程系Mike Brooks主持編寫Matlab的音頻工具箱voicebox。Vociebox中的readwav函數(shù)可以讀取步驟BI得到的特定格式的音頻。B3.將B2步驟得到的音頻片段,用encoder編碼器和decoder解碼器對(duì)每個(gè)片段分別編解碼,再用改進(jìn)的PEAQ算法器衡量得到該片段的編碼質(zhì)量MOS值。B4.用encoder編碼器編碼時(shí),AMR-WB+編碼速率的范圍為5. 2_36kbit/s,用不同的速率都重復(fù)B3步驟,最后得到不同速率下所得的編碼質(zhì)量MOS值。C、聚類:對(duì)A步驟得到的特征矢量樣本進(jìn)行聚類處理,得到特征聚類碼本;聚類過程包
      含以下步驟
      Cl.將步驟A得到的特征矢量集轉(zhuǎn)換成htk格式。C2.利用HTK工具包[2]中的Hquant訓(xùn)練工具對(duì)Cl得到的數(shù)據(jù)進(jìn)行聚類,得到聚類碼本。D、對(duì)應(yīng)建立C步驟得到的類別與編碼速率的對(duì)應(yīng)關(guān)系,得到信號(hào)復(fù)雜度與編碼速率的
      映射關(guān)系碼本。對(duì)應(yīng)過程包含以下步驟
      Dl.根據(jù)C過程得到的特征聚類碼本,判定音頻信號(hào)每幀所在的類別,并記錄每幀在各個(gè)預(yù)定編碼速率下的MOS值。D2.統(tǒng)計(jì)每個(gè)類別的每個(gè)編碼速率下各個(gè)MOS值區(qū)間內(nèi)的樣本數(shù)占總樣本數(shù)的比例。D3.根據(jù)D2得到的比例數(shù)據(jù),得到映射關(guān)系碼本,里面記錄的是每個(gè)類別要達(dá)到特定編碼質(zhì)量MOS值需要的編碼速率。E、測(cè)試測(cè)試D步驟得到的碼本是否有效。測(cè)試過程包含以下步驟
      El.用不同于步驟A中的音頻信號(hào)進(jìn)行步驟A,B,得到音頻信號(hào)的特征矢量和實(shí)際編碼速率下的MOS值。E2.根據(jù)特征聚類碼本,判定每幀音頻信號(hào)所在的類別,然后根據(jù)映射關(guān)系碼本, 用該類別下達(dá)到目標(biāo)MOS值所需的預(yù)定編碼速率對(duì)其編解碼,得到預(yù)定編碼速率下的編碼質(zhì)量MOS值。
      E3.對(duì)比實(shí)際編碼速率下的MOS值和預(yù)定編碼速率下的MOS值,測(cè)試出映射關(guān)系碼本的效果。音樂特征提取是一個(gè)計(jì)算一系列能表示一段音樂特征數(shù)值的過程。要建立基于音樂信號(hào)復(fù)雜度的編碼速率選擇模型的話,音樂特征的設(shè)計(jì)是整個(gè)過程中最大的挑戰(zhàn)。本發(fā)明參考MIRtoolbox工具包[3]中的特征,并根據(jù)其特性分為長時(shí)特征和短時(shí)特征。短時(shí)特征包含以下9個(gè)
      I) root-mean-square energy (均方 根倉泛量)
      權(quán)利要求
      1.一種信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,其特征在于包含如下五個(gè)過程A.特征提取提取音頻輸入信號(hào)的特征參數(shù)集,基于該特征參數(shù)集為輸入音頻信號(hào)導(dǎo)出特征矢量;B.MOS值提取建立編碼質(zhì)量的MOS值數(shù)據(jù)庫;C.聚類對(duì)A步驟得到的特征矢量樣本進(jìn)行聚類處理,得到特征聚類碼本;D.對(duì)應(yīng)建立C步驟得到的類別與編碼速率的對(duì)應(yīng)關(guān)系,得到信號(hào)復(fù)雜度與編碼速率的映射關(guān)系碼本;E.測(cè)試測(cè)試D步驟得到的碼本是否有效。
      2.如權(quán)利要求I所述的信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,其特征在于特征提取過程包含以下步驟Al.在提取特征之前,首先將音頻信號(hào)轉(zhuǎn)換成數(shù)字形式,即將wav形式的音頻文件通過一定的采樣率對(duì)其進(jìn)行采樣,得到一系列離散的采樣點(diǎn);A2.將數(shù)字形式的音頻信號(hào)分幀,即通過計(jì)算一定時(shí)間內(nèi)包含多少個(gè)采樣點(diǎn)來劃分中貞,分幀的時(shí)間隨特征的特性而定,長時(shí)特征的幀長以秒為數(shù)量級(jí),而短時(shí)特征的幀長以毫秒為數(shù)量級(jí);A3.從數(shù)字形式的音頻信號(hào)樣本幀中計(jì)算要提取的特征;A4.把該特征參數(shù)集轉(zhuǎn)換成該幀的特征矢量輸出。
      3.如權(quán)利要求I所述的信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,其特征在于MOS 值提取過程包含的步驟如下BI.轉(zhuǎn)換音頻格式,包括音頻的位速、采樣大小、采樣頻率和音頻格式,以使音頻文件能夠被AMR-WB+編碼器識(shí)別;B2.讀取步驟BI得到的特定格式的音頻,將每段音樂切割成若干片段;B3.將B2步驟得到的音頻片段,用encoder編碼器和decoder解碼器對(duì)每個(gè)片段分別編解碼,再用改進(jìn)的PEAQ算法器衡量得到每個(gè)片段的編碼質(zhì)量MOS值;B4.用encoder編碼器編碼時(shí),AMR-WB+編碼速率的范圍為5. 2_36kbit/s,用不同的速率都重復(fù)B3步驟,最后得到不同速率下所得的編碼質(zhì)量MOS值。
      4.如權(quán)利要求I所述的信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,其特征在于聚類過程包含以下步驟Cl.將步驟A得到的特征矢量集轉(zhuǎn)換成htk格式;C2.利用HTK工具包中的Hquant訓(xùn)練工具對(duì)Cl得到的數(shù)據(jù)進(jìn)行聚類,得到特征聚類碼本。
      5.如權(quán)利要求I所述的信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,其特征在于對(duì)應(yīng)過程包含以下步驟Dl.根據(jù)C過程得到的特征聚類碼本,判定音頻信號(hào)每幀所在的類別,并記錄每幀在各個(gè)預(yù)定編碼速率下的MOS值;D2.統(tǒng)計(jì)每個(gè)類別的每個(gè)編碼速率下各個(gè)MOS值區(qū)間內(nèi)的樣本數(shù)占總樣本數(shù)的比例; D3.根據(jù)D2得到的比例數(shù)據(jù),得到映射關(guān)系碼本,里面記錄的是每個(gè)類別要達(dá)到特定編碼質(zhì)量MOS值需要的編碼速率。
      6.如權(quán)利要求I所述的信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,其特征在于測(cè)試過程包含以下步驟El.用不同于步驟A中的音頻信號(hào)進(jìn)行步驟A,B,得到音頻信號(hào)的特征矢量和實(shí)際編碼速率下的MOS值;E2.根據(jù)特征聚類碼本,判定每幀音頻信號(hào)所在的類別,然后根據(jù)映射關(guān)系碼本,用該類別下達(dá)到目標(biāo)MOS值所需的預(yù)定編碼速率對(duì)其編解碼,得到預(yù)定編碼速率下的編碼質(zhì)量 MOS 值;E3.對(duì)比實(shí)際編碼速率下的MOS值和預(yù)定編碼速率下的MOS值,測(cè)試出映射關(guān)系碼本的效果。
      全文摘要
      本發(fā)明公開一種信號(hào)復(fù)雜度和編碼速率選擇的映射實(shí)現(xiàn)方法,包含如下五個(gè)過程特征提取提取音頻輸入信號(hào)的特征參數(shù)集,基于該特征參數(shù)集為輸入音頻信號(hào)導(dǎo)出特征矢量;MOS值提取建立編碼質(zhì)量的MOS值數(shù)據(jù)庫;聚類對(duì)特征矢量樣本進(jìn)行聚類處理,得到特征聚類碼本;對(duì)應(yīng)建立聚類處理得到的類別與編碼速率的對(duì)應(yīng)關(guān)系,得到信號(hào)復(fù)雜度與編碼速率的映射關(guān)系碼本;測(cè)試測(cè)試碼本是否有效。通過對(duì)本發(fā)明的正確使用,一方面可以進(jìn)一步用于音樂的分類研究,另一方面對(duì)音樂復(fù)雜度的分級(jí),在保證編碼質(zhì)量的前提下,用不同的速率對(duì)不同復(fù)雜度的音樂進(jìn)行編碼,使得音質(zhì)與文件體積之間達(dá)到平衡,實(shí)現(xiàn)指導(dǎo)編碼速率的自動(dòng)選擇,提高編碼傳輸效率。
      文檔編號(hào)G10L15/06GK102610234SQ201210100679
      公開日2012年7月25日 申請(qǐng)日期2012年4月9日 優(yōu)先權(quán)日2012年4月9日
      發(fā)明者嚴(yán)勤, 周云春 申請(qǐng)人:河海大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1