国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語(yǔ)音壓縮方法、語(yǔ)音解壓方法及音頻編碼器、音頻解碼器的制造方法

      文檔序號(hào):10595528閱讀:530來(lái)源:國(guó)知局
      語(yǔ)音壓縮方法、語(yǔ)音解壓方法及音頻編碼器、音頻解碼器的制造方法
      【專利摘要】本發(fā)明公開(kāi)了一種語(yǔ)音壓縮方法、語(yǔ)音解壓方法及音頻編碼器、音頻解碼器,通過(guò)MLT變換時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào),采用RMS權(quán)重分析法細(xì)化頻域信號(hào)量化分級(jí),矢量量化和哈弗曼編碼等方法分別對(duì)量化參數(shù)(量化權(quán)重、比特分配數(shù))和頻域數(shù)據(jù)進(jìn)行壓縮,以期在保證近似無(wú)損的頻譜特性最大限度提高壓縮比。
      【專利說(shuō)明】
      語(yǔ)音壓縮方法、語(yǔ)音解壓方法及音頻編碼器、音頻解碼器
      技術(shù)領(lǐng)域
      [0001] 本發(fā)明屬于無(wú)線語(yǔ)音信號(hào)壓縮領(lǐng)域,具體設(shè)及一種基于MLT變換和向量賭編碼的 語(yǔ)音壓縮方法、解壓方法及音頻編碼器、音頻解碼器。
      【背景技術(shù)】
      [0002] 語(yǔ)音信號(hào)壓縮是為了節(jié)省硬件存儲(chǔ)空間,方便存儲(chǔ)和傳輸。而無(wú)線數(shù)字語(yǔ)音系統(tǒng) 不同于一般的有線音頻系統(tǒng),其利用空中帶寬傳輸語(yǔ)音信號(hào),不需有線作為信號(hào)傳輸載體, 方便了用戶實(shí)際使用體驗(yàn)。
      [0003] 基于嵌入式技術(shù)的無(wú)線數(shù)字音頻系統(tǒng)更是有效地將嵌入式技術(shù)、音頻編解碼技 術(shù)、無(wú)線傳輸技術(shù)結(jié)合在一起,具有體積小,攜帶方便,功能專業(yè)化高,成本較低,穩(wěn)定性高, 實(shí)時(shí)性好等特點(diǎn)。但是會(huì)受到帶寬、延遲和功耗等方面的限制。因此要求應(yīng)用于無(wú)線語(yǔ)音傳 輸?shù)膲嚎s算法同時(shí)具有有高音、質(zhì)高壓縮比、低延遲和低計(jì)算復(fù)雜度的特性。
      [0004] 而目前頻域壓縮編碼藍(lán)牙SBC語(yǔ)音算法的音質(zhì)較低,而時(shí)域壓縮算法ADPCM,G711 等,又普遍具有較低的壓縮比。因此,針對(duì)無(wú)線傳輸設(shè)計(jì)一款高壓縮比、低延遲和低計(jì)算復(fù) 雜度的情況下實(shí)現(xiàn)較高音質(zhì)的語(yǔ)音編解碼算并將之應(yīng)用在基于嵌入式技術(shù)的無(wú)線音頻系 統(tǒng)中是十分有意義的。
      [0005] 語(yǔ)音數(shù)據(jù)壓縮利用的是語(yǔ)音信號(hào)的冗余和人耳聽(tīng)覺(jué)系統(tǒng)的獨(dú)特感知性,語(yǔ)音信號(hào) 的冗余主要表現(xiàn)在時(shí)域冗余和頻域冗余2中,目前公知的語(yǔ)音壓縮方法按照編碼方式可W 分為兩類。第一類是:時(shí)域壓縮,該類型編碼器通過(guò)分析語(yǔ)音數(shù)據(jù)時(shí)域上的相關(guān)性對(duì)其進(jìn)行 壓縮;第二類是:頻域壓縮,該類型編碼器通過(guò)分析語(yǔ)音數(shù)據(jù)頻域上的相關(guān)性對(duì)其進(jìn)行壓 縮。
      [0006] 第一類壓縮方法主要采用消除語(yǔ)音信號(hào)的時(shí)域冗余進(jìn)行壓縮,通過(guò)計(jì)算音頻數(shù)據(jù) 和預(yù)測(cè)值的差值,并設(shè)定自適應(yīng)量化器的量化級(jí)、更新下一數(shù)據(jù)的預(yù)測(cè)值。時(shí)域預(yù)測(cè)方法在 保證一定壓縮比的情況下很難將提高主觀音質(zhì)水平,所W時(shí)域預(yù)測(cè)方法的特點(diǎn)是低延遲、 低運(yùn)算量、中等音質(zhì)和較低的壓縮比。主流的時(shí)域預(yù)測(cè)方法有ADPCM和G711等,一般壓縮比 在2:巧Ij4:l之間。
      [0007] 第二類壓縮方法主要采用消除語(yǔ)音信號(hào)的頻域冗余進(jìn)行壓縮,一般采用變換域結(jié) 合屯、里聲學(xué)模型的方法,通過(guò)變換域?qū)r(shí)域語(yǔ)音數(shù)據(jù)變換為頻域數(shù)據(jù)而后通過(guò)屯、里聲學(xué)模 型,按照人耳聽(tīng)覺(jué)特性對(duì)該語(yǔ)音數(shù)據(jù)的頻域信號(hào)進(jìn)行分級(jí)量化,對(duì)人耳聽(tīng)覺(jué)敏感度高的頻 域部分進(jìn)行較少的量化,保留較高的精度,對(duì)人耳聽(tīng)覺(jué)敏感度低的頻域部分進(jìn)行較多的量 化,保留較少的精度。由于有屯、理聲學(xué)模型的分析,變換域方法可W在保證人耳主觀感受的 情況下最大限度地壓縮音頻數(shù)據(jù)流,所W變換域方法的特點(diǎn)就是高延遲、高復(fù)雜度、高音質(zhì) 和低碼流。W主流的變換域方法有余弦調(diào)制濾波器組實(shí)現(xiàn)的子帶編碼,如SBC(音質(zhì)一般,壓 縮比僅有5:1左右),改進(jìn)型離散余弦變換(MDCT)實(shí)現(xiàn)的編碼,如CELT, S陽(yáng)EX等(音質(zhì)較高, 但延遲需要50ms到IOOms)。
      [0008] 由于基于無(wú)線語(yǔ)音傳輸?shù)恼Z(yǔ)音碼流需要的高音質(zhì)、高壓縮比、低延遲和低計(jì)算復(fù) 雜度,因此主流第一類編碼器中的主流的域預(yù)測(cè)編碼因其低壓縮比和音質(zhì)而同樣無(wú)法滿足 要求;而第二類編碼器的主流變換域編碼因?yàn)槠涓哐舆t和高運(yùn)算量無(wú)法達(dá)到無(wú)線傳輸?shù)囊?求。

      【發(fā)明內(nèi)容】

      [0009] 針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明的目的在于提供一種基于MLT變換和向量賭編 碼的語(yǔ)音壓縮方法,該方法可同時(shí)有效滿足無(wú)線語(yǔ)音傳輸?shù)母咭糍|(zhì)、低延遲、高壓縮比且低 復(fù)雜運(yùn)算量。本發(fā)明的另一目的是提供一種基于MLT變換和向量賭編碼的語(yǔ)音解壓方法。
      [0010] 為實(shí)現(xiàn)上述目的,本發(fā)明基于MLT變換和向量賭編碼的語(yǔ)音壓縮方法,具體為:
      [0011] 1 )MLT頻域變換:將數(shù)字麥克采集的時(shí)域數(shù)字語(yǔ)音信號(hào)轉(zhuǎn)換為頻域譜系數(shù);
      [001^ 2)RMS量化權(quán)重計(jì)算:頻域譜系數(shù)為分組計(jì)算信號(hào)的均方根RMS,通過(guò)分組均方根 計(jì)算頻域分量權(quán)重;
      [0013] 3)最優(yōu)分組比特位分配:根據(jù)分組信號(hào)頻域分量權(quán)重和設(shè)定比特率參數(shù)獲得最優(yōu) 分組比特位;
      [0014] 4)將分組頻域語(yǔ)音信號(hào)進(jìn)行矢量量化,生成分組矢量量化系數(shù);
      [0015] 5)將分組矢量量化系數(shù)進(jìn)行哈弗曼編碼,完成數(shù)據(jù)壓縮。
      [0016] 進(jìn)一步,所述步驟1)采用調(diào)制混疊變換,通過(guò)MLT變換,將短時(shí)帖的PCM時(shí)域音頻數(shù) 據(jù)轉(zhuǎn)換成MLT頻域譜系數(shù),按頻域相關(guān)性對(duì)MLT頻域譜系數(shù)進(jìn)行分組。
      [0017] 進(jìn)一步,所述PCM時(shí)域音頻數(shù)據(jù)首先經(jīng)過(guò)50%數(shù)據(jù)重疊混合處理,再進(jìn)行反混疊濾 波,防止頻譜溢出,之后進(jìn)行DCT-IV變換,將時(shí)域數(shù)據(jù)變換成頻域譜系數(shù)。
      [0018] 進(jìn)一步,所述MLT頻域變換的公式如下:
      [0019]
      [0020] 巧含m< N,0<n<2N,N e(80'160,320),
      [0021 ]進(jìn)一步,所述步驟2)中將時(shí)頻轉(zhuǎn)換后的頻域譜系數(shù)通過(guò)均方根RMS計(jì)算量化權(quán)重, 其RMS計(jì)算公式如下:
      [0022]
      [0023] 計(jì)算每組MS值的量化權(quán)重值:
      [0024] 細(xì)斷―i打dex的=log(2 : );(-8 < i 5^)'
      [0025] 進(jìn)一步,所述步驟3)中,最優(yōu)分組比特位計(jì)算方法為:根據(jù)量化權(quán)重計(jì)算最大比特 位和最小比特位,根據(jù)比特率參數(shù)優(yōu)化分組比特位,使優(yōu)化后的比特位在比特位限制下滿 足各分組頻譜系數(shù)的需求。
      [00%]進(jìn)一步,根據(jù)量化權(quán)重值,計(jì)算每組比特分配系數(shù):
      [0027] category(r)=MAX{0,MIN{7,(offset-rms_index(r)/2)}};
      [002引(0《r《numbe;r_of_regions;-32《offset《31);
      [0029]根據(jù)比特分配參數(shù)計(jì)算預(yù)計(jì)量化所需比特?cái)?shù):
      [0030]
      [0031] 然后,根據(jù)設(shè)定比特率參數(shù)計(jì)算可用比特?cái)?shù):
      [0032] estimated_number_of_avai lable_bits = 320 + ( (number_of_avai Iable_ bits.320)巧/8);
      [0033] 調(diào)整每組的比特分配參數(shù),W獲取在可用比特?cái)?shù)范圍內(nèi),每組可用比特達(dá)到最大 化,確定最優(yōu)分組比特位。
      [0034] 進(jìn)一步,所述步驟4 )、步驟5)的處理過(guò)程為:
      [0035] A)將頻域譜系數(shù)拆分為符號(hào)位和強(qiáng)度,計(jì)算每組強(qiáng)度的歸一化指數(shù):
      [0036] k( i) =MIN{ (x;*magnitude of (mlt(20r+i) )+deadzone_;rounding) ,kmax}
      [0037] ((0<i<20;x = l/(stepsize水(ma即itude_of_;rms(;r)););
      [0038] B)將歸一化之后的指數(shù)組成矢量組比特流:
      [0039]
      [0040]
      [0041] C)對(duì)每組矢量組和符號(hào)位組進(jìn)行哈弗曼編碼,形成壓縮比特流。
      [0042] -種針對(duì)上述語(yǔ)音壓縮方法的基于MLT變換和向量賭編碼的語(yǔ)音解壓方法,采取 反矢量量化和反MLT來(lái)解壓數(shù)據(jù)壓縮后的語(yǔ)音,具體為:
      [0043] 1)對(duì)壓縮比特流進(jìn)行解析和哈弗曼解碼,得到矢量組和符號(hào)位組;
      [0044] 2)對(duì)矢量組進(jìn)行反歸一化運(yùn)算,獲取頻域譜系數(shù)強(qiáng)度和對(duì)應(yīng)符號(hào)位,得到頻域譜 系數(shù);
      [0045] 3)對(duì)頻域譜系數(shù)進(jìn)行反調(diào)制混疊變換IMLT,獲取時(shí)域語(yǔ)音數(shù)據(jù),完成解碼。
      [0046] 進(jìn)一步,所述步驟1)中對(duì)經(jīng)過(guò)編碼壓縮的碼流數(shù)據(jù)進(jìn)行分析,獲取采樣率、比特率 和分時(shí)帖長(zhǎng)的時(shí)域PCM流信息。
      [0047] 進(jìn)一步,所述步驟2)中反歸一化運(yùn)算公式如下:
      [004引
      [0049] Z' indicalcs taking Ihc grcalcst Inlcgcr value less than or equal Io 二,
      [0050] 進(jìn)一步,所述步驟3)中IMLT變換公式如下:
      [0化1 ]
      [0化2]
      [0化3]
      [0化4]
      [0055] 一種實(shí)施上述語(yǔ)音壓縮方法的音頻編碼器,包括MLT頻域變換器、RMS量化權(quán)重計(jì) 算器、最優(yōu)分組比特位分配器、哈弗曼編碼器,通過(guò)MLT變換器將時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào), 采用MS量化權(quán)重計(jì)算器細(xì)化頻域信號(hào)量化分級(jí),采用最優(yōu)分組比特位分配器、哈弗曼編碼 器分別對(duì)量化參數(shù)和頻域數(shù)據(jù)進(jìn)行壓縮,在保證近似無(wú)損的頻譜特性下最大限度提高語(yǔ)音 數(shù)據(jù)壓縮比。
      [0056] -種實(shí)施上述語(yǔ)音解壓方法的音頻解碼器,包括碼流分析器、哈弗曼解碼器、反矢 量量化器、逆MLT變換濾波器,其中:
      [0057] 在碼流分析器中,讀經(jīng)過(guò)編碼壓縮的碼流數(shù)據(jù)進(jìn)行分析,獲取采樣率,比特率和分 時(shí)帖長(zhǎng)等時(shí)域PCM流信息;
      [0058] 在哈弗曼解碼器中,解碼獲取MS權(quán)重、比特分配參數(shù)和量化后的MLT頻域譜矢量;
      [0059] 在反矢量量化器中,使用RMS權(quán)重和比特分配參數(shù)對(duì)量化后MLT頻域譜矢量進(jìn)行反 量化運(yùn)算,獲取MLT頻域譜系數(shù);
      [0060] 在逆MLT變換濾波器中,對(duì)MLT頻域譜系數(shù)進(jìn)反MLT變換濾波,獲取時(shí)域PCM數(shù)據(jù);
      [0061] 通過(guò)碼流解析的PCM流信息,控制PCM數(shù)據(jù),重建整合PCM語(yǔ)音碼流。
      [0062] 本發(fā)明的有益效果主要表現(xiàn)在:在保證語(yǔ)音數(shù)據(jù)高音質(zhì)的情況下實(shí)現(xiàn)了高壓縮 比、低延遲和中等的運(yùn)算復(fù)雜度,更適應(yīng)無(wú)線語(yǔ)音應(yīng)用。
      【附圖說(shuō)明】
      [0063] 圖1為壓縮流程圖;
      [0064] 圖2為解壓縮流程圖;
      [0065] 圖3為MLT變換原理圖;
      [0066] 圖4為最優(yōu)比特分配流程圖;
      [0067] 圖5為原始PCM波形數(shù)據(jù)時(shí)域數(shù)據(jù)圖;
      [0068] 圖6為原始PCM波形數(shù)據(jù)頻譜數(shù)據(jù)圖;
      [0069] 圖7為MLT變換后PCM波形數(shù)據(jù)時(shí)域數(shù)據(jù)圖;
      [0070] 圖8為MLT變換后PCM波形數(shù)據(jù)頻譜數(shù)據(jù)圖。
      【具體實(shí)施方式】
      [0071] 下面,參考附圖,對(duì)本發(fā)明進(jìn)行更全面的說(shuō)明,附圖中示出了本發(fā)明的示例性實(shí)施 例。然而,本發(fā)明可W體現(xiàn)為多種不同形式,并不應(yīng)理解為局限于運(yùn)里敘述的示例性實(shí)施 例。而是,提供運(yùn)些實(shí)施例,從而使本發(fā)明全面和完整,并將本發(fā)明的范圍完全地傳達(dá)給本 領(lǐng)域的普通技術(shù)人員。
      [0072] 本發(fā)明基于MLT變換和向量賭編碼的語(yǔ)音壓縮方法,具體為:
      [0073] (l)MLT(Modulated Lapped Transform)頻域變換器,MLT變換是一種頻域變換,可 將時(shí)域數(shù)據(jù)分短時(shí)獨(dú)立帖進(jìn)行變換,并采用50 %的帖混疊的方式保證了臨界數(shù)據(jù)的頻譜不 失真,具有線性和完美信號(hào)重建等特性;MLT變換公式如下:
      [0074]
      [00巧](2)RMS量化權(quán)重計(jì)算器,RMS計(jì)算分組頻域譜系數(shù)的均方根(Root-Mean-Square), 用于表示量化權(quán)重;相比絕對(duì)值表示的量化權(quán)重,通過(guò)RMS值表示的量化層級(jí)更多,量化精 度更高,RMS計(jì)算公式如下:
      [0076]
      ,
      [0077] 計(jì)算每組MS值的量化權(quán)重值:
      [007引
      [0079] (3)最優(yōu)分組比特位分配器,根據(jù)量化權(quán)重值,計(jì)算每組比特分配系數(shù):
      [0080] category(r)=MAX{0,MIN{7,(offset-rms_index(r)/2)}},
      [0081] (0《r《ruimbe;r_of_regions;-32《offset《31);
      [0082] 根據(jù)比特分配參數(shù)計(jì)算預(yù)計(jì)量化所需比特?cái)?shù):
      [0083]
      [0084] 然后,根據(jù)設(shè)定比特率參數(shù)計(jì)算可用比特?cái)?shù):
      [0085] estimated_number_of_available_bits = 320 + ((number_of_available_ bits.320)巧/8),
      [0086] 調(diào)整每組的比特分配參數(shù),W獲取在可用比特?cái)?shù)范圍內(nèi),每組可用比特達(dá)到最大 化,確定最優(yōu)分組比特位;
      [0087] (4)對(duì)頻域譜系數(shù)進(jìn)行矢量量化,生成分組矢量量化系數(shù):
      [0088] 將頻域譜系數(shù)拆分為符號(hào)位和強(qiáng)度,計(jì)算每組強(qiáng)度的歸一化指數(shù):
      [0089] k(i)=MIN{(x*ma即itude of(mlt(20r+i))+deadzone_;rounding) ,kmax},
      [0090] ((0<i<20;x = l/(stepsize>Kma即itude_of_;rms(;r));),
      [0091 ]將歸一化之后的指數(shù)組成矢量組比特流: .,'.'1 / ; I 1 \
      [0092]
      [0093] (5)對(duì)每組矢量組和符號(hào)位組進(jìn)行哈弗曼編碼,形成壓縮比特流。
      [0094] -種針對(duì)上述語(yǔ)音壓縮方法的基于MLT變換和向量賭編碼的語(yǔ)音解壓方法,采取 反矢量量化和反MLT來(lái)解壓數(shù)據(jù)壓縮后的語(yǔ)音,具體為:
      [0095] (1)將壓縮后的碼流經(jīng)過(guò)哈弗曼解碼器進(jìn)行解碼分析,獲得量化后的MLT頻域譜系 數(shù)量化數(shù)據(jù);
      [0096] (2)采用反矢量量化器對(duì)MLT頻域譜系數(shù)量化數(shù)據(jù)進(jìn)行反量化解析,對(duì)矢量組進(jìn)行 反歸一化運(yùn)算,獲取頻域譜系數(shù)強(qiáng)度和對(duì)應(yīng)符號(hào)位,得到頻域譜系數(shù);
      [0097]
      [009引 t-Z-
      [0099] (3)對(duì)頻域譜系數(shù)進(jìn)行IMLT(反調(diào)制混疊變換),獲取時(shí)域語(yǔ)音數(shù)據(jù),完成解碼; IMLT變換公式如下:
      [0100]
      [0101]
      [0102]
      [0103]
      [0104] 一種實(shí)施上述語(yǔ)音壓縮方法的音頻編碼器,包括MLT頻域變換器、RMS量化權(quán)重計(jì) 算器、最優(yōu)分組比特位分配器、哈弗曼編碼器,通過(guò)MLT變換器將時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào), 采用RMS量化權(quán)重計(jì)算器細(xì)化頻域信號(hào)量化分級(jí),采用最優(yōu)分組比特位分配器、哈弗曼編碼 器分別對(duì)量化參數(shù)和頻域數(shù)據(jù)進(jìn)行壓縮,在保證近似無(wú)損的頻譜特性下最大限度提高語(yǔ)音 數(shù)據(jù)壓縮比。
      [0105] -種實(shí)施上述語(yǔ)音解壓方法的音頻解碼器,包括碼流分析器、哈弗曼解碼器、反矢 量量化器、逆MLT變換濾波器,其中:
      [0106] 在碼流分析器中,讀經(jīng)過(guò)編碼壓縮的碼流數(shù)據(jù)進(jìn)行分析,獲取采樣率,比特率和分 時(shí)帖長(zhǎng)等時(shí)域PCM流信息;
      [0107] 在哈弗曼解碼器中,解碼獲取MS權(quán)重、比特分配參數(shù)和量化后的MLT頻域譜矢量;
      [0108] 在反矢量量化器中,使用RMS權(quán)重和比特分配參數(shù)對(duì)量化后MLT頻域譜矢量進(jìn)行反 量化運(yùn)算,獲取MLT頻域譜系數(shù);
      [0109] 在逆MLT變換濾波器中,對(duì)MLT頻域譜系數(shù)進(jìn)反MLT變換濾波,獲取時(shí)域PCM數(shù)據(jù);
      [0110] 通過(guò)碼流解析的PCM流信息,控制PCM數(shù)據(jù),重建整合PCM語(yǔ)音碼流。
      [0111] 本發(fā)明中,壓縮部分【具體實(shí)施方式】如圖1:
      [0112] (1)使用數(shù)字麥克風(fēng)采樣語(yǔ)音數(shù)據(jù),獲取PCM原始數(shù)字語(yǔ)音數(shù)據(jù),并將語(yǔ)音數(shù)據(jù)分 成短時(shí)帖:5ms(SOsample)、IOms(IGOsample)或20ms(320sample),并將PCM配置的比特率義 樣率等信息寫入碼流。
      [0113] (2)通過(guò)MLT變換,將短時(shí)帖的時(shí)域PCM數(shù)據(jù)轉(zhuǎn)換成MLT頻域譜系數(shù)。按頻域相關(guān)性 對(duì)MLT頻域譜系數(shù)進(jìn)行分組,分為20組MLT頻域譜矢量。
      [0114] (3)通過(guò)RMS權(quán)重計(jì)算器,計(jì)算分組MLT頻域譜矢量的RMS,獲取各組頻域譜矢量的 量化權(quán)重,量化權(quán)重值直接寫入碼流。
      [0115] (4)在最優(yōu)比特分配器中使用分組頻域譜系數(shù)的量化權(quán)重RMS,對(duì)各分組MLT頻域 譜矢量進(jìn)行比特分配計(jì)算,求取最優(yōu)比特分配數(shù),比特分配數(shù)也直接寫入碼流。
      [0116] (5)在矢量量化器組中,使用量化權(quán)重和最優(yōu)比特分配對(duì)量化譜系數(shù)。分組MLT頻 域譜矢量進(jìn)行矢量量化。
      [0117] (6)在哈弗曼編碼器中,對(duì)量化權(quán)重、比特分配參數(shù)和量化后的分組MLT頻域譜矢 量進(jìn)行哈弗曼編碼,獲取最終編碼壓縮碼流。
      [0118] 本發(fā)明中,解碼部分【具體實(shí)施方式】如圖2:
      [0119] (1)在碼流分析器中,對(duì)經(jīng)過(guò)編碼壓縮的碼流數(shù)據(jù)進(jìn)行分析,獲取采樣率,比特率 和分時(shí)帖長(zhǎng)等時(shí)域PCM流信息;
      [0120] (2)在哈弗曼解碼器中,解碼獲取RMS權(quán)重、比特分配參數(shù)和量化后的MLT頻域譜矢 量;
      [0121] (3)在反矢量量化器中,使用RMS權(quán)重和比特分配參數(shù)對(duì)量化后MLT頻域譜矢量進(jìn) 行反量化運(yùn)算。獲取MLT頻域譜系數(shù);
      [0122] (4)在逆MLT變換濾波器中,對(duì)MLT頻域譜系數(shù)進(jìn)反MLT變換濾波,獲取時(shí)域PCM數(shù) 據(jù);
      [0123] (5)通過(guò)碼流解析的PCM流信息,控制PCM數(shù)據(jù),重建整合PCM語(yǔ)音碼流。
      [0124] 如圖3所示的為MLT變換原理圖,PCM時(shí)域音頻數(shù)據(jù)首先經(jīng)過(guò)50%數(shù)據(jù)重疊混合處 理,再進(jìn)行反混疊濾波,防止頻譜溢出,之后進(jìn)行DCT-IV變換,將時(shí)域數(shù)據(jù)變換成頻域譜系 數(shù),MLT變換的優(yōu)點(diǎn)為線性和完美重構(gòu)的特性,能無(wú)損的將PCM數(shù)據(jù)進(jìn)行時(shí)域到頻域的相互 轉(zhuǎn)換。如圖5、圖6、圖7、圖8所示,為MLT變換前后的PCM數(shù)據(jù),可W看到,經(jīng)過(guò)變換的PCM數(shù)據(jù) 和原始PCM數(shù)據(jù)在時(shí)域和頻域信息上都達(dá)到無(wú)損的效果。
      [0125] 如圖4所示的最優(yōu)比特分配流程,按照分組頻域譜系數(shù)為單位進(jìn)行比特分配的流 程:
      [01 %] (1)首先,分析該組頻域譜系數(shù)的MS量化權(quán)重信息,設(shè)定比特分配參數(shù),進(jìn)行比特 分配計(jì)算;
      [0127] (2)之后,根據(jù)比特分配結(jié)果計(jì)算預(yù)計(jì)比特分配所消耗的比特?cái)?shù),在預(yù)制信噪比和 剩余比特?cái)?shù)的限制,分析當(dāng)前預(yù)計(jì)比特分配數(shù)是否滿足該限制。如不滿足,重設(shè)比特分配參 數(shù),重新進(jìn)行比特分配,如滿足,則進(jìn)入下一組頻域譜系數(shù)的比特分配計(jì)算。同時(shí)更新剩余 比特?cái)?shù),用于下一組比特分配運(yùn)算。
      [0128] 本實(shí)施例的屯、理聲學(xué)模型、比特分配和量化方式經(jīng)過(guò)優(yōu)化后簡(jiǎn)化了屯、理聲學(xué)模型 的計(jì)算復(fù)雜度,直接應(yīng)用經(jīng)過(guò)驗(yàn)證的頻域聽(tīng)覺(jué)闊值和掩蔽闊值對(duì)子頻帶數(shù)據(jù)進(jìn)行分析;而 在比特分配單元由于采用了對(duì)稱量化方案,比特分配的結(jié)果并不直接通過(guò)碼流傳輸至解碼 端,而是通過(guò)量化因子在解碼端通過(guò)同樣的比特分配機(jī)制計(jì)算比特分配數(shù),運(yùn)樣減小了大 量的碼流可用于傳輸量化后音頻數(shù)據(jù),并且設(shè)定了碼流長(zhǎng)度調(diào)節(jié)參數(shù),可隨時(shí)根據(jù)無(wú)線傳 輸環(huán)境調(diào)節(jié)比特分配數(shù)。
      [0129] 如上所述,本中針對(duì)無(wú)線語(yǔ)音傳輸應(yīng)用的特點(diǎn)采用了完美重構(gòu)的MLT變換用于時(shí) 域到頻域的轉(zhuǎn)換,保證了語(yǔ)音數(shù)據(jù)的高音質(zhì),并且可W根據(jù)系統(tǒng)對(duì)延遲的要求,直接修改 MLT變換長(zhǎng)度,保證了低延遲,并采用了最優(yōu)比特分配保證了壓縮比在不影響音質(zhì)的情況下 達(dá)到最高,最終采用哈弗曼編碼進(jìn)一步對(duì)量化后數(shù)據(jù)進(jìn)行壓縮。
      【主權(quán)項(xiàng)】
      1. 一種語(yǔ)音壓縮方法,其特征在于,該方法具體為: 1 )MLT頻域變換:將數(shù)字麥克采集的時(shí)域數(shù)字語(yǔ)音信號(hào)轉(zhuǎn)換為頻域譜系數(shù); 2. RMS量化權(quán)重計(jì)算:頻域譜系數(shù)為分組計(jì)算信號(hào)的均方根RMS,通過(guò)分組均方根計(jì)算 頻域分量權(quán)重; 3) 最優(yōu)分組比特位分配:根據(jù)分組信號(hào)頻域分量權(quán)重和設(shè)定比特率參數(shù)獲得最優(yōu)分組 比特位; 4) 將分組頻域語(yǔ)音信號(hào)進(jìn)行矢量量化,生成分組矢量量化系數(shù); 5) 將分組矢量量化系數(shù)進(jìn)行哈弗曼編碼,完成數(shù)據(jù)壓縮。2. 如權(quán)利要求1所述的語(yǔ)音壓縮方法,其特征在于,所述步驟1)采用調(diào)制混疊變換,通 過(guò)MLT變換,將短時(shí)幀的PCM時(shí)域音頻數(shù)據(jù)轉(zhuǎn)換成MLT頻域譜系數(shù),按頻域相關(guān)性對(duì)MLT頻域 譜系數(shù)進(jìn)行分組;所述PCM時(shí)域音頻數(shù)據(jù)首先經(jīng)過(guò)50 %數(shù)據(jù)重疊混合處理,再進(jìn)行反混疊濾 波,防止頻譜溢出,之后進(jìn)行DCT-IV變換,將時(shí)域數(shù)據(jù)變換成頻域譜系數(shù)。3. 如權(quán)利要求1所述的語(yǔ)音壓縮方法,其特征在于,所述MLT頻域變換的公式如下:所述步驟2)中將時(shí)頻轉(zhuǎn)換后的頻域譜系數(shù)通過(guò)均方根RMS計(jì)算量化權(quán)重,其RMS計(jì)算公 式如下: ▼ - _ u=u計(jì)算每組RMS值的量化權(quán)重值:4. 如權(quán)利要求1所述的語(yǔ)音壓縮方法,其特征在于,所述步驟3)中,最優(yōu)分組比特位計(jì) 算方法為:根據(jù)量化權(quán)重計(jì)算最大比特位和最小比特位,根據(jù)比特率參數(shù)優(yōu)化分組比特位, 使優(yōu)化后的比特位在比特位限制下滿足各分組頻譜系數(shù)的需求;根據(jù)量化權(quán)重值,計(jì)算每 組比特分配系數(shù): category(r)=MAX{0,MIN{7,(offset-rms_index(r)/2)}}; (O^;r^;number_of_regions ;-32^;off set^;31); 根據(jù)比特分配參數(shù)計(jì)算預(yù)計(jì)量化所需比特?cái)?shù):然后,根據(jù)設(shè)定比特率參數(shù)計(jì)算可用比特?cái)?shù): estimated_number_of_available_bits=320+((number_of_available_bits·320)氺 5/8); 調(diào)整每組的比特分配參數(shù),以獲取在可用比特?cái)?shù)范圍內(nèi),每組可用比特達(dá)到最大化,確 定最優(yōu)分組比特位。5. 如權(quán)利要求1所述的語(yǔ)音壓縮方法,其特征在于,所述步驟4 )、步驟5)的處理過(guò)程為: A) 將頻域譜系數(shù)拆分為符號(hào)位和強(qiáng)度,計(jì)算每組強(qiáng)度的歸一化指數(shù):B) 將歸一化之后的指數(shù)組成矢量組比特流:C) 對(duì)每組矢量組和符號(hào)位組進(jìn)行哈弗曼編碼,形成壓縮比特流。6. -種語(yǔ)音解壓方法,其特征在于,采取反矢量量化和反MLT來(lái)解壓數(shù)據(jù)壓縮后的語(yǔ) 音,具體為: 1) 對(duì)壓縮比特流進(jìn)行解析和哈弗曼解碼,得到矢量組和符號(hào)位組; 2) 對(duì)矢量組進(jìn)行反歸一化運(yùn)算,獲取頻域譜系數(shù)強(qiáng)度和對(duì)應(yīng)符號(hào)位,得到頻域譜系數(shù); 3) 對(duì)頻域譜系數(shù)進(jìn)行反調(diào)制混疊變換頂LT,獲取時(shí)域語(yǔ)音數(shù)據(jù),完成解碼。7. 如權(quán)利要求6所述的語(yǔ)音解壓方法,其特征在于,所述步驟1)中對(duì)經(jīng)過(guò)編碼壓縮的碼 流數(shù)據(jù)進(jìn)行分析,獲取采樣率、比特率和分時(shí)幀長(zhǎng)的時(shí)域PCM流信息;所述步驟2)中反歸一 化運(yùn)算公式如下:8. 如權(quán)利要求6所述的語(yǔ)音解壓方法,其特征在于,所述步驟3)中IMLT變換公式如下: j9. 一種音頻編碼器,其特征在于,包括MLT頻域變換器、RMS量化權(quán)重計(jì)算器、最優(yōu)分組 比特位分配器、哈弗曼編碼器,通過(guò)MLT變換器將時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào),采用RMS量化權(quán) 重計(jì)算器細(xì)化頻域信號(hào)量化分級(jí),采用最優(yōu)分組比特位分配器、哈弗曼編碼器分別對(duì)量化 參數(shù)和頻域數(shù)據(jù)進(jìn)行壓縮,在保證近似無(wú)損的頻譜特性下最大限度提高語(yǔ)音數(shù)據(jù)壓縮比。10. -種音頻解碼器,包括碼流分析器、哈弗曼解碼器、反矢量量化器、逆MLT變換濾波 器,其中: 在碼流分析器中,讀經(jīng)過(guò)編碼壓縮的碼流數(shù)據(jù)進(jìn)行分析,獲取采樣率,比特率和分時(shí)幀 長(zhǎng)等時(shí)域PCM流信息; 在哈弗曼解碼器中,解碼獲取RMS權(quán)重、比特分配參數(shù)和量化后的MLT頻域譜矢量; 在反矢量量化器中,使用RMS權(quán)重和比特分配參數(shù)對(duì)量化后MLT頻域譜矢量進(jìn)行反量化 運(yùn)算,獲取MLT頻域譜系數(shù); 在逆MLT變換濾波器中,對(duì)MLT頻域譜系數(shù)進(jìn)反MLT變換濾波,獲取時(shí)域PCM數(shù)據(jù); 通過(guò)碼流解析的PCM流信息,控制PCM數(shù)據(jù),重建整合PCM語(yǔ)音碼流。
      【文檔編號(hào)】G10L19/038GK105957533SQ201610260757
      【公開(kāi)日】2016年9月21日
      【申請(qǐng)日】2016年4月22日
      【發(fā)明人】楊洋, 姚嘉, 任金平, 高永澤
      【申請(qǐng)人】杭州微納科技股份有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1