用于以帶選擇的方式量化語音信號的方法和設(shè)備的制作方法
【專利摘要】本發(fā)明涉及用于以帶選擇的方式量化語音信號的方法和設(shè)備。語音解碼方法可以包括逆量化從選擇性地量化的語音帶產(chǎn)生的語音參數(shù)信息,和基于逆量化的語音參數(shù)信息執(zhí)行逆變換。因此,根據(jù)本發(fā)明,在語音編碼/解碼中的編碼/解碼效率可以通過選擇性地編碼/解碼重要信息而提高。
【專利說明】用于以帶選擇的方式量化語音信號的方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及以帶選擇的方式量化語音信號的方法和使用該方法的設(shè)備,尤其是,涉及語音編碼/解碼方法和設(shè)備。
【背景技術(shù)】
[0002]在當(dāng)前的移動通信中主要使用語音通信。由人產(chǎn)生的語音信號可以表示為電模擬信號。有線電話發(fā)送模擬信號,并且將發(fā)送的電模擬信號再現(xiàn)為語音信號。
[0003]隨著信息技術(shù)的最新發(fā)展,與用于發(fā)送電模擬信號的現(xiàn)有的模擬系統(tǒng)相比,已經(jīng)研究能夠更加靈活地發(fā)送更多信息的方法。因此,語音信號已經(jīng)從模擬變化到數(shù)字。數(shù)字語音信號比模擬語音信號需要更寬的帶寬用于傳輸,但是,在諸如信號傳輸、靈活性、安全性和與其它的系統(tǒng)協(xié)作的許多方面具有許多優(yōu)點。語音壓縮技術(shù)已經(jīng)被開發(fā)以便補充在數(shù)字語音信號中寬的帶寬的缺點。語音信號從模擬到數(shù)字的變化已經(jīng)通過語音壓縮技術(shù)加快,其占據(jù)信息通信的重要的部分。
[0004]音頻編解碼器可以取決于在壓縮語音信號時對信號建模的方法劃分為16kbps或者更小的中速率或者低速率編解碼器,以及高速率編解碼器??紤]到接收方如何準(zhǔn)確地重構(gòu)原始信號,高速率編解碼器使用波形編譯系統(tǒng)來壓縮語音信號。允許操作這樣的編譯系統(tǒng)的編解碼器稱為波形編譯器。另一方面,中間速率或者低速率編解碼器使用源編譯系統(tǒng)去壓縮語音信號,因為表示原始信號的比特數(shù)量減小??紤]到如何類似于原始信號,接收方使用語音信號產(chǎn)生模型來編譯語音信號。采用這樣的編譯系統(tǒng)的編碼器稱為聲編譯器。
【發(fā)明內(nèi)容】
[0005]技術(shù)問題
[0006]本發(fā)明的一個目的是提供一種通過語音信號的頻帶選擇性地執(zhí)行量化和去量化以便提高語音編碼效率的方法。
[0007]本發(fā)明的另一個目的是提供一種通過語音信號的頻帶選擇性地執(zhí)行量化和去量化以便提高語音解碼效率的方法。
[0008]技術(shù)方案
[0009]根據(jù)本發(fā)明的一個方面,提供了一種語音解碼方法,包括步驟:去量化從選擇性地量化的語音帶中提取的語音參數(shù)信息;和基于去量化的語音參數(shù)信息執(zhí)行逆(inverse)變換。選擇性地量化的語音帶可以包括:至少一個預(yù)先確定的要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。至少一個選擇的高頻語音帶可以是基于語音帶的能量分布信息選擇的具有大的能量部分的高頻帶?;谌チ炕恼Z音參數(shù)信息執(zhí)行逆變換的步驟可以包括:通過將不同的碼本應(yīng)用于基于去量化的語音參數(shù)信息選擇的要量化的語音帶來執(zhí)行逆變換。要量化的語音帶可以包括:至少一個預(yù)先確定的要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。通過將不同的碼本應(yīng)用于要量化的語音帶執(zhí)行逆變換的步驟可以包括:基于第一碼本和去量化的要量化的低頻語音帶的語音參數(shù)來重構(gòu)語音信號,以及基于第二碼本和去量化的要量化的高頻語音帶的語音參數(shù)來重構(gòu)語音信號?;谌チ炕恼Z音參數(shù)信息執(zhí)行逆變換的步驟可以包括:通過將去量化的舒適噪聲電平應(yīng)用于不要量化的語音帶來重構(gòu)語音信號。選擇性地量化的語音帶可以包括:預(yù)先確定的至少一個要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。去量化從選擇性地量化的語音帶中提取的語音參數(shù)信息的步驟可以包括:使用分析-合成(AbS)去量化從通過最類似于原始信號的組合選擇的要量化的高頻語音帶和至少一個預(yù)先確定的要量化的固定的低頻語音帶中提取的語音參數(shù)信息?;谌チ炕恼Z音參數(shù)信息執(zhí)行逆變換的步驟可以包括:使用離散傅里葉逆變換(IDFT)對要量化的高頻語音帶執(zhí)行逆變換,并且使用快速傅里葉逆變換(IFFT)對要量化的低頻語音帶執(zhí)行逆變換。
[0010]根據(jù)本發(fā)明的另一個方面,提供了一種語音解碼器,包括:去量化單元,其去量化從選擇性地量化的語音帶中提取的語音參數(shù)信息;和逆變換單元,其基于通過去量化單元去量化的語音參數(shù)信息執(zhí)行逆變換。選擇性地量化的語音帶可以包括:至少一個預(yù)先確定的要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。逆變換單元可以通過基于去量化的語音參數(shù)信息確定要量化的語音帶,并且將不同的碼本應(yīng)用于要量化的語音帶來重構(gòu)語音信號。去量化單元可以使用分析-合成(AbS)去量化從通過最類似于原始信號的組合選擇的要量化的高頻語音帶和至少一個預(yù)先確定的要量化的固定的低頻語音帶中提取的語音參數(shù)信息。逆變換單元可以使用離散傅里葉逆變換(IDFT)對要量化的高頻語音帶執(zhí)行逆變換,并且可以使用快速傅里葉逆變換(IFFT)對要量化的低頻語音帶執(zhí)行逆變換。
[0011]有益效果
[0012]通過采用以上提及的根據(jù)本發(fā)明的方面用于以帶選擇的方式量化語音信號的方法和設(shè)備,當(dāng)量化語音參數(shù)信息的時候通過選擇地僅僅量化包括重要信息的某些帶,能夠降低不必要的信息量以提高語音編譯效率。也能夠通過由AbS選擇某些帶來重構(gòu)最接近于時間軸語音信號的信號。
【專利附圖】
【附圖說明】
[0013]圖1至4是圖示根據(jù)本發(fā)明實施例的語音編碼器和語音解碼器的示意圖。
[0014]圖1是圖示根據(jù)本發(fā)明實施例的語音編碼器的示意圖。
[0015]圖2是圖示根據(jù)本發(fā)明實施例的執(zhí)行TCX模式的TCX模式執(zhí)行單元的示意圖。
[0016]圖3是圖示根據(jù)本發(fā)明實施例的執(zhí)行CELP模式的CELP模式執(zhí)行單元的示意圖。
[0017]圖4是圖示根據(jù)本發(fā)明實施例的語音解碼器的示意圖。
[0018]圖5至7是圖示根據(jù)本發(fā)明實施例以TCX模式執(zhí)行編碼操作方法的流程圖。
[0019]圖8是圖示根據(jù)本發(fā)明實施例的量化目標(biāo)帶選擇方法的示例的示意圖。
[0020]圖9是圖示根據(jù)本發(fā)明實施例標(biāo)準(zhǔn)化量化選擇帶的線性預(yù)測殘留信號的處理示例的示意圖。
[0021]圖10是圖示根據(jù)本發(fā)明實施例在插入舒適噪聲之前和之后的信號,以示出舒適噪聲電平(CN電平)插入的效果的示意圖。
[0022]圖11是圖示根據(jù)本發(fā)明實施例的舒適噪聲計算方法的示意圖。
[0023]圖12是圖示根據(jù)本發(fā)明實施例的語音編碼器的一部分(TCX模式塊的量化單元)的示意圖。
[0024]圖13是圖示根據(jù)本發(fā)明實施例的去量化TCX模式塊的處理的流程圖。
[0025]圖14是圖示根據(jù)本發(fā)明實施例的語音編碼器的一部分(TCX模式塊的去量化單元)的示意圖。
[0026]圖15至20是圖示根據(jù)本發(fā)明實施例使用分析-合成(AbS)方法以TCX模式的編碼方法的示意圖。
[0027]圖15是圖示根據(jù)本發(fā)明實施例使用分析-合成(AbS)方法以TCX模式的編碼方法的示意圖。
[0028]圖16是圖示根據(jù)本發(fā)明實施例將帶選擇IDFT應(yīng)用于AbS結(jié)構(gòu)的方法的示意圖。
[0029]圖17是圖示根據(jù)本發(fā)明實施例在AbS結(jié)構(gòu)的前級(front stage)中執(zhí)行的帶選擇IDFT處理的示意圖。
[0030]圖18是圖示根據(jù)本發(fā)明實施例使用AbS結(jié)構(gòu)以TCX模式的編碼方法的示意圖。
[0031]圖19是圖示根據(jù)本發(fā)明實施例使用AbS結(jié)構(gòu)的TCX模式塊的去量化處理的流程圖。
[0032]圖20是圖示根據(jù)本發(fā)明實施例的語音解碼器的一部分(使用AbS結(jié)構(gòu)的TCX模式塊的去量化單元)的示意圖。
[0033]圖21、22和23是圖示作為在AbS中為了選擇上帶信號(upper_band)組合作為比較信號的輸入語音信號經(jīng)過聽覺識別加權(quán)濾波器W(Z)情的形的示意圖。
【具體實施方式】
[0034]在下文中,將參考附圖具體描述本發(fā)明的實施例。當(dāng)確定在本發(fā)明中涉及的已知的配置或者功能的詳細描述使本發(fā)明的大意難以理解的時候,將不進行其詳細描述。
[0035]如果提及一個元件“連接到”或者“耦合到”另一個元件的時候,應(yīng)該理解,再一個元件可以插入在其間,以及該元件可以連接或者直接耦合到另一個元件。當(dāng)在本發(fā)明中提及“包括”特定的元件的時候,其不意味著排除除該特定元件以外的元件,而指的是額外的元件可以包括在本發(fā)明的實施例,或者本發(fā)明的技術(shù)精神的范圍中。
[0036]諸如“第一”和“第二”的術(shù)語可用于描述各種元件,但是,元件不受到該術(shù)語的限制。該術(shù)語僅僅用于區(qū)別一個元件與另一個元件。例如,在本發(fā)明的技術(shù)精神內(nèi)稱作第一元件的元件可以稱作第二元件,并且稱作第二元件的單元可以類似地稱作第一元件。
[0037]在本發(fā)明的實施例中描述的組成單元被獨立地示出以表示不同獨特功能。每個組成單元不由單獨的硬件或者軟件單元構(gòu)成。也就是說,為了解釋便利的目的,組成單元被獨立地布置,并且至少兩個組成單元可以被組合成單個組成單元,或者單個組成單元可以被分成多個組成單元以執(zhí)行功能。不脫離本發(fā)明的概念,元件被組合和/或分解的實施例屬于本發(fā)明的范圍。
[0038]某些元件可以不是用于執(zhí)行本發(fā)明的必要功能的必要元件,而是,可以是僅僅用于改善性能的選擇性的元件。本發(fā)明可以僅僅通過實施本發(fā)明的必要元件,而不是僅僅用于改善性能的元件,來實施,并且僅僅包括除僅用于改善性能的選擇性的元件以外的必要元件的結(jié)構(gòu)屬于本發(fā)明的范圍。
[0039]圖1是圖示根據(jù)本發(fā)明實施例的語音編碼器的示意圖。[0040]參考圖1,語音編碼器包括帶寬檢查單元103、采樣和轉(zhuǎn)換單元106、預(yù)處理單元109、帶劃分單元112、線性預(yù)測和分析單元115和118、線性預(yù)測和量化單元121和124、TCX模式執(zhí)行單元127、CELP模式執(zhí)行單元136、模式選擇單元151、帶預(yù)測單元154和補償增益預(yù)測單元157。
[0041]圖1圖示語音編碼器的示例。在不脫離本發(fā)明的概念的情況下,根據(jù)本發(fā)明的實施例的語音編碼器可以具有別的配置。在圖1中圖示的組成單元獨立地示出以表示不同的獨特功能。每個組成單元不由單獨的硬件或者軟件單元構(gòu)成。也就是說,為了解釋便利的目的,組成單元被獨立地布置,并且至少兩個組成單元可以被組合成單個組成單元,或者單個組成單元可以被分成多個組成單元以執(zhí)行功能。不脫離本發(fā)明的概念,元件被組合和/或分解的實施例屬于本發(fā)明的范圍。某些元件可以不是用于執(zhí)行本發(fā)明的必要功能的必要元件,而是,可以是僅僅用于改善性能的選擇性的元件。例如,可以實施其中取決于語音信號的帶寬而從圖1中除去不必要的組成單元的語音編碼器。這個語音編碼器也屬于本發(fā)明的范圍。
[0042]本發(fā)明可以僅僅通過實施本發(fā)明必需的元件,而不是僅僅用于改善性能的元件,來實施,并且僅僅包括除僅用于改善性能的選擇性的元件以外的必要元件的結(jié)構(gòu)屬于本發(fā)明的范圍。
[0043]帶寬檢查單元103可以確定輸入語音信號的帶寬信息。取決于其帶寬,語音信號可以劃分為具有大約4kHz的帶寬并且通常在公共電話交換網(wǎng)(PSTN)中使用的窄帶信號,具有大約7kHz的帶寬、比窄帶語音信號更加自然并且通常在高質(zhì)量語音或者AM無線電中使用的寬帶信號,具有大約14kHz的帶寬并且通常在諸如音樂和數(shù)字廣播這樣強調(diào)聲音質(zhì)量的領(lǐng)域中使用超寬帶信號,和具有大約20kHz的帶寬的全頻帶信號。帶寬檢查單元103可以將輸入語音信號變換到頻域,并且可以確定當(dāng)前的語音信號的帶寬。
[0044]語音編碼器的編碼操作可以取決于語音信號的帶寬而變化。例如,當(dāng)輸入語音信號是超寬帶信號的時候,該輸入語音信號被僅僅輸入給帶劃分單元112,并且采樣轉(zhuǎn)換單元106不激活。當(dāng)輸入語音信號是窄帶信號或者寬帶信號的時候,該輸入語音信號被僅僅輸入給采樣轉(zhuǎn)換單元106和帶劃分單元112,并且其后續(xù)的組成單元115、121、157和154不激活。在一些實施例中,當(dāng)輸入語音信號的帶寬是固定的時候,帶寬檢查單元103可以不包括在語音編碼器中。
[0045]采樣轉(zhuǎn)換單元106可以將輸入窄帶信號或者輸入寬帶信號改變?yōu)楹愣ǖ牟蓸铀俾?。例如,?dāng)輸入窄帶信號的采樣速率是8kHz的時候,該輸入語音信號可以被上采樣為12.SkHz以產(chǎn)生上帶信號。當(dāng)輸入寬帶信號的采樣速率是16kHz的時候,該輸入語音信號可以被下采樣為12.8kHz以產(chǎn)生下帶(lower-band)信號。內(nèi)部采樣頻率可以是除12.8kHz以外的頻率。
[0046]預(yù)處理單元109可以對具有由采樣轉(zhuǎn)換單元106改變的內(nèi)部采樣頻率的語音信號執(zhí)行預(yù)處理操作。通過預(yù)處理,能夠有效地提取語音參數(shù)。例如,預(yù)處理單元109可以使用高通濾波或者預(yù)加重濾波以提取重要的帶的頻率分量。例如,預(yù)處理單元109可以通過取決于語音信號的帶寬將截止頻率設(shè)置為不同,來專注于提取參數(shù)所需要的重要的帶。預(yù)處理單元109可以執(zhí)行高通濾波以濾除是包括相對次要的信息的頻帶的非常低的頻率。例如,預(yù)處理單元109提升輸入語音信號的高頻帶,并且縮放低頻帶和高頻帶的能量。通過提升和縮放,可以提高用于線性預(yù)測和分析的分辨率。
[0047]帶劃分單元112可以轉(zhuǎn)換輸入超寬帶信號的采樣速率,并且可以將其頻帶劃分為上帶和下帶。例如,32kHz的語音信號可以被轉(zhuǎn)換為25.6kHz的采樣頻率。轉(zhuǎn)換為25.6kHz的采樣頻率的語音信號可以通過12.SkHz被劃分為上帶和下帶。下帶可以發(fā)送給預(yù)處理單元109用于濾波。
[0048]線性預(yù)測分析單元118可以計算線性預(yù)測系數(shù)(LPC)。線性預(yù)測分析單元118可以建模表示語音信號的頻譜的整個形狀的共振峰(formant)。線性預(yù)測分析單元118可以計算LPC值,以致誤差值的均方差(MSE),該誤差值是在原始語音信號和使用由線性預(yù)測分析單元118計算的線性預(yù)測系數(shù)產(chǎn)生的預(yù)測語音信號之間的差。各種LPC系數(shù)計算方法,諸如自相關(guān)方法和協(xié)方差方法可用于計算LPC。
[0049]線性預(yù)測量化單元124可以將從下帶語音信號中提取的LPC轉(zhuǎn)換為頻域的變換系數(shù),諸如LSP或者LSF,并且可以量化該變換系數(shù)。LPC具有寬的動態(tài)范圍。因此,當(dāng)LPC被沒有任何變化的情況下被發(fā)送的時候,壓縮率被降低。因此,能夠使用變換為頻域的變換系數(shù)產(chǎn)生具有少量信息的LPC信息。線性預(yù)測量化單元124可以量化和編碼LPC系數(shù)。線性預(yù)測量化單元124可以發(fā)送線性預(yù)測殘留信號。線性預(yù)測殘留信號包括基音(pitch)信息和隨機信號,基音信息是使用去量化和變換為時域的LPC而從其中去除共振峰分量的信號。線性預(yù)測殘留信號可以發(fā)送給線性預(yù)測量化單元124的后續(xù)的級。在上帶中,線性預(yù)測殘留信號可以發(fā)送給補償增益預(yù)測單元157。在下帶中,在下帶中的線性預(yù)測殘留信號可以發(fā)送給TCX模式執(zhí)行單元127和CELP模式執(zhí)行單元136。
[0050]本發(fā)明以下的實施例將描述以變換碼激勵(TCX)模式或者碼激勵線性預(yù)測(CELP)模式編碼窄帶信號或者寬帶信號的線性預(yù)測殘留信號的方法。
[0051]圖2是圖示根據(jù)本發(fā)明實施例執(zhí)行TCX模式的TCX模式執(zhí)行單元的示意圖。
[0052]TCX模式執(zhí)行單元可以包括TCX變換單元200、TCX量化單元210、TCX逆變換單元220和TCX合成單元230。
[0053]TCX變換單元200可以基于變換函數(shù),諸如離散傅里葉變換(DFT)或者修改的離散余弦變換(MDCT),將輸入殘留信號變換到頻域,并且可以將系數(shù)信息變換給TCX量化單元210。
[0054]TCX量化單元210可以使用各種量化方法量化由TCX變換單元200變換的變換系數(shù)。根據(jù)本發(fā)明實施例,TCX量化單元210可以取決于頻帶選擇性地執(zhí)行量化,并且可以使用分析-合成(AbS)方法計算最佳頻率組合。本發(fā)明的實施例將在下面描述。
[0055]TCX逆變換單元220可以基于量化的信息將已經(jīng)由變換單元變換到頻域的線性預(yù)測殘留信號逆變換為時域的激勵信號。
[0056]TCX合成單元230可以使用以TCX模式量化的逆變換的線性預(yù)測系數(shù)值和重構(gòu)的激勵信號計算合成的語音信號。合成的語音信號可以被提供給模式選擇單元151,并且以TCX模式重構(gòu)的語音信號可以以稍后描述的CELP模式量化,并且可以與重構(gòu)的語音信號相比較。
[0057]圖3是圖示根據(jù)本發(fā)明實施例執(zhí)行CELP模式的CELP模式執(zhí)行單元的示意圖。
[0058]CELP模式執(zhí)行單元包括基音檢測單元300、自適應(yīng)碼本搜索單元310、固定碼本搜索單元320、CELP量化單元330、CELP逆變換單元340和CELP合成單元350。[0059]基音檢測單元300可以使用開環(huán)方法,諸如自相關(guān)方法,基于線性預(yù)測殘留信號獲得基音的周期信息和峰信息。
[0060]基音檢測單元300可以將合成的語音信號與實際的語音信號比較,并且可以計算基音周期(峰值)。計算的基音信息可以由CELP量化單元量化,并且可以發(fā)送給自適應(yīng)碼本搜索單元。自適應(yīng)碼本搜索單元可以基于諸如AbS方法這樣的方法來計算基音周期(基音值)。
[0061]自適應(yīng)碼本搜索單元310可以例如使用AbS方法,基于量化的基音信息,從線性預(yù)測殘留信號中計算基音結(jié)構(gòu)。量化的基音信息是基于基音檢測單元300產(chǎn)生的。自適應(yīng)碼本搜索單元310可以產(chǎn)生除基音結(jié)構(gòu)以外的隨機信號分量。
[0062]固定碼本搜索單元320可以通過使用碼本索引信息和碼本增益信息來編碼由自適應(yīng)碼本搜索單元310產(chǎn)生的隨機信號分量。由固定碼本搜索單元320確定的碼本索引信息和碼本增益信息可以由CELP量化單元330量化。
[0063]CELP量化單元330可以量化由如上所述的基音檢測單元300、自適應(yīng)碼本搜索單元310,和固定碼本搜索單元320確定的基音相關(guān)信息和碼本相關(guān)信息。
[0064]CELP逆變換單元340可以使用由CELP量化單元330量化的信息重構(gòu)激勵信號。
[0065]CELP合成單元350可以通過對作為以CELP模式量化的逆變換的線性預(yù)測殘留信號的重構(gòu)的激勵信號執(zhí)行線性預(yù)測的逆處理,基于重構(gòu)的語音信號和量化的線性預(yù)測系數(shù)計算合成的語音信號。以CELP模式重構(gòu)的語音信號可以供應(yīng)給模式選擇單元151,并且可以與以TCX模式重構(gòu)的語音信號相比較。
[0066]模式選擇單元151可以將從以TCX模式重構(gòu)的激勵信號產(chǎn)生的TCX重構(gòu)的語音信號與從以CELP模式重構(gòu)的激勵信號產(chǎn)生的CELP重構(gòu)的語音信號比較,可以選擇更加類似于原始語音信號的信號,并且可以編碼有關(guān)編碼模式的模式信息。選擇信息可以發(fā)送給帶預(yù)測單元154。
[0067]帶預(yù)測單元154可以使用從模式選擇單元151發(fā)送的選擇信息和重構(gòu)的激勵信號來產(chǎn)生上帶預(yù)測激勵信號。
[0068]補償增益預(yù)測單元157可以將上帶預(yù)測殘留信號與從帶預(yù)測單元154發(fā)送的上帶預(yù)測激勵信號比較,并且可以補償頻譜增益。
[0069]圖4是圖示根據(jù)本發(fā)明實施例的語音解碼器的示意圖。
[0070]參考圖4,語音解碼器包括去量化單元401和402、逆變換單元405、第一線性預(yù)測和合成單元410、采樣轉(zhuǎn)換單元415、后處理濾波單元420和445、帶預(yù)測單元440、增益補償單元430、第二線性預(yù)測和合成單元435,以及帶合成單元440。
[0071]去量化單元401和402可以去量化由語音編碼器量化的參數(shù)信息,并且可以將去量化的參數(shù)信息供應(yīng)給語音解碼器的組成單元。
[0072]逆變換單元405可以逆變換以TCX模式或者CELP模式編碼的語音信息,并且可以重構(gòu)激勵信號。根據(jù)本發(fā)明實施例,逆變換單元可以僅僅對由語音編碼器選擇的某些帶執(zhí)行逆變換。本發(fā)明的實施例將在下面詳細描述。重構(gòu)的激勵信號可以被從第一線性預(yù)測和合成單元410以及帶預(yù)測單元425發(fā)送。
[0073]第一線性預(yù)測和合成單元410可以使用從逆變換單元405發(fā)送的激勵信號和從語音編碼器發(fā)送的線性預(yù)測系數(shù)信息來重構(gòu)下帶語音信號。重構(gòu)的下帶語音信號可以被發(fā)送給采樣轉(zhuǎn)換單元415和帶合成單元440。
[0074]帶預(yù)測單元425可以基于從逆變換單元405發(fā)送的重構(gòu)的激勵信號值產(chǎn)生上帶預(yù)測激勵信號。
[0075]增益補償單元430可以基于從帶預(yù)測單元425發(fā)送的上帶預(yù)測激勵信號和從語音編碼器發(fā)送的補償增益值來補償超寬帶語音信號的頻譜增益。
[0076]第二線性預(yù)測和合成單元435可以基于從增益補償單元430發(fā)送的補償?shù)纳蠋ьA(yù)測激勵信號值和從語音編碼器發(fā)送的線性預(yù)測系數(shù)值來重構(gòu)上帶語音信號。
[0077]帶合成單元440可以合成從第一線性預(yù)測和合成單元410發(fā)送的重構(gòu)的下帶語音信號的帶和從第二線性預(yù)測和合成單元435發(fā)送的重構(gòu)的上帶語音信號的帶。
[0078]采樣轉(zhuǎn)換單元415可以再次將內(nèi)部采樣頻率值轉(zhuǎn)換為原始采樣頻率值。
[0079]后處理濾波單元420和445例如可以包括去加重濾波器,其可以執(zhí)行預(yù)處理單元(109)中的預(yù)加重濾波器的逆濾波。后處理濾波單元可以執(zhí)行各種后處理操作,諸如,將量化誤差減到最小的操作,和恢復(fù)(revive)諧振峰和抑制波谷的操作以及濾波操作。
[0080]如上所述,在圖1和2中圖示的語音編碼器是本發(fā)明的一個示例,可以采用不脫離本發(fā)明概念的別的語音編碼器結(jié)構(gòu),并且這樣的實施例也包括在本發(fā)明的范圍中。
[0081]圖5至7是圖示根據(jù)本發(fā)明實施例以TCX模式執(zhí)行編碼操作方法的流程圖。
[0082]在根據(jù)本發(fā)明實施例的TCX編碼方法中,能夠通過使用取決于信號的重要程度選擇性地執(zhí)行量化的方法來實現(xiàn)較高的編碼效率。
[0083]參考圖5,計算輸入語音信號的目標(biāo)信號(步驟S500)。目標(biāo)信號是在時間軸中除去了在語音采樣之間的短期相關(guān)性的線性預(yù)測殘留信號。
[0084]Aw(z)表示包括經(jīng)歷LPC分析和量化的量化的線性預(yù)測系數(shù)(LPC)的濾波器。輸入信號可以經(jīng)過Aw(Z)濾波器以輸出線性預(yù)測殘留信號。線性預(yù)測殘留信號可以是要以TCX模式編碼的目標(biāo)信號。
[0085]當(dāng)先前幀被以除TCX模式以外的模式編碼的時候,零輸入響應(yīng)(ZIR)被除去(步驟 S510)。
[0086]例如,當(dāng)先前幀是以除TCX模式以外的ACELP模式編碼的幀的時候,通過加權(quán)濾波器和合成濾波器的組合的零輸入響應(yīng)可以從加權(quán)信號中除去,以便消除由于先前的輸入信號對輸出值的影響。
[0087]然后,執(zhí)行自適應(yīng)加窗(windowing)操作(步驟S520)。
[0088]如上所述,線性預(yù)測殘留信號可以被使用多個方法,諸如TCX和CELP來編碼。當(dāng)使用不同的方法編碼連續(xù)的幀的時候,可能在幀之間的邊界處導(dǎo)致語音質(zhì)量劣化。因此,當(dāng)先前幀被以除當(dāng)前幀的模式以外的模式編碼的時候,在幀之間的連續(xù)性可以使用加窗操作獲得。
[0089]隨后,執(zhí)行變換操作(步驟S530)。
[0090]加窗的線性預(yù)測殘留信號可以使用諸如DFT或者MDCT的變換函數(shù)從時域信號變換為頻域信號。
[0091]參考圖6,在步驟S530中變換的該性預(yù)測殘留信號經(jīng)歷頻譜預(yù)整形和帶劃分(步驟 S600)。
[0092]在根據(jù)本發(fā)明的實施例劃分語音信號帶的方法中,線性預(yù)測殘留信號可以取決于頻率被劃分為下帶和上帶,并且可以被編碼。通過使用劃分帶的方法,能夠取決于帶的重要度確定是否執(zhí)行量化。本發(fā)明以下的實施例將描述量化某些固定的低頻帶,和選擇性地量化在較高的高頻帶中具有大的能量部分的帶的方法。要量化的帶可以稱為要量化的頻帶,多個固定的低頻帶可以稱為固定的低頻帶,并且要選擇性地量化的多個高頻帶可以稱為選擇的高頻帶。
[0093]任意地,頻帶被劃分為高頻帶和低頻帶,并且要量化的頻帶被在劃分的頻帶中選擇。因此,不脫離本發(fā)明的概念,別的頻帶劃分方法可用于選擇頻帶,并且要量化的頻帶的數(shù)目可以變化。這個實施例也屬于本發(fā)明的范圍。為了解釋便利的目的,本發(fā)明的以下的實施例將描述DFT被用作變換方法,但是,可以使用別的變換方法(例如,MDCT)。這個實施例也屬于本發(fā)明的范圍。
[0094]以TCX模式的目標(biāo)信號經(jīng)由頻譜預(yù)整形被變換為在頻域中的系數(shù)。為了解釋便利的目的,本發(fā)明的實施例將描述以12.8kHz的內(nèi)部采樣速率處理20ms (256個采樣)的幀部分的序列,但是,具體的值(頻率系數(shù)的數(shù)目和帶劃分的特征值)可以隨幀大小變化而變化。
[0095]在頻域中的系 數(shù)可以變換為具有288個采樣的頻域信號,并且變換的頻域信號可以被劃分成每個具有8個采樣的36個帶。頻域信號可以經(jīng)歷交替地重新排序和分組實部和虛部的預(yù)整形,以便將頻域信號劃分為每個具有8個采樣的36個帶。例如,當(dāng)288個采樣經(jīng)歷DFT的時候,采樣在頻域中被排列為關(guān)于Fs/2是對稱的,并且因此,要編碼的系數(shù)可以是144個頻域采樣。頻域系數(shù)具有實部和虛部。因此,實部和虛部可以被交替地重新排序用于量化,以便通過8個采樣分組288個采樣以形成36個帶。
[0096]表達式I表不劃分的頻域信號。
[0097]<表達式1>
[0098]Xn (k) =X (η X 8+k), k=0, , 7n=0, , 35
[0099]在這里,四個低頻帶(Xn(k)n=0,...,3)可以是固定的,并且在32個高頻帶之中的四個重要的頻帶可以基于能量分布被選擇和定義為量化選擇帶。最后,量化選擇帶可以是
包括四個低頻帶和四個高頻帶的8個頻(X,(k) ? = 0, -,7)。如上所述,要量化的頻帶
的數(shù)目是任意的,并且可以變化,有關(guān)選擇的帶的位置的信息可以發(fā)送給語音解碼器。
[0100]圖8是圖示根據(jù)本發(fā)明實施例選擇要量化的帶的方法示例的示意圖。
[0101]參考圖8,在圖8的上部分中的橫軸表示當(dāng)原始線性預(yù)測殘留信號被變換為頻域時的頻帶(800)。如上所述,線性預(yù)測殘留信號的頻率變換系數(shù)可以取決于頻帶被劃分成32個帶,并且在原始線性預(yù)測殘留信號的頻帶中的四個固定的低頻帶820和四個選擇的高頻帶840的8個頻帶可以是要量化的選擇的頻帶。在選擇8個選擇的頻帶時,除四個固定的低頻帶以外的32個頻帶被以能量降序排列,并且8個上頻帶被選擇。
[0102]再次參考圖6,選擇的量化帶可以被標(biāo)準(zhǔn)化(步驟S610)。
[0103]要量化的頻帶的總能量可以通過使用表達式2計算每個選擇的頻帶的能量(E(n)n=0,..., 7)來計算。
[0104]〈表達式2>[0105]
【權(quán)利要求】
1.一種語音解碼方法,包括: 去量化從選擇性地量化的語音帶中提取的語音參數(shù)信息;和 基于去量化的語音參數(shù)信息執(zhí)行逆變換。
2.根據(jù)權(quán)利要求1的方法, 其中,所述選擇性地量化的語音帶包括:至少一個預(yù)先確定的要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。
3.根據(jù)權(quán)利要求2的方法, 其中,至少一個選擇的高頻語音帶是基于語音帶的能量分布信息選擇的具有大的能量部分的高頻帶。
4.根據(jù)權(quán)利要求2的方法, 其中,基于去量化的語音參數(shù)信息執(zhí)行逆變換包括:通過將不同的碼本應(yīng)用于基于所述去量化的語音參數(shù)信息選擇的要量化的語音帶來執(zhí)行逆變換。
5.根據(jù)權(quán)利要求4的方法, 其中,所述要量化的語音帶包括:至少一個預(yù)先確定的要量化的固定的低頻語音帶,和至少一個要量化的選擇的高 頻語音帶。
6.根據(jù)權(quán)利要求5的方法, 其中,通過將不同的碼本應(yīng)用于要量化的語音帶來執(zhí)行逆變換包括:基于第一碼本和去量化的要量化的低頻語音帶的語音參數(shù)來重構(gòu)語音信號,和基于第二碼本和去量化的要量化的高頻語音帶的語音參數(shù)來重構(gòu)語音信號。
7.根據(jù)權(quán)利要求4的方法, 其中,基于去量化的語音參數(shù)信息執(zhí)行逆變換包括:通過將去量化的舒適噪聲電平應(yīng)用于不要量化的語音帶來重構(gòu)語音信號。
8.根據(jù)權(quán)利要求1的方法, 其中,所述選擇性地量化的語音帶包括:預(yù)先確定的至少一個要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。
9.根據(jù)權(quán)利要求8的方法, 其中,去量化從選擇性地量化的語音帶中提取的語音參數(shù)信息包括:使用分析-合成(AbS)去量化從通過最類似于原始信號的組合選擇的要量化的高頻語音帶和至少一個預(yù)先確定的要量化的固定的低頻語音帶中提取的語音參數(shù)信息。
10.根據(jù)權(quán)利要求9的方法, 其中,基于去量化的語音參數(shù)信息執(zhí)行逆變換包括:使用離散傅里葉逆變換(IDFT)對要量化的高頻語音帶執(zhí)行逆變換,并且使用快速傅里葉逆變換(IFFT)對要量化的低頻語音帶執(zhí)行逆變換。
11.一種語音解碼器,包括: 去量化單元,所述去量化單元去量化從選擇性地量化的語音帶中提取的語音參數(shù)信息;和 逆變換單元,所述逆變換單元基于通過所述去量化單元去量化的語音參數(shù)信息執(zhí)行逆變換。
12.根據(jù)權(quán)利要求11的語音解碼器,其中,所述選擇性地量化的語音帶包括:至少一個預(yù)先確定的要量化的固定的低頻語音帶,和至少一個要量化的選擇的高頻語音帶。
13.根據(jù)權(quán)利要求11的語音解碼器, 其中,所述逆變換單元通過基于去量化的語音參數(shù)信息確定要量化的語音帶,并且將不同的碼本應(yīng)用于所述要量化的語音帶來重構(gòu)語音信號。
14.根據(jù)權(quán)利要求11的語音解碼器, 其中,所述去量化單元使用分析-合成(AbS)去量化從通過最類似于原始信號的組合選擇的要量化的高頻語音帶和至少一個預(yù)先確定的要量化的固定的低頻語音帶中提取的語音參數(shù)信息。
15.根據(jù)權(quán)利要求11的語音解碼器, 其中,所述逆變換單元使用離散傅里葉逆變換(IDFT)對要量化的高頻語音帶執(zhí)行逆變換,并且使用快速傅里葉 逆變換(IFFT)對要量化的低頻語音帶執(zhí)行逆變換。
【文檔編號】G10L19/032GK103999153SQ201280062478
【公開日】2014年8月20日 申請日期:2012年5月4日 優(yōu)先權(quán)日:2011年10月24日
【發(fā)明者】鄭奎赫, 李英漢, 洪起烽, 田惠晶, 李寅誠, 姜仁圭, 金洛榕 申請人:Lg電子株式會社, 忠北大學(xué)校產(chǎn)學(xué)協(xié)力團