專利名稱:子帶域中改進(jìn)的頻譜平移/折疊的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種改進(jìn)高頻重建(HFR)技術(shù)的新方法和設(shè)備,可應(yīng)用于音頻信源編碼系統(tǒng)。利用這種新方法可以大大減小計(jì)算復(fù)雜性。這是借助于子帶域中頻率平移和折疊而實(shí)現(xiàn)的,最好是,它與頻譜包絡(luò)調(diào)整過程相結(jié)合。通過不和諧防護(hù)帶濾波的概念,本發(fā)明還改進(jìn)感覺音頻質(zhì)量。本發(fā)明給出低復(fù)雜性,中等質(zhì)量HFR方法并且涉及PCT專利頻譜帶復(fù)制(SBR)[WO 98/57436]。
背景技術(shù):
某個頻率之上的原始音頻信息被高斯噪聲或人為低頻帶信息所代替的方案統(tǒng)稱為高頻重建(HFR)方法。除了噪聲插入或諸如整流的非線性之外,現(xiàn)有技術(shù)的HFR方法一般利用所謂的拷貝技術(shù),用于產(chǎn)生高頻帶信號。這些技術(shù)主要采用寬帶線性頻率偏移,即,平移,或頻率倒置線性偏移,即,折疊?,F(xiàn)有技術(shù)的HFR方法主要是為了改進(jìn)語音編解碼器的性能。然而,利用感覺準(zhǔn)確的方法,高頻帶再生中的最近發(fā)展已使HFR方法成功地應(yīng)用于自然音頻編解碼器,編碼音樂或其他復(fù)雜的節(jié)目材料,PCT專利[WO 98/57436]。在某些條件下,簡單的拷貝技術(shù)在編碼復(fù)雜節(jié)目材料時(shí)也是適用的。這些技術(shù)在中級質(zhì)量應(yīng)用中已產(chǎn)生合理的結(jié)果,特別是用于編解碼器裝置,其中對于整個系統(tǒng)的計(jì)算復(fù)雜性有嚴(yán)格的約束。
人類話音和大多數(shù)樂器產(chǎn)生準(zhǔn)穩(wěn)定的音調(diào)信號,這些信號從振蕩系統(tǒng)發(fā)出。根據(jù)傅里葉理論,任何周期性信號可以表示成頻率為f,2f,3f,4f,5f等的正弦波之和,其中f是基頻。這些頻率形成一個調(diào)和級數(shù)。音調(diào)親合性是指感覺音調(diào)或諧波之間的關(guān)系。在自然聲音再現(xiàn)中,這種音調(diào)親合性是受不同類型話音或所用樂器的控制和確定??偟腍FR技術(shù)思想是根據(jù)現(xiàn)有低頻帶建立的信息代替原始高頻信息,和隨后給這個信息加上頻譜包絡(luò)調(diào)整?,F(xiàn)有技術(shù)HFR方法建立高頻帶信號,其中音調(diào)親合性往往是不可控制和受損的。這些方法產(chǎn)生非諧波頻率分量,它給復(fù)雜節(jié)目材料造成感覺的假象。這種假象在編碼文獻(xiàn)中稱之為“刺耳”發(fā)聲,聽眾的感覺到的是聲音失真。
與和諧(悅耳)相反,感覺的不和諧(刺耳)出現(xiàn)在相鄰音調(diào)或泛音發(fā)生干擾的時(shí)候。各種研究人員解釋了不和諧理論,其中包括Plomp和Levelt[“Tonal Consonance and Critical Bandwidth”R.Plomp,W.J.M.Levelt,JASA,Vol.38,1965],該理論指出,若頻率之差約在兩個泛音所在臨界頻帶帶寬的5至50%以內(nèi),則認(rèn)為這兩個泛音是不和諧的。頻率變換到臨界頻帶所用的標(biāo)度稱之為Bark標(biāo)度。一個Bark相當(dāng)于一個臨界頻帶的頻率距離。例如,以下的函數(shù)關(guān)系式可用于頻率(f)到Bark標(biāo)度(z)的轉(zhuǎn)換z(f)=26.811+1960f-0.53---[Bark]---(1)]]>Plomp指出,若兩個泛音的頻率之差約小于所在臨界頻帶的5%,或相當(dāng)?shù)?,若兩個泛音的頻率間隔小于0.05Bark,則人類聽覺系統(tǒng)不能辨別這兩個泛音。另一方面,若兩個泛音的頻率間隔大于0.5Bark,則感覺到這兩個泛音為分開的音調(diào)。
不和諧理論部分地解釋為什么現(xiàn)有技術(shù)的方法給出不滿意的結(jié)果。一組和諧泛音的頻率上移可能變成不和諧泛音。此外,在平移頻帶樣本與低頻帶之間的交叉區(qū),泛音能夠發(fā)生干擾,按照不和諧規(guī)則,因?yàn)檫@些泛音可能不在可接受的偏差范圍內(nèi)。
發(fā)明內(nèi)容
本發(fā)明提供一種改進(jìn)信源編碼系統(tǒng)中平移或折疊技術(shù)的新方法和設(shè)備。其目的包括大大減小計(jì)算復(fù)雜性和減小感覺假象。本發(fā)明展示一種分抽樣數(shù)字濾波器組作為頻率平移或折疊裝置的新實(shí)施方案,還提供低頻帶與平移或折疊頻帶之間改進(jìn)的交叉準(zhǔn)確度。此外,本發(fā)明指出避免感覺不和諧的交叉區(qū)得益于被濾波。濾波區(qū)稱之為不和諧的防護(hù)帶,利用分抽樣濾波器組,本發(fā)明能夠以不復(fù)雜和準(zhǔn)確的方式減小不和諧泛音。
新濾波器組基的平移或折疊過程可以有利地與頻譜包絡(luò)調(diào)整過程相結(jié)合。于是,用于包絡(luò)調(diào)整的濾波器組也可用于頻率平移或折疊過程,所以,不需要使用分開的濾波器組或頻譜包絡(luò)調(diào)整過程。本發(fā)明以低計(jì)算代價(jià)提供唯一和靈活的濾波器組基設(shè)計(jì),因此,建立一種非常有效的平移/折疊/包絡(luò)調(diào)整系統(tǒng)。
此外,本發(fā)明有利地與PCT專利[SE00/00159]中描述的自適應(yīng)噪聲背景相加方法進(jìn)行組合。這個組合可以改進(jìn)困難節(jié)目材料條件下的感覺質(zhì)量。
我們提出的子帶域基平移或折疊技術(shù)包括以下步驟-通過數(shù)字濾波器組的分析部分,濾波低頻帶信號以得到一組子帶信號;-在數(shù)字濾波器組的合成部分,從相鄰的低頻帶頻道到相鄰的高頻帶頻道修補(bǔ)一些子帶信號;-按照所需的頻譜包絡(luò),調(diào)整修補(bǔ)的子帶信號;和-通過數(shù)字濾波器組的合成部分,濾波調(diào)整的子帶信號,以非常有效的方法得到包絡(luò)調(diào)整和頻率平移或折疊的信號。
本發(fā)明引人注目的應(yīng)用涉及改進(jìn)各種類型的中級質(zhì)量編解碼器的應(yīng)用,例如,MPEG 2 Layer III,MPEG 2/4 AAC,Dolby AC-3,NTTTwin VQ,AT&T/Lucent PAC,等等,其中這些編解碼器用在低比特率。本發(fā)明在各種語音編解碼器中也是非常有用的,例如,G.729MPEG-4 CELP和`HVXC等,可以改進(jìn)感覺質(zhì)量。上述的編解碼器在多媒體,電話工業(yè),互聯(lián)網(wǎng)以及專業(yè)多媒體應(yīng)用中得到廣泛的使用。
參照附圖,借助于幾個具體例子描述本發(fā)明,這些例子不限制本發(fā)明的范圍或精神,其中圖1表示按照本發(fā)明在編碼系統(tǒng)中結(jié)合濾波器組基的平移或折疊;圖2表示最大抽取濾波器組的基本結(jié)構(gòu);
圖3表示按照本發(fā)明的頻譜平移;圖4表示按照本發(fā)明的頻譜折疊;和圖5表示按照本發(fā)明利用防護(hù)頻帶的頻譜平移。
具體實(shí)施例方式
數(shù)字濾波器組基的平移和折疊現(xiàn)在描述新濾波器組基的平移或折疊技術(shù)。利用濾波器組的分析部分,把所考慮的信號分解成一系列子帶信號。通過分析和合成子帶頻道的重新連接,于是,這些子帶信號被修補(bǔ)以實(shí)現(xiàn)頻譜平移或折疊或二者的組合。
圖2表示最大抽取濾波器組分析/合成系統(tǒng)的基本結(jié)構(gòu)。分析濾波器組201把輸入信號分割成幾個子帶信號。合成濾波器組202組合子帶樣本以重建原始信號。利用最大抽取濾波器組的實(shí)施方案可以大大減小計(jì)算成本,應(yīng)當(dāng)理解,實(shí)現(xiàn)本發(fā)明可以利用幾種類型的濾波器組或變換,包括余弦或復(fù)指數(shù)調(diào)制的濾波器組,子波變換的濾波器組解釋,其他非相等帶寬濾波器組或變換,以及多維濾波器組或變換。
在以下典型而非限制性的描述中,我們假設(shè),L頻道濾波器組把輸入信號x(n)分割成L個子帶信號。利用抽樣頻率fS,輸入信號的頻帶限制到頻率fC。最大抽取濾波器組的分析濾波器(圖2)標(biāo)記為Hk(z)203,其中k=0,1,…,L-1。在傳輸通過抽取器204之后,子帶信號vk(n)被最大地抽取,每個信號的抽樣頻率為fS/L。在內(nèi)插205和濾波206之后,具有合成濾波器Fk(z)的合成部分重新組合子帶信號以產(chǎn)生 此外,本發(fā)明還完成 的頻譜重建,給出增強(qiáng)的信號y(n)。
重建范圍起始頻道標(biāo)記為M,它是由以下的公式確定M=floor{fCfS2L}-----(2)]]>源區(qū)頻道的數(shù)目標(biāo)記為S(1≤S≤M)。按照本發(fā)明,通過 的平移并結(jié)合包絡(luò)調(diào)整,利用修補(bǔ)子帶信號完成頻譜重建,νM+k(n)=eM+k(n)νM-S-P+k(n) (3)其中k∈
,(-1)S+P=1,即,S+P是偶數(shù),P是整數(shù)偏移(0≤P≤M-S)和eM+k(n)是包絡(luò)校正。按照本發(fā)明,通過 的折疊,利用修補(bǔ)子帶信號完成頻譜重建,νM+k(n)=eM+k(n)ν*M-P-S-k(n) (4)其中k∈
,(-1)S+P=-1,即,S+P是奇整數(shù),P是整數(shù)偏移(1-S≤P≤M-2S+1)和eM+k(n)是包絡(luò)校正。算符[*]表示復(fù)共軛。通常,在達(dá)到預(yù)期的高頻帶寬量之前,重復(fù)修補(bǔ)過程。
應(yīng)當(dāng)注意,通過利用子帶域基的平移和折疊,實(shí)現(xiàn)低頻帶與平移或折疊頻帶樣本之間改進(jìn)的交叉準(zhǔn)確度,因?yàn)樗行盘柺峭ㄟ^有匹配頻率響應(yīng)的濾波器組頻道進(jìn)行濾波。
若x(n)的頻率fC太高,或相當(dāng)?shù)?,若fS太低,不允許實(shí)現(xiàn)有效的頻譜重建,即,M+S>L,則在分析濾波之后可以增大子帶頻道的數(shù)目。利用QL頻道合成濾波器組濾波子帶信號,其中僅利用L個低頻帶頻道,和上抽樣因子Q是這樣選取的,使QL是整數(shù)值,它導(dǎo)致抽樣頻率為Qfs的輸出信號。因此,擴(kuò)展濾波器組起的作用是,它似乎是后面有上抽樣器的L頻道濾波器組。在此情況下,由于沒有利用L(Q-1)個高頻帶濾波器(饋入零),音頻帶寬不發(fā)生變化,該濾波器組僅僅重建 的上抽樣版本。然而,若修補(bǔ)L個子帶信號到高頻帶頻道,則按照公式(3)或(4), 的帶寬就增大。利用這種方案,上抽樣過程與合成濾波相結(jié)合。應(yīng)當(dāng)注意,可以利用任何規(guī)模的合成濾波器組,導(dǎo)致輸出信號有不同的抽樣率。
參照圖3,考慮16頻道分析濾波器組中的子帶頻道。輸入信號x(n)的頻率范圍高達(dá)Nyquist頻率(fC=fS/2)。在第一次迭代中,16個子帶擴(kuò)展到23個子帶,利用以下參數(shù)M=16,S=7,和P=1完成按照公式(3)的頻率平移。這個操作表示在圖中從點(diǎn)a到點(diǎn)b的子帶修補(bǔ)。在下一次迭代中,23個子帶擴(kuò)展到28個子帶,公式(3)中使用新的參數(shù)M=23,S=5,和P=3。這個操作表示在圖中是從點(diǎn)b到點(diǎn)c的子帶修補(bǔ)。然后,可以利用28頻道濾波器組合成如此產(chǎn)生的子帶。這就產(chǎn)生抽樣頻率為28/16fS=1.75fS的臨界抽樣輸出信號。也可以利用32頻道濾波器組合成子帶信號,其中4個最高頻道中饋入零,在圖中用虛線表示,從而產(chǎn)生抽樣頻率為2fS的輸出信號。
利用相同的分析濾波器組和相同頻率范圍的輸入信號,圖4表示按照公式(4)在兩次迭代中利用頻率折疊的修補(bǔ)。在第一次迭代中,M=16,S=8,和P=-7,16個子帶擴(kuò)展到24個。在第二次迭代中,M=24,S=8,和P=-7,子帶數(shù)目從24個擴(kuò)展32個。利用32頻道濾波器組合成這些子帶。在抽樣頻率為2fS的輸出信號中,這種修補(bǔ)產(chǎn)生兩個重建的頻帶,一個頻帶是由于子帶信號修補(bǔ)到頻道16至23,它是頻道8至15提取的帶通信號的折疊版本;而另一個頻帶是由于修補(bǔ)到頻道24至31,它是相同帶通信號的平移版本。
高頻重建中的防護(hù)頻帶由于相鄰頻帶的干擾,即,平移頻帶樣本與低頻帶交叉區(qū)附近泛音之間的干擾,感覺不和諧可能在平移或折疊過程中得到發(fā)展。這種類型不和諧在諧波豐富,多音調(diào)節(jié)目材料中是很普遍的。為了減小不和諧,可以插入防護(hù)頻帶,且這些防護(hù)頻帶最好是由零能量的小頻帶組成,即,低頻帶信號與復(fù)制頻譜帶之間交叉區(qū)的濾波是利用帶阻或陷波濾波器。若利用防護(hù)頻帶減小不和諧,則感覺到較少的感知退化。防護(hù)頻帶的帶寬最好是在0.5Bark左右。若小于0.5Bark,則可能產(chǎn)生不和諧;若大于0.5Bark,則可能產(chǎn)生梳狀濾波器的聲音特征。
在濾波器組基的平移或折疊中,可以插入防護(hù)頻帶,且這些防護(hù)頻帶最好是由設(shè)置成零的一個或幾個子帶頻道組成。利用防護(hù)頻帶,公式(3)和公式(4)分別改變成公式(5)和公式(6)νM+D+k(n)=eM+D+k(n)νM-S-P+k(n)(5)和νM+D+k(n)=eM+D+k(n)ν*M-P-S-k(n) (6)D是小的整數(shù),它代表用作防護(hù)頻帶的濾波器組中頻道數(shù)目。在公式(5)中,P+S+D應(yīng)當(dāng)為偶整數(shù);而在公式(6)中,P+S+D應(yīng)當(dāng)為奇整數(shù)。P的取值與以前的值相同。圖5表示利用公式(5)修補(bǔ)32頻道濾波器組的情況。輸入信號的頻率范圍高達(dá)fC=5/16fS,在第一次迭代中,使M=20。信源頻道的數(shù)目選取為S=4和P=2。此外,D的選取最好是使防護(hù)頻帶的帶寬為0.5Bark。此處,D=2,使防護(hù)頻帶的帶寬為fS/32Hz。在第二次迭代中,參數(shù)的選取為M=26,S=4,D=2和P=0。在圖5中,防護(hù)頻帶是用虛線連接的子帶表示。
為了使頻譜包絡(luò)連續(xù),利用隨機(jī)白噪聲信號,即,利用白噪聲代替零饋入到子帶中,可以部分地重建不和諧防護(hù)頻帶。較好的方法是利用PCT專利申請[SE00/00159]中描述的自適應(yīng)噪聲背景相加(ANA)方法。這個方法估算原始信號中高頻帶的噪聲背景,并以明確的方式把合成噪聲加到解碼器中的重建高頻帶。
實(shí)際方案利用任意的編解碼器,本發(fā)明可以在各種存儲或傳輸音頻信號的系統(tǒng)中實(shí)施。圖1表示音頻編碼系統(tǒng)的解碼器。分路器101從比特流中分出包絡(luò)數(shù)據(jù)和其他HFR有關(guān)的控制信號,并饋入相關(guān)部分到任意的低頻帶解碼器102。低頻帶解碼器102產(chǎn)生饋入到分析濾波器組104的數(shù)字信號。包絡(luò)數(shù)據(jù)在包絡(luò)解碼器103中被解碼,形成的頻譜包絡(luò)信息與來自分析濾波器組的子帶樣本一起饋入到與平移或折疊結(jié)合的包絡(luò)調(diào)整濾波器組單元105。按照本發(fā)明,這個單元105平移或折疊低頻帶信號以形成寬帶信號,并加上發(fā)射的頻譜包絡(luò)。然后,處理后的子帶樣本饋入到合成濾波器組106,合成濾波器組106可以與分析濾波器組104有不同的規(guī)模。最后,數(shù)字寬帶輸出信號被DAC 107轉(zhuǎn)換成模擬輸出信號。
上述的實(shí)施例僅僅說明利用濾波器組基頻率平移或折疊方法改進(jìn)高頻重建(HFR)技術(shù)的本發(fā)明原理。應(yīng)當(dāng)明白,對于本領(lǐng)域其他專業(yè)人員,對此處描述的裝置和細(xì)節(jié)作各種改動和變化是顯而易見的。所以,本發(fā)明的內(nèi)容僅僅受專利申請的權(quán)利要求書范圍所限制,而不受描述和解釋實(shí)施例所提供的具體細(xì)節(jié)所限制。
權(quán)利要求
1.一種增強(qiáng)高頻重建技術(shù)的方法,組合頻率平移或折疊與頻譜包絡(luò)調(diào)整,其特征是-通過數(shù)字濾波器組的分析部分,濾波低頻帶信號以得到一組子帶信號;-在數(shù)字濾波器組的合成部分中,從所述濾波器組的相鄰頻道到相鄰頻道修補(bǔ)一些所述子帶信號,其中從頻率指數(shù)為k的頻道到頻率指數(shù)為j≠k的頻道,修補(bǔ)每個所述子帶信號;-按照所需的頻譜包絡(luò),調(diào)整所述修補(bǔ)的子帶信號;和-通過數(shù)字濾波器組的所述合成部分,濾波所述調(diào)整的子帶信號;從而得到包絡(luò)調(diào)整和頻率平移或折疊的信號。
2.按照權(quán)利要求1的方法,其特征是,所述數(shù)字濾波器組是借助于低通原型濾波器的余弦或正弦調(diào)制得到的。
3.按照權(quán)利要求1的方法,其特征是,所述數(shù)字濾波器組是借助于低通原型濾波器的復(fù)指數(shù)調(diào)制得到的。
4.按照權(quán)利要求2-3的方法,其特征是,所述低通原型濾波器設(shè)計(jì)成這樣,使所述數(shù)字濾波器組頻道的過渡帶僅與相鄰頻道的通帶重疊。
5.按照權(quán)利要求1-4的方法,其特征是,饋入零或高斯噪聲到數(shù)字濾波器組中所述合成部分的一個或幾個頻道;從而衰減不和諧有關(guān)的假象。
6.按照權(quán)利要求5的方法,其特征是,饋入零或高斯噪聲的所述頻道帶寬約為半個Bark。
7.按照權(quán)利要求1-6的方法,其特征是,所述濾波器組是利用高頻重建(HFR)的音頻編碼系統(tǒng)中的部分解碼器。
8.一種利用高頻重建技術(shù)增強(qiáng)信源編碼系統(tǒng)的設(shè)備,其中所述設(shè)備是解碼器,用于解碼編碼器編碼的信號,且所述設(shè)備組合頻率平移或折疊與頻譜包絡(luò)調(diào)整,其特征是-所述解碼器中的解碼裝置,用于解碼低頻帶音頻信號以形成第一信號;-所述解碼器中的分解裝置,用于分解所述第一信號成一些子帶信號;-所述解碼器中的頻譜平移或折疊裝置,用于修補(bǔ)一些所述子帶信號;-所述解碼器中的調(diào)整裝置,用于頻譜包絡(luò)調(diào)整所述修補(bǔ)的子帶信號;和-所述解碼器中的裝置,用于把所述調(diào)整的子帶信號重新組合成輸出信號;從而得到頻譜包絡(luò)調(diào)整和頻率平移或折疊的輸出信號。
全文摘要
本發(fā)明涉及一種利用頻率平移或折疊或二者組合改進(jìn)高頻重建(HFR)技術(shù)的新方法和設(shè)備。本發(fā)明可應(yīng)用于音頻信源編碼系統(tǒng),和大大減小計(jì)算的復(fù)雜性。這是借助于子帶域中的頻率平移或折疊實(shí)現(xiàn)的,最好是,它與相同域中的頻譜包絡(luò)調(diào)整相結(jié)合。還提出不和諧防護(hù)頻帶濾波的概念。本發(fā)明提供一種可應(yīng)用于語音和自然音頻編碼的低復(fù)雜性,中級質(zhì)量HFR方法。
文檔編號G10L21/038GK1430777SQ01809978
公開日2003年7月16日 申請日期2001年5月23日 優(yōu)先權(quán)日2000年5月23日
發(fā)明者拉斯·古斯塔夫·里爾耶爾德, 珀·??怂固靥m德, 弗雷德里克·漢, 克里斯托佛·克迂爾靈 申請人:編碼技術(shù)瑞典股份公司