專利名稱:用于編碼多通道音頻信號(hào)的參數(shù)編碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼。
背景技術(shù):
例如C ·富勒(C. Faller)和F ·鮑姆加特(F. Baumgarte)的“使用感知參數(shù)化來(lái)高效表不空間音步頁(yè)(Efficient representation of spatial audio using perceptualparametrization) ”(IEEE 關(guān)于 Appl. of Sig.的研討會(huì)會(huì)刊,Audio and Acoust.會(huì)刊,2001年10月,第199到202頁(yè))中所描述的參數(shù)立體聲或多通道音頻編碼使用空間線索來(lái)將混音(通常單聲道或立體聲)音頻信號(hào)合成為多通道的信號(hào)。通常,混音音頻信號(hào)因多通道音頻信號(hào)(例如立體聲音頻信號(hào))的多個(gè)音頻通道信號(hào)的疊加而生成。這些較少通道是經(jīng)波形編碼的,且將與原始信號(hào)通道關(guān)系有關(guān)的輔助信息(即,空間線索)作為編碼參數(shù)添加到經(jīng)編碼的音頻通道。解碼器使用此輔助信息在經(jīng)解碼的經(jīng)波形編碼的音頻通道的基 礎(chǔ)上重新生成原始數(shù)目個(gè)音頻通道。基本參數(shù)立體聲編碼器可使用通道間級(jí)別差異(ILD)作為從單聲道混音音頻信號(hào)生成立體聲信號(hào)所需的線索。較復(fù)雜的編碼器還可使用通道間相干性(ICC),其可表示音頻通道信號(hào)(即,音頻通道)之間的相似度。此外,當(dāng)編碼雙聲道立體聲信號(hào)(例如)以實(shí)現(xiàn)3D音頻或基于頭戴耳機(jī)的環(huán)繞渲染(surround rendering)時(shí),通道間相位差(IPD)也可起到再現(xiàn)通道之間的相位/延遲差異的作用。ICC線索的合成可對(duì)大多數(shù)音頻和音樂內(nèi)容適用,以重新生成環(huán)境、立體聲混響、源寬度和其它與空間感有關(guān)的感知,如描述于J ·布老爾特(J.Blauert)的“空間聽覺人類聲音定位的心理物理學(xué)(Spatial Hearing The Psychophysics of Human SoundLocalization) ”(1997年,美國(guó)馬薩諸塞州坎布里奇市的MIT出版社)中??赏ㄟ^在頻域中使用解相關(guān)器來(lái)實(shí)施相干性合成,如描述于E 舒約斯(E. Schuijers)、W 歐門(W. Oomen)、B ·鄧布林克(B. den Brinker)以及J ·布里巴爾特(J. Breebaart)的“對(duì)高質(zhì)量音頻的參數(shù)編石馬的進(jìn)步(Advances in parametric coding for high-quality audio),,(予頁(yè)印本,第114次音頻工程協(xié)會(huì)會(huì)議,2003年3月)中。然而,用于合成多通道音頻信號(hào)的已知合成方法苦于復(fù)雜性的增加。此外,除其它參數(shù)(例如通道間級(jí)別差異(ICLD)和通道間相位差(ICPD))之外還使用ICC參數(shù)可增加比特率開銷。
發(fā)明內(nèi)容
本發(fā)明要實(shí)現(xiàn)的目標(biāo)是降低參數(shù)編碼方案的復(fù)雜性。此目標(biāo)由獨(dú)立權(quán)利要求的特征實(shí)現(xiàn)。實(shí)施例可通過描述內(nèi)容、圖式和從屬權(quán)利要求可闡明。本發(fā)明是基于發(fā)現(xiàn)組合例如ICC參數(shù)等參數(shù)編碼參數(shù)可減小代表所述參數(shù)所需的比特率,且因此可降低以次所得的參數(shù)編碼方案的復(fù)雜性???例如)將經(jīng)組合的編碼參數(shù)僅應(yīng)用于某一頻率范圍,以便改進(jìn)(例如)語(yǔ)音等音頻質(zhì)量,借此可進(jìn)一步降低復(fù)雜性和存儲(chǔ)器要求。
根據(jù)第一方面,本發(fā)明涉及一種參數(shù)編碼器,其用于編碼具有第一音頻信號(hào)和第二音頻信號(hào)的多通道音頻信號(hào),所述參數(shù)編碼器具有變換器,用于將第一音頻信號(hào)變換到頻域中,以獲得第一變換后的音頻信號(hào),且用于將第二音頻信號(hào)變換到頻域中,以獲得第二變換后的音頻信號(hào);參數(shù)生成器,用于在第一頻率下由所述第一變換后的音頻信號(hào)及及第二變換后的音頻信號(hào)中生成第一編碼參數(shù),并在第二頻率下由第一變換后的音頻信號(hào)及第二變換后的音頻信號(hào)中生成第二編碼參數(shù);以及參數(shù)組合器,用于組合所述第一編碼參數(shù)及所述第二編碼參數(shù),以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第一方面的第一實(shí)施方式,第一和第二編碼參數(shù)可為通道間相位差。根據(jù)第一方面的第三實(shí)施方式,第一和第二編碼參數(shù)可為通道間相干性。根據(jù)第一方面的第四實(shí)施方式,第一和第二編碼參數(shù)可為通道間強(qiáng)度差異。根據(jù)第一方面的第五實(shí)施方式,第一和第二編碼參數(shù)可為通道間級(jí)別差異。
根據(jù)第一方面的第六實(shí)施方式,參數(shù)生成器用于基于第一變換后的音頻信號(hào)和第二變換后的音頻信號(hào)的值的相乘而生成第一編碼參數(shù)和第二編碼參數(shù)。根據(jù)第一方面的第七實(shí)施方式,參數(shù)組合器用于將第一編碼參數(shù)與第二編碼參數(shù)相加,以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第一方面的第八實(shí)施方式,參數(shù)組合器用于確定第一編碼參數(shù)與第二編碼參數(shù)的平均值,以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第一方面的第九實(shí)施方式,參數(shù)組合器用于在某一頻率下使用第一變換后的音頻信號(hào)和第二變換后的信號(hào)的功率作為權(quán)重來(lái)確定第一編碼參數(shù)與第二編碼參數(shù)的加權(quán)平均值,以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第一方面的第十實(shí)施方式,參數(shù)組合器用于使用頻率相關(guān)權(quán)重來(lái)確定第一編碼參數(shù)與第二編碼參數(shù)的加權(quán)平均值,以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第一方面的第十一實(shí)施方式,參數(shù)生成器用于在多個(gè)頻率下由第一變換后的音頻信號(hào)及第二變換后的音頻信號(hào)生成多個(gè)編碼參數(shù),且其中參數(shù)組合器用于組合所述多個(gè)編碼參數(shù)以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第一方面的第十二實(shí)施方式,參數(shù)編碼器進(jìn)一步包括信號(hào)組合器,用于組合第一變換后的音頻信號(hào)和第二變換后的音頻信號(hào)以獲得混音信號(hào)。根據(jù)第一方面的第十三實(shí)施方式,參數(shù)編碼器進(jìn)一步包括反變換器,用于反變換第一變換后的音頻信號(hào)與第二變換后的音頻信號(hào)的組合以獲得混音音頻信號(hào)。根據(jù)第二方面,本發(fā)明涉及一種參數(shù)解碼器,其用于基于經(jīng)組合的編碼參數(shù)而解碼混音音頻信號(hào),所述混音音頻信號(hào)表示第一音頻信號(hào)與第二音頻信號(hào)的組合,所述經(jīng)組合的編碼參數(shù)表示頻率特定編碼參數(shù)的組合,所述參數(shù)解碼器具有變換器,用于變換混音音頻信號(hào),以獲得具有某一頻率的變換后的混音音頻信號(hào);提供器,用于基于經(jīng)組合的編碼參數(shù)而提供與所述某一頻率相關(guān)聯(lián)的頻率特定編碼參數(shù);以及音頻合成器,用于在所述某一頻率下從變換后的混音音頻信號(hào)及頻率特定編碼參數(shù)中合成第一音頻信號(hào)和第二音頻信號(hào)。舉例來(lái)說(shuō),所述參數(shù)解碼器可用于解碼混音音頻信號(hào),所述混音音頻信號(hào)可由基于第一方面的參數(shù)編碼器提供。根據(jù)第二方面的第一實(shí)施方式,提供器適于提供經(jīng)組合的編碼參數(shù)作為頻率特定編碼參數(shù)。根據(jù)第二方面的第二實(shí)施方式,參數(shù)解碼器進(jìn)一步包括反變換器,用于反變換第一音頻信號(hào)和第二音頻信號(hào)。根據(jù)第三方面,本發(fā)明涉及一種用于以參數(shù)方式編碼具有第一音頻信號(hào)和第二音頻信號(hào)的多通道音頻信號(hào)的方法,所述方法包括將第一音頻信號(hào)變換到頻域中,以獲得第一變換后的音頻信號(hào),并將第二音頻信號(hào)變換到頻域中,以獲得第二變換后的音頻信號(hào);在第一頻率下由第一變換后的音頻信號(hào)及第二變換后的音頻信號(hào)生成第一編碼參數(shù),且在第二頻率下由第一變換后的音頻信號(hào)及第二變換后的音頻信號(hào)中生成第二編碼參數(shù);以及組合第一編碼參數(shù)與第二編碼參數(shù),以獲得經(jīng)組合的編碼參數(shù)。根據(jù)第三方面的實(shí)施方式的另外的方法步驟可直接從基于第一方面的參數(shù)編碼器的功能中導(dǎo)出。根據(jù)第四方面,本發(fā)明涉及一種用于基于經(jīng)組合的編碼參數(shù)而以參數(shù)方式解碼混 音音頻信號(hào)的方法,所述混音音頻信號(hào)表示第一音頻信號(hào)與第二音頻信號(hào)的組合,所述經(jīng)組合的編碼參數(shù)表示頻率特定編碼參數(shù)的組合,所述方法包括變換混音音頻信號(hào),以獲得具有某一頻率的變換后的混音音頻信號(hào);基于經(jīng)組合的編碼參數(shù)而提供與所述某一頻率相關(guān)聯(lián)的頻率特定編碼參數(shù);以及在所述某一頻率下從變換后的混音音頻信號(hào)及頻率特定編碼參數(shù)中合成第一音頻信號(hào)和第二音頻信號(hào)。根據(jù)第四方面的實(shí)施方式的另外的方法步驟可直接從基于第二方面的參數(shù)解碼器的功能中導(dǎo)出。
將參看以下圖式描述本發(fā)明的另外的實(shí)施例,其中圖I展示根據(jù)一實(shí)施方式的參數(shù)編碼器的框圖;圖2展示根據(jù)一實(shí)施方式的參數(shù)解碼器的框圖;圖3展示根據(jù)一實(shí)施方式的參數(shù)編碼方法的圖;以及圖4展示根據(jù)一實(shí)施方式的參數(shù)解碼方法的圖。
具體實(shí)施例方式圖I展示根據(jù)一實(shí)施方式的用于編碼具有第一音頻信號(hào)Xl和第二音頻信號(hào)x2的多通道音頻信號(hào)的參數(shù)編碼器的圖。所述參數(shù)編碼器包括變換器101,用于將第一音頻信號(hào)變換到頻域中,以獲得第一變換后的音頻信號(hào),且用于將第二音頻信號(hào)變換到頻域中,以獲得第二變換后的音頻信號(hào)。變換器101可包括第一變換器103,用于變換第一音頻信號(hào);以及第二變換器105,用于變換第二音頻信號(hào)。變換器101和/或變換器103、105可為(例如)傅立葉變換器。將第一和第二變換后的音頻信號(hào)提供給參數(shù)生成器107,用于在第一頻率下(例如,在第i頻率下或在第i頻帶中)由第一變換后的信號(hào)及第二變換后的音頻信號(hào)生成第一編碼參數(shù)。第i頻帶或“頻帶i” (也見圖I)指代參數(shù)生成器107在其下或其中由第一和第二變換后的信號(hào)生成相應(yīng)的編碼參數(shù)的頻帶i,且也稱為參數(shù)頻帶i。參數(shù)生成器107進(jìn)一步用于在第二頻率下或在第二頻帶中由第一和第二變換后的音頻信號(hào)生成第二編碼參數(shù)。將第一和第二編碼參數(shù)提供給參數(shù)組合器109,參數(shù)組合器109根據(jù)本文所描述的原理組合第一編碼參數(shù)與第二編碼參數(shù),以獲得經(jīng)組合的編碼參數(shù)。然而,參數(shù)組合器109可針對(duì)不同參數(shù)頻帶單獨(dú)地獲得編碼參數(shù)。參看圖I,及形成編碼參數(shù)的實(shí)施例的ICC參數(shù),(例如)立體聲輸入音頻通道xl和x2被轉(zhuǎn)換為多個(gè)子頻帶或參數(shù)頻帶。在所有參數(shù)頻帶或參數(shù)頻帶的子集中,可估算對(duì)應(yīng)的ICC參數(shù)??蓪⒁粋€(gè)或一個(gè)以上ICC參數(shù)組合過程(例如根據(jù)等式⑴到(4)的過程中的一者)應(yīng)用于所有參數(shù)頻帶或參數(shù)頻帶子集的ICC參數(shù),以計(jì)算經(jīng)組合的ICC參數(shù)。可將至少一個(gè)經(jīng)組合的ICC參數(shù)放入比特流111中,或?qū)⑵浒l(fā)射到音頻解碼器(圖I中顯示)。相對(duì)于形成編碼參數(shù)的實(shí)施例的ICC而示范性地描述以下實(shí)施例。然而,應(yīng)理解,編碼參數(shù)可為任何編碼參數(shù),或具有用于參數(shù)編碼的任何編碼參數(shù)類型,例如通道間相位差或通道間強(qiáng)度差異或通道間級(jí)別差異等,且將理解,編碼器可適于根據(jù)前面所提到的編碼參數(shù)類型中的一者、一些或全部而生成經(jīng)組合的編碼參數(shù),·且適于將經(jīng)組合的不同類型的編碼參數(shù)作為輔助信息包含在比特流111中。圖I的參數(shù)編碼器可形成參數(shù)立體聲編碼器,其在參數(shù)頻帶中估算感知空間線索參數(shù),例如ICLD、ICro和/或ICC。如果參數(shù)頻帶索引為i,那么在所述頻帶中估算的參數(shù)表示為ICLD (i)、ICPD (i)和ICC (i)。參數(shù)頻帶中的左側(cè)和右側(cè)信號(hào)功率分別表示為Pl (i)和P2⑴。在此方面,可計(jì)算一個(gè)或一個(gè)以上經(jīng)組合的ICC參數(shù),(例如)作為平均值
權(quán)利要求
1.一種用于編碼具有第一音頻信號(hào)和第二音頻信號(hào)的多通道音頻信號(hào)的參數(shù)編碼器,其特征在于,所述參數(shù)編碼器包括 變換器(101),用于將所述第一音頻信號(hào)變換到頻域中,以獲得第一變換后的音頻信號(hào),且用于將所述第二音頻信號(hào)變換到頻域中,以獲得第二變換后的音頻信號(hào); 參數(shù)生成器(107),用于在第一頻率下由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成第一編碼參數(shù),且用于在第二頻率下由由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成第二編碼參數(shù);以及 參數(shù)組合器(109),用于組合所述第一編碼參數(shù)和所述第二編碼參數(shù)以獲得經(jīng)組合的編碼參數(shù)。
2.根據(jù)權(quán)利要求I所述的參數(shù)編碼器,其特征在于,所述第一編碼參數(shù)和所述第二編碼參數(shù)為通道間相位差或通道間相干性或通道間強(qiáng)度差異或通道間級(jí)別差異。
3.根據(jù)權(quán)利要求I或2所述的參數(shù)編碼器,其特征在于,所述參數(shù)生成器(107)用于基于所述第一變換后的音頻信號(hào)和所述第二變換后的音頻信號(hào)的值的相乘而生成所述第一編碼參數(shù)和所述第二編碼參數(shù)。
4.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其特征在于,所述參數(shù)組合器(109)用于將所述第一編碼參數(shù)與所述第二編碼參數(shù)相加,以獲得所述經(jīng)組合的編碼參數(shù)。
5.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其特征在于,所述參數(shù)組合器(109)用于確定所述第一編碼參數(shù)與所述第二編碼參數(shù)的平均值,以獲得所述經(jīng)組合的編碼參數(shù)。
6.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其特征在于,所述參數(shù)組合器(109)用于在某一頻率下使用所述第一變換后的音頻信號(hào)和所述第二變換后的信號(hào)的功率作為權(quán)重來(lái)確定所述第一編碼參數(shù)與所述第二編碼參數(shù)的加權(quán)平均值,以獲得所述經(jīng)組合的編碼參數(shù)。
7.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其特征在于,所述參數(shù)組合器(109)用于使用頻率相關(guān)權(quán)重來(lái)確定所述第一編碼參數(shù)與所述第二編碼參數(shù)的加權(quán)平均值,以獲得所述經(jīng)組合的編碼參數(shù)。
8.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其特征在于,所述參數(shù)生成器(107)用于在多個(gè)頻率下由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成多個(gè)編碼參數(shù),且,所述參數(shù)組合器用于組合所述多個(gè)所述編碼參數(shù),以獲得所述經(jīng)組合的編碼參數(shù)。
9.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其特征在于,所述的參數(shù)編碼器進(jìn)一步用于組合所述第一變換后的音頻信號(hào)與所述第二變換后的音頻信號(hào),以獲得混音信號(hào)。
10.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的參數(shù)編碼器,其進(jìn)一步包括反變換器,用于反變換所述第一變換后的音頻信號(hào)與所述第二變換后的音頻信號(hào)的組合以獲得混音音頻信號(hào)。
11.一種用于基于經(jīng)組合的編碼參數(shù)而解碼混音音頻信號(hào)的參數(shù)解碼器,所述混音音頻信號(hào)表示第一音頻信號(hào)與第二音頻信號(hào)的組合,所述經(jīng)組合的編碼參數(shù)表示頻率特定編碼參數(shù)的組合,其特征在于,所述參數(shù)解碼器具有 變換器(201),用于變換所述混音音頻信號(hào)以獲得具有某一頻率的變換后的混音音頻信號(hào); 提供器(203),用于基于所述經(jīng)組合的編碼參數(shù)而提供與所述某一頻率相關(guān)聯(lián)的頻率特定編碼參數(shù);以及 音頻合成器(205),用于在所述某一頻率下由所述變換后的混音音頻信號(hào)及所述頻率特定編碼參數(shù)合成所述第一音頻信號(hào)與所述第二音頻信號(hào)。
12.根據(jù)權(quán)利要求11所述的參數(shù)解碼器,其特征在于,所述提供器(203)用于提供所述經(jīng)組合的編碼參數(shù),作為所述頻率特定編碼參數(shù)。
13.根據(jù)權(quán)利要求11或12所述的參數(shù)解碼器,其特征在于,其進(jìn)一步包括反變換器(207),用于反變換所述第一音頻信號(hào)和所述第二音頻信號(hào)。
14.一種用于以參數(shù)方式編碼具有第一音頻信號(hào)和第二音頻信號(hào)的多通道音頻信號(hào)的方法,其特征在于,所述方法包括 將所述第一音頻信號(hào)變換(301)到頻域中,以獲得第一變換后的音頻信號(hào),且將所述第二音頻信號(hào)變換到頻域中,以獲得第二變換后的音頻信號(hào); 在第一頻率下由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成(303)第一編碼參數(shù),且在第二頻率下由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成第二編碼參數(shù);以及 組合(305)所述第一編碼參數(shù)與所述第二編碼參數(shù)以獲得經(jīng)組合的編碼參數(shù)。
15.一種用于基于經(jīng)組合的編碼參數(shù)而以參數(shù)方式解碼混音音頻信號(hào)的方法,所述混音音頻信號(hào)表示第一音頻信號(hào)與第二音頻信號(hào)的組合,所述經(jīng)組合的編碼參數(shù)表示頻率特定編碼參數(shù)的組合,其特征在于,所述方法包括 變換(401)所述混音音頻信號(hào)以獲得具有某一頻率的變換后的混音音頻信號(hào); 基于所述經(jīng)組合的編碼參數(shù)而提供(403)與所述某一頻率相關(guān)聯(lián)的頻率特定編碼參數(shù);以及 在所述某一頻率下由所述變換后的的混音音頻信號(hào)及所述頻率特定編碼參數(shù)合成(405)所述第一音頻信號(hào)與所述第二音頻信號(hào)。
全文摘要
本發(fā)明涉及一種用于編碼具有第一音頻信號(hào)和第二音頻信號(hào)的多通道音頻信號(hào)的參數(shù)編碼器。所述參數(shù)編碼器具有變換器(101),用于將所述第一音頻信號(hào)變換到頻域中,以獲得第一變換后的音頻信號(hào),且用于將所述第二音頻信號(hào)變換到頻域中,以獲得第二變換后的音頻信號(hào);參數(shù)生成器(107),用于在第一頻率下由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成第一編碼參數(shù),且用于在第二頻率下由所述第一變換后的音頻信號(hào)及所述第二變換后的音頻信號(hào)生成第二編碼參數(shù);以及參數(shù)組合器(109),用于組合所述第一編碼參數(shù)與所述第二編碼參數(shù),以獲得經(jīng)組合的編碼參數(shù)。
文檔編號(hào)G10L19/02GK102844808SQ201080033764
公開日2012年12月26日 申請(qǐng)日期2010年11月3日 優(yōu)先權(quán)日2010年11月3日
發(fā)明者克里斯托弗·富勒, 苗磊, 郎玥, 許劍峰 申請(qǐng)人:華為技術(shù)有限公司