專利名稱:用于可伸縮聲道解碼的方法、介質(zhì)和設(shè)備的制作方法
用于可伸縮聲道解碼的方法、介質(zhì)和設(shè)備
本申請(qǐng)是向中國知識(shí)產(chǎn)權(quán)局提交的申請(qǐng)日為2007年I月11日的標(biāo)題為“用于可伸縮聲道解碼的方法、介質(zhì)和設(shè)備”的第200780002329. X號(hào)申請(qǐng)的分案申請(qǐng)。技術(shù)領(lǐng)域
本申請(qǐng)要求2006年I月11日提交到美國專利商標(biāo)局的第60/757,857號(hào)美國臨時(shí)專利申請(qǐng)、2006年I月17日提交到美國專利商標(biāo)局的第60/758,985號(hào)美國臨時(shí)專利申請(qǐng)、2006年I月18日提交到美國專利商標(biāo)局的第60/759,543號(hào)美國臨時(shí)專利申請(qǐng)、2006 年4月5日提交到美國專利商標(biāo)局的第60/789,147號(hào)美國臨時(shí)專利申請(qǐng)、2006年4月6日提交到美國專利商標(biāo)局的第60/789,601號(hào)美國臨時(shí)專利申請(qǐng)以及在2006年5月30日提交到韓國知識(shí)產(chǎn)權(quán)局的第10-2006-0049033號(hào)韓國專利申請(qǐng)的利益,這些申請(qǐng)全部公開于此以資參考。
本發(fā)明的一個(gè)或多個(gè)實(shí)施例涉及音頻解碼,更具體地講,涉及用于對(duì)多聲道信號(hào)進(jìn)行編碼/解碼的環(huán)繞音頻編碼。
背景技術(shù):
發(fā)明的公開
技術(shù)問題
多聲道音頻編碼可被分類為波形多聲道音頻編碼和參數(shù)多聲道音頻編碼。波形多聲道音頻編碼可被分類為運(yùn)動(dòng)圖像專家組(MPEG)-2MC音頻編碼、AAC MC音頻編碼和BSAC/ AVS MC音頻編碼,其中,對(duì)5聲道信號(hào)進(jìn)行編碼并對(duì)5聲道信號(hào)進(jìn)行解碼。參數(shù)多聲道音頻 編碼包括MPEG環(huán)繞編碼,其中,所述編碼方案從6或8多聲道產(chǎn)生I或2個(gè)編碼的聲道,然后從所述I或2個(gè)編碼的聲道解碼為所述6或8多聲道。這里的6或8多聲道只是這種多聲道環(huán)境的示例。
通常,在這種多聲道音頻編碼中,將從解碼器輸出的聲道的數(shù)量由編碼器固定。 例如,在MPEG環(huán)繞編碼中,編碼器可將6或8多聲道信號(hào)編碼為I或2個(gè)編碼的聲道,而解碼器必須將所述I或2個(gè)編碼的聲道解碼為6或8多聲道,S卩,由于編碼器對(duì)多聲道信號(hào)進(jìn)行編碼的分級(jí),在輸出任何具體聲道之前以相似的相反順序的分級(jí)對(duì)所有可用聲道進(jìn)行解碼。因此,如果在解碼器中將被用于再現(xiàn)的揚(yáng)聲器的數(shù)量和與揚(yáng)聲器的位置相應(yīng)的聲道配置與在編碼器中構(gòu)造的聲道的數(shù)量不同,則在解碼器的上混合(up mix)期間,聲音的質(zhì)量將會(huì)降低。
根據(jù)MPEG環(huán)繞規(guī)范,可通過下混合模塊的分級(jí)來對(duì)多聲道信號(hào)進(jìn)行編碼,所述下混合模塊可最終將多聲道信號(hào)順序地下混合為一個(gè)或兩個(gè)編碼的聲道。通過上混合模塊的相似的分級(jí)(樹結(jié)構(gòu)),所述一個(gè)或兩個(gè)編碼的聲道可被解碼為多聲道信號(hào)。這里,例如,上混合分級(jí)開始接收編碼的下混合信號(hào),并使用I至2(0TT)上混合模塊的結(jié)合,將編碼的下混合信號(hào)上混合為左前(FL)聲道、右前(FR)聲道、中央(C)聲道、低頻增強(qiáng)(LFE)聲道、左后(BL)聲道和右后(BR)聲道的多聲道信號(hào)。這里,可以用編碼器在對(duì)多聲道信號(hào)進(jìn)行編碼期間產(chǎn)生的聲道等級(jí)差(Channel Level Difference, CLD)和/或聲道間的相關(guān)性 (Inter-Channel Correlation, ICC)的空間信息(空間暗示)來實(shí)現(xiàn)OTT模塊的分級(jí)的上 混合,其中,CLD是關(guān)于多聲道中的預(yù)定聲道之間的能量比或差的信息,ICC是關(guān)于與輸入 的信號(hào)的時(shí)間/頻率瓦(tile)相應(yīng)的相關(guān)性或一致性的信息。利用各個(gè)CLD和ICC,每個(gè) 分級(jí)的OTT可將單個(gè)輸入信號(hào)上混合為通過每個(gè)分級(jí)的OTT的各個(gè)輸出信號(hào)。請(qǐng)參見作為 根據(jù)本發(fā)明實(shí)施例的分級(jí)的上混合樹結(jié)構(gòu)的示例的圖4到圖8。
因此,由于要求解碼器必須具有反映編碼器的分級(jí)的特定分級(jí)的結(jié)構(gòu),并且由于 下混合的傳統(tǒng)順序,難于基于解碼器中的將被用于再現(xiàn)的揚(yáng)聲器的數(shù)量和與揚(yáng)聲器的位置 對(duì)應(yīng)的相應(yīng)的聲道配置有選擇地對(duì)編碼的聲道進(jìn)行解碼。
技術(shù)方案
本發(fā)明的一個(gè)或多個(gè)實(shí)施例闡述了一種用于可伸縮聲道解碼的方法、介質(zhì)和設(shè) 備,其中,識(shí)別解碼器中聲道或揚(yáng)聲器的配置以對(duì)每個(gè)通過編碼器編碼的多聲道信號(hào)計(jì)算 將被解碼的等級(jí)的數(shù)量,并根據(jù)計(jì)算的等級(jí)的數(shù)量執(zhí)行解碼。
將在下面的描述中部分地闡述本發(fā)明的另外方面和/或優(yōu)點(diǎn),部分地,從下面的 描述中,這些方面和/或優(yōu)點(diǎn)將會(huì)清楚,或者通過實(shí)施本發(fā)明而被了解。
為了至少實(shí)現(xiàn)上述和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括用于可伸縮信道 解碼的方法,所述方法包括對(duì)于至少一個(gè)編碼的多聲道信號(hào)設(shè)置解碼等級(jí)的數(shù)量;根據(jù) 設(shè)置的解碼等級(jí)的數(shù)量來對(duì)所述至少一個(gè)編碼的多聲道信號(hào)執(zhí)行有選擇的解碼和上混合; 從而當(dāng)設(shè)置的解碼等級(jí)的數(shù)量被設(shè)置為表示解碼等級(jí)的全部數(shù)量時(shí),所述至少一個(gè)編碼的 多聲道信號(hào)的所有等級(jí)被解碼和上混合,當(dāng)設(shè)置的解碼等級(jí)的數(shù)量被設(shè)置為表示解碼等級(jí) 的數(shù)量不同于解碼等級(jí)的全部數(shù)量時(shí),并非所述至少一個(gè)編碼的多聲道信號(hào)的可用的所有 解碼等級(jí)被解碼和上混合。
為了至少實(shí)現(xiàn)上述和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括至少一種包括控 制至少一種處理部件以實(shí)現(xiàn)本發(fā)明實(shí)施例的計(jì)算機(jī)可讀代碼的介質(zhì)。
為了至少實(shí)現(xiàn)上述和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種用于可伸縮 聲道解碼的設(shè)備,所述設(shè)備包括等級(jí)設(shè)置單元,對(duì)于至少一個(gè)編碼的多聲道信號(hào)設(shè)置解碼 等級(jí)的數(shù)量;上混合單元,根據(jù)設(shè)置的解碼等級(jí)的數(shù)量來對(duì)所述至少一個(gè)編碼的多聲道信 號(hào)執(zhí)行有選擇的解碼和上混合;從而當(dāng)設(shè)置的解碼等級(jí)的數(shù)量被設(shè)置為表示解碼等級(jí)的全 部數(shù)量時(shí),所述至少一個(gè)編碼的多聲道信號(hào)的所有等級(jí)被解碼和上混合,當(dāng)設(shè)置的解碼等 級(jí)的數(shù)量被設(shè)置為表示解碼等級(jí)的數(shù)量不同于解碼等級(jí)的全部數(shù)量時(shí),并非所述至少一個(gè) 編碼的多聲道信號(hào)的可用的所有解碼等級(jí)被解碼和上混合。
為了至少實(shí)現(xiàn)上述和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種用于可伸縮 聲道解碼的方法,所述方法包括識(shí)別解碼器的聲道或揚(yáng)聲器的配置;有選擇地將至少一 個(gè)下混合的編碼的多聲道信號(hào)上混合為與識(shí)別的聲道或揚(yáng)聲器的配置相應(yīng)的多聲道信號(hào)。
為了至少實(shí)現(xiàn)上述和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種用于可伸縮 聲道解碼的方法,所述方法包括識(shí)別解碼器的聲道或揚(yáng)聲器的配置;基于識(shí)別的聲道或 揚(yáng)聲器的配置來設(shè)置使從至少一個(gè)下混合的編碼的多聲道信號(hào)上混合的各個(gè)上混合信號(hào) 通過的模塊的數(shù)量;根據(jù)設(shè)置的模塊的數(shù)量來對(duì)所述至少一個(gè)下混合的編碼的多聲道信號(hào) 進(jìn)行有選擇的解碼和上混合。
為了至少實(shí)現(xiàn)上述和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種用于可伸縮 聲道解碼的方法,所述方法包括識(shí)別解碼器的聲道或揚(yáng)聲器的配置;基于通過解碼器再 現(xiàn)聲道的可用性來確定是否對(duì)由至少一個(gè)下混合的編碼的多聲道信號(hào)表示的多個(gè)聲道的 聲道進(jìn)行解碼;確定除了由確定是否對(duì)聲道進(jìn)行解碼的步驟被確定為不被解碼的多聲道之 外是否存在將以相同路徑被解碼的多聲道;根據(jù)確定除了被確定為不被解碼的多聲道之外 是否存在以相同路徑被解碼的多聲道的步驟,計(jì)算每個(gè)多聲道信號(hào)必須通過的解碼和上混 合模塊的數(shù)量;根據(jù)計(jì)算的解碼和上混合模塊的數(shù)量來執(zhí)行有選擇的解碼和上混合。
有益效果
從下面結(jié)合附圖對(duì)實(shí)施例的描述中,本發(fā)明的這些和/或其他方面和優(yōu)點(diǎn)將變得 清楚,并更容易理解,其中
圖1示出根據(jù)本發(fā)明實(shí)施例的多聲道解碼方法;
圖2示出根據(jù)本發(fā)明實(shí)施例的用于可伸縮解碼的設(shè)備;
圖3示出根據(jù)本發(fā)明實(shí)施例的5-2-5樹結(jié)構(gòu)和任意樹結(jié)構(gòu)的復(fù)雜結(jié)構(gòu);
圖4示出根據(jù)本發(fā)明實(shí)施例的用于解釋用于可伸縮聲道解碼的方法、介質(zhì)和設(shè)備 的預(yù)定的樹結(jié)構(gòu);
圖5示出根據(jù)本發(fā)明實(shí)施例的在5-1-51樹結(jié)構(gòu)中輸出的4聲道;
圖6示出根據(jù)本發(fā)明實(shí)施例的在5-1-52樹結(jié)構(gòu)中輸出的4聲道;
圖7示出根據(jù)本發(fā)明實(shí)施例的在5-1-51樹結(jié)構(gòu)中輸出的3聲道;
圖8示出根據(jù)本發(fā)明實(shí)施例的在5-1-52樹結(jié)構(gòu)中輸出的3聲道;
圖9示出使用根據(jù)本發(fā)明實(shí)施例的用于可伸縮聲道解碼的方法、介質(zhì)和設(shè)備來設(shè) 置Treesign(v,)的偽代碼;
圖10示出使用根據(jù)本發(fā)明實(shí)施例的用于可伸縮聲道解碼的方法、介質(zhì)和設(shè)備去 除與不必要的模塊相應(yīng)的矩陣或向量的元素的偽代碼。
最佳方式
發(fā)明的方式
現(xiàn)在將對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)描述,本發(fā)明的示例在附圖中示出,其中,相同的 標(biāo)號(hào)始終表示相同的部件。下面將參照附圖來描述實(shí)施例以解釋本發(fā)明。
圖1示出根據(jù)本發(fā)明實(shí)施例的多聲道解碼方法。
首先,在操作100中,解析從編碼器發(fā)送的環(huán)繞比特流以提取空間暗示和附加信 息。在操作103,識(shí)別在解碼器中提供的聲道或揚(yáng)聲器的配置。這里,解碼器中多聲道的配 置對(duì)應(yīng)于包括在解碼器中/可用于解碼器的揚(yáng)聲器的數(shù)量(下面稱作“numPlayChan”)、 包括在解碼器中/可用于解碼器的揚(yáng)聲器中的可操作揚(yáng)聲器的位置(下面被稱作 iiPlayChanPos(Ch) ”)和指示在編碼器中編碼的聲道是否可用于在解碼器中提供的多聲道 的向量(下面稱作“bPlaySpk(ch) ”)。
這里,例如,在下面所述的等式I中,bPlaySpk(ch)使用“I”表示在編碼器中編碼 的聲道中可用于解碼器中提供的多聲道的揚(yáng)聲器,使用“O”表示不可用于所述多聲道的揚(yáng)聲器。
等式1:
權(quán)利要求
1.一種用于可伸縮聲道解碼的設(shè)備,所述設(shè)備包括 配置識(shí)別單元,識(shí)別聲道或揚(yáng)聲器的配置; 等級(jí)設(shè)置單元,考慮識(shí)別的聲道或揚(yáng)聲器的配置來確定下混合的信號(hào)必須通過的模塊的數(shù)量; 上混合單元,根據(jù)確定的模塊的數(shù)量來對(duì)下混合的信號(hào)執(zhí)行有選擇的解碼和上混合,以產(chǎn)生多聲道信號(hào)。
全文摘要
一種用于可伸縮性聲道解碼的方法、介質(zhì)和設(shè)備。所述方法包括識(shí)別聲道或揚(yáng)聲器的配置;使用識(shí)別的聲道或揚(yáng)聲器的配置來對(duì)每個(gè)多聲道信號(hào)計(jì)算解碼等級(jí)的數(shù)量;根據(jù)計(jì)算的解碼等級(jí)的數(shù)量來執(zhí)行解碼和上混合。
文檔編號(hào)G10L19/00GK103021417SQ20121045882
公開日2013年4月3日 申請(qǐng)日期2007年1月11日 優(yōu)先權(quán)日2006年1月11日
發(fā)明者金重會(huì), 吳殷美, 苗磊 申請(qǐng)人:三星電子株式會(huì)社