用于處理音頻信號(hào)的方法和裝置的制作方法

文檔序號(hào)：7942032閱讀：222來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：用于處理音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于處理音頻信號(hào)的裝置及其方法。雖然本發(fā)明適用于大范圍的應(yīng) 用，但是特別適合于處理經(jīng)由數(shù)字媒體、廣播信號(hào)等等接收到的音頻信號(hào)。
背景技術(shù)：
通常，在用于將多個(gè)對(duì)象下混合為單音或者立體聲信號(hào)的過(guò)程中，分別從對(duì)象信號(hào)中提取參數(shù)。這些參數(shù)可用于解碼器。對(duì)象的每一個(gè)的搖擺(panning)和增益是可通過(guò) 用戶(hù)選擇控制的。

發(fā)明內(nèi)容
技術(shù)問(wèn)題然而，為了控制每個(gè)對(duì)象信號(hào)，應(yīng)當(dāng)適當(dāng)?shù)囟ㄎ换驌u擺包含在下混合中的每個(gè)源。另外，為了提供根據(jù)面向聲道的解碼方案的向后兼容，對(duì)象參數(shù)應(yīng)當(dāng)被轉(zhuǎn)換成用于上混合的多聲道參數(shù)。因此，本發(fā)明針對(duì)一種用于處理音頻信號(hào)的裝置及其方法，其基本上消除了由于現(xiàn)有技術(shù)的限制和缺點(diǎn)而導(dǎo)致的一個(gè)或多個(gè)問(wèn)題。本發(fā)明的目的在于提供一種用于處理音頻信號(hào)的裝置及其方法，通過(guò)該裝置和方法，可以通過(guò)控制對(duì)象的增益和搖擺來(lái)輸出單音信號(hào)、立體聲信號(hào)和多聲道信號(hào)。本發(fā)明的另一個(gè)目的在于提供一種用于處理音頻信號(hào)的裝置及其方法，通過(guò)該裝置和方法，可以在不執(zhí)行多聲道解碼器的復(fù)雜的方案的情況下，從下混合信號(hào)中輸出單音信號(hào)和立體聲信號(hào)。本發(fā)明的又一個(gè)目的在于提供一種用于處理音頻信號(hào)的裝置及其方法，通過(guò)該方法和裝置，可以在以相當(dāng)大的寬度調(diào)整有聲或者背景音樂(lè)的增益的情況下，防止聲音質(zhì)量的失真。有益效果因此，本發(fā)明提供以下的效果或者優(yōu)點(diǎn)。第一，本發(fā)明能夠在沒(méi)有限制的情況下控制對(duì)象的增益和搖擺。第二，本發(fā)明能夠基于用戶(hù)選擇來(lái)控制對(duì)象的增益和搖擺。第三，在輸出模式是單音或者立體聲的情況下，本發(fā)明在不執(zhí)行多聲道解碼器的復(fù)雜的方案的情況下生成輸出信號(hào)，從而便利實(shí)現(xiàn)和降低復(fù)雜度。第四，在為諸如移動(dòng)設(shè)備的設(shè)備提供一個(gè)或者兩個(gè)揚(yáng)聲器的情況下，本發(fā)明能夠在不需要處理多聲道解碼器的編解碼器的情況下控制用下混合信號(hào)的對(duì)象的增益和搖擺。第五，在有聲或者背景音樂(lè)被完全地抑制的情況下，本發(fā)明能夠根據(jù)增益調(diào)整來(lái) 防止聲音質(zhì)量的失真。第六，在諸如聲樂(lè)等的至少兩個(gè)單獨(dú)立對(duì)象(立體聲聲道或者若干有聲信號(hào))存在的情況下，本發(fā)明能夠根據(jù)增益調(diào)整來(lái)防止聲音質(zhì)量的失真。

附圖被包括進(jìn)來(lái)以提供對(duì)本發(fā)明的進(jìn)一步理解，并且并入和構(gòu)成本說(shuō)明書(shū)的一部分，附示了本發(fā)明的實(shí)施例，并且與描述一起用于可以解釋本發(fā)明原理。在附圖中圖1是根據(jù)用于生成單音/立體聲信號(hào)的本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置的框圖；圖2是用于在圖1中示出的下混合處理單元的第一示例的詳細(xì)框圖；圖3是用于在圖1中示出的下混合處理單元的第二示例的詳細(xì)框圖；圖4是根據(jù)用于生成雙聲道信號(hào)的本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置框圖；圖5是在圖4中示出的下混合處理單元的詳細(xì)框圖；圖6是根據(jù)用于生成雙聲道聲道的本發(fā)明的另一個(gè)實(shí)施例的用于處理音頻信號(hào) 的裝置的框圖；圖7是根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置的框圖；圖8是用于根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的另一個(gè)實(shí)施例來(lái)處理音頻信號(hào)的裝置的框圖；圖9是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第一實(shí)施例的用于處理音頻信號(hào)的裝置的框圖；圖10是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第二實(shí)施例的用于處理音頻信號(hào)的裝置的框圖；以及圖11和圖12是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第三實(shí)施例的用于處理音頻信號(hào)的裝置的框圖。最佳方式本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的描述中進(jìn)行闡述，并且從該描述中在某種程度上將是清晰可見(jiàn)的，或者可以通過(guò)實(shí)踐本發(fā)明來(lái)習(xí)得?？梢酝ㄟ^(guò)在撰寫(xiě)的說(shuō)明書(shū)及其權(quán) 利要求以及所附的附圖中所具體指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得本發(fā)明的目的和其他的優(yōu)點(diǎn)。為了實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的，如在實(shí)施和廣泛描述的，根據(jù)本發(fā)明的一種處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)和在生成下混合信號(hào)時(shí)提取的對(duì)象信息；接收用于控制對(duì)象信號(hào)的混合信息；根據(jù)輸出模式使用對(duì)象信息和混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及如果生成了下混合處理信息，則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào)，其中，下混合信號(hào)和輸出信號(hào)與單音信號(hào)相對(duì)應(yīng)，并且其中，多聲道信息與用于將下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。根據(jù)本發(fā)明，下混合信號(hào)和輸出信號(hào)與在時(shí)間域上的信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明，生成輸出信號(hào)包括通過(guò)分解下混合信號(hào)來(lái)生成子帶信號(hào)；使用下混合處理信息來(lái)處理子帶信號(hào)；以及通過(guò)合成子帶信號(hào)來(lái)生成輸出信號(hào)。根據(jù)本發(fā)明，輸出信號(hào)包括通過(guò)去相關(guān)下混合信號(hào)所生成的信號(hào)。
根據(jù)本發(fā)明，該方法進(jìn)一步包括如果生成多聲道信息，則通過(guò)使用多聲道信息對(duì) 下混合信號(hào)進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。根據(jù)本發(fā)明，根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定輸出模式，并且揚(yáng)聲器聲道數(shù)目基于設(shè) 備信息和混合信息中的一個(gè)。根據(jù)本發(fā)明，混合信息基于對(duì)象位置信息、對(duì)象增益信息和回放配置信息中的至少一個(gè)來(lái)生成。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，一種用于處理音頻信號(hào)的裝置，包括多路分解器，該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)和在下混合信號(hào)生成時(shí)提取的對(duì)象信息；信息生成單元，該信息生成單元根據(jù)輸出模式使用對(duì)象信息和用于控制對(duì)象信號(hào)的混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及下混合處理單元，如果生成下混合處理信息，則該下混合處理單元通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào)，其中，下混合信號(hào)和輸出信號(hào)與單音信號(hào)相對(duì)應(yīng)，并且其中，多聲道信息與用于將下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。根據(jù)本發(fā)明，該下混合處理單元包括子帶分解單元，該子帶分解單元通過(guò)分解下混合信號(hào)來(lái)生成子帶信號(hào)；M2M處理單元，該M2M處理單元使用下混合處理信息來(lái)處理子帶信號(hào)；以及子帶合成單元，該子帶合成單元通過(guò)合成子帶信號(hào)來(lái)生成輸出信號(hào)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，根據(jù)本發(fā)明的一種處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)和在下混合信號(hào)生成時(shí)提取的對(duì)象信息；接收用于控制對(duì)象信號(hào)的混合信息；根據(jù)輸出模式使用對(duì)象信息和混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及如果生成了下混合處理信息，則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào)，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)所生成的立體聲信號(hào)相對(duì) 應(yīng)，并且其中，多聲道信息與用于將下混合信號(hào)上混合為多聲道信號(hào)的信息相對(duì)應(yīng)。根據(jù)本發(fā)明，下混合信號(hào)和輸出信號(hào)與在時(shí)間域上的信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明，生成輸出信號(hào)包括通過(guò)分解下混合信號(hào)來(lái)生成子帶信號(hào)；通過(guò)使用下混合處理信息處理該子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào)；以及通過(guò)合成兩個(gè)子帶信號(hào)來(lái)分別生成輸出信號(hào)。根據(jù)本發(fā)明，生成兩個(gè)子帶信號(hào)包括通過(guò)去相關(guān)子帶信號(hào)來(lái)生成去相關(guān)的信號(hào)；以及通過(guò)使用下混合處理信息處理去相關(guān)的信號(hào)和該子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào)。根據(jù)本發(fā)明，該下混合處理信息包括雙聲道參數(shù)和與雙聲道信號(hào)相對(duì)應(yīng)的輸出信號(hào)。根據(jù)本發(fā)明，該方法進(jìn)一步包括如果生成了多聲道信息，則通過(guò)使用多聲道信息對(duì)下混合信號(hào)進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。根據(jù)本發(fā)明，根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定輸出模式，并且揚(yáng)聲器聲道數(shù)目基于設(shè) 備信息和混合信息中的一個(gè)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，一種用于處理音頻信號(hào)的裝置，包括多路分解器，該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)、時(shí)間域下混合信號(hào)和在生成下混合信號(hào)時(shí)提取的對(duì)象信息；信息生成單元，該信息生成單元根據(jù)輸出模式使用用于控制對(duì)象信號(hào)的混合信息和對(duì)象信息來(lái)生成下混合處理信息和
6多聲道信息中的一個(gè)；以及下混合處理單元，如果生成下混合處理信息，則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào)，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng)，并且其中，多聲道信息與用于將下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，根據(jù)本發(fā)明的一種處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信號(hào)時(shí)提取的對(duì)象信息；接收包括模式選擇信息的混合信息，該混合信息用于控制對(duì)象信號(hào)；基于模式選擇信息繞過(guò)下混合信號(hào)或者從下混合信號(hào)中提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì) 象；以及如果該下混合信號(hào)被繞過(guò)，則使用該對(duì)象信息和該混合信息來(lái)生成多聲道信息，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，并且其中，該模式選擇信息包括指示模式的哪一個(gè)的信息，模式包括正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。根據(jù)本發(fā)明，該方法進(jìn)一步包括接收增強(qiáng)的對(duì)象信息，其中，使用增強(qiáng)的對(duì)象信息從下混合信號(hào)中提取至少一個(gè)獨(dú)立對(duì)象。根據(jù)本發(fā)明，該增強(qiáng)的對(duì)象信息與殘差信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明，至少一個(gè)獨(dú)立對(duì)象與基于對(duì)象的信號(hào)相對(duì)應(yīng)，并且該背景對(duì)象與單音信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明，如果模式選擇模式與正常模式相對(duì)應(yīng)，則生成立體聲輸出信號(hào)。并且，如果模式選擇模式與用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式中的一個(gè)相對(duì)應(yīng)，則提取該背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象。根據(jù)本發(fā)明，該方法進(jìn)一步包括如果從該下混合信號(hào)中提取該背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象，則生成用于控制該背景對(duì)象的第一多聲道信息和用于控制至少一個(gè)獨(dú)立對(duì) 象的第二多聲道信息中的至少一個(gè)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，一種用于處理音頻信號(hào)的裝置，包括多路分解器，該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信號(hào)時(shí)提取的對(duì)象信息；對(duì)象代碼轉(zhuǎn)換器，該對(duì)象代碼轉(zhuǎn)換器基于包括在用于控制對(duì)象信號(hào)的混合信息中的模式選擇信息來(lái)繞過(guò)下混合信號(hào)，或者從下混合信號(hào)提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象；以及多聲道解碼器，如果繞過(guò)該下混合信號(hào)，則使用對(duì)象信息和混合信息來(lái)生成多聲道信息，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，輸出信號(hào) 與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)來(lái)生成的立體聲信號(hào)相對(duì)應(yīng)，并且其中，該模式選擇信息包括指示模式的哪一個(gè)的信息，模式包括正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，根據(jù)本發(fā)明的一種處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信號(hào)時(shí)提取的對(duì)象信息；接收包括模式選擇信息的混合信息，該混合信息用于控制該對(duì)象信號(hào)；以及使用下混合信號(hào)來(lái)生成立體聲輸出信號(hào)，或者基于模式選擇信息來(lái)從下混合信號(hào) 中提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，該立體聲輸出信號(hào)與包括通過(guò)去相關(guān)下混合信號(hào)生成的信號(hào)的時(shí)域信號(hào)相對(duì)應(yīng)，并且其中，該模式選擇信息包括指示模式的哪一個(gè)的信息，模式包括標(biāo)正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。
7
根據(jù)本發(fā)明，該方法進(jìn)一步包括接收增強(qiáng)的對(duì)象信息，其中，至少一個(gè)獨(dú)立對(duì)象使用增強(qiáng)的對(duì)象信息從下混合信號(hào)中進(jìn)行提取。根據(jù)本發(fā)明，該增強(qiáng)的對(duì)象信息與殘差信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明，至少一個(gè)獨(dú)立對(duì)象與基于對(duì)象的信號(hào)相對(duì)應(yīng)，并且該背景對(duì)象與單音信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明，如果模式選擇模式與正常模式相對(duì)應(yīng)，則生成該立體聲輸出信號(hào)。并且，如果模式選擇模式與用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式中的一個(gè)相對(duì)應(yīng)，則提取該背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象。根據(jù)本發(fā)明，該方法進(jìn)一步包括如果從下混合信號(hào)中提取該背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象，則生成用于控制該背景對(duì)象的第一多聲道信息和用于控制至少一個(gè)獨(dú)立對(duì)象的第二多聲道信息中的至少一個(gè)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)，并且根據(jù)本發(fā)明的目的，一種用于處理音頻信號(hào)的裝置，包括多路分解器，該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信號(hào)時(shí)提取的對(duì)象信息；以及對(duì)象代碼轉(zhuǎn)換器，該對(duì)象代碼轉(zhuǎn)換器使用下混合信號(hào)來(lái)生成立體聲輸出信號(hào)，或者基于包括在用于控制該對(duì)象信號(hào)的混合信息中的模式選擇信息來(lái)從該下混合信號(hào)中提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，該立體聲輸出信號(hào)與包括通過(guò)去相關(guān)下混合信號(hào)生成的信號(hào)的時(shí) 域信號(hào)相對(duì)應(yīng)，并且其中，該模式選擇信息包括指示模式的哪一個(gè)的信息相對(duì)應(yīng)，模式包括正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。應(yīng)該明白，上文的概述和下面的詳細(xì)描述是示例性和說(shuō)明性的，并且希望提供要求保護(hù)的本發(fā)明的進(jìn)一步說(shuō)明。
具體實(shí)施例方式現(xiàn)在將對(duì)本發(fā)明的優(yōu)選實(shí)施例詳細(xì)地進(jìn)行參考，其示例在附圖中進(jìn)行圖示。首先，本發(fā)明中的術(shù)語(yǔ)可以被解釋為以下的引用。并且，在本說(shuō)明書(shū)中沒(méi)有公開(kāi)的術(shù)語(yǔ)可以被解釋為匹配本發(fā)明的技術(shù)想法的以下的含義和概念。特定地，在本公開(kāi)中的“信息”是通常包括值、參數(shù)、系數(shù)、要素等的術(shù)語(yǔ)，并且其含義可以被認(rèn)為偶爾地不同，本發(fā)明不受此限制。對(duì)象具有包括基于對(duì)象的信號(hào)和基于聲道的信號(hào)二者的概念。有時(shí)，對(duì)象可以?xún)H 包括基于對(duì)象的信號(hào)。在接收到單音下混合信號(hào)的情況下，本發(fā)明意在描述用于處理單音下混合信號(hào)的各種過(guò)程。首先，如果有必要將參考圖1至圖3來(lái)解釋從單音下混合信號(hào)生成單音/立體聲信號(hào)或者多個(gè)聲道信號(hào)的方法。第二，將參考圖4至圖6來(lái)解釋從單音下混合信號(hào)(或者立體聲下混合信號(hào))生成雙聲道信號(hào)的方法。第三，將參考圖7至圖12來(lái)解釋用于控制包含在單音下混合中的獨(dú)立對(duì)象信號(hào)(或者單音背景信號(hào))的方法的各種實(shí)施例。1.單音/立體聲信號(hào)的生成圖1是根據(jù)用于生成單音/立體聲信號(hào)的本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置的框圖。參考圖1，根據(jù)本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置100包括多路分解器110、信息生成單元120和下混合處理單元130。該音頻信號(hào)處理裝置100可以進(jìn)一步包括多聲道解碼器140。多路分解器110經(jīng)由比特流來(lái)接收對(duì)象信息(OI)。該對(duì)象信息(OI)是關(guān)于包含在下混合信號(hào)內(nèi)的對(duì)象的信息，并且能夠包括對(duì)象水平信息、對(duì)象相關(guān)信息等。該對(duì)象信息 (OI)能夠包含對(duì)象參數(shù)(OP)，該對(duì)象參數(shù)(OP)是指示對(duì)象特性的參數(shù)。比特流進(jìn)一步包含下混合信號(hào)(DMX)。該多路分解器110能夠進(jìn)一步從該比特流中提取下混合信號(hào)(DMX)。該下混合信號(hào)(DMX)是從下混合至少一個(gè)對(duì)象信號(hào)生成的信號(hào)，并且可以與在時(shí)間域上的信號(hào)相對(duì)應(yīng)。該下混合信號(hào)(DMX)可以是單音信號(hào)或者立體聲信號(hào)。在本實(shí)施例中，該下混合信號(hào)(DMX)可以是例如單音信號(hào)。信息生成單元120從多路分解器110接收對(duì)象信息(OI)。該信息生成單元120從用戶(hù)接口接收混合信息(MXT)。該信息生成單元120從用戶(hù)接口或者設(shè)備接收輸出模式信息(OM)。該信息生成單元120能夠進(jìn)一步從HRTF DB接收HRTF (報(bào)頭相關(guān)的傳送功能)參數(shù)。在該情況下，混合信息(MXI)是基于對(duì)象位置信息、對(duì)象增益信息、回放配置信息等生成的信息。對(duì)象位置信息是使用戶(hù)控制每個(gè)對(duì)象的位置或者搖擺而輸入的信息。對(duì)象增益信息是使用戶(hù)控制每個(gè)對(duì)象的增益而輸入的信息。特定地，對(duì)象位置信息或者對(duì)象增益信息可以是從預(yù)設(shè)置的模式選擇的一個(gè)。在該情況下，預(yù)設(shè)置的模式是隨著時(shí)間的推移用于預(yù)設(shè)置對(duì)象的特定增益或者位置的值。該預(yù)設(shè)置模式信息可以是從另一個(gè)設(shè)備接收到的值或者存儲(chǔ)在設(shè)備中的值。同時(shí)，從至少一個(gè)或多個(gè)預(yù)設(shè)置模式(例如，未使用的預(yù)設(shè)置模式、預(yù)設(shè)置模式1、預(yù)設(shè)置模式2等)選擇一個(gè)可以通過(guò)用戶(hù)輸入來(lái)確定。回放配置信息是包含揚(yáng)聲器數(shù)目、揚(yáng)聲器位置、環(huán)境信息(揚(yáng)聲器的虛擬位置)等的信息?；胤排渲眯畔⒖梢杂捎脩?hù)輸入、可以預(yù)先存儲(chǔ)或者可以從另一個(gè)設(shè)備接收。輸出模式信息(OM)是關(guān)于輸出模式的信息。例如，該輸出模式信息(OM)可以包括指示多少信號(hào)用于輸出的信息。指示多少信號(hào)用于輸出的該信息可以與單音輸出模式、立體聲輸出模式、多聲道輸出模式等中的一個(gè)相對(duì)應(yīng)。同時(shí)，該輸出模式信息(OM)可以與混合信息(MXI)的揚(yáng)聲器的數(shù)目相同。如果預(yù)先存儲(chǔ)該輸出模式信息(OM)，則它基于設(shè)備信息。如果該輸出模式信息(OM)由用戶(hù)輸入，則它基于用戶(hù)輸入信息。在該情況下，該用戶(hù)輸入信息可以被包括在混合信息(MXI)中。信息生成單元120根據(jù)輸出模式使用對(duì)象信息(OI)和混合信息(MXI)來(lái)生成下混合處理信息(DPI)和多聲道信息(MI)中的一個(gè)。在該情況下，輸出模式基于以上解釋的輸出模式信息(OM)。如果輸出模式是單音輸出或者立體聲信號(hào)，則信息生成單元120生成下混合處理信息(DPI)。如果輸出模式是多聲道輸出，則信息生成單元120生成多聲道信息 (Ml)。在該情況下，下混合處理信息(DPI)是用于處理下混合信號(hào)(DMX)的信息，稍后將解釋其細(xì)節(jié)。該多聲道信息(MI)是用于對(duì)下混合信號(hào)(DMX)進(jìn)行上混合的信息，并且能夠包括聲道水平信息、聲道相關(guān)信息等。如果輸出模式是單音輸出或者立體聲輸出，則僅生成該下混合處理信息(DPI)。這是因?yàn)橄禄旌咸幚韱卧?30能夠生成時(shí)域單音信號(hào)或者時(shí)域立體聲信號(hào)。同時(shí)，如果輸出模式是多聲道輸出，則生成多聲道信息(Ml)。這是因?yàn)樵谳斎胄盘?hào)是單音信號(hào)的情況下多聲道解碼器140可以生成多聲道信號(hào)。
9
下混合處理單元130使用下混合處理信息(DPI)和單音下混合(DMX)來(lái)生成單音輸出信號(hào)或者立體聲輸出信號(hào)。在該情況下，下混合處理信息(DPI)是用于處理下混合信號(hào)(DMX)的信息，并且將控制包含在下混合信號(hào)中對(duì)象的增益和/或搖擺。同時(shí)，單音輸出信號(hào)或者立體聲輸出信號(hào)與時(shí)域信號(hào)相對(duì)應(yīng)，并且可以包括PCM 信號(hào)。在單音輸出信號(hào)的情況下，將參考圖2來(lái)解釋下混合處理單元130的詳細(xì)配置。在立體聲輸出信號(hào)的情況下，將參考圖3來(lái)解釋下混合處理單元130的詳細(xì)配置。此外，下混合處理信息(DPI)可以包括雙聲道參數(shù)。在該情況下，該雙聲道參數(shù)是用于3D效果的參數(shù)，并且可以是由信息成生單元120使用對(duì)象信息(01)、混合信息(MXI) 和HRTF參數(shù)成生的信息。在下混合處理信息(DPI)包括雙聲道參數(shù)的情況下，下混合處理單元130能夠輸出雙聲道信號(hào)。稍后將參考圖4至圖6來(lái)詳細(xì)解釋用于生成雙聲道信號(hào)的實(shí)施例。如果接收到立體聲下混合信號(hào)而不是單音下混合信號(hào)[在該圖中未示出]，則僅執(zhí)行用于修改下混合信號(hào)的串音干擾(crosstalk)的處理，而不生成時(shí)域輸出信號(hào)。該處理的下混合信號(hào)可以再次由多聲道解碼器140來(lái)進(jìn)行處理。但是，本發(fā)明不受該處理的限制。如果輸出模式是多聲道輸出模式，則多聲道解碼器140通過(guò)使用多聲道信息對(duì)下混合(DMX)進(jìn)行上混合來(lái)生成多聲道信號(hào)。該多聲道解碼器140可以根據(jù)MPEG環(huán)繞(IS)/ IEC 23003-1)的標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)，本發(fā)明不受此限制。圖2是用于在圖1示出的下混合處理單元的第一示例的詳細(xì)框圖，這是用于生成單音輸出信號(hào)的實(shí)施例。圖3是用于在圖1示出的下混合處理單元的第二示例的詳細(xì)框圖，這是用于生成立體聲輸出信號(hào)的示例。參考圖2，下混合處理單元130A包括子帶分解單元132A、M2M處理單元134A和子帶合成單元136A。該下混合處理單元130A從單音下混合信號(hào)生成單音輸出信號(hào)。該子帶分解單元132A通過(guò)分解單音下混合信號(hào)(DMX)來(lái)生成子帶信號(hào)。子帶分解單元132A被實(shí)現(xiàn)有混合濾波器組，并且子帶信號(hào)可以與在混合QMF域上的信號(hào)相對(duì)應(yīng)。 M2M處理單元134A使用下混合處理信息(DPI)來(lái)處理子帶信號(hào)。在該情況下，M2M是單音到單音的縮寫(xiě)。M2M處理單元134A能夠使用去相關(guān)器來(lái)處理子帶信號(hào)。子帶合成單元136A 通過(guò)合成處理的子帶信號(hào)來(lái)生成時(shí)域單音輸出信號(hào)。另外，該子帶合成單元136A可以被實(shí) 現(xiàn)有混合濾波器組。參考圖3，下混合處理單元132B包括子帶分解單元132B、M2S處理單元134B、第一子帶合成單元136B和第二子帶合成單元138B。下混合處理單元130B接收單音下混合信號(hào)，并且然后生成立體聲輸出。類(lèi)似在圖2中示出的先前的子帶分解單元132A，該子帶分解單元132B通過(guò)分解單音下混合信號(hào)(DMX)來(lái)生成子帶信號(hào)。同樣地，該子帶分解單元132B可以被實(shí)現(xiàn)有混合濾波器組。該M2S處理單元134B通過(guò)使用下混合處理信息(DPI)和去相關(guān)器135B處理子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào)(第一子帶信號(hào)和第二子帶信號(hào))。在該情況下，M2S是單音到立體聲的縮寫(xiě)。如果使用去相關(guān)器135B，則能夠通過(guò)降低在左聲道和右聲道之間的相關(guān)性來(lái) 提高立體聲效果。
同時(shí)，去相關(guān)器135B將從子帶分解單元132B輸入的子帶信號(hào)設(shè)置為第一子帶信號(hào)，并且然后能夠輸出作為第二子帶信號(hào)的通過(guò)去相關(guān)第一子帶信號(hào)生成的信號(hào)，本發(fā)明不受此限制。第一子帶合成單元136B合成第一子帶信號(hào)，并且第二子帶合成單元138B合成第二子帶信號(hào)，由此生成時(shí)域立體聲輸出信號(hào)。因此，在輸入單音下混合的情況下，在以上的描述中解釋了經(jīng)由下混合處理單元來(lái)輸出單音/立體聲輸出的實(shí)施例。在以下的描述中，解釋生成雙聲道信號(hào)的情況。2.雙聲道信號(hào)的生成圖4是根據(jù)用于生成雙聲道信號(hào)的本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置的框圖。圖5是在圖4中示出的下混合處理單元的詳細(xì)框圖。圖6是根據(jù)用于生成雙聲道信號(hào)的本發(fā)明的另一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置框圖。參考圖4和圖5，解釋了用于生成雙聲道信號(hào)的一個(gè)實(shí)施例。參考圖6，解釋了用于生成雙聲道信號(hào)的另一個(gè)實(shí)施例。參考圖4，音頻信號(hào)處理裝置200包括多路分解器210、信息生成單元220和下混合處理單元230。在該情況下，類(lèi)似參考圖1描述的先前的多路分解器110，該多路分解器 210從比特流中提取對(duì)象信息(OI)，并且能夠從比特流中進(jìn)一步提取下混合(DMX)。在該情況下，該下混合信號(hào)可以是單音信號(hào)或者立體聲信號(hào)。信息生成單元220使用對(duì)象信息(OI)、混合信息(MXI)和HRTF信息來(lái)生成包含雙聲道參數(shù)的下混合處理信息。在該情況下，該HRTF信息可以是從HRTF DB提取的信息。并且，雙聲道參數(shù)是用于帶來(lái)虛擬3D效果的參數(shù)。下混合處理單元230使用包括雙聲道參數(shù)的下混合處理信息(DPI)來(lái)輸出雙聲道信號(hào)。參考圖5來(lái)解釋下混合處理單元230的詳細(xì)配置。參考圖5，下混合處理單元230A包括子帶分解單元232A、雙聲道處理單元234A和子帶合成單元236A。該子帶分解單元232A通過(guò)分解下混合信號(hào)來(lái)生成一個(gè)或者兩個(gè)子帶信號(hào)。該雙聲道處理單元234A使用包含雙聲道參數(shù)的下混合處理信息(DPI)來(lái)處理一個(gè) 或者兩個(gè)子帶信號(hào)。該子帶合成單元236A通過(guò)合成一個(gè)或者兩個(gè)子帶信號(hào)來(lái)生成時(shí)域雙聲道輸出信號(hào)。參考圖6，音頻信號(hào)處理裝置300包括多路分解器310和信息生成單元320。音頻信號(hào)處理裝置300可以進(jìn)一步包括多聲道解碼器330。多路分解器310從比特流中提取對(duì)象信息(OI)，并且能夠從比特流中進(jìn)一步提取下混合信號(hào)(DMX)。信息生成單元320使用對(duì)象信息(OI)和混合信息(MXI)來(lái)生成多聲道信息(Ml)。在該情況下，該多聲道信息(MI)是用于對(duì)該下混合信號(hào)(DMX)進(jìn)行上混合的信息，并且包括諸如聲道水平信息和聲道相關(guān)信息的空間參數(shù)。信息生成單元320使用從HRTF DB提取的HRTF參數(shù)來(lái)生成雙聲道參數(shù)。雙聲道參數(shù)是用于帶來(lái)3D效果的參數(shù)，并且可以包括HRTF參數(shù)本身。雙聲道參數(shù)是非時(shí)變性值，并且可以具有動(dòng)態(tài)特性。如果下混合信號(hào)是單音信號(hào)，則多聲道信息(MI)可以進(jìn)一步包括增益信息 (ADG)。在該情況下，增益信息(ADG)是用于調(diào)整下混合增益的參數(shù)，并且在控制用于特定對(duì)象的增益中是可使用的。在雙聲道輸出的情況下，對(duì)對(duì)象進(jìn)行上采樣或者下采樣是必要的。優(yōu)選地使用增益信息(ADG)。如果多聲道解碼器330遵循MPS環(huán)繞標(biāo)準(zhǔn)，并且多聲道信
11息(MI)需要根據(jù)MPEG環(huán)繞句法來(lái)進(jìn)行配置，則能夠通過(guò)設(shè)置‘bsArbitraryDownmix = 1，使用增益信息(ADG)。如果下混合信號(hào)是立體聲信號(hào)，則音頻信號(hào)處理裝置300可以進(jìn)一步包括用于立體聲下混合信號(hào)的左聲道和右聲道的重新?lián)u擺的下混合處理單元(在該圖中未示出)。但是，在雙聲道渲染中，左聲道和右聲道的交叉項(xiàng)可以通過(guò)HRTF參數(shù)的選擇來(lái)生成。因此，在下混合處理單元(在該圖中未示出)中的操作不是必需的。如果下混合信號(hào)是立體聲，并且多聲道信息(MI)遵循MPS環(huán)繞標(biāo)準(zhǔn)，則優(yōu)詵地設(shè)置為5-2-5配置樽式。并且，優(yōu)選地通過(guò)僅繞過(guò)左前聲道和右前聲道來(lái)進(jìn)行輸出。此外，可以以從右前和左前聲道到右輸出和左輸出(總共四個(gè)參數(shù)設(shè)置)具有有效值而其余的值是零的方式來(lái)傳送雙聲道參數(shù)。多聲道解碼器330使用多聲道信息(MI)和雙聲道參數(shù)從下混合信號(hào)生成雙聲道輸出。具體地，該多聲道解碼器330能夠通過(guò)將包括在多聲道信息中的空間參數(shù)和雙聲道參數(shù)的組合應(yīng)用于下混合信號(hào)來(lái)生成雙聲道輸出。在以上的描述中，解釋了用于生成雙聲道輸出的實(shí)施例。類(lèi)似于第一實(shí)施例，如果經(jīng)由下混合處理單元來(lái)直接生成雙聲道輸出，則無(wú)需執(zhí)行多聲道解碼器的復(fù)雜方案。因此，可以降低復(fù)雜度。類(lèi)似于第二實(shí)施例，如果使用多聲道解碼器，則能夠使用多聲道解碼器的功能。3.獨(dú)立對(duì)象的控制(卡拉OK模式/無(wú)伴奏合唱(cappella)模式)在以下的描述中，解釋用于通過(guò)接收單音下混合來(lái)控制獨(dú)立對(duì)象或者背景對(duì)象的技術(shù)。圖7是根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置的框圖，并且圖8是根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的另一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置的框圖。參考圖7，音頻信號(hào)編碼裝置400的多聲道解碼器410接收多個(gè)聲道信號(hào)，并且然后生成單音下混合(DMXm)和多聲道比特流。在該情況下，多個(gè)聲道信號(hào)是多聲道背景對(duì)象 (MBO)。例如，多聲道背景對(duì)象(MBO)能夠包括配置背景音樂(lè)的多個(gè)樂(lè)器信號(hào)。但是，無(wú) 法知道包括多少源信號(hào)(例如，樂(lè)器信號(hào))。并且，它們不可以按每個(gè)源信號(hào)來(lái)控制。雖然背景對(duì)象可以被下混合為立體聲聲道，但是本發(fā)明意在描述僅下混合為單音信號(hào)的背景對(duì)象。對(duì)象編碼器420通過(guò)下混合單音背景對(duì)象(DMXm)和至少一個(gè)對(duì)象信號(hào)(ob jN)來(lái) 生成單音下混合(DMX)，并且還生成對(duì)象信息比特流。在該情況下，至少一個(gè)對(duì)象信號(hào)(或者基于對(duì)象的信號(hào))是獨(dú)立對(duì)象，并且可以被稱(chēng)作前景對(duì)象(reo)。例如，如果背景對(duì)象是伴唱，則獨(dú)立對(duì)象(reo)可以與主唱信號(hào)相對(duì)應(yīng)。當(dāng)然，如果存在兩個(gè)獨(dú)立對(duì)象，則可以分別與歌手1的有聲信號(hào)和歌手2的有聲信號(hào)相對(duì)應(yīng)。并且，對(duì)象編碼器420能夠進(jìn)一步生成殘差信息。該對(duì)象編碼器420能夠在下混合單音背景對(duì)象(DMXm)和對(duì)象信號(hào)(ob jN) ( S卩，獨(dú) 立對(duì)象)的過(guò)程中生成殘差。該殘差用于使解碼器從下混合信號(hào)中提取獨(dú)立對(duì)象(或者，背景對(duì)象)。音頻信號(hào)解碼裝置500的對(duì)象代碼轉(zhuǎn)換器510根據(jù)包括在混合信息(MXT)中的模式選擇信息(MSI)來(lái)使用增強(qiáng)的對(duì)象信息(例如，殘差)從下混合(DMX)中提取至少一個(gè) 獨(dú)立對(duì)象或者背景對(duì)象。該模式選擇信息(MSI)包括指示是否選擇了用于控制背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象的模式的信息。另外，該模式選擇信息(MSI)可以包括指示規(guī)定的模式與包括正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式的模式中的哪一個(gè)相對(duì) 應(yīng)的信息。例如，如果背景對(duì)象是背景音樂(lè)，則用于控制背景對(duì)象的模式可以與‘無(wú)伴奏合唱模式’模式(或者獨(dú)奏模式)相對(duì)應(yīng)。例如，如果獨(dú)立對(duì)象是有聲的，則用于控制至少一個(gè)獨(dú)立對(duì)象的模式可以與卡拉OK模式相對(duì)應(yīng)。換句話(huà)說(shuō)，該模式選擇信息可以是指示是否選擇了正常模式、‘無(wú)伴奏合唱模式’模式和卡拉OK模式中的一個(gè)的信息。另外，在‘無(wú)伴奏合唱模式’或者卡拉OK模式的情況下，可以進(jìn)一步包括關(guān)于增益調(diào)整的信息?？傊?，如果模式選擇信息(MSI)是‘無(wú)伴奏合唱模式’或者卡拉OK模式，則從下混合(DMX)中提取至少一個(gè)獨(dú)立對(duì)象或者背景對(duì)象。在正常模式的情況下，該下混合信號(hào)可以經(jīng)過(guò)旁路。如果提取了獨(dú)立對(duì)象，則該對(duì)象代碼轉(zhuǎn)換器510通過(guò)使用對(duì)象信息(OI)、混合信息(MI)等混合至少一個(gè)獨(dú)立對(duì)象和背景對(duì)象來(lái)生成混合的單音下混合。在該情況下，該對(duì) 象信息(OI)是從對(duì)象信息比特流中提取的信息，并且可以與在先前的描述中解釋的相同。并且，混合信息(MXI)可以是用于調(diào)整對(duì)象增益和/或搖擺的信息。同時(shí)，對(duì)象代碼轉(zhuǎn)換器510使用多聲道比特流和/或?qū)ο笮畔⒈忍亓鱽?lái)生成多聲道信息(Ml)。可以提供該多聲道信息(MI)來(lái)控制背景對(duì)象或者至少一個(gè)獨(dú)立對(duì)象。在該情況下，該多聲道信息可以包括用于控制背景對(duì)象的第一多聲道信息和用于控制至少一個(gè) 獨(dú)立對(duì)象的第二多聲道信息中的至少一個(gè)。并且，多聲道解碼器520從使用多聲道信息(MI)混合的單音下混合或者繞過(guò)的單音下混合來(lái)生成輸出信號(hào)。圖8是用于獨(dú)立對(duì)象生成的另一個(gè)實(shí)施例的示圖。參考圖8，音頻信號(hào)處理單元600接收單音下混合(DMX)。該音頻信號(hào)處理裝置 600包括下混合處理單元610、多聲道解碼器620、OTN模塊630和渲染單元640。音頻信號(hào)處理裝置600根據(jù)模式選擇信息(MSI)來(lái)確定是否將下混合信號(hào)輸入到 OTN模塊630。在該情況下，該模式選擇信息可以與參考圖7描述的以前的模式選擇信息相同。如果根據(jù)該模式選擇信息當(dāng)前的模式是用于控制背景對(duì)象(MBO)或者至少一個(gè) 獨(dú)立對(duì)象(reo)的模式，則允許將下混合信號(hào)輸入到OTN模塊630。如果根據(jù)模式選擇信息，當(dāng)前模式是正常模式，則該下混合信號(hào)繞過(guò)OTN模塊530，而根據(jù)輸出模式輸入到下混合處理單元610或者多聲道解碼器620。在該情況下，輸出模式與參考圖1描述的輸出模式信息(OM)相同，并且可以包括輸出揚(yáng)聲器的數(shù)目。在輸出模式是單音/立體聲/雙聲道輸出模式的情況下，下混合處理單元610處理下混合。在該情況下，下混合處理單元610可以是起與參考圖1/圖2/圖3描述的先前的下混合處理單元130/130A/130B相同作用的單元。在輸出模式是多聲道模式的情況下，多聲道解碼器620從單音下混合(DMX)生成多聲道輸出。同樣地，該多聲道解碼器620可以用作與參考圖1描述的以前的多聲道解碼器140相同的單元。
13
同時(shí)，如果根據(jù)模式選擇信息(MSI)將單音下混合信號(hào)輸入到OTN模塊630，則 OTN模塊630從下混合信號(hào)中提取單音背景對(duì)象(MBO)和至少一個(gè)獨(dú)立對(duì)象信號(hào)(TOO)。在該情況下，OTN是一到η的縮寫(xiě)。如果存在一個(gè)獨(dú)立對(duì)象信號(hào)，則OTN模塊可以具有OTT( — 到二)結(jié)構(gòu)。如果存在兩個(gè)獨(dú)立對(duì)象信號(hào)，則該OTN模塊可以具有OTT(—到三)結(jié)構(gòu)。如果存在(N-I)個(gè)獨(dú)立對(duì)象信號(hào)，則該OTN模塊可以具有OTN結(jié)構(gòu)。該OTN模塊630能夠使用對(duì)象信息(OI)和增強(qiáng)的對(duì)象信息(EDI)。在該情況下，該增強(qiáng)的對(duì)象信息(EOI)可以是在下混合背景對(duì)象和獨(dú)立對(duì)象的過(guò)程中生成的殘差信號(hào)。并且，渲染單元640通過(guò)使用混合信息(MXI)來(lái)渲染背景信息(MBO)和獨(dú)立對(duì)象 (FGO)來(lái)生成輸出聲道信號(hào)。在該情況下，混合信息(MXI)包括用于控制背景對(duì)象的信息和 /或用于控制獨(dú)立對(duì)象的信息。同時(shí)，可以基于對(duì)象信息(OI)和混合信息(MXI)來(lái)生成多聲道信息(Ml)。在該情況下，將輸出聲道信號(hào)輸入到多聲道解碼器(在該圖中未示出)，并且然后可以基于該多聲道信息來(lái)進(jìn)行上混合。圖9是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第一實(shí)施例的用于處理音頻信號(hào)的裝置的框圖，圖10是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第二實(shí)施例的用于處理音頻信號(hào)的裝置的框圖，并且圖11和圖12是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第三實(shí)施例的用于處理音頻信號(hào)的裝置的框圖。第一實(shí)施例涉及單音下混合和單音對(duì)象。第二實(shí)施例涉及單音下混合和立體聲對(duì) 象。并且，第三實(shí)施例涉及涵蓋第一和第二實(shí)施例的兩種情況的情況。參考圖9，音頻信號(hào)編碼裝置700A的增強(qiáng)的對(duì)象信息編碼器710從是單音信號(hào)的混合的音頻信號(hào)生成增強(qiáng)的對(duì)象信息(EOP_Xl)和對(duì)象信號(hào)(obj_Xl)。在該情況下，由于一個(gè)信號(hào)使用兩個(gè)信號(hào)來(lái)生成，所以增強(qiáng)的對(duì)象信息編碼器710可以被實(shí)現(xiàn)為OTT( —到二) 編碼模塊。在該情況下，增強(qiáng)的對(duì)象信息(EOP_Xl)可以是殘差信號(hào)。并且，增強(qiáng)的對(duì)象信息編碼器710生成與該OTT模塊相對(duì)應(yīng)的對(duì)象信息(0P_Xl)。音頻信號(hào)解碼裝置800Α的增強(qiáng)的對(duì)象信息解碼器810使用增強(qiáng)的對(duì)象信息(ΕΟΡ_ X1)和混合的音頻信號(hào)來(lái)生成與附加的重新混合數(shù)據(jù)相對(duì)應(yīng)的輸出信號(hào)(obj_Xl‘)。參考圖10，音頻信號(hào)編碼裝置700B包括第一增強(qiáng)的對(duì)象信息編碼器710B和第二增強(qiáng)的對(duì)象信息編碼器720B。并且，音頻信號(hào)解碼裝置800B包括第一增強(qiáng)的對(duì)象信息解碼器_和第二增強(qiáng)的對(duì)象信息解碼器_。第一增強(qiáng)的對(duì)象信息編碼器710B通過(guò)將兩個(gè)對(duì)象信號(hào)(obj_Xl，obj_x2)合并在一起來(lái)生成合并的對(duì)象和第一增強(qiáng)的對(duì)象信息(E0P_L1)。在該情況下，兩個(gè)對(duì)象信號(hào)可以包括立體聲對(duì)象信號(hào)，即，對(duì)象的左聲道信號(hào)和該對(duì)象的右聲道信號(hào)。在生成合并的對(duì)象的過(guò) 程中，生成第一對(duì)象信息(0P_L1)。第二增強(qiáng)的對(duì)象信息編碼器720B使用是單音信號(hào)的混合的音頻信號(hào)和合并的對(duì) 象來(lái)生成第二增強(qiáng)的對(duì)象信息(EOP_LO)和第二對(duì)象信息(OP_LO)。因此，最后的信號(hào)通過(guò)以上的兩個(gè)步驟來(lái)生成。由于第一和第二增強(qiáng)的對(duì)象信息編碼器710B和720B的每一個(gè)從兩個(gè)信號(hào)生成一個(gè)信號(hào)，所以它可以被實(shí)現(xiàn)為OTT (—到二)模塊。該音頻信號(hào)解碼裝置800B執(zhí)行與音頻信號(hào)編碼裝置700B相反的過(guò)程。具體地，第二增強(qiáng)的對(duì)象信息解碼器_使用第二增強(qiáng)的對(duì)象信息(EOP_LO)和混合的音頻信號(hào)來(lái)生成合并的對(duì)象。在該情況下，可以進(jìn)一步提取音頻信號(hào)。并且，第一增強(qiáng)的對(duì)象信息解碼器型巡使用第一增強(qiáng)的對(duì)象信息(E0P_L1)從合并的對(duì)象中生成兩個(gè)對(duì)象(Obj_x/ ,obj_x2‘)，其是附加的再混合數(shù)據(jù)。圖11和圖12示出了第一和第二實(shí)施例的合并的結(jié)構(gòu)。參考圖11，如果根據(jù)在多聲道編碼器705C的5-1-5或者5-2-5樹(shù)形結(jié)構(gòu)的操作的存在或者不存來(lái)將增強(qiáng)的對(duì)象改變?yōu)閱我艋蛘吡Ⅲw聲，則將下混合信號(hào)改變?yōu)閱我粜盘?hào)或者立體聲信號(hào)。參考圖11和圖12，在增強(qiáng)的對(duì)象是單音信號(hào)的情況下，不操作第一增強(qiáng)的對(duì)象信息編碼器710C和第一增強(qiáng)的信息解碼器820C。元件的功能分別地與關(guān)于圖10描述的相同名稱(chēng)的那些相同。同時(shí)，在下混合信號(hào)是單音的情況下，第二增強(qiáng)的對(duì)象信息編碼器720C和第二增強(qiáng)的信息解碼器810C優(yōu)選地分別作為OTT編碼器和OTT解碼器來(lái)進(jìn)行操作。在下混合信號(hào)是立體聲的情況下，第二增強(qiáng)的對(duì)象信息編碼器720C和第二增強(qiáng)的信息解碼器810C可以分別作為T(mén)IT編碼器和TIT解碼器來(lái)操作。根據(jù)本發(fā)明，上述音頻信號(hào)處理方法可以在記錄程序的介質(zhì)中被實(shí)現(xiàn)為計(jì)算機(jī)可讀代碼。計(jì)算機(jī)可讀介質(zhì)包括各種記錄設(shè)備，其中存儲(chǔ)計(jì)算機(jī)系統(tǒng)可讀的數(shù)據(jù)。計(jì)算機(jī)可讀的介質(zhì)包括，例如，ROM、RAM、CD-ROM、磁帶、軟盤(pán)、光數(shù)據(jù)存儲(chǔ)設(shè)備等，并且還包括載波型實(shí)施方式(例如，經(jīng)由因特網(wǎng)的傳輸)。另外，將通過(guò)編碼方法生成的比特流存儲(chǔ)在計(jì)算機(jī) 可讀記錄介質(zhì)中，或者可以經(jīng)由有線(xiàn)/無(wú)線(xiàn)通信網(wǎng)絡(luò)進(jìn)行傳送。工業(yè)實(shí)用性因此，本發(fā)明適用于編碼和解碼音頻信號(hào)。雖然已經(jīng)在此處參考本發(fā)明的優(yōu)選實(shí)施例描述和說(shuō)明了本發(fā)明，但是對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的是，在不脫離本發(fā)明的精神和范圍的情況下，可以在其中進(jìn)行各種的修改和變化。因此，希望本發(fā)明涵蓋落入所附權(quán)利要求和其等價(jià)物的范圍內(nèi)的本發(fā)明的修改和變化。
權(quán)利要求
一種處理音頻信號(hào)的方法，包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成所述下混合信號(hào)時(shí)提取的對(duì)象信息；接收用于控制所述對(duì)象信號(hào)的混合信息；根據(jù)輸出模式使用所述對(duì)象信息和所述混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及如果生成了所述下混合處理信息，則通過(guò)將所述下混合處理信息應(yīng)用于所述下混合信號(hào)來(lái)生成輸出信號(hào)，其中，所述下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，所述輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于所述下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng)，以及其中，所述多聲道信息與用于將所述下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。
2.根據(jù)權(quán)利要求1所述的方法，其中，所述下混合信號(hào)和所述輸出信號(hào)的每個(gè)與在時(shí) 間域上的信號(hào)相對(duì)應(yīng)。
3.根據(jù)權(quán)利要求1所述的方法，其中，所述生成所述輸出信號(hào)包括通過(guò)分解所述下混合信號(hào)來(lái)生成子帶信號(hào)；通過(guò)使用所述下混合處理信息處理所述子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào)；以及通過(guò)分別地合成所述兩個(gè)子帶信號(hào)來(lái)生成所述輸出信號(hào)。
4.根據(jù)權(quán)利要求3所述的方法，其中，所述生成所述兩個(gè)子帶信號(hào)包括通過(guò)去相關(guān)所述子帶信號(hào)來(lái)生成去相關(guān)的信號(hào)；以及通過(guò)使用所述下混合處理信息處理所述去相關(guān)的信號(hào)和所述子帶信號(hào)來(lái)生成所述兩個(gè)子帶信號(hào)。
5.根據(jù)權(quán)利要求1所述的方法，其中，所述下混合處理信號(hào)包括雙聲道參數(shù)，并且其中，所述輸出信號(hào)與雙聲道信號(hào)相對(duì)應(yīng)。
6.根據(jù)權(quán)利要求1所述的方法，進(jìn)一步包括如果生成了所述多聲道信息，則通過(guò)使用所述多聲道信息對(duì)所述下混合信號(hào)進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。
7.根據(jù)權(quán)利要求1所述的方法，其中，根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定所述輸出模式，并且其中，所述揚(yáng)聲器聲道數(shù)目基于設(shè)備信息和所述混合信息中的一個(gè)。
8.一種用于處理音頻信號(hào)的裝置，包括多路分解器，所述多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成所述下混合信號(hào)時(shí)提取的對(duì)象信息；信息生成單元，所述信息生成單元根據(jù)輸出模式使用所述對(duì)象信息和用于控制所述對(duì) 象信號(hào)的混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及下混合處理單元，如果生成了所述下混合處理信息，則所述下混合處理單元通過(guò)將所述下混合處理信息應(yīng)用于所述下混合信號(hào)來(lái)生成輸出信號(hào)，其中，所述下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，所述輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于所述下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng)，以及其中，所述多聲道信息與用于將所述下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。
9.根據(jù)權(quán)利要求8所述的裝置，其中，所述下混合信號(hào)和所述輸出信號(hào)與時(shí)間域上的信號(hào)相對(duì)應(yīng)。
10.根據(jù)權(quán)利要求8所述的裝置，其中，所述下混合處理單元包括子帶分解單元，所述子帶分解單元通過(guò)分解所述下混合信號(hào)來(lái)生成子帶信號(hào)； M2M處理單元，所述M2M處理單元通過(guò)使用所述下混合處理信息處理所述子帶信號(hào)來(lái) 生成兩個(gè)子帶信號(hào)；以及合成單元，所述合成單元通過(guò)分別合成所述兩個(gè)子帶信號(hào)來(lái)生成所述輸出信號(hào)。
11.根據(jù)權(quán)利要求10所述的裝置，其中，所述M2S處理單元進(jìn)一步包括去相關(guān)器，所述去相關(guān)器通過(guò)去相關(guān)所述子帶信號(hào)來(lái)生成去相關(guān)的信號(hào)；以及其中，所述合成單元通過(guò)使用所述下混合處理信息處理所述去相關(guān)的信號(hào)和所述子帶信號(hào)來(lái)生成所述兩個(gè)子帶信號(hào)。
12.根據(jù)權(quán)利要求8所述的裝置，其中，所述下混合處理信息包括雙聲道參數(shù)，并且其中，所述輸出信號(hào)與雙聲道信號(hào)相對(duì)應(yīng)。
13.根據(jù)權(quán)利要求8所述的裝置，進(jìn)一步包括多聲道解碼器，如果生成了所述多聲道信息，則所述多聲道解碼器通過(guò)使用所述多聲道信息對(duì)所述下混合信息進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。
14.根據(jù)權(quán)利要求8所述的裝置，其中，根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定所述輸出模式，并且其中，所述揚(yáng)聲器聲道數(shù)目基于設(shè)備信息和所述混合信息中的一個(gè)。
15.一種包括存儲(chǔ)在其中的程序的計(jì)算機(jī)可讀記錄介質(zhì)，所述程序被提供用于執(zhí)行處理音頻信號(hào)的方法，所述方法包括接收包括至少一個(gè)對(duì)象信號(hào)的時(shí)域下混合信號(hào)以及在生成所述下混合信號(hào)時(shí)提取的對(duì)象信息；接收用于控制所述對(duì)象信號(hào)的混合信息；根據(jù)輸出模式使用所述對(duì)象信息和所述混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及如果生成了所述下混合處理信息，則通過(guò)將所述下混合處理信息應(yīng)用于所述下混合信號(hào)來(lái)生成輸出信號(hào)，其中，所述下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，所述輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于所述下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng)，以及其中，所述多聲道信息與用于將所述下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。 全文摘要
公開(kāi)了一種處理音頻信號(hào)的方法和裝置。本發(fā)明包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信號(hào)時(shí)提取的對(duì)象信息；接收用于控制對(duì)象信號(hào)的混合信息；根據(jù)輸出模式使用對(duì)象信息和混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè)；以及如果生成了下混合處理信息，則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào)，其中，下混合信號(hào)與單音信號(hào)相對(duì)應(yīng)，其中，輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng)，并且其中，多聲道信息與用于將下混合信號(hào)上混合為多聲道信號(hào)的信息相對(duì)應(yīng)。
文檔編號(hào)H04S7/00GK101911732SQ200880122770
公開(kāi)日2010年12月8日申請(qǐng)日期2008年12月31日優(yōu)先權(quán)日2008年1月1日
發(fā)明者吳賢午, 鄭亮源申請(qǐng)人:Lg電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳賢午;鄭亮源
技術(shù)所有人：ＬＧ電子株式會(huì)社
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻信號(hào)處理相關(guān)技術(shù)

matlab音頻信號(hào)處理相關(guān)技術(shù)

音頻信號(hào)處理院校排名相關(guān)技術(shù)

音頻信號(hào)處理器相關(guān)技術(shù)

simulink音頻信號(hào)處理相關(guān)技術(shù)

音頻數(shù)字信號(hào)處理相關(guān)技術(shù)

音頻信號(hào)處理算法相關(guān)技術(shù)

數(shù)字音頻信號(hào)處理器相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于處理音頻信號(hào)的方法和裝置的制作方法