国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于處理音頻信號(hào)的方法和裝置的制作方法

      文檔序號(hào):7942032閱讀:222來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):用于處理音頻信號(hào)的方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及用于處理音頻信號(hào)的裝置及其方法。雖然本發(fā)明適用于大范圍的應(yīng) 用,但是特別適合于處理經(jīng)由數(shù)字媒體、廣播信號(hào)等等接收到的音頻信號(hào)。
      背景技術(shù)
      通常,在用于將多個(gè)對(duì)象下混合為單音或者立體聲信號(hào)的過(guò)程中,分別從對(duì)象信 號(hào)中提取參數(shù)。這些參數(shù)可用于解碼器。對(duì)象的每一個(gè)的搖擺(panning)和增益是可通過(guò) 用戶(hù)選擇控制的。

      發(fā)明內(nèi)容
      技術(shù)問(wèn)題然而,為了控制每個(gè)對(duì)象信號(hào),應(yīng)當(dāng)適當(dāng)?shù)囟ㄎ换驌u擺包含在下混合中的每個(gè)源。另外,為了提供根據(jù)面向聲道的解碼方案的向后兼容,對(duì)象參數(shù)應(yīng)當(dāng)被轉(zhuǎn)換成用 于上混合的多聲道參數(shù)。因此,本發(fā)明針對(duì)一種用于處理音頻信號(hào)的裝置及其方法,其基本上消除了由于 現(xiàn)有技術(shù)的限制和缺點(diǎn)而導(dǎo)致的一個(gè)或多個(gè)問(wèn)題。本發(fā)明的目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)該裝置和方 法,可以通過(guò)控制對(duì)象的增益和搖擺來(lái)輸出單音信號(hào)、立體聲信號(hào)和多聲道信號(hào)。本發(fā)明的另一個(gè)目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)該裝 置和方法,可以在不執(zhí)行多聲道解碼器的復(fù)雜的方案的情況下,從下混合信號(hào)中輸出單音 信號(hào)和立體聲信號(hào)。本發(fā)明的又一個(gè)目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)該方 法和裝置,可以在以相當(dāng)大的寬度調(diào)整有聲或者背景音樂(lè)的增益的情況下,防止聲音質(zhì)量 的失真。有益效果因此,本發(fā)明提供以下的效果或者優(yōu)點(diǎn)。第一,本發(fā)明能夠在沒(méi)有限制的情況下控制對(duì)象的增益和搖擺。第二,本發(fā)明能夠基于用戶(hù)選擇來(lái)控制對(duì)象的增益和搖擺。第三,在輸出模式是單音或者立體聲的情況下,本發(fā)明在不執(zhí)行多聲道解碼器的 復(fù)雜的方案的情況下生成輸出信號(hào),從而便利實(shí)現(xiàn)和降低復(fù)雜度。第四,在為諸如移動(dòng)設(shè)備的設(shè)備提供一個(gè)或者兩個(gè)揚(yáng)聲器的情況下,本發(fā)明能夠 在不需要處理多聲道解碼器的編解碼器的情況下控制用下混合信號(hào)的對(duì)象的增益和搖擺。第五,在有聲或者背景音樂(lè)被完全地抑制的情況下,本發(fā)明能夠根據(jù)增益調(diào)整來(lái) 防止聲音質(zhì)量的失真。第六,在諸如聲樂(lè)等的至少兩個(gè)單獨(dú)立對(duì)象(立體聲聲道或者若干有聲信號(hào))存 在的情況下,本發(fā)明能夠根據(jù)增益調(diào)整來(lái)防止聲音質(zhì)量的失真。


      附圖被包括進(jìn)來(lái)以提供對(duì)本發(fā)明的進(jìn)一步理解,并且并入和構(gòu)成本說(shuō)明書(shū)的一部 分,附示了本發(fā)明的實(shí)施例,并且與描述一起用于可以解釋本發(fā)明原理。在附圖中圖1是根據(jù)用于生成單音/立體聲信號(hào)的本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的 裝置的框圖;圖2是用于在圖1中示出的下混合處理單元的第一示例的詳細(xì)框圖;圖3是用于在圖1中示出的下混合處理單元的第二示例的詳細(xì)框圖;圖4是根據(jù)用于生成雙聲道信號(hào)的本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的 裝置框圖;圖5是在圖4中示出的下混合處理單元的詳細(xì)框圖;圖6是根據(jù)用于生成雙聲道聲道的本發(fā)明的另一個(gè)實(shí)施例的用于處理音頻信號(hào) 的裝置的框圖;圖7是根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝 置的框圖;圖8是用于根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的另一個(gè)實(shí)施例來(lái)處理音頻信號(hào)的 裝置的框圖;圖9是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第一實(shí)施例的用于處理音頻信號(hào)的 裝置的框圖;圖10是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第二實(shí)施例的用于處理音頻信號(hào)的 裝置的框圖;以及圖11和圖12是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第三實(shí)施例的用于處理音頻 信號(hào)的裝置的框圖。最佳方式本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的描述中進(jìn)行闡述,并且從該描述中在某種程 度上將是清晰可見(jiàn)的,或者可以通過(guò)實(shí)踐本發(fā)明來(lái)習(xí)得??梢酝ㄟ^(guò)在撰寫(xiě)的說(shuō)明書(shū)及其權(quán) 利要求以及所附的附圖中所具體指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得本發(fā)明的目的和其他的優(yōu)點(diǎn)。為了實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的,如在實(shí)施和廣泛描述的,根 據(jù)本發(fā)明的一種處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)和在 生成下混合信號(hào)時(shí)提取的對(duì)象信息;接收用于控制對(duì)象信號(hào)的混合信息;根據(jù)輸出模式使 用對(duì)象信息和混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè);以及如果生成了下 混合處理信息,則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào),其中,下混合 信號(hào)和輸出信號(hào)與單音信號(hào)相對(duì)應(yīng),并且其中,多聲道信息與用于將下混合信號(hào)上混合為 多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。根據(jù)本發(fā)明,下混合信號(hào)和輸出信號(hào)與在時(shí)間域上的信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明,生成輸出信號(hào)包括通過(guò)分解下混合信號(hào)來(lái)生成子帶信號(hào);使用下 混合處理信息來(lái)處理子帶信號(hào);以及通過(guò)合成子帶信號(hào)來(lái)生成輸出信號(hào)。根據(jù)本發(fā)明,輸出信號(hào)包括通過(guò)去相關(guān)下混合信號(hào)所生成的信號(hào)。
      根據(jù)本發(fā)明,該方法進(jìn)一步包括如果生成多聲道信息,則通過(guò)使用多聲道信息對(duì) 下混合信號(hào)進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。根據(jù)本發(fā)明,根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定輸出模式,并且揚(yáng)聲器聲道數(shù)目基于設(shè) 備信息和混合信息中的一個(gè)。根據(jù)本發(fā)明,混合信息基于對(duì)象位置信息、對(duì)象增益信息和回放配置信息中的至 少一個(gè)來(lái)生成。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號(hào)的裝置,包括多路分解器,該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)和 在下混合信號(hào)生成時(shí)提取的對(duì)象信息;信息生成單元,該信息生成單元根據(jù)輸出模式使用 對(duì)象信息和用于控制對(duì)象信號(hào)的混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè); 以及下混合處理單元,如果生成下混合處理信息,則該下混合處理單元通過(guò)將下混合處理 信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào),其中,下混合信號(hào)和輸出信號(hào)與單音信號(hào)相對(duì)應(yīng), 并且其中,多聲道信息與用于將下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。根據(jù)本發(fā)明,該下混合處理單元包括子帶分解單元,該子帶分解單元通過(guò)分解下 混合信號(hào)來(lái)生成子帶信號(hào);M2M處理單元,該M2M處理單元使用下混合處理信息來(lái)處理子帶 信號(hào);以及子帶合成單元,該子帶合成單元通過(guò)合成子帶信號(hào)來(lái)生成輸出信號(hào)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的一種 處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)和在下混合信號(hào)生成 時(shí)提取的對(duì)象信息;接收用于控制對(duì)象信號(hào)的混合信息;根據(jù)輸出模式使用對(duì)象信息和混 合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè);以及如果生成了下混合處理信息, 則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào),其中,下混合信號(hào)與單音信 號(hào)相對(duì)應(yīng),其中,輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)所生成的立體聲信號(hào)相對(duì) 應(yīng),并且其中,多聲道信息與用于將下混合信號(hào)上混合為多聲道信號(hào)的信息相對(duì)應(yīng)。根據(jù)本發(fā)明,下混合信號(hào)和輸出信號(hào)與在時(shí)間域上的信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明,生成輸出信號(hào)包括通過(guò)分解下混合信號(hào)來(lái)生成子帶信號(hào);通過(guò)使 用下混合處理信息處理該子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào);以及通過(guò)合成兩個(gè)子帶信號(hào)來(lái)分 別生成輸出信號(hào)。根據(jù)本發(fā)明,生成兩個(gè)子帶信號(hào)包括通過(guò)去相關(guān)子帶信號(hào)來(lái)生成去相關(guān)的信號(hào); 以及通過(guò)使用下混合處理信息處理去相關(guān)的信號(hào)和該子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào)。根據(jù)本發(fā)明,該下混合處理信息包括雙聲道參數(shù)和與雙聲道信號(hào)相對(duì)應(yīng)的輸出信號(hào)。根據(jù)本發(fā)明,該方法進(jìn)一步包括如果生成了多聲道信息,則通過(guò)使用多聲道信息 對(duì)下混合信號(hào)進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。根據(jù)本發(fā)明,根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定輸出模式,并且揚(yáng)聲器聲道數(shù)目基于設(shè) 備信息和混合信息中的一個(gè)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號(hào)的裝置,包括多路分解器,該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)、 時(shí)間域下混合信號(hào)和在生成下混合信號(hào)時(shí)提取的對(duì)象信息;信息生成單元,該信息生成單 元根據(jù)輸出模式使用用于控制對(duì)象信號(hào)的混合信息和對(duì)象信息來(lái)生成下混合處理信息和
      6多聲道信息中的一個(gè);以及下混合處理單元,如果生成下混合處理信息,則通過(guò)將下混合處 理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào),其中,下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,輸 出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng),并且其中,多聲 道信息與用于將下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的一種 處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信 號(hào)時(shí)提取的對(duì)象信息;接收包括模式選擇信息的混合信息,該混合信息用于控制對(duì)象信號(hào); 基于模式選擇信息繞過(guò)下混合信號(hào)或者從下混合信號(hào)中提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì) 象;以及如果該下混合信號(hào)被繞過(guò),則使用該對(duì)象信息和該混合信息來(lái)生成多聲道信息,其 中,下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),并且其中,該模式選擇信息包括指示模式的哪一個(gè)的信 息,模式包括正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。根據(jù)本發(fā)明,該方法進(jìn)一步包括接收增強(qiáng)的對(duì)象信息,其中,使用增強(qiáng)的對(duì)象信 息從下混合信號(hào)中提取至少一個(gè)獨(dú)立對(duì)象。根據(jù)本發(fā)明,該增強(qiáng)的對(duì)象信息與殘差信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明,至少一個(gè)獨(dú)立對(duì)象與基于對(duì)象的信號(hào)相對(duì)應(yīng),并且該背景對(duì)象與單 音信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明,如果模式選擇模式與正常模式相對(duì)應(yīng),則生成立體聲輸出信號(hào)。并 且,如果模式選擇模式與用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式中 的一個(gè)相對(duì)應(yīng),則提取該背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象。根據(jù)本發(fā)明,該方法進(jìn)一步包括如果從該下混合信號(hào)中提取該背景對(duì)象和至少 一個(gè)獨(dú)立對(duì)象,則生成用于控制該背景對(duì)象的第一多聲道信息和用于控制至少一個(gè)獨(dú)立對(duì) 象的第二多聲道信息中的至少一個(gè)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號(hào)的裝置,包括多路分解器,該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以 及在生成下混合信號(hào)時(shí)提取的對(duì)象信息;對(duì)象代碼轉(zhuǎn)換器,該對(duì)象代碼轉(zhuǎn)換器基于包括在 用于控制對(duì)象信號(hào)的混合信息中的模式選擇信息來(lái)繞過(guò)下混合信號(hào),或者從下混合信號(hào)提 取背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象;以及多聲道解碼器,如果繞過(guò)該下混合信號(hào),則使用對(duì)象 信息和混合信息來(lái)生成多聲道信息,其中,下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,輸出信號(hào) 與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)來(lái)生成的立體聲信號(hào)相對(duì)應(yīng),并且其中,該模式選擇 信息包括指示模式的哪一個(gè)的信息,模式包括正常模式、用于控制背景對(duì)象的模式和用于 控制至少一個(gè)獨(dú)立對(duì)象的模式。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的一種 處理音頻信號(hào)的方法包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信 號(hào)時(shí)提取的對(duì)象信息;接收包括模式選擇信息的混合信息,該混合信息用于控制該對(duì)象信 號(hào);以及使用下混合信號(hào)來(lái)生成立體聲輸出信號(hào),或者基于模式選擇信息來(lái)從下混合信號(hào) 中提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象,其中,下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,該立體 聲輸出信號(hào)與包括通過(guò)去相關(guān)下混合信號(hào)生成的信號(hào)的時(shí)域信號(hào)相對(duì)應(yīng),并且其中,該模 式選擇信息包括指示模式的哪一個(gè)的信息,模式包括標(biāo)正常模式、用于控制背景對(duì)象的模 式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。
      7
      根據(jù)本發(fā)明,該方法進(jìn)一步包括接收增強(qiáng)的對(duì)象信息,其中,至少一個(gè)獨(dú)立對(duì)象 使用增強(qiáng)的對(duì)象信息從下混合信號(hào)中進(jìn)行提取。根據(jù)本發(fā)明,該增強(qiáng)的對(duì)象信息與殘差信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明,至少一個(gè)獨(dú)立對(duì)象與基于對(duì)象的信號(hào)相對(duì)應(yīng),并且該背景對(duì)象與單 音信號(hào)相對(duì)應(yīng)。根據(jù)本發(fā)明,如果模式選擇模式與正常模式相對(duì)應(yīng),則生成該立體聲輸出信號(hào)。并 且,如果模式選擇模式與用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式中 的一個(gè)相對(duì)應(yīng),則提取該背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象。根據(jù)本發(fā)明,該方法進(jìn)一步包括如果從下混合信號(hào)中提取該背景對(duì)象和至少一 個(gè)獨(dú)立對(duì)象,則生成用于控制該背景對(duì)象的第一多聲道信息和用于控制至少一個(gè)獨(dú)立對(duì)象 的第二多聲道信息中的至少一個(gè)。為了進(jìn)一步實(shí)現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號(hào)的裝置,包括多路分解器,該多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以 及在生成下混合信號(hào)時(shí)提取的對(duì)象信息;以及對(duì)象代碼轉(zhuǎn)換器,該對(duì)象代碼轉(zhuǎn)換器使用下 混合信號(hào)來(lái)生成立體聲輸出信號(hào),或者基于包括在用于控制該對(duì)象信號(hào)的混合信息中的模 式選擇信息來(lái)從該下混合信號(hào)中提取背景對(duì)象和至少一個(gè)獨(dú)立對(duì)象,其中,下混合信號(hào)與 單音信號(hào)相對(duì)應(yīng),其中,該立體聲輸出信號(hào)與包括通過(guò)去相關(guān)下混合信號(hào)生成的信號(hào)的時(shí) 域信號(hào)相對(duì)應(yīng),并且其中,該模式選擇信息包括指示模式的哪一個(gè)的信息相對(duì)應(yīng),模式包括 正常模式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式。應(yīng)該明白,上文的概述和下面的詳細(xì)描述是示例性和說(shuō)明性的,并且希望提供要 求保護(hù)的本發(fā)明的進(jìn)一步說(shuō)明。
      具體實(shí)施例方式現(xiàn)在將對(duì)本發(fā)明的優(yōu)選實(shí)施例詳細(xì)地進(jìn)行參考,其示例在附圖中進(jìn)行圖示。首先, 本發(fā)明中的術(shù)語(yǔ)可以被解釋為以下的引用。并且,在本說(shuō)明書(shū)中沒(méi)有公開(kāi)的術(shù)語(yǔ)可以被解 釋為匹配本發(fā)明的技術(shù)想法的以下的含義和概念。特定地,在本公開(kāi)中的“信息”是通常包括值、參數(shù)、系數(shù)、要素等的術(shù)語(yǔ),并且其含 義可以被認(rèn)為偶爾地不同,本發(fā)明不受此限制。對(duì)象具有包括基于對(duì)象的信號(hào)和基于聲道的信號(hào)二者的概念。有時(shí),對(duì)象可以?xún)H 包括基于對(duì)象的信號(hào)。在接收到單音下混合信號(hào)的情況下,本發(fā)明意在描述用于處理單音下混合信號(hào)的 各種過(guò)程。首先,如果有必要將參考圖1至圖3來(lái)解釋從單音下混合信號(hào)生成單音/立體 聲信號(hào)或者多個(gè)聲道信號(hào)的方法。第二,將參考圖4至圖6來(lái)解釋從單音下混合信號(hào)(或 者立體聲下混合信號(hào))生成雙聲道信號(hào)的方法。第三,將參考圖7至圖12來(lái)解釋用于控制 包含在單音下混合中的獨(dú)立對(duì)象信號(hào)(或者單音背景信號(hào))的方法的各種實(shí)施例。1.單音/立體聲信號(hào)的生成圖1是根據(jù)用于生成單音/立體聲信號(hào)的本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的 裝置的框圖。參考圖1,根據(jù)本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置100包括多路分解器110、信息生成單元120和下混合處理單元130。該音頻信號(hào)處理裝置100可以進(jìn)一步包括 多聲道解碼器140。多路分解器110經(jīng)由比特流來(lái)接收對(duì)象信息(OI)。該對(duì)象信息(OI)是關(guān)于包含 在下混合信號(hào)內(nèi)的對(duì)象的信息,并且能夠包括對(duì)象水平信息、對(duì)象相關(guān)信息等。該對(duì)象信息 (OI)能夠包含對(duì)象參數(shù)(OP),該對(duì)象參數(shù)(OP)是指示對(duì)象特性的參數(shù)。比特流進(jìn)一步包含下混合信號(hào)(DMX)。該多路分解器110能夠進(jìn)一步從該比特流 中提取下混合信號(hào)(DMX)。該下混合信號(hào)(DMX)是從下混合至少一個(gè)對(duì)象信號(hào)生成的信號(hào), 并且可以與在時(shí)間域上的信號(hào)相對(duì)應(yīng)。該下混合信號(hào)(DMX)可以是單音信號(hào)或者立體聲信 號(hào)。在本實(shí)施例中,該下混合信號(hào)(DMX)可以是例如單音信號(hào)。信息生成單元120從多路分解器110接收對(duì)象信息(OI)。該信息生成單元120從 用戶(hù)接口接收混合信息(MXT)。該信息生成單元120從用戶(hù)接口或者設(shè)備接收輸出模式信 息(OM)。該信息生成單元120能夠進(jìn)一步從HRTF DB接收HRTF (報(bào)頭相關(guān)的傳送功能)參數(shù)。在該情況下,混合信息(MXI)是基于對(duì)象位置信息、對(duì)象增益信息、回放配置信息 等生成的信息。對(duì)象位置信息是使用戶(hù)控制每個(gè)對(duì)象的位置或者搖擺而輸入的信息。對(duì)象 增益信息是使用戶(hù)控制每個(gè)對(duì)象的增益而輸入的信息。特定地,對(duì)象位置信息或者對(duì)象增 益信息可以是從預(yù)設(shè)置的模式選擇的一個(gè)。在該情況下,預(yù)設(shè)置的模式是隨著時(shí)間的推移 用于預(yù)設(shè)置對(duì)象的特定增益或者位置的值。該預(yù)設(shè)置模式信息可以是從另一個(gè)設(shè)備接收到 的值或者存儲(chǔ)在設(shè)備中的值。同時(shí),從至少一個(gè)或多個(gè)預(yù)設(shè)置模式(例如,未使用的預(yù)設(shè)置 模式、預(yù)設(shè)置模式1、預(yù)設(shè)置模式2等)選擇一個(gè)可以通過(guò)用戶(hù)輸入來(lái)確定。回放配置信息是包含揚(yáng)聲器數(shù)目、揚(yáng)聲器位置、環(huán)境信息(揚(yáng)聲器的虛擬位置)等 的信息?;胤排渲眯畔⒖梢杂捎脩?hù)輸入、可以預(yù)先存儲(chǔ)或者可以從另一個(gè)設(shè)備接收。輸出模式信息(OM)是關(guān)于輸出模式的信息。例如,該輸出模式信息(OM)可以包 括指示多少信號(hào)用于輸出的信息。指示多少信號(hào)用于輸出的該信息可以與單音輸出模式、 立體聲輸出模式、多聲道輸出模式等中的一個(gè)相對(duì)應(yīng)。同時(shí),該輸出模式信息(OM)可以與 混合信息(MXI)的揚(yáng)聲器的數(shù)目相同。如果預(yù)先存儲(chǔ)該輸出模式信息(OM),則它基于設(shè)備 信息。如果該輸出模式信息(OM)由用戶(hù)輸入,則它基于用戶(hù)輸入信息。在該情況下,該用 戶(hù)輸入信息可以被包括在混合信息(MXI)中。信息生成單元120根據(jù)輸出模式使用對(duì)象信息(OI)和混合信息(MXI)來(lái)生成下 混合處理信息(DPI)和多聲道信息(MI)中的一個(gè)。在該情況下,輸出模式基于以上解釋的 輸出模式信息(OM)。如果輸出模式是單音輸出或者立體聲信號(hào),則信息生成單元120生成 下混合處理信息(DPI)。如果輸出模式是多聲道輸出,則信息生成單元120生成多聲道信息 (Ml)。在該情況下,下混合處理信息(DPI)是用于處理下混合信號(hào)(DMX)的信息,稍后將解 釋其細(xì)節(jié)。該多聲道信息(MI)是用于對(duì)下混合信號(hào)(DMX)進(jìn)行上混合的信息,并且能夠包 括聲道水平信息、聲道相關(guān)信息等。如果輸出模式是單音輸出或者立體聲輸出,則僅生成該下混合處理信息(DPI)。這 是因?yàn)橄禄旌咸幚韱卧?30能夠生成時(shí)域單音信號(hào)或者時(shí)域立體聲信號(hào)。同時(shí),如果輸出 模式是多聲道輸出,則生成多聲道信息(Ml)。這是因?yàn)樵谳斎胄盘?hào)是單音信號(hào)的情況下多 聲道解碼器140可以生成多聲道信號(hào)。
      9
      下混合處理單元130使用下混合處理信息(DPI)和單音下混合(DMX)來(lái)生成單音 輸出信號(hào)或者立體聲輸出信號(hào)。在該情況下,下混合處理信息(DPI)是用于處理下混合信 號(hào)(DMX)的信息,并且將控制包含在下混合信號(hào)中對(duì)象的增益和/或搖擺。同時(shí),單音輸出信號(hào)或者立體聲輸出信號(hào)與時(shí)域信號(hào)相對(duì)應(yīng),并且可以包括PCM 信號(hào)。在單音輸出信號(hào)的情況下,將參考圖2來(lái)解釋下混合處理單元130的詳細(xì)配置。在 立體聲輸出信號(hào)的情況下,將參考圖3來(lái)解釋下混合處理單元130的詳細(xì)配置。此外,下混合處理信息(DPI)可以包括雙聲道參數(shù)。在該情況下,該雙聲道參數(shù)是 用于3D效果的參數(shù),并且可以是由信息成生單元120使用對(duì)象信息(01)、混合信息(MXI) 和HRTF參數(shù)成生的信息。在下混合處理信息(DPI)包括雙聲道參數(shù)的情況下,下混合處理 單元130能夠輸出雙聲道信號(hào)。稍后將參考圖4至圖6來(lái)詳細(xì)解釋用于生成雙聲道信號(hào)的 實(shí)施例。如果接收到立體聲下混合信號(hào)而不是單音下混合信號(hào)[在該圖中未示出],則僅 執(zhí)行用于修改下混合信號(hào)的串音干擾(crosstalk)的處理,而不生成時(shí)域輸出信號(hào)。該處 理的下混合信號(hào)可以再次由多聲道解碼器140來(lái)進(jìn)行處理。但是,本發(fā)明不受該處理的限 制。如果輸出模式是多聲道輸出模式,則多聲道解碼器140通過(guò)使用多聲道信息對(duì)下 混合(DMX)進(jìn)行上混合來(lái)生成多聲道信號(hào)。該多聲道解碼器140可以根據(jù)MPEG環(huán)繞(IS)/ IEC 23003-1)的標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn),本發(fā)明不受此限制。圖2是用于在圖1示出的下混合處理單元的第一示例的詳細(xì)框圖,這是用于生成 單音輸出信號(hào)的實(shí)施例。圖3是用于在圖1示出的下混合處理單元的第二示例的詳細(xì)框圖, 這是用于生成立體聲輸出信號(hào)的示例。參考圖2,下混合處理單元130A包括子帶分解單元132A、M2M處理單元134A和子 帶合成單元136A。該下混合處理單元130A從單音下混合信號(hào)生成單音輸出信號(hào)。該子帶分解單元132A通過(guò)分解單音下混合信號(hào)(DMX)來(lái)生成子帶信號(hào)。子帶分 解單元132A被實(shí)現(xiàn)有混合濾波器組,并且子帶信號(hào)可以與在混合QMF域上的信號(hào)相對(duì)應(yīng)。 M2M處理單元134A使用下混合處理信息(DPI)來(lái)處理子帶信號(hào)。在該情況下,M2M是單音 到單音的縮寫(xiě)。M2M處理單元134A能夠使用去相關(guān)器來(lái)處理子帶信號(hào)。子帶合成單元136A 通過(guò)合成處理的子帶信號(hào)來(lái)生成時(shí)域單音輸出信號(hào)。另外,該子帶合成單元136A可以被實(shí) 現(xiàn)有混合濾波器組。參考圖3,下混合處理單元132B包括子帶分解單元132B、M2S處理單元134B、第一 子帶合成單元136B和第二子帶合成單元138B。下混合處理單元130B接收單音下混合信 號(hào),并且然后生成立體聲輸出。類(lèi)似在圖2中示出的先前的子帶分解單元132A,該子帶分解單元132B通過(guò)分解單 音下混合信號(hào)(DMX)來(lái)生成子帶信號(hào)。同樣地,該子帶分解單元132B可以被實(shí)現(xiàn)有混合濾 波器組。該M2S處理單元134B通過(guò)使用下混合處理信息(DPI)和去相關(guān)器135B處理子帶 信號(hào)來(lái)生成兩個(gè)子帶信號(hào)(第一子帶信號(hào)和第二子帶信號(hào))。在該情況下,M2S是單音到立 體聲的縮寫(xiě)。如果使用去相關(guān)器135B,則能夠通過(guò)降低在左聲道和右聲道之間的相關(guān)性來(lái) 提高立體聲效果。
      同時(shí),去相關(guān)器135B將從子帶分解單元132B輸入的子帶信號(hào)設(shè)置為第一子帶信 號(hào),并且然后能夠輸出作為第二子帶信號(hào)的通過(guò)去相關(guān)第一子帶信號(hào)生成的信號(hào),本發(fā)明 不受此限制。第一子帶合成單元136B合成第一子帶信號(hào),并且第二子帶合成單元138B合成第 二子帶信號(hào),由此生成時(shí)域立體聲輸出信號(hào)。因此,在輸入單音下混合的情況下,在以上的描述中解釋了經(jīng)由下混合處理單元 來(lái)輸出單音/立體聲輸出的實(shí)施例。在以下的描述中,解釋生成雙聲道信號(hào)的情況。2.雙聲道信號(hào)的生成圖4是根據(jù)用于生成雙聲道信號(hào)的本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置 的框圖。圖5是在圖4中示出的下混合處理單元的詳細(xì)框圖。圖6是根據(jù)用于生成雙聲道 信號(hào)的本發(fā)明的另一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置框圖。參考圖4和圖5,解釋了用于生成雙聲道信號(hào)的一個(gè)實(shí)施例。參考圖6,解釋了用 于生成雙聲道信號(hào)的另一個(gè)實(shí)施例。參考圖4,音頻信號(hào)處理裝置200包括多路分解器210、信息生成單元220和下混 合處理單元230。在該情況下,類(lèi)似參考圖1描述的先前的多路分解器110,該多路分解器 210從比特流中提取對(duì)象信息(OI),并且能夠從比特流中進(jìn)一步提取下混合(DMX)。在該情 況下,該下混合信號(hào)可以是單音信號(hào)或者立體聲信號(hào)。信息生成單元220使用對(duì)象信息(OI)、混合信息(MXI)和HRTF信息來(lái)生成包含雙 聲道參數(shù)的下混合處理信息。在該情況下,該HRTF信息可以是從HRTF DB提取的信息。并 且,雙聲道參數(shù)是用于帶來(lái)虛擬3D效果的參數(shù)。下混合處理單元230使用包括雙聲道參數(shù)的下混合處理信息(DPI)來(lái)輸出雙聲道 信號(hào)。參考圖5來(lái)解釋下混合處理單元230的詳細(xì)配置。參考圖5,下混合處理單元230A包括子帶分解單元232A、雙聲道處理單元234A和 子帶合成單元236A。該子帶分解單元232A通過(guò)分解下混合信號(hào)來(lái)生成一個(gè)或者兩個(gè)子帶 信號(hào)。該雙聲道處理單元234A使用包含雙聲道參數(shù)的下混合處理信息(DPI)來(lái)處理一個(gè) 或者兩個(gè)子帶信號(hào)。該子帶合成單元236A通過(guò)合成一個(gè)或者兩個(gè)子帶信號(hào)來(lái)生成時(shí)域雙 聲道輸出信號(hào)。參考圖6,音頻信號(hào)處理裝置300包括多路分解器310和信息生成單元320。音頻 信號(hào)處理裝置300可以進(jìn)一步包括多聲道解碼器330。多路分解器310從比特流中提取對(duì)象信息(OI),并且能夠從比特流中進(jìn)一步提取 下混合信號(hào)(DMX)。信息生成單元320使用對(duì)象信息(OI)和混合信息(MXI)來(lái)生成多聲 道信息(Ml)。在該情況下,該多聲道信息(MI)是用于對(duì)該下混合信號(hào)(DMX)進(jìn)行上混合 的信息,并且包括諸如聲道水平信息和聲道相關(guān)信息的空間參數(shù)。信息生成單元320使用 從HRTF DB提取的HRTF參數(shù)來(lái)生成雙聲道參數(shù)。雙聲道參數(shù)是用于帶來(lái)3D效果的參數(shù), 并且可以包括HRTF參數(shù)本身。雙聲道參數(shù)是非時(shí)變性值,并且可以具有動(dòng)態(tài)特性。如果下混合信號(hào)是單音信號(hào),則多聲道信息(MI)可以進(jìn)一步包括增益信息 (ADG)。在該情況下,增益信息(ADG)是用于調(diào)整下混合增益的參數(shù),并且在控制用于特定 對(duì)象的增益中是可使用的。在雙聲道輸出的情況下,對(duì)對(duì)象進(jìn)行上采樣或者下采樣是必要 的。優(yōu)選地使用增益信息(ADG)。如果多聲道解碼器330遵循MPS環(huán)繞標(biāo)準(zhǔn),并且多聲道信
      11息(MI)需要根據(jù)MPEG環(huán)繞句法來(lái)進(jìn)行配置,則能夠通過(guò)設(shè)置‘bsArbitraryDownmix = 1, 使用增益信息(ADG)。如果下混合信號(hào)是立體聲信號(hào),則音頻信號(hào)處理裝置300可以進(jìn)一步包括用于立 體聲下混合信號(hào)的左聲道和右聲道的重新?lián)u擺的下混合處理單元(在該圖中未示出)。但 是,在雙聲道渲染中,左聲道和右聲道的交叉項(xiàng)可以通過(guò)HRTF參數(shù)的選擇來(lái)生成。因此,在 下混合處理單元(在該圖中未示出)中的操作不是必需的。如果下混合信號(hào)是立體聲,并 且多聲道信息(MI)遵循MPS環(huán)繞標(biāo)準(zhǔn),則優(yōu)詵地設(shè)置為5-2-5配置樽式。并且,優(yōu)選地通 過(guò)僅繞過(guò)左前聲道和右前聲道來(lái)進(jìn)行輸出。此外,可以以從右前和左前聲道到右輸出和左 輸出(總共四個(gè)參數(shù)設(shè)置)具有有效值而其余的值是零的方式來(lái)傳送雙聲道參數(shù)。多聲道解碼器330使用多聲道信息(MI)和雙聲道參數(shù)從下混合信號(hào)生成雙聲道 輸出。具體地,該多聲道解碼器330能夠通過(guò)將包括在多聲道信息中的空間參數(shù)和雙聲道 參數(shù)的組合應(yīng)用于下混合信號(hào)來(lái)生成雙聲道輸出。在以上的描述中,解釋了用于生成雙聲道輸出的實(shí)施例。類(lèi)似于第一實(shí)施例,如果 經(jīng)由下混合處理單元來(lái)直接生成雙聲道輸出,則無(wú)需執(zhí)行多聲道解碼器的復(fù)雜方案。因此, 可以降低復(fù)雜度。類(lèi)似于第二實(shí)施例,如果使用多聲道解碼器,則能夠使用多聲道解碼器的 功能。3.獨(dú)立對(duì)象的控制(卡拉OK模式/無(wú)伴奏合唱(cappella)模式)在以下的描述中,解釋用于通過(guò)接收單音下混合來(lái)控制獨(dú)立對(duì)象或者背景對(duì)象的 技術(shù)。圖7是根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝 置的框圖,并且圖8是根據(jù)用于控制獨(dú)立對(duì)象的本發(fā)明的另一個(gè)實(shí)施例的用于處理音頻信 號(hào)的裝置的框圖。參考圖7,音頻信號(hào)編碼裝置400的多聲道解碼器410接收多個(gè)聲道信號(hào),并且然 后生成單音下混合(DMXm)和多聲道比特流。在該情況下,多個(gè)聲道信號(hào)是多聲道背景對(duì)象 (MBO)。例如,多聲道背景對(duì)象(MBO)能夠包括配置背景音樂(lè)的多個(gè)樂(lè)器信號(hào)。但是,無(wú) 法知道包括多少源信號(hào)(例如,樂(lè)器信號(hào))。并且,它們不可以按每個(gè)源信號(hào)來(lái)控制。雖然 背景對(duì)象可以被下混合為立體聲聲道,但是本發(fā)明意在描述僅下混合為單音信號(hào)的背景對(duì)象。對(duì)象編碼器420通過(guò)下混合單音背景對(duì)象(DMXm)和至少一個(gè)對(duì)象信號(hào)(ob jN)來(lái) 生成單音下混合(DMX),并且還生成對(duì)象信息比特流。在該情況下,至少一個(gè)對(duì)象信號(hào)(或 者基于對(duì)象的信號(hào))是獨(dú)立對(duì)象,并且可以被稱(chēng)作前景對(duì)象(reo)。例如,如果背景對(duì)象是 伴唱,則獨(dú)立對(duì)象(reo)可以與主唱信號(hào)相對(duì)應(yīng)。當(dāng)然,如果存在兩個(gè)獨(dú)立對(duì)象,則可以分 別與歌手1的有聲信號(hào)和歌手2的有聲信號(hào)相對(duì)應(yīng)。并且,對(duì)象編碼器420能夠進(jìn)一步生 成殘差信息。該對(duì)象編碼器420能夠在下混合單音背景對(duì)象(DMXm)和對(duì)象信號(hào)(ob jN) ( S卩,獨(dú) 立對(duì)象)的過(guò)程中生成殘差。該殘差用于使解碼器從下混合信號(hào)中提取獨(dú)立對(duì)象(或者, 背景對(duì)象)。音頻信號(hào)解碼裝置500的對(duì)象代碼轉(zhuǎn)換器510根據(jù)包括在混合信息(MXT)中的模式選擇信息(MSI)來(lái)使用增強(qiáng)的對(duì)象信息(例如,殘差)從下混合(DMX)中提取至少一個(gè) 獨(dú)立對(duì)象或者背景對(duì)象。該模式選擇信息(MSI)包括指示是否選擇了用于控制背景對(duì)象和至少一個(gè)獨(dú)立 對(duì)象的模式的信息。另外,該模式選擇信息(MSI)可以包括指示規(guī)定的模式與包括正常模 式、用于控制背景對(duì)象的模式和用于控制至少一個(gè)獨(dú)立對(duì)象的模式的模式中的哪一個(gè)相對(duì) 應(yīng)的信息。例如,如果背景對(duì)象是背景音樂(lè),則用于控制背景對(duì)象的模式可以與‘無(wú)伴奏合 唱模式’模式(或者獨(dú)奏模式)相對(duì)應(yīng)。例如,如果獨(dú)立對(duì)象是有聲的,則用于控制至少一 個(gè)獨(dú)立對(duì)象的模式可以與卡拉OK模式相對(duì)應(yīng)。換句話(huà)說(shuō),該模式選擇信息可以是指示是否 選擇了正常模式、‘無(wú)伴奏合唱模式’模式和卡拉OK模式中的一個(gè)的信息。另外,在‘無(wú)伴 奏合唱模式’或者卡拉OK模式的情況下,可以進(jìn)一步包括關(guān)于增益調(diào)整的信息??傊?,如果 模式選擇信息(MSI)是‘無(wú)伴奏合唱模式’或者卡拉OK模式,則從下混合(DMX)中提取至 少一個(gè)獨(dú)立對(duì)象或者背景對(duì)象。在正常模式的情況下,該下混合信號(hào)可以經(jīng)過(guò)旁路。如果提取了獨(dú)立對(duì)象,則該對(duì)象代碼轉(zhuǎn)換器510通過(guò)使用對(duì)象信息(OI)、混合信 息(MI)等混合至少一個(gè)獨(dú)立對(duì)象和背景對(duì)象來(lái)生成混合的單音下混合。在該情況下,該對(duì) 象信息(OI)是從對(duì)象信息比特流中提取的信息,并且可以與在先前的描述中解釋的相同。 并且,混合信息(MXI)可以是用于調(diào)整對(duì)象增益和/或搖擺的信息。同時(shí),對(duì)象代碼轉(zhuǎn)換器510使用多聲道比特流和/或?qū)ο笮畔⒈忍亓鱽?lái)生成多聲 道信息(Ml)。可以提供該多聲道信息(MI)來(lái)控制背景對(duì)象或者至少一個(gè)獨(dú)立對(duì)象。在該 情況下,該多聲道信息可以包括用于控制背景對(duì)象的第一多聲道信息和用于控制至少一個(gè) 獨(dú)立對(duì)象的第二多聲道信息中的至少一個(gè)。并且,多聲道解碼器520從使用多聲道信息(MI)混合的單音下混合或者繞過(guò)的單 音下混合來(lái)生成輸出信號(hào)。圖8是用于獨(dú)立對(duì)象生成的另一個(gè)實(shí)施例的示圖。參考圖8,音頻信號(hào)處理單元600接收單音下混合(DMX)。該音頻信號(hào)處理裝置 600包括下混合處理單元610、多聲道解碼器620、OTN模塊630和渲染單元640。音頻信號(hào)處理裝置600根據(jù)模式選擇信息(MSI)來(lái)確定是否將下混合信號(hào)輸入到 OTN模塊630。在該情況下,該模式選擇信息可以與參考圖7描述的以前的模式選擇信息相 同。如果根據(jù)該模式選擇信息當(dāng)前的模式是用于控制背景對(duì)象(MBO)或者至少一個(gè) 獨(dú)立對(duì)象(reo)的模式,則允許將下混合信號(hào)輸入到OTN模塊630。如果根據(jù)模式選擇信 息,當(dāng)前模式是正常模式,則該下混合信號(hào)繞過(guò)OTN模塊530,而根據(jù)輸出模式輸入到下混 合處理單元610或者多聲道解碼器620。在該情況下,輸出模式與參考圖1描述的輸出模式 信息(OM)相同,并且可以包括輸出揚(yáng)聲器的數(shù)目。在輸出模式是單音/立體聲/雙聲道輸出模式的情況下,下混合處理單元610處 理下混合。在該情況下,下混合處理單元610可以是起與參考圖1/圖2/圖3描述的先前 的下混合處理單元130/130A/130B相同作用的單元。在輸出模式是多聲道模式的情況下,多聲道解碼器620從單音下混合(DMX)生成 多聲道輸出。同樣地,該多聲道解碼器620可以用作與參考圖1描述的以前的多聲道解碼 器140相同的單元。
      13
      同時(shí),如果根據(jù)模式選擇信息(MSI)將單音下混合信號(hào)輸入到OTN模塊630,則 OTN模塊630從下混合信號(hào)中提取單音背景對(duì)象(MBO)和至少一個(gè)獨(dú)立對(duì)象信號(hào)(TOO)。在 該情況下,OTN是一到η的縮寫(xiě)。如果存在一個(gè)獨(dú)立對(duì)象信號(hào),則OTN模塊可以具有OTT( — 到二)結(jié)構(gòu)。如果存在兩個(gè)獨(dú)立對(duì)象信號(hào),則該OTN模塊可以具有OTT(—到三)結(jié)構(gòu)。如 果存在(N-I)個(gè)獨(dú)立對(duì)象信號(hào),則該OTN模塊可以具有OTN結(jié)構(gòu)。該OTN模塊630能夠使用對(duì)象信息(OI)和增強(qiáng)的對(duì)象信息(EDI)。在該情況下, 該增強(qiáng)的對(duì)象信息(EOI)可以是在下混合背景對(duì)象和獨(dú)立對(duì)象的過(guò)程中生成的殘差信號(hào)。并且,渲染單元640通過(guò)使用混合信息(MXI)來(lái)渲染背景信息(MBO)和獨(dú)立對(duì)象 (FGO)來(lái)生成輸出聲道信號(hào)。在該情況下,混合信息(MXI)包括用于控制背景對(duì)象的信息和 /或用于控制獨(dú)立對(duì)象的信息。同時(shí),可以基于對(duì)象信息(OI)和混合信息(MXI)來(lái)生成多 聲道信息(Ml)。在該情況下,將輸出聲道信號(hào)輸入到多聲道解碼器(在該圖中未示出),并 且然后可以基于該多聲道信息來(lái)進(jìn)行上混合。圖9是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第一實(shí)施例的用于處理音頻信號(hào)的 裝置的框圖,圖10是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第二實(shí)施例的用于處理音頻信 號(hào)的裝置的框圖,并且圖11和圖12是根據(jù)用于處理增強(qiáng)的對(duì)象的本發(fā)明的第三實(shí)施例的 用于處理音頻信號(hào)的裝置的框圖。第一實(shí)施例涉及單音下混合和單音對(duì)象。第二實(shí)施例涉及單音下混合和立體聲對(duì) 象。并且,第三實(shí)施例涉及涵蓋第一和第二實(shí)施例的兩種情況的情況。參考圖9,音頻信號(hào)編碼裝置700A的增強(qiáng)的對(duì)象信息編碼器710從是單音信號(hào)的 混合的音頻信號(hào)生成增強(qiáng)的對(duì)象信息(EOP_Xl)和對(duì)象信號(hào)(obj_Xl)。在該情況下,由于一 個(gè)信號(hào)使用兩個(gè)信號(hào)來(lái)生成,所以增強(qiáng)的對(duì)象信息編碼器710可以被實(shí)現(xiàn)為OTT( —到二) 編碼模塊。在該情況下,增強(qiáng)的對(duì)象信息(EOP_Xl)可以是殘差信號(hào)。并且,增強(qiáng)的對(duì)象信 息編碼器710生成與該OTT模塊相對(duì)應(yīng)的對(duì)象信息(0P_Xl)。音頻信號(hào)解碼裝置800Α的增強(qiáng)的對(duì)象信息解碼器810使用增強(qiáng)的對(duì)象信息(ΕΟΡ_ X1)和混合的音頻信號(hào)來(lái)生成與附加的重新混合數(shù)據(jù)相對(duì)應(yīng)的輸出信號(hào)(obj_Xl‘)。參考圖10,音頻信號(hào)編碼裝置700B包括第一增強(qiáng)的對(duì)象信息編碼器710B和第二 增強(qiáng)的對(duì)象信息編碼器720B。并且,音頻信號(hào)解碼裝置800B包括第一增強(qiáng)的對(duì)象信息解碼 器_和第二增強(qiáng)的對(duì)象信息解碼器_。第一增強(qiáng)的對(duì)象信息編碼器710B通過(guò)將兩個(gè)對(duì)象信號(hào)(obj_Xl,obj_x2)合并在一 起來(lái)生成合并的對(duì)象和第一增強(qiáng)的對(duì)象信息(E0P_L1)。在該情況下,兩個(gè)對(duì)象信號(hào)可以包 括立體聲對(duì)象信號(hào),即,對(duì)象的左聲道信號(hào)和該對(duì)象的右聲道信號(hào)。在生成合并的對(duì)象的過(guò) 程中,生成第一對(duì)象信息(0P_L1)。第二增強(qiáng)的對(duì)象信息編碼器720B使用是單音信號(hào)的混合的音頻信號(hào)和合并的對(duì) 象來(lái)生成第二增強(qiáng)的對(duì)象信息(EOP_LO)和第二對(duì)象信息(OP_LO)。因此,最后的信號(hào)通過(guò)以上的兩個(gè)步驟來(lái)生成。由于第一和第二增強(qiáng)的對(duì)象信息 編碼器710B和720B的每一個(gè)從兩個(gè)信號(hào)生成一個(gè)信號(hào),所以它可以被實(shí)現(xiàn)為OTT (—到 二)模塊。該音頻信號(hào)解碼裝置800B執(zhí)行與音頻信號(hào)編碼裝置700B相反的過(guò)程。具體地,第二增強(qiáng)的對(duì)象信息解碼器_使用第二增強(qiáng)的對(duì)象信息(EOP_LO)和混合的音頻信號(hào)來(lái)生成合并的對(duì)象。在該情況下,可以進(jìn)一步提取音頻信號(hào)。并且,第一增強(qiáng)的對(duì)象信息解碼器型巡使用第一增強(qiáng)的對(duì)象信息(E0P_L1)從合 并的對(duì)象中生成兩個(gè)對(duì)象(Obj_x/ ,obj_x2‘),其是附加的再混合數(shù)據(jù)。圖11和圖12示出了第一和第二實(shí)施例的合并的結(jié)構(gòu)。參考圖11,如果根據(jù)在多 聲道編碼器705C的5-1-5或者5-2-5樹(shù)形結(jié)構(gòu)的操作的存在或者不存來(lái)將增強(qiáng)的對(duì)象改 變?yōu)閱我艋蛘吡Ⅲw聲,則將下混合信號(hào)改變?yōu)閱我粜盘?hào)或者立體聲信號(hào)。參考圖11和圖12,在增強(qiáng)的對(duì)象是單音信號(hào)的情況下,不操作第一增強(qiáng)的對(duì)象信 息編碼器710C和第一增強(qiáng)的信息解碼器820C。元件的功能分別地與關(guān)于圖10描述的相同 名稱(chēng)的那些相同。同時(shí),在下混合信號(hào)是單音的情況下,第二增強(qiáng)的對(duì)象信息編碼器720C和第二增 強(qiáng)的信息解碼器810C優(yōu)選地分別作為OTT編碼器和OTT解碼器來(lái)進(jìn)行操作。在下混合信 號(hào)是立體聲的情況下,第二增強(qiáng)的對(duì)象信息編碼器720C和第二增強(qiáng)的信息解碼器810C可 以分別作為T(mén)IT編碼器和TIT解碼器來(lái)操作。根據(jù)本發(fā)明,上述音頻信號(hào)處理方法可以在記錄程序的介質(zhì)中被實(shí)現(xiàn)為計(jì)算機(jī)可 讀代碼。計(jì)算機(jī)可讀介質(zhì)包括各種記錄設(shè)備,其中存儲(chǔ)計(jì)算機(jī)系統(tǒng)可讀的數(shù)據(jù)。計(jì)算機(jī)可 讀的介質(zhì)包括,例如,ROM、RAM、CD-ROM、磁帶、軟盤(pán)、光數(shù)據(jù)存儲(chǔ)設(shè)備等,并且還包括載波型 實(shí)施方式(例如,經(jīng)由因特網(wǎng)的傳輸)。另外,將通過(guò)編碼方法生成的比特流存儲(chǔ)在計(jì)算機(jī) 可讀記錄介質(zhì)中,或者可以經(jīng)由有線(xiàn)/無(wú)線(xiàn)通信網(wǎng)絡(luò)進(jìn)行傳送。工業(yè)實(shí)用性因此,本發(fā)明適用于編碼和解碼音頻信號(hào)。雖然已經(jīng)在此處參考本發(fā)明的優(yōu)選實(shí)施例描述和說(shuō)明了本發(fā)明,但是對(duì)于本領(lǐng)域 技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的是,在不脫離本發(fā)明的精神和范圍的情況下,可以在其中進(jìn)行各 種的修改和變化。因此,希望本發(fā)明涵蓋落入所附權(quán)利要求和其等價(jià)物的范圍內(nèi)的本發(fā)明 的修改和變化。
      權(quán)利要求
      一種處理音頻信號(hào)的方法,包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成所述下混合信號(hào)時(shí)提取的對(duì)象信息;接收用于控制所述對(duì)象信號(hào)的混合信息;根據(jù)輸出模式使用所述對(duì)象信息和所述混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè);以及如果生成了所述下混合處理信息,則通過(guò)將所述下混合處理信息應(yīng)用于所述下混合信號(hào)來(lái)生成輸出信號(hào),其中,所述下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,所述輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于所述下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng),以及其中,所述多聲道信息與用于將所述下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。
      2.根據(jù)權(quán)利要求1所述的方法,其中,所述下混合信號(hào)和所述輸出信號(hào)的每個(gè)與在時(shí) 間域上的信號(hào)相對(duì)應(yīng)。
      3.根據(jù)權(quán)利要求1所述的方法,其中,所述生成所述輸出信號(hào)包括 通過(guò)分解所述下混合信號(hào)來(lái)生成子帶信號(hào);通過(guò)使用所述下混合處理信息處理所述子帶信號(hào)來(lái)生成兩個(gè)子帶信號(hào);以及 通過(guò)分別地合成所述兩個(gè)子帶信號(hào)來(lái)生成所述輸出信號(hào)。
      4.根據(jù)權(quán)利要求3所述的方法,其中,所述生成所述兩個(gè)子帶信號(hào)包括 通過(guò)去相關(guān)所述子帶信號(hào)來(lái)生成去相關(guān)的信號(hào);以及通過(guò)使用所述下混合處理信息處理所述去相關(guān)的信號(hào)和所述子帶信號(hào)來(lái)生成所述兩 個(gè)子帶信號(hào)。
      5.根據(jù)權(quán)利要求1所述的方法,其中,所述下混合處理信號(hào)包括雙聲道參數(shù),并且其 中,所述輸出信號(hào)與雙聲道信號(hào)相對(duì)應(yīng)。
      6.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果生成了所述多聲道信息,則通過(guò)使用 所述多聲道信息對(duì)所述下混合信號(hào)進(jìn)行上混合來(lái)生成多個(gè)聲道信號(hào)。
      7.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定所述輸出模式,并且 其中,所述揚(yáng)聲器聲道數(shù)目基于設(shè)備信息和所述混合信息中的一個(gè)。
      8.一種用于處理音頻信號(hào)的裝置,包括多路分解器,所述多路分解器接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成所 述下混合信號(hào)時(shí)提取的對(duì)象信息;信息生成單元,所述信息生成單元根據(jù)輸出模式使用所述對(duì)象信息和用于控制所述對(duì) 象信號(hào)的混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè);以及下混合處理單元,如果生成了所述下混合處理信息,則所述下混合處理單元通過(guò)將所 述下混合處理信息應(yīng)用于所述下混合信號(hào)來(lái)生成輸出信號(hào), 其中,所述下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,所述輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于所述下混合信號(hào)所生成的立體聲信號(hào)相 對(duì)應(yīng),以及其中,所述多聲道信息與用于將所述下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。
      9.根據(jù)權(quán)利要求8所述的裝置,其中,所述下混合信號(hào)和所述輸出信號(hào)與時(shí)間域上的 信號(hào)相對(duì)應(yīng)。
      10.根據(jù)權(quán)利要求8所述的裝置,其中,所述下混合處理單元包括子帶分解單元,所述子帶分解單元通過(guò)分解所述下混合信號(hào)來(lái)生成子帶信號(hào); M2M處理單元,所述M2M處理單元通過(guò)使用所述下混合處理信息處理所述子帶信號(hào)來(lái) 生成兩個(gè)子帶信號(hào);以及合成單元,所述合成單元通過(guò)分別合成所述兩個(gè)子帶信號(hào)來(lái)生成所述輸出信號(hào)。
      11.根據(jù)權(quán)利要求10所述的裝置,其中,所述M2S處理單元進(jìn)一步包括去相關(guān)器,所 述去相關(guān)器通過(guò)去相關(guān)所述子帶信號(hào)來(lái)生成去相關(guān)的信號(hào);以及其中,所述合成單元通過(guò)使用所述下混合處理信息處理所述去相關(guān)的信號(hào)和所述子帶 信號(hào)來(lái)生成所述兩個(gè)子帶信號(hào)。
      12.根據(jù)權(quán)利要求8所述的裝置,其中,所述下混合處理信息包括雙聲道參數(shù),并且其 中,所述輸出信號(hào)與雙聲道信號(hào)相對(duì)應(yīng)。
      13.根據(jù)權(quán)利要求8所述的裝置,進(jìn)一步包括多聲道解碼器,如果生成了所述多聲道 信息,則所述多聲道解碼器通過(guò)使用所述多聲道信息對(duì)所述下混合信息進(jìn)行上混合來(lái)生成 多個(gè)聲道信號(hào)。
      14.根據(jù)權(quán)利要求8所述的裝置,其中,根據(jù)揚(yáng)聲器聲道數(shù)目來(lái)確定所述輸出模式,并 且其中,所述揚(yáng)聲器聲道數(shù)目基于設(shè)備信息和所述混合信息中的一個(gè)。
      15.一種包括存儲(chǔ)在其中的程序的計(jì)算機(jī)可讀記錄介質(zhì),所述程序被提供用于執(zhí)行處 理音頻信號(hào)的方法,所述方法包括接收包括至少一個(gè)對(duì)象信號(hào)的時(shí)域下混合信號(hào)以及在生成所述下混合信號(hào)時(shí)提取的 對(duì)象信息;接收用于控制所述對(duì)象信號(hào)的混合信息;根據(jù)輸出模式使用所述對(duì)象信息和所述混合信息來(lái)生成下混合處理信息和多聲道信 息中的一個(gè);以及如果生成了所述下混合處理信息,則通過(guò)將所述下混合處理信息應(yīng)用于所述下混合信 號(hào)來(lái)生成輸出信號(hào),其中,所述下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,所述輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于所述下混合信號(hào)所生成的立體聲信號(hào)相 對(duì)應(yīng),以及其中,所述多聲道信息與用于將所述下混合信號(hào)上混合為多個(gè)聲道信號(hào)的信息相對(duì)應(yīng)。 全文摘要
      公開(kāi)了一種處理音頻信號(hào)的方法和裝置。本發(fā)明包括接收包括至少一個(gè)對(duì)象信號(hào)的下混合信號(hào)以及在生成下混合信號(hào)時(shí)提取的對(duì)象信息;接收用于控制對(duì)象信號(hào)的混合信息;根據(jù)輸出模式使用對(duì)象信息和混合信息來(lái)生成下混合處理信息和多聲道信息中的一個(gè);以及如果生成了下混合處理信息,則通過(guò)將下混合處理信息應(yīng)用于下混合信號(hào)來(lái)生成輸出信號(hào),其中,下混合信號(hào)與單音信號(hào)相對(duì)應(yīng),其中,輸出信號(hào)與通過(guò)將去相關(guān)器應(yīng)用于下混合信號(hào)所生成的立體聲信號(hào)相對(duì)應(yīng),并且其中,多聲道信息與用于將下混合信號(hào)上混合為多聲道信號(hào)的信息相對(duì)應(yīng)。
      文檔編號(hào)H04S7/00GK101911732SQ200880122770
      公開(kāi)日2010年12月8日 申請(qǐng)日期2008年12月31日 優(yōu)先權(quán)日2008年1月1日
      發(fā)明者吳賢午, 鄭亮源 申請(qǐng)人:Lg電子株式會(huì)社
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1