国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      音頻信號(hào)譯碼器、對(duì)音頻信號(hào)譯碼的方法、以及使用級(jí)聯(lián)音頻對(duì)象處理級(jí)的計(jì)算機(jī)程序的制作方法

      文檔序號(hào):2824829閱讀:225來源:國(guó)知局
      專利名稱:音頻信號(hào)譯碼器、對(duì)音頻信號(hào)譯碼的方法、以及使用級(jí)聯(lián)音頻對(duì)象處理級(jí)的計(jì)算機(jī)程序的制作方法
      技術(shù)領(lǐng)域
      根據(jù)本發(fā)明的實(shí)施方式涉及用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息而提供上混信號(hào)表示型態(tài)的一種音頻信號(hào)譯碼器。根據(jù)本發(fā)明的其它實(shí)施方式涉及用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息而提供上混信號(hào)表示型態(tài)的一種方法。根據(jù)本發(fā)明的其它實(shí)施方式涉及一種計(jì)算機(jī)程序。根據(jù)本發(fā)明的若干實(shí)施方式涉及一種進(jìn)階的卡拉OK/獨(dú)唱SAOC系統(tǒng)。
      背景技術(shù)
      在現(xiàn)代音頻系統(tǒng),期望以比特率有效方式傳送與儲(chǔ)存音頻信息。此外,經(jīng)常期望使用房間內(nèi)空間分散的二揚(yáng)聲器或甚至更多揚(yáng)聲器來重制一音頻內(nèi)容。在此種情況下,期望探勘此種多揚(yáng)聲器配置的能力來允許使用者可在空間上識(shí)別不同音頻內(nèi)容或單一音頻內(nèi)容的不同項(xiàng)目。此項(xiàng)目的可通過將不同音頻內(nèi)容分開地分配至不同的揚(yáng)聲器而達(dá)成。換言之,在音頻處理、音頻傳輸及音頻儲(chǔ)存技術(shù)領(lǐng)域,越來越期望處理多信道內(nèi)容而改善聽覺感受。使用多信道音頻內(nèi)容給使用者帶來顯著改善。舉例言之,可獲得三維空間的聽覺感受,其帶來娛樂用途上改善的使用者的滿足。但多信道音頻內(nèi)容也可用于專業(yè)領(lǐng)域,例如用于電話會(huì)議用途,原因在于通過使用多信道音頻回放,可改良揚(yáng)聲器的識(shí)別性。但也期望音頻質(zhì)量與比特率要求間有妥善折衷,以免因多信道應(yīng)用造成過度資源負(fù)荷。最近,已經(jīng)提出了用于含多個(gè)音頻對(duì)象的音頻場(chǎng)景的比特率有效傳輸及/或儲(chǔ)存的參數(shù)技術(shù),例如雙聲道提示編碼(I型)(參見例如參考文獻(xiàn)[BCC])、聯(lián)合來源編碼(參見例如參考文獻(xiàn)[JSC])、及MPEG空間音頻對(duì)象編碼(SAOC)(參見例如參考文獻(xiàn)[SA0C1]、 [SA0C2])。這些技術(shù)是針對(duì)知覺上重構(gòu)期望的輸出音頻場(chǎng)景而非通過波形匹配。圖8示出此種系統(tǒng)(此處MPEG SA0C)的系統(tǒng)綜覽。圖8示出的MPEG SAOC系統(tǒng) 800包括SAOC編碼器810及SAOC譯碼器820。該SAOC編碼器810接收多個(gè)對(duì)象信號(hào)X1至 %,其可表示為例如時(shí)域信號(hào)或時(shí)頻域信號(hào)(例如,呈傅利葉轉(zhuǎn)換的轉(zhuǎn)換系數(shù)集合形式,或呈QMF次頻帶信號(hào)形式)。SAOC編碼器810典型地也接收與對(duì)象信號(hào)X1至%相關(guān)聯(lián)的下混系數(shù)屯至屯。下混系數(shù)的分開集合可供下混信號(hào)的各信道利用。SAOC編碼器810典型地被配置為通過根據(jù)相關(guān)聯(lián)的下混系數(shù)Cl1至dN組合對(duì)象信號(hào)X1至%而獲得下混信號(hào)信道。 典型地,具有比對(duì)象信號(hào)X1至%更少的下混信道。為了允許(至少近似允許)在SAOC譯碼器820該端的對(duì)象信號(hào)的分開(或分開處理),SAOC編碼器810提供一個(gè)或多個(gè)下混信號(hào)(標(biāo)示為下混信道)812及旁信息814兩者。旁信息814描述對(duì)象信號(hào)X1至%的特性, 以便允許譯碼器端的特定對(duì)象處理。SAOC譯碼器820被配置為接收一個(gè)或多個(gè)下混信號(hào)812及旁信息814兩者。此外,SAOC譯碼器820典型地被配置為接收使用者互動(dòng)信息及/或使用者控制信息822,其描述期望的描繪設(shè)定值。舉例言之,使用者互動(dòng)信息/使用者控制信息822可描述揚(yáng)聲器設(shè)定值及由對(duì)象信號(hào)&至&所提供的這些對(duì)象期望的空間位置。SAOC譯碼器820被配置為提供例如多個(gè)已譯碼的上混信道信號(hào)免至;^。這些上混信道信號(hào)可與多揚(yáng)聲器描繪配置的個(gè)別揚(yáng)聲器相關(guān)聯(lián)。SAOC譯碼器820例如可包含對(duì)象分離器820a,其被配置為基于一個(gè)或多個(gè)下混信號(hào)812及旁信息814,至少近似重構(gòu)對(duì)象信號(hào)X1至%,借此獲得重構(gòu)的對(duì)象信號(hào)820b。但該重構(gòu)的對(duì)象信號(hào)820b可能略為偏離原先對(duì)象信號(hào),例如,原因在于由于比特率限制而旁信息814可能并非相當(dāng)足以用于完美重構(gòu)。SAOC譯碼器820可進(jìn)一步包括混合器820c,其可被配置為接收該重構(gòu)的對(duì)象信號(hào) 820b及使用者互動(dòng)信息及/或使用者控制信息822,以及基于此而提供上混信道信號(hào)丸至 yu?;旌掀?20c可經(jīng)組配來使用該使用者互動(dòng)信息及/或使用者控制信息822而判定個(gè)別重構(gòu)的對(duì)象信號(hào)820b對(duì)上混信道信號(hào)丸至;^的貢獻(xiàn)。使用者互動(dòng)信息及/或使用者控制信息822例如可包含描繪信息(也標(biāo)識(shí)為描繪系數(shù)),其判定個(gè)別重構(gòu)的對(duì)象信號(hào)820b 對(duì)上混信道信號(hào)丸至的貢獻(xiàn)。但須注意于多個(gè)實(shí)施例中,對(duì)象的分開(通過圖8的對(duì)象分離器820a指示)與混合(通過圖8的混合器820c指示)在一個(gè)單一步驟中執(zhí)行。為了達(dá)成此項(xiàng)目的,可運(yùn)算總參數(shù),其描述將一個(gè)或多個(gè)下混信號(hào)812直接映像至上混信道信號(hào)丸至^/。這些參數(shù)可基于旁信息814及使用者互動(dòng)信息及/或使用者控制信息822運(yùn)算?,F(xiàn)在參考圖9a、9b及9c,將說明基于下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的旁信息用以獲得上混信號(hào)表示型態(tài)的不同裝置。圖9a示出包括SAOC譯碼器920的MPEG SAOC系統(tǒng) 900的方塊示意圖。SAOC譯碼器920包括對(duì)象譯碼器922及混合器/描繪器擬6作為分開的功能區(qū)塊。該對(duì)象譯碼器922根據(jù)下混信號(hào)表示型態(tài)(例如,呈以時(shí)域或時(shí)頻域表示的一個(gè)或多個(gè)下混信號(hào)形式)及對(duì)象相關(guān)的旁信息(例如,呈對(duì)象母數(shù)據(jù)形式)而提供多個(gè)重構(gòu)的對(duì)象信號(hào)924?;旌掀?描繪器擬6接收與多數(shù)N個(gè)對(duì)象相關(guān)聯(lián)的重構(gòu)的對(duì)象信號(hào) 924,及基于此信號(hào)而提供一個(gè)或多個(gè)上混信道信號(hào)擬8。在SAOC譯碼器920中,對(duì)象信號(hào) 924的提取與混合/描繪分開執(zhí)行,其允許對(duì)象譯碼功能與混合/描繪功能分開,但帶來相當(dāng)高的運(yùn)算復(fù)雜度?,F(xiàn)在參考圖9b,將簡(jiǎn)短討論另一種MPEG SAOC系統(tǒng)930,其包括SAOC譯碼器950。 SAOC譯碼器950根據(jù)下混信號(hào)表示型態(tài)(例如,呈一個(gè)或多個(gè)下混信號(hào)形式)及對(duì)象相關(guān)的旁信息(例如,呈對(duì)象母數(shù)據(jù)形式)而提供多個(gè)上混信道信號(hào)958。SAOC譯碼器950包括組合型對(duì)象譯碼器及混合器/描繪器,其被配置為在聯(lián)合混合處理中獲得上混信道信號(hào) 958而未分開對(duì)象譯碼與混合/描繪,其中,這些用于聯(lián)合上混處理的參數(shù)取決對(duì)象相關(guān)的旁信息及描繪信息兩者。聯(lián)合上混處理也取決于下混信息,其被視為該對(duì)象相關(guān)的旁信息的一部分。綜上所述,上混信道信號(hào)958的提供可以一步式處理或兩步式處理執(zhí)行。現(xiàn)在參考圖9c,將說明一種MPEG SAOC系統(tǒng)960。SAOC系統(tǒng)960包括SAOC至MPEG 環(huán)繞轉(zhuǎn)碼器980而非SAOC譯碼器。SAOC至MPEG環(huán)繞轉(zhuǎn)碼器包括旁信息轉(zhuǎn)碼器982,其被配置為接收對(duì)象相關(guān)的旁信息(例如,呈對(duì)象母數(shù)據(jù)形式),以及可選地,一個(gè)或多個(gè)下混信號(hào)的信息及描繪信息。旁信息轉(zhuǎn)碼器也被配置為基于所接收的數(shù)據(jù)而提供MPEG環(huán)繞旁信息984 (例如,呈MPEG環(huán)繞比特流形式)。如此,旁信息轉(zhuǎn)碼器982被配置為考慮描繪信息,以及可選地,有關(guān)一個(gè)或多個(gè)下混信號(hào)內(nèi)容的信息,而將自該對(duì)象編碼器所釋出的對(duì)象相關(guān)的(參數(shù))旁信息轉(zhuǎn)換成信道相關(guān)的(參數(shù))旁信息984??蛇x地,該SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980可被配置為操縱例如由下混信號(hào)表示型態(tài)所描述的一個(gè)或多個(gè)下混信號(hào)而獲得已經(jīng)操縱的下混信號(hào)表示型態(tài)988。但可刪除下混信號(hào)操縱器986,使得SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980的輸出下混信號(hào)表示型態(tài)988與SAOC 至MPEG環(huán)繞轉(zhuǎn)碼器的輸入下混信號(hào)表示型態(tài)相同。若基于SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980的輸入下混信號(hào)表示型態(tài),信道相關(guān)的MPEG環(huán)繞旁信息984不允許提供期望的聽覺感受(在某些描繪系列可能為此種情況),則可使用下混信號(hào)操縱器986。如此,SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980提供下混信號(hào)表示型態(tài)988及MPEG環(huán)繞旁信息984,因而使用接收MPEG環(huán)繞旁信息984及下混信號(hào)表示型態(tài)988的MPEG環(huán)繞譯碼器, 可產(chǎn)生多個(gè)上混信道信號(hào),這些信號(hào)表示根據(jù)輸入SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980的描繪信息的音頻對(duì)象。綜上所述,可使用用來譯碼經(jīng)SAOC編碼的音頻信號(hào)的不同構(gòu)想。在某些情況下, 使用SAOC譯碼器,其根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)旁信息而提供上混信道信號(hào)(例如,上混信道信號(hào)928、958)。此種構(gòu)想的實(shí)例可參考第9a及9b圖。另外,經(jīng)SAOC 編碼的音頻信息可經(jīng)轉(zhuǎn)碼來獲得下混信號(hào)表示型態(tài)(例如,下混信號(hào)表示型態(tài)988)及信道相關(guān)的旁信息(例如,信道相關(guān)的MPEG環(huán)繞旁信息984),其可由MPEG環(huán)繞譯碼器用來提供期望的上混信道信號(hào)。在MPEG SAOC系統(tǒng)800中,其系統(tǒng)綜覽提供于圖8,一般處理以頻率選擇方式進(jìn)行, 而在各頻帶內(nèi)可描述如下· N個(gè)輸入音頻對(duì)象信號(hào)X1至%經(jīng)下混作為SAOC編碼器處理的一部分。用于單聲道下混,下混系數(shù)以Cl1至dN表示。此外,SAOC編碼器810提取描述輸入音頻對(duì)象的特性的旁信息814。用于MPEG SA0C,相對(duì)于彼此的對(duì)象功率關(guān)系為此種旁信息的最基本形式。 下混信號(hào)812及旁信息814經(jīng)傳送及/或儲(chǔ)存。為了達(dá)到該目的,下混音頻信號(hào)可使用眾所周知的知覺音頻編碼器諸如MPEG-I層II或?qū)覫II (亦稱「. mp3j )、MPEG進(jìn)階音頻編碼(AAC)、或任何其它音頻編碼器壓縮?!ぴ诮邮斩?,SAOC譯碼器820在構(gòu)想上嘗試使用所傳送的旁信息814(及當(dāng)然,一個(gè)或多個(gè)下混信號(hào)812)而轉(zhuǎn)存該原先對(duì)象信號(hào)(「對(duì)象分離」)。這些近似的對(duì)象信號(hào)(也稱作為重構(gòu)的對(duì)象信號(hào)820b)然后使用描繪矩陣而混合成由M個(gè)音頻輸出信道(其例如可以上混信道信號(hào)、至9m表示)的一標(biāo)靶場(chǎng)景。用于單聲道輸出,描繪矩陣系數(shù)系以巧至!·, 表不?!び行У?,罕見執(zhí)行(或甚至未曾執(zhí)行)對(duì)象信號(hào)的分離,原因在于分離步驟(以對(duì)象分離器820a指示)及混合步驟(以混合器820C)兩者組合成單一轉(zhuǎn)碼步驟,其經(jīng)常導(dǎo)致運(yùn)算復(fù)雜度的大減。已經(jīng)發(fā)現(xiàn)此種體系極度有效,無論就傳送比特率(只需傳送數(shù)個(gè)下混信道加若干旁信息而非N個(gè)離散對(duì)象音頻信號(hào)或離散系統(tǒng))及運(yùn)算復(fù)雜度(處理復(fù)雜度主要涉及輸出信道數(shù)目而非音頻對(duì)象數(shù)目)而言都如此。對(duì)接收端的使用者的其他優(yōu)點(diǎn)包括其選擇描繪設(shè)定值(單聲道、立體聲、環(huán)繞音效、虛擬頭戴式耳機(jī)回放等)的選擇自由度及使用者互動(dòng)性特征描繪矩陣,及如此輸出場(chǎng)景可由使用者根據(jù)其意愿、個(gè)人偏好或其它標(biāo)準(zhǔn)而以互動(dòng)方式設(shè)定與改變。舉例言之,可自共同位在一個(gè)空間區(qū)的一組群中定位該消息源(發(fā)話者) 來最大化與其它消息源的區(qū)別。這種互動(dòng)性系經(jīng)由提供譯碼器使用者接口來達(dá)成。對(duì)各個(gè)所傳送的聲音對(duì)象,可調(diào)整其相對(duì)位準(zhǔn)及(用于非單聲道描繪)描繪的空間位置。當(dāng)使用者改變相關(guān)的圖形使用者接口(⑶I)滑動(dòng)件的位置(例如對(duì)象位準(zhǔn) (level) =+58分貝,對(duì)象位置=-30度)時(shí)可能實(shí)時(shí)出現(xiàn)。但發(fā)現(xiàn)難以在此種系統(tǒng)中處理不同型音頻對(duì)象的音頻對(duì)象。具體地,發(fā)現(xiàn)若欲處理的音頻對(duì)象總數(shù)未經(jīng)預(yù)先測(cè)定,則難以處理不同型音頻對(duì)象的音頻對(duì)象,例如與不同的旁信息相關(guān)聯(lián)的音頻對(duì)象。有鑒于此種情況,本發(fā)明的一目的在于形成一種構(gòu)想,其允許包括下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息的音頻信號(hào)的運(yùn)算有效和彈性譯碼,其中,該對(duì)象相關(guān)的參數(shù)信息描述了二個(gè)或多個(gè)不同型音頻對(duì)象的音頻對(duì)象。

      發(fā)明內(nèi)容
      該目的通過獨(dú)立權(quán)利要求所定義的一種用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息而提供上混信號(hào)表示型態(tài)的音頻信號(hào)譯碼器、一種用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息而提供上混信號(hào)表示型態(tài)的方法、及一種計(jì)算機(jī)程序而實(shí)現(xiàn)。根據(jù)本發(fā)明的一實(shí)施方式形成一種用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息提供上混信號(hào)表示型態(tài)的音頻信號(hào)譯碼器。該音頻信號(hào)譯碼器包括配置為分解該下混信號(hào)表示型態(tài)的對(duì)象分離器,其根據(jù)該下混信號(hào)表示型態(tài)提供描述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的第一音頻信息,和描述第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的第二音頻信息。該音頻信號(hào)譯碼器還包括配置為接收該第二音頻信息及根據(jù)該對(duì)象相關(guān)的參數(shù)信息而處理該第二音頻信息的音頻信號(hào)處理器,以獲得該第二音頻信息的已處理的版本。該音頻信號(hào)譯碼器還包括配置為組合該第一音頻信息與該第二音頻信息的該已處理的版本的音頻信號(hào)組合器,以獲得該上混信號(hào)表示型態(tài)。本發(fā)明的關(guān)鍵構(gòu)想為可以級(jí)聯(lián)結(jié)構(gòu)獲得不同型音頻對(duì)象的有效處理,其允許在由該對(duì)象分離器所執(zhí)行的第一處理步驟中使用至少部分對(duì)象相關(guān)的參數(shù)信息來分離不同型音頻對(duì)象,及其允許通過該音頻信號(hào)處理器根據(jù)至少部分對(duì)象相關(guān)的參數(shù)信息,執(zhí)行第二處理步驟的額外空間處理。發(fā)現(xiàn)自下混信號(hào)表示型態(tài)提取包含第二音頻對(duì)象類型的音頻對(duì)象的第二音頻信息可以以中等復(fù)雜度執(zhí)行,即使有較大量的第二音頻對(duì)象類型的音頻對(duì)象也如此。此外,發(fā)現(xiàn)一旦第二音頻信息與描述這些第一音頻對(duì)象類型的音頻對(duì)象的第一音頻信息分開時(shí),可有效執(zhí)行第二音頻對(duì)象類型的音頻對(duì)象的空間處理。此外,發(fā)現(xiàn)若第二音頻對(duì)象類型的音頻對(duì)象的對(duì)象-個(gè)別處理延遲至該音頻信號(hào)處理器,而未與第一音頻信息及第二音頻信息的分開的同時(shí)執(zhí)行,則通過對(duì)象分離器執(zhí)行用以分離第一音頻信息及第二音頻信息的處理演繹法則可以以較低復(fù)雜度執(zhí)行。在優(yōu)選實(shí)施方式中,音頻信號(hào)譯碼器被配置為根據(jù)下混信號(hào)表示型態(tài)、對(duì)象相關(guān)的參數(shù)信息、及與由該下混信號(hào)表示型態(tài)所表示的一音頻對(duì)象子集相關(guān)聯(lián)的剩余信息而提供上混信號(hào)表示型態(tài)。在此種情況下,該對(duì)象分離器被配置為根據(jù)該下混信號(hào)表示型態(tài)及使用至少部分該對(duì)象相關(guān)的參數(shù)信息及剩余信息而分解該下混信號(hào)表示型態(tài),以提供描述與剩余信息相關(guān)聯(lián)的第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象(例如,前景對(duì)象reo)的第一集合的該第一音頻信息,及描述并未與剩余信息相關(guān)聯(lián)的第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象(例如,背景對(duì)象BGO)的第二集合的該第二音頻信息。本實(shí)施方式基于發(fā)現(xiàn)除了對(duì)象相關(guān)的參數(shù)信息外,經(jīng)由使用剩余信息,可獲得描述該第一音頻對(duì)象類型的音頻對(duì)象的第一集合的第一音頻信息與描述該第二音頻對(duì)象類型的音頻對(duì)象的第二集合的第二音頻信息間的特別準(zhǔn)確分開。發(fā)現(xiàn)在多種情況下,單純使用對(duì)象相關(guān)的參數(shù)信息將導(dǎo)致失真,其可經(jīng)由使用剩余信息顯著減少或甚至完全消除。例如,剩余信息描述剩余失真,即使第一音頻對(duì)象類型的音頻對(duì)象僅使用對(duì)象相關(guān)的參數(shù)信息分離,預(yù)期仍將保有該剩余失真。剩余信息典型地通過音頻信號(hào)編碼器估算。經(jīng)由應(yīng)用剩余信息,可改良該第一音頻對(duì)象類型的音頻對(duì)象與該第二音頻對(duì)象類型的音頻對(duì)象間的分開。如此允許獲得第一音頻信息及第二音頻信息,而該第一音頻對(duì)象類型的音頻對(duì)象與該第二音頻對(duì)象類型的音頻對(duì)象間有特別良好的分開,而其又允許當(dāng)在音頻信號(hào)處理器處理該第二音頻信息時(shí),達(dá)成第二音頻對(duì)象類型的音頻對(duì)象的高質(zhì)量空間處理。在優(yōu)選實(shí)施方式中,因而對(duì)象分離器被配置提供音頻信息使得第一音頻對(duì)象類型的音頻對(duì)象強(qiáng)調(diào)超過第一音頻信息中的第二音頻對(duì)象類型的音頻對(duì)象。對(duì)象分離器也被配置為提供音頻信息使得第二音頻對(duì)象類型的音頻對(duì)象強(qiáng)調(diào)超過第二音頻信息中的第一音頻對(duì)象類型的音頻對(duì)象。在優(yōu)選實(shí)施方式中,音頻信號(hào)譯碼器被配置為執(zhí)行兩步式處理,使得在音頻信號(hào)處理器中該第二音頻信息的處理在描述該第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的第一音頻信息與描述該第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的第二音頻信息間分開之后進(jìn)行。在優(yōu)選實(shí)施方式中,音頻信號(hào)處理器被配置為根據(jù)與該第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息,及與該第一音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息獨(dú)立無關(guān)地處理該第二音頻信息。如此,可獲得第一音頻對(duì)象類型的音頻對(duì)象與第二音頻對(duì)象類型的音頻對(duì)象的分開處理。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為使用該下混信號(hào)表示型態(tài)的一個(gè)或多個(gè)下混信號(hào)信道與一個(gè)或多個(gè)剩余信道的線性組合來獲得該第一音頻信息及該第二音頻信息。在此種情況下,其中該對(duì)象分離器被配置為根據(jù)與該第一音頻對(duì)象類型的這些音頻對(duì)象相關(guān)聯(lián)的下混參數(shù)、及根據(jù)該第一音頻對(duì)象類型的這些音頻對(duì)象的信道預(yù)測(cè)系數(shù)而執(zhí)行該線性組合來獲得組合參數(shù)。該第一音頻對(duì)象類型的音頻對(duì)象的信道預(yù)測(cè)系數(shù)的運(yùn)算例如可考慮第二音頻對(duì)象類型的音頻對(duì)象為單共享音頻對(duì)象。如此,分離處理可以以夠小的運(yùn)算復(fù)雜度達(dá)行,其例如與第二音頻對(duì)象類型的音頻對(duì)象的數(shù)目幾乎獨(dú)立無關(guān)。在優(yōu)選實(shí)施方式中,該對(duì)象分離器施加描繪矩陣至該第一音頻信息來將該第一音頻對(duì)象類型的音頻對(duì)象映像至該上混音頻信號(hào)表示型態(tài)的音頻信道上。可如此進(jìn)行的原因在于對(duì)象分離器可提取個(gè)別表示該第一音頻對(duì)象類型的音頻對(duì)象的分開的音頻信號(hào)。如此,可將該第一音頻對(duì)象類型的音頻對(duì)象直接映像至該上混信號(hào)表示型態(tài)的音頻信道上。
      15
      在優(yōu)選實(shí)施方式中,音頻處理器被配置為根據(jù)描繪信息、對(duì)象相關(guān)的協(xié)方差信息、 下混信息來執(zhí)行該第二音頻信息的立體聲前處理而獲得該上混音頻信號(hào)表示型態(tài)的音頻信道。如此該第二音頻對(duì)象類型的音頻對(duì)象的立體聲處理與該第一音頻對(duì)象類型的音頻對(duì)象與該第二音頻對(duì)象類型的音頻對(duì)象間的分開分離。如此,該第一音頻對(duì)象類型的音頻對(duì)象與該第二音頻對(duì)象類型的音頻對(duì)象間的有效分開不受立體聲處理影響(或降級(jí)), 該處理典型地導(dǎo)致音頻對(duì)象分配于多個(gè)音頻信道上,而未提供高度對(duì)象分開,而例如使用剩余信息可在對(duì)象分離器獲得對(duì)象的高度分開。在另一優(yōu)選實(shí)施方式中,該音頻處理器被配置為根據(jù)描繪信息、對(duì)象相關(guān)的協(xié)方差信息及下混信息而執(zhí)行第二音頻信息的后處理。這種形式的后處理允許在音頻場(chǎng)景中第二音頻對(duì)象類型的音頻對(duì)象的空間定置。雖然如此,由于級(jí)聯(lián)構(gòu)想,音頻處理器的運(yùn)算復(fù)雜度可維持足夠低,原因在于該音頻處理器無需考慮與第一音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息。此外,可通過音頻處理器執(zhí)行不同型處理,例如單聲道至雙聲道處理、單聲道至立體聲處理、立體聲至雙聲道處理、或立體聲至立體聲處理。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為將并未關(guān)聯(lián)剩余信息的第二音頻對(duì)象類型的音頻對(duì)象處理成單一音頻對(duì)象。此外,該音頻信號(hào)處理器被配置為考慮對(duì)象專一性描繪參數(shù)而調(diào)整第二音頻對(duì)象類型的這些音頻對(duì)象對(duì)該上混信號(hào)表示型態(tài)的貢獻(xiàn)。如此, 該第二音頻對(duì)象類型的音頻對(duì)象由該對(duì)象分離器視為單一音頻對(duì)象,其顯著減低了對(duì)象分離器的復(fù)雜度,同時(shí)也允許具有獨(dú)特剩余信息,其與該第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的描繪信息獨(dú)立無關(guān)。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為對(duì)多個(gè)第二音頻對(duì)象類型的音頻對(duì)象獲得一個(gè)或二個(gè)共享對(duì)象電平差值。該對(duì)象分離器被配置為使用該共享對(duì)象位準(zhǔn)差值用于信道預(yù)測(cè)系數(shù)的運(yùn)算。此外,該對(duì)象分離器被配置為使用該信道預(yù)測(cè)系數(shù)而獲得表示該第二音頻信息的一個(gè)或二個(gè)音頻信道。為了獲得共享對(duì)象位準(zhǔn)差值,第二音頻對(duì)象類型的音頻對(duì)象可通過對(duì)象分離器作為單一音頻對(duì)象有效處理。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為對(duì)多個(gè)第二音頻對(duì)象類型的音頻對(duì)象獲得一個(gè)或二個(gè)共享對(duì)象位準(zhǔn)差值;及該對(duì)象分離器被配置為使用該共享對(duì)象位準(zhǔn)差值用于一矩陣的元的運(yùn)算。及該對(duì)象分離器被配置為使用該能量模式映像矩陣而獲得表示該第二音頻信息的一個(gè)或多個(gè)音頻信道。再次,該共享對(duì)象位準(zhǔn)差值允許通過該對(duì)象分離器來進(jìn)行該第二音頻對(duì)象類型的音頻對(duì)象的運(yùn)算上有效的共享處理。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為若發(fā)現(xiàn)有兩個(gè)該第二音頻對(duì)象類型的音頻對(duì)象,則根據(jù)該對(duì)象相關(guān)的參數(shù)信息而選擇性地獲得與第二音頻對(duì)象類型的這些音頻對(duì)象相關(guān)聯(lián)的該共享對(duì)象間相關(guān)值,以及若發(fā)現(xiàn)有多于或少于兩個(gè)該第二音頻對(duì)象類型的音頻對(duì)象,則設(shè)定與第二音頻對(duì)象類型的這些音頻對(duì)象相關(guān)聯(lián)的該共享對(duì)象間相關(guān)值為零。對(duì)象分離器被配置為使用與該第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的該共享對(duì)象間相關(guān)值而獲得表示該第二音頻信息的一個(gè)或多個(gè)音頻信道。使用這種辦法,如果可以高運(yùn)算效率獲得,即如果存在兩個(gè)該第二音頻對(duì)象類型的音頻對(duì)象,則采用對(duì)象間相關(guān)值。否則有運(yùn)算要求來獲得對(duì)象間相關(guān)值。如此,若有多于或少于兩個(gè)第二音頻對(duì)象類型的音頻對(duì)象,將與該第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象間相關(guān)值設(shè)定為零,則就聽覺感受及運(yùn)算復(fù)雜度而言可獲得良好折衷。在優(yōu)選實(shí)施方式中,該音頻信號(hào)處理器被配置為根據(jù)(至少部分)該對(duì)象相關(guān)的參數(shù)信息而描繪該第二音頻信息,以獲得第二音頻對(duì)象類型的這些音頻對(duì)象的經(jīng)描繪的表示型態(tài)作為該第二音頻信息的已處理的版本。在此種情況下,可與該第一音頻對(duì)象類型的音頻對(duì)象獨(dú)立無關(guān)而作描繪。在優(yōu)選實(shí)施方式中,對(duì)象分離器被配置為提供第二音頻信息使得該第二音頻信息描述多于兩個(gè)該第二音頻對(duì)象類型的音頻對(duì)象。根據(jù)本發(fā)明的實(shí)施方式允許彈性調(diào)整第二音頻對(duì)象類型的音頻對(duì)象數(shù)目,此項(xiàng)調(diào)整通過處理的級(jí)聯(lián)結(jié)構(gòu)顯著獲得協(xié)助。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為獲得表示多于兩個(gè)該第二音頻對(duì)象類型的音頻對(duì)象的一信道音頻信號(hào)表示型態(tài)或二信道音頻信號(hào)表示型態(tài)作為第二音頻信息。 具體言之,比較對(duì)象分離器需要處理多于兩個(gè)第二音頻對(duì)象類型的音頻對(duì)象的情況,該對(duì)象分離器的復(fù)雜度可維持顯著較低。雖然如此,發(fā)現(xiàn)其為第二音頻對(duì)象類型的音頻對(duì)象使用一個(gè)或二個(gè)音頻信號(hào)信道的運(yùn)算上有效的表示型態(tài)。在優(yōu)選實(shí)施方式中,音頻信號(hào)處理器被配置為考慮與多于兩個(gè)第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息,而根據(jù)(至少部分)對(duì)象相關(guān)的參數(shù)信息來接收第二音頻信息及處理第二音頻信息。如此,通過音頻處理器執(zhí)行對(duì)象個(gè)別處理,而對(duì)第二音頻對(duì)象類型的音頻對(duì)象,未通過對(duì)象分離器執(zhí)行這種對(duì)象個(gè)別處理。在優(yōu)選實(shí)施方式中,該音頻譯碼器被配置為自該對(duì)象相關(guān)的參數(shù)信息的配置信息提取對(duì)象總數(shù)信息及前景對(duì)象數(shù)目信息。該音頻譯碼器也被配置為經(jīng)由形成該對(duì)象總數(shù)信息與該前景對(duì)象數(shù)目信息間的差而判定該第二音頻對(duì)象類型的音頻對(duì)象數(shù)目。如此,達(dá)成第二音頻對(duì)象類型的音頻對(duì)象數(shù)目的有效傳訊。此外,此種構(gòu)想提供有關(guān)第二音頻對(duì)象類型的音頻對(duì)象數(shù)目的高度彈性。在優(yōu)選實(shí)施方式中,該對(duì)象分離器被配置為使用與該第一音頻對(duì)象類型的N·音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息而獲得表示(優(yōu)選個(gè)別地)該第一音頻對(duì)象類型的 Neao音頻對(duì)象的N·音頻信號(hào)作為第一音頻信息,及獲得表示該第二音頻對(duì)象類型的N-N· 音頻對(duì)象的一個(gè)或二個(gè)音頻信號(hào)作為第二音頻信息,將該第二音頻信息的N-Nm。音頻對(duì)象處理作為單一一信道或二信道音頻對(duì)象。該音頻信號(hào)處理器被配置為使用與該第二音頻對(duì)象類型的n-Nm。音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息而個(gè)別描繪由該第二音頻對(duì)象類型的一個(gè)或二個(gè)音頻信號(hào)所表示的N-N·音頻對(duì)象。如此,該第一音頻對(duì)象類型的音頻對(duì)象與該第二音頻對(duì)象類型的音頻對(duì)象間的音頻對(duì)象分離與隨后該第二音頻對(duì)象類型的音頻對(duì)象的處理分開。根據(jù)本發(fā)明的實(shí)施方式形成一種用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息而提供上混信號(hào)表示型態(tài)的方法。根據(jù)本發(fā)明的另一實(shí)施方式形成一種用以執(zhí)行該方法的計(jì)算機(jī)程序。


      隨后將參考所附的附圖而說明根據(jù)本發(fā)明的實(shí)施例,附圖中圖1示出根據(jù)本發(fā)明實(shí)施方式的一種音頻信號(hào)譯碼器的方塊示意圖2示出根據(jù)本發(fā)明實(shí)施方式的另一音頻信號(hào)譯碼器的方塊示意圖;圖3a及圖北示出可用作本發(fā)明實(shí)施方式中對(duì)象分離器的一種剩余處理器的方塊示意圖;圖如至如圖示出根據(jù)本發(fā)明實(shí)施方式的可用于音頻信號(hào)譯碼器的音頻信號(hào)處理器的方塊示意圖;圖4f示出一種SAOC轉(zhuǎn)碼器處理模式的方塊圖;圖4g示出一種SAOC譯碼器處理模式的方塊圖;圖fe示出根據(jù)本發(fā)明實(shí)施方式的一種音頻信號(hào)譯碼器的方塊示意圖;圖恥示出根據(jù)本發(fā)明實(shí)施方式的另一音頻信號(hào)譯碼器的方塊示意圖;圖6a示出表示試聽測(cè)試設(shè)計(jì)描述的表;圖6b示出表示待測(cè)系統(tǒng)的表;圖6c示出表示試聽測(cè)試項(xiàng)目及描繪矩陣的表;圖6d示出用于卡拉OK/獨(dú)唱型描繪試聽測(cè)試的平均MUSHRA分?jǐn)?shù)的圖形表示;圖6e示出用于傳統(tǒng)描繪試聽測(cè)試的平均MUSHRA分?jǐn)?shù)的圖形表示;圖7示出根據(jù)本發(fā)明實(shí)施方式的用以提供上混信號(hào)表示型態(tài)的一種方法的流程圖;圖8示出參考MPEG SAOC系統(tǒng)的方塊示意圖;圖9a示出使用分開的譯碼器及混合器的參考SAOC系統(tǒng)的方塊示意圖;圖9b示出使用整合式譯碼器及混合器的參考SAOC系統(tǒng)的方塊示意圖;及圖9c示出使用SAOC至MPEG轉(zhuǎn)碼器的參考SAOC系統(tǒng)的方塊示意圖。
      具體實(shí)施例方式1.根據(jù)圖1的音頻信號(hào)譯碼器圖1示出根據(jù)本發(fā)明實(shí)施方式的一種音頻信號(hào)譯碼器100的方塊示意圖。音頻信號(hào)譯碼器100被配置為接收對(duì)象相關(guān)的參數(shù)信息110及下混信號(hào)表示型態(tài) 112。該音頻信號(hào)譯碼器100被配置為根據(jù)該下混信號(hào)表示型態(tài)及該對(duì)象相關(guān)的參數(shù)信息 110而提供上混信號(hào)表示型態(tài)120。該音頻信號(hào)譯碼器100包括對(duì)象分離器130,其被配置為根據(jù)該下混信號(hào)表示型態(tài)112及使用該對(duì)象相關(guān)的參數(shù)信息110的至少一部分將該下混信號(hào)表示型態(tài)112分解以提供描述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的第一音頻信息132及描述第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的第二音頻信息134。該音頻信號(hào)譯碼器100還包括音頻信號(hào)處理器140,其被配置為接收第二音頻信息134及根據(jù)該對(duì)象相關(guān)的參數(shù)信息112的至少一部分而處理該第二音頻信息以獲得該第二音頻信息134的已處理的版本142。該音頻信號(hào)譯碼器100還包括音頻信號(hào)組合器 150,其被配置為組合該第一音頻信息132與該第二音頻信息134的已處理的版本142而獲得該上混信號(hào)表示型態(tài)120。音頻信號(hào)譯碼器100實(shí)施下混信號(hào)表示型態(tài)的級(jí)聯(lián)處理,其以組合方式表示該第一音頻對(duì)象類型的音頻對(duì)象及該第二音頻對(duì)象類型的音頻對(duì)象。在由該對(duì)象分離器130所執(zhí)行的第一處理步驟中,使用該對(duì)象相關(guān)的參數(shù)信息 110,描述第二音頻對(duì)象類型的音頻對(duì)象的第二集合的該第二音頻信息與描述第一音頻對(duì)
      18象類型的音頻對(duì)象的第一集合的該第一音頻信息132分開。但第二音頻信息134典型為以組合方式描述該第二音頻對(duì)象類型的音頻對(duì)象的音頻信息(例如,一信道音頻信號(hào)或二信道音頻信號(hào))。在第二處理步驟中,音頻信號(hào)處理器140根據(jù)該對(duì)象相關(guān)的參數(shù)信息處理第二音頻信息134。如此,音頻信號(hào)處理器140可執(zhí)行該第二音頻對(duì)象類型的音頻對(duì)象的對(duì)象個(gè)別處理或描繪,這些音頻對(duì)象典型由第二音頻信息134所描述,及該步驟典型地并未由對(duì)象分離器130實(shí)施。如此,雖然第二音頻對(duì)象類型的音頻對(duì)象優(yōu)選未以對(duì)象個(gè)別方式由對(duì)象分離器 130處理,但在由音頻信號(hào)處理器140執(zhí)行的第二處理步驟中,第二音頻對(duì)象類型的音頻對(duì)象確實(shí)以對(duì)象個(gè)別方式處理(例如,以對(duì)象個(gè)別方式描繪)。如此,由對(duì)象分離器130執(zhí)行的第一音頻對(duì)象類型的音頻對(duì)象與第二音頻對(duì)象類型的音頻對(duì)象間的分離與隨后由音頻信號(hào)處理器140執(zhí)行的第二音頻對(duì)象類型的音頻對(duì)象的對(duì)象個(gè)別處理分開。如此,由對(duì)象分離器130所執(zhí)行的處理實(shí)質(zhì)上與第二音頻對(duì)象類型的音頻對(duì)象數(shù)目無關(guān)。此外,第二音頻信息134的格式(例如,一信道音頻信號(hào)或二信道音頻信號(hào))典型地與第二音頻對(duì)象類型的音頻對(duì)象數(shù)目無關(guān)。如此,可變更第二音頻對(duì)象類型的音頻對(duì)象數(shù)目而無需修改對(duì)象分離器130結(jié)構(gòu)。換言之,第二音頻對(duì)象類型的音頻對(duì)象視為單一(例如,一信道音頻信號(hào)或二信道音頻信號(hào))音頻對(duì)象處理,對(duì)該對(duì)象由對(duì)象分離器140獲得共享對(duì)象相關(guān)的參數(shù)信息(例如,與一個(gè)或二個(gè)音頻信道相關(guān)聯(lián)的共享對(duì)象位準(zhǔn)差值)。據(jù)此,根據(jù)圖1的音頻信號(hào)譯碼器100可處理可變量目的第二音頻對(duì)象類型的音頻對(duì)象而無需做對(duì)象分離器130的結(jié)構(gòu)修改。此外,由對(duì)象分離器130及音頻信號(hào)處理器 140可應(yīng)用不同的音頻對(duì)象處理演繹法則。如此例如,可由對(duì)象分離器130使用剩余信息執(zhí)行音頻對(duì)象的分離,其允許使用剩余信息而特別好地分離不同音頻對(duì)象,該剩余信息組成用以改良對(duì)象分離質(zhì)量的旁信息。相反地,音頻信號(hào)處理器140可執(zhí)行對(duì)象個(gè)別處理而未使用剩余信息。舉例言之,音頻信號(hào)處理器140可被配置為執(zhí)行已知空間音頻對(duì)象編碼 (SAOC)型音頻信號(hào)處理而描繪不同的音頻對(duì)象。2.根據(jù)圖2的音頻信號(hào)譯碼器下文中將說明根據(jù)本發(fā)明實(shí)施方式的音頻信號(hào)譯碼器200。此音頻信號(hào)譯碼器 200的方塊示意圖在圖2中示出。音頻譯碼器200被配置為接收下混信號(hào)210、所謂的SAOC比特流212、描繪矩陣信息214,以及可選地,頭相關(guān)傳送功能(HRTF)參數(shù)信息216。音頻信號(hào)譯碼器200還被配置為提供輸出/MPS下混信號(hào)220及(可選地)MPS比特流222。2. 1.音頻信號(hào)譯碼器200的輸入信號(hào)及輸出信號(hào)下文中,將說明有關(guān)音頻信號(hào)譯碼器200的輸入信號(hào)及輸出信號(hào)的各項(xiàng)細(xì)節(jié)。下混信號(hào)200例如可為一信道音頻信號(hào)或二信道音頻信號(hào)。下混信號(hào)210例如可由下混信號(hào)的已編碼表示型態(tài)導(dǎo)出。空間音頻對(duì)象編碼比特流(SA0C比特流)212例如可包含對(duì)象相關(guān)的參數(shù)信息。舉例言之,SAOC比特流212可包含例如呈對(duì)象位準(zhǔn)差參數(shù)OLD形式的對(duì)象位準(zhǔn)差信息、呈對(duì)象間相關(guān)性參數(shù)IOC形式的對(duì)象間相關(guān)性信息。此外,SAOC比特流212可包含下混信息,其說明如何使用下混處理而基于多數(shù)音
      19頻對(duì)象信號(hào)已經(jīng)提供下混信號(hào)。舉例言之,SAOC比特流可包含下混增益參數(shù)DMG及(可選地)下混信道位準(zhǔn)差參數(shù)DCLD。描繪矩陣信息214例如可描述不同音頻對(duì)象如何由音頻譯碼器描繪。舉例言之, 描繪矩陣信息214描述音頻對(duì)象的部署至輸出/MPS下混信號(hào)220的一個(gè)或多個(gè)信道。頭相關(guān)傳送功能(HRTF)參數(shù)信息216可進(jìn)一步說明導(dǎo)出雙聲道頭戴式耳機(jī)信號(hào)的傳送功能。輸出/MPEG環(huán)繞下混信號(hào)(也簡(jiǎn)稱為「輸出/MPS下混信號(hào)」)220表示例如呈時(shí)域音頻信號(hào)表示型態(tài)或頻域音頻信號(hào)表示型態(tài)的一個(gè)或多個(gè)音頻信道?;騿为?dú)形成、或組合包含描述輸出/MPS下混信號(hào)220的映像狀況的MPEG環(huán)繞參數(shù)的可選MPEG環(huán)繞比特流 (MPS比特流)222而形成上混信號(hào)表示型態(tài)。2. 2.音頻信號(hào)譯碼器200的結(jié)構(gòu)及功能下文中,將說明可執(zhí)行SAOC轉(zhuǎn)碼器的功能或SAOC譯碼器的功能的音頻信號(hào)譯碼器200結(jié)構(gòu)的進(jìn)一步細(xì)節(jié)。音頻信號(hào)譯碼器200包括下混處理器230,其被配置為接收下混信號(hào)210及基于該信號(hào)而提供輸出/MPS下混信號(hào)220。下混處理器230也被配置為接收至少部分SAOC比特流信息212及至少部分描繪矩陣信息214。此外,下混處理器230也接收得自參數(shù)處理器 250的已處理的SAOC參數(shù)信息M0。參數(shù)處理器250被配置為接收SAOC比特流信息212、描繪矩陣信息214,以及可選地,頭相關(guān)傳送功能參數(shù)信息260,以及基于此而提供載有MPEG環(huán)繞參數(shù)的MPEG環(huán)繞比特流222 (若需MPEG環(huán)繞參數(shù),例如在轉(zhuǎn)碼操作模式中如此為真)。此外,參數(shù)處理器250提供已處理的SAOC信息240 (若需此種已處理的SAOC信息)。下文中,將說明下混處理器230的結(jié)構(gòu)及功能的進(jìn)一步細(xì)節(jié)。下混處理器230包含剩余處理器沈0,其被配置為接收下混信號(hào)210及基于此提供描述所謂增強(qiáng)的音頻對(duì)象(EAO)的第一音頻對(duì)象信號(hào)沈2,EAO可被視為第一音頻對(duì)象類型的音頻對(duì)象。該第一音頻對(duì)象信號(hào)包含一個(gè)或多個(gè)音頻信道且可視為第一音頻信息。剩余處理器沈0也被配置為提供第二音頻對(duì)象信號(hào)沈4,該信號(hào)描述第二音頻對(duì)象類型的音頻對(duì)象且可視為第二音頻信息。第二音頻對(duì)象信號(hào)264可包含一個(gè)或多個(gè)信道,典型地包含描述多數(shù)音頻對(duì)象的一或二音頻信道。典型地,第二音頻對(duì)象信號(hào)可描述甚至多于兩個(gè)第二音頻對(duì)象類型的音頻對(duì)象。下混處理器230還包括SAOC下混前處理器270,其被配置為接收第二音頻對(duì)象信號(hào)264及基于此而提供該第二音頻對(duì)象信號(hào)264的已處理的版本272,其可視為第二音頻信息的已處理的版本。下混處理器230還包括音頻信號(hào)組合器觀0,其被配置為接收第一音頻對(duì)象信號(hào) 262及第二音頻對(duì)象信號(hào)沈4的已處理的版本272,以及基于這些信號(hào)而提供輸出/MPS下混信號(hào)220,其可單獨(dú)或與(選擇性)相對(duì)應(yīng)的MPEG環(huán)繞比特流222共同被視為上混信號(hào)表示型態(tài)。下文中,將討論下混處理器230的個(gè)別單元的功能的進(jìn)一步細(xì)節(jié)。剩余處理器260被配置為分開地提供第一音頻對(duì)象信號(hào)262及第二音頻對(duì)象信號(hào) 264.為了達(dá)成此項(xiàng)目的,剩余處理器260可被配置為施加至少部分SAOC比特流信息212。舉例言之,剩余處理器260可被配置為評(píng)估與第一音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息,亦即所謂「增強(qiáng)的音頻對(duì)象」ΕΑ0。此外,剩余處理器260可被配置為描述第二音頻對(duì)象類型的音頻對(duì)象例如,俗稱所謂的「未經(jīng)增強(qiáng)的音頻對(duì)象」的總體信息。剩余處理器260還可被配置為評(píng)估設(shè)置于SAOC比特流信息212中的剩余信息,用以分離增強(qiáng)的音頻對(duì)象(第一音頻對(duì)象類型的音頻對(duì)象)與未經(jīng)增強(qiáng)的音頻對(duì)象(第二音頻對(duì)象類型的音頻對(duì)象)。剩余信息例如可編碼時(shí)域剩余信號(hào),該信號(hào)應(yīng)用來獲得增強(qiáng)的音頻對(duì)象與未增強(qiáng)的音頻對(duì)象間的特別利落分開。此外,可選地,剩余處理器260評(píng)估至少部分描繪矩陣信息214(例如)以測(cè)定增強(qiáng)的音頻對(duì)象分配至第一音頻對(duì)象信號(hào)沈2的這些音頻信道。SAOC下混前處理器270包括信道重分配器274,其被配置為接收一個(gè)或多個(gè)第二音頻對(duì)象信號(hào)264的音頻信道,以及基于此而提供一個(gè)或多個(gè)(典型為兩個(gè))已處理的第二音頻對(duì)象信號(hào)272的音頻信道。此外,SAOC下混前處理器270包括一去相關(guān)信號(hào)提供器 276,其被配置為接收一個(gè)或多個(gè)第二音頻對(duì)象信號(hào)沈4的音頻信道,以及基于此而提供一個(gè)或多個(gè)去相關(guān)信號(hào)278a、278b,其加至由信道重分配器274所提供的信號(hào),以獲得第二音頻對(duì)象信號(hào)264的已處理的版本272。有關(guān)SAOC下混處理器的進(jìn)一步細(xì)節(jié)將討論如下。音頻信號(hào)組合器280組合第一音頻對(duì)象信號(hào)262與第二音頻對(duì)象信號(hào)的已處理的版本272。為了達(dá)成此項(xiàng)目的,可執(zhí)行逐信道組合。如此,獲得輸出/MPS下混信號(hào)220。參數(shù)處理器250被配置為獲得(選擇性的)MPEG環(huán)繞參數(shù),其考慮描繪矩陣信息 214,以及可選地,HRTF參數(shù)信息216,基于SAOC比特流而組成上混信號(hào)表示型態(tài)的MPEG環(huán)繞比特流222。換言之,SAOC參數(shù)處理器252被配置為將由SAOC比特流信息212所描述的對(duì)象相關(guān)的參數(shù)信息轉(zhuǎn)譯成信道相關(guān)參數(shù)信息,其通過MPEG環(huán)繞比特流222作說明。下文中,將舉出第2圖所示SAOC轉(zhuǎn)碼器/譯碼器架構(gòu)的結(jié)構(gòu)的簡(jiǎn)短綜論??臻g音頻對(duì)象編碼(SAOC)為參數(shù)多數(shù)對(duì)象編碼技術(shù)。該技術(shù)被設(shè)計(jì)用于以包含M個(gè)信道的音頻信號(hào)(例如,下混音頻信號(hào)210)發(fā)送多個(gè)音頻對(duì)象。連同此種反向可兼容的下混信號(hào),發(fā)送 (例如,使用SAOC比特流信息212)對(duì)象參數(shù),其允許重新形成及操縱原先對(duì)象信號(hào)。SAOC 編碼器(未顯示于此處)產(chǎn)生于其輸入端的對(duì)象信號(hào)的下混,及提取這些對(duì)象參數(shù)。可處理的對(duì)象數(shù)目原則上并無限制。對(duì)象參數(shù)經(jīng)量化,及有效編碼成SAOC比特流212。下混信號(hào)210可經(jīng)壓縮及發(fā)送而無需更新既有的編碼器及基礎(chǔ)結(jié)構(gòu)。對(duì)象參數(shù)或SAOC旁信息在低比特率旁信道例如,下混比特流的附屬數(shù)據(jù)部分發(fā)送。在譯碼器端,輸入對(duì)象被重組及描繪至某個(gè)數(shù)目的回放信道。包含各個(gè)對(duì)象的再現(xiàn)位準(zhǔn)及搖攝位置的描繪信息為使用者供應(yīng)或可提取自SAOC比特流(例如,作為預(yù)設(shè)信息)。描繪信息可為時(shí)間變量。輸出信號(hào)情況可自單信道至多信道(例如,5.1)及與輸入對(duì)象數(shù)目及下混信道數(shù)目二者皆無關(guān)。對(duì)象的雙聲道描繪可包括虛擬對(duì)象位置的方位角及高度。除了位準(zhǔn)及搖攝修改外,可選的效應(yīng)接口允許對(duì)象信號(hào)的先進(jìn)操縱。對(duì)象本身可為單聲道信號(hào)、立體聲信號(hào)、及多信道信號(hào)(例如,5. 1信道)。典型下混配置為單聲道及立體聲。下文中,將解釋圖2所示的SAOC轉(zhuǎn)碼器/譯碼器的基本結(jié)構(gòu)。本文所述的SAOC 轉(zhuǎn)碼器/譯碼器根據(jù)期望的輸出信道配置可作為孤立譯碼器或作為自SAOC至MPEG環(huán)繞比特流的轉(zhuǎn)碼器。在第一操作模式,輸出信號(hào)被配置為單聲道、立體聲或雙聲道,以及使用二輸出信道。在此種第一情況下,SAOC模塊可以譯碼器模式操作,而SAOC模塊輸出信號(hào)為脈沖碼調(diào)變輸出信號(hào)(PCM輸出信號(hào))。在第一情況下,無需MPEG環(huán)繞譯碼器。反而上混信號(hào)表示型態(tài)只包含輸出信號(hào)220,同時(shí)可免除MPEG環(huán)繞比特流222的提供。在第二情況下,輸出信號(hào)配置為有多于兩個(gè)輸出信道的多信道配置。SAOC模塊可以轉(zhuǎn)碼器模式操作。在此種情況下,SAOC模塊輸出信號(hào)可包含正混信號(hào)220及MPEG環(huán)繞比特流222,如圖2所示。如此,需要MPEG環(huán)繞譯碼器,以便獲得終音頻信號(hào)表示型態(tài)供由揚(yáng)聲器輸出。圖2示出了 SAOC轉(zhuǎn)碼器/譯碼器架構(gòu)的基本結(jié)構(gòu)。剩余處理器216使用SAOC比特流信息212所含的剩余信息從輸入下混信號(hào)210中提取增強(qiáng)的音頻對(duì)象。SAOC下混前處理器270處理規(guī)則音頻對(duì)象(其為例如未經(jīng)增強(qiáng)的音頻對(duì)象,亦即在SAOC比特流信息212 中并未傳送剩余信息的音頻對(duì)象)。增強(qiáng)的音頻對(duì)象(以第一音頻對(duì)象信號(hào)262表示)及經(jīng)處理的規(guī)則音頻對(duì)象(例如,以第二音頻對(duì)象信號(hào)264的已處理的版本272表示)被組合成用于SAOC譯碼器模式的輸出信號(hào)220或用于SAOC轉(zhuǎn)碼器模式的MPEG環(huán)繞下混信號(hào) 220。有關(guān)處理方塊的細(xì)節(jié)說明如下。3.剩余處理器及能量模式處理器的架構(gòu)及功能下文中,將說明有關(guān)剩余處理器的細(xì)節(jié),例如其可取代音頻信號(hào)譯碼器100的對(duì)象分離器130或音頻信號(hào)譯碼器200的剩余處理器沈0的功能。用于此項(xiàng)目的,圖3a及圖 3b示出了此種剩余處理器300的方塊示意圖,其可取代對(duì)象分離器130或剩余處理器沈0 的作用。圖3a示出的細(xì)節(jié)比圖北少。然而,下文說明應(yīng)用至根據(jù)圖3a的剩余處理器300, 以及應(yīng)用至根據(jù)圖北的剩余處理器380。剩余處理器300被配置為接收SAOC下混信號(hào)310,其可相當(dāng)于圖1的下混信號(hào)表示型態(tài)112或圖2的下混信號(hào)表示型態(tài)210。剩余處理器300被配置為基于此而提供描述一個(gè)或多個(gè)增強(qiáng)的音頻對(duì)象的第一音頻信息320,其可例如相當(dāng)于第一音頻信息132或相當(dāng)于第一音頻對(duì)象信號(hào)262。又,剩余處理器300可提供描述一個(gè)或多個(gè)其它音頻對(duì)象(例如,未經(jīng)增強(qiáng)的音頻對(duì)象,對(duì)其未能取得剩余信息)的第二音頻信息322,其中該第二音頻信息322可相當(dāng)于第二音頻信息134或相當(dāng)于第二音頻對(duì)象信號(hào)沈4。剩余處理器300包括1對(duì)N/2對(duì)N單元(0ΤΝ/ΤΤΝ單元),其接收SAOC下混信號(hào) 310,也接收SAOC數(shù)據(jù)及剩余信息332。1對(duì)N/2對(duì)N單元330也提供增強(qiáng)的音頻對(duì)象信號(hào) 334,其描述含于SAOC下混信號(hào)310的增強(qiáng)的音頻對(duì)象(EAO)。又,1對(duì)N/2對(duì)N單元330 提供第二音頻信息322。剩余處理器300還包括描繪單元340,其接收增強(qiáng)的音頻對(duì)象信號(hào) 334及描繪矩陣信息342,及基于此信息而提供第一音頻信息320。下文中,將說明由剩余處理器300執(zhí)行的增強(qiáng)的音頻對(duì)象處理(ΕΑ0處理)的更多細(xì)節(jié)。3. 1剩余處理器300的操作引言有關(guān)剩余處理器300的功能,須注意SAOC技術(shù)允許只以極為有限方式,就其位準(zhǔn)放大/衰減而言,個(gè)別操縱多個(gè)音頻對(duì)象而未顯著減低所得聲音質(zhì)量。特殊「卡拉OK型」 應(yīng)用場(chǎng)景要求特定對(duì)象典型為主唱的完全(或幾乎完全)遏止,但仍保持背景音景的知覺質(zhì)量無損O典型應(yīng)用例含有多至四個(gè)增強(qiáng)的音頻對(duì)象(EAO)信號(hào),其可例如表示兩個(gè)獨(dú)立立體聲對(duì)象(例如,準(zhǔn)備在譯碼器端移除的兩個(gè)獨(dú)立立體聲對(duì)象)。
      須注意(一個(gè)或多個(gè))質(zhì)量增強(qiáng)的音頻對(duì)象(或更精確言之,與增強(qiáng)的音頻對(duì)象相關(guān)聯(lián)的音頻信號(hào)貢獻(xiàn))包括在SAOC下混信號(hào)310中。典型地,與(一個(gè)或多個(gè))增強(qiáng)的音頻對(duì)象相關(guān)聯(lián)的音頻信號(hào)貢獻(xiàn)由音頻信號(hào)編碼器所執(zhí)行的下混處理而與其它音頻對(duì)象亦即未經(jīng)增強(qiáng)的音頻對(duì)象相關(guān)聯(lián)的音頻信號(hào)貢獻(xiàn)混合。又,須注意多個(gè)增強(qiáng)的音頻對(duì)象相關(guān)聯(lián)的音頻信號(hào)貢獻(xiàn)也典型地由音頻信號(hào)編碼器所執(zhí)行的下混而重迭或混合。3. 2SA0C架構(gòu)支持增強(qiáng)的音頻對(duì)象下文中,將說明有關(guān)剩余處理器300的細(xì)節(jié)。增強(qiáng)的音頻對(duì)象處理結(jié)合1對(duì)N/2對(duì) N單元,取決于SAOC下混模式。1對(duì)N處理單元專用于單聲道下混信號(hào),而2對(duì)N處理單元系專用于立體聲下混信號(hào)310。這兩個(gè)單元表示自IS0/IEC 23003-1 :2007為已知的2對(duì) 2框(TTT框)的一般性且經(jīng)增強(qiáng)的修改。在編碼器中,規(guī)則信號(hào)及EAO信號(hào)經(jīng)組合成下混信號(hào)。采用OT^/TTN—1處理單元(其為1對(duì)N處理單元的顛倒或2對(duì)N處理單元的顛倒) 來產(chǎn)生及編碼相對(duì)應(yīng)的剩余信號(hào)。通過0ΤΝ/ΤΤΝ單元330,使用SAOC旁信息及所結(jié)合的剩余信號(hào),而自SAOC下混信號(hào)310恢復(fù)EAO信號(hào)及規(guī)則信號(hào)。所恢復(fù)的EAO(通過增強(qiáng)的音頻對(duì)象信號(hào)334描述)被反饋入描繪單元340,其表示(或提供)相對(duì)應(yīng)描繪矩陣之積(通過描繪矩陣信息342描述)及0ΤΝ/ΤΤΝ單元的所得輸出信號(hào)。規(guī)則音頻對(duì)象(通過第二音頻信息322描述)傳送至SAOC下混前處理器,例如SAOC下混前處理器270供進(jìn)一步處理。圖3a及圖3b示出剩余處理器的大體結(jié)構(gòu),亦即剩余處理器的架構(gòu)。剩余處理器輸出信號(hào)320、322被運(yùn)算為Xobj = MffijXres,XEAO = AEA0MEA0Xres,其中,Xto表示規(guī)則音頻對(duì)象(亦即非ΕΑ0)的下混信號(hào),而Xem為用于SAOC譯碼模式的經(jīng)描繪的EAO輸出信號(hào)或用于SAOC轉(zhuǎn)碼模式的相對(duì)應(yīng)的EAO下混信號(hào)。剩余處理器可以以預(yù)測(cè)(使用剩余信息)模式或能量(不含剩余信息)模式操作。 擴(kuò)展的輸入信號(hào)Xms據(jù)此定義
      Yx^
      Y --,用于預(yù)測(cè)模式,
      X = <
      res
      IresJ
      、χ,用于能量模式··此處X例如表示下混信號(hào)表示型態(tài)310的一個(gè)或多個(gè)信道,其可于表示多信道音頻內(nèi)容的比特流中傳送。res表示一個(gè)或多個(gè)剩余信號(hào),其可通過表示多信道音頻內(nèi)容的比特流描述。0ΤΝ/ΤΤΝ處理通過矩陣M表示,而EAO處理器系以矩陣Aeaq表示。0ΤΝ/ΤΤΝ處理矩陣M根據(jù)EAO操作模式(亦即預(yù)測(cè)或能量)定義為
      - _ Iprediction ,
      用于預(yù)測(cè)模式, = jMEnergy,用于能量模式··0ΤΝ/ΤΤΝ處理矩陣M表示為
      2權(quán)利要求
      1.一種音頻信號(hào)譯碼器(100 ;200 ;500 ;590),用以根據(jù)下混信號(hào)表示型態(tài)(112 ;210 ; 510 ;510a)和對(duì)象相關(guān)的參數(shù)信息(110 ;212 ;512 ;512a)提供上混信號(hào)表示型態(tài),所述音頻信號(hào)譯碼器包括對(duì)象分離器(130 ;260 ;520 ;520a),被配置為分解所述下混信號(hào)表示型態(tài),以根據(jù)所述下混信號(hào)表示型態(tài)提供描述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的第一音頻信息(132 ;262 ;562 ;56 ),和描述第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的第二音頻信息(134 ;264 ;564 ;564a);音頻信號(hào)處理器,被配置為接收所述第二音頻信息(134 ;264 ;564 ;564a),以及根據(jù)所述對(duì)象相關(guān)的參數(shù)信息處理所述第二音頻信息,以獲得所述第二音頻信息的已處理的版本 (142 ;272 ;572 ;572a);以及音頻信號(hào)組合器(150 ;280 ;580 ;580a),被配置為組合所述第一音頻信息與所述第二音頻信息的所述已處理的版本,以獲得所述上混信號(hào)表示型態(tài)。
      2.根據(jù)權(quán)利要求1所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)譯碼器被配置為根據(jù)與通過所述下混信號(hào)表示型態(tài)所表示的音頻對(duì)象子集相關(guān)聯(lián)的剩余信息提供所述上混信號(hào)表示型態(tài),其中,所述對(duì)象分離器被配置為根據(jù)所述下混信號(hào)表示型態(tài)及使用所述剩余信息來分解所述下混信號(hào)表示型態(tài),以提供描述與剩余信息相關(guān)聯(lián)的第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的所述第一音頻信息,和描述并未與剩余信息相關(guān)聯(lián)的第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的所述第二音頻信息。
      3.根據(jù)權(quán)利要求1或2所述的音頻信號(hào)譯碼器(100;200;500;590),其中,所述對(duì)象分離器被配置為提供所述第一音頻信息,使得所述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象被強(qiáng)調(diào)超過所述第一音頻信息中的所述第二音頻對(duì)象類型的音頻對(duì)象,以及其中,所述對(duì)象分離器被配置為提供所述第二音頻信息,使得所述第二音頻對(duì)象類型的音頻對(duì)象被強(qiáng)調(diào)超過所述第二音頻信息中的所述第一音頻對(duì)象類型的音頻對(duì)象。
      4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200;500;590),其中, 所述音頻信號(hào)譯碼器被配置為執(zhí)行兩步式處理,使得所述音頻信號(hào)處理器中的所述第二音頻信息的處理在描述所述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的所述第一集合與描述所述第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的所述第二集合間分離之后執(zhí)行。
      5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;570),其中,所述音頻信號(hào)處理器被配置為根據(jù)與所述第二音頻對(duì)象類型的所述音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息(110 ;212 ;512 ;512a)而與所述第一音頻對(duì)象類型的所述音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息(110 ;212 ;512 ;512a)獨(dú)立無關(guān)地來處理所述第二音頻信息(134 ; 264 ;564 ;564a)。
      6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中, 所述對(duì)象分離器被配置為使用所述下混信號(hào)表示型態(tài)的一個(gè)或多個(gè)下混信號(hào)信道與一個(gè)或多個(gè)剩余信道的線性組合來獲得所述第一音頻信息(132 ;262 ;562 ;562a, Xeao)及所述第二音頻信息(Π4 ;264 ;564 ;564a, Xqbj),其中,所述對(duì)象分離器被配置為根據(jù)與所述第一音頻對(duì)象類型的所述音頻對(duì)象0 . . . HIneacm ;n0. . . Hneao^1.)相關(guān)聯(lián)的下混參數(shù)、及根據(jù)所述第一音頻對(duì)象類型的所述音頻對(duì)象的信道預(yù)測(cè)系數(shù)(C",而執(zhí)行所述線性組合來獲得組合參數(shù)。
      7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中, 所述對(duì)象分離器被配置為根據(jù)
      8.根據(jù)權(quán)利要求7所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為獲得逆下混矩陣δ—1作為擴(kuò)展的下混矩陣δ的逆矩陣,其中δ被定義為
      9.根據(jù)權(quán)利要求8所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為計(jì)算所述預(yù)測(cè)系數(shù)^/,ο及。_,ι為
      10.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中,所述對(duì)象分離器被配置為根據(jù)
      11.根據(jù)權(quán)利要求10所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為獲得所述逆下混矩陣δ-1作為擴(kuò)展的下混矩陣δ的逆矩陣,δ被定義為
      12.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中, 所述對(duì)象分離器被配置為根據(jù)
      13.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為根據(jù)
      14.根據(jù)權(quán)利要求1至13中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中, 所述對(duì)象分離器被配置為施加描繪矩陣至所述第一音頻信息(132 ;262 ;562 ;562a)而將所述第一音頻信息的對(duì)象信號(hào)映像至所述上混音頻信號(hào)表示型態(tài)(120 ;220 ;222 ;562 ;562a) 的音頻信道上。
      15.根據(jù)權(quán)利要求1至14中任一項(xiàng)所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中, 所述音頻信號(hào)處理器(140 ;270 ;570 ;570a)被配置為根據(jù)描繪信息、對(duì)象相關(guān)的協(xié)方差信息(E)、下混信息(D)來執(zhí)行所述第二音頻信息(134 ;264 ;564 ;564a)的立體聲預(yù)處理,以獲得所述第二音頻信息的已處理的版本的音頻信道。
      16.根據(jù)權(quán)利要求15所述的音頻信號(hào)譯碼器(100;200 ;500 ;590),其中,所述音頻信號(hào)處理器(140 ;270 ;570 ;570a)被配置為根據(jù)描繪信息及協(xié)方差信息來執(zhí)行立體聲處理, 以將所述第二音頻信息(134 ;264 ;564 ;564a)的經(jīng)估算的音頻對(duì)象貢獻(xiàn)(ED*JX)映像至所述上混音頻信號(hào)表示型態(tài)的多個(gè)信道上。
      17.根據(jù)權(quán)利要求15或16所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為根據(jù)描繪上混誤差信息(R)及一個(gè)或多個(gè)去相關(guān)的信號(hào)強(qiáng)度縮放值(wdl,wd2)而將去相關(guān)的音頻信號(hào)貢獻(xiàn)(P2Xd)加至所述第二音頻信息,或加至自所述第二音頻信息所導(dǎo)出的信肩、ο
      18.根據(jù)權(quán)利1至14中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器 (140 ;270 ;570 ;570a)被配置為根據(jù)描繪信息(A)、對(duì)象相關(guān)的協(xié)方差信息(E)及下混信息 (D)執(zhí)行第二音頻信息(134 ;264 ;564 ;564a)的后處理。
      19.根據(jù)權(quán)利要求18所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為考慮頭相關(guān)的傳送功能,執(zhí)行所述第二音頻信息的單聲道至雙聲道處理,以將所述第二音頻信息的一單信道映像到所述上混信號(hào)表示型態(tài)的二信道上。
      20.根據(jù)權(quán)利要求18所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為執(zhí)行所述第二音頻信息的單聲道至立體聲處理,以將所述第二音頻信息的單信道映像至所述上混信號(hào)表示型態(tài)的二信道上。
      21.根據(jù)權(quán)利要求18所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為考慮頭相關(guān)的傳送功能,以執(zhí)行所述第二音頻信息的立體聲道至雙聲道處理,以將所述第二音頻信息的二信道映像到所述上混信號(hào)表示型態(tài)的二信道上。
      22.根據(jù)權(quán)利要求18所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為執(zhí)行所述第二音頻信息的立體聲道至立體聲道處理,以將所述第二音頻信息的二信道映像到所述上混信號(hào)表示型態(tài)的二信道上。
      23.根據(jù)權(quán)利要求1至22中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為將并無剩余信息相關(guān)聯(lián)的所述第二音頻對(duì)象類型的音頻對(duì)象處理為單一音頻對(duì)象,以及其中,所述音頻信號(hào)處理器(140 ;270 ;570 ;570a)被配置為考慮與所述第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的對(duì)象專一性描繪參數(shù)而調(diào)整所述第二音頻對(duì)象類型的音頻對(duì)象對(duì)所述上混信號(hào)表示型態(tài)的貢獻(xiàn)。
      24.根據(jù)權(quán)利要求1至23中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為對(duì)第二音頻對(duì)象類型的多個(gè)音頻對(duì)象獲得一個(gè)或二個(gè)共享對(duì)象位準(zhǔn)差值(0U\,0LDK); 以及其中,所述對(duì)象分離器被配置為使用所述共享對(duì)象位準(zhǔn)差值用于信道預(yù)測(cè)系數(shù)(CPC) 的計(jì)算;以及其中,所述對(duì)象分離器被配置為使用所述信道預(yù)測(cè)系數(shù)獲得表示所述第二音頻信息的一個(gè)或二個(gè)音頻信道。
      25.根據(jù)權(quán)利要求1至M中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為對(duì)第二音頻對(duì)象類型的多個(gè)音頻對(duì)象獲得一個(gè)或二個(gè)共享對(duì)象位準(zhǔn)差值(0U\,0LDK); 以及其中,所述對(duì)象分離器被配置為使用所述共享對(duì)象位準(zhǔn)差值用于矩陣(M)的元的計(jì)算;以及其中,所述對(duì)象分離器被配置為使用所述矩陣(M)獲得表示所述第二音頻信息的一個(gè)或多個(gè)音頻信道。
      26.根據(jù)權(quán)利要求1至25中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為若發(fā)現(xiàn)有所述第二音頻對(duì)象類型的兩個(gè)音頻對(duì)象,則根據(jù)所述對(duì)象相關(guān)的參數(shù)信息而選擇性地獲得與所述第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的所述共享對(duì)象間相關(guān)值(I0Q,E),以及若發(fā)現(xiàn)有所述第二音頻對(duì)象類型的多于或少于兩個(gè)的音頻對(duì)象,則設(shè)定與所述第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的所述共享對(duì)象間相關(guān)值為零;以及其中,所述對(duì)象分離器被配置為使用所述共享對(duì)象間相關(guān)值用于矩陣(M)的元的計(jì)算;以及其中,所述對(duì)象分離器被配置為使用與所述第二音頻對(duì)象類型的音頻對(duì)象相關(guān)聯(lián)的所述共享對(duì)象間相關(guān)值獲得表示所述第二音頻信息的一個(gè)或多個(gè)音頻信道。
      27.根據(jù)權(quán)利要求1至沈中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為根據(jù)所述對(duì)象相關(guān)的參數(shù)信息描繪所述第二音頻信息,以獲得所述第二音頻對(duì)象類型的音頻對(duì)象的經(jīng)描繪的表示型態(tài)作為所述第二音頻信息的已處理的版本。
      28.根據(jù)權(quán)利要求1至27中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為提供所述第二音頻信息,使得所述第二音頻信息描述所述第二音頻對(duì)象類型的多于兩個(gè)的音頻對(duì)象。
      29.根據(jù)權(quán)利要求觀所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為獲得表示所述第二音頻對(duì)象類型的多于兩個(gè)的音頻對(duì)象的一信道音頻信號(hào)表示型態(tài)或二信道音頻信號(hào)表示型態(tài)作為所述第二音頻信息。
      30.根據(jù)權(quán)利要求1至四中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)處理器被配置為考慮與所述第二音頻對(duì)象類型的多于兩個(gè)的音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息,接收所述第二音頻信息及處理所述第二音頻信息。
      31.根據(jù)權(quán)利要求1至30中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述音頻信號(hào)譯碼器被配置為自所述對(duì)象相關(guān)的參數(shù)信息的配置信息(SAOCSpecificConfig)提取對(duì)象總數(shù)信息(bsNumGroupsreO)及前景對(duì)象數(shù)目信息(bsNumOb jectss),及通過形成所述對(duì)象總數(shù)信息與所述前景對(duì)象數(shù)目信息間的差來判定所述第二音頻對(duì)象類型的音頻對(duì)象數(shù)目。
      32.根據(jù)權(quán)利要求1至31中任一項(xiàng)所述的音頻信號(hào)譯碼器,其中,所述對(duì)象分離器被配置為使用與所述第一音頻對(duì)象類型的Nem音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息獲得表示所述第一音頻對(duì)象類型的Nem音頻對(duì)象的Nem音頻信號(hào)(Xem)作為第一音頻信息,及獲得表示所述第二音頻對(duì)象類型的N-Nem音頻對(duì)象的一個(gè)或二個(gè)音頻信號(hào)(Xobj)作為第二音頻信息,將所述第二音頻信息的N-Nem音頻對(duì)象處理為單一一信道或二信道音頻對(duì)象;以及其中,所述音頻信號(hào)處理器被配置為使用與所述第二音頻對(duì)象類型的N-Nem音頻對(duì)象相關(guān)聯(lián)的對(duì)象相關(guān)的參數(shù)信息而個(gè)別描繪通過一個(gè)或二個(gè)所述第二音頻對(duì)象類型的音頻信號(hào)所表示的N-Nem音頻對(duì)象。
      33.一種用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息來提供上混信號(hào)表示型態(tài)的方法,所述方法包括分解所述下混信號(hào)表示型態(tài),以根據(jù)所述下混信號(hào)表示型態(tài)及使用所述對(duì)象相關(guān)的參數(shù)信息的至少一部分提供描述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的第一音頻信息,和描述第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的第二音頻信息;以及根據(jù)所述對(duì)象相關(guān)的參數(shù)信息處理所述第二音頻信息,以獲得所述第二音頻信息的已處理的版本;以及組合所述第一音頻信息與所述第二音頻信息的已處理的版本,以獲得所述上混信號(hào)表示型態(tài)。
      34. 一種計(jì)算機(jī)程序,當(dāng)在計(jì)算機(jī)上運(yùn)行所述計(jì)算機(jī)程序時(shí)用,所述計(jì)算機(jī)程序用于執(zhí)行根據(jù)權(quán)利要求33所述方法。
      全文摘要
      一種音頻信號(hào)譯碼器,用以根據(jù)下混信號(hào)表示型態(tài)及對(duì)象相關(guān)的參數(shù)信息而提供上混信號(hào)表示型態(tài),該音頻信號(hào)譯碼器包括對(duì)象分離器,被配置為分解該下混信號(hào)表示型態(tài),以根據(jù)該下混信號(hào)表示型態(tài)及使用該對(duì)象相關(guān)的參數(shù)信息中的至少一部分提供描述第一音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第一集合的第一音頻信息,及描述第二音頻對(duì)象類型的一個(gè)或多個(gè)音頻對(duì)象的第二集合的第二音頻信息。該音頻信號(hào)譯碼器還包括音頻信號(hào)處理器,被配置為接收該第二音頻信息,以及根據(jù)該對(duì)象相關(guān)的參數(shù)信息處理該第二音頻信息,以獲得該第二音頻信息的已處理的版本。該音頻信號(hào)譯碼器還包括音頻信號(hào)組合器,被配置為組合該第一音頻信息與該第二音頻數(shù)據(jù)的已處理的版本,以獲得該上混信號(hào)表示型態(tài)。
      文檔編號(hào)G10L19/14GK102460573SQ201080028673
      公開日2012年5月16日 申請(qǐng)日期2010年6月23日 優(yōu)先權(quán)日2009年6月24日
      發(fā)明者于爾根·赫萊, 列昂尼德·特倫蒂夫, 奧利弗·黑爾慕斯, 法爾科·里德魯施, 科爾內(nèi)利婭·法爾克, 約翰內(nèi)斯·希爾珀特 申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1