用于生成多個音頻聲道的裝置和方法
【專利摘要】一種用于生成用于第一揚(yáng)聲器設(shè)置的多個音頻聲道的裝置的特征在于假想揚(yáng)聲器確定器、能量分布計(jì)算器、處理器和渲染器。假想揚(yáng)聲器確定器被配置為確定未包含在第一揚(yáng)聲器設(shè)置中的假想揚(yáng)聲器的位置,以獲得包含該假想揚(yáng)聲器的第二揚(yáng)聲器設(shè)置。能量分布計(jì)算器被配置為計(jì)算從假想揚(yáng)聲器到第二揚(yáng)聲器設(shè)置中的其他揚(yáng)聲器的能量分布。處理器被配置為重復(fù)能量分布,以獲得針對從第二揚(yáng)聲器設(shè)置到第一揚(yáng)聲器設(shè)置的下混頻的下混頻信息。渲染器被配置為使用下混頻信息生成該多個音頻聲道。
【專利說明】
用于生成多個音頻聲道的裝置和方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及用于生成用于揚(yáng)聲器設(shè)置的多個音頻聲道的裝置和方法。
【背景技術(shù)】
[0002] 空間音頻編解碼硬件和軟件在本領(lǐng)域中是眾所周知的,并例如在MPEG環(huán)繞標(biāo)準(zhǔn)中 進(jìn)行了標(biāo)準(zhǔn)化??臻g音頻系統(tǒng)包括一定數(shù)目的揚(yáng)聲器及相應(yīng)音頻聲道,例如,左聲道、中央 聲道、右聲道、左環(huán)繞聲道、右環(huán)繞聲道和低頻增強(qiáng)聲道。每個聲道通常由相應(yīng)揚(yáng)聲器來再 現(xiàn)。輸出設(shè)置中對揚(yáng)聲器的放置通常是固定的,且例如取決于5.1格式、7.1格式等。根據(jù)相 應(yīng)格式來定義揚(yáng)聲器的位置。一些設(shè)置將揚(yáng)聲器位置定義在收聽者位置之上。該揚(yáng)聲器也 被稱為上帝之聲(VoG)。一些格式還可以定義位置在收聽者的揚(yáng)聲器之下。相應(yīng)地,該揚(yáng)聲 器可被稱為地獄之聲(VoH)。為了生成對揚(yáng)聲器設(shè)置中的揚(yáng)聲器的音頻信號進(jìn)行定義的音 頻聲道,可以使用矢量基幅度平移(VBAP)方法。VBAP使用指向揚(yáng)聲器設(shè)置的揚(yáng)聲器的一組N 個單位矢量h,...,1N。在揚(yáng)聲器設(shè)置被配置為再現(xiàn)三維聲學(xué)場景的情況下,將該揚(yáng)聲器設(shè) 置表示為3D揚(yáng)聲器設(shè)置。通過這些揚(yáng)聲器矢量的線性組合來定義由Cartesian單位矢量P給 出的平移方向。
[0003] ρ = [1ι,· · ·,lN][gi,· · ·,gN]T (1)
[0004] 其中,gn表示應(yīng)用于ln.的縮放因子。在1?中,通過3個矢量基來形成矢量空間。因 此,如果活躍揚(yáng)聲器的數(shù)目且因此非零縮放因子的數(shù)目被限制為3,則一般可通過矩陣取逆 來求解(1)。實(shí)際上,這是通過定義揚(yáng)聲器之間的三角形網(wǎng)格并通過選擇針對其間區(qū)域的那 些三元組來完成的。這可導(dǎo)致關(guān)于以下方面要應(yīng)用的縮放因子的解
[0005] [gnl,gn2,gn3] T=[lnl,ln2,ln3]-2)
[0006] 其中,{m,n2,n3}表示活躍的揚(yáng)聲器三元組。最后,歸一化(其確保功率歸一化的輸 出信號)導(dǎo)致最終平移增益a!,· · ·,aN:
[0007] 3)
[0008] MPEG-Η解碼器中包括的對象渲染器使用VBAP來渲染針對給定揚(yáng)聲器配置的音頻 對象。如果揚(yáng)聲器設(shè)置不包括T0( "上帝之聲")揚(yáng)聲器(如9.1揚(yáng)聲器設(shè)置),則其仰角相對于 收聽者的位置大于35°的對象被限制為35°仰角(上揚(yáng)聲器的缺省仰角角度)。然而作為實(shí)際 解決方案,該解決方案很明顯不是最優(yōu)的,因?yàn)槠淇赡芨淖兯佻F(xiàn)的聲學(xué)場景。
[0009] 在9.1揚(yáng)聲器設(shè)置(即,根據(jù)9.1格式的揚(yáng)聲器設(shè)置)中,將上半球劃分為兩個三角 形的備選方案將導(dǎo)致不對稱,且在收聽者正上方的對象會因此由兩個相向的揚(yáng)聲器來再 現(xiàn)。因此,與音頻對象將從左上前方向右上后方移動相比,例如從右上前方向左上后方移動 的音頻對象聽起來將會不同,即使揚(yáng)聲器設(shè)置是對稱的。該困境的解決方案是使用Ν向(Ν-wi se)平移,其中,對于上半球中的對象而言,所有的上揚(yáng)聲器都涉及到。將VBAP平移從三個 揚(yáng)聲器擴(kuò)展為N個揚(yáng)聲器稱為N向平移??赏ㄟ^由三角形的邊規(guī)定的圖形給出相鄰關(guān)系,其 例如將會由MPEG解碼器計(jì)算??衫缤ㄟ^形成具有N個頂點(diǎn)的一個或多個多面體來獲得三 角形。可由揚(yáng)聲器形成頂點(diǎn)??稍诙嗝骟w的外表面之外形成三角形。
[0010] VBAP平移方法要求針對所有立體角的正確三角測量。在當(dāng)前的MPEG-Η 3D參考軟 件中,針對固定數(shù)目的揚(yáng)聲器設(shè)置來預(yù)計(jì)算該三角測量并通過表格的形式給出。這在當(dāng)前 將所支持的揚(yáng)聲器設(shè)置限制為給定的設(shè)置或限制為僅相差較小位移的設(shè)置。
[0011] 對揚(yáng)聲器位置進(jìn)行定義的音頻格式引導(dǎo)用戶(例如收聽者)將揚(yáng)聲器放置在這些 所定義的位置處。例如在將揚(yáng)聲器定義為圍繞收聽者呈環(huán)形或環(huán)形路徑布置的情況下,這 樣的要求可能難以滿足。一些用戶,特別是居住在公寓中的用戶,需要適應(yīng)這樣的設(shè)置,因 為具有揚(yáng)聲器設(shè)置的起居室是矩形的而不是圓形的,并且用戶更愿意將揚(yáng)聲器放得靠近墻 而不是在房間的中間。
[0012] 因此,例如需要允許更靈活的揚(yáng)聲器設(shè)置的音頻解碼概念。
【發(fā)明內(nèi)容】
[0013] 本發(fā)明的目標(biāo)是提供針對更靈活的音頻編碼裝置和方法的概念。
[0014] 通過獨(dú)立權(quán)利要求的主題來解決該目標(biāo)。
[0015] 本發(fā)明的其他有利修改是從屬權(quán)利要求的主題。
[0016] 本發(fā)明的實(shí)施例涉及用于生成用于第一揚(yáng)聲器設(shè)置的多個音頻聲道的裝置。該裝 置包括:假想揚(yáng)聲器確定器,用于確定未包含在第一揚(yáng)聲器設(shè)置中的假想揚(yáng)聲器的位置。通 過確定假想揚(yáng)聲器的位置,獲得包含假想揚(yáng)聲器的第二揚(yáng)聲器設(shè)置。該裝置還包括:能量分 布計(jì)算器,用于計(jì)算從假想揚(yáng)聲器到第二揚(yáng)聲器設(shè)置中的其他揚(yáng)聲器的能量分布。該裝置 還包括:處理器,重復(fù)所述能量分布,以獲得針對從第二揚(yáng)聲器設(shè)置到第一揚(yáng)聲器設(shè)置的下 混頻的下混頻信息。該裝置的渲染器被配置為使用下混頻信息生成該多個音頻聲道。
[0017] 發(fā)明人已發(fā)現(xiàn),通過確定虛擬(即,假想)揚(yáng)聲器的位置,可以如同真實(shí)的設(shè)置(第 一設(shè)置)將會關(guān)于揚(yáng)聲器的數(shù)目和/或揚(yáng)聲器的位置與所定義的配置匹配一樣來處理音頻 數(shù)據(jù)(例如針對定義的格式進(jìn)行格式化的電影的3D音頻數(shù)據(jù))。為了控制真實(shí)揚(yáng)聲器,根據(jù) 能量分布對假想的第二設(shè)置進(jìn)行下混頻,使得可以如同第一設(shè)置(真實(shí)實(shí)現(xiàn)的設(shè)置)是第二 設(shè)置(例如,由格式定義的設(shè)置)一樣來控制該第一設(shè)置。
[0018] 這使得由相應(yīng)格式定義的音頻聲道例如可適應(yīng)于在收聽者的家中實(shí)現(xiàn)的真實(shí)揚(yáng) 聲器設(shè)置。
[0019] 本發(fā)明的其他實(shí)施例涉及一種裝置,其中,處理器被配置為基于能量分布生成能 量分布矩陣。能量分布矩陣的元素可以表示假想揚(yáng)聲器到另一揚(yáng)聲器的能量分布。處理器 被配置為計(jì)算該能量分布矩陣的冪。能量分布矩陣的冪使所獲得的矩陣的元素減小或收斂 到所定義的閾值,使得對于進(jìn)一步的處理而言,這些元素可被忽略。因此,可基于能量分布 矩陣的冪來獲得下混頻信息。下混頻信息指示如何控制第一揚(yáng)聲器設(shè)置中的揚(yáng)聲器模擬第 二揚(yáng)聲器設(shè)置。
[0020] 本發(fā)明的其他實(shí)施例涉及一種還包括能量分布計(jì)算器的裝置,能量分布計(jì)算器包 括相鄰估計(jì)器。相鄰估計(jì)器被配置為確定作為假想揚(yáng)聲器的相鄰揚(yáng)聲器的至少一個揚(yáng)聲 器。能量分布計(jì)算器被配置為計(jì)算假想揚(yáng)聲器到虛揚(yáng)聲器中的所述至少一個相鄰揚(yáng)聲器的 能量分布。
[0021] 通過確定假想揚(yáng)聲器的相鄰揚(yáng)聲器,相應(yīng)的假想揚(yáng)聲器可被布置在任何位置,使 得第二揚(yáng)聲器設(shè)置可被配置為根據(jù)預(yù)定義設(shè)置(例如,某個格式)來實(shí)現(xiàn)。另一好處是在重 復(fù)相鄰估計(jì)時可針對改變的第一揚(yáng)聲器設(shè)置生成該多個音頻聲道。因此,相同的真實(shí)揚(yáng)聲 器設(shè)置可例如適配為在一個時間再現(xiàn)5.1多聲道信號,且在另一時間再現(xiàn)7.1多聲道信號。
[0022] 其他的實(shí)施例涉及裝置,其中,相鄰估計(jì)器被配置為確定作為假想揚(yáng)聲器的相鄰 揚(yáng)聲器的至少兩個揚(yáng)聲器,以及能量分布計(jì)算器被配置為計(jì)算能量分布,使得作為假想揚(yáng) 聲器的相鄰揚(yáng)聲器的所述至少兩個揚(yáng)聲器之間的能量分布在預(yù)定義的容限內(nèi)相等,即均勻 分布。預(yù)定義容限可例如是與均勻分布值偏差0.1 %、1 %或10%。
[0023] 通過計(jì)算在相鄰揚(yáng)聲器之間均勻分布的能量,可確保能量分布矩陣的冪的收斂, 使得可獲得下混頻信息的唯一結(jié)果。
[0024] 本發(fā)明的其他實(shí)施例涉及一種裝置,其中,相鄰估計(jì)器被配置為確定作為假想揚(yáng) 聲器的相鄰揚(yáng)聲器的至少兩個揚(yáng)聲器,以及作為假想揚(yáng)聲器的相鄰揚(yáng)聲器的所述至少兩個 揚(yáng)聲器中的至少一個揚(yáng)聲器是假想揚(yáng)聲器。好處是,即使第一揚(yáng)聲器設(shè)置有一個以上的揚(yáng) 聲器不同于第二揚(yáng)聲器設(shè)置,也可以獲得下混頻信息。
[0025] 本發(fā)明的其他實(shí)施例涉及一種裝置,其中,該裝置是音頻解碼器的格式變換單元 的一部分,使得音頻解碼器提供的例如用于控制第一揚(yáng)聲器設(shè)置的聲道的數(shù)目從較高音頻 聲道數(shù)目或最大音頻聲道數(shù)目(例如,諸如MPEG-Η的標(biāo)準(zhǔn)支持的最大數(shù)目)下混頻為相應(yīng)地 針對于實(shí)際存在的揚(yáng)聲器的數(shù)目的格式。
[0026] 其他實(shí)施例涉及一種裝置,其中,該裝置是音頻解碼器的對象渲染器的一部分,且 該裝置包括平移器,使得對象渲染器適配為根據(jù)第一揚(yáng)聲器設(shè)置提供多個音頻聲道。
[0027] 其他實(shí)施例涉及一種裝置,其中,該裝置被配置為提供第一揚(yáng)聲器設(shè)置的有效性 信息。
[0028] 該實(shí)施例的好處是,該裝置相應(yīng)地,有效性信息可指示是否可以向(例如,由用戶 例如在家中實(shí)現(xiàn)的)第一揚(yáng)聲器設(shè)置提供適當(dāng)?shù)囊纛l聲道,或例如是否必須重新放置揚(yáng)聲 器以與要求(例如,揚(yáng)聲器位置的容限)匹配。
[0029] 其他實(shí)施例涉及一種音頻系統(tǒng),該音頻系統(tǒng)包括:用于生成用于揚(yáng)聲器設(shè)置的多 個音頻聲道的裝置,以及根據(jù)由該裝置提供的多個音頻聲道的多個揚(yáng)聲器。
[0030] 該實(shí)施例的好處是可以實(shí)現(xiàn)例如用于實(shí)現(xiàn)3D聲學(xué)場景的音頻系統(tǒng)。
[0031] 本發(fā)明的其他實(shí)施例涉及一種用于生成用于第一揚(yáng)聲器設(shè)置的多個音頻聲道的 方法,并涉及一種計(jì)算機(jī)程序。
【附圖說明】
[0032] 將參考附圖更詳細(xì)地描述本發(fā)明的實(shí)施例,在附圖中:
[0033] 圖1示出根據(jù)本發(fā)明的實(shí)施例的用于生成用于第一揚(yáng)聲器設(shè)置的多個音頻聲道的 裝置的示意性框圖;
[0034] 圖2示出根據(jù)本發(fā)明的實(shí)施例的示例性第二揚(yáng)聲器設(shè)置的示意圖,該示例性第二 揚(yáng)聲器設(shè)置包括假想揚(yáng)聲器和形成第一揚(yáng)聲器設(shè)置的真實(shí)揚(yáng)聲器;
[0035] 圖3以從上方的透視視角示出圖2的第二揚(yáng)聲器投影到二維平面的示意圖;
[0036]圖4a示出根據(jù)本發(fā)明的實(shí)施例的第一揚(yáng)聲器設(shè)置14-1相對于位置42的透視圖; [0037]圖4b示出了圖4a的配置的頂視圖;
[0038]圖5a示出根據(jù)本發(fā)明的實(shí)施例的圖4a的第一揚(yáng)聲器設(shè)置的示意性透視圖,其中, 附加假想揚(yáng)聲器形成在環(huán)形形狀上,形成第二揚(yáng)聲器設(shè)置;
[0039]圖5b示出圖5a的場景的頂視圖,并描繪了環(huán)48的圓形形狀;
[0040] 圖6示出了第二揚(yáng)聲器設(shè)置上的透視圖,該第二揚(yáng)聲器設(shè)置包括第一揚(yáng)聲器設(shè)置 和假想揚(yáng)聲器;根據(jù)本發(fā)明的實(shí)施例,假想揚(yáng)聲器的位置位于計(jì)算球面處。
[0041] 圖7示出根據(jù)本發(fā)明的實(shí)施例的根據(jù)圖2的第二揚(yáng)聲器設(shè)置的示意圖,其中描繪了 與平坦層垂直的層,以澄清揚(yáng)聲器的相鄰關(guān)系;
[0042] 圖8示出了根據(jù)本發(fā)明的實(shí)施例的音頻解碼器的示意性框圖,該音頻解碼器可被 用于解碼MP4信號以獲得多個音頻信號,描述了裝置的兩個選項(xiàng);
[0043] 圖9示出了作為圖8中的選項(xiàng)1參考的裝置的示意性框圖;
[0044] 圖10示出了作為圖8中的選項(xiàng)2參考的格式變換框1720的示意性框圖;以及
[0045] 圖11示出了音頻系統(tǒng)的示意性框圖。
【具體實(shí)施方式】
[0046] 在下面的描述中,即使在不同的圖中出現(xiàn),同樣的或等同的元素或者具有同樣的 或等同的功能的元素也由同樣的或等同的附圖標(biāo)記來表示。
[0047] 在以下描述中,闡述了多個細(xì)節(jié)以提供對本發(fā)明的實(shí)施例的更透徹的解釋。然而, 本領(lǐng)域技術(shù)人員將清楚的是,可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐本發(fā)明的實(shí)施例。在 其他實(shí)例中,以框圖形式而不是具體地示出了公知的結(jié)構(gòu)和設(shè)備,以避免對本發(fā)明的實(shí)施 例造成混淆。此外,除非另外具體指示,否則下文所述的不同實(shí)施例的特征可以彼此組合。
[0048] 圖1示出用于生成用于第一揚(yáng)聲器設(shè)置14的多個音頻聲道12的裝置10的示意性框 圖。第一揚(yáng)聲器設(shè)置14包括多個揚(yáng)聲器16a_c。揚(yáng)聲器16a_c可例如位于收聽房間中,并且可 以是再現(xiàn)系統(tǒng)的一部分,例如作為影院或家庭影院應(yīng)用的一部分。第一揚(yáng)聲器設(shè)置14是真 實(shí)存在的。裝置10包括假想揚(yáng)聲器確定器18,用于確定未包含在第一揚(yáng)聲器設(shè)置14中的假 想揚(yáng)聲器22的位置。假想揚(yáng)聲器確定器18被配置為獲得包含假想揚(yáng)聲器22的第二揚(yáng)聲器設(shè) 置24。第二揚(yáng)聲器設(shè)置24包括第一揚(yáng)聲器設(shè)置14的一些或全部揚(yáng)聲器16a-c。假想揚(yáng)聲器確 定器18可被配置為確定假想揚(yáng)聲器22的位置,使得假想揚(yáng)聲器位于根據(jù)格式定義的位置的 位置處,揚(yáng)聲器應(yīng)該位于該根據(jù)格式定義的位置處,但實(shí)際上并未位于該處。假想揚(yáng)聲器確 定器18執(zhí)行的確定可被控制為使得設(shè)置14和24共同擁有或共同位于設(shè)置14和24中的揚(yáng)聲 器的數(shù)目最小化,或使得兩個設(shè)置14和24中最接近的相鄰揚(yáng)聲器之間的平均距離最小,或 者可由用戶手動控制。
[0049] 裝置10包括能量分布計(jì)算器26,用于計(jì)算從假想揚(yáng)聲器22到第二揚(yáng)聲器設(shè)置中的 其他揚(yáng)聲器的能量分布。備選地或附加地,假想揚(yáng)聲器確定器18可被配置為確定假想揚(yáng)聲 器22的位置,使得假想揚(yáng)聲器22靠近"被位移的"揚(yáng)聲器16a-c,以使得假想揚(yáng)聲器可以校正 由該位移產(chǎn)生的聲學(xué)效應(yīng)。
[0050] 例如,當(dāng)?shù)谝粨P(yáng)聲器設(shè)置14部分地實(shí)現(xiàn)根據(jù)諸如5.1、7.1、9.1、11.2等的音頻格式 的揚(yáng)聲器配置或揚(yáng)聲器設(shè)置時,假想揚(yáng)聲器22可以是第一揚(yáng)聲器設(shè)置14中關(guān)于要實(shí)現(xiàn)的格 式而缺失的揚(yáng)聲器。
[0051 ]能量分布表不假想揚(yáng)聲器22的被分布到第二揚(yáng)聲器設(shè)置24中的其他揚(yáng)聲器的能 量的量或份額。換言之,能量分布表示假想揚(yáng)聲器22在第二揚(yáng)聲器設(shè)置24中的剩余揚(yáng)聲器 之間共享的能量。
[0052] 裝置10還包括處理器28。處理器28被配置為重復(fù)框32所指示的能量分布,以如框 34中的Μ所指示的獲得下混頻信息36。下混頻信息可被用于將第二揚(yáng)聲器設(shè)置24的音頻聲 道下混頻到第一揚(yáng)聲器設(shè)置14。換言之,下混頻信息36允許控制第一揚(yáng)聲器設(shè)置14中的揚(yáng) 聲器16a-c,以獲得在假想揚(yáng)聲器22將會是真實(shí)揚(yáng)聲器時將會至少部分地獲得的聲學(xué)場景。 [0053]裝置10包括用于使用下混頻信息36生成多個音頻聲道12的渲染器38。渲染器38被 配置為將下混頻信息38應(yīng)用到輸入信號或輸入信號組39,例如與第二揚(yáng)聲器設(shè)置24相對應(yīng) 的多個音頻聲道或?qū)S糜谟傻诙P(yáng)聲器設(shè)置24再現(xiàn)的多個音頻聲道。渲染器38被配置為使 用下混頻信息36獲得從第二揚(yáng)聲器設(shè)置24到第一揚(yáng)聲器設(shè)置14的下混頻36。換言之,渲染 器38被配置為通過將假想設(shè)置24的(假想)音頻聲道39下混頻為真實(shí)的第一設(shè)置14的真實(shí) 音頻聲道12來確定多個音頻聲道12。
[0054] 該實(shí)施例的好處是可至少部分地由揚(yáng)聲器16a_c生成聲學(xué)場景,當(dāng)揚(yáng)聲器16a_c將 與更廣泛的設(shè)置匹配時,將會獲得該聲學(xué)場景。通過這種方式,即使在真實(shí)的第一揚(yáng)聲器設(shè) 置14中缺失了一個或多個揚(yáng)聲器(例如,環(huán)繞揚(yáng)聲器),也可實(shí)現(xiàn)具有某一格式(例如,3D格 式)的聲學(xué)場景。
[0055]使用裝置10要解決的任務(wù)可以是例如在任意揚(yáng)聲器設(shè)置上對3D音頻對象的渲染, 即使該任意揚(yáng)聲器設(shè)置關(guān)于某種格式是無效的3D設(shè)置。雖然通過使用假想揚(yáng)聲器,在沒有 包括真實(shí)揚(yáng)聲器的方向之外不產(chǎn)生聲音,用于控制揚(yáng)聲器的確定性解決方案也被(例如自 動地)交付,該解決方案可被視為合理的解決方案。例如,這在以下情況下是適用的:在環(huán)繞 左揚(yáng)聲器不存在時,經(jīng)由左前聲道并然后經(jīng)由右前聲道以較大的份額再現(xiàn)環(huán)繞左聲道。因 此,所呈現(xiàn)的裝置和方法在回退解決方案方面很好地適于MPEG-H。
[0056]備選地或附加地,可根據(jù)預(yù)定義位置確定第二揚(yáng)聲器設(shè)置24中的至少一個其他假 想揚(yáng)聲器的數(shù)目、和/或假想揚(yáng)聲器22和/或該其他假想揚(yáng)聲器的位置,該預(yù)定義位置例如 可包含在表格形式或數(shù)據(jù)庫中。備選地或附加地,可確定假想揚(yáng)聲器22和/或該至少一個其 他假想揚(yáng)聲器的位置,使得第一揚(yáng)聲器設(shè)置14和/或第二揚(yáng)聲器設(shè)置24的揚(yáng)聲器之間的距 離實(shí)質(zhì)上等距或者對應(yīng)于音頻格式或標(biāo)準(zhǔn)。
[0057]換言之,裝置10包括以下使用VBAP平移器或類似平移方法的組件:
[0058] 1.確定缺失和/或所需揚(yáng)聲器位置的組件
[0059] 2.確定這些假想揚(yáng)聲器的相鄰揚(yáng)聲器的組件
[0060] 3.通過使用"能量分布"方法實(shí)現(xiàn)下混頻并可選地執(zhí)行能量歸一化的組件
[0061] 換言之,例如,如果聲學(xué)場景(例如,存儲在如CD的數(shù)據(jù)存儲器上的聲學(xué)場景)包括 6個音頻聲道且第一揚(yáng)聲器設(shè)置包括2個揚(yáng)聲器,則該裝置可被配置為確定缺失的揚(yáng)聲器。
[0062] "能量分布矩陣" Μ可被視為實(shí)質(zhì)貢獻(xiàn),并定義到相應(yīng)相鄰揚(yáng)聲器的相應(yīng)能量的分 布。并不要求能量分布矩陣包含具有恒定值的列。作為備選,利用其他值的實(shí)現(xiàn)也是可能 的。優(yōu)選地,定義列的值以使得這些值可被合計(jì)為值1。能量分布矩陣的基礎(chǔ)可例如是如圖3 中所描繪的能量分布圖。
[0063]圖2示出了示例性揚(yáng)聲器設(shè)置24-1的示意圖,揚(yáng)聲器設(shè)置24-1包括形成第一揚(yáng)聲 器設(shè)置14-1的揚(yáng)聲器16a和16b。揚(yáng)聲器設(shè)置24-1包括4個假想揚(yáng)聲器22a_d。第二揚(yáng)聲器設(shè) 置24-1可以是假想揚(yáng)聲器確定器(其可以是假想揚(yáng)聲器確定器18)確定的結(jié)果,并且可以是 用于相對于收聽者的位置42再現(xiàn)3D聲學(xué)場景的可能的揚(yáng)聲器設(shè)置。當(dāng)?shù)谝粨P(yáng)聲器設(shè)置14-1 例如可以是立體聲配置時(例如,相對于位置42位于前墻處),可將揚(yáng)聲器16a表示為該立體 聲配置的左揚(yáng)聲器,且將揚(yáng)聲器16b表不為該立體聲配置的右揚(yáng)聲器。假想揚(yáng)聲器確定器可 被配置為實(shí)現(xiàn)預(yù)設(shè)置(例如,音頻格式)。當(dāng)揚(yáng)聲器16a和16b的位置與音頻格式的預(yù)定義位 置匹配(可能在容限范圍內(nèi))時,則假想揚(yáng)聲器確定器可被配置為通過將揚(yáng)聲器16a和16b的 位置匹配到預(yù)定義位置來確定假想揚(yáng)聲器22a-d的位置??蓪P(yáng)聲器16a和16b未占據(jù)的位 置確定為假想揚(yáng)聲器22a-d的位置。容限可以是絕對值,例如5cm、50cm或5m,或者是相對值, 例如第一揚(yáng)聲器設(shè)置14-1或第二揚(yáng)聲器設(shè)置24-1的空間的1%、10%或30%。
[0064] 第二揚(yáng)聲器設(shè)置24-1可包括假想上揚(yáng)聲器(上帝之聲,V〇G)22a、位于位置42下方 的下?lián)P聲器(地獄之聲,VoH)22b、假想左環(huán)繞(SL)揚(yáng)聲器22c和假想右環(huán)繞(SR)揚(yáng)聲器22d。 使用"Γ來標(biāo)記假想揚(yáng)聲器22a-d。備選地,第一揚(yáng)聲器設(shè)置14-1和/或第二揚(yáng)聲器設(shè)置24-1 可包括不同數(shù)目的真實(shí)揚(yáng)聲器16a_b和/或假想揚(yáng)聲器22a_d。真實(shí)揚(yáng)聲器和/或假想揚(yáng)聲器 可位于與所描繪的不同的位置處。
[0065]例如,可將平面環(huán)繞設(shè)置(例如,沒有上帝之聲和地獄之聲揚(yáng)聲器的設(shè)置)定義為 所有的揚(yáng)聲器都在平坦層44內(nèi)。由于環(huán)境(如,收聽房間的特點(diǎn)或例如其他物體(例如,電視 屏幕或窗戶)的存在),揚(yáng)聲器16a、16b和/或22c_d也可位于由上層46a和/或下層46b描述的 容限內(nèi),上層46a和/或下層46b描述了揚(yáng)聲器16a、16b和/或22c-d可位于其中的容限的上邊 界和/或下邊界。層46a和46b可例如通過相對于位置42的、到揚(yáng)聲器16a/16b和/或22c和22d 的最大角度來定義。例如,揚(yáng)聲器16a和16b可各自包括小于等于5度、小于等于10度、小于等 于20度、或小于等于45度的角度α。揚(yáng)聲器16a和22c被布置在層44中,揚(yáng)聲器16b被布置在層 46a中,揚(yáng)聲器22d被布置為層46b中。備選地或附加地,揚(yáng)聲器可被布置在層46a與44之間 和/或44與46b之間。換言之,當(dāng)被稱作平面設(shè)置時,第一揚(yáng)聲器設(shè)置14-1和/或第二揚(yáng)聲器 設(shè)置24-1也可被布置在不同的層中。
[0066] 假想揚(yáng)聲器22b(V〇H)直接位于位置42下方。假想揚(yáng)聲器22a(V〇G)被布置在由位置 42上方的空間定義的上半球內(nèi)。假想揚(yáng)聲器22a相對于前揚(yáng)聲器16a和16b位于位置42前方。 換言之,且相對于位置42,假想揚(yáng)聲器22a被布置在幾何平面(層44)的第一側(cè)處,且假想揚(yáng) 聲器22b沿著與幾何平面的第一側(cè)相向的該幾何平面的第二側(cè)布置。幾何平面可被配置為 分隔揚(yáng)聲器的相鄰性。例如,揚(yáng)聲器16a、16b、22c和22d是假想揚(yáng)聲器22a和22b的相鄰揚(yáng)聲 器(且反之亦然)。被包括邊界46a和46b的幾何平面(層44)所分隔,假想揚(yáng)聲器22a和22b可 被描述為"沒有相鄰揚(yáng)聲器"。
[0067]假想揚(yáng)聲器22a_d之間的箭頭描繪了從假想揚(yáng)聲器22a_d到第二設(shè)置24-1中的臨 近揚(yáng)聲器的可能能量分布,該臨近揚(yáng)聲器是相應(yīng)揚(yáng)聲器22a_d的相鄰揚(yáng)聲器。由能量分布計(jì) 算器(例如,能量分布計(jì)算器26)執(zhí)行能量分布。換言之,每個假想揚(yáng)聲器22a-d的能量被分 布到每個假想揚(yáng)聲器22a_d的相應(yīng)相鄰揚(yáng)聲器,且在每個假想揚(yáng)聲器22a_d的相應(yīng)相鄰揚(yáng)聲 器之間分布。在下面的圖3中描繪了揚(yáng)聲器投影到二維平面的示意圖。
[0068]圖3以從上方的透視視角示出第二揚(yáng)聲器設(shè)置24-1投影到二維平面的示意圖,該 第二揚(yáng)聲器設(shè)置24-1包括第一設(shè)置14-1。圖3通過經(jīng)由箭頭的連接描繪了每個假想揚(yáng)聲器 22a_d的相鄰揚(yáng)聲器,箭頭指示從每個假想揚(yáng)聲器22a_d到其相鄰揚(yáng)聲器的能量分布。可由 相鄰估計(jì)器確定假想揚(yáng)聲器的相鄰揚(yáng)聲器,相鄰估計(jì)器可以是能量分布計(jì)算器(例如,能量 分布計(jì)算器26)的一部分,或例如可以是假想揚(yáng)聲器確定器(例如,假想揚(yáng)聲器確定器18)的 一部分。備選地,相鄰估計(jì)器可以布置在假想揚(yáng)聲器確定器和能量分布計(jì)算器之間。
[0069] 假想環(huán)繞左(SL)揚(yáng)聲器22c具有4個相鄰揚(yáng)聲器:左前(FL)揚(yáng)聲器16a、VoG揚(yáng)聲器 22a、環(huán)繞右(SR)揚(yáng)聲器22d和VoH揚(yáng)聲器22b。每個假想揚(yáng)聲器22a-d的能量從假想揚(yáng)聲器 22a_d向其相鄰揚(yáng)聲器分布,其中,可通過能量分布系數(shù)d xy來表示能量分布,X指示所分布能 量的源,且y指示所分布能量的接收揚(yáng)聲器。用索引1表示左前揚(yáng)聲器16a,用索引2表示右前 揚(yáng)聲器,用索引3表示VoG揚(yáng)聲器22a,用索引4表示VoH揚(yáng)聲器22b,用索引5表示環(huán)繞左揚(yáng)聲 器22c,且用索引6表示環(huán)繞右揚(yáng)聲器22d。
[0070] 每個能量分布系數(shù)dxy可以由能量分布計(jì)算器獨(dú)立確定。根據(jù)實(shí)施例,根據(jù)兩個臨 近揚(yáng)聲器之間的距離來確定或計(jì)算能量分布系數(shù)。根據(jù)備選實(shí)施例,將能量分布以及因此 的能量分布系數(shù)d xy計(jì)算為均勻分布。因?yàn)樵谑纠栽O(shè)置內(nèi)每個假想揚(yáng)聲器22a_d具有4個相 鄰揚(yáng)聲器,這可導(dǎo)致例如相等的能量分布系數(shù)1/4。
[0071] 換言之,從相鄰圖開始,可以構(gòu)建可被表示為能量分布圖的加權(quán)有向圖。權(quán)重(即 該圖中的能量分布系數(shù)dxy)描述了被從假想節(jié)點(diǎn)(揚(yáng)聲器)22a-d向其相鄰揚(yáng)聲器重新分布 的該部分聲音能量。
[0072] 能量分布計(jì)算器(例如,圖1中描繪的能量分布計(jì)算器26)可被配置為將能量分布 系數(shù)排列為能量分布矩陣,例如表示為D。根據(jù)以上所述的相鄰圖,按照FL、FR、VoG、VoH、SL、 SR的順序示例性地排列揚(yáng)聲器??蓪⑺a(chǎn)生的能量分布矩陣D形成為:
[0073] 4)
[0074] 其中,多個列和行對應(yīng)于索引1-6。通過添加假想揚(yáng)聲器22a_d,可以將在第一揚(yáng)聲 器設(shè)置14-1中表示的立體聲設(shè)置轉(zhuǎn)換為有效的3D揚(yáng)聲器設(shè)置。
[0075]針對該示例,將索引dxy設(shè)置為1/4,且因此設(shè)置為0.25。關(guān)于矩陣D的第三列(其表 示作為具有索引1、2、5和6的揚(yáng)聲器16a、16b、22c和22d的相鄰揚(yáng)聲器的假想揚(yáng)聲器22a),矩 陣D在行1、2、5和6中示出了值0.25。
[0076]備選地,可通過可從凸包獲得的三角測量的邊來定義假想揚(yáng)聲器的相鄰揚(yáng)聲器。 在完整平面環(huán)繞設(shè)置的情況下,當(dāng)假想揚(yáng)聲器的所有相鄰揚(yáng)聲器都是現(xiàn)有揚(yáng)聲器時,針對 每個相鄰揚(yáng)聲器,下混頻矩陣的對應(yīng)列可具有恒定值1/·^?,其中,N表示相鄰揚(yáng)聲器的數(shù) 目。
[0077] 例如,可使用能量分布來計(jì)算如何通過其他揚(yáng)聲器補(bǔ)償在真實(shí)的揚(yáng)聲器設(shè)置中不 存在的假想揚(yáng)聲器22a_d。
[0078] 根據(jù)實(shí)施例的裝置的處理器(例如,處理器28)被配置為重復(fù)能量分布。處理器被 配置為重復(fù)能量分布,因?yàn)榭捎?jì)算假想揚(yáng)聲器(例如,22c-d)以部分地補(bǔ)償假想揚(yáng)聲器22a, 即,可將假想揚(yáng)聲器22a的能量部分地分配或重新分配給假想揚(yáng)聲器22c-d并分配或重新分 配給真實(shí)揚(yáng)聲器16a和16b。將分配或重新分配給假想揚(yáng)聲器22c-d的能量例如通過處理器 28重新分布到其相鄰揚(yáng)聲器,使得通過重復(fù)能量分布,將假想揚(yáng)聲器22a-d的能量分配或重 新分配給真實(shí)揚(yáng)聲器16a和16b。這意味著假想揚(yáng)聲器22c-d從假想揚(yáng)聲器22a "接收"必須要 被重新分布的能量。
[0079]可例如通過計(jì)算矩陣D的冪來執(zhí)行該重復(fù)。處理器28被配置為獲得針對從第二揚(yáng) 聲器設(shè)置24-1到第一揚(yáng)聲器設(shè)置14-1的下混頻的下混頻信息。為了獲得下混頻信息,處理 器可被配置為計(jì)算D的第η次冪的平方根(平方根運(yùn)算),其可被表達(dá)為:
[0080] M = sqrt(Dn), 5)
[0081]
[0082]其中,D表示以分布權(quán)重dxy作為元素的能量分布矩陣,η表示迭代(即,重復(fù))次數(shù), 且sqrt( ·)表示逐元素(element-wise)平方根,且Μ表示結(jié)果(且可被表示為下混頻矩陣)。 [0083] 例如,在20次迭代(重復(fù))之后,且因此η = 20,這可導(dǎo)致以下下混頻矩陣:
[0084] 6)
[0085] 具中,弟3、4、5和6仃包拈值0,該值已經(jīng)骰冋卜取整。弟1打和第2行表示在運(yùn)算時 針對具有索引l(16a)和索引2(16b)的揚(yáng)聲器的信息,使得可模擬假想揚(yáng)聲器22a-d的存在。 [0086]換言之,通過將能量分布系數(shù)dxy設(shè)置為相鄰揚(yáng)聲器的數(shù)目的倒數(shù),導(dǎo)致能量預(yù)留, 且同時可確保算法的收斂。
[0087] 處理器可被配置為針對固定值η確定能量分布矩陣D的第η次冪。備選地,處理器可 被配置為迭代地計(jì)算D的冪。例如,處理器可被配置為將D與D相乘,并在然后將結(jié)果與D相 乘,以此類推,以迭代地獲得D的迭代地增加的冪,且然后應(yīng)用平方根運(yùn)算。在針對固定維度 的冪計(jì)算能量分布矩陣的冪時,可獲得包括所產(chǎn)生的下混頻信息的不同第二揚(yáng)聲器設(shè)置的 再現(xiàn)性。備選地,在迭代地計(jì)算能量分布矩陣D的冪時,可將所產(chǎn)生的矩陣的元素或平方根 操作的結(jié)果與例如某個閾值進(jìn)行比較,且在各元素低于該某個閾值的情況下,可以將值設(shè) 置為0。該閾值例如可以是0.05、0.1或0.2,或者任何其他合適的值。這樣的方法可導(dǎo)致更短 的計(jì)算時間和更低的計(jì)算量,因?yàn)橹灰@得適當(dāng)?shù)慕Y(jié)果,該方法便可停止。
[0088] 換言之,可通過應(yīng)用能量分布η次來實(shí)現(xiàn)對能量分布矩陣的第η次冪的計(jì)算。平方 根將能量值改變?yōu)榭蓱?yīng)用于關(guān)于下混頻系數(shù)的信號值的衰減值。由對能量分布矩陣的冪的 計(jì)算而實(shí)現(xiàn)的迭代可導(dǎo)致與假想揚(yáng)聲器對應(yīng)的所有的行都被變換為〇的結(jié)果。
[0089] 換言之,在每個迭代步驟中,處理器實(shí)現(xiàn)的算法適配為根據(jù)給定的權(quán)重來重新分 布這些能量部分。對此進(jìn)行重復(fù),直到假想節(jié)點(diǎn)的能量總量低于給定閾值。對節(jié)點(diǎn)的平方根 最終產(chǎn)生下混頻矩陣Μ的元素,該節(jié)點(diǎn)收集用于現(xiàn)有揚(yáng)聲器的重新分布的能量。渲染器(其 可以是渲染器38)可被配置為應(yīng)用下混頻信息(例如,下混頻矩陣Μ和/或下混頻信息39),以 將較大數(shù)目的音頻聲道下混頻為一定數(shù)目的真實(shí)揚(yáng)聲器。
[0090] 下混頻矩陣的目的可被認(rèn)為是消除所添加的假想揚(yáng)聲器,并將計(jì)算出的增益限制 到現(xiàn)有揚(yáng)聲器。例如,如果給定揚(yáng)聲器設(shè)置既不包含高位揚(yáng)聲器也不包含后置揚(yáng)聲器,則所 添加的在收聽者上方的假想揚(yáng)聲器也將會是假想的后置揚(yáng)聲器的相鄰揚(yáng)聲器,且反之亦 然。
[0091]針對所有的平移方向,VBAP要求導(dǎo)致正平移增益的3個獨(dú)立基矢量。這意味著由該 3個矢量生成的坐標(biāo)系的原點(diǎn)需要在多面體內(nèi)部,且不能是其表面的一部分。因此,通過檢 查所有三角形的距離是否高于某個閾值,可執(zhí)行對給定揚(yáng)聲器設(shè)置是否是有效的3D設(shè)置的 有效性檢查。渲染器可被配置為:通過實(shí)現(xiàn)這樣的有效性檢查和用于處理無效揚(yáng)聲器設(shè)置 的策略,支持具有任意揚(yáng)聲器位置的新?lián)P聲器設(shè)置。例如,渲染器可指示真實(shí)揚(yáng)聲器的重新 定位,使得重新定位的揚(yáng)聲器可啟用假想揚(yáng)聲器的有效位置。
[0092]平面揚(yáng)聲器設(shè)置或不具有任何后置揚(yáng)聲器的設(shè)置很明顯不是有效的3D設(shè)置。渲染 器可被配置為提供用于通過執(zhí)行下混頻來支持這樣的設(shè)置的盡力而為方法。通過在圖2的 設(shè)置14-1的頂部和底部添加這樣的不存在的假想揚(yáng)聲器,可將平面設(shè)置變?yōu)橛行У?D設(shè) 置。通過在缺失位置放置這樣的不存在的揚(yáng)聲器并通過將其下混頻到其相鄰揚(yáng)聲器,可獲 得用于控制第一設(shè)置14-1的策略。
[0093]圖4a不出第一揚(yáng)聲器設(shè)置14-1相對于位置42的透視圖。下面的圖5和圖6將說明假 想揚(yáng)聲器確定器的用于實(shí)現(xiàn)對假想揚(yáng)聲器的位置的確定的可能方法。
[0094]圖4b示出了圖4a的配置的頂視圖。
[0095]圖5a示出了第一揚(yáng)聲器設(shè)置14-1的示意性透視圖,第一揚(yáng)聲器設(shè)置14-1與假想揚(yáng) 聲器22b和22d共同形成第二揚(yáng)聲器設(shè)置24-2。例如通過形成包括第一揚(yáng)聲器設(shè)置14-1中的 揚(yáng)聲器16a和16b二者的環(huán)48,可由假想揚(yáng)聲器確定器(例如,假想揚(yáng)聲器確定器18)獲得假 想揚(yáng)聲器22b和22d的位置。因?yàn)槟承└袷?例如,7.1)限定揚(yáng)聲器位置在環(huán)(位置42位于該 環(huán)內(nèi))上,這可以是用于定義假想揚(yáng)聲器22b和22d的位置的適合的解決方案。
[0096]圖5b示出圖5a的場景的頂視圖,并描繪了環(huán)48的圓形形狀。例如作為用于渲染要 再現(xiàn)的聲學(xué)場景中的聲學(xué)對象的對象渲染器的一部分,假想揚(yáng)聲器確定器被配置為除了手 動選擇的針對給定設(shè)置的三角測量還實(shí)現(xiàn)三角測量算法。例如,Delaunay三角測量可提供 針對該問題的良好解決方案,因?yàn)槠鋵?yīng)于Voronoi圖的對偶圖。備選地或附加地,假想揚(yáng) 聲器確定器可被配置為:通過考慮22b和22d的相應(yīng)位置與位置42和/或參考角49(例如,0°) 之間的角度扮和/或說,假想揚(yáng)聲器來確定假想揚(yáng)聲器22b和22d的位置。因此,可實(shí)現(xiàn)與中心 位置(0°)的例如60°的配置。
[0097]圖6示出了包括第一揚(yáng)聲器設(shè)置14-1、假想揚(yáng)聲器22b、22d和22a的第二揚(yáng)聲器設(shè) 置24-3的透視圖。關(guān)于其位置,假想揚(yáng)聲器22b和22d與圖5a和圖5b中所述的相同。例如可通 過基于環(huán)48計(jì)算球面52來找到假想揚(yáng)聲器22a的位置。例如可通過計(jì)算揚(yáng)聲器16a、16b、22c 和22d或第一揚(yáng)聲器設(shè)置14-1(給定頂點(diǎn)集合)的凸包來計(jì)算球面52。可例如通過 "QuichHull"算法來確定凸包,如在[1]中所描述的,該算法具有0(N*log(N))的平均計(jì)算復(fù) 雜度和〇(N 2)的最差復(fù)雜度,其中,0表示復(fù)雜程度。QuickHull算法適于提供涉及揚(yáng)聲器的 相鄰揚(yáng)聲器的信息。備選實(shí)施例使用其他算法,例如Devide及Conquor算法或Gift Wrap算 法。
[0098] QuickHull算法相當(dāng)簡單,且由于所有的頂點(diǎn)(即,揚(yáng)聲器)都位于球面上這一事實(shí) 可進(jìn)一步簡化。簡單的算法使得可包括到現(xiàn)有框架(例如,參考軟件)中。通過利用三角測量 算法,可通過形成所有表面都被細(xì)分為三角形(如果有必要)的多面體來獲得根據(jù)MPEG格式 所需的三角形。因?yàn)樗许旤c(diǎn)(即,揚(yáng)聲器位置)在球面上位于容限之內(nèi),可通過計(jì)算給定頂 點(diǎn)集合的凸包來建立Delaunay方案。
[0099] -種根據(jù)本發(fā)明的實(shí)施例的用于生成多個音頻聲道的裝置被配置為確定第一揚(yáng) 聲器設(shè)置14-1的揚(yáng)聲器的位置的有效性。例如,當(dāng)?shù)谝粨P(yáng)聲器設(shè)置包括兩個以上揚(yáng)聲器時, 假想揚(yáng)聲器確定器可被配置為確定所有揚(yáng)聲器是否都被布置在環(huán)形路徑上的某個容限內(nèi), 或揚(yáng)聲器是否被布置在關(guān)于位置42的一個層中的某個容限內(nèi)。
[0100]換言之,例如,根據(jù)Delaunay三角測量的空環(huán)特性對于三角測量而言可以是充分 條件。該條件要求沒有其他頂點(diǎn)(即,揚(yáng)聲器)位于任何三角形的外接圓內(nèi)。因?yàn)轫旤c(diǎn)位于球 面上,違反該條件的頂點(diǎn)將會位于所考慮的表面之外,且在該區(qū)域中包(hull)將不會是凸 的。因此,凸包算法(如Quickhul 1算法)滿足Delaunay三角測量的"空環(huán)"充分條件, Delaunay三角測量可提供與揚(yáng)聲器設(shè)置的有效性有關(guān)的信息。此外,假想揚(yáng)聲器確定器或 例如相鄰估計(jì)器可被配置為根據(jù)Delaunay三角測量或提供凸包的算法來確定假想揚(yáng)聲器 的位置或相鄰關(guān)系。
[0101] QuickHull算法可用于例如將N向平移應(yīng)用于具有或不具有上帝之聲的3D設(shè)置。通 過使用QuickHull算法,可提供用于任意3D揚(yáng)聲器設(shè)置的三角測量方法,且可通過使用所提 出的能量分布方法來支持任意(且甚至無效的)揚(yáng)聲器設(shè)置。
[0102] 對于上揚(yáng)聲器層上方的音頻對象而言,在設(shè)置不包括上帝之聲的情況下,例如,可 使用一個或所有升高的揚(yáng)聲器來替代在參考模型0(RM0)中實(shí)現(xiàn)的對高度進(jìn)行限制。這可通 過N向平移來實(shí)現(xiàn)。增加的計(jì)算復(fù)雜度可以小到可忽略。
[0103]因此,如果用于渲染聲學(xué)對象的相應(yīng)對象渲染器除了手動選擇的針對給定設(shè)置的 三角測量還包括三角測量算法,則可支持任何3D揚(yáng)聲器設(shè)置??赏ㄟ^揚(yáng)聲器設(shè)置再現(xiàn)的相 應(yīng)格式來定義該給定設(shè)置。
[0104] 圖7示出了根據(jù)圖2的第二揚(yáng)聲器設(shè)置24-1的示意圖,其中描繪了與層44垂直的層 54。揚(yáng)聲器16a和16b被布置在幾何平面54的第一側(cè)處。假想揚(yáng)聲器22b和22d被布置在幾何 平面54的與該第一側(cè)相向的一側(cè)處。假想揚(yáng)聲器22a沿著幾何平面54的第一側(cè)布置。
[0105] 通過在幾何平面54的與揚(yáng)聲器16a和/或16b-側(cè)相向的一側(cè)處布置假想揚(yáng)聲器, 可在預(yù)定義收聽者位置42處再現(xiàn)三維聲學(xué)場景。簡而言之,第二揚(yáng)聲器設(shè)置24-1模擬了在 收聽者前方的揚(yáng)聲器(揚(yáng)聲器16a和16b)、在收聽者后方的揚(yáng)聲器(揚(yáng)聲器22b和22d)、在收 聽者下方的揚(yáng)聲器(揚(yáng)聲器22b)和上方的揚(yáng)聲器(揚(yáng)聲器22a)。
[0106] 圖8示出了音頻解碼器的示意性框圖,該音頻解碼器可被用于解碼MP4信號以獲得 多個音頻信號12-1。
[0107] 后置處理器1700可被實(shí)現(xiàn)為雙耳渲染器1710或格式變換器1720。備選地,如1730 所示,還可實(shí)現(xiàn)數(shù)據(jù)1205(8卩,音頻聲道)的直接輸出。因此,優(yōu)選在解碼器中對最高數(shù)目的 聲道(例如,22.2或32)執(zhí)行處理,以獲得靈活性并然后在要求較小格式的情況下進(jìn)行后置 處理。
[0108] 對象處理器1200可包括SA0C解碼器(SA0C =空間音頻編碼)1800,且SA0C解碼器被 配置用于對相關(guān)聯(lián)的參數(shù)化數(shù)據(jù)以及核心解碼器輸出的一個或多個傳輸通道進(jìn)行解碼,并 使用已解壓縮的元數(shù)據(jù)來獲得多個已渲染音頻對象。為此,0ΑΜ輸出連接到框1800。
[0109] 此外,對象處理器1200被配置為渲染核心解碼器輸出的已解碼對象,該已解碼對 象未被在SA0C傳輸通道中編碼,但在由對象渲染器1210指示的通常單個的通道化元素 (channeled element)中被編碼。此外,解碼器包括與輸出1730相對應(yīng)的輸出接口,輸出 1730用于向揚(yáng)聲器輸出混頻器的輸出。
[0110] 對象處理器1200可包括空間音頻對象編碼解碼器1800,空間音頻對象編碼解碼器 1800用于解碼一個或多個傳輸通道以及對已編碼音頻對象或已編碼音頻聲道進(jìn)行表示的 相關(guān)聯(lián)的參數(shù)化輔助信息,其中,空間音頻對象編碼解碼器被配置為將相關(guān)聯(lián)的參數(shù)化信 息以及已解壓縮元數(shù)據(jù)轉(zhuǎn)碼為可用于直接渲染輸出格式(例如,在SA0C的較早版本中定義 的輸出格式)的已轉(zhuǎn)碼參數(shù)化輔助信息。后置處理器1700被配置用于使用已解碼傳輸通道 和已轉(zhuǎn)碼參數(shù)化輔助信息計(jì)算輸出格式的音頻聲道。后置處理器執(zhí)行的處理可類似于MPEG 環(huán)繞處理,或可以是任何其他處理,例如BCC處理等。
[0111] 對象處理器1200可包括空間音頻對象編碼解碼器1800,空間音頻對象編碼解碼器 1800被配置為使用已解碼傳輸通道(由核心解碼器解碼)和參數(shù)化輔助信息對針對輸出格 式的聲道信號直接進(jìn)行上混頻和渲染。
[0112] 此外,對象處理器1200包括混頻器1220,當(dāng)與聲道混頻的已預(yù)渲染對象存在時,混 頻器1220直接接收USAC解碼器1300輸出的數(shù)據(jù)來作為輸入。此外,在沒有SA0C解碼的情況 下,混頻器1220從執(zhí)行對象渲染的對象渲染器接收數(shù)據(jù)。此外,混頻器接收SA0C解碼器輸出 數(shù)據(jù),即,SA0C渲染的對象。
[0113] 混頻器1220連接到輸出接口 1730、雙耳渲染器1710和格式變換器1720。雙耳渲染 器1710被配置用于使用頭部相關(guān)轉(zhuǎn)移函數(shù)或雙耳房間脈沖響應(yīng)(BRIR)將輸出聲道渲染為 兩個雙耳聲道。格式變換器1720被配置用于將輸出聲道變換為與混頻器的輸出(數(shù)據(jù))聲道 1205相比具有較低數(shù)目的聲道的輸出格式,且格式變換器1720要求與再現(xiàn)布局(例如,5.1 揚(yáng)聲器等)有關(guān)的信息。
[0114] 在選項(xiàng)1中,且在下面的圖9中將要描述的,用于生成多個音頻聲道12-1的裝置可 例如是對象渲染器1210的一部分。作為選項(xiàng)2,且在下面的圖10中將要描述的,用于生成多 個音頻聲道12-2的裝置可例如是格式變換框1720的一部分,以例如將該數(shù)目的聲道1205下 混頻為多個音頻聲道12-2。在應(yīng)用選項(xiàng)1時,可在混頻器1220的輸出處獲得多個音頻聲道 12-1。該輸出可例如是可與包括多個揚(yáng)聲器的揚(yáng)聲器系統(tǒng)連接的連接器。
[0115] 在應(yīng)用選項(xiàng)2時,可例如在格式變換框1720的輸出處獲得多個音頻聲道12-2。可將 格式變換框1720實(shí)現(xiàn)為例如包括開關(guān)的裝置,啟用應(yīng)該基于聲道1205輸出的格式選擇,例 如,5.1格式。格式變換框1720可與混頻器1220連接,使得格式變換框1720的輸入可以是標(biāo) 準(zhǔn)或格式族(例如MPEG)的最大數(shù)目的聲道(例如,32個)。
[0116] 換言之,這使得可通過僅改變解碼器內(nèi)的信號處理來保持比特流語法不變??赏?過以下的新特征擴(kuò)展參考模型0(RM0)。
[0117] 圖9示出了作為圖8中的選項(xiàng)1參考的裝置10-1的示意性框圖。裝置10-1被配置為 接收涉及聲學(xué)場景內(nèi)要再現(xiàn)的對象的數(shù)據(jù)或信息。裝置10-1的平移器56被配置為基于涉及 對象的數(shù)據(jù)來計(jì)算平移系數(shù)。平移系數(shù)的數(shù)目可以等于被確定為根據(jù)音頻標(biāo)準(zhǔn)或格式再現(xiàn) 聲學(xué)場景的揚(yáng)聲器的數(shù)目。例如,關(guān)于格式5.1,其可以是6個揚(yáng)聲器的數(shù)目。換言之,平移系 數(shù)表示對象所輻射的聲音的縮放因子,其中,平移系數(shù)適于例如關(guān)于聲壓級來縮放揚(yáng)聲器 信號,以實(shí)現(xiàn)對象相對于收聽者位置的位置或方向。
[0118]假想揚(yáng)聲器確定器18-1(其可以是假想揚(yáng)聲器確定器18)被配置為確定一個或多 個假想揚(yáng)聲器的位置。例如,在參考圖8時,在選擇例如由特定格式表示的特定收聽體驗(yàn)時, 可以獲得對要由假想揚(yáng)聲器表示的揚(yáng)聲器的決定。基于此,可考慮連接到混頻器或解碼器 的揚(yáng)聲器的數(shù)目。可以選擇要根據(jù)該格式實(shí)現(xiàn)但沒有連接到混頻器或解碼器的每個揚(yáng)聲器 來作為假想揚(yáng)聲器。
[0119]能量分布計(jì)算器26-1(其可以是能量分布計(jì)算器26)被配置為計(jì)算從假想揚(yáng)聲器 或多個假想揚(yáng)聲器到所獲得的第二揚(yáng)聲器設(shè)置中的其他揚(yáng)聲器的能量分布。處理器28-1 (其可以是處理器28)被配置為重復(fù)能量分布,以例如通過計(jì)算從第二揚(yáng)聲器設(shè)置到第一揚(yáng) 聲器設(shè)置的下混頻的下混頻矩陣Μ來獲得下混頻信息。因此,平移系數(shù)的數(shù)目可以大于音頻 聲道12-1的數(shù)目。處理器28-1被配置為向渲染器38-1(例如,渲染器38)輸出加權(quán)因子。渲染 器38-1被配置為根據(jù)該加權(quán)因子以及相應(yīng)對象的聲音或噪聲生成多個音頻聲道12-1。聲音 或噪聲信號可例如作為單聲道信號提供。因此,渲染器38-1被配置為基于下混頻信息和平 移系數(shù)生成多個音頻聲道12-1,其中,可通過加權(quán)因子來至少部分地表示函數(shù)關(guān)系。
[0120]該實(shí)施例的好處是,通過在對象渲染器12-1內(nèi)實(shí)現(xiàn)用于生成多個音頻聲道12-1的 裝置,可通過與所實(shí)現(xiàn)的硬件設(shè)置相匹配的方式獲得多個音頻聲道12-1。在音頻聲道的最 大數(shù)目是32且音頻聲道的所需數(shù)目是6時,在處理期間可跳過一定數(shù)目的不需要的音頻聲 道(例如26個),使得可降低計(jì)算量。
[0121] 圖10示出了圖8中描繪的格式變換框1720的示意性框圖,格式變換框1720包括用 于生成多個音頻聲道12-2的裝置10-2。裝置10-2被配置為將一定數(shù)目的聲道1205下混頻為 一定數(shù)目的音頻聲道12-2。
[0122] 該實(shí)施例的好處是,可將格式變換框1720附接到或包括到解碼器(例如,圖8中描 繪的解碼器),同時使解碼器本身不改變,并基于解碼器輸出的聲道1205,根據(jù)所需輸出格 式將已解碼音頻信號和音頻聲道進(jìn)行下混頻。
[0123] 圖11示出了音頻系統(tǒng)110的示意性框圖,音頻系統(tǒng)110包括裝置112,裝置112可以 是例如裝置10、裝置10-1或裝置10-2,或者包括例如裝置10、裝置10-1或裝置10-2。音頻系 統(tǒng)110包括兩個揚(yáng)聲器16a和16b。裝置112被配置為生成多個音頻聲道,使得兩個揚(yáng)聲器16a 和16b的數(shù)目在位置42處模擬五個揚(yáng)聲器16a、16b和22a_c的存在。
[0124] 其他實(shí)施例示出了具有不同數(shù)目(例如,6個、10個、13個、32個或更多個)的揚(yáng)聲器 的音頻系統(tǒng)以及用于根據(jù)揚(yáng)聲器的數(shù)目生成多個揚(yáng)聲器信號(音頻聲道)的裝置。該多個揚(yáng) 聲器被配置為接收多個音頻聲道,并基于該多個音頻聲道提供多個聲學(xué)信號。音頻聲道的 數(shù)目可等于要控制的揚(yáng)聲器的數(shù)目。
[0125] 這使得還可針對例如包括有效性檢查的所定義的揚(yáng)聲器設(shè)置且還基于任意的3D 設(shè)置來渲染對象。例如,這可通過將QuickHull算法集成到例如參考軟件(例如,MPEG-Η 3D 參考模型(RM)0)中來執(zhí)行。能量分布方法允許基于任意設(shè)置渲染對象,該任意設(shè)置可以是 有效的3D設(shè)置,但不一定是有效的3D設(shè)置。該方法包括以下步驟:
[0126] 1.針對具有附加假想揚(yáng)聲器的擴(kuò)展揚(yáng)聲器設(shè)置計(jì)算VBAP增益(加權(quán)因子)
[0127] 2.應(yīng)用在初始化期間計(jì)算出的下混頻矩陣
[0128] 3.向已下混頻的VBAP增益應(yīng)用能量歸一化
[0129] 在不存在與應(yīng)用于給定(任意)設(shè)置的格式相對應(yīng)的規(guī)則時,例如作為最后的手 段,該流程還可由格式變換器來施加。這可添加以下的有益特性:渲染器能夠已針對任何給 定設(shè)置產(chǎn)生了信號??衫缤ㄟ^編程語言(例如,C)形式的編程代碼來實(shí)現(xiàn)該方法。
[0130] 換言之,裝置10可被配置為:根據(jù)相應(yīng)格式,基于可以是無效3D設(shè)置的任何揚(yáng)聲器 設(shè)置的基于對象的MPEG-Η數(shù)據(jù)流,獲得適合的音頻信號(音頻聲道)。在參考公式2時,可對 一定數(shù)目的系數(shù)g進(jìn)行下混頻。還可將系數(shù)g表示為VBAP系數(shù)。
[0131] 可在容限內(nèi)確定真實(shí)揚(yáng)聲器和假想揚(yáng)聲器的位置,如圖2中示例性地描述的。這樣 的閾值可應(yīng)用于其他幾何平面和/或包(例如凸包)上的地點(diǎn)或位置。
[0132] 雖然已經(jīng)在裝置的上下文中描述了一些方面,但是將清楚的是,這些方面還表示 對相應(yīng)方法的描述,其中,框或設(shè)備對應(yīng)于方法步驟或方法步驟的特征。類似地,在方法步 驟的上下文中描述的方案也表示對相應(yīng)塊或項(xiàng)或者相應(yīng)裝置的特征的描述。
[0133] 取決于某些實(shí)現(xiàn)要求,可以在硬件中或在軟件中實(shí)現(xiàn)本發(fā)明的實(shí)施例??梢允褂?其上存儲有電子可讀控制信號的數(shù)字存儲介質(zhì)(例如,軟盤、DVD、CD、R0M、PR0M、EPR0M、 EEPR0M或閃存)來執(zhí)行該實(shí)現(xiàn),該電子可讀控制信號與可編程計(jì)算機(jī)系統(tǒng)協(xié)作(或者能夠與 之協(xié)作)從而執(zhí)行相應(yīng)方法。
[0134] 根據(jù)本發(fā)明的一些實(shí)施例包括具有電子可讀控制信號的數(shù)據(jù)載體,該電子可讀控 制信號能夠與可編程計(jì)算機(jī)系統(tǒng)協(xié)作從而執(zhí)行本文所述的方法之一。
[0135] 通常,本發(fā)明的實(shí)施例可以實(shí)現(xiàn)為具有程序代碼的計(jì)算機(jī)程序產(chǎn)品,程序代碼可 操作以在計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時執(zhí)行方法之一。程序代碼可以例如存儲在機(jī)器 可讀載體上。
[0136] 其他實(shí)施例包括存儲在機(jī)器可讀載體上的計(jì)算機(jī)程序,該計(jì)算機(jī)程序用于執(zhí)行本 文所述的方法之一。
[0137] 換言之,本發(fā)明方法的實(shí)施例因此是具有程序代碼的計(jì)算機(jī)程序,該程序代碼用 于在計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時執(zhí)行本文所述的方法之一。
[0138] 因此,本發(fā)明方法的另一實(shí)施例是其上記錄有計(jì)算機(jī)程序的數(shù)據(jù)載體(或者數(shù)字 存儲介質(zhì)或計(jì)算機(jī)可讀介質(zhì)),該計(jì)算機(jī)程序用于執(zhí)行本文所述的方法之一。
[0139] 因此,本發(fā)明方法的另一實(shí)施例是表示計(jì)算機(jī)程序的數(shù)據(jù)流或信號序列,所述計(jì) 算機(jī)程序用于執(zhí)行本文所述的方法之一。數(shù)據(jù)流或信號序列可以例如被配置為經(jīng)由數(shù)據(jù)通 信連接(例如,經(jīng)由互聯(lián)網(wǎng))傳遞。
[0140]另一實(shí)施例包括處理裝置,例如,計(jì)算機(jī)或可編程邏輯器件,所述處理裝置被配置 為或適于執(zhí)行本文所述的方法之一。
[0141] 另一實(shí)施例包括其上安裝有計(jì)算機(jī)程序的計(jì)算機(jī),該計(jì)算機(jī)程序用于執(zhí)行本文所 述的方法之一。
[0142] 在一些實(shí)施例中,可編程邏輯器件(例如,現(xiàn)場可編程門陣列)或集成電路可以用 于執(zhí)行本文所述的方法的一些或全部功能。在一些實(shí)施例中,現(xiàn)場可編程門陣列可以與微 處理器協(xié)作以執(zhí)行本文所述的方法之一。通常,方法優(yōu)選地由任意硬件裝置來執(zhí)行。
[0143] 上述實(shí)施例對于本發(fā)明的原理僅是說明性的。應(yīng)當(dāng)理解的是:本文所述的布置和 細(xì)節(jié)的修改和變形對于本領(lǐng)域其他技術(shù)人員將是顯而易見的。因此,旨在僅由所附專利權(quán) 利要求的范圍來限制而不是由借助對本文的實(shí)施例的描述和解釋所給出的具體細(xì)節(jié)來限 制。
[0144] 參考文獻(xiàn)
[0145] Barber,C·Bradford;Dobkin,David P·;Huhdanpaa,Η·,"The quickhul1 algorithm for convex hulls,',ACM Transactions on Mathematical Software,vol ·22, no 4,pp.469-483,1996.
【主權(quán)項(xiàng)】
1. 一種用于生成用于第一揚(yáng)聲器設(shè)置(14; 14-1)的多個音頻聲道(12; 12-1; 12-2)的裝 置,其特征在于: 假想揚(yáng)聲器確定器(18; 18-1),用于確定未包含在所述第一揚(yáng)聲器設(shè)置(14; 14-1)中的 假想揚(yáng)聲器(22;22a-d)的位置,以獲得包含所述假想揚(yáng)聲器(22;22a-d)的第二揚(yáng)聲器設(shè)置 (24;24-1;24-2;24-3); 能量分布計(jì)算器(26; 26-1 ),用于計(jì)算從所述假想揚(yáng)聲器(22; 22a-d)到所述第二揚(yáng)聲 器設(shè)置(24; 24-1; 24-2; 24-3)中的其他揚(yáng)聲器的能量分布; 處理器(28; 28-1 ),重復(fù)所述能量分布,以獲得針對從所述第二揚(yáng)聲器設(shè)置(24; 24-1; 24-2;24-3)到所述第一揚(yáng)聲器設(shè)置(14;14-1)的下混頻的下混頻信息(36);以及 渲染器(38;38-1),用于使用所述下混頻信息(36)生成所述多個音頻聲道(12; 12-1; 12-2)〇2. 根據(jù)權(quán)利要求1所述的裝置,其中,所述處理器(28;28-1)被配置為基于所述能量分 布生成能量分布矩陣(D),所述能量分布矩陣(D)包括表示所述假想揚(yáng)聲器(22;22a-d)到所 述第二揚(yáng)聲器設(shè)置(24;24-1;24-2;24-3)中的另一揚(yáng)聲器的能量分布的元素(d xy)。3. 根據(jù)權(quán)利要求2所述的裝置,其中,所述處理器(28;28-1)還被配置為計(jì)算所述能量 分布矩陣(D)的冪(η),所述冪(η)是預(yù)定義值,且所述處理器(28;28-1)被配置為基于所述 能量分布矩陣(D)的所述冪獲得所述下混頻信息(36)。4. 根據(jù)權(quán)利要求2所述的裝置,其中,所述處理器(28;28-1)還被配置為對所述能量分 布矩陣(D)的冪(η)進(jìn)行迭代計(jì)算,迭代步驟的數(shù)目基于所述能量分布矩陣(D)的所述冪(η) 的值。5. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的裝置,其中,所述能量分布計(jì)算器(26;26-1)包 括:相鄰估計(jì)器,用于確定所述第二揚(yáng)聲器設(shè)置(24; 24-1; 24-2; 24-3)中的作為所述假想揚(yáng) 聲器(22; 22a-d)的相鄰揚(yáng)聲器的至少一個揚(yáng)聲器,以及所述能量分布計(jì)算器(26; 26-1)被 配置為計(jì)算所述假想揚(yáng)聲器(22;22a-d)到所述假想揚(yáng)聲器(22;22a-d)的所述至少一個相 鄰揚(yáng)聲器的能量分布。6. 根據(jù)權(quán)利要求5所述的裝置,其中,所述相鄰估計(jì)器被配置為確定作為所述假想揚(yáng)聲 器(22;22a-d)的相鄰揚(yáng)聲器的至少兩個揚(yáng)聲器,以及所述能量分布計(jì)算器(26;26-1)被配 置為計(jì)算能量分布,使得作為所述假想揚(yáng)聲器(22;22a-d)的相鄰揚(yáng)聲器的所述至少兩個揚(yáng) 聲器之間的能量分布在預(yù)定義的容限內(nèi)相等。7. 根據(jù)權(quán)利要求5或6所述的裝置,其中,所述相鄰估計(jì)器被配置為確定作為所述假想 揚(yáng)聲器(22;22a-d)的相鄰揚(yáng)聲器的至少兩個揚(yáng)聲器,以及作為所述假想揚(yáng)聲器(22;22a-d) 的相鄰揚(yáng)聲器的所述至少兩個揚(yáng)聲器中的至少一個揚(yáng)聲器是假想揚(yáng)聲器(22; 22a-d)。8. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的裝置,其中,所述第一揚(yáng)聲器設(shè)置(14; 14-1)中的 揚(yáng)聲器(16a-c)在預(yù)定義容限(46a;46b)內(nèi)被布置在幾何平面(44;54)中,以及所述幾何平 面(44)包括預(yù)定義的收聽者位置(42),且所述假想揚(yáng)聲器(22;22a-d)被布置在所述幾何平 面(44)的一側(cè)。9. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的裝置,其中,所述第一揚(yáng)聲器設(shè)置(14; 14-1)中的 揚(yáng)聲器被布置在所述幾何平面(44; 54)的第一側(cè),以及沿著與所述幾何平面(44; 54)的所述 第一側(cè)相向的所述幾何平面(44; 54)的第二側(cè)布置所述假想揚(yáng)聲器(22; 22a-d)。10. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的裝置,其中,所述裝置包括格式變換單元 (1720),其中,所述格式變換單元(1720)被配置為基于多個數(shù)據(jù)聲道(1205)輸出所述多個 音頻聲道(12; 12-1; 12-2),以及數(shù)據(jù)聲道(1205)的數(shù)目大于所述多個音頻聲道(12; 12-1; 12-2)的數(shù)目。11. 根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的裝置,其中,所述裝置包括平移器(56),所述平 移器(56)用于生成針對所述第二揚(yáng)聲器設(shè)置(24;24-1;24-2)的平移系數(shù),以及所述渲染器 (38;38-1)被配置為基于所述下混頻信息(36)和所述平移系數(shù)生成所述多個音頻聲道(12; 12-1;12-2)。12. 根據(jù)權(quán)利要求11所述的裝置,其中,所述裝置包括對象渲染器(1210),所述對象渲 染器(1210)被配置為基于聲學(xué)對象的位置信息輸出所述多個音頻聲道(12; 12-1; 12-2),以 及平移系數(shù)的數(shù)目大于所述多個音頻聲道(12; 12-1; 12-2)的數(shù)目。13. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的裝置,其中,所述假想揚(yáng)聲器確定器(18; 18-1) 被配置為基于所述第一揚(yáng)聲器設(shè)置(14; 14-1)的揚(yáng)聲器(16a-c)的位置計(jì)算凸包(52),并根 據(jù)QuickHull算法確定所述假想揚(yáng)聲器(22;22a-d)的位置,所述假想揚(yáng)聲器(22;22a-d)的 位置和所述第一揚(yáng)聲器設(shè)置(14; 14-1)中的揚(yáng)聲器(16a-c)的位置在預(yù)定義閾值內(nèi)被布置 在所述凸包(52)處。14. 根據(jù)權(quán)利要求13所述的裝置,其中,所述裝置被配置為提供所述第一揚(yáng)聲器設(shè)置 (14; 14-1)的有效性信息,所述有效性信息指示所述第一揚(yáng)聲器設(shè)置(14; 14-1)中的每個揚(yáng) 聲器(16a-c)的位置在預(yù)定義閾值內(nèi)被布置在所述凸包(52)處,或指示所述第一揚(yáng)聲器設(shè) 置(14;14-1)中的至少一個揚(yáng)聲器的位置在預(yù)定義閾值內(nèi)被布置在所述凸包(52)外。15. -種音頻系統(tǒng),包括: 根據(jù)權(quán)利要求1至14中的一項(xiàng)所述的裝置(10; 10-1; 10-2);以及 根據(jù)所述多個音頻聲道(12; 12-1; 12-2)的多個揚(yáng)聲器(16a-c); 其中,所述多個揚(yáng)聲器(16a-c)被配置為接收所述多個音頻聲道(12; 12-1; 12-2),并基 于所述多個音頻聲道(12;12-1;12-2)提供多個聲學(xué)信號。16. -種用于生成用于第一揚(yáng)聲器設(shè)置(14; 14-1)的多個音頻聲道(12; 12-1; 12-2)的 方法,包括: 確定未包含在所述第一揚(yáng)聲器設(shè)置(14; 14-1)中的假想揚(yáng)聲器(22;22a-d)的位置,并 獲得包含所述假想揚(yáng)聲器(22; 22a-d)的第二揚(yáng)聲器設(shè)置(24; 24-1; 24-2; 24-3); 計(jì)算從所述假想揚(yáng)聲器(22;22a-d)到所述第二揚(yáng)聲器設(shè)置(24;24-1;24-2;24-3)中的 其他揚(yáng)聲器的能量分布; 重復(fù)所述能量分布,并獲得針對從所述第二揚(yáng)聲器設(shè)置(24; 24-1; 24-2; 24-3)到所述 第一揚(yáng)聲器設(shè)置(14;14-1)的下混頻的下混頻信息(36);以及 使用所述下混頻信息(36)生成所述多個音頻聲道(12; 12-1; 12-2)。17. -種其上存儲有計(jì)算機(jī)程序的非瞬時性存儲介質(zhì),所述計(jì)算機(jī)程序具有程序代碼, 當(dāng)在計(jì)算機(jī)上運(yùn)行所述程序代碼時,所述程序代碼用于執(zhí)行根據(jù)權(quán)利要求16所述的用于生 成用于第一揚(yáng)聲器設(shè)置(14;14-1)的多個音頻聲道(12;12-1;12-2)的方法。
【文檔編號】H04S3/02GK105934955SQ201580003783
【公開日】2016年9月7日
【申請日】2015年1月5日
【發(fā)明人】克里斯汀·鮑斯, 克里斯汀·厄泰爾, 約翰內(nèi)斯·希爾珀特, 亞琴·昆茲, 邁克爾·費(fèi)希爾, 弗洛里安·舒, 伯恩哈德·格瑞
【申請人】弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會