相等。這些值示例性地涉及22.0設(shè)置 (NHK),即采用22個(gè)揚(yáng)聲器和4階H0A信號(L= 22,N= 4)。
[0033]
[0034] 表1H0A以及呈現(xiàn)的H0A響度級
[0035] 對呈現(xiàn)器的要求
[0036] 使用以下簡化:不失一般性地(即,它不是先決條件),假設(shè)無DC測試信號x(t)。 假設(shè)A是該信號的RMS值,而且Ea=A2是它的能量。測試信號是來自D= (0,巾)T方向 的單一源信號,其中0是仰角,巾是方位角。在最佳聽音區(qū),所謂的悅耳區(qū)應(yīng)用能量考慮。 [0037] 測試信號可以表示為基于聲道的信號、音頻對象(A0)或H0A信號。下表提供了這 些表示,其中b是抽象輸入矢量,呈現(xiàn)之后基于聲道的表示用矢量w表示,呈現(xiàn)之后的能量 是Ew,而且呈現(xiàn)之后能量(響度)相等的條件是EA=Ew。假設(shè)D是廣義呈現(xiàn)矩陣:
[0038] w=Db(2)
[0039] 在表2中,對定向測試信號(directivetestsignal)導(dǎo)出能量保存要求EA=Ew, 該定向測試信號被編碼為音頻對象(頂行)、H0A信號(中行)或基于聲道的表示(底行)。 矢量b是呈現(xiàn)之前的編碼輸入。矢量w是呈現(xiàn)之后的信號(在D/A之前的揚(yáng)聲器信號)。 Ew是呈現(xiàn)之后的能量。EA=A2是測試信號x(t)的能量,而且^是時(shí)間樣本索引。下面進(jìn) 一步地,對H0A情形示例性地導(dǎo)出Ew。
[0040]
[0041] 表2能量保存要求
[0042] 關(guān)于音頻對象(A0)呈現(xiàn),對音頻對象的考慮導(dǎo)致眾所周知的要求,即呈現(xiàn)權(quán)重cw 的平方的總和等于1 :
[0043]
[0044] 該要求還適用于疊加獨(dú)立的A0,但對于相關(guān)的A0則適用基于聲道的考慮。
[0045] 對呈現(xiàn)基于聲道的內(nèi)容的要求由下式給出:
[0046] 1 =cbTDTDcb (4)其中,矢量cb包含在內(nèi)容創(chuàng)建內(nèi)使用的調(diào)節(jié)權(quán)重,而且矩陣D是 廣義呈現(xiàn)矩陣(也稱為解碼矩陣)。
[0047] 兩種類型的內(nèi)容被示例性地考慮:
[0048] 1.原始內(nèi)容已經(jīng)使用調(diào)節(jié)獨(dú)立的A0而被混合,而且調(diào)節(jié)權(quán)重的平方的和等于1。 然后,呈現(xiàn)要求變成DTD= 1(大小為LbXLb的單位矩陣)。得到的對呈現(xiàn)矩陣的要求在下 面討論,而且根據(jù)本發(fā)明的解決方案可以用于這種類型的內(nèi)容。
[0049] 2.對于麥克風(fēng)錄音和混合的內(nèi)容,調(diào)節(jié)權(quán)重的性質(zhì)還未知,通常當(dāng)向不同的揚(yáng)聲 器設(shè)置混合時(shí),無法對所呈現(xiàn)信號的能量做出預(yù)測。因此,一般在向下混合(down-mixing) 或重新呈現(xiàn)之后預(yù)測響度是不可能的,本發(fā)明不適用。在此,只有不同的方法似乎是適用 的:分離有方向性和無方向性的部分以移除聲道之間的任何相關(guān)性,并且對有方向性的內(nèi) 容使用與對象有關(guān)的呈現(xiàn)方法。然后,以保存有方向性與無方向性的原始的能量比率的方 式來添加環(huán)境混合(ambientmix)。傳統(tǒng)方法已用于創(chuàng)建在混音室里生成新的藝術(shù)混合。
[0050] 對于能量保存H0A呈現(xiàn)器,H0A呈現(xiàn)要求是:
[0051] 1 =yTDTDy(5)
[0052] 在基于H0A的內(nèi)容內(nèi),任意信號被表示為平面波的疊加。平面波信號通過b= yx(ti)被編碼為H0A,其中y是包括方向D的球諧函數(shù)(SphericalHarmonics,SH)的編 碼矢量。矢量b和y包括(N+1)2個(gè)元素,其中N表示H0A階。由于SH的正交性質(zhì),矢量產(chǎn) 生yTy= (N+1)2(N3D歸一化的SH)。
[0053] 要求DTD= 1在[5]中討論,其中I是(N+1)2X(N+1)2的單位矩陣。構(gòu)建這樣的 "能量保存"解碼矩陣的過程是基于奇異值分解(SingularValueDecomposition,SVD)。在
[5]中,能量保存E
=1定義。
[0054] 導(dǎo)出滿足能量保存的要求的呈現(xiàn)矩陣Dn的步驟如下:
[0055] 1.導(dǎo)出能量保存呈現(xiàn)矩陣隊(duì)。這對于許多揚(yáng)聲器位置都是可能的,只要揚(yáng)聲器的 數(shù)量L大于或至少等于H0A系數(shù)(N+1)2的數(shù)量。
[0056] 2.使能量保存呈現(xiàn)矩陣不依賴于H0A階。由于06被構(gòu)建以使得| = 1,因此要求 導(dǎo)致通過以下因子縮放:
(6)
[0058] 對于實(shí)際的H0A呈現(xiàn)器的構(gòu)建,以下內(nèi)容適用。實(shí)際中,揚(yáng)聲器的位置通常不是最 優(yōu)的,而且L〈(N+1)2。因此,呈現(xiàn)矩陣設(shè)計(jì)僅能夠接近于理論。通常在揚(yáng)聲器密度低的區(qū)域 中偏差最大,而且如果增加H0A階,則偏差更大。示例在圖4中示出。一個(gè)好的呈現(xiàn)矩陣設(shè) 計(jì)的特征在于來自低揚(yáng)聲器密度區(qū)域的能量的衰減,即,從這些方向入射的聲音應(yīng)當(dāng)被感 知為不太大聲。
[0059] 圖4示出了能量保存呈現(xiàn)矩陣DroA的現(xiàn)實(shí)世界示例。在第一行中,存在對于不同 H0A階的各種揚(yáng)聲器設(shè)置,在最后一行中,存在各個(gè)方向的能量保存特征。使用等距方向采 樣球體的6724平面波被編碼為H0A,并向22或12聲道設(shè)置呈現(xiàn)。有方向性的能量保存以 灰度示出,并且不同設(shè)置以及它們的最小值和最大值如下:
[0060] 圖 4a)示出具有H0A 階N = 4 的 22_NHK_45 設(shè)置:[-0? 2dB;0?OdB]
[0061] 圖 4b)示出具有H0A 階N = 6 的 22_NHK_45 設(shè)置:[-1. 2dB;0?ldB]
[0062] 圖 4c)示出具有H0A 階N = 3 的 12_SwissAudec_110 設(shè)置:[-1.ldB ;0? 2dB]
[0063] 正如可以看到的,對于具有N= 4的22聲道設(shè)置,信號能量被相當(dāng)平均地分配,使 得僅0. 2dB的偏差出現(xiàn)。對于具有N= 6的22聲道設(shè)置和具有N= 3的12聲道設(shè)置,信 號能量仍然被相當(dāng)平均地分配,但已經(jīng)具有1. 3dB的偏差(甚至對于沒有揚(yáng)聲器可用的方 向)。信號能量的平均分配是能量保存呈現(xiàn)的優(yōu)點(diǎn)。
[0064]因?yàn)槟芰勘4鎯H僅在揚(yáng)聲器跨越圍繞聽音位置的完整凸面外殼時(shí)才是可能的,所 以呈現(xiàn)構(gòu)建的步驟變成:
[0065] 1.構(gòu)建近似能量保存呈現(xiàn)矩陣D。兩種適當(dāng)?shù)姆椒ㄔ赱5]、[6]中描述。能量保存 在正面區(qū)域中應(yīng)當(dāng)是精確的,并且在背面底部或側(cè)面區(qū)域中可以是不太精確的。
[0066]2.由于Cauchy-Schwarz不等式(見下面),呈現(xiàn)矩陣可以通過下式被歸一化: (7)[0067]
[0068] 該式代替式(6)以用于近似能量保存矩陣,而且式(6)可以看作是式(7)的特殊 情形。另一種選擇是使用從中心(〇。= (〇,〇) T)入射的單位能量的測試信號來歸一化呈現(xiàn) 矩陣:
[0069] ,、 (8)
[0070] 其中模式矢量y= 以及方向 的 球諧函數(shù)Ynm⑷。)。模式矢量7可以是包括方向Q。的球諧函數(shù)的H0A測試信號。
[0071] 參考H0A內(nèi)容已在實(shí)際研宄中被用于使用能量和響度測量來評價(jià)上述考慮。通 過使用Technicolor的聽音室的雙聲道室脈沖響應(yīng)(BinauralRoomImpulseResponses, BRIRs)以及來自中心揚(yáng)聲器聲道的-23LKFS測試信號的校準(zhǔn),對以下進(jìn)行響度測量:H0A零 階系數(shù)聲道(W聲道)、呈現(xiàn)之后的多聲道信號(對于多于5個(gè)聲道的設(shè)置,其具有聲道權(quán)重 1)以及多聲道信號的雙聲道向下混合。并行地,進(jìn)行能量測量。除了具有寂靜片段的項(xiàng)目, 能量測量(完整的文件)非常接近地與響度測量相匹配。對于LKFS測量,這些片段被忽略, 所以此處值更高。這證明了能量測量可以估計(jì)感知響度的假設(shè)。下面提供測量數(shù)據(jù)。數(shù)據(jù) 的某些評價(jià)在下面給出。它們通過非正式的聽音測試被證實(shí)。LKFS測量精度是+/-2dB。
[0072] 下面涉及在對不同的H0A階進(jìn)行呈現(xiàn)時(shí)的響度保存。圖5示出了在對22. 0揚(yáng)聲 器聲道設(shè)置的不同的H0A階進(jìn)行呈現(xiàn)時(shí)的響度保存。三個(gè)測試項(xiàng)目1\、T2、T3的雙聲道響 度測量以根據(jù)本發(fā)明的方式被呈現(xiàn)給呈現(xiàn)階N= 1. . 6的22. 0聲道設(shè)置。測試項(xiàng)目階是N =6,呈現(xiàn)器在為較低階呈現(xiàn)時(shí)忽略較高階成分。對于第一測試項(xiàng)目1^的測試是N= 1階 的tn、N= 2階的t12等,并且相應(yīng)地對于第二和第三測試項(xiàng)目TjPT3。正如可以看到的, 具有不同呈現(xiàn)階的部分信號(即,各個(gè)測試項(xiàng)目的成分)以基本上相同的響度被呈現(xiàn),不依 賴于它們的呈現(xiàn)階。
[0073] 下面涉及在對不同揚(yáng)聲器設(shè)置進(jìn)行呈現(xiàn)時(shí)的響度保存。圖6示出了在將具有N =4(S卩,第四階)的14個(gè)H0A測試項(xiàng)目LI\,…,LT14呈現(xiàn)給5個(gè)不同的揚(yáng)聲器設(shè)置時(shí)的 響度保存。在每一組的5列中,S卩,每個(gè)測試項(xiàng)目,列(從左到右)與所選擇的揚(yáng)聲器設(shè)置 22.0(CfP)、12.0(Auro3D)、9.0(Auro3D)、5.0(ITU)、2.0(+/-30。)相對應(yīng)。正如可以看到 的,每一組5列中的差異非常小。換言之,指定的信號以基本上相同的響度被呈現(xiàn),不依賴 于揚(yáng)聲器設(shè)置和揚(yáng)聲器數(shù)量。因?yàn)槔碚撋夏芰勘4骐S著揚(yáng)聲器的減少(特別是2D設(shè)置) 而惡化,所以根據(jù)式(7)的呈現(xiàn)矩陣的歸一化導(dǎo)致實(shí)際可用改善的呈現(xiàn)器。
[0074] 下面涉及在呈現(xiàn)之