使用奇異值分解進(jìn)行高階高保真立體聲編碼和解碼的方法和裝置的制造方法
【專利摘要】使用奇異值分解來對HOA信號進(jìn)行編碼和解碼包括:基于聲源方向值和高保真立體聲階次,形成(11)對應(yīng)的球諧右矢量(|Y(Ωs)>)和編碼器模式矩陣(ΞOxS)。根據(jù)音頻輸入信號(|x(Ωs)>),確定奇異閾值(σε)。對編碼器模式矩陣執(zhí)行奇異值分解(13),以便得到與所述閾值比較的相關(guān)奇異值,導(dǎo)致最終的編碼器模式矩陣秩基于揚聲器的方向值(Ωl)和解碼器高保真立體聲階次(Nl),形成(18)對應(yīng)的右矢量(|Y(Ωl)>)以及解碼器模式矩陣(ΨOxL)。對解碼器模式矩陣執(zhí)行奇異值分解(19),以提供最終的解碼器模式矩陣秩根據(jù)最終的編碼器模式矩陣秩和最終的解碼器模式矩陣秩,確定最終的模式矩陣秩(rfin),并且根據(jù)最終的模式矩陣秩以及編碼器側(cè)的奇異值分解,計算編碼器模式矩陣(ΞOxS)的伴隨偽逆和高保真立體聲右矢量(|a′s>)。根據(jù)所述最終的模式矩陣秩(rfin)減少(16)高保真立體聲右矢量(|a′s>)的分量的數(shù)量,以便提供改動的高保真立體聲右矢量(|a′l>)。根據(jù)改動的高保真右矢量、解碼器側(cè)的奇異值分解的輸出值和所述最終的模式矩陣秩計算(15)伴隨解碼器模式矩陣(Ψ+),得到所有揚聲器的輸出信號的右矢量(|y(Ωl)>)。
【專利說明】
使用奇異值分解進(jìn)行高階高保真立體聲編碼和解碼的方法和 裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及用于使用奇異值分解進(jìn)行高階高保真立體聲(Ambisonics)編碼和解 碼的方法和裝置。
【背景技術(shù)】
[0002] 高階高保真立體聲巧igher化der Ambisonics,H0A)表示S維聲音。其他技術(shù)是 波場合成(WFS)或基于聲道的方法(比如,22.2)。然而,與基于聲道的方法相反,冊A表示提 供獨立于特定揚聲器設(shè)置的優(yōu)點。但是,運種靈活性是WHOA表示在特定揚聲器設(shè)置上的回 放所需的解碼處理為代價的。與所需揚聲器的數(shù)量通常非常大的方法相比,HOA也可W 被擅染到僅由幾個揚聲器組成的設(shè)置。HOA的其他優(yōu)點是,同一表示也可W無任何修改地用 于對耳機(jī)的雙耳擅染。
[0003] 冊A基于復(fù)諧波平面波振幅的空間密度的通過截斷球諧(SH)擴(kuò)展的表示。每個擴(kuò) 展系數(shù)是角頻率的函數(shù),其可W等效地由時域函數(shù)表示。因此,不失一般性地,整個HOA聲場 表示實際上可被假定為由0個時域函數(shù)組成,其中0表示擴(kuò)展系數(shù)的數(shù)量。運些時域函數(shù)在 下面將被等效地稱為HOA系數(shù)序列或冊A聲道。冊A表示可W被表達(dá)為包含HOA系數(shù)的HOA數(shù) 據(jù)帖的時間序列。HOA表示的空間分辨率隨著擴(kuò)展的最大階次N增長而提高。對于3D情況,擴(kuò) 展系數(shù)的數(shù)量0隨著階次N呈二次方地增長,特別地為0=(化I)2。
[0004] 復(fù)矢量空間
[0005] 高保真立體聲必須處理復(fù)函數(shù)。因此引入了基于復(fù)矢量空間的符號。該符號隨抽 象的復(fù)矢量操作,所述復(fù)矢量不表示從=維"xyz"坐標(biāo)系知道的真實的幾何矢量。相反,每 個復(fù)矢量描述物理系統(tǒng)的可能的狀態(tài),并且在d維空間中由具有d個分量Xi的列矢量形成, 并且根據(jù)Dirac,運些面向列的矢量被稱為右矢量化et vector),被表示為I X〉。在d維空間 中,任意的I X〉由其分量Xi和d個正交基矢量I ei>形成:
[0006]
")
[0007] 運里,d維空間不是通常的"xyz" 3D空間。
[000引右矢量的共輛復(fù)數(shù)被稱為左矢量(bra vector) I x〉* = <x I。左矢量表示基于行的 描述,并且形成原始右矢量空間的對偶空間一一左矢量空間。
[0009] 該Dirac符號將被用在對高保真立體聲相關(guān)音頻系統(tǒng)的W下描述中。
[0010] 內(nèi)積可W根據(jù)同一維度的左矢量和右矢量來構(gòu)建,得到復(fù)數(shù)標(biāo)量值。如果隨機(jī)矢 量|x>由其在正交矢量基中的分量描述,則對于特定基的特定分量,即,|x>到I ei>上的投 影,由內(nèi)積給出:
[0011] Xi = <X I I Gi> = <x I Gi> (2)
[0012] 在左矢量和右矢量之間,僅考慮一個條、而非兩個條。
[001引對于同一基中的不同矢量I X〉和I y〉,內(nèi)積通過將左矢量<x I乘W右矢量I y>而得 到,使得:
[0014]
(3)
[0015] 如果維度mxl的右矢量和維度Ixn的左矢量被乘W外積,則具有m行n列的矩陣A被 導(dǎo)出:
[0016] A=Ix^yI (4)
[0017] 高保真立體聲矩陣
[0018] 基于高保真立體聲的描述考慮了用于將整個聲場映射到時變矩陣中所需的相關(guān) 性(dependency)。在高階高保真立體聲化OA)編碼或解碼矩陣中,行(列)的數(shù)量與從聲源或 聲宿(sound sink)起的特定方向相關(guān)。在編碼器側(cè),變化數(shù)量的S個聲源被考慮,其中,S = 1,…,S。每個聲源S可W具有離原點的個體距離。、個體方向Q s=(0s,Os),其中,0S描述 從Z軸開始的傾斜角,Os描述從X軸開始的方位角。對應(yīng)的時間相關(guān)信號Xs=(t)具有個體時 間行為。
[0019] 為蘆K心慮方向部分(徑向相關(guān)性將由貝塞爾函數(shù)描述)。那么,特定方向 Q S用列矢量 苗述,其中,n表示高保真立體聲度,m是高保真立體聲階次N的索 引。對應(yīng)的值分別按m= 1,…財Pn = -m,…,0,? ? 'm取值。
[0020] 一般來說,特定HOA描述根據(jù)N來對2D或3D情況下的每個右矢量I 從y)限制 分量的敬量0:
[0021] ㈱
[0022] 對于多于一個的聲源,如果階次n的S個個體矢量悄n(化))被組合,則所有方向都 被包括。運導(dǎo)致包含0 X S個模式分量的模式矩陣曰,即,曰的每個列表示特定方向:
[0023] ㈱
[0024] 所有信號值都被組合在信號矢量Ix化T)〉中,但是被W共同的采樣速率^采樣,信 號矢量Ix化T)〉考慮每個源信號Xs化T)的時間相關(guān)性:
[0025] (7)
[00%]在下文中,為簡單起見,在比如I X化T)〉的時變信號中,采樣編號k不再被描述,即, 它將被忽視。那么,如方程(8)中所示,I X〉被乘W模式矩陣S。運確保所有信號分量都與對應(yīng) 的同一方向QS的列線性地組合,根據(jù)方程(5)得到具有O個高保真立體聲模式分量或系數(shù) 的右矢量I as〉:
[0027] as> = S|x> (8)
[00%]解碼器具有再現(xiàn)由專用數(shù)量的I個揚聲器信號I y>所表示的聲場I ai>的任務(wù)。因 此,揚聲器模式矩陣W由基于球諧的單位矢量陽。'褲{八的L個單獨的列組成(類似于方程 (6 )),即,每個揚聲器方向一個右矢量:
[0029] Qi: |ai>=W |y> (9)
[0030] 對于其中模式的數(shù)量等于揚聲器的數(shù)量的二次矩陣,I y>可W由模式矩陣W的逆 矩陣確定。在其中行和列的數(shù)量可W不同的任意矩陣的一般情況下,揚聲器信號I y>可W由 偽逆確定,參見M.A.F*oletti,"A S地erical 化rmonic A卵roach to 3D Surround Sound Systems" ,Acusti州m論壇,布達(dá)佩斯,2005。那么,利用W的偽逆W + :
[0031] y> = W+|ai> (10)
[0032] 假定在編碼器側(cè)和解碼器側(cè)描述的聲場幾乎是相同的,即,|as〉> |ai〉。然而,揚聲 器位置可W不同于源位置,即,對于有限的高保真立體聲階次,由I X〉描述的實值源信號和 由I y>描述的揚聲器信號是不同的。因此,將映射I X〉在I y>上的平移矩陣G可W被使用。那 么,根據(jù)方程(8)和(10 ),編碼器和解碼器的串運算是:
[0033] y>=GW+H|x> (11)
[0034] 線性泛函
[0035] 為了保持W下方程更簡單,平移矩陣直到"
【發(fā)明內(nèi)容】
"章節(jié)都將被忽視。如果所需 的基矢量的數(shù)量變?yōu)闊o限,則基矢量可W從離散基變?yōu)檫B續(xù)基。因此,函數(shù)f可W被解釋為 具有無限數(shù)量的模式分量的矢量。運從數(shù)學(xué)意義上來講被稱為"泛函",因為它W確定性的 方式執(zhí)行從右矢量到特定的輸出右矢量的映射。它可W用函數(shù)f和右矢量I X〉之間的內(nèi)積表 示,得到一般的復(fù)敬C:
[0036] (12)
[0037] 如果泛函保持右矢量的線性組合,則f被稱為"線性泛函"。
[0038] 只要對化rmitean運算符存在約束,就應(yīng)考慮W下特性。Hermitean運算符總是具 有:
[0039] ?實的特征值;
[0040] ?對于不同特征值的完備的正交特征函數(shù)集。
[004。 因此,每個函數(shù)可W從運些特征函數(shù)建立,參見H.Vogel、C.Gerthsen、 H.O.Kneser, "Physik" ,Springer Verlag, 1982.任意函數(shù)可W被表示為球諧.巧資) 與復(fù)數(shù)常數(shù)Cf的線性組合:
[0042] 閨 U4)
[0044] 索引n、m被W確定性的方式使用。它們被一維索引j取代,索引n'、m'被相同大小的 索引i替代。由于每個子空間正交于具有不同i、j的子空間的事實,它們可被描述為無限維 的空間中的線性獨立的正交單位矢量:
[0045] (15)
[0046]
[0047] (16)
[004引 子空間(索引i) 的映射
[0049]
[0050] -個本質(zhì)的方面是,如果存在從連續(xù)描述到左矢量/右矢量符號的變化,則積分解 (integral solution)可W被球諧的左矢量描述和右矢量描述之間的內(nèi)積的和替代。一般 來說,與連續(xù)基的內(nèi)積可W被用于將基于右矢量的波描述I X〉的離散表示映射到連續(xù)表示。 例如,x(ra)是位置基(即,半徑)中的右矢量表示:
[0051] ra:x(ra) =<ra | x> (18)
[0052] 針對不同種類的模式矩陣W和曰,奇異值分解被用于處理任意種類的矩陣。
[0053] 奇異值分解
[0054]奇異值分解(SVD,參見G.H.GolubXh.F.van Loan, "Matrix Computations",約翰 霍普金斯大學(xué)出版社,第3版,1996年10月11日)使得能夠?qū)⒕哂衜行和n列的任意矩陣A分解 為S個矩陣U、X和Ft,參見方程(19)。在原始形式中,矩陣U和F"*'分別是維度mXm和nXn 的酉矩陣(unitary ma化ix)。運樣的矩陣是正交的,并且分別是從表示復(fù)單位矢量I山〉和 二《町:i的正交的列構(gòu)建的。來自復(fù)數(shù)空間的酉矩陣與實空間中的正交矩陣是等效 的,即,它們的列表示正交矢量基:
[00 巧]
(19)
[0056]矩陣U和V包含用于所有四個子空間的正交基。
[0化7] ? U的頭r個列:A的列空間
[0化引 ? U的后m-r個列:_4十的零空間
[0化9] ? V的頭r個列:A的行空間
[0060] -V的后n-r個列:A的零空間
[0061] 矩陣E包含可W被用于表征A的行為的所有奇異值。一般來說,E是具有多達(dá)r個 對角元素Oi的mXn矩形對角矩陣,其中,秩r給出A的線性獨立的列和行的數(shù)量(r《(min(m, n))。它包含降序的奇異值,即,在方程(20)和(21)中,Oi具有最高值,Or具有最低值。
[0062] 在緊湊形式中,只有r個奇異值(即,U的r個列和rt的r個行)是重構(gòu)矩陣A必需的。
[0063] 矩陣U、E和ri的維度不同于原始形式。然而,E矩陣總是得到二次形式。那么,對于m〉n = r,
(2斯
[0064]
[00 化] (21)
[0066] 因此,可W通過低秩逼近來非常高效地實現(xiàn)SVD,參見W上提及的Golub/van Loan 教科書。運種逼近精確地描述了原始矩陣,但是包含多達(dá)r個秩-I矩陣。就Dirac符號而言,
矩陣I、I山 八=1 Ar工口 ± -
[0067] (22)
[0068] 當(dāng)查看方程(Il)中的編碼器解碼器鏈時,不僅存在用于編碼器的模式矩陣(比如, 矩陣巧,而且模式矩陣(比如,矩陣W )的逆矩陣或另一個復(fù)雜的解碼器矩陣也要被考慮。對 于一般的矩陣A,可W通過執(zhí)行方形矩陣E的逆W及U和Ft的共輛復(fù)數(shù)轉(zhuǎn)置來直接從SVD檢 查A的偽逆A+,其結(jié)果是:
[0069;
(23)
[0070]對于方程(22)的基于矢量的描述,偽逆A+通過執(zhí)行I化〉和<乂11的共輛轉(zhuǎn)置而得到, 而奇異估0;化須獻(xiàn)求橄?;?zé)結(jié)單浩卸的偽逆看上去如下; W71]
口 4)[0072] 如果不同矩陣的基于SVD的分解與基于矢量的描述組合(參見方程(8)和(10)),則 對于編碼處理得到:
[0073] (瑚
[0074] 對于解碼器,當(dāng)考慮偽逆矩陣W +(方程(24))時:
[0075]
(26)
[0076] 如果假定來自編碼器的高保真立體聲聲場描述I as〉與用于解碼器的I ai>幾乎相 同,并且維度rs = ri = r,則對于輸入信號|x>和輸出信號|y〉,組合的方程看上去如下:
[0077] (27)
【發(fā)明內(nèi)容】
[0078] 然而,編碼器解碼器鏈的運個組合的描述具有如下所述的一些特定問題。
[0079] 對高保真立體聲矩陣的影響
[0080] 高階高保真立體聲化OA)模式矩陣S和W受到聲源或揚聲器的位置(參見方程(6)) 和它們的高保真立體聲階次的直接影響。如果幾何結(jié)構(gòu)是規(guī)則的,即,源或揚聲器位置之間 的相互角距離幾乎相等,則方程(27)可W被求解。
[0081 ] 但是在實際的應(yīng)用中,通常不是如此。因此,執(zhí)行曰和W的SVD并且調(diào)查它們在對應(yīng) 的矩陣E中的奇異值是有道理的,因為它反映了S和W的數(shù)值行為。E是具有實奇異值的正 定矩陣。但是盡管如此,即使存在多達(dá)r個奇異值,運些值之間的數(shù)值關(guān)系對于聲場的再現(xiàn) 也是非常重要的,因為在解碼器側(cè)必須構(gòu)建矩陣的逆或偽逆。用于測量該行為的合適的量 是A的條件數(shù)(condition number)。條件數(shù)K(A)被定義為最小奇異值與最大奇異值之比: W 劇
(28)
[0083] 逆問題
[0084] 病態(tài)矩陣是有問題的,因為它們具有大的k(A)。在求逆或求偽逆的情況下,病態(tài)矩 陣導(dǎo)致很小的奇異值Oi變得非常占主導(dǎo)的問題。在P.畑.Hansen, "Rank-Deficient and Discrete Ill-Posed Problems !Numerical Aspects of Linear Inversion'',工業(yè)和應(yīng)用 數(shù)學(xué)學(xué)會(SIAM),1998中,兩種基本類型的問題通過描述奇異值如何衰減而被區(qū)分(第I. I 章第2-3頁)。
[0085] ?秩虧問題,在該秩虧問題中,矩陣在大奇異值和小奇異值的聚類之間具有差距 (非逐漸衰減);
[0086] ?離散不適定問題,在該離散不適定問題中,平均地,矩陣的所有奇異值都逐漸衰 減到零,即,在奇異值譜中沒有差距。
[0087] 關(guān)于編碼器側(cè)的麥克風(fēng)的幾何結(jié)構(gòu)W及解碼器側(cè)的揚聲器幾何結(jié)構(gòu),主要發(fā)生第 一個秩虧問題。然而,在記錄期間修改一些麥克風(fēng)的位置比控制客戶端的所有可能的揚聲 器位置更簡單。尤其是在解碼器側(cè),模式矩陣的逆或偽逆將被執(zhí)行,運對于較高的模式分量 導(dǎo)致數(shù)值問題和過分強(qiáng)調(diào)的值(參見W上提及的化nsen的書)。
[0088] 信號有關(guān)的相關(guān)性
[0089] 減少上述求逆問題可W例如通過降低模式矩陣的秩,即,通過避免最小奇異值來 實現(xiàn)。但是然后,闊值將被用于最小的可能的值Or(參見方程(20)和(21))。在W上提及的 化nsen的書中描述了用于運種最低奇異值的最佳值。Hansen提出了
其取決于 輸入信號的特性(運里用I X〉描述)。從方程(27)可W看出,該信號對再現(xiàn)具有影響,但是信 號相關(guān)性在解碼器中不能被控制。
[0090] 非正交基的問題
[0091] 根據(jù)方程(25)和(26),在不同基的每個系統(tǒng)中描述了在HOA編碼和HOA解碼器之間 傳輸?shù)臓顟B(tài)矢量las〉。然而,如果正交基被使用,則狀態(tài)不改變。那么,模式分量可W從一個 基投影到另一個基。所W,原則上,每個揚聲器設(shè)置或聲音描述應(yīng)構(gòu)建在正交基系統(tǒng)上,因 為運允許運些基之間的矢量表示的改變,例如,在高保真立體聲中,從3D空間投影到2D子空 間中。
[0092] 然而,經(jīng)常存在具有病態(tài)矩陣的設(shè)置,在病態(tài)矩陣中,基矢量是近似線性相關(guān)的。 所W,原則上,非正交基將被處理。運使得當(dāng)HOA聲場描述應(yīng)被采用到不同的揚聲器設(shè)置上 時或者當(dāng)期望在編碼器側(cè)或解碼器側(cè)處理不同的HOA階次和維度時必要的從一個子空間到 另一個子空間的改變復(fù)雜化。
[0093] 投影到稀疏揚聲器集上的典型問題是,聲音能量在揚聲器附近高,并且在運些揚 聲器之間的距離很時低。所W,不同揚聲器之間的位置需要相應(yīng)地對能量進(jìn)行平衡的平移 函數(shù)。
[0094] 上述問題可W通過本發(fā)明的處理來繞開,并且通過權(quán)利要求1中公開的方法來解 決。利用該方法的設(shè)備在權(quán)利要求2中被公開。
[00%]根據(jù)本發(fā)明,考慮到最低的模式矩陣秩W及截斷的奇異值分解,用于編碼過程的 互逆基(reciprocal basis)與用于解碼過程的原始基被組合使用。因為雙正交系統(tǒng)被表 示,所W確保編碼器矩陣和解碼器矩陣的乘積保持至少用于最低的模式矩陣秩的單位矩 陣。
[0096] 運通過將基于右矢量的描述變?yōu)榛趯ε伎臻g(具有互逆基矢量的左矢量空間) 的表示來實現(xiàn),在對偶空間中,每一個矢量是右矢量的伴隨(adjoint)。它通過使用模式矩 陣的偽逆的伴隨來實現(xiàn)。"伴隨"意指復(fù)數(shù)共輛轉(zhuǎn)置。
[0097] 因此,偽逆的伴隨已經(jīng)被用于編碼器側(cè)W及伴隨解碼器矩陣。對于所述處理,正交 互逆基矢量被使用,W便關(guān)于基變化而不變。此外,運種類型的處理允許考慮與輸入信號相 關(guān)的影響,對于正則化過程中的Oi導(dǎo)致降噪最佳闊值。
[0098] 原則上,本發(fā)明的方法適合于使用奇異值分解的高階高保真立體聲編碼和解碼, 所述方法包括W下步驟:
[0099] -接收音頻輸入信號;
[0100] -基于聲源的方向值和所述音頻輸入信號的高保真立體聲階次,形成對應(yīng)的球諧 右矢量和對應(yīng)的編碼器模式矩陣;
[0101] -對所述編碼器模式矩陣執(zhí)行奇異值分解,其中,兩個對應(yīng)的編碼器酉矩陣、對應(yīng) 的包含奇異值的編碼器對角矩陣W及相關(guān)的編碼器模式矩陣秩被輸出;
[0102] -從所述音頻輸入信號、所述奇異值和所述編碼器模式矩陣秩確定闊值;
[0103] -將所述奇異值中的至少一個與所述闊值進(jìn)行比較,并且確定對應(yīng)的最終的編碼 器模式矩陣秩;
[0104] -基于揚聲器的方向值和解碼器高保真立體聲階次,形成對應(yīng)的用于位于與所述 方向值對應(yīng)的方向上的特定揚聲器的球諧右矢量W及對應(yīng)的解碼器模式矩陣;
[0105] -對所述解碼器模式矩陣執(zhí)行奇異值分解,其中,兩個對應(yīng)的解碼器酉矩陣W及對 應(yīng)的包含奇異值的解碼器對角矩陣被輸出,并且所述解碼器模式矩陣的對應(yīng)的最終的秩被 確定;
[0106] -從所述最終的編碼器模式矩陣秩和所述最終的解碼器模式矩陣秩確定最終的模 式矩陣秩;
[0107] -從所述編碼器酉矩陣、所述編碼器對角矩陣和所述最終的模式矩陣秩計算所述 編碼器模式矩陣的伴隨偽逆,得到高保真立體聲右矢量,
[0108] 并且根據(jù)所述最終的模式矩陣秩減少所述高保真立體聲右矢量的分量的數(shù)量,W 便提供改動的高保真立體聲右矢量;
[0109] -從所述改動的高保真右矢量、所述解碼器酉矩陣、所述解碼器對角矩陣和所述最 終的模式矩陣秩計算伴隨解碼器模式矩陣,得到所有揚聲器的輸出信號的右矢量。
[0110] 原則上,本發(fā)明設(shè)備適于使用奇異值分解的高階高保真立體聲編碼和解碼,所述 設(shè)備包括適于執(zhí)行W下操作的部件:
[0111] -接收音頻輸入信號;
[0112] -基于聲源的方向值和所述音頻輸入信號的高保真立體聲階次,形成對應(yīng)的球諧 右矢量和對應(yīng)的編碼器模式矩陣;
[0113] -對所述編碼器模式矩陣執(zhí)行奇異值分解,其中,兩個對應(yīng)的編碼器酉矩陣、對應(yīng) 的包含奇異值的編碼器對角矩陣W及相關(guān)的編碼器模式矩陣秩被輸出;
[0114] -從所述音頻輸入信號、所述奇異值和所述編碼器模式矩陣秩確定闊值;
[0115] -將所述奇異值中的至少一個與所述闊值進(jìn)行比較,并且確定對應(yīng)的最終的編碼 器模式矩陣秩;
[0116] -基于揚聲器的方向值和解碼器高保真立體聲階次,形成對應(yīng)的用于位于與所述 方向值對應(yīng)的方向上的特定揚聲器的球諧右矢量W及對應(yīng)的解碼器模式矩陣;
[0117] -對所述解碼器模式矩陣執(zhí)行奇異值分解,其中,兩個對應(yīng)的解碼器酉矩陣W及對 應(yīng)的包含奇異值的解碼器對角矩陣被輸出,并且所述解碼器模式矩陣的對應(yīng)的最終的秩被 確定;
[0118] -從所述最終的編碼器模式矩陣秩和所述最終的解碼器模式矩陣秩確定最終的模 式矩陣秩;
[0119] -從所述編碼器酉矩陣、所述編碼器對角矩陣和所述最終的模式矩陣秩計算所述 編碼器模式矩陣的伴隨偽逆,得到高保真立體聲右矢量,
[0120] 并且根據(jù)所述最終的模式矩陣秩減少所述高保真立體聲右矢量的分量的數(shù)量,W 便提供改動的高保真立體聲右矢量;
[0121] -從所述改動的高保真右矢量、所述解碼器酉矩陣、所述解碼器對角矩陣和所述最 終的模式矩陣秩計算伴隨解碼器模式矩陣,得到所有揚聲器的輸出信號的右矢量。
[0122] 本發(fā)明的有利的附加的實施例在各個從屬權(quán)利要求中被公開。
【附圖說明】
[0123] 參照附圖描述本發(fā)明的示例性實施例,在附圖中示出了:
[0124] 圖1基于SVD的HOA編碼器和解碼器的框圖;
[0125] 圖2包括線性泛函平移的HOA編碼器和解碼器的框圖;
[01%]圖3包括矩陣平移的HOA編碼器和解碼器的框圖;
[0127]圖4用于確定闊值Oe的流程圖;
[012引圖5在降低的模式矩陣秩'吁心。的情況下對奇異值的重新計算W及ks〉的計算;
[0129] 圖6在有平移或沒有平移時,在降低的模式矩陣秩所n。和巧的情況下對奇異值 的重新計算W及|y(Qi)>的計算。
【具體實施方式】
[0130] 圖1中描繪了關(guān)于本發(fā)明的基于SVD的HOA處理的、具有編碼器部分和解碼器部分 的框圖。兩個部分都在使用SVD,W便產(chǎn)生互逆基矢量。相對于已知的模式匹配解有所改變, 例如,與方程(27)相關(guān)的改變。
[0131] HOA編碼器
[0132] 為了用互逆基矢量工作,基于右矢量的描述被變到左矢量空間,在左矢量空間中, 每個矢量是右矢量的化rmitean共輛或伴隨。它通過使用模式矩陣的偽逆來實現(xiàn)。然后,根 據(jù)方程(8),基于(對偶)左矢量的高保真立體聲矢量也可W重新用(對偶)模式矩陣表示:
[0133] 司:<as| =<x|^i = <x|S+ (29)
[0134] 所得到的編碼器側(cè)的高保真立體聲矢量<as I現(xiàn)在為左矢量語義。然而,統(tǒng)一的描 述是期望的,即,返回到右矢量語義。代替曰的偽逆,使用Sd*'或這一的化rmitean共輛:
[013 引 (30)
[0136]
[0137] m
[0138] 其中,所有奇異值都是實數(shù),并且取i的復(fù)數(shù)共輛可W被忽視。
[0139] 巧骨敵高保直而化聲A量的U下描述:
[0140] (32)
[0141] 用于源端的基于矢量的描述掲示了 las〉取決于逆a*。如果對于編碼器側(cè)運樣做, 則它將變到解碼器側(cè)的對應(yīng)的對偶基矢量。
[0142] HOA解碼器
[0145]旨P,揚聲器信號為:
[0143] #瓶屈毀爲(wèi)加其平偽逆的情況下,為了導(dǎo)出揚聲器信號I y>得到: W 443 巧巧
[0146] (34)
[0147]
[醒] (35)
[0149] 因此,不是構(gòu)建偽逆,而是在方程(35)中只保留伴隨運算(用表示)。運意味著 在解碼器中需要更少的算術(shù)運算,因為只需要切換虛部的符號,并且轉(zhuǎn)置僅僅是修正的存 儲器訪問:
[0150] (36)
[0151] 如果假定編碼器和解碼器的高保真立體聲表示是幾乎相同的,即,las〉= |曰1〉,貝。 通過方程(32 ),整個編碼器解碼器鏈得到W下相關(guān)性:
[0152] (37)
[0153] (38)
[0154] 在真實的情景下,來自方程(11)的平移矩陣G和有限的高保真立體聲階次要被考 慮。后者導(dǎo)致被用于描述聲場的基矢量的有限數(shù)量的線性組合。此外,基矢量的線性獨立性 受到附加的誤差源(比如數(shù)值舍入誤差或測量誤差)的影響。從實踐角度來看,運可W通過 數(shù)值秩來繞開(參見W上提及的化nsen的書的第3.1章),運確保所有的基矢量在某些容限 內(nèi)都是線性獨立的。
[0155] 為了對噪聲更魯棒,考慮輸入信號的SNR,其中輸入信號的SNR影響編碼器右矢量 W及所計算的輸入的高保真立體聲表示。所W,如果必要的話,即,對于將被求逆的病態(tài)模 式矩陣,根據(jù)編碼器中的輸入信號的SNR來對Oi值進(jìn)行正則化。
[0156] 編碼器中的正則化
[0157] 正則化可W通過不同的方式來執(zhí)行,例如,通過使用經(jīng)由截斷的SVD的闊值。SVD提 供降序的〇1,其中,具有最低水平或最高索引的〇1(被表示為Or)包含非常頻繁地切換的并且 導(dǎo)致噪聲效應(yīng)和SNR的分量(參看方程(20)和(21) W及W上提及的化nsen教科書)。因此,截 斷SVD(TSVD)將所有的Oi值與闊值進(jìn)行比較,并且忽視超出闊值Oe的噪聲分量。闊值Oe可W 是固定的或者可W根據(jù)輸入信號的SNR被最佳地修正。
[0158] 矩陣的跡(trace)是指所有對角矩陣元素的和。
[0159] TSVD方框(圖1至3中的10、20、30)具有W下任務(wù):
[0160] ?計算模式矩陣秩。
[0161] ?移除低于闊值的噪聲分量,并且設(shè)置最終的模式矩陣秩rfin。
[0162] 所述處理對復(fù)矩陣S和W進(jìn)行處理。然而,為了對實數(shù)值Oi進(jìn)行正則化,運些矩陣 不能被直接使用。適當(dāng)?shù)闹祦碜栽慌c其伴隨E+之間的乘積。所得到的矩陣是具有實數(shù)對角 本征值的二次矩陣,所述實數(shù)對角本征值等同于適當(dāng)?shù)钠娈愔档亩沃?。如果可W用矩陣 S2的跡(如下面的表達(dá)式39所示)描述的所有本征值之和保持固定,則系統(tǒng)的物理性質(zhì)守 恒。運也巧巧干巧降W。
[0163]
(39)
[0164] 因此,編碼器側(cè)的方框ONBs (圖1-3中的15、25、35)或解碼器側(cè)的方框ONBi (圖1-3中 的19、29、39)修改奇異值,W使得正則化之前和之后的trace(X2)守恒(參見圖5和圖6):
[0165] ?修正其余的〇1(對于i = 1... mn),W使得原始矩陣和目標(biāo)截斷矩陣S t的跡保持
固定(
[0166 I A 曰;
[0167 (40)
[0168]如果正常數(shù)量的奇異值和減少數(shù)量的奇異值之間的對直被調(diào)用
則所得到的值如下:
[01691
(41)
[0170] ?對截斷的矩陣Xt重新計算所有的新的奇異值〇i,t:
[0171] 〇i't = 〇i+A。 (42)
[0172] 另外,如果用于適當(dāng)?shù)膢a>的基(參見方程(30)或(33))被改變?yōu)閷?yīng)的SVD相關(guān)的
i }基,則可W實現(xiàn)編碼器和解碼器的簡化,導(dǎo)致:
[0173] (側(cè):
[0174] (備注:如果Oi和I a〉在沒有附加的編碼器或解碼器索引的情況下被使用,則它們 是指編碼器側(cè)和/或解碼器側(cè))。該基是正交的,W使得它保持I a〉的范數(shù)。即,代替I a〉,正則 化可W使用I a/〉,I a/〉需要矩陣I a/〉和V,但是不需要更大的矩陣U。
[0175] 在{從十}基中使用縮小的右矢量Ia'>,運具有秩真正被降低的優(yōu)點。
[0176] 因此,在本發(fā)明中,SVD在兩側(cè)都被使用,不僅用于執(zhí)行單個矩陣S和W的正交基和 奇異值,而且還用于得到它們的秩rfin。
[0177] 分量改動
[0178] 通過考慮S的源秩或者通過相對于闊值或最終的源秩忽視對應(yīng)的Os中的一些,可 W減少分量的數(shù)量,并且可W提供更魯棒的編碼矩陣。因此,根據(jù)解碼器側(cè)的分量的對應(yīng)數(shù) 量對所傳輸?shù)母弑U媪Ⅲw聲分量的數(shù)量的改動被執(zhí)行。通常,它取決于高保真立體聲階次 0。運里,從用于編碼器矩陣曰的SVD方框得到的最終的模式矩陣秩化Ke和從用于解碼器矩陣 W的SVD方框得到的最終的模式矩陣秩吁要被考慮。在改動#壓縮步驟/級16中,如下改 動分量的數(shù)量:
[01巧]
.不改變一不壓縮;
[0180] 玉縮,忽視解碼器矩陣聲十中的巧化e -吁泌d個列=〉編碼器和 解碼器^
[0181] ^在傳輸之前取消高保真立體聲狀態(tài)矢量自^
的分 量,即,壓縮。忽視編碼器矩陣曰中的- y'/iRd個行=〉編碼器和解碼器操作減少。
[01劇結(jié)果是,將在編碼器側(cè)和解碼器側(cè)使用的最終的模式矩陣秩rfin是巧的郝晰Ie中 的較小的一個。
[0183] 因此,如果在編碼器和解碼器之間存在用于交換另一端的秩的雙向信號,則可W 使用秩差異來改進(jìn)可能的壓縮并且減少編碼器和解碼器中的操作的數(shù)量。
[0184] 考慮平移函數(shù)
[0185] 由于關(guān)于為稀疏和不規(guī)則的揚聲器設(shè)置得到的能量分布的問題,前面提及了平移 函數(shù)fs、fi或平移矩陣G的使用,參見方程(11)。運些問題必須對通??蒞在高保真立體聲中 使用的有限階次進(jìn)行處理(參見章節(jié)"對高保真立體聲矩陣的影響"到"非正交基的問題")。
[0186] 關(guān)于對平移矩陣G的要求,在編碼之后,假定一些聲學(xué)源的聲場處于由高保真立體 聲狀態(tài)矢量I as〉表示的良好狀態(tài)。然而,在解碼器側(cè),狀態(tài)已經(jīng)被準(zhǔn)備得如何是完全未知 的。即,完全不知道系統(tǒng)的當(dāng)前狀態(tài)。因此,為了保持方程(9)和(8)之間的內(nèi)積,采取互逆 基。
[0187] 使用已經(jīng)在編碼器側(cè)的偽逆提供了 W下優(yōu)點:
[0188] ?互逆基的使用滿足了編碼器基和解碼器基之間的雙正交巧
[0189] ?編碼/解碼鏈中的操作的數(shù)量減少;
[0190] ?在關(guān)于SNR行為的數(shù)值方面得到改善;
[0191] ?經(jīng)修改的模式矩陣中的列是正交的,而不僅僅是線性獨立的;
[0192] ?它簡化了基的改變;
[0193] ?使用秩-1逼近導(dǎo)致更少的存儲器工作和減少的操作數(shù)量,尤其在最終的秩較低 的時候。一般來說,對于M X N矩陣,只需要M+N個操作,而不是M*N個操作;
[0194] ?它簡化了解碼器側(cè)的改動,因為解碼器中的偽逆可W被避免;
[01M] ?具有數(shù)值不穩(wěn)定的O的逆問題可W被繞開。
[0196] 在圖1中,在編碼器或解碼器側(cè),聲源的S = I,...,S不同的方向值Q S和高保真立 體聲階次Ns被輸入到步驟或級11,步驟或級11從其形成球諧的對應(yīng)右矢量I Y( Q S)〉和具有 維度0 X S的編碼器模式矩陣SoxS。矩陣卻XS是對應(yīng)于輸入信號矢量I x( Q S)〉而產(chǎn)生的,輸入 信號矢量I x( Q S)〉包括關(guān)于不同方向Q S的S個源信號。因此,矩陣卻XS是球諧右矢量I Y( Q S) 〉的集合。因為不僅信號X(Qs)還有位置隨著時間而變化,所W計算矩陣曰Ox河W被動態(tài)地 執(zhí)行。該矩陣具有用于源的非正交基NONBs。根據(jù)輸入信號|x(Qs)>和秩值。,在步驟或級12 中確定特定的奇異闊值Oe。編碼器模式矩陣卻XS和闊值Oe被饋送到截斷奇異值分解TSVD處理 1〇(參看W上的章節(jié)"奇異值分解"),該處理在步驟或級13中執(zhí)行對模式矩陣曰OxS的奇異值 分解,W便得到其奇異值,由此,一方面,酉矩陣U和F+W及包含。個奇異值巧…£相的對角 矩陣E被輸出,另一方面,相關(guān)的編碼器模式矩陣秩。被確定(備注:〇1是來自SVD巧)=UEV +的矩陣S的第i奇異值)。
[0197]在步驟/級12中,根據(jù)章節(jié)"編碼器中的正則化"來確定闊值Oe。闊值Oe可W將所使 用的0&值的數(shù)量限制為截斷的或最終的編碼器模式矩陣秩f/ble。闊值Oe可W被設(shè)置為預(yù) 定義的值,或者可W被改為輸入信號的信噪比SNR:
由此全部S個源信號I X (Q S)〉的SNR在預(yù)定義數(shù)量的采樣值上被測量。
[019引在比較器步驟或級14中,將來自矩陣E的奇異值Or與闊值Oe進(jìn)行比較,并且根據(jù)該 比較,計算截斷的或最終的編碼器模式矩陣秩心e,該秩化n。根據(jù)章節(jié)"編碼器中的正則 化"來修改其余的巧^1值。最終的編碼器模式矩陣秩巧《。被饋送到步驟或級16。
[0199] 關(guān)于解碼器側(cè),在步驟或級18中,對應(yīng)于方框17中的相關(guān)信號I y( Q 1)〉的揚聲器 位置,根據(jù)揚聲器的1 = 1,...,L方向值Q 1和解碼器高保真立體聲階次化,確定關(guān)于方向Q 1 上的特定揚聲器的對應(yīng)的球諧右矢量I Y( Q i)〉W及對應(yīng)的具有維度QXL的解碼器模式矩 陣W日止。類似于編碼器矩陣卻XS,解碼器矩陣W日XL是用于所有方向Qi的球諧右矢量|Y( Qi)〉 的集合。W日XL的計算被動態(tài)地執(zhí)行。
[0200] 在步驟或級19中,對解碼器模式矩陣WoxL執(zhí)行奇異值分解處理,并且將所得到的 酉矩陣U和ytW及對角矩陣E饋送到方框17。此外,最終的解碼器模式矩陣秩被計算 并且被饋送到步驟/級16。
[0201] 在步驟或級16中,如上所述的那樣,根據(jù)最終的編碼器模式矩陣秩和最終的 解碼器模式矩陣秩確定最終的矩陣秩rfin。將最終的模式矩陣秩Win饋送到步驟/級15 和步驟/級17。
[020^ 編碼器側(cè)矩陣Us、VfxEs、秩值最終的模式矩陣秩值化山及所有源信號的時 間相關(guān)的輸入信號右矢量|x(Qs)>被饋送到步驟或級15,步驟或級15使用方程(32)從運些 與卻、5相關(guān)的輸入值計算編碼器模式矩陣的伴隨偽逆(5+^_^該矩陣具有維度所,1。乂5*和用
于源的正交基ONBs。當(dāng)處理復(fù)矩陣及其伴隨時,考慮: 步 0 驟/級15輸出對應(yīng)的時間相關(guān)的高保真立體聲右矢量或狀態(tài)矢量a's〉,參見上面的章節(jié) "冊A編碼器"。
[0203] 在步驟或級16中,如上面的章節(jié)"分量改動"中所描述的,使用最終的模式矩陣秩 Win來減少Ia^ S〉的分量的數(shù)量,W便可能地減少所傳輸?shù)男畔⒘?,在改動之后得到時間相 關(guān)的高保真立體聲右矢量或狀態(tài)矢量I a/1〉。
[0204] 根據(jù)保真立體聲右矢量或狀態(tài)矢量I a'1〉,根據(jù)從模式矩陣OxL導(dǎo)出的秩值r擬及 解碼器側(cè)矩陣U/、Vi、Ei, W及根據(jù)來自步驟/級16的最終的模式矩陣秩值rfin,計算具有維 度玉X 和用于揚聲器的正交基ONBi的伴隨解碼器模式矩陣CF)t,得到所有揚聲器的 時間相關(guān)的輸出信號的右矢量|y( Q 1)〉,參見上面的章節(jié)"H0A解碼器"。解碼是利用平常的 模式矩陣的共輛轉(zhuǎn)置執(zhí)行的,所述共輛轉(zhuǎn)置依賴于特定的揚聲器位置。對于附加的擅染,應(yīng) 使用特定的平移矩陣。
[0205] 解碼器由步驟/級18、19和17表示。編碼器由其他步驟/級表示。
[0206] 圖1的步驟/級11至19原則上分別對應(yīng)于圖2中的步驟/級21至29 W及圖3中的步 驟/級31至39。
[0207] 另外,在圖2中,在步驟或級211中計算的用于編碼器側(cè)的平移函數(shù)fsW及在步驟 或級218中計算的用于解碼器側(cè)的平移函數(shù)f 1281被用于線性泛函平移。平移函數(shù)fs是用于 步驟/級21的附加輸入信號,平移函數(shù)fi是用于步驟/級28的附加輸入信號。在上面的章節(jié) "考慮平移函數(shù)"中描述了使用運種平移函數(shù)的原因。
[0208] 與圖1相比,在圖3中,平移矩陣G控制對在步驟/級37的輸出處的所有揚聲器的時 間相關(guān)的輸出信號的初步右矢量的平移處理371。運導(dǎo)致所有揚聲器的時間相關(guān)的輸出信 號的改動的右矢量|y(Qi)〉。
[0209] 圖4更詳細(xì)地示出了用于基于編碼器模式矩陣卻XS的奇異值分解SVD處理來確定闊 值Oe的處理。SVD處理傳遞矩陣E (在其遞減對角中包含從〇1到巧'S的所有奇異值Oi,參見方 程(20)和(21)) W及矩陣E的秩。。在使用固定闊值的情況(方框41)下,在從i = l開始并且 可W-直到i =。的、由變量i控制的循環(huán)(方框42和43)內(nèi),檢查(方框45)在運些Oi值之間是 否存在量值差距。運種差距被假定為當(dāng)奇異值OW的量值明顯小于其在前的奇異值Oi的量 值(例如,小于1/10)時發(fā)生。當(dāng)檢測到運種差距時,循環(huán)停止,并且闊值Oe被設(shè)置為當(dāng)前奇 異值〇1。在i=。的情況(方框44)下,達(dá)到最低的奇異值Oi = Or,回路被退出,并且Oe被設(shè)定為 Or (方框 46)。
[0210] 在不使用固定闊值的情況(方框41)下,調(diào)查所有S個源信號的T個采樣的塊X=[ I X (Qs,t = 0)〉,. . .,|x( Qs,t = T)〉](=矩陣SXT)。計算X的信噪比SNR(方框48),并且將闊值 Oe設(shè)置巧
:方框49)。
[0211]圖5示出了在步驟/級15、25、35內(nèi),在降低的模式矩陣秩rfin的情況下的奇異值的 重新計算W及I曰/S〉的計算。來自圖1/2/3的方框10/20/30的編碼器對角矩陣ES被饋送到步 驟或級51、步驟或級52、步驟或級54,其中步驟或級51使用值Ts來計算總能量
步驟或級52使用值所來計算減小的總能量
。 總能量值和減小的總能量值之間的差值A(chǔ) E、值化ace )和值所:".e被饋送到步驟或級 53,步驟或級53計
[0212] 為了確保由
?述的能量被保持為使得結(jié)果在物理上是有意 義的,值A(chǔ) O是需要的。如果在編碼器或解碼器側(cè),能量由于矩陣簡化而減小,則運樣的能量 損失被用值A(chǔ) O補(bǔ)償,值A(chǔ) O被W相等的方式分布給所有剩余的矩陣元素,即,
[0213] 步驟或級54從Es、A O和斬n。計I
[0214]輸入信號矢量I x( Q S)〉被乘W矩陣公。結(jié)果乘^為+。后一乘法的結(jié)果是右矢量 a's〉。
[0215]圖6示出了在步驟/級17、27、37內(nèi),在有或沒有平移時在降低的模式矩陣秩rfin的 情況下的奇異值的重新計算W及揚聲器信號I y( Q 1)〉的計算。來自圖1/2/3中的方框19/ 29/39的解碼器對角矩陣Ei被饋送到步驟或級61、步驟或級62W及步驟或級64,其中步驟 或級61使用值n來計算總能量
,步驟或級62使用值嚇來計算減小 的總能量心ace
設(shè)能量值和減小的總能量值之間的差值A(chǔ) E、值 化脫e 和值巧被饋送到步驟或級63,步驟或級63計算:
[0216]
[0217]
[0218] 右矢量Ia^ S〉被乘W矩陣Et。結(jié)果被乘W矩陣V。后一乘法的結(jié)果是所有揚聲器的 時間相關(guān)的輸出信號的右矢量Iy( Q1)〉。
[0219] 本發(fā)明處理可W由單個處理器或電子電路執(zhí)行,或者由并行操作和/或?qū)Ρ景l(fā)明 的處理的不同部分操作的幾個處理器或電子電路執(zhí)行。
【主權(quán)項】
1. 一種用于使用奇異值分解進(jìn)行高階高保真立體聲化OA)編碼和解碼的方法,所述方 法包括W下步驟: -接收音頻輸入信號(|x(Qs)>); -基于聲源的方向值(Qs)和所述音頻輸入信號(|χ(Ω S)〉)的高保真立體聲階次(Ns), 形成(11、31)對應(yīng)的球諧右矢量(|¥(〇3)〉)和對應(yīng)的編碼器模式矩陣(動、5); -對所述編碼器模式矩陣(卻XS)執(zhí)行(13、23、33)奇異值分解,其中,兩個對應(yīng)的編碼器 酉矩陣化s、K+)、對應(yīng)的包含奇異值的編碼器對角矩陣(Es)W及相關(guān)的編碼器模式矩陣秩 (。)被輸出; -從所述音頻輸入信號(|x(Ωs)〉)、所述奇異值(Σs)和所述編碼器模式矩陣秩(rs)確 定(12、22、32)闊值(οε); -將所述奇異值中的至少一個(Or)與所述闊值(σε)進(jìn)行比較(14、24、34),并且確定對應(yīng) 的最終的編碼器模式矩陣秩(皆):; -基于揚聲器的方向值(Ωι)和解碼器高保真立體聲階次(Ni),形成(18、38)用于位于與 所述方向值(Ωι)對應(yīng)的方向上的特定揚聲器的對應(yīng)的球諧右矢量(|¥(〇1)〉)^及對應(yīng)的 解碼器模式矩陣(Ψ日XL); -對所述解碼器模式矩陣(Ψοχ?執(zhí)行(19、29、39)奇異值分解,其中,兩個對應(yīng)的解碼器 酉矩陣(U/、Vi)W及對應(yīng)的包含奇異值的解碼器對角矩陣(Σι)被輸出,并且所述解碼器模 式矩陣的對應(yīng)的最終的秩? f巧;)被確定; -從所述最終的編碼器模式矩陣秩(印'"e )和所述最終的解碼器模式矩陣秩(吁化d ) 確定(16、26、36)最終的模式矩陣秩(打in); -從所述編碼器酉矩陣(Us、f/)、所述編碼器對角矩陣(Es)和所述最終的模式矩陣秩 (mn)計算(15、25、35)所述編碼器模式矩陣間XS)的伴隨偽逆(Ξ+)*,得到高保真立體聲右 矢量(|a' S〉), 并且根據(jù)所述最終的模式矩陣秩(rfin)減少(16、26、36)所述高保真立體聲右矢量(la^s 〉)的分量的數(shù)量,W便提供改動的高保真立體聲右矢量(la^i〉); -從所述改動的高保真右矢量(I a/1〉)、所述解碼器酉矩陣(yf >Vi)、所述解碼器對角矩 陣(Σι)和所述最終的模式矩陣秩計算(17、27、37)伴隨解碼器模式矩陣(Ψ + ),得到所有揚 聲器的輸出信號的右矢量(|y(Qi)〉)。2. -種用于使用奇異值分解進(jìn)行高階高保真立體聲化0A)編碼和解碼的裝置,所述裝 置包括適于執(zhí)行W下操作的部件: -接收音頻輸入信號(IX( Ω S)〉); -基于聲源的方向值(Qs)和所述音頻輸入信號(|χ(Ω S)〉)的高保真立體聲階次(Ns), 形成(11、31)對應(yīng)的球諧右矢量(|Υ( Qs)>)和對應(yīng)的編碼器模式矩陣(Soxs); -對所述編碼器模式矩陣(卻xs)執(zhí)行(13、23、33)奇異值分解,其中,兩個對應(yīng)的編碼器 酉矩陣化s、^t)、對應(yīng)的包含奇異值的編碼器對角矩陣(Es)W及相關(guān)的編碼器模式矩陣秩 (。)被輸出; -從所述音頻輸入信號(|x(Ωs)〉)、所述奇異值(Σs)和所述編碼器模式矩陣秩(rs)確 定(12、22、32)闊值(οε); -將所述奇異值中的至少一個(Or)與所述闊值(σε)進(jìn)行比較(14、24、34),并且確定對應(yīng) 的最終的編碼器模式矩陣秩(); -基于揚聲器的方向值(Ωι)和解碼器高保真立體聲階次(Ni),形成(18、38)用于位于與 所述方向值(Ωι)對應(yīng)的方向上的特定揚聲器的對應(yīng)的球諧右矢量(|¥(〇1)〉)^及對應(yīng)的 解碼器模式矩陣(Ψ日XL); -對所述解碼器模式矩陣(Ψοχ?執(zhí)行(19、29、39)奇異值分解,其中,兩個對應(yīng)的解碼器 酉矩陣(Uf、Vi)W及對應(yīng)的包含奇異值的解碼器對角矩陣(Σι)被輸出,并且所述解碼器模 式矩陣的對應(yīng)的最終的秩? r巧巧皮確定; -從所述最終的編碼器模式矩陣秩(所"e )和所述最終的解碼器模式矩陣秩(吁;"rf ) 確定(16、26、36)最終的模式矩陣秩(打in); -從所述編碼器酉矩陣(Us、皆)、所述編碼器對角矩陣(Es)和所述最終的模式矩陣秩 (mn)計算(15、25、35)所述編碼器模式矩陣間XS)的伴隨偽逆巧+)十,得到高保真立體聲右 矢量(|a' S〉), 并且根據(jù)所述最終的模式矩陣秩(rfin)減少(16、26、36)所述高保真立體聲右矢量(la^s 〉)的分量的數(shù)量,W便提供改動的高保真立體聲右矢量(la^i〉); -從所述改動的高保真右矢量(I曰/1〉)、所述解碼器酉矩陣(巧t >Vi)、所述解碼器對角矩 陣(Σι)和所述最終的模式矩陣秩計算(17、27、37)伴隨解碼器模式矩陣(Ψ + ),得到所有揚 聲器的輸出信號的右矢量(|y(Qi)〉)。3. 根據(jù)權(quán)利要求1所述的方法或根據(jù)權(quán)利要求2所述的裝置,其中,當(dāng)形成(21)所述球 諧右矢量(|Y(Qs)>)和所述編碼器模式矩陣間XS)時,使用平移函數(shù)(211,fs),所述平移函 數(shù)(211,fs)執(zhí)行線性運算并且將所述音頻輸入信號(|x( Qs)>)中的源位置映射到揚聲器輸 出信號的所述右矢量(|y(Q 1)〉)中的揚聲器的位置, 并且當(dāng)形成(28)用于特定揚聲器的所述球諧右矢量(|Υ(Ω 1)〉)和所述解碼器模式矩陣 (Ψοχ?時,使用對應(yīng)的平移函數(shù)(281,fi),所述平移函數(shù)(281,fi)執(zhí)行線性運算并且將所述 音頻輸入信號(|x( Qs)>)中的源位置映射到揚聲器輸出信號的所述右矢量(|y( Ω 1)〉)中的 揚聲器的位置。4. 根據(jù)權(quán)利要求1所述的方法或根據(jù)權(quán)利要求2所述的裝置,其中,在計算(17、27、37) 所述伴隨解碼器模式矩陣(Ψ + )和所有揚聲器的時間相關(guān)的輸出信號的初步改動的右矢量 之后,使用平移矩陣(G)來執(zhí)行所有揚聲器的時間相關(guān)的輸出信號的運些初步改動的右矢 量的平移(371),得到所有揚聲器的輸出信號的所述右矢量(|y(Qi)〉)。5. 根據(jù)權(quán)利要求1-4之一所述的方法或根據(jù)權(quán)利要求1-4之一所述的裝置,其中,為了 在所述奇異值(〇1)的集合內(nèi)確定(12、22、32)所述闊值(οε),從第一個奇異值(01)開始檢測 量值差距,并且如果后一奇異值(〇1+1)的量值比當(dāng)前奇異值(〇1)的量值小預(yù)定因子,則該當(dāng) 前奇異值的量值被取作所述闊值(Οε)。6. 根據(jù)權(quán)利要求1-4之一所述的方法或根據(jù)權(quán)利要求1-4之一所述的裝置,其中,為了 確定(12、22、32)所述闊值(Oε),計算所有源信號的采樣塊的信噪比SNR,并且將所述闊值 (〇6)設(shè)置為^^,=;?^。7.-種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品包括當(dāng)在計算機(jī)上被執(zhí)行時執(zhí)行根據(jù)權(quán) 利要求1所述的方法的指令。
【文檔編號】H04S3/00GK105981410SQ201480074092
【公開日】2016年9月28日
【申請日】2014年11月18日
【發(fā)明人】H·克羅普, S·埃伯林格
【申請人】杜比國際公司