分配函數(shù)的裝置;
[0030]-適用于使用所述分配函數(shù)、在所述先前時間幀中的平滑方向的集合、在所述先前 時間幀中活動主導聲源的索引的集合、在倒數(shù)第二時間幀和所述先前時間幀之間的各自源 移動角度的集合、和由相應的主導聲源創(chuàng)建的所述HOA聲場組件來計算平滑的主導源方向 的裝置;
[0031] -適用于使用所述平滑的主導源方向、所述先前時間幀的活動主導聲源的幀延遲 版本的方向、和所述先前時間幀的活動主導聲源的幀延遲版本的索引來確定所述當前時間 幀的活動主導聲源的索引和方向的裝置,
[0032] 其中在所述先前時間幀中活動的聲源的所述方向信號由所述先前時間幀的活動 主導聲源的所述幀延遲版本的方向和使用模式匹配的所述先前時間幀的HOA系數(shù)來計算,
[0033] 并且其中所述倒數(shù)第二時間幀和所述先前時間幀之間的所述源移動角度的集合 由所述先前時間幀的活動主導聲源的所述幀延遲版本的方向和它另外的幀延遲版本的方 向來計算。
[0034] 本發(fā)明的有利的附加實施例在各自的從屬權利要求中公開。
【附圖說明】
[0035] 參考附圖描述了本發(fā)明的示例實施例,附圖示為如下:
[0036] 圖1用于估計高階高保真立體聲的主導且不相關方向的信號的方向的發(fā)明過程 的框圖;
[0037] 圖2初步方向估計的細節(jié);
[0038] 圖3由主導聲源產(chǎn)生的聲場的主導方向的信號和HOA表示的計算;
[0039] 圖4基于模型的平滑主導聲源方向的計算;
[0040] 圖5球面坐標系統(tǒng);
[0041]圖6針對不同的高保真立體聲階數(shù)N和角度0 e [0, 31]的標準化分散函數(shù) Vn ( @ )〇
【具體實施方式】
[0042] 本發(fā)明的方向追蹤處理的原理在圖1中示出并在下文中被解釋說明。假設方向處 理基于對長度為L的HOA系數(shù)序列的輸入幀C(k)的成功處理,其中K表示幀的索引。幀 關于在等式(45)中所指定的HOA系數(shù)序列在如下高階高保真立體聲的基礎的部分中被定 義:
[0043] fC(k) := [c((kB+l)Ts) c((kB+2)Ts) ... c((kB+L)Ts)] (I)
[0044] 其中Ts表示采樣周期,并且B < L指示幀移位。這是合理但并不是必須的,假設 連續(xù)的幀被重疊,即B < L。
[0045] 在第一步驟或階段11,HOA表示的第k個幀C(k)是針對主導聲源被初步分析的。 該處理的詳細描述在下文的初步方向搜索的部分中被提供。具體地,確定被檢測的主導方
[0046] 獨立初步方向估計和相關的數(shù)量以順序方式被計算,即第一個為d=1,接下來 d = 2,以此類推。在第一步,初始HOA表示C(k)的方向功率分布以EP 12305537.8所提 出的來計算,并且針對存在的主導聲源被相繼地分析。在主導聲源被檢測的情況下,各自 的初步方向估計被計算。另外地,響應的方向信號與當前幀C(k)的組件 一起被估計,假設該當前幀C(k)的組件cESm仰RR(fc)由該聲源創(chuàng)建。假設 cJ2M,eQRR(fc)表示與方向信號相關的c (k)的組件。最終,H〇A組件c3M>a)RR(fc)從 C(k)中減去,從而獲得殘差HOA表示cgM(/c)。第d個(d彡2)初步方向的估計以與第一個 完全類似的方法來執(zhí)行,唯一的例外是代替C (k)而使用殘差的HOA表示Cg^(Zc)。從而確 切地保證由發(fā)現(xiàn)的第d個聲源創(chuàng)建的聲場組件被另外的方向搜索排除在外。
[0047] 在方向分配步驟或階段13,在步驟/階段11在第k個幀中發(fā)現(xiàn)的主導聲源被分 配給在第(k_l)個幀中(被假設為)活動的相應的聲源。一方面,通過比較當前幀(k)的 初步方向估計乃^^〇)乃^^;^(fc)和在第(k_l)個幀中(被假設為)活動的聲源的平滑 方向來完成分配,該聲源的平滑方向被包括在集合",DOM,ACT(fc _ 1)中,并且它們的索引被 包括在集合Aom,Acr(fc_l)中。另一方面,為了該分配,在幀k處被檢測的主導聲源的即時 方向信號x$ ST(fc),d = lD(fc)和在第k個幀中(被假設為)活動的聲源的方向信號 Xact(H)之間的關聯(lián)被利用。該分配的結果由分配函數(shù)/#:{1Bm^ {1£?}表述, 其中D表示將要被追蹤的預期聲源的最大數(shù)量,意味著第d個新發(fā)現(xiàn)的聲源被分配給具有 索引/c/Z,fc(c〇的先前的活動聲源。
[0048] 在基于模型的平滑主導聲源方向的計算步驟中或階段14中,基于在 EP12306485.9中所提出的統(tǒng)計的聲源移動模式,通過使用在幀(k-1)處的活動聲源的索 引的集合知01\^(:1'(^ - 1)、在幀(k_l)處的相應的主導源方向的集合^fi,DOM,ACT(& _ 1)、 在幀(k_2)和幀(k_l)之間各自源的移動角度、被認為是由發(fā)現(xiàn)的主導聲源創(chuàng)建的 HOA聲場組件cg^eC)RR(:fc:)d = 1和分配函數(shù)/ifc來計算平滑的主導聲源方向 n(b〇Md)^k^d= 1i亥基于模型的平渭程序的詳細指i述在下文的基于模型的 平滑主導聲源方向的計算的部分中被提供。
[0049] 在最后的步驟或階段15中,使用來自步驟/階段14的平滑主導源方向 n^:w\k),Ci=I,...,0C/O以及包括在第(k-1)個幀中被假設是活動的聲源的平滑方 向和各自的索引的集合仏2,D〇M,ACT(fc - 1)和;7DQM,Acr(fc - 1)來確定當前活動主導聲源的索 引和方向,該索引和方向被認為是分別包括在集合JdomiActOc)和fifl.DONMurrOO中。該操作 具有不會錯誤地無效聲源的目的,這些聲源未曾針對少量的連續(xù)幀被檢測。
[0050] 步驟或階段12使用幀k_l的HOA表不C (k_l)和在第(k_l)個幀中被認為是活 動的聲源的平滑方向的集合dom.actR- 1)來執(zhí)行在第(k-1)個幀中被認為是活動的聲 源的方向信號的計算。該計算基于在M. A Poletti的"基于球鞋函數(shù)的三維環(huán)繞立體聲系 統(tǒng)(Three-Dimensional Surround Sound Systems Based on Spherical Harmonics)" J. Audio Eng. Soc.,卷53(11),頁.1004-1025,2005中所描述的模式匹配的原則。
[0051] 在源移動角度估計步驟或階段16,分別通過在第(k-1)和第(k-2)個幀中被認為 是活動的聲源的平滑方向估計的兩個集合仏^01^>(:1 1(_&_1)和^^,〇〇1'4,4(:7'(丨<-2)來計算主 導活動聲源的移動角度的集合6'&, D0lM,ACT(k - 1)。該移動被理解為發(fā)生在幀k-2和k-1之 間。活動的主導聲源的移動角度是其在幀k-2處和幀k-1處的平滑方向估計之間的弧度。
[0052] 備注:如果幀k-2的方向估計針對在幀k-1中被假設為活動的主導聲源是不可用 的,則各自的移動角度可以被設定為最大值" "。通常,當針對第一幀k和幀k-1的值初始 化的處理還未可用時,將被輸入到圖1的步驟或階段的相應的設定或數(shù)值分別是空的或者 被設定到0。
[0053] 該操作對該光源的下一方向產(chǎn)生先驗概率,以使其變得與所有可能的方向幾乎相 同,參考下文確定當前活動的主導光源的索引和方向的部分。
[0054] 幀延遲171到174通過一個幀對各自的信號進行延遲。
[0055] 在下文中,更為詳細地解釋了上述的步驟和階段。
[0056] 初步方向搜索
[0057] 在初步方向搜索步驟/階段11中,估計存在的主導聲源的當前數(shù)量5〇)和各自 的方向SJSm(Zc), d = 另外,計算被認為是由獨立的聲源創(chuàng)建的HOA聲場組件 cf2MC〇RR(fc), d = 1,…以及響應的方向信號Xi^st(Zc), d = I,...,S(Zc)(即,通用平 面波函數(shù))。所有先前枚舉的數(shù)量首先針對方向索引d = 1,接下來針對d = 2依次被計算, 直到d = 0(fc)。
[0058] 針對單個方向d索引的計算過程在圖2中被示出。在第(d-1)個方向的估計(與 第k個時間幀的第d個方向的估計有關)之后產(chǎn)生的其余HOA表示被輸入到該階 段。從而應當理解的是,在循環(huán)開始的C^m(Zc)相當于初始HOA幀C(k)。在第一步驟或階 段21中,針對Q離散測試方向(D q,q = 1,...,Q)的預定數(shù)量計算其余HOA表示C^m(Zc) 的方向功率分布P(d) (k),該Q離散測試方向被幾乎均勻地分布在單元球面上。更具體地,每 個測試方向Dq被定義為包括傾斜角9 [0,JT]和方位角(}> [0, 2 JT [的矢量,根據(jù) Qq:= ( 9q,⑵
[0059] 其中,(.)T表示轉置。方向功率分布由如下矢量表示。
[0061] 它的組件表示屬于與第k個時間的方向D q有關的表示的所由 主導聲源的聯(lián)合功率。如EP 12305537. 8中提議的來計算來自C^fw(Zc)的方向功率分布 Pp(Zf)的實際計算。
[0062] 在步驟或階段22中,針對存在的主導聲源來分析向功率分布檢測主導源 的一種方法在下文針對存在的主導聲源進行分析的部分中被描述。如果沒有主導聲源被檢 測,則停止方向搜索,并且發(fā)現(xiàn)的主導方向的總數(shù)被設置為0(lc) = d-l。否則,如果主導 源被檢測,則其關于坐標原點的方向^ESm(Zc)的初步估計在步驟或階段23中被計算,詳細 請見下文搜索主導聲源檢測的部分。然后,被假設為將由第d個