示C|EM(fc):來計算,該殘差H0A表示 表示來自與已經(jīng)被除去的先前發(fā)現(xiàn)的聲源的信號相關(guān)的所有組件的初始H0A表示, 其中當前方向候選從若干預(yù)定的測試方向中選出,使得從監(jiān)聽者的位置上所選的方向 撞擊的所述殘差H0A表示C^EM(/〇的相關(guān)通用平面波的功率是與所有其它測試方向的相比 的最大值。2. 如權(quán)利要求1所述的方法,其中,針對H0A系數(shù)c(k)的所述當前時間幀k選擇的方 向估計被分配給在H0A系數(shù)c(k-l)的先前時間幀k-1中發(fā)現(xiàn)的主導(dǎo)聲源,最終的方向估計 關(guān)于作為結(jié)果的時間軌跡被進行平滑。3. 如權(quán)利要求2所述的方法,其中,所述平滑通過實行貝葉斯推理過程而被執(zhí)行,其中 該貝葉斯推理過程利用統(tǒng)計的先驗聲源移動模型,以及利用所述初始H0A表示的主導(dǎo)聲源 組件的方向功率分布4. 如權(quán)利要求3所述的方法,其中,所述統(tǒng)計的先驗?zāi)P蛷膶υ谙惹皶r間幀k-1中的獨 立聲源的方向的認知和先前時間幀k-1與倒數(shù)第二的時間幀k-2之間的移動的認識來統(tǒng)計 地預(yù)測獨立聲源的移動。5. 如權(quán)利要求3或4所述的方法,其中,通過方向估計和先前發(fā)現(xiàn)的聲源的方向?qū)χ?間的聯(lián)合最小角度、和通過與方向估計和在H0A系數(shù)的所述先前時間幀k-1發(fā)現(xiàn)的主導(dǎo)聲 源有關(guān)的方向信號對之間的相關(guān)系數(shù)的最大絕對值來完成對在H0A系數(shù)的先前時間幀k-1 中發(fā)現(xiàn)的主導(dǎo)聲源的所述方向估計的分配。6. -種在表示聲場的H0A的高階高保真立體聲表示中確定不相關(guān)聲源的方向 k,DOM,ACT0)的方法,所述方法包括如下步驟: -在HOA系數(shù)c(k)的當前時間幀k中,相繼搜索(11)主導(dǎo)聲源的初步方向估計 斯十胃(11)郵目&白勺柯原倉1 健白勺易謝斯十胃(n) 相應(yīng)的方向信號(ft); -通過比較所述當前時間幀k的所述初步方向估計i5%M(/f)和在所述先前時間幀k-1 中活動的聲源的平滑方向&,D0M,ACT(fc_ 1)、并且通過關(guān)聯(lián)所述當前時間幀k的所述方向 信號與在所述先前時間幀k-1中活動的聲源的方向信號XACT(k-l)來對在所述H0A 系數(shù)的先前時間幀k-1中活動的相應(yīng)聲源分配(13)所述計算的主導(dǎo)聲源,得到分配函數(shù) Xuc; _使用所述分配函數(shù)心在所述先前時間幀k-1中的平滑方向的集合 5fl,D0M,ACT(& - 1)、在所述先前時間幀k_l中的活動主導(dǎo)聲源的索引的集合 九ORAcrO- 1)、在倒數(shù)第二時間幀k-2和所述先前時間幀k-1之間的各自源移動角度的 集合^,D〇M,ACT(fc- 1)、和由相應(yīng)的主導(dǎo)聲源創(chuàng)建的所述H0A聲場組件:cg^e()RR(fc)來計 算(14)平滑的主導(dǎo)源方向 -使用所述平滑的主導(dǎo)源方向所述先前時間幀k-1的活動主導(dǎo)聲源的幀 延遲(174)版本的方向1)、和所述先前時間幀k-1的活動主導(dǎo)聲源的幀延 遲(172)版本的索引^OM,ACT〇 -l)來確定(15)所述當前時間幀k的活動主導(dǎo)聲源的索 引Jd〇M,ACT(女)和方向 &?,DOM,ACT0), 其中在所述先前時間幀k-1中活動的聲源的所述方向信號XACT(k-l)由所述先前時間 幀k-1的活動主導(dǎo)聲源的所述幀延遲(174)版本的方向&fl,DOM,ACTU)和使用模式匹配的所 述先前時間幀的HOA系數(shù)c(k-1)來計算(12), 并且其中所述倒數(shù)第二時間幀k-2和所述先前時間幀k-1之間的所述源移動角度的集 合'fg,DOM,ACT認-1)由所述先前時間幀k-1的活動主導(dǎo)聲源的所述幀延遲(174)版本的方 向&aDOM,ACT(k- 1)和它另外的幀延遲(173)版本的方向來計算。7.-種在表示聲場的HOA的高階高保真立體聲表示中確定不相關(guān)聲源的方向lfeD〇M,ACT(/〇的裝置,所述裝置包括如下步驟: -適用于在HOA系數(shù)c(k)的當前時間幀k中相繼搜索主導(dǎo)聲源的初步方向估計 ,用于計算由相應(yīng)的主導(dǎo)聲源創(chuàng)建的HOA聲場組件cg]M>a3RR(fc),以及用于計算 相應(yīng)的方向信號.X盟T(fc)的裝置(11); -適用于通過比較所述當前時間幀k的所述初步方向估計名和在所述先前時間 幀k-1中活動的聲源的平滑方向、Qj,dom,act(& _】)、并且通過關(guān)聯(lián)所述當前時間幀k的所 述方向信號;cfgTO)與在所述先前時間幀k-1中活動的聲源的方向信號XACT(k-1)來對在 所述HOA系數(shù)的先前時間幀k-1中活動的相應(yīng)聲源分配所述計算的主導(dǎo)聲源,得到分配函 數(shù):/抑的裝置(13); -適用于使用所述分配函數(shù)kfc、在所述先前時間幀k-1中的平滑方向的 集合_&f3,D0M,ACT(& _ 1)、在所述先前時間幀k-1中活動主導(dǎo)聲源的索引的集合 - 1)、在倒數(shù)第二時間幀k_2和所述先前時間幀k_l之間的各自源移動角度的 集合PiddmactO- 1)、和由相應(yīng)的主導(dǎo)聲源創(chuàng)建的所述H0A聲場組來計 算平滑的主導(dǎo)源方向00的裝置(14); -適用于使用所述平滑的主導(dǎo)源方向所述先前時間幀k-1的活動主導(dǎo)聲 源的幀延遲(174)版本的方向仏2,D0M,ACT(fc-1)、和所述先前時間幀k-1的活動主導(dǎo)聲源 的幀延遲(172)版本的索引:7D〇M,ACTa- 1)灰確定所述當前時間幀k的活動主導(dǎo)聲源的索 弓丨7d〇M,ACT⑷和方向心 .DOM.ACT(fc)的裝置(15), 其中在所述先前時間幀k-1中活動的聲源的所述方向信號XACT(k-l)由所述先前時間 幀k-1的活動主導(dǎo)聲源的所述幀延遲(174)版本的方向&,DOM,act(/〇?和使用模式匹配的 所述先前時間幀的H0A系數(shù)c(k-1)來計算(12), 并且其中所述倒數(shù)第二時間幀k-2和所述先前時間幀k-1之間的所述源移動角度的集 合知D〇M,ACT(k- 1)由所述先前時間幀k-1的活動主導(dǎo)聲源的所述幀延遲(174)版本的方 向;,DOM,ACT認-1)和它另外的幀延遲(173)版本的方向來計算。8. 如權(quán)利要求6所述的方法或如權(quán)利要求7所述的裝置,其中,在確定所檢測的主導(dǎo)方 向信號的數(shù)量和相應(yīng)的初步方向估計中,由相應(yīng)的主導(dǎo)聲源創(chuàng)建的H0A聲場 組件cg]M@RR(/<)波從H0A系數(shù)c(k)的所述當前幀k中減去,以便獲得相應(yīng)的殘差H0A表 示并于每個針對種聲場會且件剩余的殘胃H0A表示的情況?復(fù)執(zhí)彳亍該減'法 過程,使得所發(fā)現(xiàn)的聲場組件被另外的方向搜索排除在外。9.如權(quán)利要求8所述的方法或如權(quán)利要求8所述的裝置,其中,針對單個方向索引d, 剩余的殘差H0A表示的方向功率分布針對預(yù)定數(shù)量的離散測試方向Qq被計算,該 離散測試方向Dq在單元球面上幾乎是均勻分布的,并且所述方向功率分布針對存在的主 導(dǎo)聲源被分析,如果沒有主導(dǎo)聲源被檢測,則方向搜索被停止,如果主導(dǎo)源被檢測,則其關(guān) 于坐標原點的方向的初步估計被計算。10. 如權(quán)利要求8和9所述的方法或如權(quán)利要求8和9所述的裝置,其中,在確定主 導(dǎo)源方向的初步估計之后,被假設(shè)由相同聲源創(chuàng)建的聲場組件的各自方向信號 和H0A表示C認M.c〇RR(fc)通過如下來計算: -旋轉(zhuǎn)(31)目標是在單元球面上均勻分布的由取樣位置DINIT,。組成的固定的、預(yù)定的 球面網(wǎng)格:gaiNIT,以提供由旋轉(zhuǎn)的取樣位置.nSkJk)的網(wǎng)格^SoT(k),其中所述旋轉(zhuǎn)被 執(zhí)行使得第一旋轉(zhuǎn)取樣位置與所述初步方向估計fifSM(k)相對應(yīng); -將所述剩余的殘差H0A表示轉(zhuǎn)換(32)到空間域,這等同于由相應(yīng)的平面波 函數(shù):4%St⑻來表示,該平面波函數(shù)被假設(shè)為從旋轉(zhuǎn)的網(wǎng)格方向丨影響到坐標原 點,并計算主導(dǎo)聲源信號和網(wǎng)格方向信號; -執(zhí)行(33)對來自主導(dǎo)聲源信號的所述網(wǎng)格方向信號預(yù)測; -計算(34)預(yù)測的網(wǎng)格方向信號的HOA表示cg^eQRR(fc),通過球諧函數(shù)逆變換來表 示對由所述剩余的殘差HOA表示:表示的聲場的主導(dǎo)聲源的貢獻。11.如權(quán)利要求6、8-10中任一所述的方法或如權(quán)利要求7-10中任一所述的裝置,其中 平滑主導(dǎo)源方向辦的所述計算(14)被實行如下: -使用所述分配函數(shù)々,fc、在所述先前時間幀中的平滑方向的集合fiaDOlVUCTOf- 1)、在所述先前時間幀中的活動主導(dǎo)聲源的索引的集合JDQM|Acr(A: - 1)、 和源移動角度的集合&D()M)ACT〇-;P來計算(42)方向的先驗概率函數(shù) -使用所述分配函數(shù)和使用由主導(dǎo)聲源創(chuàng)建的所述H0A聲場組件c£JM>roRR(fc)來 計算(41)方向似然函數(shù) -使用所述方向似然函數(shù)和使用所述方向的先驗概率函數(shù)來 針對主導(dǎo)聲源方向計算(43)方向的后驗概率函數(shù) -使用主導(dǎo)聲源方向的所述方向的后驗概率函數(shù)確定(44)平滑的主導(dǎo)聲 源方向戒二叫⑵。
【專利摘要】高階高保真立體聲(HOA)表示三維立體聲。HOA提供高空間分辨率并且促進關(guān)于主導(dǎo)聲源的聲場的分析。本發(fā)明的目的在于識別由聲場構(gòu)成的獨立主導(dǎo)聲源,并追蹤它們暫時的軌跡。已知的申請是通過查看初始HOA表示的方向功率分布來搜索主導(dǎo)聲源的所有潛在候選,而在本發(fā)明中,與先前發(fā)現(xiàn)的聲源的信號相關(guān)的所有組件被除去。通過這種操作,許多代替僅一個正確聲源的錯誤檢測的問題可以被避免,以防它對聲場的貢獻被高度方向性地分散。
【IPC分類】H04S3/00, G10L19/008, G01S3/80
【公開號】CN104995926
【申請?zhí)枴緾N201480008017
【發(fā)明人】亞歷山大·克魯格, 斯文·科爾東
【申請人】湯姆遜許可公司
【公開日】2015年10月21日
【申請日】2014年2月7日
【公告號】EP2765791A1, EP2954700A1, WO2014122287A1