国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于確定在聲場的高階高保真立體聲表示中不相關(guān)的聲源的方向的方法和裝置的制造方法

      文檔序號(hào):9278650閱讀:677來源:國知局
      用于確定在聲場的高階高保真立體聲表示中不相關(guān)的聲源的方向的方法和裝置的制造方法
      【專利說明】用于確定在聲場的高階高保真立體聲表示中不相關(guān)的聲源 的方向的方法和裝置
      [0001] 本發(fā)明涉及用于確定在聲場的高階高保真立體聲表示中不相關(guān)的聲源的方向的 方法和裝置。
      【背景技術(shù)】
      [0002] 高階高保真立體聲(HOA)在其它技術(shù)(如波場合成(WFS)或基于信道的如22. 2 的方法)之中提供了表示三維立體聲的一個(gè)可能性。然而,與基于信道的方法相比,HOA表 示對不依賴于特定揚(yáng)聲器的設(shè)置提供了優(yōu)勢。然而,這種靈活性是以對特殊揚(yáng)聲器設(shè)置上 的HOA表示的重放所需的過程進(jìn)行解碼為代價(jià)的。與WFS方法相比,所需要的揚(yáng)聲器的數(shù) 量通常是很大的,也可以對只包括少數(shù)的揚(yáng)聲器的設(shè)置提出HOA。HOA另外的優(yōu)勢是也可以 采用相同的表示而無需對雙耳用的耳機(jī)做出任何修改。
      [0003] HOA是基于由縮短的球諧函數(shù)(SH)展開式表示的復(fù)雜平面諧波幅度的空間密度。 每個(gè)展開系數(shù)是角頻率的函數(shù),其可以同樣由時(shí)域函數(shù)來表示。因此,不失一般性,完整的 HOA聲場表示實(shí)際上可以被假設(shè)被由0時(shí)域函數(shù)組成,其中0指示展開系數(shù)的數(shù)目。在下文 中,這些時(shí)域函數(shù)被稱為HOA系數(shù)序列或被稱為HOA信道。
      [0004] HOA具有提供高空間分辨率的潛能,通過增長的展開的最高階數(shù)N來進(jìn)行改善。這 對關(guān)于主導(dǎo)聲源的聲場進(jìn)行分析提供了可能性。

      【發(fā)明內(nèi)容】

      [0005] -個(gè)如何可以從給定的HOA表示中識(shí)別由聲場組成的獨(dú)立主導(dǎo)聲源、和如何追蹤 它們暫時(shí)的軌跡的申請。需要這種操作用于例如通過將聲場分寫成主導(dǎo)方向信號(hào)和其余的 周邊組件來壓縮HOA表示,如專利申請EP12305537. 8中所述。針對這種方向追蹤方法的另 外的申請會(huì)是粗糙的、初步的源分離。對后產(chǎn)生的HOA聲場記錄使用估計(jì)的方向軌跡以便 放大或減弱特定聲源的信號(hào)也是可能的。
      [0006] 在EP 12305537. 8中提出了相繼執(zhí)行如下的三個(gè)操作:
      [0007] -識(shí)別時(shí)間幀內(nèi)的當(dāng)前存在的主導(dǎo)聲源的數(shù)量并且搜索相應(yīng)的方向。主導(dǎo)聲源的 數(shù)量被從HOA信道互相關(guān)的矩陣的特征值確定。為了搜索主導(dǎo)聲源的方向,估計(jì)與固定數(shù) 量的預(yù)定測試方向的HOA系數(shù)的幀相對應(yīng)的方向功率分布。通過尋找方向功率分布中的最 大值獲得第一方向估計(jì)。隨后通過連續(xù)重復(fù)如下的兩個(gè)操作來發(fā)現(xiàn)其余識(shí)別的方向:從其 余的測試方向的集合中排除空間鄰域的測試方向,并且結(jié)果集合被認(rèn)為是搜索的方向功率 分布的最大值。
      [0008] _估計(jì)的方向被分配給在最后的時(shí)間幀中被認(rèn)為是活動(dòng)的聲源。
      [0009] _在分配之后,對方向估計(jì)執(zhí)行適當(dāng)?shù)钠交员惬@得暫時(shí)平滑的方向軌跡。
      [0010] 然而,盡管通過這種過程,方向估計(jì)的暫時(shí)平滑在原則上通過以指數(shù)的方式計(jì)算 加權(quán)移動(dòng)平局?jǐn)?shù)來完成,但是該技術(shù)具有不能準(zhǔn)確捕獲意外的方向改變或突發(fā)的新主導(dǎo)聲 音的缺點(diǎn)。
      [0011] 為了克服該問題,在專利申請EP 12306485.9中介紹了一種簡單統(tǒng)計(jì)源移動(dòng) 的預(yù)測模型,針對由貝葉斯學(xué)習(xí)定律實(shí)行的統(tǒng)計(jì)上的動(dòng)力平滑利用該模型。然而,EP 12306485. 9和EP 12305537. 8僅從方向功率分布來針對聲源方向計(jì)算似然函數(shù)。該分布表 示來自由在單元球面上幾乎是均勻分布的取樣點(diǎn)指定的方向的多數(shù)通用平面波的功率。沒 有提供關(guān)于來自不同方向的通用平面波之間的互相關(guān)的任意信息。
      [0012] 實(shí)際上,HOA表示的階數(shù)N通常是有限的,導(dǎo)致空間有限帶寬的聲場。具體的,這 意味著對方向功率分布的方向聲源的貢獻(xiàn)被周圍入射在鄰域內(nèi)方向的真方向所彌散。該彌 散效應(yīng)在數(shù)學(xué)上通過"分散函數(shù)"來描述,見下文高階高保真立體聲的空間分辨率部分。其 程度隨著HOA表示的階數(shù)下降而增長。EP 12306485. 9和EP 12305537. 8的方向追蹤方法 某種程度上地考慮到了該效應(yīng),通過約束至先前發(fā)現(xiàn)方向鄰域外的區(qū)域的方向的搜索。然 而,鄰域的規(guī)范假設(shè)所有聲源被編碼有全階N的HOA表示。該假設(shè)違反了 N階HOA表示,該 N階HOA表示包括在小于階數(shù)N中編碼的通用平面波。這種小于階數(shù)N的通用平面波可以 是藝術(shù)創(chuàng)造的結(jié)果,為了使聲源顯得更寬。然而,它們還通過球形麥克風(fēng)隨著記錄HOA聲場 表示出現(xiàn)。
      [0013] 假使聲場由小于階數(shù)N的單個(gè)通用平面波組成(這是不期望有的性能),EP 12306485. 9和EP 12305537. 8的方向追蹤方法不只識(shí)別單個(gè)聲源。
      [0014] 本發(fā)明所要解決的問題是改進(jìn)HOA聲場中主導(dǎo)聲源的確定,使得主導(dǎo)聲源的暫時(shí) 的軌跡可以被追蹤。該問題由權(quán)利要求1、2和6中公開的方法所解決。利用權(quán)利要求6的 方法的裝置在權(quán)利要求7中公開。
      [0015] 本發(fā)明改進(jìn)了 EP 12306485. 9的過程。該發(fā)明過程尋找獨(dú)立主導(dǎo)聲源并隨著時(shí)間 追蹤它們的方向。"獨(dú)立主導(dǎo)聲源"的表示意味著各自聲源的信號(hào)是不相關(guān)的。
      [0016] 盡管EP 12305537. 8和EP 12306485. 9是通過僅考慮初始HOA表示的方向功率分 布來搜索主導(dǎo)聲源方向的所有潛在候選的最先進(jìn)的方法,但是下文描述的發(fā)明過程從初始 HOA表示中除去了每個(gè)方向候選的搜索,所有組件與先前發(fā)現(xiàn)的聲源的信號(hào)有關(guān)。通過這 種操作,許多代替僅一個(gè)正確聲源的錯(cuò)誤檢測的問題可以被避免,以防它對聲場的貢獻(xiàn)被 高度方向性地分散。如上所述,這種效應(yīng)會(huì)針對N階HOA表示發(fā)生,該N階HOA表示包括在 小于階數(shù)N中編碼的通用平面波。與EP 12306485. 9相似,針對主導(dǎo)聲源方向發(fā)現(xiàn)的候選 隨后被分配給先前發(fā)現(xiàn)的主導(dǎo)聲源,并最終根據(jù)統(tǒng)計(jì)源移動(dòng)模式使其變平滑。因此,與EP 12306485. 9相似,發(fā)明過程提供暫時(shí)平滑的發(fā)現(xiàn)估計(jì),并且能夠捕獲意外的方向改變或突 發(fā)的新主導(dǎo)聲音。
      [0017] 發(fā)明過程在兩個(gè)后續(xù)處理中確定針對HOA表示的連續(xù)幀的主導(dǎo)聲源方向的估計(jì), 這兩個(gè)后續(xù)處理為:
      [0018] 從HOA表示的當(dāng)前時(shí)間幀k,相繼搜索針對主導(dǎo)聲源方向的候選或估計(jì),并且確定 被認(rèn)為是由各自聲源創(chuàng)建的HOA表示的組件。在該搜索過程的每次迭代中,每個(gè)另外的方 向候選由殘差HOA表示計(jì)算,殘差HOA表示表示來自與已經(jīng)被除去的先前發(fā)現(xiàn)的聲源的信 號(hào)相關(guān)的所有組件的初始HOA表示。當(dāng)前方向候選從若干預(yù)定的測試方向中選出,使得從 監(jiān)聽者的位置上所選的方向撞擊(impinging)的殘差HOA表示的相關(guān)通用平面波的功率是 與所有其它測試方向的相比的最大值。
      [0019] 接下來,針對當(dāng)前時(shí)間幀選擇的方向候選被分配給在HOA系數(shù)的先前時(shí)間幀k-1 中發(fā)現(xiàn)的主導(dǎo)聲源。其后,關(guān)于作為結(jié)果的時(shí)間軌跡平滑的最終方向估計(jì)通過實(shí)行貝葉斯 推理過程被計(jì)算,其中該貝葉斯推理過程一方面利用統(tǒng)計(jì)的先驗(yàn)聲源移動(dòng)模型,另一方面 利用初始HOA表示的主導(dǎo)聲源組件的方向功率分布。先驗(yàn)聲源移動(dòng)模型從在先前時(shí)間幀 k-1的獨(dú)立聲源的方向和先前時(shí)間幀k-1與倒數(shù)第二的時(shí)間幀k-2之間的移動(dòng)來統(tǒng)計(jì)地預(yù) 測獨(dú)立聲源的當(dāng)前移動(dòng)。通過方向估計(jì)和先前發(fā)現(xiàn)的聲源的方向?qū)χg的聯(lián)合最小角度、 和關(guān)于方向估計(jì)和在先前時(shí)間幀發(fā)現(xiàn)的主導(dǎo)聲源的方向信號(hào)對之間的相關(guān)系數(shù)的最大絕 對值來完成對在HOA系數(shù)的先前時(shí)間幀(k-1)中發(fā)現(xiàn)的主導(dǎo)聲源的方向估計(jì)的分配。
      [0020] 原則上,發(fā)明方法適用于在表示聲場的HOA的高階高保真立體聲表示中確定不相 關(guān)的聲源的方向,所述方法包括如下步驟:
      [0021] -在HOA系數(shù)的當(dāng)前時(shí)間幀中,相繼搜索主導(dǎo)聲源的初步方向估計(jì),并計(jì)算由相應(yīng) 的主導(dǎo)聲源創(chuàng)建的HOA聲場組件,并計(jì)算相應(yīng)的方向信號(hào);
      [0022] -通過比較所述當(dāng)前時(shí)間幀的所述初步方向估計(jì)和在所述先前時(shí)間幀中活動(dòng)的聲 源的平滑方向、并且通過關(guān)聯(lián)所述當(dāng)前時(shí)間幀的所述方向信號(hào)與在所述先前時(shí)間幀中活動(dòng) 的聲源的方向信號(hào)來對在所述HOA系數(shù)的先前時(shí)間幀中活動(dòng)的相應(yīng)聲源分配所述計(jì)算的 主導(dǎo)聲源,得到分配函數(shù);
      [0023]-使用所述分配函數(shù)、在所述先前時(shí)間幀中的平滑方向的集合、在所述先前時(shí)間幀 中活動(dòng)主導(dǎo)聲源的索引的集合、在倒數(shù)第二時(shí)間幀和所述先前時(shí)間幀之間的各自源移動(dòng)角 度的集合、和由相應(yīng)的主導(dǎo)聲源創(chuàng)建的所述HOA聲場組件來計(jì)算平滑的主導(dǎo)源方向;
      [0024] _使用所述平滑的主導(dǎo)源方向、所述先前時(shí)間幀的活動(dòng)主導(dǎo)聲源的幀延遲版本的 方向、和所述先前時(shí)間幀的活動(dòng)主導(dǎo)聲源的幀延遲版本的索引來確定所述當(dāng)前時(shí)間幀的活 動(dòng)主導(dǎo)聲源的索引和方向,
      [0025] 其中在所述先前時(shí)間幀中活動(dòng)的聲源的所述方向信號(hào)由所述先前時(shí)間幀的活動(dòng) 主導(dǎo)聲源的所述幀延遲版本的方向和使用模式匹配的所述先前時(shí)間幀的HOA系數(shù)來計(jì)算,
      [0026] 并且其中所述倒數(shù)第二時(shí)間幀和所述先前時(shí)間幀之間的所述源移動(dòng)角度的集合 由所述先前時(shí)間幀的活動(dòng)主導(dǎo)聲源的所述幀延遲版本的方向和它另外的幀延遲版本的方 向來計(jì)算。
      [0027] 原則上,發(fā)明裝置適用于在表示聲場的HOA的高階高保真立體聲表示中確定不相 關(guān)的聲源的方向,所述裝置包括:
      [0028]-適用于在HOA系數(shù)的當(dāng)前時(shí)間幀中相繼搜索主導(dǎo)聲源的HOA系數(shù)初步方向估計(jì), 用于計(jì)算由相應(yīng)的主導(dǎo)聲源創(chuàng)建的HOA聲場組件,以及用于計(jì)算相應(yīng)的方向信號(hào)的裝置;
      [0029]-適用于通過比較所述當(dāng)前時(shí)間幀的所述初步方向估計(jì)和在所述先前時(shí)間幀中活 動(dòng)的聲源的平滑方向、并且通過關(guān)聯(lián)所述當(dāng)前時(shí)間幀的所述方向信號(hào)與在所述先前時(shí)間幀 中活動(dòng)的聲源的方向信號(hào)來對在所述HOA系數(shù)的先前時(shí)間幀中活動(dòng)的相應(yīng)聲源分配所述 計(jì)算的主導(dǎo)聲源,得到
      當(dāng)前第1頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1