確定聲道間時間差參數(shù)的方法和裝置的制造方法
【專利摘要】提供一種確定聲道間時間差參數(shù)的方法和裝置,能夠降低在立體聲編碼過程中聲道間時間差參數(shù)搜索計算過程的計算量,方法包括:根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),基準(zhǔn)參數(shù)對應(yīng)于第一聲道的時域信號與第二聲道的時域信號之間的獲取順序,第一聲道的時域信號及第二聲道的時域信號對應(yīng)于同一時段;根據(jù)基準(zhǔn)參數(shù)和極限值Tmax,確定搜索范圍,其中,極限值Tmax是根據(jù)第一聲道的時域信號的采樣率確定的,搜索范圍屬于[-Tmax,0],或搜索范圍屬于[0,Tmax];基于第一聲道的頻域信號及第二聲道的頻域信號,在搜索范圍內(nèi)進(jìn)行搜索處理,以確定與第一聲道及第二聲道相對應(yīng)的第一聲道間時間差I(lǐng)TD參數(shù)。
【專利說明】
確定聲道間時間差參數(shù)的方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及音頻處理領(lǐng)域,并且更具體地,涉及確定聲道間時間差參數(shù)的方法和 裝置。
【背景技術(shù)】
[0002] 隨著生活質(zhì)量的提高,人們對高質(zhì)量音頻的需求不斷增大。相對于單聲道音頻,立 體聲音頻具有各生源的方位感和分布感,能夠提高信息的清晰度和可懂度,因而備受人們 青睞。
[0003]目前,已知一種針對立體聲音頻信號的傳輸技術(shù),編碼端將立體聲信號轉(zhuǎn)換為單 聲道音頻信號和聲道間時間差(ITD,Inter-Channel Time Difference)等參數(shù),分別對其 進(jìn)行編碼并傳輸給解碼端,解碼端得到單聲道音頻信號后,進(jìn)一步根據(jù)ITD等參數(shù)恢復(fù)立 體聲信號,從而,能夠?qū)崿F(xiàn)立體聲信號的低比特高質(zhì)量傳輸。
[0004] 在上述技術(shù)中,編碼端基于單聲道音頻的時域信號的采樣率,能夠確定該采樣率 下ITD參數(shù)的極限值!^,,從而,可以基于該頻域信號,逐子帶在[-τ_,T_]范圍內(nèi)搜索計 算以獲得ITD參數(shù)。
[0005] 但是,上述較大的搜索范圍致現(xiàn)有技術(shù)在頻域內(nèi)確定ITD參數(shù)過程的計算量較 大,增加了編碼端的性能要求,影響了處理效率。
[0006] 因此,希望提供一種技術(shù),能夠在確保ITD參數(shù)準(zhǔn)確性的前提下,減少ITD參數(shù)搜 索計算過程的計算量。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明實施例提供一種確定聲道間時間差參數(shù)的方法和裝置,能夠降低在立體聲 編碼過程中聲道間時間差參數(shù)搜索計算過程的計算量。
[0008] 第一方面,提供了一種確定聲道間時間差參數(shù)的方法,該方法包括:根據(jù)第一聲道 的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),該基準(zhǔn)參數(shù)對應(yīng)于該第一聲道的時域 信號與該第二聲道的時域信號之間的獲取順序,其中,該第一聲道的時域信號及該第二聲 道的時域信號對應(yīng)于同一時段;根據(jù)該基準(zhǔn)參數(shù)和極限值!^.,確定搜索范圍,其中,該極限 值!^.是根據(jù)該第一聲道的時域信號的采樣率確定的,該搜索范圍屬于[_Τ_,0],或該搜索 范圍屬于[0,Τ_];基于該第一聲道的頻域信號及該第二聲道的頻域信號,在該搜索范圍內(nèi) 進(jìn)行搜索處理,以確定與該第一聲道及該第二聲道相對應(yīng)的第一聲道間時間差I(lǐng)TD參數(shù)。
[0009] 結(jié)合第一方面,在第一方面的第一種實現(xiàn)方式中,該根據(jù)第一聲道的時域信號及 第二聲道的時域信號,確定基準(zhǔn)參數(shù),包括:對該第一聲道的時域信號及該第二聲道的時域 信號進(jìn)行互相關(guān)處理,以確定第一互相關(guān)處理值及第二互相關(guān)處理值,其中,該第一互相關(guān) 處理值是該第一聲道的時域信號相對于該第二聲道的時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍 內(nèi)的最大函數(shù)值,該第二互相關(guān)處理值是該第二聲道的時域信號相對于該第一聲道的時域 信號的互相關(guān)函數(shù)在該預(yù)設(shè)范圍內(nèi)的最大函數(shù)值;根據(jù)該第一互相關(guān)處理值及該第二互相 關(guān)處理值之間的大小關(guān)系,確定該基準(zhǔn)參數(shù)。
[0010] 結(jié)合第一方面及其上述實現(xiàn)方式,在第一方面的第二種實現(xiàn)方式中,該基準(zhǔn)參數(shù) 是該第一互相關(guān)處理值及該第二互相關(guān)處理值中較大一方所對應(yīng)的索引值或者該索引值 的相反數(shù)。
[0011] 結(jié)合第一方面及其上述實現(xiàn)方式,在第一方面的第三種實現(xiàn)方式中,該根據(jù)第一 聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),包括:對該第一聲道的時域信號及 該第二聲道的時域信號進(jìn)行峰值檢測處理,以確定第一索引值及第二索引值,其中,該第一 索引值是與該第一聲道的時域信號在預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值,該第二索 引值是與該第二聲道的時域信號在該預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值;根據(jù)該第 一索引值與該第二索引值之間的大小關(guān)系,確定該基準(zhǔn)參數(shù)。
[0012] 結(jié)合第一方面及其上述實現(xiàn)方式,在第一方面的第四種實現(xiàn)方式中,該方法還包 括:基于第二ITD參數(shù),對該第一 ITD參數(shù)進(jìn)行平滑處理,其中,該第一 ITD參數(shù)是第一時段 的ITD參數(shù),該第二ITD參數(shù)是第二時段的ITD參數(shù)的平滑值,該第二時段處于該第一時段 之前。
[0013] 第二方面,提供了一種確定聲道間時間差參數(shù)的裝置,該裝置包括:確定單元,用 于根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),該基準(zhǔn)參數(shù)對應(yīng)于該 第一聲道的時域信號與該第二聲道的時域信號之間的獲取順序,其中,該第一聲道的時域 信號及該第二聲道的時域信號對應(yīng)于同一時段,并根據(jù)該基準(zhǔn)參數(shù)和極限值τ_,確定搜索 范圍,其中,該極限值τ_是根據(jù)該第一聲道的時域信號的采樣率確定的,該搜索范圍屬于 [-τ_,ο],或該搜索范圍屬于[0, τ_];處理單元,用于基于該第一聲道的頻域信號及該第 二聲道的頻域信號,根據(jù)該基準(zhǔn)參數(shù),進(jìn)行搜索處理,以確定與該第一聲道及該第二聲道相 對應(yīng)的第一聲道間時間差I(lǐng)TD參數(shù)。
[0014] 結(jié)合第二方面,在第二方面的第一種實現(xiàn)方式中,該確定單元具體用于對該第一 聲道的時域信號及該第二聲道的時域信號進(jìn)行互相關(guān)處理,以確定第一互相關(guān)處理值及第 二互相關(guān)處理值,并根據(jù)該第一互相關(guān)處理值及該第二互相關(guān)處理值之間的大小關(guān)系,確 定該基準(zhǔn)參數(shù),其中,該第一互相關(guān)處理值是該第一聲道的時域信號相對于該第二聲道的 時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍內(nèi)的最大函數(shù)值,該第二互相關(guān)處理值是該第二聲道的 時域信號相對于該第一聲道的時域信號的互相關(guān)函數(shù)在該預(yù)設(shè)范圍內(nèi)的最大函數(shù)值。
[0015] 結(jié)合第二方面及其上述實現(xiàn)方式,在第二方面的第二種實現(xiàn)方式中,該確定單元 具體用于將該第一互相關(guān)處理值及該第二互相關(guān)處理值中較大一方所對應(yīng)的索引值或者 所述索引值的相反數(shù)確定為該基準(zhǔn)參數(shù)。
[0016] 結(jié)合第二方面及其上述實現(xiàn)方式,在第二方面的第三種實現(xiàn)方式中,該確定單元 具體用于對該第一聲道的時域信號及該第二聲道的時域信號進(jìn)行峰值檢測處理,以確定第 一索引值及第二索引值,并根據(jù)該第一索引值與該第二索引值之間的大小關(guān)系,確定該基 準(zhǔn)參數(shù),其中,該第一索引值是與該第一聲道的時域信號在預(yù)設(shè)范圍內(nèi)的最大幅度值相對 應(yīng)的索引值,該第二索引值是與該第二聲道的時域信號在該預(yù)設(shè)范圍內(nèi)的最大幅度值相對 應(yīng)的索引值。
[0017] 結(jié)合第二方面及其上述實現(xiàn)方式,在第二方面的第四種實現(xiàn)方式中,該處理單元 還用于基于第二ITD參數(shù),對該第一 ITD參數(shù)進(jìn)行平滑處理,其中,該第一 ITD參數(shù)是第一 時段的ITD參數(shù),該第二ITD參數(shù)是第二時段的ITD參數(shù)的平滑值,該第二時段處于該第一 時段之前。
[0018] 根據(jù)本發(fā)明實施例的聲道間時間差參數(shù)的方法和裝置,通過在時域上確定與第一 聲道的時域信號及第二聲道的時域信號之間的獲取順序相對應(yīng)的基準(zhǔn)參數(shù),能夠基于該基 準(zhǔn)參數(shù),確定搜索范圍,并在該搜索范圍內(nèi)從在頻域上進(jìn)行針對該第一聲道的頻域信號及 該第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應(yīng)的聲道間時間 差I(lǐng)TD參數(shù),本發(fā)明實施例中根據(jù)基準(zhǔn)參數(shù)確定的搜索范圍屬于[-τ_,0]或[0,T_],小于 現(xiàn)有技術(shù)中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差I(lǐng)TD參數(shù)的搜索計算量,降 低了對編碼端的性能要求,提高了編碼端的處理效率。
【附圖說明】
[0019] 為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對本發(fā)明實施例中所需要使 用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0020] 圖1是根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的方法的示意性流程圖。
[0021] 圖2是根據(jù)本發(fā)明一實施例的搜索范圍確定過程的示意圖。
[0022] 圖3是根據(jù)本發(fā)明另一實施例的確定搜索范圍確定過程的示意圖。
[0023] 圖4是根據(jù)本發(fā)明再一實施例的確定搜索范圍確定過程的示意圖。
[0024] 圖5是根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的裝置的示意性框圖。
[0025] 圖6是根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的設(shè)備的示意性結(jié)構(gòu)圖。
【具體實施方式】
[0026] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā) 明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施 例,都屬于本發(fā)明保護(hù)的范圍。
[0027] 圖1是示出了本發(fā)明實施例的確定聲道間時間差參數(shù)的方法100的示意性流程 圖,該方法100的執(zhí)行主體可以是傳輸音頻信號的編碼端設(shè)備(也可以稱為,發(fā)送端設(shè)備), 如圖1所示,該方法100包括:
[0028] S110,根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),該基準(zhǔn)參 數(shù)對應(yīng)于該第一聲道的時域信號與該第二聲道的時域信號之間的獲取順序,其中,該第一 聲道的時域信號及該第二聲道的時域信號對應(yīng)于同一時段;
[0029] S120,根據(jù)該基準(zhǔn)參數(shù)和極限值!^.,確定搜索范圍,其中,該極限值!^.是根據(jù)該 第一聲道的時域信號的采樣率確定的,該搜索范圍屬于[_Τ_,0],或該搜索范圍屬于[0, τ_];
[0030] S130,基于該第一聲道的頻域信號及該第二聲道的頻域信號,在該搜索范圍內(nèi)進(jìn) 行搜索處理,以確定與該第一聲道及該第二聲道相對應(yīng)的第一聲道間時間差I(lǐng)TD參數(shù)。
[0031] 本發(fā)明實施例的確定聲道間時間差參數(shù)的方法100可以應(yīng)用于具有至少兩個聲 道的音頻系統(tǒng),在該音頻系統(tǒng)中,通過來自至少兩個聲道(即,包括第一聲道和第二聲道) 的單聲道信號合成立體聲信號,例如,通過來自左聲道(即,第一聲道的一例)的單聲道信 號和來自右聲道(即,第二聲道的一例)的單聲道信號合成立體聲信號。
[0032] 其中,作為傳輸該立體聲信號的方法,可以列舉參數(shù)立體聲(PS)技術(shù),該技術(shù)根 據(jù)空間感知特性,編碼端將立體聲信號轉(zhuǎn)換為單聲道信號和空間感知參數(shù),并分別進(jìn)行編 碼,解碼端得到單聲道音頻后,進(jìn)一步根據(jù)空間參數(shù)恢復(fù)立體聲信號。該技術(shù)能夠?qū)崿F(xiàn)立體 聲信號的低比特高質(zhì)量傳輸。聲道間時間差I(lǐng)TD(ITD,Inter-Channel Time Difference) 參數(shù)是表示聲源水平方位的空間參數(shù),是空間參數(shù)的重要組成部分,本發(fā)明實施例主要涉 及該ITD參數(shù)的確定過程。另外,在本發(fā)明實施例中,根據(jù)ITD參數(shù)對立體聲信號和單聲道 信號進(jìn)行編解碼的過程與現(xiàn)有技術(shù)相似,這里為了避免贅述,省略其詳細(xì)說明。
[0033] 應(yīng)理解,以上列舉的音頻系統(tǒng)所具有的聲道數(shù)量僅為示例性說明,本發(fā)明并未限 定于此,例如,該音頻系統(tǒng)也可以具有三個或三個以上的聲道,并且,能夠通過任意兩個聲 道的單聲道信號合成立體聲信號。以下,為了便于理解,以將該方法100應(yīng)用于具有兩個聲 道(即,左聲道和右聲道)的音頻系統(tǒng)使的處理過程為例,進(jìn)行說明,并且,為了便于區(qū)分, 以左聲道作為第一聲道,以右聲道作為第二聲道,進(jìn)行說明。
[0034] 具體地說,在S110,編碼端設(shè)備可以通過例如,與左聲道相對應(yīng)的麥克風(fēng)等音頻輸 入設(shè)備獲取與左聲道相對應(yīng)的音頻信號,并根據(jù)預(yù)設(shè)的采樣率α (即,第一聲道的時域信 號的采樣率的一例),對該音頻信號進(jìn)行采樣處理,以生成左聲道的時域信號(即,第一聲 道的時域信號的一例,以下,為了便于理解和區(qū)分,記做時域信號#L)。并且,在本發(fā)明實施 例中,該獲取時域信號#L的過程可以與現(xiàn)有技術(shù)相似,這里,為了避免贅述,省略其詳細(xì)說 明。
[0035] 在本發(fā)明實施例中,第一聲道的時域信號的采樣率與第二聲道的時域信號的采樣 率相同,因此,類似地,編碼端設(shè)備可以通過例如,與右聲道相對應(yīng)的麥克風(fēng)等音頻輸入設(shè) 備獲取與右聲道相對應(yīng)的音頻信號,并根據(jù)上述采樣率α,對該音頻信號進(jìn)行采樣處理,以 生成右聲道的時域信號(即,第二聲道的時域信號的一例,以下,為了便于理解和區(qū)分,記 做時域信號#R)。
[0036] 需要說明的是,在本發(fā)明實施例中,時域信號#L與時域信號#R是對應(yīng)同一時段的 時域信號(或者說,在同一時段內(nèi)獲取的時域信號),例如,該時域信號#L與時域信號#R可 以是對應(yīng)同一幀(即,20ms)的時域信號,此情況下,基于時域信號札與時域信號#R能夠獲 得與該一幀信號相對應(yīng)的一個ITD參數(shù)。
[0037] 再例如,該時域信號#L與時域信號#R也可以是對應(yīng)同一幀內(nèi)的同一子幀(即, 10ms或5ms等)的時域信號,此情況下,基于時域信號#L與時域信號#R能夠獲得與該一 幀信號相對應(yīng)的多個ITD參數(shù),例如,如果該時域信號#L與時域信號#R所對應(yīng)的子幀為 l〇ms,則通過該一幀(即,20ms)信號能夠獲得兩個ITD參數(shù)。再例如,如果該時域信號#L 與時域信號#1?所對應(yīng)的子幀為5ms,則通過該一幀(即,20ms)信號能夠獲得四個ITD參數(shù)。
[0038] 應(yīng)理解,以上列舉的時域信號#L與時域信號#R所對應(yīng)的時段的長度僅為示例性 說明,本發(fā)明并未限定于此,可以根據(jù)需要任意變更該時段的長度。
[0039] 其后,編碼端設(shè)備可以根據(jù)該時域信號#L和時域信號#R,確定基準(zhǔn)參數(shù)。其中,該 基準(zhǔn)參數(shù)可以與該時域信號#L和時域信號#R獲取順序(例如,輸入至上述音頻輸入設(shè)備 的先后順序)相對應(yīng),隨后,結(jié)合該基準(zhǔn)參數(shù)的確定過程,對該對應(yīng)關(guān)系進(jìn)行詳細(xì)說明。
[0040] 在本發(fā)明實施例中,可以通過對時域信號#L和時域信號#R進(jìn)行互相關(guān)處理來確 定該基準(zhǔn)參數(shù)(即,方式1),也可以通過搜索時域信號#L和時域信號#R的幅度最大值來確 定該基準(zhǔn)參數(shù)(即,方式2),下面,分別對該方式1和方式2進(jìn)行詳細(xì)說明。
[0041] 方式 1
[0042] 可選地,該根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),包 括:
[0043] 對該第一聲道的時域信號及該第二聲道的時域信號進(jìn)行互相關(guān)處理,以確定第一 互相關(guān)處理值及第二互相關(guān)處理值,其中,該第一互相關(guān)處理值是該第一聲道的時域信號 相對于該第二聲道的時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍內(nèi)的最大函數(shù)值,該第二互相關(guān)處 理值是該第二聲道的時域信號相對于該第一聲道的時域信號的互相關(guān)函數(shù)在該預(yù)設(shè)范圍 內(nèi)的最大函數(shù)值;
[0044] 根據(jù)該第一互相關(guān)處理值及該第二互相關(guān)處理值之間的大小關(guān)系,確定該基準(zhǔn)參 數(shù)。
[0045] 具體地說,在本發(fā)明實施例中,編碼端設(shè)備可以根據(jù)以下式1確定時域信號札相 對于時域信號#R的互相關(guān)函數(shù)c n (i),即:
[0046]
[0047] 其中,T_表示ITD參數(shù)的極限值(或者說,時域信號#L與時域信號#R之間的獲 取時間差的最大值)可以根據(jù)上述采樣率α確定,并且,其確定方法可以與現(xiàn)有技術(shù)相似, 這里為了避免贅述,省略其詳細(xì)說明。x R(j)表示時域信號#R在第j個采樣點處的信號值, xjj+i)表示時域信號#L在第j+i個采樣點處的信號值,Length表示時域信號#R包括的 采樣點的總數(shù)量,或者說,時域信號#R的長度,例如,可以為一個幀的長度(即,20ms)或一 個子幀的長度(例如,l〇ms或5ms等)。
[0048] 并且,編碼端設(shè)備可以確定該互相關(guān)函數(shù)cn(i)的最大值。
[0049] 類似地,編碼端設(shè)備可以根據(jù)以下式2確定時域信號#R相對于時域信號#L的互 相關(guān)函數(shù)c p(i),即: T i>vurrth - 1 - j
[0050]
[0051] 并且,編碼端設(shè)備可以確定該互相關(guān)函數(shù)cp(i)的最大值
[0052] 在本發(fā)明實施例中,編碼端設(shè)備可以根據(jù)與之間的關(guān) 系,通過以下方式1A或方式1B確定基準(zhǔn)參數(shù)的值。
[0053] 方式 1A
[0054] 如圖2所示,如果,,m=,、h⑴K 則編碼端設(shè)備可以確定時域信號 #L是先于時域信號#R獲取的,即,左右聲道之間的ITD參數(shù)為正數(shù),此情況下,可以將基準(zhǔn) 參數(shù)T置為1。
[0055] 從而,在S120的判定過程中,編碼端設(shè)備可以判定該基準(zhǔn)參數(shù)大于0,從而確定搜 索范圍為[0, T_],即,當(dāng)時域信號#L是先于時域信號#R獲取時,ITD參數(shù)為正數(shù),搜索范 圍為[0, T_] ( 即,搜索范圍屬于[0, T_]的一例)。
[0056] 或者,如果,則編碼端設(shè)備可以確定時域信號#L是后 于時域信號#R獲取的,即,左右聲道之間的ITD參數(shù)為負(fù)數(shù),此情況下,可以將基準(zhǔn)參數(shù)T 置為0。
[0057] 從而,在S120的判定過程中,編碼端設(shè)備可以判定該基準(zhǔn)參數(shù)不大于0,從而確定 搜索范圍為[_Τ_,0],即,當(dāng)時域信號#L是后于時域信號#R獲取時,ITD參數(shù)為負(fù)數(shù),搜索 范圍為[-T_,0] ( 即,搜索范圍屬于[_Τ_,0]的一例)。
[0058] 方式 1Β
[0059] 可選地,該基準(zhǔn)參數(shù)是該第一互相關(guān)處理值及該第二互相關(guān)處理值中較大一方所 對應(yīng)的索引值或者索引值的相反數(shù)。
[0060] 具體地說,如圖3所示,如果,則編碼端設(shè)備可以確定 時域信號#L是先于時域信號#R獲取的,即,左右聲道之間的ITD參數(shù)為正數(shù),此情況下,可 以將基準(zhǔn)參數(shù)T置為所對應(yīng)的索引值。
[0061] 從而,在其后的判定過程中,編碼端設(shè)備在判定基準(zhǔn)參數(shù)T大于0之后,可以進(jìn) 一步判定該基準(zhǔn)參數(shù)T是否大于或等并根據(jù)判定結(jié)果確定搜索范圍,例如,當(dāng) T彡T_/2時,搜索范圍為[T_/2,T_](即,搜索范圍屬于[0,T_]的一例)。當(dāng)T < T_/2 時,搜索范圍為[0, T_/2] ( 即,搜索范圍屬于[0, Τ_]的另一例)。
[0062] 或者,如果則編碼端設(shè)備可以確定時域信號虬是后 于時域信號#R獲取的,即,左右聲道之間的ITD參數(shù)為負(fù)數(shù),此情況下,可以將基準(zhǔn)參數(shù)Τ 置為《思所對應(yīng)的索弓丨值的相反數(shù)。
[0063] 從而,在S120的判定過程中,編碼端設(shè)備在判定基準(zhǔn)參數(shù)T小于或等于0之后,可 以進(jìn)一步判定該基準(zhǔn)參數(shù)T是否小于于或等于-T_/2,并根據(jù)判定結(jié)果確定搜索范圍,例 如,當(dāng)Τ < -Τ_/2時,搜索范圍為[-T_,-T_/2] ( SM叟索范圍屬于[_Τ_,0]的一例)。當(dāng) Τ > -Τ_/2時,搜索范圍為[-T_/2,0] ( 即,搜索范圍屬于[_Τ_,0]的另一例)。
[0064] 方式 2
[0065] 可選地,該根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),包 括:
[0066] 對該第一聲道的時域信號及該第二聲道的時域信號進(jìn)行峰值檢測處理,以確定第 一索引值及第二索引值,其中,該第一索引值是與該第一聲道的時域信號在預(yù)設(shè)范圍內(nèi)的 最大幅度值相對應(yīng)的索引值,該第二索引值是與該第二聲道的時域信號在該預(yù)設(shè)范圍內(nèi)的 最大幅度值相對應(yīng)的索引值;
[0067] 根據(jù)該第一索引值與該第二索引值之間的大小關(guān)系,確定該基準(zhǔn)參數(shù)。
[0068] 具體地說,在本發(fā)明實施例中,編碼端設(shè)備可以檢測時域信號札的幅度值(記做: L(j))最大值max(L(j)),j e [0,Length_l],并記錄該max(L(j))所對應(yīng)的索引值口1(^,其 中,Length表示時域信號#L包括的采樣點的總數(shù)量。
[0069] 并且,編碼端設(shè)備可以檢測時域信號#1?的幅度值(記做:R(j))最大值 max(R(j)),j e [0,Length_l],并記錄該 max(R(j))所對應(yīng)的索引值 pright,其中,Length 表 示時域信號#R包括的采樣點的總數(shù)量。
[0070] 其后,編碼端設(shè)備可以判定plrft與p "ght之間的大小關(guān)系。
[0071] 如圖4所不,如果pleft^= p hght,則編碼端設(shè)備可以確定時域彳目號#L是先于時域{目 號#R獲取的,即,左右聲道之間的ITD參數(shù)為正數(shù),此情況下,可以將基準(zhǔn)參數(shù)T置為1。
[0072] 從而,在S120的判定過程中,編碼端設(shè)備可以判定該基準(zhǔn)參數(shù)大于0,從而確定搜 索范圍為[0, T_],即,當(dāng)時域信號#L是先于時域信號#R獲取時,ITD參數(shù)為正數(shù),搜索范 圍為[0, T_] ( 即,搜索范圍屬于[0, T_]的一例)。
[0073] 或者,如果pleft< p hght,則編碼端設(shè)備可以確定時域?目號是后于時域彳目號#尺獲 取的,即,左右聲道之間的ITD參數(shù)為負(fù)數(shù),此情況下,可以將基準(zhǔn)參數(shù)T置為0。
[0074] 從而,在S120的判定過程中,編碼端設(shè)備可以判定該基準(zhǔn)參數(shù)不大于0,從而確定 搜索范圍為[_Τ_,0],即,當(dāng)時域信號#L是后于時域信號#R獲取時,ITD參數(shù)為負(fù)數(shù),搜索 范圍為[-T_,0] ( 即,搜索范圍屬于[_Τ_,0]的一例)。
[0075] 在S130,編碼端設(shè)備可以對時域信號#L進(jìn)行時頻變換處理以獲得左聲道的頻域 信號(即,第一聲道的頻域信號的一例,以下,為了便于理解和區(qū)分,記做頻域信號札)???以對時域信號#1?進(jìn)行時頻變換處理以獲得右聲道的頻域信號(即,第二聲道的頻域信號的 一例,以下,為了便于理解和區(qū)分,記做頻域信號#R)
[0076] 例如,在本發(fā)明實施例中,可以采用快速傅氏變換(FFT,F(xiàn)ast Fourier Transformation)技術(shù),基于以下式3,進(jìn)行時頻變換處理。
[0077]
n:-〇^
[0078] 其中,X(k)表示頻域信號,F(xiàn)FT_LENGTH表示時頻變換長度。x(n)表示時域信號 (即,時域信號#L或時域信號#R),Length表示時域信號包括的采樣點的總數(shù)量。
[0079] 應(yīng)理解,以上列舉的時頻變換處理的過程僅為示例性說明,本發(fā)明并不限定于此, 該視頻變換處理的方法和過程可以與現(xiàn)有技術(shù)相似,例如,還可以采用修正離散余弦變換 (MDCT, Modified Discrete Cosine Transform)等技術(shù)。
[0080] 從而,編碼端設(shè)備可以在如上所述確定的搜索范圍內(nèi),對如上所述確定的頻域信 號#L和頻域信號#R進(jìn)行搜索處理,以確定左聲道與右聲道之間的ITD參數(shù),例如,可以列 舉以下搜索處理的過程:
[0081] 首先,編碼端設(shè)備可以根據(jù)預(yù)設(shè)的帶寬A,將頻域信號的FFT_LENGTH個頻點劃分 為N subbandf (例如,1個)子帶,其中,對于第k個子帶A k,其包含的頻點為Ak A b彡A k-l,
[0082] 在上述搜索范圍內(nèi),根據(jù)以下式4計算頻域信號#L的相關(guān)函數(shù)mag (j)
[0083]
[0084] 其中,Xjb)表示頻域信號#L在第b個頻點的信號值,XR (b)表示頻域信號#R在第 b個頻點的信號值,F(xiàn)FT_LENGTH表示時頻變換長度,j的取值范圍是如上所述確定的搜索范 圍,為了便于理解和說明,將該搜索范圍記做[a,b]。
[0085] 則第k個子帶的ITD參數(shù)值為7=噸,,("喂(/)),即mag(j)的最大值對應(yīng)的 索引值。
[0086] 由此,可以得到左聲道與右聲道之間的一個或多個(根據(jù)如上所述確定的子帶的 數(shù)量相對應(yīng))ITD參數(shù)值。
[0087] 其后,編碼端設(shè)備還可以對上述ITD參數(shù)值進(jìn)行量化處理等,并將處理后的ITD參 數(shù)值以及對左右聲道的信號進(jìn)行例如下混頻等處理得到的單聲道信號發(fā)送給解碼端設(shè)備 (或者說,接收端設(shè)備)。
[0088] 解碼端設(shè)備可以根據(jù)單聲道音頻信號和ITD參數(shù)值,恢復(fù)出立體聲音頻信號。
[0089] 可選地,該方法還包括:
[0090] 基于第二ITD參數(shù),對該第一 ITD參數(shù)進(jìn)行平滑處理,其中,該第一 ITD參數(shù)是第 一時段的ITD參數(shù),該第二ITD參數(shù)是第二時段的ITD參數(shù)的平滑值,該第二時段處于該第 一時段之前。
[0091] 具體地說,在本發(fā)明實施例中,在對ITD參數(shù)值進(jìn)行量化處理等之前,編碼端設(shè)備 還可以對如上所述或缺的ITD參數(shù)值進(jìn)行平滑處理,作為示例而非限定,編碼端設(shè)備可以 根據(jù)以下式5進(jìn)行該平滑處理:
[0092] Tsm (k) = w1*Tsm[ 11 (k) +w2*T (k)式 5
[0093] 其中,Tsni(k)表示第k個幀或第k個子幀所對應(yīng)的平滑處理后的ITD參數(shù)值,T sni[ 1] 表示第k-1個幀或第k-1個子幀所對應(yīng)的平滑處理后的ITD參數(shù)值,T(k)表示第k個幀或 第k個子幀所對應(yīng)的未經(jīng)平滑處理的ITD參數(shù)值, Wl、w2為平滑因子,w p w2可以設(shè)置為常 數(shù),或者Wl、w2也可以根據(jù)Tsni [14PT(k)的差值設(shè)置,只要滿足Wl+w2=l即可。另外,當(dāng)k =1時,T sni[1]可以為預(yù)設(shè)的數(shù)值。
[0094] 需要說明的是,在本發(fā)明實施例的確定聲道間時間差參數(shù)的方法中,上述平滑處 理可以由編碼端設(shè)備執(zhí)行,也可以由解碼端設(shè)備執(zhí)行,本發(fā)明并未特別限定,即,編碼端設(shè) 備也可以不進(jìn)行上述平滑處理而將如上所述獲得的ITD參數(shù)值直接發(fā)送給解碼端設(shè)備,并 由解碼端設(shè)備對該ITD參數(shù)值進(jìn)行平滑處理,并且,該解碼端設(shè)備所進(jìn)行的平滑處理的方 法和過程可以與上述解碼端設(shè)備所進(jìn)行的平滑處理的方法和過程相似,這里,為了避免贅 述,省略其詳細(xì)說明。
[0095] 根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的方法,通過在時域上確定與第一聲 道的時域信號及第二聲道的時域信號之間的獲取順序相對應(yīng)的基準(zhǔn)參數(shù),能夠基于該基準(zhǔn) 參數(shù),確定搜索范圍,并在該搜索范圍內(nèi)從在頻域上進(jìn)行針對該第一聲道的頻域信號及該 第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應(yīng)的聲道間時間差 ITD參數(shù),本發(fā)明實施例中根據(jù)基準(zhǔn)參數(shù)確定的搜索范圍屬于[_Τ_,0]或[0,T_],小于現(xiàn) 有技術(shù)中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差I(lǐng)TD參數(shù)的搜索計算量,降低 了對編碼端的性能要求,提高了編碼端的處理效率。
[0096] 上文中,結(jié)合圖1至圖4,詳細(xì)描述了根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù) 的方法,下面,將結(jié)合圖5,詳細(xì)描述根據(jù)本發(fā)明實施例的根據(jù)本發(fā)明實施例的確定聲道間 時間差參數(shù)的裝置。
[0097] 圖5示出了根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的裝置200的示意性框 圖。如圖5所示,該裝置200包括:
[0098] 確定單元210,用于根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參 數(shù),該基準(zhǔn)參數(shù)對應(yīng)于該第一聲道的時域信號與該第二聲道的時域信號之間的獲取順序, 其中,該第一聲道的時域信號及該第二聲道的時域信號對應(yīng)于同一時段,并根據(jù)該基準(zhǔn)參 數(shù)和極限值T_,確定搜索范圍,其中,該極限值T_是根據(jù)該第一聲道的時域信號的采樣率 確定的,該搜索范圍屬于[_Τ_,0],或該搜索范圍屬于[0,Τ_];
[0099] 處理單元220,用于基于該第一聲道的頻域信號及該第二聲道的頻域信號,根據(jù)該 基準(zhǔn)參數(shù),進(jìn)行搜索處理,以確定與該第一聲道及該第二聲道相對應(yīng)的第一聲道間時間差 ITD參數(shù)。
[0100] 可選地,該確定單元210具體用于對該第一聲道的時域信號及該第二聲道的時域 信號進(jìn)行互相關(guān)處理,以確定第一互相關(guān)處理值及第二互相關(guān)處理值,并根據(jù)該第一互相 關(guān)處理值及該第二互相關(guān)處理值之間的大小關(guān)系,確定該基準(zhǔn)參數(shù),其中,該第一互相關(guān)處 理值是該第一聲道的時域信號相對于該第二聲道的時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍內(nèi) 的最大函數(shù)值,該第二互相關(guān)處理值是該第二聲道的時域信號相對于該第一聲道的時域信 號的互相關(guān)函數(shù)在該預(yù)設(shè)范圍內(nèi)的最大函數(shù)值。
[0101] 可選地,該確定單元210具體用于將該第一互相關(guān)處理值及該第二互相關(guān)處理值 中較大一方所對應(yīng)的索引值或者該索引值的相反數(shù)確定為該基準(zhǔn)參數(shù)。
[0102] 可選地,該確定單元210具體用于對該第一聲道的時域信號及該第二聲道的時域 信號進(jìn)行峰值檢測處理,以確定第一索引值及第二索引值,并根據(jù)該第一索引值與該第二 索引值之間的大小關(guān)系,確定該基準(zhǔn)參數(shù),其中,該第一索引值是與該第一聲道的時域信號 在預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值,該第二索引值是與該第二聲道的時域信號在 該預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值。
[0103] 可選地,該處理單元220還用于基于第二ITD參數(shù),對該第一 ITD參數(shù)進(jìn)行平滑處 理,其中,該第一 ITD參數(shù)是第一時段的ITD參數(shù),該第二ITD參數(shù)是第二時段的ITD參數(shù) 的平滑值,該第二時段處于該第一時段之前。
[0104] 根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的裝置200作為本發(fā)明實施例的確 定聲道間時間差參數(shù)的方法100的實施主體,可對應(yīng)于本發(fā)明實施例的方法中的編碼端設(shè) 備,并且,該確定聲道間時間差參數(shù)的裝置200中的各單元及模塊和上述其他操作和/或功 能分別為了實現(xiàn)圖1中的方法100的相應(yīng)流程,為了簡潔,在此不再贅述。
[0105] 根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的裝置,通過在時域上確定與第一聲 道的時域信號及第二聲道的時域信號之間的獲取順序相對應(yīng)的基準(zhǔn)參數(shù),能夠基于該基準(zhǔn) 參數(shù),確定搜索范圍,并在該搜索范圍內(nèi)從在頻域上進(jìn)行針對該第一聲道的頻域信號及該 第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應(yīng)的聲道間時間差 ITD參數(shù),本發(fā)明實施例中根據(jù)基準(zhǔn)參數(shù)確定的搜索范圍屬于[-Τ_,0]或[0,Τ_],小于現(xiàn) 有技術(shù)中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差I(lǐng)TD參數(shù)的搜索計算量,降低 了對編碼端的性能要求,提高了編碼端的處理效率。
[0106] 上文中,結(jié)合圖1至圖4,詳細(xì)描述了根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù) 的方法,下面,將結(jié)合圖6,詳細(xì)描述根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的設(shè)備。
[0107] 圖6示出了根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的設(shè)備300的示意性框 圖。如圖6所示,該設(shè)備300可以包括:
[0108] 總線 310;
[0109] 與該總線相連的處理器320 ;
[0110] 與該總線相連的存儲器330 ;
[0111] 其中,該處理器320通過該總線310,調(diào)用該存儲器330中存儲的程序,以用于根據(jù) 第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),該基準(zhǔn)參數(shù)對應(yīng)于該第一聲 道的時域信號與該第二聲道的時域信號之間的獲取順序,其中,該第一聲道的時域信號及 該第二聲道的時域信號對應(yīng)于同一時段;
[0112] 用于根據(jù)該基準(zhǔn)參數(shù)和極限值T_,確定搜索范圍,其中,該極限值T_是根據(jù)該 第一聲道的時域信號的采樣率確定的,該搜索范圍屬于[-τ_,0],或該搜索范圍屬于[0, τ_];
[0113] 用于基于該第一聲道的頻域信號及該第二聲道的頻域信號,在該搜索范圍內(nèi)進(jìn)行 搜索處理,以確定與該第一聲道及該第二聲道相對應(yīng)的第一聲道間時間差I(lǐng)TD參數(shù)。
[0114] 可選地,該處理器320具體用于對該第一聲道的時域信號及該第二聲道的時域信 號進(jìn)行互相關(guān)處理,以確定第一互相關(guān)處理值及第二互相關(guān)處理值,其中,該第一互相關(guān)處 理值是該第一聲道的時域信號相對于該第二聲道的時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍內(nèi) 的最大函數(shù)值,該第二互相關(guān)處理值是該第二聲道的時域信號相對于該第一聲道的時域信 號的互相關(guān)函數(shù)在該預(yù)設(shè)范圍內(nèi)的最大函數(shù)值;
[0115] 用于根據(jù)該第一互相關(guān)處理值及該第二互相關(guān)處理值之間的大小關(guān)系,確定該基 準(zhǔn)參數(shù)。
[0116] 可選地,該基準(zhǔn)參數(shù)是該第一互相關(guān)處理值及該第二互相關(guān)處理值中較大一方所 對應(yīng)的索引值或者該索引值的相反數(shù)。
[0117] 可選地,該處理器320具體用于對該第一聲道的時域信號及該第二聲道的時域信 號進(jìn)行峰值檢測處理,以確定第一索引值及第二索引值,其中,該第一索引值是與該第一聲 道的時域信號在預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值,該第二索引值是與該第二聲道 的時域信號在該預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值;
[0118] 用于根據(jù)該第一索引值與該第二索引值之間的大小關(guān)系,確定該基準(zhǔn)參數(shù)。
[0119] 可選地,該處理器320還用于基于第二ITD參數(shù),對該第一 ITD參數(shù)進(jìn)行平滑處 理,其中,該第一 ITD參數(shù)是第一時段的ITD參數(shù),該第二ITD參數(shù)是第二時段的ITD參數(shù) 的平滑值,該第二時段處于該第一時段之前。
[0120] 在本發(fā)明實施例中,設(shè)備300的各個組件通過總線310耦合在一起,其中,總線310 除包括數(shù)據(jù)總線之外,還包括電源總線、控制總線和狀態(tài)信號總線。但是為了清楚明起見, 在圖中將各種總線都標(biāo)為總線310。
[0121] 處理器320可以實現(xiàn)或者執(zhí)行本發(fā)明方法實施例中的公開的各步驟及邏輯框圖。 處理器320可以是微處理器或者該處理器也可以是任何常規(guī)的處理器,解碼器等。結(jié)合本 發(fā)明實施例所公開的方法的步驟可以直接體現(xiàn)為硬件處理器執(zhí)行完成,或者用解碼處理器 中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī)存儲器,閃存、只讀存儲器,可 編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領(lǐng)域成熟的存儲介質(zhì)中。該存儲 介質(zhì)位于存儲器330,處理器讀取存儲器330中的信息,結(jié)合其硬件完成上述方法的步驟。
[0122] 應(yīng)理解,在本發(fā)明實施例中,該處理器320可以是中央處理單元(Central Processing Unit,簡稱為"CPU"),該處理器320還可以是其他通用處理器、數(shù)字信號處理 器(DSP)、專用集成電路(ASIC)、現(xiàn)成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立 門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可 以是任何常規(guī)的處理器等。
[0123] 該存儲器330可以包括只讀存儲器和隨機(jī)存取存儲器,并向處理器320提供指令 和數(shù)據(jù)。存儲器330的一部分還可以包括非易失性隨機(jī)存取存儲器。例如,存儲器330還 可以存儲設(shè)備類型的信息。
[0124] 在實現(xiàn)過程中,上述方法的各步驟可以通過處理器320中的硬件的集成邏輯電路 或者軟件形式的指令完成。結(jié)合本發(fā)明實施例所公開的方法的步驟可以直接體現(xiàn)為硬件處 理器執(zhí)行完成,或者用處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī) 存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領(lǐng) 域成熟的存儲介質(zhì)中。
[0125] 根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的設(shè)備300作為本發(fā)明實施例的確 定聲道間時間差參數(shù)的方法100的實施主體,可對應(yīng)于本發(fā)明實施例的方法中的編碼端設(shè) 備,并且,該確定聲道間時間差參數(shù)的設(shè)備300中的各單元及模塊和上述其他操作和/或功 能分別為了實現(xiàn)圖1中的方法100的相應(yīng)流程,為了簡潔,在此不再贅述。
[0126] 根據(jù)本發(fā)明實施例的確定聲道間時間差參數(shù)的設(shè)備,通過在時域上確定與第一聲 道的時域信號及第二聲道的時域信號之間的獲取順序相對應(yīng)的基準(zhǔn)參數(shù),能夠基于該基準(zhǔn) 參數(shù),確定搜索范圍,并在該搜索范圍內(nèi)從在頻域上進(jìn)行針對該第一聲道的頻域信號及該 第二聲道的頻域信號的搜索處理,以確定該第一聲道及該第二聲道相對應(yīng)的聲道間時間差 ITD參數(shù),本發(fā)明實施例中根據(jù)基準(zhǔn)參數(shù)確定的搜索范圍屬于[_Τ_,0]或[0,T_],小于現(xiàn) 有技術(shù)中的搜索范圍[_Τ_,Τ_],從而能夠降低聲道間時間差I(lǐng)TD參數(shù)的搜索計算量,降低 了對編碼端的性能要求,提高了編碼端的處理效率。應(yīng)理解,在本發(fā)明的各種實施例中,上 述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在 邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。
[0127] 本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單 元及算法步驟,能夠以電子硬件、或者計算機(jī)軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟 以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員 可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出 本發(fā)明的范圍。
[0128] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、 裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
[0129] 在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以 通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件 可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或 討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦 合或通信連接,可以是電性,機(jī)械或其它的形式。
[0130] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目 的。
[0131] 另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。
[0132] 所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以 存儲在一個計算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說 對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計 算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個 人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。 而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取 存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0133] 以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項】
1. 一種確定聲道間時間差參數(shù)的方法,其特征在于,所述方法包括: 根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),所述基準(zhǔn)參數(shù)對應(yīng) 于所述第一聲道的時域信號與所述第二聲道的時域信號之間的獲取順序,其中,所述第一 聲道的時域信號及所述第二聲道的時域信號對應(yīng)于同一時段; 根據(jù)所述基準(zhǔn)參數(shù)和極限值τ_,確定搜索范圍,其中,所述極限值τ_是根據(jù)所述第 一聲道的時域信號的采樣率確定的,所述搜索范圍屬于[-τ_,0],或所述搜索范圍屬于[0, τ_]; 基于所述第一聲道的頻域信號及所述第二聲道的頻域信號,在所述搜索范圍內(nèi)進(jìn)行搜 索處理,以確定與所述第一聲道及所述第二聲道相對應(yīng)的第一聲道間時間差I(lǐng)TD參數(shù)。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)第一聲道的時域信號及第二聲 道的時域信號,確定基準(zhǔn)參數(shù),包括: 對所述第一聲道的時域信號及所述第二聲道的時域信號進(jìn)行互相關(guān)處理,以確定第一 互相關(guān)處理值及第二互相關(guān)處理值,其中,所述第一互相關(guān)處理值是所述第一聲道的時域 信號相對于所述第二聲道的時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍內(nèi)的最大函數(shù)值,所述第二 互相關(guān)處理值是所述第二聲道的時域信號相對于所述第一聲道的時域信號的互相關(guān)函數(shù) 在所述預(yù)設(shè)范圍內(nèi)的最大函數(shù)值; 根據(jù)所述第一互相關(guān)處理值及所述第二互相關(guān)處理值之間的大小關(guān)系,確定所述基準(zhǔn) 參數(shù)。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基準(zhǔn)參數(shù)是所述第一互相關(guān)處理值 及所述第二互相關(guān)處理值中較大一方所對應(yīng)的索引值或者所述索引值的相反數(shù)。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)第一聲道的時域信號及第二聲 道的時域信號,確定基準(zhǔn)參數(shù),包括: 對所述第一聲道的時域信號及所述第二聲道的時域信號進(jìn)行峰值檢測處理,以確定第 一索引值及第二索引值,其中,所述第一索引值是與所述第一聲道的時域信號在預(yù)設(shè)范圍 內(nèi)的最大幅度值相對應(yīng)的索引值,所述第二索引值是與所述第二聲道的時域信號在所述預(yù) 設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引值; 根據(jù)所述第一索引值與所述第二索引值之間的大小關(guān)系,確定所述基準(zhǔn)參數(shù)。5. 根據(jù)權(quán)利要求1至4中任一項所述的方法,其特征在于,所述方法還包括: 基于第二ITD參數(shù),對所述第一 ITD參數(shù)進(jìn)行平滑處理,其中,所述第一 ITD參數(shù)是第 一時段的ITD參數(shù),所述第二ITD參數(shù)是第二時段的ITD參數(shù)的平滑值,所述第二時段處于 所述第一時段之前。6. -種確定聲道間時間差參數(shù)的裝置,其特征在于,所述裝置包括: 確定單元,用于根據(jù)第一聲道的時域信號及第二聲道的時域信號,確定基準(zhǔn)參數(shù),所述 基準(zhǔn)參數(shù)對應(yīng)于所述第一聲道的時域信號與所述第二聲道的時域信號之間的獲取順序,其 中,所述第一聲道的時域信號及所述第二聲道的時域信號對應(yīng)于同一時段,并根據(jù)所述基 準(zhǔn)參數(shù)和極限值Τ_,確定搜索范圍,其中,所述極限值Τ_是根據(jù)所述第一聲道的時域信號 的采樣率確定的,所述搜索范圍屬于[-Τ_,0],或所述搜索范圍屬于[0,Τ_]; 處理單元,用于基于所述第一聲道的頻域信號及所述第二聲道的頻域信號,根據(jù)所述 基準(zhǔn)參數(shù),進(jìn)行搜索處理,以確定與所述第一聲道及所述第二聲道相對應(yīng)的第一聲道間時 間差I(lǐng)TD參數(shù)。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述確定單元具體用于對所述第一聲道 的時域信號及所述第二聲道的時域信號進(jìn)行互相關(guān)處理,以確定第一互相關(guān)處理值及第二 互相關(guān)處理值,并根據(jù)所述第一互相關(guān)處理值及所述第二互相關(guān)處理值之間的大小關(guān)系, 確定所述基準(zhǔn)參數(shù),其中,所述第一互相關(guān)處理值是所述第一聲道的時域信號相對于所述 第二聲道的時域信號的互相關(guān)函數(shù)在預(yù)設(shè)范圍內(nèi)的最大函數(shù)值,所述第二互相關(guān)處理值是 所述第二聲道的時域信號相對于所述第一聲道的時域信號的互相關(guān)函數(shù)在所述預(yù)設(shè)范圍 內(nèi)的最大函數(shù)值。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述確定單元具體用于將所述第一互相 關(guān)處理值及所述第二互相關(guān)處理值中較大一方所對應(yīng)的索引值或者所述索引值的相反數(shù) 確定為所述基準(zhǔn)參數(shù)。9. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述確定單元具體用于對所述第一聲道 的時域信號及所述第二聲道的時域信號進(jìn)行峰值檢測處理,以確定第一索引值及第二索引 值,并根據(jù)所述第一索引值與所述第二索引值之間的大小關(guān)系,確定所述基準(zhǔn)參數(shù),其中, 所述第一索引值是與所述第一聲道的時域信號在預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng)的索引 值,所述第二索引值是與所述第二聲道的時域信號在所述預(yù)設(shè)范圍內(nèi)的最大幅度值相對應(yīng) 的索引值。10. 根據(jù)權(quán)利要求6至9中任一項所述的裝置,其特征在于,所述處理單元還用于基于 第二ITD參數(shù),對所述第一 ITD參數(shù)進(jìn)行平滑處理,其中,所述第一 ITD參數(shù)是第一時段的 ITD參數(shù),所述第二ITD參數(shù)是第二時段的ITD參數(shù)的平滑值,所述第二時段處于所述第一 時段之前。
【文檔編號】G10L25/03GK106033671SQ201510101315
【公開日】2016年10月19日
【申請日】2015年3月9日
【發(fā)明人】張興濤, 苗磊
【申請人】華為技術(shù)有限公司