立體聲相位參數(shù)的編碼方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息技術(shù)領(lǐng)域,特別涉及一種立體聲相位參數(shù)的編碼方法及裝置。
【背景技術(shù)】
[0002] 隨著人們物質(zhì)生活水平的不斷提高,人們對(duì)音頻效果的要求越來越高。與單聲道 音頻相比,立體聲音頻具有各聲源的方位感和分布感,能夠提高音頻信息的清晰度,因此立 體聲音頻可以更好地滿足人們對(duì)音頻效果的需求。
[0003] 目前,獲取立體聲音頻信號(hào)時(shí),通過提取Global(全局)參數(shù),根據(jù)Global參數(shù)恢復(fù) 立體聲相位信息。其中,Global 參數(shù)包括6_110(61<^&1 Inter-Channel Time Difference, 群時(shí)延)&G_IPD (Global Inter-Channel Phase Difference,群相位)。
[0004] 然而,通過提取Global參數(shù)直接恢復(fù)立體聲相位信息,提取的G_ITD及G_iro準(zhǔn) 確度較低,無法根據(jù)G_ITD及G_iro恢復(fù)原始立體聲相位信息,從而導(dǎo)致立體聲音頻信息的 效果較差。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實(shí)施例提供一種立體聲相位參數(shù)的編碼方法及裝置,可以提高立體聲音頻 信息的效果。
[0006] 本發(fā)明實(shí)施例采用的技術(shù)方案為:
[0007] 第一方面,本發(fā)明提實(shí)施例供一種立體聲相位參數(shù)的編碼方法,包括:
[0008] 獲取當(dāng)前幀的立體聲全局相位參數(shù);
[0009] 確定所述當(dāng)前幀的立體聲全局相位參數(shù)的值;
[0010] 根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果,對(duì)所述當(dāng)前幀的立體聲 全局相位參數(shù)的值進(jìn)行調(diào)整;
[0011] 對(duì)調(diào)整后的當(dāng)前幀的立體聲全局相位參數(shù)的值進(jìn)行編碼。
[0012] 在第一方面的第一種實(shí)現(xiàn)方式中,所述根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的 值的確定結(jié)果,對(duì)所述當(dāng)前幀的立體聲全局相位參數(shù)的值進(jìn)行調(diào)整具體包括:
[0013] 獲取所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差;
[0014] 根據(jù)所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差,計(jì)算所述當(dāng)前幀的各個(gè)子帶的聲道 間時(shí)間差的絕對(duì)值均值;
[0015] 根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果以及所述當(dāng)前幀的各個(gè) 子帶的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的立體聲全局相位參數(shù)的值進(jìn)行調(diào)整。
[0016] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,在第一方面的第二種實(shí)現(xiàn)方式 中,在所述當(dāng)前幀不是數(shù)據(jù)流的第一個(gè)數(shù)據(jù)幀時(shí),所述根據(jù)所述當(dāng)前幀的立體聲全局相位 參數(shù)的值的確定結(jié)果以及所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng) 前中貞的立體聲全局相位參數(shù)的值進(jìn)行調(diào)整前進(jìn)一步包括:
[0017] 對(duì)所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差的絕對(duì)值均值進(jìn)行幀間平滑處理,獲取 所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值;
[0018] 所述根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果以及所述當(dāng)前幀的 各個(gè)子帶的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的立體聲全局相位參數(shù)的值進(jìn)行調(diào) 整具體包括:
[0019] 根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果以及所述當(dāng)前幀的各個(gè) 子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的立體聲全局相位參數(shù)的 值進(jìn)行調(diào)整。
[0020] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,在第一方面的第三種實(shí)現(xiàn)方式中,所述立體聲全局相位參數(shù)包括群時(shí)延G_ITD參數(shù);
[0021] 所述根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果以及所述當(dāng)前幀的 各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的立體聲全局相位參 數(shù)的值進(jìn)行調(diào)整包括:
[0022] 在所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果為所述G_ITD參數(shù)的值不 為〇時(shí),根據(jù)所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述 當(dāng)前幀的G_ITD參數(shù)的值進(jìn)行調(diào)整。
[0023] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,在第一方面的第四種實(shí)現(xiàn)方式中,所述根據(jù)所述當(dāng)前 幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的G_ITD參數(shù)的 值進(jìn)行調(diào)整具體為:
[0024] 根據(jù)公式|6_打0'|=€&(:1\|6_打0|+€&〇2\打0_8111,對(duì)所述當(dāng)前幀的6_幾0參數(shù) 的值的絕對(duì)值進(jìn)行調(diào)整,其中,|G_ITD' I為調(diào)整之后的G_ITD參數(shù)的值的絕對(duì)值,|G_ITD 為G_ITD參數(shù)的值的絕對(duì)值,ITD_sm為所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間 差的絕對(duì)值均值,facl與fac2為平滑因子,并且facl>0, fac2>0, facl+fac2=l。
[0025] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,在第一方面的第五 種實(shí)現(xiàn)方式中,fac 1=0. 5。
[0026] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,或者第一方面的第 五種實(shí)現(xiàn)方式,在第一方面的第六種實(shí)現(xiàn)方式中,所述立體聲全局相位參數(shù)包括群時(shí)延G_ ITD參數(shù)和群相位G_IH)參數(shù);
[0027] 所述根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果以及所述當(dāng)前幀的 各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的立體聲全局相位參 數(shù)的值進(jìn)行調(diào)整包括:
[0028] 在所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果為所述G_ITD參數(shù)的值為0 時(shí),根據(jù)所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前 幀的G_IH)參數(shù)的值進(jìn)行調(diào)整。
[0029] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,或者第一方面的第 五種實(shí)現(xiàn)方式,或者第一方面的第六種實(shí)現(xiàn)方式,在第一方面的第七種實(shí)現(xiàn)方式中,在所述 當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果為所述G_ITD參數(shù)的值為0,且所述當(dāng)前幀 的G_iro參數(shù)的值不為〇時(shí),所述根據(jù)所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間 差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的G_iro參數(shù)的值進(jìn)行調(diào)整具體包括:
[0030] 根據(jù)公式 I G_IPD' I =fac3 X I G_IPD I +fac4 X IPD_sm,對(duì)所述 G_IPD 參數(shù)的值的 絕對(duì)值進(jìn)行調(diào)整,其中,|G_IPD' I為調(diào)整之后的G_iro參數(shù)的值的絕對(duì)值,|G_IPD|為6_ Iro參數(shù)的值的絕對(duì)值,fac3與fac4為平滑因子,并且fac3>0, fac4>0, fac3+fac4=l, 2πΚ χ ITD sm IPD sm=嚇丁匕四,F(xiàn)FT_LEN為變換長(zhǎng)度,K為頻點(diǎn)值,ITD_sm為所述當(dāng)前幀的各 個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,IPD_sm為所述當(dāng)前幀的各個(gè)子帶的平 滑處理后的聲道間相位差的絕對(duì)值均值。
[0031] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,或者第一方面的第 五種實(shí)現(xiàn)方式,或者第一方面的第六種實(shí)現(xiàn)方式,或者第一方面的第七種實(shí)現(xiàn)方式,在第一 方面的第八種實(shí)現(xiàn)方式中,fac3=0. 75。
[0032] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,或者第一方面的第 五種實(shí)現(xiàn)方式,或者第一方面的第六種實(shí)現(xiàn)方式,或者第一方面的第七種實(shí)現(xiàn)方式,或者第 一方面的第八種實(shí)現(xiàn)方式,在第一方面的第九種實(shí)現(xiàn)方式中,在所述當(dāng)前幀的立體聲全局 相位參數(shù)的值的確定結(jié)果為所述G_ITD參數(shù)的值為0,且所述當(dāng)前幀的G_IH)參數(shù)的值為 〇時(shí),所述根據(jù)所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述 當(dāng)前幀的G_IH)參數(shù)的值進(jìn)行調(diào)整具體包括:
[0033] 將所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間相位差的絕對(duì)值均值作為所述 當(dāng)前幀的G_iro參數(shù)的絕對(duì)值,將所述當(dāng)前幀的前一幀的G_iro參數(shù)的符號(hào)作為所述當(dāng)前 幀的G_iro參數(shù)的符號(hào)。
[0034] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,或者第一方面的第 五種實(shí)現(xiàn)方式,或者第一方面的第六種實(shí)現(xiàn)方式,或者第一方面的第七種實(shí)現(xiàn)方式,或者第 一方面的第八種實(shí)現(xiàn)方式,或者第一方面的第九種實(shí)現(xiàn)方式,在第一方面的第十種實(shí)現(xiàn)方 式中,所述對(duì)所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差的絕對(duì)值均值進(jìn)行幀間平滑處理,獲 取所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值包括:
[0035] 根據(jù)公式 ITD_sm (k) =f ac5 X ITD_sm (k-1) +f ac6 X ITD 進(jìn)行幀間平滑處理,其中, ITD_sm(k)為所述當(dāng)前幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值,ITD_ sm(k-l)為所述當(dāng)前幀的前一幀的各個(gè)子帶的平滑處理后的聲道間時(shí)間差的絕對(duì)值均值, fac5 與 fac6 為平滑因子,并且 fac5>0, fac6>0, fac5+fac6=l。
[0036] 結(jié)合第一方面或者第一方面的第一種實(shí)現(xiàn)方式,或者第一方面的第二種實(shí)現(xiàn)方 式,或者第一方面的第三種實(shí)現(xiàn)方式,或者第一方面的第四種實(shí)現(xiàn)方式,或者第一方面的第 五種實(shí)現(xiàn)方式,或者第一方面的第六種實(shí)現(xiàn)方式,或者第一方面的第七種實(shí)現(xiàn)方式,或者第 一方面的第八種實(shí)現(xiàn)方式,或者第一方面的第九種實(shí)現(xiàn)方式,或者第一方面的第十種實(shí)現(xiàn) 方式,在第一方面的第i 種實(shí)現(xiàn)方式中,fac5=0. 9844。
[0037] 第二方面,本發(fā)明實(shí)施例提供一種立體聲相位參數(shù)的編碼裝置,包括:
[0038] 獲取單元,用于獲取當(dāng)前幀的立體聲全局相位參數(shù);
[0039] 確定單元,用于確定所述獲取單元獲取的所述當(dāng)前幀的立體聲全局相位參數(shù)的 值;
[0040] 調(diào)整單元,用于根據(jù)所述確定單元確定的所述當(dāng)前幀的立體聲全局相位參數(shù)的值 的確定結(jié)果,對(duì)所述當(dāng)前幀的立體聲全局相位參數(shù)的值進(jìn)行調(diào)整;
[0041] 編碼單元,用于對(duì)所述調(diào)整單元調(diào)整后的當(dāng)前幀的立體聲全局相位參數(shù)的值進(jìn)行 編碼。
[0042] 在第二方面的第一種實(shí)現(xiàn)方式中,所述調(diào)整單元包括:
[0043] 獲取模塊,用于獲取所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差;
[0044] 計(jì)算模塊,用于根據(jù)所述獲取模塊獲取的所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間 差,計(jì)算所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差的絕對(duì)值均值;
[0045] 調(diào)整模塊,用于根據(jù)所述當(dāng)前幀的立體聲全局相位參數(shù)的值的確定結(jié)果以及所述 計(jì)算模塊計(jì)算的所述當(dāng)前幀的各個(gè)子帶的聲道間時(shí)間差的絕對(duì)值均值,對(duì)所述當(dāng)前幀的立 體聲全局相位參數(shù)的值進(jìn)行調(diào)整。
[0046] 結(jié)合第二方面或者第二方面的第一種實(shí)現(xiàn)方式,在第二方面的第二種實(shí)現(xiàn)方式 中,所述調(diào)整單元還包括:
[0047] 處理模塊,用于對(duì)所述計(jì)算模塊計(jì)算的所述當(dāng)前幀的各個(gè)子帶的聲