信號解碼方法及設(shè)備的制作方法
【專利摘要】本發(fā)明實(shí)施例提供了信號解碼方法及設(shè)備。該方法包括:對語音或音頻信號的比特流進(jìn)行解碼,獲取解碼信號;根據(jù)解碼信號預(yù)測擴(kuò)展頻帶的激勵信號,其中擴(kuò)展頻帶與解碼信號的頻帶相鄰且解碼信號的頻帶低于擴(kuò)展頻帶;在解碼信號中選取第一頻帶和第二頻帶,根據(jù)第一頻帶的頻譜系數(shù)以及第二頻帶的頻譜系數(shù)預(yù)測擴(kuò)展頻帶的頻譜包絡(luò);根據(jù)擴(kuò)展頻帶的頻譜包絡(luò)和擴(kuò)展頻帶的激勵信號,確定擴(kuò)展頻帶的頻域信號。本發(fā)明實(shí)施例中,通過根據(jù)從語音或音頻信號的比特流中得到的解碼信號分別預(yù)測擴(kuò)展頻帶的頻譜包絡(luò)和激勵信號,從而能夠確定語音或音頻信號的擴(kuò)展頻帶的頻域信號,因此能夠提升語音或音頻信號的性能。
【專利說明】信號解碼方法及設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息【技術(shù)領(lǐng)域】,并且具體地,涉及信號解碼方法及設(shè)備。
【背景技術(shù)】
[0002] 目前的通信傳輸越來越重視語音或音頻的質(zhì)量,因此語音或音頻信號的編解碼也 成為語音或音頻信號處理中越來越重要的環(huán)節(jié)。
[0003] 編碼端在信號編碼的過程中,為了提高編碼效率,往往希望用盡量少的編碼比特 來表征要傳輸?shù)男盘枴@?,在低速率編碼時,編碼端常常不會對所有頻帶進(jìn)行編碼??紤] 到人耳對語音或音頻信號中的低頻部分比對高頻部分更加敏感的特點(diǎn),通常在低頻部分分 配較多的比特進(jìn)行編碼,在高頻部分只分配少的比特進(jìn)行編碼,有些情況下甚至不對高頻 部分進(jìn)行編碼。因此,在解碼端進(jìn)行解碼時需要通過盲帶寬擴(kuò)展技術(shù)來恢復(fù)未編碼的頻帶。
[0004] 目前,解碼端常采用時域頻帶擴(kuò)展方式恢復(fù)未編碼的頻帶,但是這種方式對語音 信號的擴(kuò)展效果很差,而且不能處理音頻信號,因此導(dǎo)致輸出的語音或音頻信號的性能很 差。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實(shí)施例提供信號解碼方法及設(shè)備,能夠提升語音或音頻信號的性能。
[0006] 第一方面,提供了一種信號解碼方法,包括:對語音或音頻信號的比特流進(jìn)行解 碼,獲取解碼信號;根據(jù)所述解碼信號預(yù)測擴(kuò)展頻帶的激勵信號,其中,所述擴(kuò)展頻帶與所 述解碼信號的頻帶相鄰,且所述解碼信號的頻帶低于所述擴(kuò)展頻帶;在所述解碼信號中選 取第一頻帶和第二頻帶,根據(jù)所述第一頻帶的頻譜系數(shù)以及所述第二頻帶的頻譜系數(shù)預(yù)測 所述擴(kuò)展頻帶的頻譜包絡(luò),其中,所述第一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最低頻點(diǎn) 小于或等于第一值,所述第二頻帶的最高頻點(diǎn)距離所述第一頻帶的最低頻點(diǎn)小于或等于第 二值;根據(jù)所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò)展頻帶的激勵信號,確定所述擴(kuò)展頻帶的頻 域信號。
[0007] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述在所述解碼信號中選取第一頻 帶和第二頻帶,包括:按照從所述擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在所述解碼信號的頻帶 中選取第一頻帶和第二頻帶,其中所述第一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最低頻點(diǎn) 等于所述第一值,所述第一值為〇 ;所述第二頻帶的最高頻點(diǎn)距離所述第一頻帶的最低頻 點(diǎn)等于所述第二值,所述第二值為0。
[0008] 結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式 中,所述根據(jù)所述第一頻帶的頻譜系數(shù)以及所述第二頻帶的頻譜系數(shù)預(yù)測所述擴(kuò)展頻帶的 頻譜包絡(luò),包括:將所述第一頻帶劃分為Μ個子帶,并根據(jù)所述第一頻帶的頻譜系數(shù)確定每 個子帶的能量或幅度的均值,其中Μ為正整數(shù);根據(jù)所述每個子帶的能量或幅度的均值,確 定所述每個子帶的能量或幅度的調(diào)整值;根據(jù)所述每個子帶的能量或幅度的調(diào)整值,預(yù)測 所述擴(kuò)展頻帶的第一頻譜包絡(luò);根據(jù)所述第二頻帶的頻譜系數(shù),確定所述第二頻帶的能量 或幅度的均值;根據(jù)所述擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均 值,預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò)。
[0009] 結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述根據(jù) 所述每個子帶的能量或幅度的均值,確定所述每個子帶的能量或幅度的調(diào)整值,包括:如果 所述Μ個子帶的能量或幅度的均值的方差不在預(yù)設(shè)的閾值范圍內(nèi),則將a個子帶中每個子 帶的能量或幅度的均值進(jìn)行調(diào)整以確定所述a個子帶中每個子帶的能量或幅度的調(diào)整值, 并將b個子帶中每個子帶的能量或幅度的均值作為所述b個子帶中每個子帶的能量或幅度 的調(diào)整值,其中所述a個子帶中每個子帶的能量或幅度的均值大于或等于均值閾值,所述b 個子帶中每個子帶的能量或幅度的均值小于所述均值閾值,a和b為正整數(shù),且a+b=M;如果 所述Μ個子帶的能量或幅度的均值的方差在預(yù)設(shè)的閾值范圍內(nèi),則將所述每個子帶的能量 或幅度的均值作為所述每個子帶的能量或幅度的調(diào)整值。
[0010] 結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述根據(jù) 所述每個子帶的能量或幅度的均值,確定所述每個子帶的能量或幅度的調(diào)整值,包括:對于 所述Μ個子帶中的第i個子帶和第(i+Ι)個子帶,如果所述第i個子帶的能量或幅度的均值 與所述第(i+Ι)個子帶的能量或幅度的均值之間的比值不在預(yù)設(shè)的閾值范圍內(nèi),則在所述 第i個子帶的能量或幅度的均值大于所述第(i+Ι)個子帶的能量或幅度的均值時,對所述 第i個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定所述第i個子帶的能量或幅度的調(diào)整值, 并將所述第(i+1)個子帶的能量或幅度的均值作為所述第(i+1)個子帶的能量或幅度的調(diào) 整值;在所述第i個子帶的能量或幅度的均值小于所述第(i+Ι)個子帶的能量或幅度的均 值時,對所述第(i+Ι)個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定所述第(i+Ι)個子帶的 能量或幅度的調(diào)整值,并將所述第i個子帶的能量或幅度的均值作為所述第i個子帶的能 量或幅度的調(diào)整值;如果所述第i個子帶的能量或幅度的均值與所述第(i+Ι)個子帶的能 量或幅度的均值之間的比值在預(yù)設(shè)的閾值范圍內(nèi),則將所述第i個子帶的能量或幅度的均 值作為所述第i個子帶的能量或幅度的調(diào)整值,并將所述第(i+ι)個子帶的能量或幅度的 均值作為所述第(i+Ι)個子帶的調(diào)整值,其中i為正整數(shù)且1彡i彡M-1。
[0011] 結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式或第一方面的第三種可能的實(shí)現(xiàn)方式或 第一方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述擴(kuò)展頻帶 的第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均值,預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò), 包括:根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的 均值,確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對所述 當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述 當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò);在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻 帶的第二頻譜包絡(luò)作為所述當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0012] 結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式或第一方面的第三種可能的實(shí)現(xiàn)方式或 第一方面的第四種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述擴(kuò)展頻帶 的第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均值,預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò), 包括:根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的 均值,確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對所述 當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述 當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò);在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò) 展頻帶的第二頻譜包絡(luò)作為所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò);根據(jù)所述解碼信號的 基音周期、所述解碼信號的濁音度因子以及所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò),確定 所述當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0013] 結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式或第一方面的第六種可能的實(shí)現(xiàn)方式,在 第七種可能的實(shí)現(xiàn)方式中,所述預(yù)設(shè)條件包括以下三個條件中的至少一個:條件一:所述 當(dāng)前幀的語音或音頻信號的編碼方式與所述前一幀的語音或音頻信號的編碼方式不相同; 條件二:所述前一幀的解碼信號為非摩擦音,且所述當(dāng)前幀的解碼信號中第m個頻帶的能 量或幅度的均值與所述前一幀的解碼信號中第η個頻帶的能量或幅度的均值之間的比值 在預(yù)設(shè)的閾值范圍內(nèi),其中m和η為正整數(shù);條件三:所述當(dāng)前幀的解碼信號為非摩擦音, 且所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與所述前一幀的擴(kuò)展頻帶的頻譜包絡(luò)之間的比 值大于所述當(dāng)前幀的解碼信號中第j個頻帶的能量或幅度的均值與所述前一幀的解碼信 號中第k個頻帶的能量或幅度的均值之間的比值,其中j和k為正整數(shù)。
[0014] 結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式至第一方面的第七種可能的 實(shí)現(xiàn)方式中任一實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述解碼信號預(yù)測所述 擴(kuò)展頻帶的激勵信號,包括:在所述語音或音頻信號的編碼方式為時域編碼方式的情況下, 從所述解碼信號中選取第三頻帶,所述第三頻帶與所述擴(kuò)展頻帶相鄰;根據(jù)所述第三頻帶 的頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
[0015] 結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式至第七種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述解碼信號預(yù)測所述擴(kuò)展頻帶的 激勵信號,包括:在所述語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或者頻域編碼方 式的情況下,從所述解碼信號中選取第四頻帶,所述第四頻帶所分配的比特?cái)?shù)目大于預(yù)設(shè) 的比特?cái)?shù)目閾值;根據(jù)所述第四頻帶的頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
[0016] 結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式至第九種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,所述方法還包括:在所述語音或音頻信號的編 碼方式為時頻聯(lián)合編碼方式或者頻域編碼方式的情況下,將所述解碼信號與所述擴(kuò)展頻帶 的頻域信號進(jìn)行合成,獲取頻域輸出信號;將所述頻域輸出信號進(jìn)行頻時變換,獲取最終輸 出信號。
[0017] 結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式至第九種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第十一種可能的實(shí)現(xiàn)方式中,所述方法還包括:在所述語音或音頻信號的 編碼方式為時域編碼方式的情況下,根據(jù)時域頻帶擴(kuò)展方式,獲取所述擴(kuò)展頻帶的第一時 域信號;將所述擴(kuò)展頻帶的頻域信號變換為所述擴(kuò)展頻帶的第二時域信號;對所述擴(kuò)展頻 帶的第一時域信號和所述擴(kuò)展頻帶的第二時域信號進(jìn)行合成,獲取所述擴(kuò)展頻帶的最終時 域信號;將所述解碼信號與所述擴(kuò)展頻帶的最終時域信號進(jìn)行合成,獲取最終輸出信號。
[0018] 第二方面,提供了一種信號解碼設(shè)備,包括:解碼單元,用于對語音或音頻信號的 比特流進(jìn)行解碼,獲取解碼信號;所述預(yù)測單元,用于從所述解碼單元接收所述解碼信號, 并根據(jù)所述解碼信號預(yù)測擴(kuò)展頻帶的激勵信號,其中,所述擴(kuò)展頻帶與所述解碼信號的頻 帶相鄰,且所述解碼信號的頻帶低于所述擴(kuò)展頻帶;所述預(yù)測單元,還用于在所述解碼信號 中選取第一頻帶和第二頻帶,并根據(jù)所述第一頻帶的頻譜系數(shù)以及所述第二頻帶的頻譜系 數(shù)預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò),其中,所述第一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最 低頻點(diǎn)小于或等于第一值,所述第二頻帶的最高頻點(diǎn)距離所述第一頻帶的最低頻點(diǎn)小于或 等于第二值;所述確定單元,用于從所述預(yù)測單元接收所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò) 展頻帶的激勵信號,根據(jù)所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò)展頻帶的激勵信號,確定所述 擴(kuò)展頻帶的頻域信號。
[0019] 結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述預(yù)測單元具體用于按照從所述 擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在所述解碼信號中選取第一頻帶和第二頻帶,其中所述 第一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最低頻點(diǎn)等于所述第一值,所述第一值為0 ;所 述第二頻帶的最高頻點(diǎn)距離所述第一頻帶的最低頻點(diǎn)等于所述第二值,所述第二值為0。
[0020] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式 中,所述預(yù)測單元具體用于將所述第一頻帶劃分為Μ個子帶,并根據(jù)所述第一頻帶的頻譜 系數(shù)確定每個子帶的能量或幅度的均值,其中Μ為正整數(shù);根據(jù)每個子帶的能量或幅度的 均值,確定每個子帶的能量或幅度的調(diào)整值;根據(jù)所述每個子帶的能量或幅度的調(diào)整值,預(yù) 測所述擴(kuò)展頻帶的第一頻譜包絡(luò);根據(jù)所述第二頻帶的頻譜系數(shù),確定所述第二頻帶的能 量或幅度的均值;根據(jù)所述擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均 值,預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò)。
[0021] 結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述預(yù)測 單元具體用于如果所述Μ個子帶的能量或幅度的均值的方差不在預(yù)設(shè)的閾值范圍內(nèi),則將 a個子帶中每個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定所述a個子帶中每個子帶的能量 或幅度的調(diào)整值,并將b個子帶中每個子帶的能量或幅度的均值作為所述b個子帶中每個 子帶的能量或幅度的調(diào)整值,其中所述a個子帶中每個子帶的能量或幅度的均值大于或等 于均值閾值,所述b個子帶中每個子帶的能量或幅度的均值小于所述均值閾值,a和b為正 整數(shù),且a+b=M ;如果所述Μ個子帶的能量或幅度的均值的方差在預(yù)設(shè)的閾值范圍內(nèi),則將 所述每個子帶的能量或幅度的均值作為所述每個子帶的能量或幅度的調(diào)整值。
[0022] 結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述預(yù)測 單元具體用于對于所述Μ個子帶中的第i個子帶和第(i+Ι)個子帶,
[0023] 如果所述第i個子帶的能量或幅度的均值與所述第(i+Ι)個子帶的能量或幅度的 均值之間的比值不在預(yù)設(shè)的閾值范圍內(nèi),則在所述第i個子帶的能量或幅度的均值大于所 述第(i+1)個子帶的能量或幅度的均值時,對所述第i個子帶的能量或幅度的均值進(jìn)行調(diào) 整以確定所述第i個子帶的能量或幅度的調(diào)整值,并將所述第(i+Ι)個子帶的能量或幅度 的均值作為所述第(i+Ι)個子帶的能量或幅度的調(diào)整值;在所述第i個子帶的能量或幅度 的均值小于所述第(i+1)個子帶的能量或幅度的均值時,對所述第(i+1)個子帶的能量或 幅度的均值進(jìn)行調(diào)整以確定所述第(i+Ι)個子帶的能量或幅度的調(diào)整值,并將所述第i個 子帶的能量或幅度的均值作為所述第i個子帶的能量或幅度的調(diào)整值;如果所述第i個子 帶的能量或幅度的均值與所述第(i+Ι)個子帶的能量或幅度的均值之間的比值在預(yù)設(shè)的閾 值范圍內(nèi),則將所述第i個子帶的能量或幅度的均值作為所述第i個子帶的能量或幅度的 調(diào)整值,并將所述第(i+1)個子帶的能量或幅度的均值作為所述第(i+1)個子帶的調(diào)整值, 其中i為正整數(shù)且1彡i彡M-1。
[0024] 結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式或第二方面的第三種可能的實(shí)現(xiàn)方式或 第二方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述預(yù)測單元具體用于 根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的均值, 確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對所述當(dāng)前 幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述當(dāng)前 幀的擴(kuò)展頻帶的頻譜包絡(luò);在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻帶的 第二頻譜包絡(luò)作為所述當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0025] 結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式或第二方面的第三種可能的實(shí)現(xiàn)方式或 第二方面的第四種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述預(yù)測單元具體用于 根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的均值, 確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對所述當(dāng)前 幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述當(dāng)前 幀的擴(kuò)展頻帶的第三頻譜包絡(luò);在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻 帶的第二頻譜包絡(luò)作為所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò);根據(jù)所述解碼信號的基音 周期、所述解碼信號的濁音度因子以及所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò),確定所述 當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0026] 結(jié)合第二方面的第五種可能的實(shí)現(xiàn)方式或第二方面的第六種可能的實(shí)現(xiàn)方式,在 第七種可能的實(shí)現(xiàn)方式中,所述預(yù)設(shè)條件包括以下三個條件中的至少一個:條件一:所述 當(dāng)前幀的語音或音頻信號的編碼方式與所述前一幀的語音或音頻信號的編碼方式不相同; 條件二:所述前一幀的解碼信號為非摩擦音,且所述當(dāng)前幀的解碼信號中第m個頻帶的能 量或幅度的均值與所述前一幀的解碼信號中第η個頻帶的能量或幅度的均值之間的比值 在預(yù)設(shè)的閾值范圍內(nèi),其中m和η為正整數(shù);條件三:所述當(dāng)前幀的解碼信號為非摩擦音, 且所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與所述前一幀的擴(kuò)展頻帶的頻譜包絡(luò)之間的比 值大于所述當(dāng)前幀的解碼信號中第j個頻帶的能量或幅度的均值與所述前一幀的解碼信 號中第k個頻帶的能量或幅度的均值之間的比值,其中j和k為正整數(shù)。
[0027] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式至第七種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述預(yù)測單元具體用于在所述語音或音頻信 號的編碼方式為時域編碼方式的情況下,從所述解碼信號中選取第三頻帶,所述第三頻帶 與所述擴(kuò)展頻帶相鄰;根據(jù)所述第三頻帶的頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
[0028] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式至第七種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,所述預(yù)測單元具體用于在所述語音或音頻信 號的編碼方式為時頻聯(lián)合編碼方式或者頻域編碼方式的情況下,從所述解碼信號中選取第 四頻帶,所述第四頻帶所分配的比特?cái)?shù)目大于預(yù)設(shè)的比特?cái)?shù)目閾值;根據(jù)所述第四頻帶的 頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
[0029] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式至第九種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,第一合成單元,用于在所述語音或音頻信號的 編碼方式為時頻聯(lián)合編碼方式或者頻域編碼方式的情況下,將所述解碼信號與所述擴(kuò)展頻 帶的頻域信號進(jìn)行合成,獲取頻域輸出信號;第一變換單元,用于將所述頻域輸出信號進(jìn)行 頻時變換,獲取最終輸出信號。
[0030] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式至第九種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第十一種可能的實(shí)現(xiàn)方式中,獲取單元,用于在所述語音或音頻信號的編 碼方式為時域編碼方式的情況下,根據(jù)時域頻帶擴(kuò)展方式,獲取所述擴(kuò)展頻帶的第一時域 信號;第二變換單元,用于將所述擴(kuò)展頻帶的頻域信號變換為所述擴(kuò)展頻帶的第二時域信 號;第二合成單元,用于對所述擴(kuò)展頻帶的第一時域信號和所述擴(kuò)展頻帶的第二時域信號 進(jìn)行合成,獲取所述擴(kuò)展頻帶的最終時域信號;第二合成單元還用于將所述解碼信號與所 述擴(kuò)展頻帶的最終時域信號進(jìn)行合成,獲取最終輸出信號。
[0031] 第三方面,提供了一種信號編碼方法,包括:對語音或音頻信號進(jìn)行核心層編碼, 得到所述語音或音頻信號的核心層碼流;對所述語音或音頻信號進(jìn)行擴(kuò)展層處理,確定擴(kuò) 展頻帶的第一包絡(luò);根據(jù)所述語音或音頻信號的信噪比、所述語音或音頻信號的基音周期 和所述擴(kuò)展頻帶的第一包絡(luò),確定所述擴(kuò)展頻帶的第二包絡(luò);對所述第二包絡(luò)進(jìn)行編碼,得 到擴(kuò)展層碼流;向解碼端發(fā)送所述核心層碼流和所述擴(kuò)展層碼流。
[0032] 第四方面,提供了一種信號解碼方法,包括:從編碼端接收語音或音頻信號的核心 層碼流和擴(kuò)展層碼流;對所述擴(kuò)展層碼流進(jìn)行解碼,確定擴(kuò)展頻帶的第二包絡(luò),其中所述第 二包絡(luò)是所述編碼端根據(jù)所述語音或音頻信號的信噪比、所述語音或音頻信號的基音周期 和所述擴(kuò)展頻帶的第一包絡(luò)確定的;對所述核心層碼流進(jìn)行解碼,得到核心層語音或音頻 信號;根據(jù)所述核心層語音或音頻信號,預(yù)測所述擴(kuò)展頻帶的激勵信號;根據(jù)所述擴(kuò)展頻 帶的激勵信號和所述擴(kuò)展頻帶的第二包絡(luò),預(yù)測所述擴(kuò)展頻帶的信號。
[0033] 第五方面,提供了一種信號編碼設(shè)備,包括:編碼單元,用于對語音或音頻信號進(jìn) 行核心層編碼,得到所述語音或音頻信號的核心層碼流;第一確定單元,用于對所述語音或 音頻信號進(jìn)行擴(kuò)展層處理,確定所述擴(kuò)展頻帶的第一包絡(luò);第二確定單元,用于根據(jù)所述語 音或音頻信號的信噪比、所述語音或音頻信號的基音周期和所述擴(kuò)展頻帶的第一包絡(luò),確 定所述擴(kuò)展頻帶的第二包絡(luò);所述編碼單元還用于對所述第二包絡(luò)進(jìn)行編碼,得到擴(kuò)展層 碼流;發(fā)送單元,用于向解碼端發(fā)送所述核心層碼流和所述擴(kuò)展層碼流。
[0034] 第六方面,提供了一種信號解碼設(shè)備,包括:接收單元,用于從編碼端接收語音或 音頻信號的核心層碼流和擴(kuò)展層碼流;解碼單元,用于對所述擴(kuò)展層碼流進(jìn)行解碼,確定擴(kuò) 展頻帶的第二包絡(luò),其中所述第二包絡(luò)是所述編碼端根據(jù)所述語音或音頻信號的信噪比、 所述語音或音頻信號的基音周期和所述擴(kuò)展頻帶的第一包絡(luò)確定的;所述解碼單元,還用 于對所述核心層碼流進(jìn)行解碼,得到核心層語音或音頻信號;預(yù)測單元,用于根據(jù)所述核心 層語音或音頻信號,預(yù)測所述擴(kuò)展頻帶的激勵信號;所述預(yù)測單元還用于根據(jù)所述擴(kuò)展頻 帶的激勵信號和所述擴(kuò)展頻帶的第二包絡(luò),預(yù)測所述擴(kuò)展頻帶的信號。
[0035] 本發(fā)明實(shí)施例中,通過根據(jù)從語音或音頻信號的比特流中得到的解碼信號分別預(yù) 測擴(kuò)展頻帶的頻譜包絡(luò)和激勵信號,使得能夠確定語音或音頻信號的擴(kuò)展頻帶的頻域信 號,因此能夠提升語音或音頻信號的性能。
【專利附圖】
【附圖說明】
[0036] 為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對本發(fā)明實(shí)施例中所需要使 用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實(shí)施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0037] 圖1是根據(jù)本發(fā)明實(shí)施例的信號解碼方法的示意性流程圖。
[0038] 圖2是根據(jù)本發(fā)明實(shí)施例的信號解碼方法的過程的示意性流程圖。
[0039] 圖3是根據(jù)本發(fā)明一個實(shí)施例的信號解碼設(shè)備的示意框圖。
[0040] 圖4是根據(jù)本發(fā)明另一實(shí)施例的信號解碼設(shè)備的示意框圖。
[0041] 圖5是根據(jù)本發(fā)明另一實(shí)施例的信號解碼設(shè)備的示意框圖。
[0042] 圖6是根據(jù)本發(fā)明一個實(shí)施例的信號解碼設(shè)備的示意框圖。
[0043] 圖7是根據(jù)本發(fā)明實(shí)施例的信號編碼方法的示意性流程圖。
[0044] 圖8是根據(jù)本發(fā)明實(shí)施例的信號解碼方法的示意性流程圖。
[0045] 圖9是根據(jù)本發(fā)明實(shí)施例的信號編碼設(shè)備的示意框圖。
[0046] 圖10是根據(jù)本發(fā)明實(shí)施例的信號解碼設(shè)備的示意框圖。
【具體實(shí)施方式】
[0047] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例?;诒景l(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí) 施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。
[0048] 圖1是根據(jù)本發(fā)明實(shí)施例的信號解碼方法的示意性流程圖。圖1的方法由信號解 碼設(shè)備執(zhí)行,例如,可以是解碼器。
[0049] 110,對語音或音頻信號的比特流進(jìn)行解碼,獲取解碼信號。
[0050] 例如,語音或音頻信號的比特流是信號編碼設(shè)備(比如,編碼器)對原始的語音或 音頻信號進(jìn)行編碼得到的。信號解碼設(shè)備獲取語音或音頻信號的比特流之后,可以對該比 特流進(jìn)行解碼,得到解碼信號。解碼過程可參照現(xiàn)有技術(shù)的過程,為了避免重復(fù),此處不再 贅述。該解碼信號可以是低頻帶的解碼信號。
[0051] 例如,如果語音信號的編碼方式為時域編碼方式,則信號解碼設(shè)備可以根據(jù)相應(yīng) 的解碼方式對語音信號的比特流進(jìn)行解碼。如果音頻信號的編碼方式為時域聯(lián)合編碼方 式或頻域編碼方式,則信號解碼設(shè)備可以根據(jù)相應(yīng)的解碼方式對音頻信號的比特流進(jìn)行解 碼。
[0052] 120,根據(jù)解碼信號預(yù)測擴(kuò)展頻帶的激勵信號,其中解碼信號的頻帶低于擴(kuò)展頻 帶,且解碼信號的頻帶低于擴(kuò)展頻帶。
[0053] 可選地,作為一個實(shí)施例,在語音或音頻信號的編碼方式為時域編碼方式的情況 下,信號解碼設(shè)備可以從解碼信號中選取第三頻帶,第三頻帶與擴(kuò)展頻帶相鄰??梢愿鶕?jù)第 三頻帶的頻譜系數(shù),預(yù)測擴(kuò)展頻帶的激勵信號。
[0054] 具體地,在語音或音頻信號的編碼方式為時域編碼方式的情況下,信號解碼設(shè)備 可以根據(jù)與擴(kuò)展頻帶相鄰的第三頻帶的頻譜系數(shù),預(yù)測擴(kuò)展頻帶的激勵信號。
[0055] 可選地,作為另一實(shí)施例,在語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或 者頻域編碼方式的情況下,信號解碼設(shè)備可以從解碼信號中選取第四頻帶,第四頻帶所分 配的比特?cái)?shù)目大于預(yù)設(shè)的比特?cái)?shù)目閾值??梢愿鶕?jù)第四頻帶的頻譜系數(shù),預(yù)測擴(kuò)展頻帶的 激勵信號。
[0056] 具體地,第四頻帶中所分配的比特?cái)?shù)目較多,那么第四頻帶在解碼時恢復(fù)的也較 好。因此,信號解碼設(shè)備可以根據(jù)第四頻帶的頻譜系數(shù),預(yù)測擴(kuò)展頻帶的激勵信號。
[0057] 130,在解碼信號中選取第一頻帶和第二頻帶,根據(jù)第一頻帶的頻譜系數(shù)以及第二 頻帶的頻譜系數(shù)預(yù)測擴(kuò)展頻帶的頻譜包絡(luò);其中,第一頻帶的最高頻點(diǎn)距離擴(kuò)展頻帶的最 低高頻點(diǎn)小于或等于第一值,第二頻帶的最高頻點(diǎn)距離第一頻帶的最低高頻點(diǎn)小于或等于 第二值。
[0058] 本發(fā)明實(shí)施例中,擴(kuò)展頻帶可以是需要擴(kuò)展的頻帶。例如,在編碼器采用ACELP (Algebraic Codebook Excited Linear Prediction,碼本激勵線性預(yù)測)編碼模式進(jìn)行編 碼時,為了提高編碼效率,可以將采樣率為16kHz的寬帶信號下采樣為采樣率為12.8kHz 的信號后再編碼。這樣,信號解碼設(shè)備對比特流進(jìn)行解碼后,得到的解碼信號的帶寬到 6. 4kHz。如果為了獲取帶寬為8kHz的輸出信號,那么信號解碼設(shè)備可以擴(kuò)展6kHz?8kHz 的頻帶,也就是擴(kuò)展出頻帶為6kHz?8kHz的信號。如果為了獲取帶寬為14kHz的輸出信 號,信號解碼設(shè)備可以擴(kuò)展6. 4kHz?14kHz的頻帶,也就是擴(kuò)展出頻帶為6. 4kHz?14kHz 的信號。
[0059] 應(yīng)理解,本發(fā)明實(shí)施例中,擴(kuò)展頻帶的頻譜包絡(luò)可以包括N個包絡(luò)值,N為正整數(shù), N的取值可以根據(jù)實(shí)際情況進(jìn)行確定。
[0060] 可以從擴(kuò)展頻帶的起始點(diǎn)向低頻的方向從解碼信號中選取第一頻帶和第二頻帶, 選取的第一頻帶和第二頻帶的離擴(kuò)展頻帶足夠接近時,擴(kuò)展頻帶能更準(zhǔn)確(即更接近真實(shí) 信號)。第一值和第二值分別是為了保證第一頻帶與擴(kuò)展頻帶、第二頻帶與第一頻帶足夠接 近。上述第一值和第二值可以為正整數(shù)或正數(shù);可以用頻譜系數(shù)或者頻點(diǎn)的數(shù)量表示;也 可以用帶寬表示。第一值和第二值可以相等也可以不相等。第一值和第二值可以根據(jù)需要 預(yù)先設(shè)定,例如可以基于采樣率以及對語音或音頻信號進(jìn)行時頻變換的樣點(diǎn)數(shù)設(shè)定第一值 和第二值。比如,如果40個頻譜系數(shù)表示1kHz,第一值和第二值可以分別為40,也就是第 一頻帶和擴(kuò)展頻帶之間的距離可以在1kHz以內(nèi);第二頻帶和第一頻帶之間的距離可以在 1kHz以內(nèi)。
[0061] 一個實(shí)施例中,在解碼信號中選取第一頻帶和第二頻帶包括:按照從擴(kuò)展頻帶的 起始點(diǎn)向低頻的方向,在解碼信號的頻帶中選取第一頻帶和第二頻帶,其中第一頻帶的最 高頻點(diǎn)距離擴(kuò)展頻帶的最低頻點(diǎn)等于第一值,第一值為0 ;第二頻帶的最高頻點(diǎn)距離第一 頻帶的最低頻點(diǎn)等于第二值,第二值為0。
[0062] 作為優(yōu)選的實(shí)施例,第一值和第二值可以為0。那么第一頻帶與擴(kuò)展頻帶相鄰,第 二頻帶與第一頻帶相鄰。因此,可選地,步驟130的一個實(shí)施例,信號解碼設(shè)備可以按照從 擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在解碼信號中選取第一頻帶和第二頻帶,其中第一頻帶 可以與擴(kuò)展頻帶相鄰,第二頻帶可以與第一頻帶相鄰。信號解碼設(shè)備可以根據(jù)第一頻帶的 頻譜系數(shù)以及第二頻帶的頻譜系數(shù),預(yù)測擴(kuò)展頻帶的頻譜包絡(luò)。
[0063] 具體地,信號解碼設(shè)備可以從擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在解碼信號的頻 帶中依次選取第一頻帶和第二頻帶。例如,假設(shè)解碼信號的頻帶為〇?6. 4kHz,擴(kuò)展頻帶為 6kHz?8kHz,那么第一頻帶可以是4. 8kHz?6. 4kHz,第二頻帶可以是3. 2kHz?4. 8kHz。 假設(shè)解碼信號的頻帶為〇?6. 4kHz,擴(kuò)展頻帶為6. 4kHz?14kHz,那么第一頻帶可以是 4kHz?6. 4kHz,第二頻帶可以是3. 2kHz?4kHz。上述數(shù)值的舉例是為了幫助本領(lǐng)域技術(shù) 人員更好地理解本發(fā)明實(shí)施例,而非限制本發(fā)明的范圍。第一頻帶和第二頻道可以根據(jù)實(shí) 際情況進(jìn)行選取,本發(fā)明實(shí)施例對此不作限定。
[0064] 可選地,作為另一實(shí)施例,信號解碼設(shè)備可以將第一頻帶劃分為Μ個子帶,并根據(jù) 第一頻帶的頻譜系數(shù)確定每個子帶的能量或幅度的均值,其中Μ為正整數(shù)??梢愿鶕?jù)每個 子帶的能量或幅度的均值,確定每個子帶的能量或幅度的調(diào)整值??梢愿鶕?jù)每個子帶的能 量或幅度的調(diào)整值,預(yù)測擴(kuò)展頻帶的第一頻譜包絡(luò)??梢愿鶕?jù)第二頻帶的頻譜系數(shù),確定第 二頻帶的能量或幅度的均值??梢愿鶕?jù)擴(kuò)展頻帶的第一頻譜包絡(luò)以及第二頻帶的能量或幅 度的均值,預(yù)測擴(kuò)展頻帶的頻譜包絡(luò)。
[0065] 具體地,信號解碼設(shè)備可以將第一頻帶劃分為Μ個子帶,并根據(jù)第一頻帶的頻譜 系數(shù)確定每個子帶的能量或幅度的均值,也就是可以得到Μ個能量或幅度的均值。根據(jù)Μ 個能量或幅度的均值,可以確定Μ個能量或幅度的調(diào)整值。
[0066] 信號解碼設(shè)備可以根據(jù)Μ個能量或幅度的調(diào)整值,預(yù)測擴(kuò)展頻帶的第一頻譜包 絡(luò)。第一頻譜包絡(luò)可以是對擴(kuò)展頻帶的頻譜包絡(luò)的初步預(yù)測。第一頻譜包絡(luò)可以包括Ν個 值。信號解碼設(shè)備可以根據(jù)擴(kuò)展頻帶的第一頻譜包絡(luò)以及第二頻帶的能量或幅度的均值, 預(yù)測擴(kuò)展頻帶的頻譜包絡(luò)。
[0067] 可選地,作為另一實(shí)施例,如果Μ個子帶的能量或幅度的均值的方差不在預(yù)設(shè)的 閾值范圍內(nèi),則將a個子帶中每個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定a個子帶中每 個子帶的能量或幅度的調(diào)整值,并將b個子帶中每個子帶的能量或幅度的均值作為b個子 帶中每個子帶的能量或幅度的調(diào)整值,其中a個子帶中每個子帶的能量或幅度的均值大于 或等于均值閾值,b個子帶中每個子帶的能量或幅度的均值小于均值閾值,a和b為正整數(shù), 且a+b=M ;如果Μ個子帶的能量或幅度的均值的方差在預(yù)設(shè)的閾值范圍內(nèi),則將每個子帶的 能量或幅度的均值作為每個子帶的能量或幅度的調(diào)整值。
[0068] 具體地,在Μ個能量或幅度的均值的方差不在預(yù)設(shè)的閾值范圍內(nèi)時,可以將Μ個能 量或幅度的均值中大于均值閾值的那些值進(jìn)行調(diào)整。應(yīng)注意,閾值范圍可以是根據(jù)Μ個能 量或幅度的均值的方差來確定的,均值閾值可以是根據(jù)Μ個能量或幅度的均值來確定的。 例如,均值閾值可以是Μ個均值的平均值,可以將Μ個能量或幅度的均值中大于該平均值的 那些能量或幅度的均值進(jìn)行縮放得到對應(yīng)的調(diào)整值。進(jìn)行縮放的過程可以是將需要調(diào)整的 均值乘以縮放比例值,該縮放比例值可以是根據(jù)Μ個子帶的能量或幅度的均值得到的,且 該縮放比例值小于1。
[0069] 可選地,作為另一實(shí)施例,對于Μ個子帶中的第i個子帶和第(i+Ι)個子帶,如果 第i個子帶的能量或幅度的均值與第(i+ι)個子帶的能量或幅度的均值之間的比值不在預(yù) 設(shè)的閾值范圍內(nèi),則在第i個子帶的能量或幅度的均值大于第(i+ι)個子帶的能量或幅度 的均值時,對第i個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定第i個子帶的能量或幅度的 調(diào)整值,并將第(i+ι)個子帶的能量或幅度的均值作為第(i+ι)個子帶的能量或幅度的調(diào) 整值;在第i個子帶的能量或幅度的均值小于第(i+ι)個子帶的能量或幅度的均值時,對 第(i+1)個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定第(i+1)個子帶的能量或幅度的調(diào)整 值,并將第i個子帶的能量或幅度的均值作為第i個子帶的能量或幅度的調(diào)整值;如果第i 個子帶的能量或幅度的均值與第(i+ι)個子帶的能量或幅度的均值之間的比值在預(yù)設(shè)的閾 值范圍內(nèi),則將第i個子帶的能量或幅度的均值作為第i個子帶的能量或幅度的調(diào)整值,并 將第(i+ι)個子帶的能量或幅度的均值作為第(i+ι)個子帶的調(diào)整值,其中i為正整數(shù)且 1彡i彡M-l。
[0070] 具體地,如果第i個子帶的能量或幅度的均值與第(i+1)個子帶的能量或幅度的 均值之間的比值不在預(yù)設(shè)的閾值范圍內(nèi),則可以對第i個子帶的能量或幅度的均值和第 (i+1)個子帶的能量或幅度的均值中較大的那個值進(jìn)行調(diào)整得打?qū)?yīng)的調(diào)整值,例如,可以 對兩者之間較大的那個均值進(jìn)行縮放,比如可以將較大的均值乘以縮放比例值。
[0071] 可選地,作為另一實(shí)施例,信號解碼設(shè)備可以根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜 包絡(luò)以及當(dāng)前幀的第二頻帶的能量或幅度的均值,確定當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包 絡(luò)。在確定滿足預(yù)設(shè)條件的情況下,可以對當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的 擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。在確定不滿足預(yù)設(shè) 條件的情況下,將當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)作為當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0072] 應(yīng)理解,圖1所描述的過程均是針對于當(dāng)前幀的。因此,信號解碼設(shè)備需要預(yù)測的 擴(kuò)展頻帶的頻譜包絡(luò)也是當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0073] 具體地,信號解碼設(shè)備可以根據(jù)擴(kuò)展頻帶的第一頻譜包絡(luò)以及第二頻帶的能量或 幅度的均值,確定擴(kuò)展頻帶的第二頻譜包絡(luò)。例如,可以在第二頻帶的能量或幅度的均值與 第一頻譜包絡(luò)的均值之間的比值大于預(yù)設(shè)值時,對第一頻譜包絡(luò)包括的N個值分別進(jìn)行縮 放,N為正整數(shù)。第一頻譜包絡(luò)的均值可以是第一頻譜包絡(luò)包括的N個值的均值。進(jìn)一步, 可以在第二頻帶的能量或幅度的均值的開方值與第一頻譜包絡(luò)的均值之間的比值大于預(yù) 設(shè)值時,對第一頻譜包絡(luò)包括的N個值分別進(jìn)行縮放。例如,可以將第一頻譜包絡(luò)包括的N 個值分別乘以縮放比例值,該縮放比例值可以根據(jù)第二頻帶的能量或幅度的均值和第一頻 譜包絡(luò)的均值確定。在語音或音頻信號的編碼方式為時域編碼方式的情況下,該縮放比例 值大于1,在語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或頻域編碼方式的情況下,該 縮放比例值小于1。
[0074] 在滿足預(yù)設(shè)條件時,當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)還需要基于前一幀的擴(kuò)展頻帶 的頻譜包絡(luò)進(jìn)行確定。具體地,可以將上述第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò) 進(jìn)行加權(quán),確定當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。在不滿足預(yù)設(shè)條件時,當(dāng)前幀的擴(kuò)展頻帶的 頻帶包絡(luò)可以是第二頻譜包絡(luò)。
[0075] 可選地,作為另一實(shí)施例,信號解碼設(shè)備可以根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜 包絡(luò)以及當(dāng)前幀的第二頻帶的能量或幅度的均值,確定當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包 絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展 頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò);在確定不滿足預(yù)設(shè) 條件的情況下,將當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)作為當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包 絡(luò);根據(jù)解碼信號的基音周期、解碼信號的濁音度因子以及當(dāng)前幀的擴(kuò)展頻帶的第三頻譜 包絡(luò),確定當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
[0076] 具體地,確定當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò)的過程與上述實(shí)施例中確定當(dāng)前 幀的擴(kuò)展頻帶的頻譜包絡(luò)的過程類似,為了避免重復(fù),此處不再贅述。也就是,在上述實(shí)施 例中,將當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò)作為當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò),但此處,為 了使擴(kuò)展頻帶的頻譜包絡(luò)更精確,因此可以對擴(kuò)展頻帶的第三頻譜包絡(luò)進(jìn)行進(jìn)一步修正得 到擴(kuò)展頻帶的頻譜包絡(luò),即可以根據(jù)上述解碼信號(也就是當(dāng)前幀的解碼信號)的基音周期 和濁音度因子,對擴(kuò)展頻帶的第三頻譜包絡(luò)進(jìn)行修正,使得最終的擴(kuò)展頻帶的頻譜包絡(luò)與 濁音度因子成反比,與基音周期成正比,從而確定最終的擴(kuò)展頻帶的頻譜包絡(luò)。
[0077] 例如,可以基于以下等式確定擴(kuò)展頻帶的頻譜包絡(luò)wenv :
[0078] wenv=(al*pitch*pitch+bl*pitch+cl)/(a2*voice_fac*voice_fac+b2*voice_ fac+c2)*wenv3
[0079] 其中,pitch可以表示解碼信號的基音周期,v〇iCe_fac可以表示解碼信號的濁音 度因子,wenv3可以表示擴(kuò)展頻帶的第三頻譜包絡(luò)。al和bl不能同時為0, a2、b2和c2不 能同時為0。
[0080] 這樣,對于擴(kuò)展頻帶存在比特的情況以及擴(kuò)展頻帶是盲頻帶的情況,該實(shí)施例都 可以適用。
[0081] 可選地,作為另一實(shí)施例,上述預(yù)設(shè)條件可以包括以下三個條件中的至少一個:條 件一:當(dāng)前幀的語音或音頻信號的編碼方式與前一幀的語音或音頻信號的編碼方式不相 同;條件二:前一幀的解碼信號為非摩擦音且當(dāng)前幀的解碼信號中第m個頻帶的能量或幅 度的均值與前一幀的解碼信號中第η個頻帶的能量或幅度的均值之間的比值在預(yù)設(shè)的閾 值范圍內(nèi),其中m和η為正整數(shù);條件三:當(dāng)前幀的解碼信號為非摩擦音且當(dāng)前幀的擴(kuò)展頻 帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)之間的比值大于當(dāng)前幀的解碼信號中 第j個頻帶的能量或幅度的均值與前一幀的解碼信號中第k個頻帶的能量或幅度的均值之 間的比值,其中j和k為正整數(shù)。
[0082] 具體地,當(dāng)前幀的語音或音頻信號的編碼方式與前一幀的語音或音頻信號的編碼 方式不相同,可以是指當(dāng)前幀的語音或音頻信號的編碼方式為時域編碼方式,而前一幀的 語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或頻域編碼方式,也可以是指當(dāng)前幀的語 音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或頻域編碼方式,而前一幀的語音或音頻信 號的編碼方式為時域編碼方式。
[0083] 前一幀的解碼信號為非摩擦音,且當(dāng)前幀的解碼信號中第m個頻帶的能量或幅度 的均值與前一幀的解碼信號中第η個頻帶的能量或幅度的均值之間的比值在預(yù)設(shè)的閾值 范圍內(nèi),其中,預(yù)設(shè)的閾值范圍可以是根據(jù)實(shí)際情況進(jìn)行設(shè)定的,本發(fā)明實(shí)施例對此不作限 定。如果當(dāng)前幀的解碼信號和前一幀的解碼信號均是語音信號,并且均是濁音或清音,則該 預(yù)設(shè)的閾值范圍可以適當(dāng)?shù)財(cái)U(kuò)大。
[0084] 此外,在上述條件中,當(dāng)前幀的解碼信號中第m個頻帶的能量或幅度的均值,可以 是根據(jù)預(yù)定義的規(guī)則或?qū)嶋H情況從當(dāng)前幀的解碼信號中選擇第m個頻帶,確定該頻帶的能 量或幅度的均值。此外,還可以將當(dāng)前幀的解碼信號中第m個頻帶的能量或幅度的均值進(jìn) 行存儲,在下一幀時,可以直接獲取存儲的當(dāng)前幀的解碼信號中第m個頻帶的能量或幅度 的均值。因此,前一幀的解碼信號中第η個頻帶的能量或幅度的均值在前一幀時已經(jīng)被存 儲。此時,可以直接獲取存儲的前一幀的解碼信號中第η個頻帶的能量或幅度的均值。如 果當(dāng)前幀的語音或音頻信號的編碼方式與前一幀的語音或音頻信號的編碼方式不相同,則 當(dāng)前幀的解碼信號中第m個頻帶可以不同于前一幀的解碼信號中第η個頻帶。
[0085] 此外,當(dāng)前幀的解碼信號中第j個頻帶的能量或幅度的均值的確定方式可參照上 述第m個頻帶的能量或幅度的均值的確定方式。前一幀的解碼信號中第k個頻帶的能量或 幅度的均值的確定方式可參照上述第η個頻帶的能量或幅度的均值的確定方式。為了避免 重復(fù),此處不再贅述。
[0086] 具體地,在滿足上面三個條件中的至少一個時,信號解碼設(shè)備可以將上述第二頻 譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),確定當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。在 上面三個條件都不滿足時,當(dāng)前幀的擴(kuò)展頻帶的頻帶包絡(luò)可以是第二頻譜包絡(luò)。
[0087] 140,根據(jù)擴(kuò)展頻帶的頻譜包絡(luò)和擴(kuò)展頻帶的激勵信號,確定擴(kuò)展頻帶的頻域信 號。
[0088] 例如,可以將擴(kuò)展頻帶的頻譜包絡(luò)和擴(kuò)展頻帶的激勵信號相乘,確定擴(kuò)展頻帶的 頻域信號。
[0089] 本發(fā)明實(shí)施例中,上述確定擴(kuò)展頻帶的頻域信號的方式,可以稱為頻域頻帶擴(kuò)展 方式。
[0090] 可選地,作為另一實(shí)施例,在語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或 者頻域編碼方式的情況下,信號解碼設(shè)備可以將擴(kuò)展頻帶的頻域信號變換為擴(kuò)展頻帶的第 一時域信號,將解碼信號與擴(kuò)展頻帶的第一時域信號進(jìn)行合成,獲取輸出信號。
[0091] 可選地,作為另一實(shí)施例,在語音或音頻信號的編碼方式為時域編碼方式的情況 下,信號解碼設(shè)備可以根據(jù)時域頻帶擴(kuò)展方式,獲取擴(kuò)展頻帶的第二時域信號。可以將擴(kuò)展 頻帶的頻域信號變換為擴(kuò)展頻帶的第三時域信號。可以對擴(kuò)展頻帶的第二時域信號和擴(kuò)展 頻帶的第三時域信號進(jìn)行合成,獲取擴(kuò)展頻帶的最終時域信號??梢詫⒔獯a信號與擴(kuò)展頻 帶的最終時域信號進(jìn)行合成,獲取輸出信號。
[0092] 具體地,在語音或音頻信號的編碼方式為時域編碼方式的情況下,信號解碼設(shè)備 可以根據(jù)時域頻帶擴(kuò)展方式以及頻域頻帶擴(kuò)展方式,獲取擴(kuò)展頻帶的最終時域信號。然后 可以將解碼信號與擴(kuò)展頻帶的最終時域信號進(jìn)行合成,獲取最終的輸出信號。時域頻帶擴(kuò) 展方式的具體過程可參照現(xiàn)有技術(shù),為了避免重復(fù),此處不再贅述。
[0093] 本發(fā)明實(shí)施例中,通過根據(jù)從語音或音頻信號的比特流中得到的解碼信號分別預(yù) 測擴(kuò)展頻帶的頻譜包絡(luò)和激勵信號,使得能夠確定語音或音頻信號的擴(kuò)展頻帶的頻域信 號,因此能夠提升語音或音頻信號的性能。
[0094] 另一個實(shí)施例中,根據(jù)本發(fā)明實(shí)施例的信號解碼方法,包括:
[0095] 對語音或音頻信號的比特流進(jìn)行解碼,獲取解碼信號;
[0096] 根據(jù)所述解碼信號預(yù)測擴(kuò)展頻帶的激勵信號,其中,所述擴(kuò)展頻帶與所述解碼信 號的頻帶相鄰,且所述解碼信號的頻帶低于所述擴(kuò)展頻帶;
[0097] 按照從所述擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在所述解碼信號的頻帶中選取第一 頻帶和第二頻帶,其中第一頻帶與擴(kuò)展頻帶相鄰,第二頻帶與第一頻帶相鄰;
[0098] 根據(jù)所述第一頻帶的頻譜系數(shù)以及所述第二頻帶的頻譜系數(shù)預(yù)測所述擴(kuò)展頻帶 的頻譜包絡(luò);
[0099] 根據(jù)所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò)展頻帶的激勵信號,確定所述擴(kuò)展頻帶的 頻域信號。
[0100] 本實(shí)施例與上一個實(shí)施例的區(qū)別在于第一頻帶和第二頻帶的選擇方式不同。本實(shí) 施例中,選取的第一頻帶與擴(kuò)展頻帶相鄰,第二頻帶與第一頻帶相鄰;此處的相鄰表示兩個 頻帶之間連續(xù)或者無頻點(diǎn)間隔。具體地,信號解碼設(shè)備可以從擴(kuò)展頻帶的起始點(diǎn)向低頻的 方向,在解碼信號的頻帶中依次選取第一頻帶和第二頻帶。例如,假設(shè)解碼信號的頻帶為 0?6. 4kHz,擴(kuò)展頻帶為6kHz?8kHz,那么第一頻帶可以是4. 8kHz?6. 4kHz,第二頻帶可 以是3. 2kHz?4. 8kHz。假設(shè)解碼信號的頻帶為0?6. 4kHz,擴(kuò)展頻帶為6. 4kHz?14kHz, 那么第一頻帶可以是4kHz?6. 4kHz,第二頻帶可以是3. 2kHz?4kHz。上述數(shù)值的舉例是 為了幫助本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實(shí)施例,而非限制本發(fā)明的范圍。第一頻帶和 第二頻帶可以根據(jù)實(shí)際情況進(jìn)行選取,本發(fā)明實(shí)施例對此不作限定。
[0101] 顯然的,上一個實(shí)施例中除選擇第一頻帶和第二頻帶之外的其他步驟涉及的具體 實(shí)現(xiàn)方式和實(shí)施例都適用于本實(shí)施例中的對應(yīng)步驟。
[0102] 下面結(jié)合具體例子詳細(xì)描述本發(fā)明實(shí)施例。應(yīng)注意,這些例子是為了幫助本領(lǐng)域 技術(shù)人員更好地理解本發(fā)明實(shí)施例,而非限制本發(fā)明實(shí)施例的范圍。
[0103] 圖2是根據(jù)本發(fā)明實(shí)施例的信號解碼方法的過程的示意性流程圖。
[0104] 在圖2中,假設(shè)語音或音頻信號的采樣率為12. 8kHz。
[0105] 201,信號解碼設(shè)備確定語音或音頻信號的編碼方式。
[0106] 202,在信號解碼設(shè)備確定語音或音頻信號的編碼方式不是時域編碼方式的情況 下,例如,該語音或音頻信號的編碼方式為時域聯(lián)合編碼方式或頻域編碼方式,信號解碼設(shè) 備可以采用相應(yīng)的解碼方式對該語音或音頻信號的比特流進(jìn)行解碼,獲取解碼信號。由于 該語音或音頻信號的采樣率為12. 8kHz,那么解碼信號的帶寬為6. 4kHz。為了獲取帶寬為 8kHz的輸出信號,則需要進(jìn)行盲帶寬擴(kuò)展,恢復(fù)頻帶為6kHz?8kHz的信號,也就是擴(kuò)展出 頻帶為6kHz?8kHz的信號。
[0107] 在語音或音頻信號的編碼方式為時域聯(lián)合編碼方式或頻域編碼方式的情況下,信 號解碼設(shè)備可采用頻域頻帶擴(kuò)展方式恢復(fù)擴(kuò)展頻帶6kHz?8kHz的頻域信號。
[0108] 203,信號解碼設(shè)備從步驟202的解碼信號中選取第一頻帶和第二頻帶,并根據(jù)第 一頻帶的頻譜系數(shù)和第二頻帶的頻譜系數(shù),預(yù)測擴(kuò)展頻帶的頻譜包絡(luò)。
[0109] 可選地,信號解碼設(shè)備可以按照從擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在解碼信號 中選取第一頻帶和第二頻帶,其中第一頻帶與擴(kuò)展頻帶相鄰,第一頻帶與第二頻帶相鄰。下 面結(jié)合具體的例子詳細(xì)描述預(yù)測擴(kuò)展頻帶的頻譜包絡(luò)的過程。應(yīng)注意,這個例子只是為了 幫助本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實(shí)施例,而非限制本發(fā)明實(shí)施例的范圍。
[0110] 在下面的例子中,假設(shè)將擴(kuò)展頻帶劃分為兩個子帶,則需要預(yù)測每個子帶的頻譜 包絡(luò)值,此處以wenv[l]和wenv[2]表示兩個子帶的頻譜包絡(luò)值。
[0111] (1)從解碼信號的頻帶中可選取第一頻帶,假設(shè)第一頻帶為4. 8kHz?6. 4kHz, 可將第一頻帶劃分為兩個子帶,第一個子帶為4. 8kHz?5. 6kHz,第二個子帶為5. 6kHz? 6.4kHz。信號解碼設(shè)備可根據(jù)第一個子帶的頻譜系數(shù),確定第一個子帶的能量的均值 enerl??筛鶕?jù)第二個子帶的頻譜系數(shù),確定第二個子帶的能量的均值ener2。
[0112] 假設(shè)預(yù)設(shè)的閾值范圍為(0. 5, 2),如果enerl/ener2>2,則可以對enerl進(jìn)行縮放, 例如 enerl' =enerl*(2*ener2/enerl),ener2 可以保持不變,即 ener2' =ener2。此處, enerl'可以表示第一個子帶的能量的調(diào)整值,ener2'可以表示第二個子帶的能量的調(diào)整 值。
[0113] 如果enerl/ener2〈0. 5,則可以對ener2進(jìn)行縮放,例如 ener2' =ener2*(2*enerl/ener2), enerl 可以保持不變,即 enerl' =enerl。
[0114] 應(yīng)注意,雖然此處根據(jù)第一個子帶的能量的均值和第二個子帶的能量的均值之間 的比值是否在閾值范圍之內(nèi),來確定第一個子帶的能量的調(diào)整值和第二個子帶的能量的調(diào) 整值。但本發(fā)明實(shí)施例中,還可以根據(jù)第一個子帶的能量的均值和第二個子帶的能量的均 值的方差是否在閾值范圍之內(nèi),來確定第一個子帶的能量的調(diào)整值和第二個子帶的能量的 調(diào)整值,確定過程可參照上述根據(jù)比值確定的過程,此處不再贅述。
[0115] 因此,根據(jù)ener"和ener2 ^ ,確定擴(kuò)展頻帶的第一頻譜包絡(luò),第一頻譜包絡(luò) 是對擴(kuò)展頻帶的頻譜包絡(luò)的初步預(yù)測,第一頻譜包絡(luò)包括兩個頻譜包絡(luò)值Wen V[l]'和 wenv [2]' 〇
[0116] 例如,可以按照如下方式確定wenv[l]'和wenv[2]':
[0117]
【權(quán)利要求】
1. 一種信號解碼方法,其特征在于,包括: 對語音或音頻信號的比特流進(jìn)行解碼,獲取解碼信號; 根據(jù)所述解碼信號預(yù)測擴(kuò)展頻帶的激勵信號,其中,所述擴(kuò)展頻帶與所述解碼信號的 頻帶相鄰,且所述解碼信號的頻帶低于所述擴(kuò)展頻帶; 在所述解碼信號中選取第一頻帶和第二頻帶,根據(jù)所述第一頻帶的頻譜系數(shù)以及所述 第二頻帶的頻譜系數(shù)預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò),其中,所述第一頻帶的最高頻點(diǎn)距離 所述擴(kuò)展頻帶的最低頻點(diǎn)小于或等于第一值,所述第二頻帶的最高頻點(diǎn)距離所述第一頻帶 的最低頻點(diǎn)小于或等于第二值; 根據(jù)所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò)展頻帶的激勵信號,確定所述擴(kuò)展頻帶的頻域 信號。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在所述解碼信號中選取第一頻帶和 第二頻帶,包括: 按照從所述擴(kuò)展頻帶的起始點(diǎn)向低頻的方向,在所述解碼信號的頻帶中選取第一頻帶 和第二頻帶;其中所述第一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最低頻點(diǎn)等于所述第一 值,所述第一值為〇 ;所述第二頻帶的最高頻點(diǎn)距離所述第一頻帶的最低頻點(diǎn)等于所述第 二值,所述第二值為0。
3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)所述第一頻帶的頻譜系數(shù)以 及所述第二頻帶的頻譜系數(shù)預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò),包括: 將所述第一頻帶劃分為Μ個子帶,并根據(jù)所述第一頻帶的頻譜系數(shù)確定每個子帶的能 量或幅度的均值,其中Μ為正整數(shù); 根據(jù)所述每個子帶的能量或幅度的均值,確定所述每個子帶的能量或幅度的調(diào)整值; 根據(jù)所述每個子帶的能量或幅度的調(diào)整值,預(yù)測所述擴(kuò)展頻帶的第一頻譜包絡(luò); 根據(jù)所述第二頻帶的頻譜系數(shù),確定所述第二頻帶的能量或幅度的均值; 根據(jù)所述擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均值,預(yù)測所述 擴(kuò)展頻帶的頻譜包絡(luò)。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述每個子帶的能量或幅度的 均值,確定所述每個子帶的能量或幅度的調(diào)整值,包括: 如果所述Μ個子帶的能量或幅度的均值的方差不在預(yù)設(shè)的閾值范圍內(nèi),則將a個子帶 中每個子帶的能量或幅度的均值進(jìn)行調(diào)整以確定所述a個子帶中每個子帶的能量或幅度 的調(diào)整值,并將b個子帶中每個子帶的能量或幅度的均值作為所述b個子帶中每個子帶的 能量或幅度的調(diào)整值,其中所述a個子帶中每個子帶的能量或幅度的均值大于或等于均值 閾值,所述b個子帶中每個子帶的能量或幅度的均值小于所述均值閾值,a和b為正整數(shù), 且 a+b=M ; 如果所述Μ個子帶的能量或幅度的均值的方差在預(yù)設(shè)的閾值范圍內(nèi),則將所述每個子 帶的能量或幅度的均值作為所述每個子帶的能量或幅度的調(diào)整值。
5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述每個子帶的能量或幅度的 均值,確定所述每個子帶的能量或幅度的調(diào)整值,包括: 對于所述Μ個子帶中的第i個子帶和第(i+Ι)個子帶, 如果所述第i個子帶的能量或幅度的均值與所述第(i+1)個子帶的能量或幅度的均值 之間的比值不在預(yù)設(shè)的閾值范圍內(nèi),則在所述第i個子帶的能量或幅度的均值大于所述第 (i+ι)個子帶的能量或幅度的均值時,對所述第i個子帶的能量或幅度的均值進(jìn)行調(diào)整以 確定所述第i個子帶的能量或幅度的調(diào)整值,并將所述第(i+ι)個子帶的能量或幅度的均 值作為所述第(i+ι)個子帶的能量或幅度的調(diào)整值;在所述第i個子帶的能量或幅度的均 值小于所述第(i+ι)個子帶的能量或幅度的均值時,對所述第(i+ι)個子帶的能量或幅度 的均值進(jìn)行調(diào)整以確定所述第(i+ι)個子帶的能量或幅度的調(diào)整值,并將所述第i個子帶 的能量或幅度的均值作為所述第i個子帶的能量或幅度的調(diào)整值; 如果所述第i個子帶的能量或幅度的均值與所述第(i+ι)個子帶的能量或幅度的均值 之間的比值在預(yù)設(shè)的閾值范圍內(nèi),則將所述第i個子帶的能量或幅度的均值作為所述第i 個子帶的能量或幅度的調(diào)整值,并將所述第(i+ι)個子帶的能量或幅度的均值作為所述第 (i+Ι)個子帶的調(diào)整值,其中i為正整數(shù)且1彡i彡M-1。
6. 根據(jù)權(quán)利要求3至5中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述擴(kuò)展頻帶的 第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均值,預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò),包 括: 根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的 均值,確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò); 在確定滿足預(yù)設(shè)條件的情況下,對所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的 擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò); 在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)作為所述 當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
7. 根據(jù)權(quán)利要求3至5中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述擴(kuò)展頻帶的 第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均值,預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò),包 括: 根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的 均值,確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò); 在確定滿足預(yù)設(shè)條件的情況下,對所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的 擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò); 在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò)作為所述 當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò); 根據(jù)所述解碼信號的基音周期、所述解碼信號的濁音度因子以及所述當(dāng)前幀的擴(kuò)展頻 帶的第三頻譜包絡(luò),確定所述當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
8. 根據(jù)權(quán)利要求6或7所述的方法,其特征在于,所述預(yù)設(shè)條件包括以下三個條件中的 至少一個: 條件一:所述當(dāng)前幀的語音或音頻信號的編碼方式與所述前一幀的語音或音頻信號的 編碼方式不相同; 條件二:所述前一幀的解碼信號為非摩擦音,且所述當(dāng)前幀的解碼信號中第m個頻帶 的能量或幅度的均值與所述前一幀的解碼信號中第η個頻帶的能量或幅度的均值之間的 比值在預(yù)設(shè)的閾值范圍內(nèi),其中m和η為正整數(shù); 條件三:所述當(dāng)前幀的解碼信號為非摩擦音,且所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包 絡(luò)與所述前一幀的擴(kuò)展頻帶的頻譜包絡(luò)之間的比值大于所述當(dāng)前幀的解碼信號中第j個 頻帶的能量或幅度的均值與所述前一幀的解碼信號中第k個頻帶的能量或幅度的均值之 間的比值,其中j和k為正整數(shù)。
9. 根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述解碼信號預(yù)測 所述擴(kuò)展頻帶的激勵信號,包括: 在所述語音或音頻信號的編碼方式為時域編碼方式的情況下,從所述解碼信號中選取 第三頻帶,所述第三頻帶與所述擴(kuò)展頻帶相鄰; 根據(jù)所述第三頻帶的頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
10. 根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述解碼信號預(yù) 測所述擴(kuò)展頻帶的激勵信號,包括: 在所述語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或者頻域編碼方式的情況下, 從所述解碼信號中選取第四頻帶,所述第四頻帶所分配的比特?cái)?shù)目大于預(yù)設(shè)的比特?cái)?shù)目閾 值; 根據(jù)所述第四頻帶的頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
11. 根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法,其特征在于,所述方法還包括: 在所述語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或者頻域編碼方式的情況下, 將所述解碼信號與所述擴(kuò)展頻帶的頻域信號進(jìn)行合成,獲取頻域輸出信號; 將所述頻域輸出信號進(jìn)行頻時變換,獲取最終輸出信號。
12. 根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法,其特征在于,所述方法還包括: 在所述語音或音頻信號的編碼方式為時域編碼方式的情況下,根據(jù)時域頻帶擴(kuò)展方 式,獲取所述擴(kuò)展頻帶的第一時域信號; 將所述擴(kuò)展頻帶的頻域信號變換為所述擴(kuò)展頻帶的第二時域信號; 對所述擴(kuò)展頻帶的第一時域信號和所述擴(kuò)展頻帶的第二時域信號進(jìn)行合成,獲取所述 擴(kuò)展頻帶的最終時域信號; 將所述解碼信號與所述擴(kuò)展頻帶的最終時域信號進(jìn)行合成,獲取最終輸出信號。
13. -種信號解碼設(shè)備,其特征在于,包括: 解碼單元,用于對語音或音頻信號的比特流進(jìn)行解碼,獲取解碼信號; 所述預(yù)測單元,用于從所述解碼單元接收所述解碼信號,并根據(jù)所述解碼信號預(yù)測擴(kuò) 展頻帶的激勵信號,其中,所述擴(kuò)展頻帶與所述解碼信號的頻帶相鄰,且所述解碼信號的頻 帶低于所述擴(kuò)展頻帶; 所述預(yù)測單元,還用于在所述解碼信號中選取第一頻帶和第二頻帶,并根據(jù)所述第一 頻帶的頻譜系數(shù)以及所述第二頻帶的頻譜系數(shù)預(yù)測所述擴(kuò)展頻帶的頻譜包絡(luò),其中,所述 第一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最低頻點(diǎn)小于或等于第一值,所述第二頻帶的最 高頻點(diǎn)距離所述第一頻帶的最低頻點(diǎn)小于或等于第二值; 所述確定單元,用于從所述預(yù)測單元接收所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò)展頻帶的 激勵信號,根據(jù)所述擴(kuò)展頻帶的頻譜包絡(luò)和所述擴(kuò)展頻帶的激勵信號,確定所述擴(kuò)展頻帶 的頻域信號。
14. 根據(jù)權(quán)利要求13所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于按照從所述擴(kuò) 展頻帶的起始點(diǎn)向低頻的方向,在所述解碼信號中選取第一頻帶和第二頻帶,其中所述第 一頻帶的最高頻點(diǎn)距離所述擴(kuò)展頻帶的最低頻點(diǎn)等于所述第一值,所述第一值為ο;所述 第二頻帶的最高頻點(diǎn)距離所述第一頻帶的最低頻點(diǎn)等于所述第二值,所述第二值為0。
15. 根據(jù)權(quán)利要求13或14所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于將所述第 一頻帶劃分為Μ個子帶,并根據(jù)所述第一頻帶的頻譜系數(shù)確定每個子帶的能量或幅度的均 值,其中Μ為正整數(shù);根據(jù)所述每個子帶的能量或幅度的均值,確定所述每個子帶的能量或 幅度的調(diào)整值;根據(jù)所述每個子帶的能量或幅度的調(diào)整值,預(yù)測所述擴(kuò)展頻帶的第一頻譜 包絡(luò);根據(jù)所述第二頻帶的頻譜系數(shù),確定所述第二頻帶的能量或幅度的均值;根據(jù)所述 擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述第二頻帶的能量或幅度的均值,預(yù)測所述擴(kuò)展頻帶的頻 譜包絡(luò)。
16. 根據(jù)權(quán)利要求15所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于如果所述Μ個子 帶的能量或幅度的均值的方差不在預(yù)設(shè)的閾值范圍內(nèi),則將a個子帶中每個子帶的能量或 幅度的均值進(jìn)行調(diào)整以確定所述a個子帶中每個子帶的能量或幅度的調(diào)整值,并將b個子 帶中每個子帶的能量或幅度的均值作為所述b個子帶中每個子帶的能量或幅度的調(diào)整值, 其中所述a個子帶中每個子帶的能量或幅度的均值大于或等于均值閾值,所述b個子帶中 每個子帶的能量或幅度的均值小于所述均值閾值,a和b為正整數(shù),且a+b=M ;如果所述Μ個 子帶的能量或幅度的均值的方差在預(yù)設(shè)的閾值范圍內(nèi),則將所述每個子帶的能量或幅度的 均值作為所述每個子帶的能量或幅度的調(diào)整值。
17. 根據(jù)權(quán)利要求15所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于對于所述Μ個子 帶中的第i個子帶和第(i+1)個子帶, 如果所述第i個子帶的能量或幅度的均值與所述第(i+Ι)個子帶的能量或幅度的均值 之間的比值不在預(yù)設(shè)的閾值范圍內(nèi),則在所述第i個子帶的能量或幅度的均值大于所述第 (i+Ι)個子帶的能量或幅度的均值時,對所述第i個子帶的能量或幅度的均值進(jìn)行調(diào)整以 確定所述第i個子帶的能量或幅度的調(diào)整值,并將所述第(i+Ι)個子帶的能量或幅度的均 值作為所述第(i+Ι)個子帶的能量或幅度的調(diào)整值;在所述第i個子帶的能量或幅度的均 值小于所述第(i+Ι)個子帶的能量或幅度的均值時,對所述第(i+Ι)個子帶的能量或幅度 均值進(jìn)行調(diào)整以確定所述第(i+Ι)個子帶的能量或幅度的調(diào)整值,并將所述第i個子帶的 能量或幅度的均值作為所述第i個子帶的能量或幅度的調(diào)整值; 如果所述第i個子帶的能量或幅度的均值與所述第(i+1)個子帶的能量或幅度的均值 之間的比值在預(yù)設(shè)的閾值范圍內(nèi),則將所述第i個子帶的能量或幅度的均值作為所述第i 個子帶的能量或幅度的調(diào)整值,并將所述第(i+1)個子帶的能量或幅度的均值作為所述第 (i+Ι)個子帶的調(diào)整值,其中i為正整數(shù)且1彡i彡M-1。
18. 根據(jù)權(quán)利要求15至17中任一項(xiàng)所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于 根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的均值, 確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對所述當(dāng)前 幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述當(dāng)前 幀的擴(kuò)展頻帶的頻譜包絡(luò);在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻帶的 第二頻譜包絡(luò)作為所述當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
19. 根據(jù)權(quán)利要求15至17中任一項(xiàng)所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于 根據(jù)當(dāng)前幀的擴(kuò)展頻帶的第一頻譜包絡(luò)以及所述當(dāng)前幀的第二頻帶的能量或幅度的均值, 確定所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包絡(luò);在確定滿足預(yù)設(shè)條件的情況下,對所述當(dāng)前 幀的擴(kuò)展頻帶的第二頻譜包絡(luò)與前一幀的擴(kuò)展頻帶的頻譜包絡(luò)進(jìn)行加權(quán),以確定所述當(dāng)前 幀的擴(kuò)展頻帶的第三頻譜包絡(luò);在確定不滿足預(yù)設(shè)條件的情況下,將所述當(dāng)前幀的擴(kuò)展頻 帶的第二頻譜包絡(luò)作為所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò);根據(jù)所述解碼信號的基音 周期、所述解碼信號的濁音度因子以及所述當(dāng)前幀的擴(kuò)展頻帶的第三頻譜包絡(luò),確定所述 當(dāng)前幀的擴(kuò)展頻帶的頻譜包絡(luò)。
20. 根據(jù)權(quán)利要求18或19所述的設(shè)備,其特征在于,所述預(yù)設(shè)條件包括以下三個條件 中的至少一個: 條件一:所述當(dāng)前幀的語音或音頻信號的編碼方式與所述前一幀的語音或音頻信號的 編碼方式不相同; 條件二:所述前一幀的解碼信號為非摩擦音,且所述當(dāng)前幀的解碼信號中第m個頻帶 的能量或幅度的均值與所述前一幀的解碼信號中第η個頻帶的能量或幅度的均值之間的 比值在預(yù)設(shè)的閾值范圍內(nèi),其中m和η為正整數(shù); 條件三:所述當(dāng)前幀的解碼信號為非摩擦音,且所述當(dāng)前幀的擴(kuò)展頻帶的第二頻譜包 絡(luò)與所述前一幀的擴(kuò)展頻帶的頻譜包絡(luò)之間的比值大于所述當(dāng)前幀的解碼信號中第j個 頻帶的能量或幅度的均值與所述前一幀的解碼信號中第k個頻帶的能量或幅度的均值之 間的比值,j和k為正整數(shù)。
21. 根據(jù)權(quán)利要求13至20中任一項(xiàng)所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于 在所述語音或音頻信號的編碼方式為時域編碼方式的情況下,從所述解碼信號中選取第三 頻帶,所述第三頻帶與所述擴(kuò)展頻帶相鄰;根據(jù)所述第三頻帶的頻譜系數(shù),預(yù)測所述擴(kuò)展頻 帶的激勵信號。
22. 根據(jù)權(quán)利要求13至20中任一項(xiàng)所述的設(shè)備,其特征在于,所述預(yù)測單元具體用于 在所述語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或者頻域編碼方式的情況下,從所 述解碼信號中選取第四頻帶,所述第四頻帶所分配的比特?cái)?shù)目大于預(yù)設(shè)的比特?cái)?shù)目閾值; 根據(jù)所述第四頻帶的頻譜系數(shù),預(yù)測所述擴(kuò)展頻帶的激勵信號。
23. 根據(jù)權(quán)利要求13至22中任一項(xiàng)所述的設(shè)備,其特征在于,所述設(shè)備還包括: 第一合成單元,用于在所述語音或音頻信號的編碼方式為時頻聯(lián)合編碼方式或者頻域 編碼方式的情況下,將所述解碼信號與所述擴(kuò)展頻帶的頻域信號進(jìn)行合成,獲取頻域輸出 信號; 第一變換單元,用于將所述頻域輸出信號進(jìn)行頻時變換,獲取最終輸出信號。
24. 根據(jù)權(quán)利要求13至22中任一項(xiàng)所述的設(shè)備,其特征在于,所述設(shè)備還包括: 獲取單元,用于在所述語音或音頻信號的編碼方式為時域編碼方式的情況下,根據(jù)時 域頻帶擴(kuò)展方式,獲取所述擴(kuò)展頻帶的第一時域信號; 第二變換單元,用于將所述擴(kuò)展頻帶的頻域信號變換為所述擴(kuò)展頻帶的第二時域信 號; 第二合成單元,用于對所述擴(kuò)展頻帶的第一時域信號和所述擴(kuò)展頻帶的第二時域信號 進(jìn)行合成,獲取所述擴(kuò)展頻帶的最終時域信號; 第二合成單元還用于將所述解碼信號與所述擴(kuò)展頻帶的最終時域信號進(jìn)行合成,獲取 最終輸出信號。
25. -種信號編碼方法,其特征在于,包括: 對語音或音頻信號進(jìn)行核心層編碼,得到所述語音或音頻信號的核心層碼流; 對所述語音或音頻信號進(jìn)行擴(kuò)展層處理,確定擴(kuò)展頻帶的第一包絡(luò); 根據(jù)所述語音或音頻信號的信噪比、所述語音或音頻信號的基音周期和所述擴(kuò)展頻帶 的第一包絡(luò),確定所述擴(kuò)展頻帶的第二包絡(luò); 對所述第二包絡(luò)進(jìn)行編碼,得到擴(kuò)展層碼流; 向解碼端發(fā)送所述核心層碼流和所述擴(kuò)展層碼流。
26. -種信號解碼方法,其特征在于,包括: 從編碼端接收語音或音頻信號的核心層碼流和擴(kuò)展層碼流; 對所述擴(kuò)展層碼流進(jìn)行解碼,確定擴(kuò)展頻帶的第二包絡(luò),其中所述第二包絡(luò)是所述編 碼端根據(jù)所述語音或音頻信號的信噪比、所述語音或音頻信號的基音周期和所述擴(kuò)展頻帶 的第一包絡(luò)確定的; 對所述核心層碼流進(jìn)行解碼,得到核心層語音或音頻信號; 根據(jù)所述核心層語音或音頻信號,預(yù)測所述擴(kuò)展頻帶的激勵信號; 根據(jù)所述擴(kuò)展頻帶的激勵信號和所述擴(kuò)展頻帶的第二包絡(luò),預(yù)測所述擴(kuò)展頻帶的信 號。
27. -種信號編碼設(shè)備,其特征在于,包括: 編碼單元,用于對語音或音頻信號進(jìn)行核心層編碼,得到所述語音或音頻信號的核心 層碼流; 第一確定單元,用于對所述語音或音頻信號進(jìn)行擴(kuò)展層處理,確定所述擴(kuò)展頻帶的第 一包絡(luò); 第二確定單元,用于根據(jù)所述語音或音頻信號的信噪比、所述語音或音頻信號的基音 周期和所述擴(kuò)展頻帶的第一包絡(luò),確定所述擴(kuò)展頻帶的第二包絡(luò); 所述編碼單元還用于對所述第二包絡(luò)進(jìn)行編碼,得到擴(kuò)展層碼流; 發(fā)送單元,用于向解碼端發(fā)送所述核心層碼流和所述擴(kuò)展層碼流。
28. -種信號解碼設(shè)備,其特征在于,包括: 接收單元,用于從編碼端接收語音或音頻信號的核心層碼流和擴(kuò)展層碼流; 解碼單元,用于對所述擴(kuò)展層碼流進(jìn)行解碼,確定擴(kuò)展頻帶的第二包絡(luò),其中所述第二 包絡(luò)是所述編碼端根據(jù)所述語音或音頻信號的信噪比、所述語音或音頻信號的基音周期和 所述擴(kuò)展頻帶的第一包絡(luò)確定的; 所述解碼單元,還用于對所述核心層碼流進(jìn)行解碼,得到核心層語音或音頻信號; 預(yù)測單元,用于根據(jù)所述核心層語音或音頻信號,預(yù)測所述擴(kuò)展頻帶的激勵信號; 所述預(yù)測單元還用于根據(jù)所述擴(kuò)展頻帶的激勵信號和所述擴(kuò)展頻帶的第二包絡(luò),預(yù)測 所述擴(kuò)展頻帶的信號。
【文檔編號】G10L19/20GK104217727SQ201310213593
【公開日】2014年12月17日 申請日期:2013年5月31日 優(yōu)先權(quán)日:2013年5月31日
【發(fā)明者】劉澤新, 苗磊 申請人:華為技術(shù)有限公司