国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      信號(hào)編碼方法及設(shè)備的制作方法

      文檔序號(hào):2826017閱讀:117來源:國知局
      信號(hào)編碼方法及設(shè)備的制作方法
      【專利摘要】本發(fā)明實(shí)施例提供了信號(hào)編碼方法及設(shè)備。該方法包括:在當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式的情況下,預(yù)測(cè)在當(dāng)前輸入幀被編碼為SID幀的情況下解碼器根據(jù)當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí)際靜音信號(hào),其中當(dāng)前輸入幀為靜音幀;確定舒適噪聲與實(shí)際靜音信號(hào)的偏離程度;根據(jù)偏離程度,確定當(dāng)前輸入幀的編碼方式,當(dāng)前輸入幀的編碼方式包括拖尾幀編碼方式或SID幀編碼方式;根據(jù)當(dāng)前輸入幀的編碼方式,對(duì)當(dāng)前輸入幀進(jìn)行編碼。本發(fā)明實(shí)施例中,通過根據(jù)舒適噪聲與實(shí)際靜音信號(hào)的偏離程度確定當(dāng)前輸入幀的編碼方式為拖尾幀編碼方式或SID幀編碼方式,能夠節(jié)省通信帶寬。
      【專利說明】信號(hào)編碼方法及設(shè)備

      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及信號(hào)處理領(lǐng)域,并且具體地,涉及信號(hào)編碼方法及設(shè)備。

      【背景技術(shù)】
      [0002] 非連續(xù)傳輸系統(tǒng)(Discontinuous Transmission, DTX)是一種被廣泛應(yīng)用的語音 通信系統(tǒng),能夠在語音通信的靜音期間采用非連續(xù)的編碼和傳輸語音幀的方式減少信道帶 寬的占用,同時(shí)仍能夠保證足夠的主觀通話質(zhì)量。
      [0003] 語音信號(hào)通??梢苑譃閮深?,即活動(dòng)語音信號(hào)和靜音信號(hào)?;顒?dòng)語音信號(hào)是指包 含有通話語音的信號(hào),而靜音信號(hào)則是指不含有通話語音的信號(hào)。在DTX系統(tǒng)中,對(duì)活動(dòng) 語音信號(hào)采用連續(xù)傳輸?shù)姆椒ㄟM(jìn)行傳輸,對(duì)靜音信號(hào)采用非連續(xù)傳輸?shù)姆椒ㄟM(jìn)行傳輸。這 種對(duì)靜音信號(hào)的非連續(xù)傳輸,是通過編碼端間歇地編碼并發(fā)送一種叫靜音描述幀(Si lence Descriptor,SID)的特殊編碼幀來實(shí)現(xiàn)的,兩個(gè)相鄰的SID幀之間DTX系統(tǒng)不會(huì)編碼任何其 它的信號(hào)幀。解碼端根據(jù)非連續(xù)接收到的SID幀自主地生成令用戶主觀聽覺舒適的噪聲。 這種舒適噪聲(Comfort Noise, CN)并非以如實(shí)的還原原始靜音信號(hào)為目的,而是為了滿足 解碼端用戶的主觀聽覺質(zhì)量要求,不要有不適感。
      [0004] 為了在解碼端獲得更好的主觀聽覺質(zhì)量,由語音活動(dòng)段到CN段的過渡質(zhì)量是至 關(guān)重要的。為了獲得更平滑的過渡,一種有效的方法是:在由語音活動(dòng)段過渡到靜音段時(shí), 編碼端不立即過渡到非連續(xù)傳輸狀態(tài),而是額外延遲一段時(shí)間。在這段時(shí)間內(nèi),靜音段開 頭的部分靜音幀仍然被視作語音活動(dòng)幀連續(xù)的編碼和發(fā)送,即設(shè)置一個(gè)連續(xù)傳輸?shù)耐衔矃^(qū) 間。這樣做的好處是解碼端可以充分地利用這段拖尾區(qū)間內(nèi)的靜音信號(hào)更好地估計(jì)和提取 靜音信號(hào)的特征,以生成更優(yōu)的CN。
      [0005] 但是,在現(xiàn)有技術(shù)中沒有對(duì)拖尾機(jī)制進(jìn)行高效的控制。拖尾機(jī)制的觸發(fā)條件是比 較簡(jiǎn)單的,即通過簡(jiǎn)單地統(tǒng)計(jì)在語音活動(dòng)結(jié)束時(shí)是否有足夠數(shù)量的語音活動(dòng)幀被連續(xù)地編 碼和發(fā)送來確定是否觸發(fā)拖尾機(jī)制,而觸發(fā)拖尾機(jī)制后,固定長(zhǎng)度的拖尾區(qū)間就會(huì)被強(qiáng)制 執(zhí)行。然而,并非有足夠數(shù)量的語音活動(dòng)幀被連續(xù)地編碼和發(fā)送就一定需要執(zhí)行固定長(zhǎng)度 的拖尾區(qū)間,例如在通信環(huán)境的背景噪聲比較平穩(wěn)時(shí),即使不設(shè)置拖尾區(qū)間或設(shè)置較短的 拖尾區(qū)間,解碼端也能獲得優(yōu)質(zhì)的CN。因此,這種對(duì)拖尾機(jī)制的簡(jiǎn)單控制模式造成了通信帶 寬的浪費(fèi)。


      【發(fā)明內(nèi)容】

      [0006] 本發(fā)明實(shí)施例提供信號(hào)編碼方法及設(shè)備,能夠節(jié)省通信帶寬。
      [0007] 第一方面,提供了一種信號(hào)編碼方法,包括:在當(dāng)前輸入巾貞的前一巾貞的編碼方式 為連續(xù)編碼方式的情況下,預(yù)測(cè)在所述當(dāng)前輸入幀被編碼為靜音描述SID幀的情況下解碼 器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí)際靜音信號(hào),其中所述當(dāng)前輸入幀為靜 音幀;確定所述舒適噪聲與所述實(shí)際靜音信號(hào)的偏離程度;根據(jù)所述偏離程度,確定所述 當(dāng)前輸入幀的編碼方式,所述當(dāng)前輸入幀的編碼方式包括拖尾幀編碼方式或SID幀編碼方 式;根據(jù)所述當(dāng)前輸入幀的編碼方式,對(duì)所述當(dāng)前輸入幀進(jìn)行編碼。
      [0008] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述預(yù)測(cè)在所述當(dāng)前輸入幀被編碼 為SID幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí)際靜音信號(hào),包 括:預(yù)測(cè)所述舒適噪聲的特征參數(shù),并確定所述實(shí)際靜音信號(hào)的特征參數(shù),其中所述舒適噪 聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)是一一對(duì)應(yīng)的;
      [0009] 所述確定所述舒適噪聲與所述實(shí)際靜音信號(hào)的偏離程度,包括:確定所述舒適噪 聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離。
      [0010] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述根據(jù) 所述偏離程度,確定所述當(dāng)前輸入幀的編碼方式,包括:在所述舒適噪聲的特征參數(shù)與所述 實(shí)際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸 入幀的編碼方式為所述SID幀編碼方式,其中所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信 號(hào)的特征參數(shù)之間的距離與所述閾值集合中的閾值是一一對(duì)應(yīng)的;在所述舒適噪聲的特征 參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離大于或等于所述閾值集合中對(duì)應(yīng)閾值的 情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方式。
      [0011] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在第三種可能 的實(shí)現(xiàn)方式中,所述舒適噪聲的特征參數(shù)用于表征以下至少一種信息:能量信息,譜信息。
      [0012] 結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述能量 信息包括碼激勵(lì)線性預(yù)測(cè)CELP激勵(lì)能量;
      [0013] 所述譜信息包括以下至少一種:線性預(yù)測(cè)濾波器系數(shù),快速傅立葉變換FFT系數(shù), 修正離散余弦變換MDCT系數(shù);
      [0014] 所述線性預(yù)測(cè)濾波器系數(shù)包括以下至少一種:線譜頻率LSF系數(shù),線譜對(duì)LSP系 數(shù),導(dǎo)抗譜頻率ISF系數(shù),導(dǎo)譜對(duì)ISP系數(shù),反射系數(shù),線性預(yù)測(cè)編碼LPC系數(shù)。
      [0015] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式至第四種可能的實(shí)現(xiàn)方式中任一實(shí)現(xiàn)方 式,在第五種可能的實(shí)現(xiàn)方式中,所述預(yù)測(cè)所述舒適噪聲的特征參數(shù),包括:根據(jù)所述當(dāng)前 輸入幀的前一幀的舒適噪聲參數(shù)和所述當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)所述舒適噪聲的特征 參數(shù);或者,根據(jù)所述當(dāng)前輸入幀之前的L個(gè)拖尾幀的特征參數(shù)和所述當(dāng)前輸入幀的特征 參數(shù),預(yù)測(cè)所述舒適噪聲的特征參數(shù),其中L為正整數(shù)。
      [0016] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式至第五種可能的實(shí)現(xiàn)方式中任一實(shí)現(xiàn)方 式,在第六種可能的實(shí)現(xiàn)方式中,所述確定所述實(shí)際靜音信號(hào)的特征參數(shù),包括:確定所述 當(dāng)前輸入幀的特征參數(shù)作為所述實(shí)際靜音信號(hào)的特征參數(shù);或者,對(duì)Μ個(gè)靜音幀的特征參 數(shù)進(jìn)行統(tǒng)計(jì)處理,以確定所述實(shí)際靜音信號(hào)的特征參數(shù)。
      [0017] 結(jié)合第一方面的第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,所述Μ個(gè) 靜音幀包括所述當(dāng)前輸入幀以及所述當(dāng)前輸入幀之前的(Μ-l)個(gè)靜音幀,Μ為正整數(shù)。
      [0018] 結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述舒適 噪聲的特征參數(shù)包括所述舒適噪聲的碼激勵(lì)線性預(yù)測(cè)CELP激勵(lì)能量和所述舒適噪聲的線 譜頻率LSF系數(shù),所述實(shí)際靜音信號(hào)的特征參數(shù)包括所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量和 所述實(shí)際靜音信號(hào)的LSF系數(shù);
      [0019] 所述確定所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離, 包括:確定所述舒適噪聲的CELP激勵(lì)能量與所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量之間的距 離De,并確定所述舒適噪聲的LSF系數(shù)與所述實(shí)際靜音信號(hào)的LSF系數(shù)之間的距離Dlsf。
      [0020] 結(jié)合第一方面的第八種可能的實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,所述在所 述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集合中對(duì)應(yīng) 閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述SID幀編碼方式,包括:在所述距離 De小于第一閾值,且所述距離Dlsf小于第二閾值的情況下,確定所述當(dāng)前輸入幀的編碼方 式為所述SID幀編碼方式;
      [0021] 所述在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離大 于或等于所述閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾 幀編碼方式,包括:在所述距離De大于或等于第一閾值,或者所述距離Dlsf大于或等于第 二閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方式。
      [0022] 結(jié)合第一方面的第九種可能的實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,還包括:獲 取預(yù)設(shè)的所述第一閾值和預(yù)設(shè)的所述第二閾值;或者,根據(jù)所述當(dāng)前輸入幀之前的N個(gè)靜 音幀的CELP激勵(lì)能量確定所述第一閾值,并根據(jù)所述N個(gè)靜音幀的LSF系數(shù)確定所述第二 閾值,其中N為正整數(shù)。
      [0023] 結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式至第十種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第十一種可能的實(shí)現(xiàn)方式中,所述預(yù)測(cè)在所述當(dāng)前輸入幀被編碼為SID 幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,包括:采用第一預(yù)測(cè)方式,預(yù)測(cè)所 述舒適噪聲,其中所述第一預(yù)測(cè)方式與所述解碼器生成所述舒適噪聲的方式相同。
      [0024] 第二方面,提供了一種信號(hào)處理方法,包括:確定P個(gè)靜音幀中每個(gè)靜音幀的組加 權(quán)譜距離,其中所述P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離為所述P個(gè)靜音幀中所述每 個(gè)靜音幀與其它(P-1)個(gè)靜音幀之間的加權(quán)譜距離之和,P為正整數(shù);根據(jù)所述P個(gè)靜音幀 中每個(gè)靜音幀的組加權(quán)譜距離,確定第一譜參數(shù),其中所述第一譜參數(shù)用于生成舒適噪聲。
      [0025] 結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述每個(gè)靜音幀與一組加權(quán)系數(shù)相 對(duì)應(yīng),其中在所述一組加權(quán)系數(shù)中,對(duì)應(yīng)于第一組子帶的加權(quán)系數(shù)大于對(duì)應(yīng)于第二組子帶 的加權(quán)系數(shù),其中所述第一組子帶的感知重要性大于所述第二組子帶的感知重要性。
      [0026] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式 中,所述根據(jù)所述P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離,確定第一譜參數(shù),包括:從所 述P個(gè)靜音幀中選擇第一靜音幀,使得在所述P個(gè)靜音幀中所述第一靜音幀的組加權(quán)譜距 離最小;將所述第一靜音幀的譜參數(shù)確定為所述第一譜參數(shù)。
      [0027] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式 中,所述根據(jù)所述P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離,確定第一譜參數(shù),包括:從所 述P個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得在所述P個(gè)靜音幀中所述至少一個(gè)靜音幀的組 加權(quán)譜距離均小于第三閾值;根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述第一譜參數(shù)。
      [0028] 結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式至第三種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述P個(gè)靜音幀包括所述當(dāng)前輸入靜音幀以 及所述當(dāng)前輸入靜音幀之前的(p-l)個(gè)靜音幀。
      [0029] 結(jié)合第二方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,還包括:將 當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所述第一譜參數(shù)。
      [0030] 第三方面,提供了一種信號(hào)處理方法,包括:將輸入信號(hào)的頻帶劃分為R個(gè)子帶, 其中R為正整數(shù);在所述R個(gè)子帶中的每個(gè)子帶上,確定S個(gè)靜音幀中每個(gè)靜音幀的子帶 組譜距離,所述S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離為在所述每個(gè)子帶上所述S個(gè)靜 音幀中所述每個(gè)靜音幀與其它(S-1)個(gè)靜音幀之間的譜距離之和,S為正整數(shù);在所述每個(gè) 子帶上根據(jù)所述S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè)子帶的第一譜參 數(shù),其中所述每個(gè)子帶的第一譜參數(shù)用于生成舒適噪聲。
      [0031] 結(jié)合第三方面,在第一種可能的實(shí)現(xiàn)方式中,所述在所述每個(gè)子帶上,根據(jù)所述S 個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè)子帶的第一譜參數(shù),包括:在所述每 個(gè)子帶上,從所述S個(gè)靜音幀中選擇第一靜音幀,使得在所述每個(gè)子帶上所述S個(gè)靜音幀中 所述第一靜音幀的子帶組譜距離最??;在所述每個(gè)子帶上,將所述第一靜音幀的譜參數(shù)確 定為所述每個(gè)子帶的第一譜參數(shù)。
      [0032] 結(jié)合第三方面,在第二種可能的實(shí)現(xiàn)方式中,所述在所述每個(gè)子帶上,根據(jù)所述S 個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè)子帶的第一譜參數(shù),包括:在所述每 個(gè)子帶上,從所述S個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得所述至少一個(gè)靜音幀的子帶組 譜距離均小于第四閾值;在所述每個(gè)子帶上,根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述 每個(gè)子帶的第一譜參數(shù)。
      [0033] 結(jié)合第三方面或第三方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在 第三種可能的實(shí)現(xiàn)方式中,所述S個(gè)靜音幀包括當(dāng)前輸入靜音幀以及所述當(dāng)前輸入靜音幀 之前的(S-1)個(gè)靜音幀。
      [0034] 結(jié)合第三方面的第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,還包括:將 所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所述每個(gè)子帶的第一譜 參數(shù)。
      [0035] 第四方面,提供了一種信號(hào)處理方法,包括:確定T個(gè)靜音幀中每個(gè)靜音幀的第一 參數(shù),所述第一參數(shù)用于表征譜熵,T為正整數(shù);根據(jù)所述T個(gè)靜音幀中每個(gè)靜音幀的第一 參數(shù),確定第一譜參數(shù),其中所述第一譜參數(shù)用于生成舒適噪聲。
      [0036] 結(jié)合第四方面,在第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述T個(gè)靜音幀中每個(gè)靜 音幀的第一參數(shù),確定第一譜參數(shù),包括:在確定能夠按照聚類準(zhǔn)則將所述T個(gè)靜音幀分為 第一組靜音幀和第二組靜音幀的情況下,根據(jù)所述第一組靜音幀的譜參數(shù),確定所述第一 譜參數(shù),其中所述第一組靜音幀的第一參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一 參數(shù)所表征的譜熵;在確定不能夠按照聚類準(zhǔn)則將所述T個(gè)靜音幀分為第一組靜音幀和第 二組靜音幀的情況下,對(duì)所述T個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜 參數(shù),其中所述第一組靜音幀的第一參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參 數(shù)所表征的譜熵。
      [0037] 結(jié)合第四方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述聚類 準(zhǔn)則包括:所述第一組靜音幀中每個(gè)靜音幀的第一參數(shù)與第一均值之間的距離小于或等于 所述第一組靜音幀中每個(gè)靜音幀的第一參數(shù)與第二均值之間的距離;所述第二組靜音幀中 每個(gè)靜音幀的第一參數(shù)與所述第二均值之間的距離小于或等于所述第二組靜音幀中每個(gè) 靜音幀的第一參數(shù)與所述第一均值之間的距離;所述第一均值與所述第二均值之間的距離 大于所述第一組靜音幀的第一參數(shù)與所述第一均值之間的平均距離;所述第一均值與所述 第二均值之間的距離大于所述第二組靜音幀的第一參數(shù)與所述第二均值之間的平均距離; 其中,所述第一均值為所述第一組靜音幀的第一參數(shù)的平均值,所述第二均值為所述第二 組靜音幀的第一參數(shù)的平均值。
      [0038] 結(jié)合第四方面,在第三種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述T個(gè)靜音幀中每個(gè)靜 音幀的第一參數(shù),確定第一譜參數(shù),包括:
      [0039] 對(duì)所述T個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù);其中,對(duì) 于所述T個(gè)靜音幀中任意不同的第i個(gè)靜音幀和第j個(gè)靜音幀,所述第i個(gè)靜音幀對(duì)應(yīng)的 加權(quán)系數(shù)大于或等于所述j個(gè)靜音巾貞對(duì)應(yīng)的加權(quán)系數(shù);在所述第一參數(shù)與所述譜熵正相關(guān) 時(shí),所述第i個(gè)靜音幀的第一參數(shù)大于所述第j個(gè)靜音幀的第一參數(shù);在所述第一參數(shù)與所 述譜熵負(fù)相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù)小于所述第j個(gè)靜音幀的第一參數(shù),i和j 均為正整數(shù),且1彡i彡T,1彡j彡T。
      [0040] 結(jié)合第四方面或第四方面的第一種可能的實(shí)現(xiàn)方式至第三種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述T個(gè)靜音幀包括當(dāng)前輸入靜音幀以及所 述當(dāng)前輸入靜音幀之前的(T-ι)個(gè)靜音幀
      [0041] 結(jié)合第四方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,還包括:將 所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所述第一譜參數(shù)。
      [0042] 第五方面,提供了一種信號(hào)編碼設(shè)備,包括:第一確定單元,用于在當(dāng)前輸入幀的 前一幀的編碼方式為連續(xù)編碼方式的情況下,預(yù)測(cè)在所述當(dāng)前輸入幀被編碼為靜音描述 SID幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí)際靜音信號(hào),其中所 述當(dāng)前輸入幀為靜音幀;第二確定單元,用于確定所述第一確定單元確定的所述舒適噪聲 與所述第一確定單元確定的所述實(shí)際靜音信號(hào)的偏離程度;第三確定單元,用于根據(jù)所述 第二確定單元確定的所述偏離程度,確定所述當(dāng)前輸入幀的編碼方式,所述當(dāng)前輸入幀的 編碼方式包括拖尾幀編碼方式或SID幀編碼方式;編碼單元,用于根據(jù)所述第三確定單元 確定的所述當(dāng)前輸入幀的編碼方式,對(duì)所述當(dāng)前輸入幀進(jìn)行編碼。
      [0043] 結(jié)合第五方面,在第一種可能的實(shí)現(xiàn)方式中,所述第一確定單元具體用于預(yù)測(cè)所 述舒適噪聲的特征參數(shù),并確定所述實(shí)際靜音信號(hào)的特征參數(shù),其中所述舒適噪聲的特征 參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)是一一對(duì)應(yīng)的;所述第二確定單元具體用于確定所述 舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離。
      [0044] 結(jié)合第五方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述第三 確定單元具體用于:在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距 離小于閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述SID幀編碼 方式,其中所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離與所述閾 值集合中的閾值是一一對(duì)應(yīng)的;在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參 數(shù)之間的距離大于或等于所述閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼 方式為所述拖尾幀編碼方式。
      [0045] 結(jié)合第五方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在第三種可能 的實(shí)現(xiàn)方式中,所述第一確定單元具體用于:根據(jù)所述當(dāng)前輸入幀的前一幀的舒適噪聲參 數(shù)和所述當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)所述舒適噪聲的特征參數(shù);或者,根據(jù)所述當(dāng)前輸入 幀之前的L個(gè)拖尾幀的特征參數(shù)和所述當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)所述舒適噪聲的特征 參數(shù),其中L為正整數(shù)。
      [0046] 結(jié)合第五方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式或第三種可能 的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述第一確定單元具體用于:確定所述當(dāng)前輸入 中貞的特征參數(shù)作為所述實(shí)際靜音信號(hào)的參數(shù);或者,對(duì)Μ個(gè)靜音巾貞的特征參數(shù)進(jìn)行統(tǒng)計(jì)處 理,以確定所述實(shí)際靜音信號(hào)的參數(shù)。
      [0047] 結(jié)合第五方面的第二種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述舒適 噪聲的特征參數(shù)包括所述舒適噪聲的碼激勵(lì)線性預(yù)測(cè)CELP激勵(lì)能量和所述舒適噪聲的線 譜頻率LSF系數(shù),所述實(shí)際靜音信號(hào)的特征參數(shù)包括所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量和 所述實(shí)際靜音信號(hào)的LSF系數(shù);所述第二確定單元具體用于確定所述舒適噪聲的CELP激勵(lì) 能量與所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量之間的距離De,并確定所述舒適噪聲的LSF系數(shù) 與所述實(shí)際靜音信號(hào)的LSF系數(shù)之間的距離Dlsf。
      [0048] 結(jié)合第五方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述第三 確定單元具體用于在所述距離De小于第一閾值,且所述距離Dlsf小于第二閾值的情況下, 確定所述當(dāng)前輸入幀的編碼方式為所述SID幀編碼方式;所述第三確定單元具體用于在所 述距離De大于或等于第一閾值,或者所述距離Dlsf大于或等于第二閾值的情況下,確定所 述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方式。
      [0049] 結(jié)合第五方面的第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,還包括:第 四確定單元,用于:獲取預(yù)設(shè)的所述第一閾值和預(yù)設(shè)的所述第二閾值;或者,根據(jù)所述當(dāng)前 輸入幀之前的N個(gè)靜音幀的CELP激勵(lì)能量確定所述第一閾值,并根據(jù)所述N個(gè)靜音幀的 LSF系數(shù)確定所述第二閾值,其中N為正整數(shù)。
      [0050] 結(jié)合第五方面或第五方面的第一種可能的實(shí)現(xiàn)方式至第七種可能的實(shí)現(xiàn)方式中 任一實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述第一確定單元具體用于采用第一預(yù)測(cè)方 式,預(yù)測(cè)所述舒適噪聲,其中所述第一預(yù)測(cè)方式與所述解碼器生成所述舒適噪聲的方式相 同。
      [0051] 第六方面,提供了一種信號(hào)處理設(shè)備,包括:第一確定單兀,用于確定P個(gè)靜音中貞 中每個(gè)靜音幀的組加權(quán)譜距離,其中所述P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離為所述 P個(gè)靜音幀中所述每個(gè)靜音幀與其它(p-l)個(gè)靜音幀之間的加權(quán)譜距離之和,P為正整數(shù); 第二確定單元,用于根據(jù)所述第一確定單元確定的所述P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán) 譜距離,確定第一譜參數(shù),所述第一譜參數(shù)用于生成舒適噪聲。
      [0052] 結(jié)合第六方面,在第一種可能的實(shí)現(xiàn)方式中,所述第二確定單元具體用于:從所述 P個(gè)靜音幀中選擇第一靜音幀,使得在所述P個(gè)靜音幀中所述第一靜音幀的組加權(quán)譜距離 最??;將所述第一靜音幀的譜參數(shù)確定為所述第一譜參數(shù)。
      [0053] 結(jié)合第六方面,在第二種可能的實(shí)現(xiàn)方式中,所述第二確定單元具體用于:從所述 P個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得在所述P個(gè)靜音幀中所述至少一個(gè)靜音幀的組加 權(quán)譜距離均小于第三閾值;根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述第一譜參數(shù)。
      [0054] 結(jié)合第六方面或第六方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在 第三種可能的實(shí)現(xiàn)方式中,所述P個(gè)靜音幀包括所述當(dāng)前輸入靜音幀以及所述當(dāng)前輸入靜 音幀之前的(p-l)個(gè)靜音幀;
      [0055] 所述設(shè)備還包括:編碼單元,用于將當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中 所述SID幀包括所述第二確定單元確定的所述第一譜參數(shù)。
      [0056] 第七方面,提供了一種信號(hào)處理設(shè)備,包括:劃分單元,用于將輸入信號(hào)的頻帶劃 分為R個(gè)子帶,其中R為正整數(shù);第一確定單元,用于在所述劃分單元?jiǎng)澐值乃鯮個(gè)子帶 中每個(gè)子帶上,確定S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,所述S個(gè)靜音幀中每個(gè)靜音 幀的子帶組譜距離為在所述每個(gè)子帶上所述S個(gè)靜音幀中所述每個(gè)靜音幀與其它(S-1)個(gè) 靜音幀之間的譜距離之和,S為正整數(shù);第二確定單元,用于在所述劃分單元?jiǎng)澐值乃雒?個(gè)子帶上根據(jù)所述第一確定單元確定的S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所 述每個(gè)子帶的第一譜參數(shù),其中所述每個(gè)子帶的第一譜參數(shù)用于生成舒適噪聲。
      [0057] 結(jié)合第七方面,在第一種可能的實(shí)現(xiàn)方式中,所述第二確定單元具體用于:在所述 每個(gè)子帶上,從所述S個(gè)靜音幀中選擇第一靜音幀,使得在所述每個(gè)子帶上的所述S個(gè)靜音 幀中所述第一靜音幀的子帶組譜距離最小;在所述每個(gè)子帶上,將所述第一靜音幀的譜參 數(shù)確定為所述每個(gè)子帶的第一譜參數(shù)。
      [0058] 結(jié)合第七方面,在第二種可能的實(shí)現(xiàn)方式中,所述第二確定單元具體用于:在所述 每個(gè)子帶上,從所述S個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得所述至少一個(gè)靜音幀的子帶 組譜距離均小于第四閾值;在所述每個(gè)子帶上,根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所 述每個(gè)子帶的第一譜參數(shù)。
      [0059] 結(jié)合第七方面或第七方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在 第三種可能的實(shí)現(xiàn)方式中,所述S個(gè)靜音幀包括當(dāng)前輸入靜音幀以及所述當(dāng)前輸入靜音幀 之前的(S-1)個(gè)靜音幀;
      [0060] 所述設(shè)備還包括:編碼單元,用于將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀, 其中所述SID巾貞包括所述每個(gè)子帶的譜參數(shù)。
      [0061] 第八方面,提供了一種信號(hào)處理設(shè)備,包括:第一確定單兀,用于確定T個(gè)靜音中貞 中每個(gè)靜音幀的第一參數(shù),所述第一參數(shù)用于表征譜熵,T為正整數(shù);第二確定單元,用于 根據(jù)所述第一確定單元確定的所述T個(gè)靜音幀中每個(gè)靜音幀的第一參數(shù),確定第一譜參 數(shù),其中所述第一譜參數(shù)用于生成舒適噪聲。
      [0062] 結(jié)合第八方面,在第一種可能的實(shí)現(xiàn)方式中,所述第二確定單元具體用于:在確定 能夠按照聚類準(zhǔn)則將所述T個(gè)靜音幀分為所述第一組靜音幀和所述第二組靜音幀的情況 下,根據(jù)所述第一組靜音幀的譜參數(shù),確定所述第一譜參數(shù),其中所述第一組靜音幀的第一 參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參數(shù)所表征的譜熵;在確定不能夠按照 聚類準(zhǔn)則將所述T個(gè)靜音幀分為所述第一組靜音幀和所述第二組靜音幀的情況下,對(duì)所述 T個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù),其中所述第一組靜音幀的 第一參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參數(shù)所表征的譜熵。
      [0063] 結(jié)合第八方面,在第二種可能的實(shí)現(xiàn)方式中,所述第二確定單元具體用于:對(duì)所述 T個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù);
      [0064] 其中,對(duì)于所述T個(gè)靜音幀中任意不同的第i個(gè)靜音幀和第j個(gè)靜音幀,所述第i 個(gè)靜音巾貞對(duì)應(yīng)的加權(quán)系數(shù)大于或等于所述j個(gè)靜音巾貞對(duì)應(yīng)的加權(quán)系數(shù);在所述第一參數(shù)與 所述譜熵正相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù)大于所述第j個(gè)靜音幀的第一參數(shù);在所 述第一參數(shù)與所述譜熵負(fù)相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù)小于所述第j個(gè)靜音幀的 第一參數(shù),i和j均為正整數(shù),且1彡i彡T,1彡j彡T。
      [0065] 結(jié)合第八方面或第八方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在 第三種可能的實(shí)現(xiàn)方式中,所述T個(gè)靜音幀包括當(dāng)前輸入靜音幀以及所述當(dāng)前輸入靜音幀 之前的(T-ι)個(gè)靜音幀;
      [0066] 所述設(shè)備還包括:編碼單元,用于將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀, 其中所述SID巾貞包括所述第一譜參數(shù)。
      [0067] 本發(fā)明實(shí)施例中,通過在當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式的情況 下,預(yù)測(cè)在當(dāng)前輸入幀被編碼為SID幀的情況下解碼器根據(jù)當(dāng)前輸入幀生成的舒適噪聲, 并確定舒適噪聲與實(shí)際靜音信號(hào)的偏離程度,根據(jù)該偏離程度確定當(dāng)前輸入幀的編碼方式 為拖尾幀編碼方式或SID幀編碼方式,而非簡(jiǎn)單地根據(jù)統(tǒng)計(jì)得到的語音活動(dòng)幀的數(shù)量將當(dāng) 前輸入幀編碼為拖尾幀,從而能夠節(jié)省通信帶寬。

      【專利附圖】

      【附圖說明】
      [0068] 為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
      [0069] 圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的語音通信系統(tǒng)的示意框圖。
      [0070] 圖2是根據(jù)本發(fā)明實(shí)施例的信號(hào)編碼方法的示意性流程圖。
      [0071] 圖3a是根據(jù)本發(fā)明一個(gè)實(shí)施例的信號(hào)編碼方法的過程的示意性流程圖。
      [0072] 圖3b是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)編碼方法的過程的示意性流程圖。
      [0073] 圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的信號(hào)處理方法的示意性流程圖。
      [0074] 圖5是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理方法的示意性流程圖。
      [0075] 圖6是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理方法的示意性流程圖。
      [0076] 圖7是根據(jù)本發(fā)明一個(gè)實(shí)施例的信號(hào)編碼設(shè)備的示意框圖。
      [0077] 圖8是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理設(shè)備的示意框圖。
      [0078] 圖9是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理設(shè)備的示意框圖。
      [0079] 圖10是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理設(shè)備的示意框圖。
      [0080] 圖11是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)編碼設(shè)備的示意框圖。
      [0081] 圖12是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理設(shè)備的示意框圖。
      [0082] 圖13是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理設(shè)備的示意框圖。
      [0083] 圖14是根據(jù)本發(fā)明另一實(shí)施例的信號(hào)處理設(shè)備的示意框圖。

      【具體實(shí)施方式】
      [0084] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例?;诒景l(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí) 施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。
      [0085] 圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的語音通信系統(tǒng)的示意框圖。
      [0086] 圖1的系統(tǒng)100可以是DTX系統(tǒng)。系統(tǒng)100可以包括編碼器110和解碼器120。
      [0087] 編碼器110可以將輸入的時(shí)域語音信號(hào)截?cái)酁檎Z音幀,并對(duì)語音幀進(jìn)行編碼,然 后將編碼后的語音幀發(fā)送給解碼器120。解碼器120可以從編碼器110接收編碼后的語音 幀,并對(duì)編碼后的語音幀進(jìn)行解碼,然后輸出解碼后的時(shí)域語音信號(hào)。
      [0088] 編碼器110還可以包括語音活動(dòng)性檢測(cè)器(Voice Activity Detector,VAD)110a。 VAD110a可以檢測(cè)當(dāng)前輸入語音幀為語音活動(dòng)幀還是靜音幀。其中,語音活動(dòng)幀可以表示含 有通話語音信號(hào)的幀,靜音幀可以表示不含有通話語音信號(hào)的幀。此處,靜音幀可以包括能 量低于靜音門限的無聲幀,也可以包括背景噪聲幀。編碼器110可以有兩種工作狀態(tài),即連 續(xù)傳輸狀態(tài)和非連續(xù)傳輸狀態(tài)。當(dāng)編碼器110工作在連續(xù)傳輸狀態(tài)時(shí),編碼器110可以對(duì) 每個(gè)輸入語音幀均進(jìn)行編碼并發(fā)送。當(dāng)編碼器110工作在非連續(xù)傳輸狀態(tài)時(shí),編碼器110 可以不對(duì)輸入語音幀編碼,或者可以將其編碼為SID幀。通常,只有在輸入語音幀為靜音幀 時(shí),編碼器110才會(huì)工作在非連續(xù)傳輸狀態(tài)下。
      [0089] 如果當(dāng)前輸入的靜音幀是語音活動(dòng)段結(jié)束后的第一幀時(shí),此處語音活動(dòng)段包括可 能存在的拖尾區(qū)間,那么編碼器110可以將該靜音幀編碼為SID幀,此處可以用SID_FIRST 表示該SID幀。如果當(dāng)前輸入的靜音幀為上一個(gè)SID幀之后的第η幀,此處η為正整數(shù),且 與上一個(gè)SID幀之間沒有語音活動(dòng)幀時(shí),那么編碼器110可以將該靜音幀編碼為SID幀,此 處可以用SID_UPDATE表示該SID幀。
      [0090] SID幀可以包括一些描述靜音信號(hào)的特征的信息。解碼器根據(jù)這些特征信息能夠 生成舒適噪聲。例如SID幀可以包括靜音信號(hào)的能量信息和譜信息。進(jìn)一步地,例如,靜音 信號(hào)的能量信息可以包括碼激勵(lì)線性預(yù)測(cè)(Code Excited Linear Prediction, CELP)模型 中激勵(lì)信號(hào)的能量,或者靜音信號(hào)的時(shí)域能量。譜信息可以包括線譜頻率(Line Spectral Frequency,LSF)系數(shù)、線譜對(duì)(Line Spectrum Pair,LSP)系數(shù)、導(dǎo)抗譜頻率(Immittance Spectral Frequencies, ISF)系數(shù)、導(dǎo)譜對(duì)(Immittance Spectral Pairs,ISP)系數(shù)、 線性預(yù)測(cè)編碼(Linear Predictive Coding, LPC)系數(shù)、快速傅立葉變換(Fast Fourier Transform,F(xiàn)FT)系數(shù)或修正離散余弦變換(Modified Discrete Cosine Transform,MDCT) 系數(shù)等。
      [0091] 編碼后的語音幀可以包括三種類型:語音編碼幀、SID幀和N0_DATA幀。其中語音 編碼幀為編碼器110在連續(xù)傳輸狀態(tài)下編碼的幀,N0_DATA幀可以表示沒有任何編碼比特 的幀,即物理上并不存在的幀,如SID幀之間的未編碼靜音幀等。
      [0092] 解碼器120可以從編碼器110接收編碼后的語音幀,并對(duì)編碼后的語音幀進(jìn)行解 碼。當(dāng)接收到語音編碼幀時(shí),解碼器可以直接解碼該幀并輸出時(shí)域語音幀。當(dāng)接收到SID 幀時(shí),解碼器可以解碼SID幀,并獲得SID幀中的拖尾長(zhǎng)度、能量和譜信息。具體地,當(dāng)SID 幀為SID_UPDATE時(shí),解碼器可以根據(jù)當(dāng)前SID幀中的信息,或者根據(jù)當(dāng)前SID幀中的信息 并結(jié)合其它信息,獲得靜音信號(hào)的能量信息和譜信息,也就是獲得CN參數(shù),從而根據(jù)CN參 數(shù)生成時(shí)域CN幀。當(dāng)SID幀為SID_FIRST時(shí),解碼器根據(jù)SID幀中的拖尾長(zhǎng)度信息獲得該 幀之前m幀中能量和譜的統(tǒng)計(jì)信息,并結(jié)合該SID幀中解碼得到的信息獲得CN參數(shù),從而 生成時(shí)域CN幀,其中m為正整數(shù)。當(dāng)解碼器的輸入為N0_DATA幀時(shí),解碼器根據(jù)最近接收 到的SID幀并結(jié)合其它信息,獲得CN參數(shù),從而生成時(shí)域CN幀。
      [0093] 圖2是根據(jù)本發(fā)明實(shí)施例的信號(hào)編碼方法的示意性流程圖。圖2的方法由編碼器 執(zhí)行,例如可以由圖1中的編碼器110執(zhí)行。
      [0094] 210,在當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式的情況下,預(yù)測(cè)在當(dāng)前輸 入幀被編碼為SID幀的情況下解碼器根據(jù)當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí)際靜音信 號(hào),其中當(dāng)前輸入幀為靜音幀。
      [0095] 本發(fā)明實(shí)施例中,實(shí)際靜音信號(hào)可以是指輸入編碼器的實(shí)際靜音信號(hào)。
      [0096] 220,確定舒適噪聲與實(shí)際靜音信號(hào)的偏離程度。
      [0097] 230,根據(jù)偏離程度,確定當(dāng)前輸入幀的編碼方式,當(dāng)前輸入幀的編碼方式包括拖 尾幀編碼方式或SID幀編碼方式。
      [0098] 具體地,拖尾幀編碼方式可以是指連續(xù)編碼方式。編碼器可以以連續(xù)編碼方式對(duì) 處于拖尾區(qū)間的靜音幀進(jìn)行編碼,編碼得到的幀可以稱為拖尾幀。
      [0099] 240,根據(jù)當(dāng)前輸入幀的編碼方式,對(duì)當(dāng)前輸入幀進(jìn)行編碼。
      [0100] 在步驟210中,編碼器可以根據(jù)不同的因素,確定以連續(xù)編碼方式對(duì)當(dāng)前輸入幀 的前一幀進(jìn)行編碼,例如,如果編碼器中的VAD確定前一幀處于語音活動(dòng)段或者編碼器確 定前一幀處于拖尾區(qū)間,那么編碼器會(huì)以連續(xù)編碼方式對(duì)前一幀進(jìn)行編碼。
      [0101]由于輸入語音信號(hào)進(jìn)入靜音段后,編碼器可以根據(jù)實(shí)際情況決定工作在連續(xù)傳輸 狀態(tài)還是非連續(xù)傳輸狀態(tài)。因此對(duì)于作為靜音幀的當(dāng)前輸入幀而言,編碼器需要確定如何 編碼當(dāng)前輸入幀。
      [0102] 當(dāng)前輸入幀可以是輸入語音信號(hào)進(jìn)入靜音段后的第一個(gè)靜音幀,也可以是輸入語 音信號(hào)進(jìn)入靜音段后的第η幀,此處η為大于1的正整數(shù)。
      [0103] 如果當(dāng)前輸入幀為第一個(gè)靜音幀,那么在步驟230中,編碼器確定當(dāng)前輸入幀的 編碼方式也就是確定是否需要設(shè)置拖尾區(qū)間,如果需要設(shè)置拖尾區(qū)間,則編碼器可以將當(dāng) 前輸入幀編碼為拖尾幀;如果不需要設(shè)置拖尾區(qū)間,則編碼器可以將當(dāng)前輸入幀編碼為 SID中貞。
      [0104] 如果當(dāng)前輸入幀為第η個(gè)靜音幀且編碼器能夠確定當(dāng)前輸入幀正處于拖尾區(qū)間, 即當(dāng)前輸入幀前面的靜音幀被連續(xù)地編碼,那么在步驟230中,編碼器確定當(dāng)前輸入幀的 編碼方式也就是確定是否結(jié)束拖尾區(qū)間。如果需要結(jié)束拖尾區(qū)間,則編碼器可以將當(dāng)前輸 入幀編碼為SID幀;如果需要繼續(xù)延長(zhǎng)拖尾區(qū)間,則編碼器可以將當(dāng)前輸入幀編碼為拖尾 幀。
      [0105] 如果當(dāng)前輸入幀為第η個(gè)靜音幀,并且也不存在拖尾機(jī)制,那么在步驟230中,編 碼器需要確定當(dāng)前輸入幀的編碼方式,使得解碼器對(duì)編碼后的當(dāng)前輸入幀進(jìn)行解碼能夠得 到優(yōu)質(zhì)的舒適噪聲信號(hào)。
      [0106] 可見,本發(fā)明實(shí)施例既可以應(yīng)用于拖尾機(jī)制的觸發(fā)場(chǎng)景,也可以應(yīng)用于拖尾機(jī)制 的執(zhí)行場(chǎng)景,還可以應(yīng)用于不存在拖尾機(jī)制的場(chǎng)景中。具體地,本發(fā)明實(shí)施例既可以確定是 否觸發(fā)拖尾機(jī)制,也可以確定是否提前結(jié)束拖尾機(jī)制?;蛘邔?duì)于不存在拖尾機(jī)制的場(chǎng)景,本 發(fā)明實(shí)施例可以確定靜音幀的編碼方式從而達(dá)到更好的編碼效果和解碼效果。
      [0107] 具體地,編碼器可以假設(shè)當(dāng)前輸入幀編碼為SID幀,如果解碼器接收到該SID幀, 將根據(jù)SID幀生成舒適噪聲,而編碼器可以預(yù)測(cè)到該舒適噪聲。然后,編碼器可以估計(jì)該舒 適噪聲與輸入編碼器的實(shí)際靜音信號(hào)的偏離程度。此處的偏離程度也可以理解為近似程 度。如果預(yù)測(cè)到的舒適噪聲與實(shí)際靜音信號(hào)足夠接近,那么編碼器可以認(rèn)為無需設(shè)置拖尾 區(qū)間或者無需繼續(xù)延長(zhǎng)拖尾區(qū)間。
      [0108] 在現(xiàn)有技術(shù)中,通過簡(jiǎn)單地統(tǒng)計(jì)語音活動(dòng)幀的數(shù)量來確定是否執(zhí)行固定長(zhǎng)度的拖 尾區(qū)間。也就是,如果有足夠數(shù)量的語音活動(dòng)幀被連續(xù)編碼,那么就設(shè)置固定長(zhǎng)度的拖尾區(qū) 間。不論當(dāng)前輸入幀為第一個(gè)靜音幀還是處于拖尾區(qū)間的第η個(gè)靜音幀,當(dāng)前輸入幀均會(huì) 被編碼為拖尾幀。然而,不必要的拖尾幀會(huì)造成通信帶寬的浪費(fèi)。而本發(fā)明實(shí)施例中,通過 根據(jù)預(yù)測(cè)的舒適噪聲與實(shí)際靜音信號(hào)的偏離程度確定當(dāng)前輸入幀的編碼方式,而非簡(jiǎn)單地 依據(jù)語音活動(dòng)幀的數(shù)量來確定當(dāng)前輸入幀編碼為拖尾幀,因此能夠節(jié)省通信帶寬。
      [0109] 本發(fā)明實(shí)施例中,通過在當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式的情況 下,預(yù)測(cè)在當(dāng)前輸入幀被編碼為SID幀的情況下解碼器根據(jù)當(dāng)前輸入幀生成的舒適噪聲, 并確定舒適噪聲與實(shí)際靜音信號(hào)的偏離程度,根據(jù)該偏離程度確定當(dāng)前輸入幀的編碼方式 為拖尾幀編碼方式或SID幀編碼方式,而非簡(jiǎn)單地根據(jù)統(tǒng)計(jì)得到的語音活動(dòng)幀的數(shù)量將當(dāng) 前輸入幀編碼為拖尾幀,從而能夠節(jié)省通信帶寬。
      [0110] 可選地,作為一個(gè)實(shí)施例,在步驟210中,編碼器可以采用第一預(yù)測(cè)方式,預(yù)測(cè)舒 適噪聲,其中第一預(yù)測(cè)方式與解碼器用于生成舒適噪聲的方式相同。
      [0111] 具體地,編碼器與解碼器可以采用相同的方式確定舒適噪聲?;蛘撸幋a器與解碼 器也可以分別采用不同的方式確定舒適噪聲。本發(fā)明實(shí)施例對(duì)此不做限定。
      [0112] 可選地,作為一個(gè)實(shí)施例,在步驟210中,編碼器可以預(yù)測(cè)舒適噪聲的特征參數(shù), 并確定實(shí)際靜音信號(hào)的特征參數(shù),其中舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征參數(shù)是 一一對(duì)應(yīng)的。在步驟220中,編碼器可以確定舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征 參數(shù)之間的距離。
      [0113] 具體地,編碼器可以比較舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征參數(shù)之間的 距離,從而確定舒適噪聲與實(shí)際靜音信號(hào)的偏離程度。舒適噪聲的特征參數(shù)與實(shí)際靜音信 號(hào)的特征參數(shù)應(yīng)當(dāng)是一一對(duì)應(yīng)的。也就是說,舒適噪聲的特征參數(shù)的類型與實(shí)際靜音信號(hào) 的特征參數(shù)的類型是相同的。例如,編碼器可以將舒適噪聲的能量參數(shù)與實(shí)際靜音信號(hào)的 能量參數(shù)進(jìn)行比較,也可以將舒適噪聲的譜參數(shù)與實(shí)際靜音信號(hào)的譜參數(shù)進(jìn)行比較。
      [0114] 本發(fā)明實(shí)施例中,當(dāng)特征參數(shù)為標(biāo)量時(shí),特征參數(shù)之間的距離可以指特征參數(shù)之 間的差值的絕對(duì)值,即標(biāo)量距離。當(dāng)特征參數(shù)為矢量時(shí),特征參數(shù)之間的距離可以是指特征 參數(shù)之間對(duì)應(yīng)元素的標(biāo)量距離的和。
      [0115] 可選地,作為另一實(shí)施例,在步驟230中,編碼器可以在舒適噪聲的特征參數(shù)與實(shí) 際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集合中對(duì)應(yīng)閾值的情況下,確定當(dāng)前輸入幀的 編碼方式為SID幀編碼方式,其中舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征參數(shù)之間的 距離與閾值集合中的閾值是一一對(duì)應(yīng)的。編碼器也可以在舒適噪聲的特征參數(shù)與實(shí)際靜音 信號(hào)的特征參數(shù)之間的距離大于或等于閾值集合中對(duì)應(yīng)閾值的情況下,確定當(dāng)前輸入幀的 編碼方式為拖尾幀編碼方式。
      [0116] 具體地,舒適噪聲的特征參數(shù)和實(shí)際靜音信號(hào)的特征參數(shù)均可以包括至少一個(gè)參 數(shù),因此,舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征參數(shù)之間的距離也可以包括至少一 種參數(shù)之間的距離。閾值集合也可以包括至少一個(gè)閾值。每種參數(shù)之間的距離可以對(duì)應(yīng)于 一個(gè)閾值。在確定當(dāng)前輸入幀的編碼方式時(shí),編碼器可以分別將至少一種參數(shù)之間的距離 與閾值集合中對(duì)應(yīng)的閾值進(jìn)行比較。閾值集合中的至少一個(gè)閾值可以是預(yù)先設(shè)定的,也可 以是由編碼器根據(jù)當(dāng)前輸入幀之前的多個(gè)靜音幀的特征參數(shù)確定的。
      [0117] 如果舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集合 中對(duì)應(yīng)閾值,編碼器可以認(rèn)為舒適噪聲與實(shí)際靜音信號(hào)足夠接近,從而可以將當(dāng)前輸入幀 編碼為SID幀。如果舒適噪聲的特征參數(shù)與實(shí)際靜音信號(hào)的特征參數(shù)之間的距離大于或等 于閾值集合中對(duì)應(yīng)閾值,那么編碼器可以認(rèn)為舒適噪聲與實(shí)際靜音信號(hào)偏離較大,從而可 以將當(dāng)前輸入幀編碼為拖尾幀。
      [0118] 可選地,作為另一實(shí)施例,上述舒適噪聲的特征參數(shù)可以用于表征以下至少一種 信息:能量信息,譜信息。
      [0119] 可選地,作為另一實(shí)施例,上述能量信息可以包括CELP激勵(lì)能量。上述譜信息可 以包括以下至少一種:線性預(yù)測(cè)濾波器系數(shù),F(xiàn)FT系數(shù),MDCT系數(shù)。線性預(yù)測(cè)濾波器系數(shù)可 以包括以下至少一種:LSF系數(shù),LSP系數(shù),ISF系數(shù),ISP系數(shù),反射系數(shù),LPC系數(shù)。
      [0120] 可選地,作為另一實(shí)施例,在步驟210中,編碼器可以確定當(dāng)前輸入幀的特征參數(shù) 作為實(shí)際靜音信號(hào)的特征參數(shù)。或者,編碼器可以對(duì)Μ個(gè)靜音幀的特征參數(shù)進(jìn)行統(tǒng)計(jì)處理, 以確定實(shí)際靜音信號(hào)的特征參數(shù)。
      [0121] 可選地,作為另一實(shí)施例,上述Μ個(gè)靜音幀可以包括當(dāng)前輸入幀以及當(dāng)前輸入幀 之前的(Μ-1)個(gè)靜音幀,Μ為正整數(shù)。
      [0122] 例如,如果當(dāng)前輸入幀為第一個(gè)靜音幀,那么實(shí)際靜音信號(hào)的特征參數(shù)可以是當(dāng) 前輸入幀的特征參數(shù);如果當(dāng)前輸入幀為第η個(gè)靜音幀,那么實(shí)際靜音信號(hào)的特征參數(shù)可 以是編碼器對(duì)包含當(dāng)前輸入幀在內(nèi)的Μ個(gè)靜音幀的特征參數(shù)進(jìn)行統(tǒng)計(jì)處理得到的。Μ個(gè)靜 音幀可以是連續(xù)的,也可以是不連續(xù)的,本發(fā)明實(shí)施例對(duì)此不做限定。
      [0123] 可選地,作為另一實(shí)施例,在步驟210中,編碼器可以根據(jù)當(dāng)前輸入幀的前一幀的 舒適噪聲參數(shù)和當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)舒適噪聲的特征參數(shù)?;蛘?,編碼器可以根據(jù) 當(dāng)前輸入幀之前的L個(gè)拖尾幀的特征參數(shù)和當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)舒適噪聲的特征 參數(shù),L為正整數(shù)。
      [0124] 例如,如果當(dāng)前輸入幀為第一個(gè)靜音幀,那么編碼器可以根據(jù)前一幀的舒適噪聲 參數(shù)和當(dāng)前輸入幀的特征參數(shù)預(yù)測(cè)舒適噪聲的特征參數(shù)。編碼器對(duì)每一幀進(jìn)行編碼時(shí),會(huì) 在編碼器內(nèi)部保存每一幀的舒適噪聲參數(shù)。通常只有在輸入幀為靜音幀時(shí),這個(gè)保存的舒 適噪聲參數(shù)才會(huì)較前一幀時(shí)發(fā)生變化,因?yàn)榫幋a器可能會(huì)根據(jù)當(dāng)前輸入靜音幀的特征參數(shù) 對(duì)保存的舒適噪聲參數(shù)進(jìn)行更新,而在當(dāng)前輸入幀為語音活動(dòng)幀時(shí)通常不對(duì)舒適噪聲參數(shù) 進(jìn)行更新。因此,編碼器可以獲取內(nèi)部存儲(chǔ)的前一幀的舒適噪聲參數(shù)。例如,舒適噪聲參數(shù) 可以包括靜音信號(hào)的能量參數(shù)和譜參數(shù)。
      [0125] 此外,如果當(dāng)前輸入幀正處于拖尾區(qū)間,編碼器可以根據(jù)當(dāng)前輸入幀之前的L個(gè) 拖尾幀的參數(shù)進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)得到的結(jié)果和當(dāng)前輸入幀的特征參數(shù),得到舒適噪聲的 特征參數(shù)。
      [0126] 可選地,作為另一實(shí)施例,舒適噪聲的特征參數(shù)可以包括舒適噪聲的CELP激勵(lì)能 量和舒適噪聲的LSF系數(shù),實(shí)際靜音信號(hào)的特征參數(shù)可以包括實(shí)際靜音信號(hào)的CELP激勵(lì)能 量和實(shí)際靜音信號(hào)的LSF系數(shù)。在步驟220中,編碼器可以確定舒適噪聲的CELP激勵(lì)能量 與實(shí)際靜音信號(hào)的CELP激勵(lì)能量之間的距離De,并可以確定舒適噪聲的LSF系數(shù)與實(shí)際靜 音信號(hào)的LSF系數(shù)之間的距離Dlsf。
      [0127] 應(yīng)注意,此處距離De和距離Dlsf可以包含一個(gè)變量,也可以包含一組變量。例如, 距離Dlsf可以包含兩個(gè)變量,一個(gè)可以是平均的LSF系數(shù)的距離,即每個(gè)對(duì)應(yīng)LSF系數(shù)的 距離的均值。另一個(gè)可以是LSF系數(shù)間的最大距離,即距離最大的那對(duì)LSF系數(shù)之間的距 離。
      [0128] 可選地,作為另一實(shí)施例,在步驟230中,在距離De小于第一閾值,且距離Dlsf小 于第二閾值的情況下,編碼器可以確定當(dāng)前輸入幀的編碼方式為SID幀編碼方式。在距離 De大于或等于第一閾值,或者距離Dlsf大于或等于第二閾值的情況下,編碼器可以確定當(dāng) 前輸入巾貞的編碼方式為拖尾巾貞編碼方式。其中,第一閾值和第二閾值均屬于上述閾值集合。
      [0129] 可選地,作為另一實(shí)施例,當(dāng)De或Dlsf包含一組變量時(shí),編碼器將一組變量中的 每個(gè)變量與其相對(duì)應(yīng)的閾值做比較,從而確定以何種方式編碼當(dāng)前輸入幀。
      [0130] 具體地,編碼器可以根據(jù)距離De和距離Dlsf,確定當(dāng)前輸入幀的編碼方式。如果 距離De〈第一閾值,并且距離Dlsf〈第二閾值,則可以表明預(yù)測(cè)的舒適噪聲的CELP激勵(lì)能 量和LSF系數(shù)與實(shí)際靜音信號(hào)的CELP激勵(lì)能量和LSF系數(shù)差別都不大,則編碼器可以認(rèn)為 舒適噪聲和實(shí)際靜音信號(hào)足夠接近,可以將當(dāng)前輸入幀編碼為SID幀。否則,可以將當(dāng)前輸 入幀編碼為拖尾幀。
      [0131] 可選地,作為另一實(shí)施例,在步驟230中,編碼器可以獲取預(yù)設(shè)的第一閾值和預(yù)設(shè) 的第二閾值?;蛘?,編碼器可以根據(jù)當(dāng)前輸入幀之前的N個(gè)靜音幀的CELP激勵(lì)能量確定第 一閾值,并根據(jù)N個(gè)靜音幀的LSF系數(shù)確定第二閾值,其中N為正整數(shù)。
      [0132] 具體地,第一閾值和第二閾值均可以是預(yù)設(shè)的固定值?;蛘?,第一閾值和第二閾值 均可以是自適應(yīng)的變量。例如,第一閾值可以是編碼器對(duì)當(dāng)前輸入幀之前的N個(gè)靜音幀的 CELP激勵(lì)能量統(tǒng)計(jì)得到的。第二閾值可以是編碼器對(duì)當(dāng)前輸入幀之前的N個(gè)靜音幀的LSF 系數(shù)統(tǒng)計(jì)得到的。N個(gè)靜音幀可以是連續(xù)的,也可以是不連續(xù)的。
      [0133] 下面將結(jié)合具體例子詳細(xì)描述上述圖2的具體過程。在下面圖3a和圖3b的例子 中,將以本發(fā)明實(shí)施例可應(yīng)用的兩個(gè)場(chǎng)景來進(jìn)行描述。應(yīng)理解,這些例子只是為了幫助本領(lǐng) 域技術(shù)人員更好地理解本發(fā)明實(shí)施例,而非限制本發(fā)明實(shí)施例的范圍。
      [0134] 圖3a是根據(jù)本發(fā)明一個(gè)實(shí)施例的信號(hào)編碼方法的過程的示意性流程圖。在圖3a 中,假設(shè)當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式,編碼器內(nèi)部的VAD確定當(dāng)前輸 入幀為輸入語音信號(hào)進(jìn)入靜音段后的第一個(gè)靜音幀。那么,編碼器將需要確定是否設(shè)置拖 尾區(qū)間,也就是需要確定是將當(dāng)前輸入幀編碼為拖尾幀還是SID幀。下面將詳細(xì)描述該過 程。
      [0135] 301a,確定實(shí)際靜音信號(hào)的CELP激勵(lì)能量和LSF系數(shù)。
      [0136] 具體地,編碼器可以將當(dāng)前輸入幀的CELP激勵(lì)能量e作為實(shí)際靜音信號(hào)的 CELP激勵(lì)能量eSI,可以將當(dāng)前輸入幀的LSF系數(shù)lsf (i)作為實(shí)際靜音信號(hào)的LSF系數(shù) lsfSI(i),1=0,1,?,1(-1,1(為濾波器階數(shù)。編碼器可以參照現(xiàn)有技術(shù),確定當(dāng)前輸入幀的 CELP激勵(lì)能量以及LSF系數(shù)。
      [0137] 302a,預(yù)測(cè)在當(dāng)前輸入幀被編碼為SID幀的情況下解碼器根據(jù)當(dāng)前輸入幀生成的 舒適噪聲的CELP激勵(lì)能量和LSF參數(shù)。
      [0138] 編碼器可以假設(shè)當(dāng)前輸入幀編碼為SID幀,那么解碼器將根據(jù)該SID幀生成舒適 噪聲。對(duì)于編碼器而言,其能夠預(yù)測(cè)該舒適噪聲的CELP激勵(lì)能量eCN和LSF系數(shù)lsfCN(i), ?=0,1,···,Κ-1,K為濾波器階數(shù)。編碼器可以根據(jù)編碼器內(nèi)部存儲(chǔ)的前一幀的舒適噪聲參 數(shù)和當(dāng)前輸入幀的CELP激勵(lì)能量和LSF系數(shù),分別確定舒適噪聲的CELP激勵(lì)能量和LSF 系數(shù)。
      [0139] 例如,編碼器可以按照等式(1)預(yù)測(cè)舒適噪聲的CELP激勵(lì)能量eCN :
      [0140] eCN=0. 4*eCN[_1]+0. 6*e (1)
      [0141] 其中,eC#1]可以表示前一幀的CELP激勵(lì)能量,e可以表示當(dāng)前輸入幀的CELP激 勵(lì)能量。
      [0142] 編碼器可以按照等式(2)預(yù)測(cè)舒適噪聲的LSF系數(shù)lsfCN(i),i=0, 1,…,Κ_1,Κ為 濾波器階數(shù)。
      [0143] lsfCN(i)=0.4*?8--Ν[-1](?)+0· 6*lsf(i) (2)
      [0144] 其中,lsfC#1]⑴可以表示前一幀的LSF系數(shù),lsf⑴可以表示當(dāng)前輸入幀的第 i個(gè)LSF系數(shù)。
      [0145] 303a,確定舒適噪聲的CELP激勵(lì)能量與實(shí)際靜音信號(hào)的CELP激勵(lì)能量之間的距 離De,并確定舒適噪聲的LSF系數(shù)與實(shí)際靜音信號(hào)的LSF系數(shù)之間的距離Dlsf。
      [0146] 具體地,編碼器可以根據(jù)等式(3)確定舒適噪聲的CELP激勵(lì)能量與實(shí)際靜音信號(hào) 的CELP激勵(lì)能量之間的距離De :
      [0147] De= | log2eCN_log2e | (3)
      [0148] 編碼器可以根據(jù)等式(4)確定舒適噪聲的LSF系數(shù)與實(shí)際靜音信號(hào)的LSF系數(shù)之 間的距離Dlsf:
      [0149]

      【權(quán)利要求】
      1. 一種信號(hào)編碼方法,其特征在于,包括: 在當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式的情況下,預(yù)測(cè)在所述當(dāng)前輸入幀 被編碼為靜音描述SID幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí) 際靜音信號(hào),其中所述當(dāng)前輸入幀為靜音幀; 確定所述舒適噪聲與所述實(shí)際靜音信號(hào)的偏離程度; 根據(jù)所述偏離程度,確定所述當(dāng)前輸入幀的編碼方式,所述當(dāng)前輸入幀的編碼方式包 括拖尾幀編碼方式或SID幀編碼方式; 根據(jù)所述當(dāng)前輸入幀的編碼方式,對(duì)所述當(dāng)前輸入幀進(jìn)行編碼。
      2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)測(cè)在所述當(dāng)前輸入幀被編碼為SID 幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,并確定實(shí)際靜音信號(hào),包括: 預(yù)測(cè)所述舒適噪聲的特征參數(shù),并確定所述實(shí)際靜音信號(hào)的特征參數(shù),其中所述舒適 噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)是一一對(duì)應(yīng)的; 所述確定所述舒適噪聲與所述實(shí)際靜音信號(hào)的偏離程度,包括: 確定所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離。
      3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述偏離程度,確定所述當(dāng)前輸 入幀的編碼方式,包括: 在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集 合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述SID幀編碼方式,其中所 述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離與所述閾值集合中的 閾值是一一對(duì)應(yīng)的; 在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離大于或等于 所述閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方 式。
      4. 根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述舒適噪聲的特征參數(shù)用于表征以 下至少一種信息:能量信息,譜信息。
      5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述能量信息包括碼激勵(lì)線性預(yù)測(cè)CELP 激勵(lì)能量; 所述譜信息包括以下至少一種:線性預(yù)測(cè)濾波器系數(shù),快速傅立葉變換FFT系數(shù),修正 離散余弦變換MDCT系數(shù); 所述線性預(yù)測(cè)濾波器系數(shù)包括以下至少一種:線譜頻率LSF系數(shù),線譜對(duì)LSP系數(shù),導(dǎo) 抗譜頻率ISF系數(shù),導(dǎo)譜對(duì)ISP系數(shù),反射系數(shù),線性預(yù)測(cè)編碼LPC系數(shù)。
      6. 根據(jù)權(quán)利要求2至5中任一項(xiàng)所述的方法,其特征在于,所述預(yù)測(cè)所述舒適噪聲的特 征參數(shù),包括: 根據(jù)所述當(dāng)前輸入幀的前一幀的舒適噪聲參數(shù)和所述當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)所 述舒適噪聲的特征參數(shù);或者, 根據(jù)所述當(dāng)前輸入幀之前的L個(gè)拖尾幀的特征參數(shù)和所述當(dāng)前輸入幀的特征參數(shù),預(yù) 測(cè)所述舒適噪聲的特征參數(shù),其中L為正整數(shù)。
      7. 根據(jù)權(quán)利要求2至6中任一項(xiàng)所述的方法,其特征在于,所述確定所述實(shí)際靜音信號(hào) 的特征參數(shù),包括: 將所述當(dāng)前輸入幀的特征參數(shù)作為所述實(shí)際靜音信號(hào)的特征參數(shù);或者, 對(duì)Μ個(gè)靜音幀的特征參數(shù)進(jìn)行統(tǒng)計(jì)處理,以確定所述實(shí)際靜音信號(hào)的特征參數(shù)。
      8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述Μ個(gè)靜音幀包括所述當(dāng)前輸入幀以及 所述當(dāng)前輸入幀之前的(Μ-1)個(gè)靜音幀,Μ為正整數(shù)。
      9. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述舒適噪聲的特征參數(shù)包括所述舒適 噪聲的碼激勵(lì)線性預(yù)測(cè)CELP激勵(lì)能量和所述舒適噪聲的線譜頻率LSF系數(shù),所述實(shí)際靜 音信號(hào)的特征參數(shù)包括所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量和所述實(shí)際靜音信號(hào)的LSF系 數(shù); 所述確定所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離,包 括: 確定所述舒適噪聲的CELP激勵(lì)能量與所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量之間的距離 De,并確定所述舒適噪聲的LSF系數(shù)與所述實(shí)際靜音信號(hào)的LSF系數(shù)之間的距離Dlsf。
      10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述在所述舒適噪聲的特征參數(shù)與所述 實(shí)際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸 入幀的編碼方式為所述SID幀編碼方式,包括 : 在所述距離De小于第一閾值,且所述距離Dlsf小于第二閾值的情況下,確定所述當(dāng)前 輸入幀的編碼方式為所述SID幀編碼方式; 所述在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離大于或 等于所述閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編 碼方式,包括: 在所述距離De大于或等于第一閾值,或者所述距離Dlsf大于或等于第二閾值的情況 下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方式。
      11. 根據(jù)權(quán)利要求10所述的方法,其特征在于,還包括: 獲取預(yù)設(shè)的所述第一閾值和預(yù)設(shè)的所述第二閾值;或者, 根據(jù)所述當(dāng)前輸入幀之前的N個(gè)靜音幀的CELP激勵(lì)能量確定所述第一閾值,并根據(jù)所 述N個(gè)靜音幀的LSF系數(shù)確定所述第二閾值,其中N為正整數(shù)。
      12. 根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法,其特征在于,所述預(yù)測(cè)在所述當(dāng)前輸入 幀被編碼為SID幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成的舒適噪聲,包括 : 采用第一預(yù)測(cè)方式,預(yù)測(cè)所述舒適噪聲,其中所述第一預(yù)測(cè)方式與所述解碼器生成所 述舒適噪聲的方式相同。
      13. -種信號(hào)處理方法,其特征在于,包括: 確定P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離,其中所述P個(gè)靜音幀中每個(gè)靜音幀的 組加權(quán)譜距離為所述P個(gè)靜音幀中所述每個(gè)靜音幀與其它(P-1)個(gè)靜音幀之間的加權(quán)譜距 離之和,P為正整數(shù); 根據(jù)所述P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離,確定第一譜參數(shù),其中所述第一 譜參數(shù)用于生成舒適噪聲。
      14. 根據(jù)權(quán)利要求13所述的方法,其特征在于,所述每個(gè)靜音幀與一組加權(quán)系數(shù)相對(duì) 應(yīng),其中在所述一組加權(quán)系數(shù)中,對(duì)應(yīng)于第一組子帶的加權(quán)系數(shù)大于對(duì)應(yīng)于第二組子帶的 加權(quán)系數(shù),其中所述第一組子帶的感知重要性大于所述第二組子帶的感知重要性。
      15. 根據(jù)權(quán)利要求13或14所述的方法,其特征在于,所述根據(jù)所述P個(gè)靜音幀中每個(gè) 靜音幀的組加權(quán)譜距離,確定第一譜參數(shù),包括: 從所述P個(gè)靜音幀中選擇第一靜音幀,使得在所述P個(gè)靜音幀中所述第一靜音幀的組 加權(quán)譜距離最??; 將所述第一靜音幀的譜參數(shù)確定為所述第一譜參數(shù)。
      16. 根據(jù)權(quán)利要求13或14所述的方法,其特征在于,所述根據(jù)所述P個(gè)靜音幀中每個(gè) 靜音幀的組加權(quán)譜距離,確定第一譜參數(shù),包括: 從所述P個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得在所述P個(gè)靜音幀中所述至少一個(gè)靜 音幀的組加權(quán)譜距離均小于第三閾值; 根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述第一譜參數(shù)。
      17. 根據(jù)權(quán)利要求13至16中任一項(xiàng)所述的方法,其特征在于,所述P個(gè)靜音幀包括當(dāng) 前輸入靜音幀以及所述當(dāng)前輸入靜音幀之前的(P-1)個(gè)靜音幀。
      18. 根據(jù)權(quán)利要求17所述的方法,其特征在于,還包括: 將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所述第一譜參數(shù)。
      19. 一種信號(hào)處理方法,其特征在于,包括: 將輸入信號(hào)的頻帶劃分為R個(gè)子帶,其中R為正整數(shù); 在所述R個(gè)子帶中的每個(gè)子帶上,確定S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,所述 S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離為在所述每個(gè)子帶上所述S個(gè)靜音幀中所述每個(gè) 靜音幀與其它(S-1)個(gè)靜音幀之間的譜距離之和,S為正整數(shù); 在所述每個(gè)子帶上根據(jù)所述S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè) 子帶的第一譜參數(shù),其中所述每個(gè)子帶的第一譜參數(shù)用于生成舒適噪聲。
      20. 根據(jù)權(quán)利要求19所述的方法,其特征在于,所述在所述每個(gè)子帶上,根據(jù)所述S個(gè) 靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè)子帶的第一譜參數(shù),包括: 在所述每個(gè)子帶上,從所述S個(gè)靜音幀中選擇第一靜音幀,使得在所述每個(gè)子帶上所 述S個(gè)靜音幀中所述第一靜音幀的子帶組譜距離最??; 在所述每個(gè)子帶上,將所述第一靜音幀的譜參數(shù)確定為所述每個(gè)子帶的第一譜參數(shù)。
      21. 根據(jù)權(quán)利要求19所述的方法,其特征在于,所述在所述每個(gè)子帶上,根據(jù)所述S個(gè) 靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè)子帶的第一譜參數(shù),包括: 在所述每個(gè)子帶上,從所述S個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得所述至少一個(gè)靜 音幀的子帶組譜距離均小于第四閾值; 在所述每個(gè)子帶上,根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述每個(gè)子帶的第一譜 參數(shù)。
      22. 根據(jù)權(quán)利要求19至21中任一項(xiàng)所述的方法,其特征在于,所述S個(gè)靜音幀包括當(dāng) 前輸入靜音幀以及所述當(dāng)前輸入靜音幀之前的(S-1)個(gè)靜音幀。
      23. 根據(jù)權(quán)利要求22所述的方法,其特征在于,還包括: 將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所述每個(gè)子帶的 第一譜參數(shù)。
      24. -種信號(hào)處理方法,其特征在于,包括: 確定T個(gè)靜音幀中每個(gè)靜音幀的第一參數(shù),所述第一參數(shù)用于表征譜熵,T為正整數(shù); 根據(jù)所述T個(gè)靜音幀中每個(gè)靜音幀的第一參數(shù),確定第一譜參數(shù),其中所述第一譜參 數(shù)用于生成舒適噪聲。
      25. 根據(jù)權(quán)利要求24所述的方法,其特征在于,所述根據(jù)所述Τ個(gè)靜音幀中每個(gè)靜音幀 的第一參數(shù),確定第一譜參數(shù),包括: 在確定能夠按照聚類準(zhǔn)則將所述Τ個(gè)靜音幀分為第一組靜音幀和第二組靜音幀的情 況下,根據(jù)所述第一組靜音幀的譜參數(shù),確定所述第一譜參數(shù),其中所述第一組靜音幀的第 一參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參數(shù)所表征的譜熵; 在確定不能夠按照聚類準(zhǔn)則將所述Τ個(gè)靜音幀分為第一組靜音幀和第二組靜音幀的 情況下,對(duì)所述Τ個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù),其中所述 第一組靜音幀的第一參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參數(shù)所表征的譜 熵。
      26. 根據(jù)權(quán)利要求25所述的方法,其特征在于,所述聚類準(zhǔn)則包括: 所述第一組靜音幀中每個(gè)靜音幀的第一參數(shù)與第一均值之間的距離小于或等于所述 第一組靜音幀中每個(gè)靜音幀的第一參數(shù)與第二均值之間的距離;所述第二組靜音幀中每個(gè) 靜音幀的第一參數(shù)與所述第二均值之間的距離小于或等于所述第二組靜音幀中每個(gè)靜音 幀的第一參數(shù)與所述第一均值之間的距離;所述第一均值與所述第二均值之間的距離大于 所述第一組靜音幀的第一參數(shù)與所述第一均值之間的平均距離;所述第一均值與所述第二 均值之間的距離大于所述第二組靜音幀的第一參數(shù)與所述第二均值之間的平均距離; 其中,所述第一均值為所述第一組靜音幀的第一參數(shù)的平均值,所述第二均值為所述 第二組靜音幀的第一參數(shù)的平均值。
      27. 根據(jù)權(quán)利要求24所述的方法,其特征在于,所述根據(jù)所述Τ個(gè)靜音幀中每個(gè)靜音幀 的第一參數(shù),確定第一譜參數(shù),包括: 對(duì)所述Τ個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù); 其中,對(duì)于所述Τ個(gè)靜音幀中任意不同的第i個(gè)靜音幀和第j個(gè)靜音幀,所述第i個(gè)靜 音幀對(duì)應(yīng)的加權(quán)系數(shù)大于或等于所述j個(gè)靜音幀對(duì)應(yīng)的加權(quán)系數(shù); 在所述第一參數(shù)與所述譜熵正相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù)大于所述第j個(gè) 靜音幀的第一參數(shù);在所述第一參數(shù)與所述譜熵負(fù)相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù) 小于所述第j個(gè)靜音幀的第一參數(shù),i和j均為正整數(shù),且1 < i < T,1 < j < T。
      28. 根據(jù)權(quán)利要求24至27中任一項(xiàng)所述的方法,其特征在于,所述T個(gè)靜音幀包括當(dāng) 前輸入靜音幀以及所述當(dāng)前輸入靜音幀之前的(Τ-1)個(gè)靜音幀
      29. 根據(jù)權(quán)利要求28所述的方法,其特征在于,還包括: 將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所述第一譜參數(shù)。
      30. -種信號(hào)編碼設(shè)備,其特征在于,包括: 第一確定單元,用于在當(dāng)前輸入幀的前一幀的編碼方式為連續(xù)編碼方式的情況下,預(yù) 測(cè)在所述當(dāng)前輸入幀被編碼為靜音描述SID幀的情況下解碼器根據(jù)所述當(dāng)前輸入幀生成 的舒適噪聲,并確定實(shí)際靜音信號(hào),其中所述當(dāng)前輸入巾貞為靜音巾貞; 第二確定單元,用于確定所述第一確定單元確定的所述舒適噪聲與所述第一確定單元 確定的所述實(shí)際靜音信號(hào)的偏離程度; 第三確定單元,用于根據(jù)所述第二確定單元確定的所述偏離程度,確定所述當(dāng)前輸入 幀的編碼方式,所述當(dāng)前輸入幀的編碼方式包括拖尾幀編碼方式或SID幀編碼方式; 編碼單元,用于根據(jù)所述第三確定單元確定的所述當(dāng)前輸入幀的編碼方式,對(duì)所述當(dāng) 前輸入幀進(jìn)行編碼。
      31. 根據(jù)權(quán)利要求30所述的設(shè)備,其特征在于,所述第一確定單元具體用于預(yù)測(cè)所述 舒適噪聲的特征參數(shù),并確定所述實(shí)際靜音信號(hào)的特征參數(shù),其中所述舒適噪聲的特征參 數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)是一一對(duì)應(yīng)的; 所述第二確定單元具體用于確定所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特 征參數(shù)之間的距離。
      32. 根據(jù)權(quán)利要求31所述的設(shè)備,其特征在于,所述第三確定單元具體用于:在所述舒 適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離小于閾值集合中對(duì)應(yīng)閾值 的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述SID幀編碼方式,其中所述舒適噪聲的 特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離與所述閾值集合中的閾值是一一對(duì) 應(yīng)的;在所述舒適噪聲的特征參數(shù)與所述實(shí)際靜音信號(hào)的特征參數(shù)之間的距離大于或等于 所述閾值集合中對(duì)應(yīng)閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方 式。
      33. 根據(jù)權(quán)利要求31或32所述的設(shè)備,其特征在于,所述第一確定單元具體用于:根 據(jù)所述當(dāng)前輸入幀的前一幀的舒適噪聲參數(shù)和所述當(dāng)前輸入幀的特征參數(shù),預(yù)測(cè)所述舒適 噪聲的特征參數(shù);或者,根據(jù)所述當(dāng)前輸入幀之前的L個(gè)拖尾幀的特征參數(shù)和所述當(dāng)前輸 入幀的特征參數(shù),預(yù)測(cè)所述舒適噪聲的特征參數(shù),其中L為正整數(shù)。
      34. 根據(jù)權(quán)利要求31至33中任一項(xiàng)所述的設(shè)備,其特征在于,所述第一確定單元具體 用于:確定所述當(dāng)前輸入幀的特征參數(shù)作為所述實(shí)際靜音信號(hào)的特征參數(shù);或者,對(duì)Μ個(gè)靜 音幀的特征參數(shù)進(jìn)行統(tǒng)計(jì)處理,以確定所述實(shí)際靜音信號(hào)的特征參數(shù)。
      35. 根據(jù)權(quán)利要求32所述的設(shè)備,其特征在于,所述舒適噪聲的特征參數(shù)包括所述舒 適噪聲的碼激勵(lì)線性預(yù)測(cè)CELP激勵(lì)能量和所述舒適噪聲的線譜頻率LSF系數(shù),所述實(shí)際靜 音信號(hào)的特征參數(shù)包括所述實(shí)際靜音信號(hào)的CELP激勵(lì)能量和所述實(shí)際靜音信號(hào)的LSF系 數(shù); 所述第二確定單元具體用于確定所述舒適噪聲的CELP激勵(lì)能量與所述實(shí)際靜音信號(hào) 的CELP激勵(lì)能量之間的距離De,并確定所述舒適噪聲的LSF系數(shù)與所述實(shí)際靜音信號(hào)的 LSF系數(shù)之間的距離Dlsf。
      36. 根據(jù)權(quán)利要求35所述的設(shè)備,其特征在于,所述第三確定單元具體用于在所述距 離De小于第一閾值,且所述距離Dlsf小于第二閾值的情況下,確定所述當(dāng)前輸入幀的編碼 方式為所述SID幀編碼方式; 所述第三確定單元具體用于在所述距離De大于或等于第一閾值,或者所述距離Dlsf 大于或等于第二閾值的情況下,確定所述當(dāng)前輸入幀的編碼方式為所述拖尾幀編碼方式。
      37. 根據(jù)權(quán)利要求36所述的設(shè)備,其特征在于,還包括: 第四確定單元,用于:獲取預(yù)設(shè)的所述第一閾值和預(yù)設(shè)的所述第二閾值;或者,根據(jù)所 述當(dāng)前輸入幀之前的N個(gè)靜音幀的CELP激勵(lì)能量確定所述第一閾值,并根據(jù)所述N個(gè)靜音 幀的LSF系數(shù)確定所述第二閾值,其中N為正整數(shù)。
      38. 根據(jù)權(quán)利要求30至37中任一項(xiàng)所述的設(shè)備,其特征在于,所述第一確定單元具體 用于采用第一預(yù)測(cè)方式,預(yù)測(cè)所述舒適噪聲,其中所述第一預(yù)測(cè)方式與所述解碼器生成所 述舒適噪聲的方式相同。
      39. -種信號(hào)處理設(shè)備,其特征在于,包括: 第一確定單元,用于確定P個(gè)靜音幀中每個(gè)靜音幀的組加權(quán)譜距離,其中所述P個(gè)靜音 幀中每個(gè)靜音幀的組加權(quán)譜距離為所述P個(gè)靜音幀中所述每個(gè)靜音幀與其它(P-1)個(gè)靜音 幀之間的加權(quán)譜距離之和,P為正整數(shù); 第二確定單元,用于根據(jù)所述第一確定單元確定的所述P個(gè)靜音幀中每個(gè)靜音幀的組 加權(quán)譜距離,確定第一譜參數(shù),所述第一譜參數(shù)用于生成舒適噪聲。
      40. 根據(jù)權(quán)利要求39所述的設(shè)備,其特征在于,所述第二確定單元具體用于:從所述P 個(gè)靜音幀中選擇第一靜音幀,使得在所述P個(gè)靜音幀中所述第一靜音幀的組加權(quán)譜距離最 ?。粚⑺龅谝混o音幀的譜參數(shù)確定為所述第一譜參數(shù)。
      41. 根據(jù)權(quán)利要求39所述的設(shè)備,其特征在于,所述第二確定單元具體用于:從所述P 個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得在所述P個(gè)靜音幀中所述至少一個(gè)靜音幀的組加權(quán) 譜距離均小于第三閾值;根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述第一譜參數(shù)。
      42. 根據(jù)權(quán)利要求39至41中任一項(xiàng)所述的設(shè)備,其特征在于,所述P個(gè)靜音幀包括所 述當(dāng)前輸入靜音幀以及所述當(dāng)前輸入靜音幀之前的(P-1)個(gè)靜音幀; 所述設(shè)備還包括: 編碼單元,用于將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所 述第二確定單元確定的所述第一譜參數(shù)。
      43. -種信號(hào)處理設(shè)備,其特征在于,包括: 劃分單元,用于將輸入信號(hào)的頻帶劃分為R個(gè)子帶,其中R為正整數(shù); 第一確定單元,用于在所述劃分單元?jiǎng)澐值乃鯮個(gè)子帶中每個(gè)子帶上,確定S個(gè)靜音 幀中每個(gè)靜音幀的子帶組譜距離,所述S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離為在所述 每個(gè)子帶上所述S個(gè)靜音幀中所述每個(gè)靜音幀與其它(S-1)個(gè)靜音幀之間的譜距離之和,S 為正整數(shù); 第二確定單元,用于在所述劃分單元?jiǎng)澐值乃雒總€(gè)子帶上根據(jù)所述第一確定單元確 定的S個(gè)靜音幀中每個(gè)靜音幀的子帶組譜距離,確定所述每個(gè)子帶的第一譜參數(shù),其中所 述每個(gè)子帶的第一譜參數(shù)用于生成舒適噪聲。
      44. 根據(jù)權(quán)利要求43所述的設(shè)備,其特征在于,所述第二確定單元具體用于:在所述每 個(gè)子帶上,從所述S個(gè)靜音幀中選擇第一靜音幀,使得在所述每個(gè)子帶上所述S個(gè)靜音幀中 所述第一靜音幀的子帶組譜距離最?。辉谒雒總€(gè)子帶上,將所述第一靜音幀的譜參數(shù)確 定為所述每個(gè)子帶的第一譜參數(shù)。
      45. 根據(jù)權(quán)利要求43所述的設(shè)備,其特征在于,所述第二確定單元具體用于:在所述每 個(gè)子帶上,從所述S個(gè)靜音幀中選擇至少一個(gè)靜音幀,使得所述至少一個(gè)靜音幀的子帶組 譜距離均小于第四閾值;在所述每個(gè)子帶上,根據(jù)所述至少一個(gè)靜音幀的譜參數(shù),確定所述 每個(gè)子帶的第一譜參數(shù)。
      46. 根據(jù)權(quán)利要求43至45中任一項(xiàng)所述的設(shè)備,其特征在于,所述S個(gè)靜音幀包括當(dāng) 前輸入靜音幀以及所述當(dāng)前輸入靜音幀之前的(S-1)個(gè)靜音幀; 所述設(shè)備還包括: 編碼單元,用于將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所 述每個(gè)子帶的譜參數(shù)。
      47. -種信號(hào)處理設(shè)備,其特征在于,包括: 第一確定單元,用于確定T個(gè)靜音幀中每個(gè)靜音幀的第一參數(shù),所述第一參數(shù)用于表 征譜熵,T為正整數(shù); 第二確定單元,用于根據(jù)所述第一確定單元確定的所述T個(gè)靜音幀中每個(gè)靜音幀的第 一參數(shù),確定第一譜參數(shù),其中所述第一譜參數(shù)用于生成舒適噪聲。
      48. 根據(jù)權(quán)利要求47所述的設(shè)備,其特征在于,所述第二確定單元具體用于:在確定 能夠按照聚類準(zhǔn)則將所述T個(gè)靜音幀分為所述第一組靜音幀和所述第二組靜音幀的情況 下,根據(jù)所述第一組靜音幀的譜參數(shù),確定所述第一譜參數(shù),其中所述第一組靜音幀的第一 參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參數(shù)所表征的譜熵;在確定不能夠按照 聚類準(zhǔn)則將所述T個(gè)靜音幀分為所述第一組靜音幀和所述第二組靜音幀的情況下,對(duì)所述 T個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù),其中所述第一組靜音幀的 第一參數(shù)所表征的譜熵均大于所述第二組靜音幀的第一參數(shù)所表征的譜熵。
      49. 根據(jù)權(quán)利要求47所述的設(shè)備,其特征在于,所述第二確定單元具體用于:對(duì)所述T 個(gè)靜音幀的譜參數(shù)進(jìn)行加權(quán)平均處理,以確定所述第一譜參數(shù); 其中,對(duì)于所述T個(gè)靜音幀中任意不同的第i個(gè)靜音幀和第j個(gè)靜音幀,所述第i個(gè)靜 音中貞對(duì)應(yīng)的加權(quán)系數(shù)大于或等于所述j個(gè)靜音巾貞對(duì)應(yīng)的加權(quán)系數(shù);在所述第一參數(shù)與所述 譜熵正相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù)大于所述第j個(gè)靜音幀的第一參數(shù);在所述第 一參數(shù)與所述譜熵負(fù)相關(guān)時(shí),所述第i個(gè)靜音幀的第一參數(shù)小于所述第j個(gè)靜音幀的第一 參數(shù),i和j均為正整數(shù),且1彡i彡T,1彡j彡T。
      50. 根據(jù)權(quán)利要求47至49中任一項(xiàng)所述的設(shè)備,其特征在于,所述T個(gè)靜音幀包括當(dāng) 前輸入靜音幀以及所述當(dāng)前輸入靜音幀之前的(T-1)個(gè)靜音幀; 所述設(shè)備還包括: 編碼單元,用于將所述當(dāng)前輸入靜音幀編碼為靜音描述SID幀,其中所述SID幀包括所 述第一譜參數(shù)。
      【文檔編號(hào)】G10L19/008GK104217723SQ201310209760
      【公開日】2014年12月17日 申請(qǐng)日期:2013年5月30日 優(yōu)先權(quán)日:2013年5月30日
      【發(fā)明者】王喆 申請(qǐng)人:華為技術(shù)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1