專利名稱:音頻編碼設(shè)備、音頻解碼設(shè)備、音頻編碼方法和音頻解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用在編碼和發(fā)送語(yǔ)音和/或聲音信號(hào)的通信系統(tǒng)中的語(yǔ)音編碼設(shè)備、語(yǔ)音解碼設(shè)備及其方法。
背景技術(shù):
在數(shù)字無線通信、以因特網(wǎng)為代表的分組通信和語(yǔ)音存儲(chǔ)等領(lǐng)域中,為了有效地利用無線電信號(hào)的傳輸信道容量和存儲(chǔ)媒體,編碼/解碼語(yǔ)音信號(hào)的技術(shù)是必不可少的,并且,人們已經(jīng)開發(fā)出許多語(yǔ)音編碼/解碼方案。在這些系統(tǒng)當(dāng)中,CELP(碼激勵(lì)線性預(yù)測(cè))語(yǔ)音編碼/解碼方案已經(jīng)實(shí)際用作主流技術(shù)。
CELP型語(yǔ)音編碼設(shè)備根據(jù)事先存儲(chǔ)的語(yǔ)音模型編碼輸入語(yǔ)音。更具體地說,CELP型語(yǔ)音編碼設(shè)備將數(shù)字化語(yǔ)音信號(hào)劃分成大約20ms的幀,一幀一幀地對(duì)語(yǔ)音信號(hào)進(jìn)行線性預(yù)測(cè)分析,獲取線性預(yù)測(cè)系數(shù)和線性預(yù)測(cè)殘差矢量,和分開編碼線性預(yù)測(cè)系數(shù)和線性預(yù)測(cè)殘差矢量。
為了進(jìn)行低位速率通信,由于存儲(chǔ)的語(yǔ)音模型量是有限的,在傳統(tǒng)CELP型語(yǔ)音編碼/解碼方案中主要存儲(chǔ)發(fā)聲語(yǔ)音模型。
在諸如因特網(wǎng)通信之類發(fā)送分組的通信系統(tǒng)中,取決于網(wǎng)絡(luò)狀態(tài),會(huì)發(fā)生分組丟失,最好,即使部分編碼信息丟失了,也可以從其余編碼信息部分中解碼出語(yǔ)音和聲音。類似地,在根據(jù)通信容量改變位速率的可變速率通信系統(tǒng)中,當(dāng)通信容量降低時(shí),最好,通過只發(fā)送部分編碼信息就可以輕易地減輕通信容量的負(fù)擔(dān)。因此,作為允許利用全部編碼信息或部分編碼信息解碼語(yǔ)音和聲音的技術(shù),最近人們把注意力放在可伸縮編碼技術(shù)上。一些可伸縮編碼方案已經(jīng)按慣例公開。
可伸縮編碼系統(tǒng)一般包括基本層和擴(kuò)充層,這些層構(gòu)成基本層是最低層的分層結(jié)構(gòu)。在每個(gè)層中,編碼等于較低層中的輸入信號(hào)和輸出信號(hào)之間的差值的殘差信號(hào)。根據(jù)這種構(gòu)造,可以利用所有層的編碼信息或只利用較低層的編碼信息解碼語(yǔ)音和/或聲音信號(hào)。
但是,在傳統(tǒng)可伸縮編碼系統(tǒng)中,CELP型語(yǔ)音編碼/解碼系統(tǒng)用作基本層和擴(kuò)充層的編碼方案,從而在計(jì)算和編碼信息兩個(gè)方面都需要相當(dāng)大的數(shù)量。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供利用少量計(jì)算和編碼信息就能夠?qū)崿F(xiàn)可伸縮編碼的語(yǔ)音編碼設(shè)備、語(yǔ)音解碼設(shè)備及其方法。
上述的目的通過如下的步驟達(dá)到提供進(jìn)行長(zhǎng)期預(yù)測(cè)的擴(kuò)充層,利用語(yǔ)音或聲音的長(zhǎng)期相關(guān)性特性對(duì)擴(kuò)充層中的殘差信號(hào)進(jìn)行長(zhǎng)期預(yù)測(cè)以便提高解碼信號(hào)的質(zhì)量,利用基本層的長(zhǎng)期預(yù)測(cè)信息獲取長(zhǎng)期預(yù)測(cè)日志,從而減少計(jì)算量。
附圖簡(jiǎn)述
圖1是例示根據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音編碼設(shè)備和語(yǔ)音解碼設(shè)備的配置的方塊圖;圖2是例示根據(jù)上面實(shí)施例的基本層編碼部分的內(nèi)部配置的方塊圖;圖3是說明根據(jù)上面實(shí)施例的基本層編碼部分中的參數(shù)確定部分確定從自適應(yīng)激勵(lì)碼本中生成的信號(hào)的處理的圖形;圖4是例示根據(jù)上面實(shí)施例的基本層解碼部分的內(nèi)部配置的方塊圖;圖5是例示根據(jù)上面實(shí)施例的擴(kuò)充層(enhancement layer)編碼部分的內(nèi)部配置的方塊圖;圖6是例示根據(jù)上面實(shí)施例的擴(kuò)充層解碼部分的內(nèi)部配置的方塊圖;圖7是例示根據(jù)本發(fā)明第二實(shí)施例的擴(kuò)充層編碼部分的內(nèi)部配置的方塊圖;圖8是例示根據(jù)上面實(shí)施例的擴(kuò)充層解碼部分的內(nèi)部配置的方塊圖;和圖9是例示根據(jù)本發(fā)明第三實(shí)施例的語(yǔ)音信號(hào)發(fā)送設(shè)備和語(yǔ)音信號(hào)接收設(shè)備的配置的方塊圖。
具體實(shí)施例方式
下面將參照附圖具體描述本發(fā)明的實(shí)施例。在每個(gè)實(shí)施例中將描述一種情況,在其中,在包括基本層和擴(kuò)充層的雙層語(yǔ)音編碼/解碼方法的擴(kuò)充層中進(jìn)行長(zhǎng)期預(yù)測(cè)的情況。但是,本發(fā)明不局限于這樣的層結(jié)構(gòu),本發(fā)明可應(yīng)用于在存在三層或更多層的分層語(yǔ)音編碼/解碼方法中利用較低層的長(zhǎng)期預(yù)測(cè)信息在較高層中進(jìn)行長(zhǎng)期預(yù)測(cè)的任何情況。分層語(yǔ)音編碼方法指的是在較高層中存在通過長(zhǎng)期預(yù)測(cè)編碼殘差信號(hào)(較低層的輸入信號(hào)與較低層的解碼信號(hào)之間的差值)以便輸出編碼信息的數(shù)種語(yǔ)音編碼方法和這些語(yǔ)音編碼方法構(gòu)成分層結(jié)構(gòu)。并且,分層語(yǔ)音解碼方法指的是在較高層中存在解碼殘差信號(hào)的數(shù)種語(yǔ)音解碼方法和這些語(yǔ)音解碼方法構(gòu)成分層結(jié)構(gòu)。這里,存在于最低層中的語(yǔ)音/聲音編碼/解碼方法被稱作基本層。存在于比基本層高的層中的語(yǔ)音/聲音編碼/解碼方法被稱作擴(kuò)充層。
在本發(fā)明的每個(gè)實(shí)施例中,舉例描述基本層進(jìn)行CELP型語(yǔ)音編碼/解碼的情況。
(第一實(shí)施例)圖1是例示根據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音編碼設(shè)備和語(yǔ)音解碼設(shè)備的配置的方塊圖。
在圖1中,語(yǔ)音編碼設(shè)備100主要包括基本層編碼部分101、基本層解碼部分102、相加部分103、擴(kuò)充層編碼部分104和多路復(fù)用部分105。語(yǔ)音解碼設(shè)備150主要包括多路分用部分151、基本層解碼部分152、擴(kuò)充層解碼部分153和相加部分154。
基本層編碼部分101接收語(yǔ)音或聲音信號(hào),利用CELP型語(yǔ)音編碼方法編碼輸入信號(hào),并將通過編碼獲得的基本層編碼信息輸出到基本層解碼部分102和多路復(fù)用部分105。
基本層解碼部分102利用CELP型語(yǔ)音解碼方法解碼基本層編碼信息,并將通過解碼獲得的基本層解碼信號(hào)輸出到相加部分103。并且,基本層解碼部分102將基音延遲(pitch lag)輸出到擴(kuò)充層編碼部分104,作為基本層的長(zhǎng)期預(yù)測(cè)信息。
“長(zhǎng)期預(yù)測(cè)信息”是指示語(yǔ)音或聲音信號(hào)的長(zhǎng)期相關(guān)性的信息?!盎粞舆t”涉及由基本層指定的位置信息,以后會(huì)作更詳細(xì)描述。
相加部分103顛倒從基本層解碼部分102輸出的基本層解碼信號(hào)的極性以便與輸入信號(hào)相加,并且將作為相加結(jié)果的殘差信號(hào)輸出到擴(kuò)充層編碼部分104。
擴(kuò)充層編碼部分104利用從基本層解碼部分102輸出的長(zhǎng)期預(yù)測(cè)信息并從相加部分103輸出的殘差信號(hào)計(jì)算長(zhǎng)期預(yù)測(cè)系數(shù),編碼長(zhǎng)期預(yù)測(cè)系數(shù),并將通過編碼獲得的擴(kuò)充層編碼信息輸出到多路復(fù)用部分105。
多路復(fù)用部分105多路復(fù)用從基本層編碼部分101輸出的基本層編碼信息和從擴(kuò)充層編碼部分104輸出的擴(kuò)充層編碼信息,以便通過傳輸信道輸出到多路分用部分151作為多路復(fù)用信息。
多路分用部分151將從語(yǔ)音編碼設(shè)備100發(fā)送的多路復(fù)用信息多路分用成基本層編碼信息和擴(kuò)充層編碼信息,并將多路分用基本層編碼信息輸出到基本層解碼部分152,同時(shí)將多路分用擴(kuò)充層編碼信息輸出到擴(kuò)充層解碼部分153。
基本層解碼部分152利用CELP型語(yǔ)音解碼方法解碼基本層編碼信息,并將通過解碼獲得的基本層解碼信號(hào)輸出到相加部分154。并且,基本層解碼部分152將基音延遲輸出到擴(kuò)充層解碼部分153,作為基本層的長(zhǎng)期預(yù)測(cè)信息。擴(kuò)充層解碼部分153利用長(zhǎng)期預(yù)測(cè)信息解碼擴(kuò)充層編碼信息,并將通過解碼獲得的擴(kuò)充層解碼信號(hào)輸出到相加部分154。
相加部分154相加從基本層解碼部分152輸出的基本層解碼信號(hào)和從擴(kuò)充層解碼部分153輸出的擴(kuò)充層解碼信號(hào),并將作為相加結(jié)果的語(yǔ)音或聲音信號(hào)輸出到供隨后處理用的設(shè)備。
下面參照?qǐng)D2的方塊圖描述圖1的基本層編碼部分101的內(nèi)部配置。
將基本層編碼部分101的輸入信號(hào)輸入預(yù)處理部分200。預(yù)處理部分200進(jìn)行除去DC(直流)成分的高通濾波處理、整形處理以及用以改善后續(xù)編碼處理的性能的預(yù)加強(qiáng)處理,并將經(jīng)過處理的信號(hào)(Xin)輸出到LPC(線性預(yù)測(cè)系數(shù))分析部分201和加法器204。
LPC分析部分201利用Xin進(jìn)行線性預(yù)測(cè)分析,并將線性預(yù)測(cè)的結(jié)果(線性預(yù)測(cè)系數(shù))輸出到LPC量化部分202。LPC量化部分202對(duì)從LPC分析部分201輸出的線性預(yù)測(cè)系數(shù)進(jìn)行量化處理,并將量化LPC輸出到合成濾波器203,同時(shí)將代表量化LPC的代碼(L)輸出到多路復(fù)用部分213。
合成濾波器203通過利用基于量化LPC的濾波系數(shù)對(duì)從如后所述的相加部分210輸出的激勵(lì)矢量進(jìn)行濾波合成,生成合成信號(hào),并將合成信號(hào)輸出到加法器204。
加法器204顛倒合成信號(hào)的極性,將所得信號(hào)與Xin相加,計(jì)算誤差信號(hào),并將誤差信號(hào)輸出到聽覺加權(quán)部分211。
自適應(yīng)激勵(lì)碼本205含有存儲(chǔ)在緩沖器中的較早從加法器210輸出的激勵(lì)矢量信號(hào),并且從參數(shù)確定部分212輸出的信號(hào)指定的較早激勵(lì)矢量信號(hào)樣本中取出與一個(gè)幀相對(duì)應(yīng)的樣本,輸出到乘法器208。
量化增益生成部分206將參數(shù)確定部分212輸出的信號(hào)指定的自適應(yīng)激勵(lì)增益和固定激勵(lì)增益分別輸出到乘法器208和209。
固定激勵(lì)碼本207將具有參數(shù)確定部分212輸出的信號(hào)指定的形狀的脈沖激勵(lì)矢量乘以擴(kuò)展矢量,并將獲得的固定激勵(lì)矢量輸出到乘法器209。
乘法器208將量化增益生成部分206輸出的量化自適應(yīng)激勵(lì)增益乘以自適應(yīng)激勵(lì)碼本205輸出的自適應(yīng)激勵(lì)矢量,并將結(jié)果輸出到加法器210。乘法器209將量化增益生成部分206輸出的量化固定激勵(lì)增益乘以固定激勵(lì)碼本207輸出的固定激勵(lì)矢量,并將結(jié)果輸出到加法器210。
加法器210接收分別從乘法器208和209輸入的兩者都已乘以增益的自適應(yīng)激勵(lì)矢量和固定激勵(lì)矢量,并且以矢量形式將它們相加,并將作為相加結(jié)果的激勵(lì)矢量輸出到合成濾波器203和自適應(yīng)激勵(lì)碼本205。另外,將輸入自適應(yīng)激勵(lì)碼本205的激勵(lì)矢量存儲(chǔ)在緩沖器中。
聽覺加權(quán)部分211對(duì)從加法器204輸出的信號(hào)進(jìn)行聽覺加權(quán),在聽覺加權(quán)區(qū)中計(jì)算Xin與合成信號(hào)之間的失真,并將結(jié)果輸出到參數(shù)確定部分212。
參數(shù)確定部分212選擇分別來自適應(yīng)激勵(lì)碼本205、固定激勵(lì)碼本207和量化增益生成部分206的使聽覺加權(quán)部分211輸出的編碼失真最小的自適應(yīng)激勵(lì)矢量、固定激勵(lì)矢量和量化增益,并將代表選擇結(jié)果的自適應(yīng)激勵(lì)矢量代碼(A)、量化增益代碼(G)和固定激勵(lì)矢量代碼(F)輸出到多路復(fù)用部分213。另外,自適應(yīng)激勵(lì)矢量代碼(A)是與基音延遲相對(duì)應(yīng)的代碼。
多路復(fù)用部分213從LPC量化部分202接收代表量化LPC的代碼(L),進(jìn)一步從參照確定部分212接收代表自適應(yīng)激勵(lì)矢量的代碼(A)、代表固定激勵(lì)矢量的代碼(F)和代表量化增益的代碼(G),并多路復(fù)用這幾個(gè)信息以便作為基本層編碼信息輸出。
上文是圖1的基本編碼部分101的內(nèi)部配置的說明。
下面參照?qǐng)D3,主要描述參數(shù)確定部分212確定要從自適應(yīng)激勵(lì)碼本205中生成的信號(hào)的處理。在圖3中,緩沖器301是配備在自適應(yīng)激勵(lì)碼本205中的緩沖器,位置302是自適應(yīng)激勵(lì)矢量的取出位置,而矢量303是取出的自適應(yīng)激勵(lì)矢量。數(shù)值“41”和“296”分別對(duì)應(yīng)于移動(dòng)取出位置302的范圍的下限和上限。
假設(shè)指定給代表自適應(yīng)激勵(lì)矢量的代碼(A)的位數(shù)是“8”,移動(dòng)取出位置302的范圍被設(shè)置在長(zhǎng)度為“256”(例如,從“41”到“296”)的范圍上。移動(dòng)取出位置302的范圍可以任意設(shè)置。
參數(shù)確定部分212在設(shè)置的范圍內(nèi)移動(dòng)取出位置302,和按幀長(zhǎng)從每個(gè)位置中取出自適應(yīng)激勵(lì)矢量303。然后,參數(shù)確定部分212獲取使聽覺加權(quán)部分211輸出的編碼失真最小的取出位置302。
參數(shù)確定部分212如此獲得的緩沖器中的取出位置302是“基音延遲”。
下面參照?qǐng)D4描述圖1的基本層解碼部分102(152)的內(nèi)部配置。
在圖4中,輸入基本層解碼部分102(152)的基本層編碼信息由多路分用部分401多路分用,分解成代碼(L、G和F)。多路分用LPC代碼(L)輸出到LPC解碼部分402,多路分用自適應(yīng)激勵(lì)矢量代碼(A)輸出到自適應(yīng)激勵(lì)碼本405,多路分用量化增益代碼(G)輸出到量化增益生成部分406,而多路分用固定激勵(lì)矢量代碼(F)輸出到固定激勵(lì)碼本407。
LPC解碼部分402從多路分用部分401輸出的代碼(L)中解碼LPC,并將結(jié)果輸出到合成濾波器403。
自適應(yīng)激勵(lì)碼本405從多路分用部分401輸出的代碼(A)指定的過去激勵(lì)矢量信號(hào)中取出與一個(gè)幀相對(duì)應(yīng)的樣本作為激勵(lì)矢量,并將激勵(lì)矢量輸出到乘法器408。并且,自適應(yīng)激勵(lì)碼本405還將作為長(zhǎng)期預(yù)測(cè)信息的基音延遲輸出到擴(kuò)充層編碼部分104(擴(kuò)充層然解碼部分153)。
量化增益生成部分406分別解碼多路分用部分401輸出的量化增益代碼(G)指定的自適應(yīng)激勵(lì)矢量增益和固定激勵(lì)矢量增益,并將結(jié)果輸出到乘法器408和409。
固定激勵(lì)碼本407生成多路分用部分401輸出的代碼(F)指定的固定激勵(lì)矢量,并將結(jié)果輸出到加法器409。
乘法器408將自適應(yīng)激勵(lì)矢量乘以自適應(yīng)激勵(lì)矢量增益,并將結(jié)果輸出到加法器410。乘法器409將固定激勵(lì)矢量乘以固定激勵(lì)矢量增益,并將結(jié)果輸出到加法器410。
加法器410相加分別從乘法器408和409輸出的兩者都乘以增益的自適應(yīng)激勵(lì)矢量和固定激勵(lì)矢量,生成激勵(lì)矢量,并將這個(gè)激勵(lì)矢量輸出到合成濾波器403和自適應(yīng)激勵(lì)碼本405。
合成濾波器403利用作為激勵(lì)信號(hào)從加法器410輸出的激勵(lì)矢量和進(jìn)一步利用在LPC解碼部分402中解碼的濾波系數(shù)進(jìn)行濾波合成,并將合成信號(hào)輸出到后處理部分404。
后處理部分404對(duì)合成濾波器403輸出的信號(hào)進(jìn)行諸如共振峰加強(qiáng)和基音加強(qiáng)之類提高語(yǔ)音的主觀質(zhì)量的處理,以及提高靜態(tài)噪聲的主觀質(zhì)量的其他處理,以便作為基本層解碼信號(hào)輸出。
上文是圖1的基本層解碼部分102的內(nèi)部配置的說明。
下面參照?qǐng)D5描述圖1的擴(kuò)充層編碼部分104的內(nèi)部配置。
擴(kuò)充層編碼部分104將殘差信號(hào)劃分成N個(gè)樣本(N是自然數(shù))的片段,并在將N個(gè)樣本作為一個(gè)幀的假設(shè)下,對(duì)每個(gè)幀進(jìn)行編碼。在下文中,殘差信號(hào)用e(0)~e(X-1)表示,而經(jīng)過編碼的幀用e(n)~e(n+N-1)表示。這里,X是殘差信號(hào)的長(zhǎng)度,而N對(duì)應(yīng)于幀的長(zhǎng)度。n是位于每個(gè)幀開頭的樣本,對(duì)應(yīng)于N的整數(shù)倍。另外,從以前生成的信號(hào)中預(yù)測(cè)一些幀的信號(hào)的方法叫作長(zhǎng)期預(yù)測(cè)。進(jìn)行長(zhǎng)期預(yù)測(cè)的濾波器叫作基音濾波器、梳狀濾波器等。
在圖5中,長(zhǎng)期預(yù)測(cè)延遲指示部分501接收在基本層解碼部分102中獲得的長(zhǎng)期預(yù)測(cè)信息t,并根據(jù)該信息獲取擴(kuò)充層的長(zhǎng)期預(yù)測(cè)延遲T,以便輸出到長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502。另外,當(dāng)在基本層和擴(kuò)充層之間出現(xiàn)取樣頻率差時(shí),從如下方程(1)中獲取長(zhǎng)期預(yù)測(cè)延遲T。另外,在方程(1)中,D是擴(kuò)充層的取樣頻率,而d是基本層的取樣頻率。
T=D×t/d...方程(1)長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502配有存儲(chǔ)較早生成的長(zhǎng)期預(yù)測(cè)信號(hào)的緩沖器。當(dāng)假設(shè)緩沖器的長(zhǎng)度是M時(shí),緩沖器包括以前生成長(zhǎng)期預(yù)測(cè)信號(hào)的序列s(n-M-1)~s(n-1)。一旦從長(zhǎng)期預(yù)測(cè)延遲指示部分501接收到長(zhǎng)期預(yù)測(cè)延遲T,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502就從存儲(chǔ)在緩沖器中的前長(zhǎng)期預(yù)測(cè)信號(hào)序列中取出倒退長(zhǎng)期預(yù)測(cè)延遲T的長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1),并將結(jié)果輸出到長(zhǎng)期預(yù)測(cè)系數(shù)計(jì)算部分503和長(zhǎng)期預(yù)測(cè)信號(hào)生成部分506。并且,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502從長(zhǎng)期預(yù)測(cè)信號(hào)生成部分506接收長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1),并通過如下方程(2)更新緩沖器。
(i)=s(i+N)(i=n-M-1,…,n-1)s(i)=(i)(i=n-M-1,…,n-1) ...方程(2)另外,當(dāng)長(zhǎng)期預(yù)測(cè)延遲T短于幀長(zhǎng)N和長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502不能取出長(zhǎng)期預(yù)測(cè)信號(hào)時(shí),將長(zhǎng)期預(yù)測(cè)延遲T乘以整數(shù),直到T長(zhǎng)于幀長(zhǎng)N,以便能夠取出長(zhǎng)期預(yù)測(cè)信號(hào)。否則,重復(fù)倒退長(zhǎng)期預(yù)測(cè)延遲T的長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1)直到要取出的幀長(zhǎng)N。
長(zhǎng)期預(yù)測(cè)系數(shù)計(jì)算部分503接收殘差信號(hào)e(n)~e(n+N-1)和長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1),并將這些信號(hào)用在如下方程(3)中,計(jì)算長(zhǎng)期預(yù)測(cè)系數(shù)β,以便輸出到長(zhǎng)期預(yù)測(cè)系數(shù)編碼部分504。
β=Σi=0N-1e(n+i)s(n-T+i)Σi=0N-1s(n-T+i)2]]>...方程(3)長(zhǎng)期預(yù)測(cè)系數(shù)編碼部分504編碼長(zhǎng)期預(yù)測(cè)系數(shù)β,并將通過編碼獲得的擴(kuò)充層編碼信息輸出到長(zhǎng)期預(yù)測(cè)系數(shù)解碼部分505,同時(shí),通過傳輸信道進(jìn)一步將信息輸出到擴(kuò)充層解碼部分153。另外,作為編碼長(zhǎng)期預(yù)測(cè)系數(shù)β的方法,通過可伸縮量化等的方法是已知的。
長(zhǎng)期預(yù)測(cè)系數(shù)解碼部分505解碼擴(kuò)充層編碼信息,并將通過解碼獲得的解碼長(zhǎng)期預(yù)測(cè)系數(shù)βq輸出到長(zhǎng)期預(yù)測(cè)信號(hào)生成部分506。
長(zhǎng)期預(yù)測(cè)信號(hào)生成部分506接收解碼長(zhǎng)期預(yù)測(cè)系數(shù)βq和長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1)作為輸入,利用該輸入,通過如下方程(4)計(jì)算長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1),并將結(jié)果輸出到長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502。
s(n+i)=βα×s(n-T+1)(i=0,…,N-1) ...方程(4)上文是圖1的擴(kuò)充層編碼部分104的內(nèi)部配置的說明。
下面參照?qǐng)D6的方塊圖描述圖1的擴(kuò)充層解碼部分153的內(nèi)部配置。
在圖6中,長(zhǎng)期預(yù)測(cè)延遲指示部分601利用基本層解碼部分152輸出的長(zhǎng)期預(yù)測(cè)信息獲取擴(kuò)充層的長(zhǎng)期預(yù)測(cè)延遲T,以輸出到長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602。
長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602配有存儲(chǔ)較早生成的長(zhǎng)期預(yù)測(cè)信號(hào)的緩沖器。當(dāng)緩沖器的長(zhǎng)度是M時(shí),緩沖器包括較早生成長(zhǎng)期預(yù)測(cè)信號(hào)的序列s(n-M-1)~s(n-1)。一旦從長(zhǎng)期預(yù)測(cè)延遲指示部分601接收到長(zhǎng)期預(yù)測(cè)延遲T,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602從存儲(chǔ)在緩沖器中的前長(zhǎng)期預(yù)測(cè)信號(hào)序列中取出倒退長(zhǎng)期預(yù)測(cè)延遲T的長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1),以便輸出到長(zhǎng)期預(yù)測(cè)信號(hào)生成部分604。并且,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602從長(zhǎng)期預(yù)測(cè)信號(hào)生成部分604接收長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1),并通過如上所述的方程(2)更新緩沖器。
長(zhǎng)期預(yù)測(cè)系數(shù)解碼部分603解碼擴(kuò)充層編碼信息,并將通過解碼獲得的解碼長(zhǎng)期預(yù)測(cè)系數(shù)βq輸出到長(zhǎng)期預(yù)測(cè)信號(hào)生成部分604。
長(zhǎng)期預(yù)測(cè)信號(hào)生成部分604接收解碼長(zhǎng)期預(yù)測(cè)系數(shù)βq和長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1)作為輸入,利用該輸入,通過如上所述方程(4)計(jì)算長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1),并將結(jié)果輸出到長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602和相加部分153,作為擴(kuò)充層解碼信號(hào)。
上文是圖1的擴(kuò)充層解碼部分153的內(nèi)部配置的說明。
因此,通過提供進(jìn)行長(zhǎng)期預(yù)測(cè)的擴(kuò)充層和利用語(yǔ)音或聲音信號(hào)的長(zhǎng)期相關(guān)性特性在擴(kuò)充層中對(duì)殘差信號(hào)進(jìn)行長(zhǎng)期預(yù)測(cè),可以利用較少編碼信息編碼/解碼頻率范圍寬的語(yǔ)音/聲音信號(hào)和減少計(jì)算量。
此刻,取代編碼/解碼長(zhǎng)期預(yù)測(cè)延遲,利用基本層的長(zhǎng)期預(yù)測(cè)信息獲取長(zhǎng)期預(yù)測(cè)延遲可以減少編碼信息。
并且,通過解碼基本層編碼信息,可以只獲取基本層的解碼信號(hào),和可以實(shí)現(xiàn)用CELP型語(yǔ)音編碼/解碼方法(可伸縮編碼)從部分編碼信息中解碼語(yǔ)音或聲音的功能。
此外,在長(zhǎng)期預(yù)測(cè)中,利用語(yǔ)音或聲音的長(zhǎng)期相關(guān)性從緩沖器中取出與當(dāng)前幀有最高相關(guān)性的幀,以及利用取出幀的信號(hào)表達(dá)當(dāng)前幀的信號(hào)。但是,在從緩沖器中取出與當(dāng)前幀有最高相關(guān)性的幀的手段中,當(dāng)不存在諸如基音延遲之類代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息時(shí),有必要改變從緩沖器中取出幀的取出位置,同時(shí)計(jì)算取出帖和當(dāng)前幀的自相關(guān)函數(shù),以便搜索有最高相關(guān)性的幀,并且,用于搜索的計(jì)算量變得相當(dāng)大。
但是,通過確定唯一使用在基本層編碼部分101中獲得的基音延遲的取出位置,可以大量地減少一般長(zhǎng)期預(yù)測(cè)所需的計(jì)算量。
另外,上面在在本實(shí)施例中說明的擴(kuò)充層長(zhǎng)期預(yù)測(cè)方法中已經(jīng)描述了從基本層解碼部分輸出的長(zhǎng)期預(yù)測(cè)信息是基音延遲的情況,但是,本發(fā)明不局限于這種情況,只要信息代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性,就可以將任何信息用作長(zhǎng)期預(yù)測(cè)信息。
并且,在本實(shí)施例中描述了長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502從緩沖器中取出長(zhǎng)期預(yù)測(cè)信號(hào)的位置是長(zhǎng)期預(yù)測(cè)延遲T的情況,但是,本發(fā)明可應(yīng)用于這樣的位置是長(zhǎng)期預(yù)測(cè)延遲T附近的位置T+α(α是一個(gè)微小數(shù)字并可任意設(shè)置)的情況,即使在長(zhǎng)期預(yù)測(cè)延遲T存在微小誤差的情況下,也可以獲得與本實(shí)施例相同的效果和優(yōu)點(diǎn)。
例如,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502從長(zhǎng)期預(yù)測(cè)延遲指示部分501接收長(zhǎng)期預(yù)測(cè)延遲T,從存儲(chǔ)在緩沖器的前長(zhǎng)期預(yù)測(cè)信號(hào)序列中取出倒退T+α的長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T-α)~s(n-T-α+N-1),利用如下方程(5)計(jì)算確定值C,獲取使確定值C最小的α,并編碼這個(gè)α。并且,在解碼的情況下,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602解碼α的編碼信息,以及利用長(zhǎng)期預(yù)測(cè)延遲T,取出長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T-α)~s(n-T-α+N-1)。
C=[Σi=0N-1e(n+i)s(n-T-α+i)]2Σi=0N-1s(n-T-α+i)2]]>...方程(5)并且,雖然上面在本實(shí)施例中已經(jīng)描述了利用語(yǔ)音/聲音信號(hào)進(jìn)行長(zhǎng)期預(yù)測(cè)的情況,但是,本發(fā)明最終可應(yīng)用于利用諸如MDCT和QMF之類的正交變換將語(yǔ)音/聲音信號(hào)從時(shí)域變換到頻域,以及利用變換信號(hào)(頻率參數(shù))進(jìn)行長(zhǎng)期預(yù)測(cè)的情況,并且,仍然可以獲得與本實(shí)施例相同的效果和優(yōu)點(diǎn)。例如,在利用語(yǔ)音/聲音信號(hào)的頻率參數(shù)進(jìn)行擴(kuò)充層長(zhǎng)期預(yù)測(cè)的情況下,在圖5中,長(zhǎng)期預(yù)測(cè)系數(shù)計(jì)算部分503重新配備了將長(zhǎng)期預(yù)測(cè)信號(hào)s(n-T)~s(n-T+N-1)從時(shí)域變換到頻域的函數(shù),并重新配備了將殘差信號(hào)變換成頻率參數(shù)的另一種函數(shù),并且,長(zhǎng)期預(yù)測(cè)系數(shù)生成部分506重新配備了將長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1)從頻域逆變換到時(shí)域的函數(shù)。并且,在圖6中,長(zhǎng)期預(yù)測(cè)系數(shù)生成部分604重新配備了將長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1)從頻域逆變換到時(shí)域的功能。
在一般語(yǔ)音/聲音編碼/解碼方法中將用在檢錯(cuò)或糾錯(cuò)中的冗余位加入編碼信息中并在傳輸信道上發(fā)送包含冗余位的編碼信息是常見的。在本發(fā)明中可以加權(quán)指定給基本層編碼部分101輸出的編碼信息(A)和擴(kuò)充層編碼部分104輸出的編碼信息(B)的冗余位對(duì)編碼信息(A)的位指定,以便進(jìn)行指定。
(第二實(shí)施例)下面參照編碼并解碼殘差信號(hào)與長(zhǎng)期預(yù)測(cè)信號(hào)之間的差值(長(zhǎng)期預(yù)測(cè)殘差信號(hào))的情況描述第二實(shí)施例。
除了擴(kuò)充層編碼部分104和擴(kuò)充層解碼部分153的內(nèi)部配置之外,本實(shí)施例的語(yǔ)音編碼設(shè)備和語(yǔ)音解碼設(shè)備的配置與圖1中的那些相同。
圖7是例示根據(jù)本實(shí)施例的擴(kuò)充層編碼部分104的內(nèi)部配置的方塊圖。另外,在圖7中,將與圖5中相同的標(biāo)號(hào)指定給與圖5共同的結(jié)構(gòu)單元,以便省略對(duì)它們的描述。
與圖5相比,圖7中的擴(kuò)充層編碼部分104進(jìn)一步配有相加部分701、長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702、編碼信息多路復(fù)用部分703、長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分704和相加部分705。
長(zhǎng)期預(yù)測(cè)信號(hào)生成部分506將計(jì)算出的長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1)輸出到相加部分701和702。
正如在如下方程(6)中所表達(dá)的那樣,相加部分701顛倒長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1)的極性,將結(jié)果與殘差信號(hào)e(n)~e(n+N-1)相加,并將作為相加結(jié)果的長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)輸出到長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702。
p(n+i)=e(n+i)-s(n+i)(i=0,…,N-1)...方程(6)長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702編碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1),并將通過編碼獲得的編碼信息(下文稱為“長(zhǎng)期預(yù)測(cè)殘差編碼信息”)輸出到編碼信息多路復(fù)用部分703和長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分704。另外,長(zhǎng)期預(yù)測(cè)殘差信號(hào)的編碼一般通過矢量量化進(jìn)行。
下面將進(jìn)行8位矢量量化的情況用作一個(gè)例子描述編碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)的方法。在這種情況下,在長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702中預(yù)備存儲(chǔ)事先生成256種代碼矢量的碼本。代碼矢量CODE(k)(0)~CODE(k)(N-1)是長(zhǎng)度為N的矢量。k是代碼矢量的索引和取范圍從0到255的值。長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702利用如下方程(7)獲取長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)與代碼矢量CODE(k)(0)~CODE(k)(N-1)之間的平方誤差er。
er=Σi=0N-1(p(n+i)-CODE(k)(i))2]]>...方程(7)然后,長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702確定使平方誤差er最小的k值,作為長(zhǎng)期預(yù)測(cè)殘差編碼信息。
編碼信息多路復(fù)用部分703多路復(fù)用從長(zhǎng)期預(yù)測(cè)系數(shù)編碼部分504輸入的擴(kuò)充層編碼信息和從長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702輸入的長(zhǎng)期預(yù)測(cè)殘差編碼信息,和通過傳輸信道將多路復(fù)用信息輸出到擴(kuò)充層解碼部分153。
長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分704解碼長(zhǎng)期預(yù)測(cè)殘差編碼信息,并將解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)pq(n)~pq(n+N-1)輸出到相加部分705。
相加部分705相加從長(zhǎng)期預(yù)測(cè)信號(hào)生成部分506輸入的長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1)和從長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分704輸入的解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)pq(n)~pq(n+N-1),并將相加結(jié)果輸出到長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502。其結(jié)果是,長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器502利用如下方程(8)更新緩沖器。
s^(i)=s(i+N)(i=n-M-1,...,n-N-1)s^(i)=s(i+N)+p(i-N)(i=n-N,...,n-1)]]>...方程(8)s(i)=(i)(i=n-M-1,…,n-1)上文是根據(jù)本實(shí)施例的擴(kuò)充層編碼部分104的內(nèi)部配置的說明。
下面參照?qǐng)D8中的方塊圖描述根據(jù)本發(fā)明的擴(kuò)充層解碼部分153的內(nèi)部配置。另外,在圖8中,將與圖6中相同的標(biāo)號(hào)指定給與圖6共同的結(jié)構(gòu)單元,以便省略對(duì)它們的描述。
與圖6相比,圖8中的擴(kuò)充層解碼部分153進(jìn)一步配有編碼信息多路分用部分801、長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分802和相加部分803。
編碼信息多路分用部分801將通過傳輸信道接收的多路復(fù)用編碼信息多路分用成擴(kuò)充層編碼信息和長(zhǎng)期預(yù)測(cè)殘差編碼信息,并將擴(kuò)充層編碼信息輸出到長(zhǎng)期預(yù)測(cè)系數(shù)解碼部分603,將長(zhǎng)期預(yù)測(cè)殘差編碼信息輸出到長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分802。
長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分802解碼長(zhǎng)期預(yù)測(cè)殘差編碼信息,獲取解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)pq(n)~pq(n+N-1),并將該信號(hào)輸出到相加部分803。
相加部分803相加從長(zhǎng)期預(yù)測(cè)信號(hào)生成部分604輸入的長(zhǎng)期預(yù)測(cè)信號(hào)s(n)~s(n+N-1)和從長(zhǎng)期預(yù)測(cè)殘差信號(hào)解碼部分802輸入的解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)pq(n)~pq(n+N-1),并將相加結(jié)果輸出到長(zhǎng)期預(yù)測(cè)信號(hào)存儲(chǔ)器602,同時(shí)將結(jié)果作為擴(kuò)充層解碼信號(hào)輸出。
上文是根據(jù)本實(shí)施例的擴(kuò)充層解碼部分153的內(nèi)部配置的說明。
通過如此編碼并解碼殘差信號(hào)與長(zhǎng)期預(yù)測(cè)信號(hào)之間的差值(長(zhǎng)期預(yù)測(cè)殘差信號(hào)),可以獲得質(zhì)量比前面在第一實(shí)施例中所述高的解碼信號(hào)。
另外,上面在本實(shí)施例中已經(jīng)描述了通過矢量量化編碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)的情況。但是,本發(fā)明不局限于這種編碼方法,可以利用,例如,形狀-增益VQ、分割VQ、變換VQ或多相VQ進(jìn)行編碼。
下面將描述通過在形狀方面8個(gè)位和在增益方面5個(gè)位的13位形狀-增益VQ進(jìn)行編碼的情況。在這種情況下,提供了兩種碼本,形狀碼本和增益碼本。形狀碼本包括256種形狀代碼矢量,和形狀代碼矢量SCODE(k1)(0)~SCODE(k1)(N-1)是長(zhǎng)度為N的矢量。k1是形狀代碼矢量的索引和取范圍從0到255的值。增益碼本包括32種增益代碼,和增益代碼GCODE(k2)取標(biāo)量值。k2是增益代碼的索引和取范圍從0到31的值。長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702利用如下方程(9)獲取長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)的增益和形狀矢量shape(0)~shape(N-1),和進(jìn)一步獲取增益與增益代碼GCODE(k2)之間的增益誤差gainer和形狀矢量shape(0)~shape(N-1)與形狀代碼矢量SCODE(k1)(0)~SCODE(k1)(N-1)之間的平方誤差shapeer。
gain=Σi=0N-1p(n+i)2]]>shape(i)=p(n+i)gain]]>(i=0,…,N-1)…方程(9)gainer=|gain-GCODE(k2)|shapeer=Σi=0N-1(shape(i)-GCODE(k2)(i))2]]>...方程(10)然后,長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702獲取使增益誤差gainer最小的k2值和使平方誤差shapper最小的k1值,并將獲得的值確定為長(zhǎng)期預(yù)測(cè)殘差編碼信息。
下面描述通過8位分割VQ進(jìn)行編碼的情況。在這種情況下,預(yù)備了兩種碼本,第一分割碼本和第二分割碼本。
第一分割碼本包括16種第一分割代碼矢量SPCODE(k3)(0)~SPCODE(k3)(N/2-1),第二分割碼本包括16種第二分割代碼矢量SPCODE(k4)(0)~SPCODE(k4)(N/2-1),和每個(gè)代碼矢量具有N/2的長(zhǎng)度。k3是第一分割代碼矢量的索引和取范圍從0到15的值。k4是第二分割代碼矢量的索引和取范圍從0到15的值。長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702利用如下方程(11)將長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)劃分成第一分割矢量sp1(0)~sp1(N/2-1)和第二分割矢量sp2(0)~sp2(N/2-1),并獲取第一分割矢量sp1(0)~sp1(N/2-1)與第一分割代碼矢量SPCODE(k3)(0)~SPCODE(k3)(N/2-1)之間的平方誤差splitter1和第二分割矢量sp2(0)~sp2(N/2-1)與第二分割代碼矢量SPCODE(k4)(0)~SPCODE(k4)(N/2-1)之間的平方誤差splitter2。
sp1(i)=p(n+i)(i=0,…,N/2-1)sp2(i)=p(n+N/2+i)(i=0,…,N/2-1) ...方程(11)spliter1=Σi=0N/2-1(sp1(i)-SPCODE1(k3)(i))2]]>spliter2=Σi=0N/2-1(sp2(i)-SPCODE2(k4)(i))2]]>...方程(12)然后,長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702獲取使平方誤差splitterl最小的k3值并使平方誤差splitter2最小的k4值,并將獲得的值確定為長(zhǎng)期預(yù)測(cè)殘差編碼信息。
下面描述通過利用離散付里葉變換的8位變換VQ進(jìn)行編碼的情況。在這種情況下,預(yù)備了包括256種變換代碼矢量的變換碼本,和變換代碼矢量TCODE(k5)(0)~TCODE(k5)(N/2-1)是長(zhǎng)度為N/2的矢量。k5是變換代碼矢量的索引和取范圍從0到255的值。長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702利用如下方程(13)對(duì)長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)進(jìn)行離散付里葉變換以獲取變換矢量tp(0)~tp(N-1),以及利用如下方程(14)獲取變換矢量tp(0)~tp(N-1)與變換代碼矢量TCODE(k5)(0)~TCODE(k5)(N/2-1)之間的平方誤差transer。
tp(i)^=Σi=0N-1p(n+i)e-j2rσiN(i^=0,...,N-1)]]>...方程(13)transfer=Σi=0N-1(tp(i)-TCODE(k5)(i))2]]>...方程(14)然后,長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702獲取使平方誤差transfer最小的k5值,并將獲得的值確定為長(zhǎng)期預(yù)測(cè)殘差編碼信息。
下面描述5個(gè)位用于第一階段和8個(gè)位用于第二階段的13位二相VQ進(jìn)行編碼的情況。在這種情況下,預(yù)備了第一階段碼本和第二階段碼本兩種碼本。第一階段碼本包括32種第一階段代碼矢量PHCODE1(k6)(0)~PHCODE1(k6)(N-1)。第二階段碼本包括256種第二階段代碼矢量PHCODE2(k7)(0)~PHCODE2(k7)(N-1),并且每個(gè)代碼矢量具有N/2的長(zhǎng)度。k6是第一階段代碼矢量的索引并且取范圍從0到31的值。k7是第二階段代碼矢量的索引并且取范圍從0到255的值。長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702利用如下方程(15)獲取長(zhǎng)期預(yù)測(cè)殘差信號(hào)p(n)~p(n+N-1)與第一階段代碼矢量PHCODE1(k6)(0)~PHCODE1(k6)(N-1)之間的平方誤差phaseer1,進(jìn)一步獲取使平方誤差phaseer1最小的k6值,并將該值確定為Kmax。
phaseer1=Σi=0N-1(p(i)-PHCODE1(k6)(i))2]]>...方程(15)然后,長(zhǎng)期預(yù)測(cè)殘差信號(hào)編碼部分702利用如下方程(16)獲取誤差矢量ep(0)~ep(N-1),獲取誤差矢量ep(0)~ep(N-1)與第二階段代碼矢量PHCODE2(k7)(0)~PHCODE2(k7)(N-1)之間的平方誤差phaseer2,進(jìn)一步獲取使平方誤差phaseer2最小的k7值,并將該值和Kmax確定為長(zhǎng)期預(yù)測(cè)殘差編碼信息。
ep(i)=p(n+i)-PHCODE1(kmax)(i)]]>(i=0,…,N-1)...方程(16)phaseer2=Σi=0N-1(ep(i)-PHCODE2(k7)(i))2]]>...方程(17)(第三實(shí)施例)圖9是例示分別含有在第一和第二實(shí)施例中描述的語(yǔ)音編碼設(shè)備和語(yǔ)音解碼設(shè)備的語(yǔ)音信號(hào)發(fā)送設(shè)備和語(yǔ)音信號(hào)接收設(shè)備的配置的方塊圖。
在圖9中,通過輸入設(shè)備902將語(yǔ)音信號(hào)901轉(zhuǎn)換成電子信號(hào)和輸出到A/D轉(zhuǎn)換設(shè)備903。A/D轉(zhuǎn)換設(shè)備903將從輸入設(shè)備902輸出的(模擬)信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并將結(jié)果輸出到語(yǔ)音編碼設(shè)備904。語(yǔ)音編碼設(shè)備904裝有如圖1所示的語(yǔ)音編碼設(shè)備100,編碼從A/D轉(zhuǎn)換設(shè)備903輸出的數(shù)字語(yǔ)音信號(hào),并將編碼信息輸出到RF調(diào)制設(shè)備905。RF調(diào)制設(shè)備905將從語(yǔ)音編碼設(shè)備904輸出的編碼信息轉(zhuǎn)換成諸如無線電信號(hào)之類傳播媒體的信號(hào)以便加以發(fā)送,并將信號(hào)輸出到發(fā)送天線906。發(fā)送天線906發(fā)送從RF調(diào)制設(shè)備905輸出的輸出信號(hào)作為無線電信號(hào)(RF信號(hào))。另外,圖9中的RF信號(hào)907代表從發(fā)送天線906發(fā)送的無線電信號(hào)(RF信號(hào))。語(yǔ)音信號(hào)發(fā)送設(shè)備的配置和操作就是像上述那樣。
RF信號(hào)908由接收天線909接收,然后,輸出到RF解調(diào)設(shè)備910。另外,圖9中的RF信號(hào)908代表如果在傳播路徑上沒有出現(xiàn)信號(hào)衰減和/或噪聲多路復(fù)用就與RF信號(hào)907相同、由接收天線909接收的無線電信號(hào)。
RF解調(diào)設(shè)備910從接收天線909輸出的RF信號(hào)中解調(diào)語(yǔ)音編碼信息,并將結(jié)果輸出到語(yǔ)音解碼設(shè)備911。語(yǔ)音解碼設(shè)備911裝有如圖1所示的語(yǔ)音解碼設(shè)備150,從RF解調(diào)設(shè)備910輸出的語(yǔ)音編碼信息中解碼語(yǔ)音信號(hào),并將結(jié)果輸出到D/A轉(zhuǎn)換設(shè)備912。D/A轉(zhuǎn)換設(shè)備912將語(yǔ)音解碼設(shè)備911輸出的數(shù)字語(yǔ)音信號(hào)轉(zhuǎn)換成模擬電子信號(hào),并將結(jié)果輸出到輸出設(shè)備913。
輸出設(shè)備913將電子信號(hào)轉(zhuǎn)換成空氣振動(dòng)并將結(jié)果輸出成人耳聽得見的聲音信號(hào)。另外,在該圖中,標(biāo)號(hào)914表示輸出聲音信號(hào)。語(yǔ)音信號(hào)接收設(shè)備的配置和操作就是像上述那樣。
通過在帶有上述語(yǔ)音信號(hào)發(fā)送設(shè)備和語(yǔ)音信號(hào)接收設(shè)備的無線通信系統(tǒng)中配備基站設(shè)備和通信終端設(shè)備,可以獲得高質(zhì)量的解碼信號(hào)。
如上所述,根據(jù)本發(fā)明,可以利用較少編碼信息編碼并解碼具有寬帶寬的語(yǔ)音和聲音信號(hào),并可以減少計(jì)算量。并且,通過利用基本層的長(zhǎng)期預(yù)測(cè)信息獲取長(zhǎng)期預(yù)測(cè)延遲,可以減少編碼信息。此外,通過解碼基本層編碼信息,可以只獲取基本層的解碼信號(hào),并且在CELP型語(yǔ)音編碼/解碼方法中,可以實(shí)現(xiàn)從部分編碼信息(可伸縮編碼)中解碼語(yǔ)音和聲音的功能。
本申請(qǐng)基于2003年4月30日提出的日本專利申請(qǐng)第2003-125665號(hào),特此全文引用,以供參考。
工業(yè)應(yīng)用性本發(fā)明適用于用在編碼和發(fā)送語(yǔ)音和/或聲音信號(hào)的通信系統(tǒng)中的語(yǔ)音編碼設(shè)備和語(yǔ)音解碼設(shè)備。
權(quán)利要求
1.一種語(yǔ)音編碼設(shè)備,包括基本層編碼器,用于編碼輸入信號(hào)并生成第一編碼信息;基本層解碼器,用于解碼第一編碼信息并生成第一解碼信號(hào),同時(shí)生成包括代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息的長(zhǎng)期預(yù)測(cè)信息;加法器,用于獲取代表輸入信號(hào)與第一解碼信息之間的差值的殘差信號(hào);和擴(kuò)充層編碼器,用于利用長(zhǎng)期預(yù)測(cè)信息和殘差信號(hào)計(jì)算長(zhǎng)期預(yù)測(cè)系數(shù),和編碼長(zhǎng)期預(yù)測(cè)系數(shù)并生成第二編碼信息。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音編碼設(shè)備,其中,基本層解碼器將指定從激勵(lì)矢量信號(hào)樣本中取出自適應(yīng)激勵(lì)矢量的取出位置的信息用作長(zhǎng)期預(yù)測(cè)信息。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音編碼設(shè)備,其中,擴(kuò)充層編碼器包括根據(jù)長(zhǎng)期預(yù)測(cè)信息獲取擴(kuò)充層的長(zhǎng)期預(yù)測(cè)延遲的部分;從存儲(chǔ)在緩沖器中的前長(zhǎng)期預(yù)測(cè)信號(hào)序列中取出倒退長(zhǎng)期預(yù)測(cè)延遲的長(zhǎng)期預(yù)測(cè)信號(hào)的部分;利用殘差信號(hào)和長(zhǎng)期預(yù)測(cè)信號(hào)計(jì)算長(zhǎng)期預(yù)測(cè)系數(shù)的部分;編碼長(zhǎng)期預(yù)測(cè)系數(shù)并生成擴(kuò)充層編碼信息的部分;解碼擴(kuò)充層編碼信息并生成解碼長(zhǎng)期預(yù)測(cè)系數(shù)的部分;和利用解碼長(zhǎng)期預(yù)測(cè)系數(shù)和長(zhǎng)期預(yù)測(cè)信號(hào)計(jì)算新長(zhǎng)期預(yù)測(cè)信號(hào),以及利用新長(zhǎng)期預(yù)測(cè)信號(hào)更新緩沖器的部分。
4.根據(jù)權(quán)利要求3所述的語(yǔ)音編碼設(shè)備,其中,擴(kuò)充層編碼器進(jìn)一步包括獲取代表殘差信號(hào)與長(zhǎng)期預(yù)測(cè)信號(hào)之間的差值的長(zhǎng)期預(yù)測(cè)殘差信號(hào)的部分;編碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)并生成長(zhǎng)期預(yù)測(cè)殘差編碼信息的部分;解碼長(zhǎng)期預(yù)測(cè)殘差編碼信息并計(jì)算解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)的部分;和相加新長(zhǎng)期預(yù)測(cè)信號(hào)并解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào),以及利用相加結(jié)果更新緩沖器的部分。
5.一種從根據(jù)權(quán)利要求1所述的語(yǔ)音編碼設(shè)備接收第一編碼信息和第二編碼信息并解碼語(yǔ)音的語(yǔ)音解碼設(shè)備,所述語(yǔ)音解碼設(shè)備包括基本層解碼器,用于解碼第一編碼信息以生成第一解碼信號(hào),同時(shí)生成包括代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息的長(zhǎng)期預(yù)測(cè)信息;擴(kuò)充層解碼器,用于利用長(zhǎng)期預(yù)測(cè)信息解碼第二編碼信息并生成第二解碼信號(hào);和加法器,用于相加第一解碼信號(hào)和第二解碼信號(hào),并輸出作為相加結(jié)果的語(yǔ)音或聲音信號(hào)。
6.根據(jù)權(quán)利要求5所述的語(yǔ)音解碼設(shè)備,其中,基本層解碼器將指定從激勵(lì)矢量信號(hào)樣本中取出自適應(yīng)激勵(lì)矢量的取出位置的信息用作長(zhǎng)期預(yù)測(cè)信息。
7.根據(jù)權(quán)利要求5所述的語(yǔ)音解碼設(shè)備,其中,擴(kuò)充層解碼器包括根據(jù)長(zhǎng)期預(yù)測(cè)信息獲取擴(kuò)充層的長(zhǎng)期預(yù)測(cè)延遲的部分;從存儲(chǔ)在緩沖器中的前長(zhǎng)期預(yù)測(cè)信號(hào)序列中取出倒退長(zhǎng)期預(yù)測(cè)延遲的長(zhǎng)期預(yù)測(cè)信號(hào)的部分;解碼擴(kuò)充層編碼信息并獲取解碼長(zhǎng)期預(yù)測(cè)系數(shù)的部分;和利用解碼長(zhǎng)期預(yù)測(cè)系數(shù)和長(zhǎng)期預(yù)測(cè)信號(hào)計(jì)算長(zhǎng)期預(yù)測(cè)信號(hào),以及利用長(zhǎng)期預(yù)測(cè)信號(hào)更新緩沖器的部分,其中,擴(kuò)充層解碼器將長(zhǎng)期預(yù)測(cè)信號(hào)用作擴(kuò)充層解碼信號(hào)。
8.根據(jù)權(quán)利要求7所述的語(yǔ)音解碼設(shè)備,其中,擴(kuò)充層解碼器進(jìn)一步包括解碼長(zhǎng)期預(yù)測(cè)殘差編碼信息并獲取解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)的部分;和相加長(zhǎng)期預(yù)測(cè)信號(hào)并解碼長(zhǎng)期預(yù)測(cè)殘差信號(hào)的部分,其中,擴(kuò)充層解碼器將相加結(jié)果用作擴(kuò)充層解碼信號(hào)。
9.一種配有語(yǔ)音編碼設(shè)備的語(yǔ)音信號(hào)發(fā)送設(shè)備,其中,該語(yǔ)音編碼設(shè)備包括基本層編碼器,用于編碼輸入信號(hào)并生成第一編碼信息;基本層解碼器,用于解碼第一編碼信息并生成第一解碼信號(hào),同時(shí)生成包括代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息的長(zhǎng)期預(yù)測(cè)信息;加法器,用于獲取代表輸入信號(hào)與第一解碼信息之間的差值的殘差信號(hào);和擴(kuò)充層編碼器,用于利用長(zhǎng)期預(yù)測(cè)信息和殘差信號(hào)計(jì)算長(zhǎng)期預(yù)測(cè)系數(shù),編碼長(zhǎng)期預(yù)測(cè)系數(shù),并生成第二編碼信息。
10.一種配有從根據(jù)權(quán)利要求1所述的語(yǔ)音編碼設(shè)備接收第一編碼信息和第二編碼信息并解碼語(yǔ)音的語(yǔ)音解碼設(shè)備的語(yǔ)音信號(hào)接收設(shè)備,所述語(yǔ)音信號(hào)接收設(shè)備包括基本層解碼器,用于解碼第一編碼信息以生成第一解碼信號(hào),同時(shí)生成包括代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息的長(zhǎng)期預(yù)測(cè)信息;擴(kuò)充層解碼器,用于利用長(zhǎng)期預(yù)測(cè)信息解碼第二編碼信息并生成第二解碼信號(hào);和加法器,用于相加第一解碼信號(hào)和第二解碼信號(hào),并輸出作為相加結(jié)果的語(yǔ)音或聲音信號(hào)。
11.一種語(yǔ)音編碼方法,包括編碼輸入信號(hào)并生成第一編碼信息;解碼第一編碼信息并生成第一解碼信號(hào),同時(shí)生成包括代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息的長(zhǎng)期預(yù)測(cè)信息;獲取代表輸入信號(hào)與第一解碼信息之間的差值的殘差信號(hào);和利用長(zhǎng)期預(yù)測(cè)信息和殘差信號(hào)計(jì)算長(zhǎng)期預(yù)測(cè)系數(shù),編碼長(zhǎng)期預(yù)則系數(shù),并生成第二編碼信息。
12.一種利用在根據(jù)權(quán)利要求11所述的語(yǔ)音編碼方法中生成的第一編碼信息和第二編碼信息解碼語(yǔ)音的語(yǔ)音解碼方法,所述語(yǔ)音解碼方法包括解碼第一編碼信息以生成第一解碼信號(hào),同時(shí)生成包括代表語(yǔ)音或聲音的長(zhǎng)期相關(guān)性的信息的長(zhǎng)期預(yù)測(cè)信息;利用長(zhǎng)期預(yù)測(cè)信息解碼第二編碼信息并生成第二解碼信號(hào);和相加第一解碼信號(hào)和第二解碼信號(hào),并輸出作為相加結(jié)果的語(yǔ)音或聲音信號(hào)。
全文摘要
基本層編碼部分(101)編碼輸入信號(hào)并獲取基本層編碼信息。基本層解碼部分(102)解碼基本層編碼信息并獲取基本層解碼信號(hào)和長(zhǎng)期預(yù)測(cè)信息(基音延遲)。加法器(103)顛倒基本層解碼信號(hào)的極性并將它與輸入信號(hào)相加以便獲取殘差信號(hào)。擴(kuò)充層編碼部分(104)編碼利用長(zhǎng)期預(yù)測(cè)信息和殘差信號(hào)計(jì)算出的長(zhǎng)期預(yù)測(cè)系數(shù)并獲取擴(kuò)充層編碼信息?;緦咏獯a部分(152)解碼基本層編碼信息并獲取基本層解碼信息和長(zhǎng)期預(yù)測(cè)信息。擴(kuò)充層解碼部分(153)利用長(zhǎng)期預(yù)測(cè)信息解碼擴(kuò)充層編碼信息并獲取擴(kuò)充層解碼信號(hào)。加法器(154)將基本層解碼信號(hào)和擴(kuò)充層解碼信號(hào)相加,以便獲取音頻/音樂復(fù)合信號(hào)。因此,可以以少量計(jì)算和少量編碼信息實(shí)現(xiàn)可伸縮編碼。
文檔編號(hào)G10L19/24GK1795495SQ200480014149
公開日2006年6月28日 申請(qǐng)日期2004年4月30日 優(yōu)先權(quán)日2003年4月30日
發(fā)明者佐藤薰, 森井利幸 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社