專利名稱:用于使用層級(jí)正弦脈沖編碼對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的示范實(shí)施例涉及一種用于對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備;且更具體地,涉及一種用于通過分層正弦脈沖編碼方案來對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備。
背景技術(shù):
由于數(shù)據(jù)傳送帶寬隨著通信技術(shù)的發(fā)展而增加,所以用戶對(duì)于使用多聲道語音和音頻的高質(zhì)量通信服務(wù)的需求增加。需要一種能夠?qū)αⅢw聲語音和音頻信號(hào)進(jìn)行有效地壓縮和解壓的編碼方案,以提供高質(zhì)量的語音/音頻通信服務(wù)。相應(yīng)地,正在對(duì)于用于對(duì)窄帶(NB,300 3,400Hz)信號(hào)、寬帶(WB,50 7,OOOHz) 信號(hào)和超寬帶(SWB,50 14,000Hz)信號(hào)進(jìn)行編碼的編解碼器進(jìn)行深入的研究。ITU-T G. 729. 1編解碼器是基于G. 729窄帶編解碼器的寬帶擴(kuò)展編解碼器的典型示例。ITU-T G. 729. 1寬帶擴(kuò)展編解碼器提供8千比特每秒(Icbit/s)的與G. 7 窄帶編解碼器的比特流級(jí)別的兼容性,并且提供121cbit/S的提高質(zhì)量的窄帶信號(hào)。同樣,ITU-T G.7^. 1寬帶擴(kuò)展編解碼器可以對(duì)從141Ait/S到321cbit/S具有21cbit/S的比特率擴(kuò)展性的寬帶信號(hào)進(jìn)行編碼,并且可以利用比特率上的增加來提高輸出信號(hào)的質(zhì)量。近來,正在開發(fā)能夠提供基于G. 729. 1的超寬帶信號(hào)的擴(kuò)展編解碼器。此擴(kuò)展編解碼器可以對(duì)窄帶、寬帶和超寬帶信號(hào)進(jìn)行編碼和解碼。擴(kuò)展編解碼器可以使用正弦脈沖編碼來提高合成信號(hào)的質(zhì)量??梢酝ㄟ^多個(gè)層來執(zhí)行正弦脈沖編碼。如果針對(duì)較低層進(jìn)行的正弦脈沖編碼所分配的脈沖或比特的數(shù)目在逐幀的基礎(chǔ)上變化,則必須提供一種用于在較高層進(jìn)行的正弦脈沖編碼中提高合成信號(hào)的質(zhì)
量的方案。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的實(shí)施例針對(duì)一種用于對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備,當(dāng)通過分層正弦脈沖編碼方案來對(duì)較高層中的音頻信號(hào)進(jìn)行編碼或解碼時(shí),該方法和設(shè)備可以通過考慮較低層的正弦脈沖編碼來進(jìn)一步改善合成信號(hào)的質(zhì)量??梢酝ㄟ^以下描述來理解本發(fā)明的其他目的和優(yōu)點(diǎn),并且通過參考本發(fā)明的實(shí)施例,它們變得明顯。同樣,對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員顯然的是,可以通過如所要求保護(hù)的手段及其組合來實(shí)現(xiàn)本發(fā)明的目的和優(yōu)點(diǎn)。技術(shù)解決方案根據(jù)本發(fā)明的實(shí)施例,一種用于對(duì)音頻信號(hào)進(jìn)行編碼的方法包括接收變換后的音頻信號(hào);將變換后的音頻信號(hào)劃分為多個(gè)子頻帶;對(duì)所述子頻帶執(zhí)行第一正弦脈沖編碼操作;基于該第一正弦脈沖編碼操作的編碼信息,在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域;以及對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖編碼操作,其中,根據(jù)該編碼信息來變化地執(zhí)行該第一正弦脈沖編碼操作。根據(jù)本發(fā)明的另一實(shí)施例,一種用于對(duì)音頻信號(hào)進(jìn)行編碼的設(shè)備包括輸入單元, 被配置為接收變換后的音頻信號(hào);操作單元,被配置為將變換后的音頻信號(hào)劃分為多個(gè)子頻帶;第一正弦脈沖編碼單元,被配置為對(duì)所述子頻帶執(zhí)行第一正弦脈沖編碼操作;以及第二正弦脈沖編碼單元,被配置為基于該第一正弦脈沖編碼操作的編碼信息,在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域,并且對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖編碼操作,其中,該第一正弦脈沖編碼單元根據(jù)該編碼信息來變化地執(zhí)行該第一正弦脈沖編碼操作。根據(jù)本發(fā)明的另一實(shí)施例,一種用于對(duì)音頻信號(hào)進(jìn)行解碼的方法包括接收變換后的音頻信號(hào);將變換后的音頻信號(hào)劃分為多個(gè)子頻帶;對(duì)所述子頻帶執(zhí)行第一正弦脈沖解碼操作;基于該第一正弦脈沖解碼操作的解碼信息,在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域;以及對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖解碼操作,其中,根據(jù)該解碼信息來變化地執(zhí)行該第一正弦脈沖解碼操作。根據(jù)本發(fā)明的另一實(shí)施例,一種用于對(duì)音頻信號(hào)進(jìn)行解碼的設(shè)備包括輸入單元, 被配置為接收變換后的音頻信號(hào);操作單元,被配置為將變換后的音頻信號(hào)劃分為多個(gè)子頻帶;第一正弦脈沖解碼單元,被配置為對(duì)所述子頻帶執(zhí)行第一正弦脈沖解碼操作;以及第二正弦脈沖解碼單元,被配置為基于該第一正弦脈沖解碼操作的解碼信息,在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域,并且對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖解碼操作,其中,該第一正弦脈沖解碼單元根據(jù)該解碼信息來變化地執(zhí)行該第一正弦脈沖解碼操作。有益效果如上所述,當(dāng)通過分層正弦脈沖編碼方案來對(duì)較高層中的音頻信號(hào)進(jìn)行編碼或解碼時(shí),本發(fā)明可以通過考慮較低層的正弦脈沖編碼來進(jìn)一步改善合成信號(hào)的質(zhì)量。
圖1是提供了與窄帶(NB)編解碼器的兼容性的超寬帶(SWB)擴(kuò)展編解碼器的框圖。圖2是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)編碼設(shè)備的框圖。圖3是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)解碼設(shè)備的框圖。圖4圖示了通過兩個(gè)層來將正弦脈沖編碼應(yīng)用于與7_14kHz對(duì)應(yīng)的211個(gè)MDCT 系數(shù)的結(jié)果。圖5圖示了根據(jù)本發(fā)明實(shí)施例的分層正弦脈沖編碼的結(jié)果。圖6圖示了根據(jù)本發(fā)明另一實(shí)施例的分層正弦脈沖編碼的結(jié)果。圖7圖示了根據(jù)本發(fā)明另一實(shí)施例的分層正弦脈沖編碼的結(jié)果。圖8是圖示了通過傳統(tǒng)的正弦脈沖編碼方法所合成的MDCT系數(shù)和通過本發(fā)明的正弦脈沖編碼方法所合成的MDCT系數(shù)的曲線圖。圖9是圖示了根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)編碼方法的流程圖。圖10是圖示了根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)解碼方法的流程圖。
5
圖11是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)編碼設(shè)備的框圖。圖12是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)解碼設(shè)備的框圖。
具體實(shí)施例方式下面,將參考附圖來更加詳細(xì)地描述本發(fā)明的示范實(shí)施例。然而,本發(fā)明可以按照不同的形式來實(shí)施,并且不應(yīng)被詮釋為限于在這里提出的實(shí)施例。相反地,提供這些實(shí)施例,使得本公開將是徹底和完全的,并將向本領(lǐng)域技術(shù)人員充分地傳達(dá)本發(fā)明的范圍。貫穿整個(gè)公開,貫穿本發(fā)明的各個(gè)圖形和實(shí)施例,同樣的附圖標(biāo)記指代同樣的部分。圖1是提供了與窄帶(NB)編解碼器的兼容性的超寬帶(SWB)擴(kuò)展編解碼器的框圖。一般地,擴(kuò)展編解碼器被配置為將輸入信號(hào)劃分為多個(gè)頻帶,并且對(duì)每個(gè)頻帶的信號(hào)進(jìn)行編碼/解碼。參考圖1,通過初級(jí)低通濾波器(LPF) 102和初級(jí)高通濾波器 (HPF) 104來對(duì)輸入信號(hào)進(jìn)行濾波。初級(jí)LPF 102執(zhí)行濾波和下采樣,以輸出輸入信號(hào)的低頻信號(hào)A(O-SkHz)。初級(jí)HPF 104執(zhí)行濾波和下采樣,以輸出輸入信號(hào)的高頻信號(hào) B(8-16kHz)。將從初級(jí)LPF 102輸出的低頻信號(hào)A輸入到次級(jí)LPF 106和次級(jí)HPF108。次級(jí) LPF 106執(zhí)行濾波和下采樣,以輸出低低頻信號(hào)Al (0-4kHz),而次級(jí)HPF 108執(zhí)行濾波和下采樣,以輸出低高頻信號(hào)A2 (4-8kHz)。將低低頻信號(hào)Al輸入到窄帶編碼模塊110。將低高頻信號(hào)A2輸入到寬帶擴(kuò)展編碼模塊112。將高頻信號(hào)B輸入到超寬帶編碼模塊114。如果操作窄帶編碼模塊110,則僅僅再現(xiàn)窄帶信號(hào)。如果操作窄帶編碼模塊110和寬帶擴(kuò)展編碼模塊112,則再現(xiàn)寬帶信號(hào)。 如果操作窄帶編碼模塊110、寬帶擴(kuò)展編碼模塊112和超寬帶擴(kuò)展編碼模塊114,則再現(xiàn)超寬帶信號(hào)。ITU-T G. 729. 1編解碼器是圖1所圖示的擴(kuò)展編解碼器的典型示例。 ITU-TG. 729. 1編解碼器是基于G. 729窄帶編解碼器的寬帶擴(kuò)展編解碼器。G. 729. 1編解碼器提供81Ait/S的與G. 729的比特流級(jí)別的兼容性,并且提供121Ait/S的具有更高質(zhì)量的窄帶信號(hào)。同樣,G. 729. 1編解碼器再現(xiàn)從14kbit/s到32kbit/s具有2kbit/s比特率擴(kuò)展性的寬帶信號(hào),并且輸出信號(hào)的質(zhì)量隨著比特率上的增加而改善。近來,正在開發(fā)能夠提供基于G. 729. 1的超寬帶質(zhì)量的擴(kuò)展編解碼器。此擴(kuò)展編解碼器可以對(duì)窄帶、寬帶和超寬帶信號(hào)進(jìn)行編碼和解碼。在這種擴(kuò)展編解碼器中,可以根據(jù)頻帶來應(yīng)用不同的編碼方案,如圖1所圖示的。 例如,G. 729. 1和G. 711. 1編解碼器通過傳統(tǒng)的窄帶編解碼器G 729和G 711來編碼窄帶信號(hào),對(duì)于剩余的信號(hào)執(zhí)行改進(jìn)離散余弦變換(MDCT)操作,并且編碼所輸出的MDCT系數(shù)。MDCT域編碼方案將MDCT系數(shù)劃分為多個(gè)子頻帶,對(duì)每個(gè)子頻帶的形狀和增益進(jìn)行編碼,并且通過ACELP (代數(shù)碼激勵(lì)線性預(yù)測(cè))或正弦脈沖來對(duì)MDCT系數(shù)進(jìn)行編碼。一般地,擴(kuò)展編解碼器對(duì)用于帶寬擴(kuò)展的信息進(jìn)行編碼,并然后,對(duì)用于質(zhì)量改善的信息進(jìn)行編碼。例如,擴(kuò)展編解碼器通過使用每個(gè)子頻帶的形狀和增益來合成7-14kHz頻帶的信號(hào), 并然后通過使用ACELP或正弦脈沖編碼方案來改善合成信號(hào)的質(zhì)量。也就是說,用于提供超寬帶質(zhì)量的第一層通過使用諸如每個(gè)子頻帶的形狀和增益之類的信息來合成與7-14kHz頻帶的信號(hào)。使用附加的比特,以應(yīng)用用于提高合成信號(hào)的質(zhì)量的正弦脈沖編碼操作。此結(jié)構(gòu)使得可能根據(jù)比特率上的增加來改善合成信號(hào)的質(zhì)量。一般地,正弦脈沖編碼方案按照預(yù)定的步長(zhǎng)來編碼最大脈沖的代碼信息、尺寸和位置(即,可以對(duì)于質(zhì)量施加最大影響的脈沖)。隨著脈沖搜索步長(zhǎng)的寬度增加,計(jì)算量增力口。相應(yīng)地,在逐子幀的基礎(chǔ)上或在逐子頻帶的基礎(chǔ)上執(zhí)行正弦脈沖編碼操作比在整個(gè)幀上(在時(shí)域的情況下)或在整個(gè)頻帶上執(zhí)行正弦脈沖編碼操作更為可取。正弦脈沖編碼方案需要更多的比特來傳送一個(gè)脈沖,但是可以更加準(zhǔn)確地表現(xiàn)影響信號(hào)質(zhì)量的信號(hào)。編解碼器的輸入信號(hào)具有取決于頻率的各種能量分布。具體地,音樂信號(hào)比語音信號(hào)具有更大的取決于頻率的能量改變。更大能量的子頻帶信號(hào)對(duì)于合成信號(hào)的質(zhì)量施加更大的影響??梢允褂梅謱拥恼颐}沖編碼方案來在逐子頻帶的基礎(chǔ)上執(zhí)行正弦脈沖編碼操作。分層的正弦脈沖編碼方案通過多個(gè)層來執(zhí)行正弦脈沖編碼操作。例如,第一層在整個(gè)子頻帶的第一區(qū)域上執(zhí)行正弦脈沖編碼操作,而第二層在整個(gè)子頻帶的第二區(qū)域上執(zhí)行正弦脈沖編碼操作。當(dāng)執(zhí)行分層的正弦脈沖編碼操作時(shí),可能通過考慮如上所述的信號(hào)的能量或頻帶來改善音頻信號(hào)的質(zhì)量。本發(fā)明提供了音頻信號(hào)的編碼/解碼方案,當(dāng)在圖1的擴(kuò)展編解碼器中執(zhí)行分層的正弦脈沖編碼操作時(shí),所述方案可以通過在先前層的編碼信息的基礎(chǔ)上執(zhí)行接下來的層上的正弦脈沖編碼操作來進(jìn)一步改善合成信號(hào)的質(zhì)量。在本發(fā)明的以下描述中,將把語音和音頻信號(hào)稱作音頻信號(hào)。圖2是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)編碼設(shè)備的框圖。參考圖2,音頻信號(hào)編碼設(shè)備202包括輸入單元204、操作單元206、第一正弦脈沖編碼單元208、和第二正弦脈沖編碼單元210。輸入單元204接收變換后的音頻信號(hào),例如通過MDCT而從音頻信號(hào)中變換的MDCT 系數(shù)。操作單元206將通過輸入單元204所接收到的變換后的音頻信號(hào)劃分為多個(gè)子頻
市ο第一正弦脈沖編碼單元208對(duì)操作單元206所劃分的子頻帶執(zhí)行第一正弦脈沖編碼操作。第一正弦脈沖編碼單元208根據(jù)編碼信息來變化地執(zhí)行第一正弦脈沖編碼操作。 在這里,該編碼信息可以是關(guān)于為第一正弦脈沖編碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為第一正弦脈沖編碼操作所分配的脈沖數(shù)目的信息。此外,變化地執(zhí)行第一正弦脈沖編碼操作可以意指在變更比特?cái)?shù)目或脈沖數(shù)目的同時(shí)、執(zhí)行第一正弦脈沖編碼操作,或者可以意指按照每個(gè)子頻帶的能量的順序、而不是按照頻帶的順序來執(zhí)行第一正弦脈沖編碼操作。第二正弦脈沖編碼單元210在第一正弦脈沖編碼操作的編碼信息的基礎(chǔ)上,在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域。在示范實(shí)施例中,如果編碼信息小于預(yù)定的值,則第二正弦脈沖編碼單元210將子頻帶的較低頻帶確定為第二正弦脈沖編碼操作的執(zhí)行區(qū)域,并且如果編碼信息大于或等于預(yù)定的值,則將子頻帶的較高頻帶確定為第二正弦脈沖編碼操作的執(zhí)行區(qū)域。在另一示例實(shí)施例中,第二正弦脈沖編碼單元210從沒有應(yīng)用第一正弦脈沖編碼操作的最低頻帶,開始應(yīng)用第二正弦脈沖編碼操作。第二正弦脈沖編碼單元210對(duì)所確定的執(zhí)行區(qū)域執(zhí)行第二正弦脈沖編碼操作。圖3是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)解碼設(shè)備的框圖。參考圖3,音頻信號(hào)解碼設(shè)備302包括輸入單元304、操作單元306、第一正弦脈沖解碼單元308、和第二正弦脈沖解碼單元310。輸入單元304接收變換后的音頻信號(hào),例如通過MDCT而從音頻信號(hào)變換的MDCT 系數(shù)。操作單元306將通過輸入單元304所接收到的變換后的音頻信號(hào)劃分為多個(gè)子頻
市ο第一正弦脈沖解碼單元308對(duì)操作單元306所劃分的子頻帶執(zhí)行第一正弦脈沖解碼操作。第一正弦脈沖解碼單元308根據(jù)解碼信息來變化地執(zhí)行第一正弦脈沖解碼操作。 在這里,該解碼信息可以是關(guān)于為第一正弦脈沖解碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為第一正弦脈沖解碼操作所分配的脈沖數(shù)目的信息。同樣,變化地執(zhí)行第一正弦脈沖解碼操作可以意指在變更比特?cái)?shù)目或脈沖數(shù)目的同時(shí)、執(zhí)行第一正弦脈沖解碼操作,或者可以意指按照每個(gè)子頻帶的能量的順序、而不是按照頻帶的順序來執(zhí)行第一正弦脈沖解碼操作。第二正弦脈沖解碼單元310在第一正弦脈沖解碼操作的解碼信息的基礎(chǔ)上,在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域。在示范實(shí)施例中,如果解碼信息小于預(yù)定的值,則第二正弦脈沖解碼單元310將子頻帶的較低頻帶確定為第二正弦脈沖解碼操作的執(zhí)行區(qū)域,并且如果解碼信息大于或等于預(yù)定的值,則將子頻帶的較高頻帶確定為第二正弦脈沖解碼操作的執(zhí)行區(qū)域。在另一示例實(shí)施例中,第二正弦脈沖解碼單元310從沒有應(yīng)用第一正弦脈沖解碼操作的最低頻帶開始應(yīng)用第二正弦脈沖解碼操作。第二正弦脈沖解碼單元310對(duì)所確定的執(zhí)行區(qū)域執(zhí)行第二正弦脈沖解碼操作。可以將圖2和圖3所圖示的音頻信號(hào)編碼設(shè)備202和音頻信號(hào)解碼設(shè)備302包括在圖ι所圖示的窄帶編碼模塊110、寬帶擴(kuò)展編碼模塊112或超寬帶擴(kuò)展編碼模塊114中。在下文中,將參考圖1到圖8來描述根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)編碼/解碼方法。超寬帶擴(kuò)展編碼模塊114將與7_14kHz對(duì)應(yīng)的MDCT系數(shù)劃分為多個(gè)子頻帶,并且編碼/解碼每個(gè)子頻帶的形狀和增益,以獲得誤差信號(hào)。超寬帶擴(kuò)展編碼模塊114對(duì)誤差信號(hào)執(zhí)行正弦脈沖編碼/解碼操作。在這里,假設(shè)正弦脈沖編碼具有能夠通過41Ait/S或 8kbit/s的單位來控制比特率的分層結(jié)構(gòu)。超寬帶擴(kuò)展編碼模塊114將高頻(7_14kHz)信號(hào)變換到MDCT域中,并且通過分層的正弦脈沖編碼方案來編碼MDCT系數(shù)。即,超寬帶擴(kuò)展編碼模塊114將MDCT系數(shù)劃分為多個(gè)子頻帶,并且針對(duì)每個(gè)子頻帶來編碼兩個(gè)脈沖。在這里,假設(shè)第一層可以根據(jù)幀來編碼上至10個(gè)脈沖,而第二層可以按照固定的方式來編碼10個(gè)脈沖。即,第一層中的脈沖的數(shù)目從0變化到10。如果一個(gè)子頻帶的范圍是0. 8kHz ( = 32個(gè)樣本),并且如果確定了子頻帶的開始點(diǎn),則來自其的32個(gè)樣本成為一個(gè)子頻帶。圖4圖示了通過兩個(gè)層來將正弦脈沖編碼應(yīng)用于與7_14kHz對(duì)應(yīng)的211個(gè)MDCT 系數(shù)的結(jié)果。在圖4中,N表示用于在第一層中執(zhí)行正弦脈沖編碼的脈沖的數(shù)目。參考圖4,第一層可以不執(zhí)行正弦脈沖編碼(N = 0),或者可以通過使用上至10個(gè)脈沖(N = 10)來執(zhí)行正弦脈沖編碼。因?yàn)闉槊總€(gè)子頻帶分配兩個(gè)脈沖,所以用于正弦脈沖編碼的子頻帶的數(shù)目根據(jù)用于執(zhí)行正弦脈沖編碼的脈沖的數(shù)目(即,N)來變化。如果N =2,則將正弦脈沖編碼應(yīng)用于僅僅一個(gè)子頻帶。如果N= 10,則將正弦脈沖編碼應(yīng)用于五個(gè)子頻帶,如圖4所圖示的。在圖4中,第二層總是將正弦脈沖編碼應(yīng)用于相同范圍的子頻帶,而與第一層無關(guān)。即,第二層總是從9. 4kHz ( = 96個(gè)樣本)開始正弦脈沖編碼,而與第一層中的正弦脈沖編碼無關(guān)。當(dāng)如圖4所圖示地執(zhí)行正弦脈沖編碼時(shí),如果在第一層中N = 6,則在執(zhí)行第二層的正弦脈沖編碼之后,將正弦脈沖編碼應(yīng)用于7-13. 4kHz的整個(gè)頻帶。然而,如果在第一層中N = 2,則在執(zhí)行了第二層的正弦脈沖編碼之后,不能將正弦脈沖編碼應(yīng)用于7. 8-9. 4kHz 頻帶,因而使得合成信號(hào)的質(zhì)量劣化。有關(guān)音頻信號(hào)(特別地,語音信號(hào))的能量分布,有聲聲音的能量位于較低頻帶中,并且無聲聲音或爆破聲音的能量位于較高頻帶中。盡管它可以根據(jù)信號(hào)特性而不同,但是大部分音頻信號(hào)在IOkHz或更小處具有大的能量。即,如圖4所圖示的,如果與第一層的正弦脈沖編碼無關(guān)地執(zhí)行第二層的正弦脈沖編碼,則不將正弦脈沖編碼應(yīng)用于一些頻帶 (特別地,不影響語音質(zhì)量的頻帶),因而使得合成信號(hào)的質(zhì)量劣化。為了解決以上問題,本發(fā)明提供了一種音頻信號(hào)編碼/解碼方法,用于通過在第一層上的正弦脈沖編碼操作的編碼信息的基礎(chǔ)上、執(zhí)行第二層上的正弦脈沖編碼操作來改善合成信號(hào)的質(zhì)量。圖5圖示了根據(jù)本發(fā)明實(shí)施例的分層正弦脈沖編碼的結(jié)果。參考圖5,圖2的操作單元204接收MDCT系數(shù)。操作單元206將所接收到的MDCT 系數(shù)劃分為多個(gè)子頻帶,如圖5所圖示的。在這里,每個(gè)子頻帶具有32個(gè)采樣。第一正弦脈沖編碼單元208對(duì)第一層執(zhí)行第一正弦脈沖編碼操作。在這里,第一正弦脈沖編碼單元208根據(jù)編碼信息來變化地執(zhí)行第一正弦脈沖編碼操作。該編碼信息可以是關(guān)于為第一正弦脈沖編碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為第一正弦脈沖編碼操作所分配的脈沖數(shù)目的信息。如果為第一正弦脈沖編碼操作分配四個(gè)正弦脈沖(或?qū)?yīng)的比特),則第一正弦脈沖編碼單元208使用這種信息來對(duì)兩個(gè)子頻帶(N = 4)執(zhí)行第一正弦脈沖編碼操作。第二正弦脈沖編碼單元210使用以上編碼信息來在子頻帶之中確定正弦脈沖編碼操作的執(zhí)行區(qū)域。第二正弦脈沖編碼單元210可以從第一正弦脈沖編碼單元208接收編碼信息,該編碼信息包括關(guān)于為第一正弦脈沖編碼操作所分配的比特?cái)?shù)目的信息、關(guān)于所分配的脈沖數(shù)目的信息、和關(guān)于每個(gè)脈沖的代碼、尺寸和位置的信息。參考圖5,如果N小于 8,則第二正弦脈沖編碼單元210對(duì)較低頻帶(7-llkHz)執(zhí)行第二正弦脈沖編碼操作。如果 N大于或等于8,則第二正弦脈沖編碼單元210對(duì)較高頻帶(9. 75-13. 75kHz)執(zhí)行第二正弦脈沖編碼操作。執(zhí)行這種分層的正弦脈沖編碼操作可以解決傳統(tǒng)編碼方法的問題。例如,如果在第一層中N = 6,則第二層在較低層上執(zhí)行正弦脈沖編碼操作,如圖5所圖示的,因而使得可能改善在IOkHz或更小處具有大部分能量的音頻信號(hào)的質(zhì)量。
圖6圖示了根據(jù)本發(fā)明另一實(shí)施例的分層正弦脈沖編碼的結(jié)果。此實(shí)施例的第二正弦脈沖編碼單元210像參考圖5所描述的第二正弦脈沖編碼單元210 —樣地執(zhí)行第二正弦脈沖編碼操作。然而,此實(shí)施例的第一正弦脈沖編碼單元208 按照子頻帶的能量的順序、而不是按照頻帶的順序來變化地執(zhí)行正弦脈沖編碼操作。圖7圖示了根據(jù)本發(fā)明另一實(shí)施例的分層正弦脈沖編碼的結(jié)果。此實(shí)施例的第一正弦脈沖編碼單元208像圖4的實(shí)施例一樣地執(zhí)行第一正弦脈沖編碼操作。第二正弦脈沖編碼單元210在編碼信息的基礎(chǔ)上執(zhí)行第二正弦脈沖編碼操作, 所述編碼信息包括關(guān)于在第一層中沒有對(duì)于其執(zhí)行第一正弦脈沖編碼操作的最低頻帶的信息。例如,如果N = 4,如圖7所圖示的,則第二正弦脈沖編碼單元210從與第64個(gè)樣本對(duì)應(yīng)的子頻帶開始正弦脈沖編碼??梢詫⒈景l(fā)明的上述實(shí)施例相似地應(yīng)用于解碼,以及應(yīng)用于編碼。圖8是圖示了通過傳統(tǒng)的正弦脈沖編碼方法所合成的MDCT系數(shù)和通過本發(fā)明的正弦脈沖編碼方法所合成的MDCT系數(shù)的曲線圖。在圖8中,藍(lán)線表現(xiàn)了原始的MDCT系數(shù),而紅線表現(xiàn)了通過傳統(tǒng)方法所編碼/解碼的MDCT系數(shù)。黃線表現(xiàn)了通過本發(fā)明的方法所編碼/解碼的MDCT系數(shù)。在這里,在第一層中N = 0,并且在第二層中編碼10個(gè)脈沖。因而,在本發(fā)明的編碼/解碼方法中,第二層從7kHz開始正弦脈沖編碼或解碼。如圖8所圖示的,當(dāng)與傳統(tǒng)的方法比較時(shí),本發(fā)明的編碼/解碼方法可以更好地表現(xiàn)可能對(duì)于音頻信號(hào)的質(zhì)量施加極大影響的、在較低頻帶中具有更高能量的信號(hào)。圖9是圖示了根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)編碼方法的流程圖。參考圖9,在步驟S902中,音頻信號(hào)編碼方法接收變換后的音頻信號(hào),例如MDCT系數(shù)。在步驟S904中,音頻信號(hào)編碼方法將變換后的音頻信號(hào)劃分為多個(gè)子頻帶。在步驟S906中,音頻信號(hào)編碼方法對(duì)子頻帶執(zhí)行第一正弦脈沖編碼操作。音頻信號(hào)編碼方法根據(jù)編碼信息來變化地執(zhí)行第一正弦脈沖編碼操作。在這里,該編碼信息可以是關(guān)于為第一正弦脈沖編碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為第一正弦脈沖編碼操作所分配的脈沖數(shù)目的信息。同樣,變化地執(zhí)行第一正弦脈沖編碼操作可以意指在變更比特?cái)?shù)目或脈沖數(shù)目的同時(shí)、執(zhí)行第一正弦脈沖編碼操作,或者可以意指按照每個(gè)子頻帶的能量的順序、而不是按照頻帶的順序來執(zhí)行第一正弦脈沖編碼操作。在步驟S908中,音頻信號(hào)編碼方法在第一正弦脈沖編碼操作的編碼信息的基礎(chǔ)上,在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域。在示范實(shí)施例中,如果編碼信息小于預(yù)定的值,則音頻信號(hào)編碼方法將子頻帶的較低頻帶確定為第二正弦脈沖編碼操作的執(zhí)行區(qū)域,并且如果編碼信息大于或等于預(yù)定的值,則將子頻帶的較高頻帶確定為第二正弦脈沖編碼操作的執(zhí)行區(qū)域。在另一示例實(shí)施例中,音頻信號(hào)編碼方法從沒有應(yīng)用第一正弦脈沖編碼操作的最低頻帶,開始應(yīng)用第二正弦脈沖編碼操作。在步驟S910中,音頻信號(hào)編碼方法對(duì)所確定的執(zhí)行區(qū)域執(zhí)行第二正弦脈沖編碼操作。圖10是圖示了根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)解碼方法的流程圖。參考圖10,在步驟S1002中,音頻信號(hào)解碼方法接收變換后的音頻信號(hào),例如MDCT 系數(shù)。在步驟S1004中,音頻信號(hào)解碼方法將變換后的音頻信號(hào)劃分為多個(gè)子頻帶。在步驟S1006中,音頻信號(hào)解碼方法對(duì)子頻帶執(zhí)行第一正弦脈沖解碼操作。音頻信號(hào)解碼方法根據(jù)解碼信息來變化地執(zhí)行第一正弦脈沖解碼操作。在這里,該解碼信息可以是關(guān)于為第一正弦脈沖解碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為第一正弦脈沖解碼操作所分配的脈沖數(shù)目的信息。此外,變化地執(zhí)行第一正弦脈沖解碼操作可以意指在變更比特的數(shù)目或脈沖的數(shù)目的同時(shí)、執(zhí)行第一正弦脈沖解碼操作,或者可以意指按照每個(gè)子頻帶的能量的順序、而不是按照頻帶的順序來執(zhí)行第一正弦脈沖解碼操作。在步驟S1008中,音頻信號(hào)解碼方法在第一正弦脈沖解碼操作的解碼信息的基礎(chǔ)上,在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域。在示范實(shí)施例中,如果解碼信息小于預(yù)定的值,則音頻信號(hào)解碼方法將子頻帶的較低頻帶確定為第二正弦脈沖解碼操作的執(zhí)行區(qū)域,并且如果解碼信息大于或等于預(yù)定的值,則將子頻帶的較高頻帶確定為第二正弦脈沖解碼操作的執(zhí)行區(qū)域。在另一示例實(shí)施例中,音頻信號(hào)解碼方法從沒有應(yīng)用第一正弦脈沖解碼操作的最低頻帶,開始應(yīng)用第二正弦脈沖解碼操作。在步驟S1010中,音頻信號(hào)解碼方法對(duì)所確定的執(zhí)行區(qū)域執(zhí)行第二正弦脈沖解碼操作。在下文中,將參考圖11和12來描述根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)編碼/解碼方法和設(shè)備。圖11是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)編碼設(shè)備的框圖。參考圖11,音頻信號(hào)編碼設(shè)備接收32kHz輸入信號(hào),并且在輸出以前,合成寬帶信號(hào)和超寬帶信號(hào)。音頻信號(hào)編碼設(shè)備包括寬帶擴(kuò)展編碼模塊(1102、1108和112 以及超寬帶擴(kuò)展編碼模塊(1104、1106、1110和1112)。寬帶擴(kuò)展編碼模塊(即,G. 7 . 1核心編解碼器)基于16kHz信號(hào)來操作,而超寬帶擴(kuò)展編碼模塊基于32kHz信號(hào)來操作。在MDCT域中執(zhí)行超寬帶擴(kuò)展編碼。使用兩個(gè)模式(即,類模式1114和正弦脈沖模式1116)來對(duì)超寬帶擴(kuò)展編碼模塊的第一層進(jìn)行編碼。在所測(cè)量的輸入信號(hào)的音調(diào)的基礎(chǔ)上確定是使用類模式1114還是使用正弦脈沖模式1116。通過用于改善高頻含量的質(zhì)量的正弦脈沖編碼單元 (1118和1120),或者通過用于改善寬帶含量的感知質(zhì)量的寬帶信號(hào)改善單元1122,來編碼較高的超寬帶層。將32kHz輸入信號(hào)輸入到下采樣單元1102,并且下采樣到16kHz。將所下采樣的 16kHz信號(hào)輸入到G. 729. 1編解碼器1108。G. 729. 1編解碼器1108對(duì)于16kHz輸入信號(hào)執(zhí)行寬帶編碼操作。將從G.729. 1編解碼器1108輸出的所合成的321cbit/S信號(hào)輸入到寬帶信號(hào)改善單元1122,并且寬帶信號(hào)改善單元1122改善輸入信號(hào)的質(zhì)量。其間,將32kHz輸入信號(hào)輸入到MDCT單元1106,并且將它變換到MDCT域中。將變換到MDCT域中的輸入信號(hào)輸入到音調(diào)測(cè)量單元1104,并且確定輸入信號(hào)是否是音調(diào)的 (1110)。即,在通過在MDCT域中比較輸入信號(hào)的先前幀與當(dāng)前幀的對(duì)數(shù)域能量所執(zhí)行的音調(diào)測(cè)量的基礎(chǔ)上,定義第一超寬帶層的編碼模式。音調(diào)測(cè)量是基于輸入信號(hào)的先前幀與當(dāng)前幀的頻譜峰值之間的相關(guān)性分析。在從音調(diào)測(cè)量單元輸出的音調(diào)信息的基礎(chǔ)上,確定輸入信號(hào)是否是音調(diào)的 (1110)。例如,如果音調(diào)信息大于閾值,則將輸入信號(hào)確定為是音調(diào)的,并且如果不是這樣, 則將輸入信號(hào)確定為不是音調(diào)的。還將音調(diào)信息包括在向解碼器傳輸?shù)谋忍亓髦?。如果輸入信?hào)是音調(diào)的,則使用正弦脈沖模式1116 ;并且如果不是,則使用類模式1114。當(dāng)輸入信號(hào)的幀不是音調(diào)的(音調(diào)(tonal) = 0)時(shí),使用類模式1114。類模式 1114使用G. 729. 1寬帶編解碼器1108的編碼MDCT域表現(xiàn)來對(duì)高頻進(jìn)行編碼。將高頻頻帶(7-14kHz)劃分為四個(gè)子頻帶,并且從編碼后的、包絡(luò)規(guī)格化的寬帶含量中搜索用于每個(gè)子頻帶的所選擇的相似性準(zhǔn)則。為了獲得合成的高頻含量,通過兩個(gè)定標(biāo)因子(scaling factor)(即,線性域的第一定標(biāo)因子和對(duì)數(shù)域的第二定標(biāo)因子)來對(duì)最為相似的匹配進(jìn)行定標(biāo)。在正弦脈沖編碼單元1118和類模式1114中,通過附加的脈沖來改善此含量。類模式1114可以通過本發(fā)明的音頻編碼方法來改善編碼信號(hào)的質(zhì)量。例如,比特預(yù)算允許在第一 Ibit/s超寬帶層中將兩個(gè)脈沖進(jìn)行加和。在合成的高頻信號(hào)的子頻帶能量的基礎(chǔ)上選擇用于搜索要加和的脈沖的軌道(track)的開始位置。可以將合成的子頻帶的能量表達(dá)為下面的等式1。
權(quán)利要求
1.一種用于對(duì)音頻信號(hào)進(jìn)行編碼的方法,包括 接收變換后的音頻信號(hào);將變換后的音頻信號(hào)劃分為多個(gè)子頻帶; 對(duì)所述子頻帶執(zhí)行第一正弦脈沖編碼操作;基于該第一正弦脈沖編碼操作的編碼信息,在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域;以及對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖編碼操作, 其中,根據(jù)該編碼信息來變化地執(zhí)行該第一正弦脈沖編碼操作。
2.根據(jù)權(quán)利要求1的方法,其中,該編碼信息是關(guān)于為該第一正弦脈沖編碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為該第一正弦脈沖編碼操作所分配的脈沖數(shù)目的信息。
3.根據(jù)權(quán)利要求1的方法,其中,所述基于該第一正弦脈沖編碼操作的編碼信息、在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域的步驟包括如果該編碼信息小于預(yù)定的值,則將所述子頻帶的較低頻帶確定為該第二正弦脈沖編碼操作的執(zhí)行區(qū)域;以及如果該編碼信息大于或等于該預(yù)定的值,則將所述子頻帶的較高頻帶確定為該第二正弦脈沖編碼操作的執(zhí)行區(qū)域。
4.一種用于對(duì)音頻信號(hào)進(jìn)行編碼的設(shè)備,包括 輸入單元,被配置為接收變換后的音頻信號(hào);操作單元,被配置為將變換后的音頻信號(hào)劃分為多個(gè)子頻帶; 第一正弦脈沖編碼單元,被配置為對(duì)所述子頻帶執(zhí)行第一正弦脈沖編碼操作;以及第二正弦脈沖編碼單元,被配置為基于該第一正弦脈沖編碼操作的編碼信息,在所述子頻帶之中確定第二正弦脈沖編碼操作的執(zhí)行區(qū)域,并且對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖編碼操作,其中,該第一正弦脈沖編碼單元根據(jù)該編碼信息來變化地執(zhí)行該第一正弦脈沖編碼操作。
5.根據(jù)權(quán)利要求4的設(shè)備,其中,該編碼信息是關(guān)于為該第一正弦脈沖編碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為該第一正弦脈沖編碼操作所分配的脈沖數(shù)目的信息。
6.根據(jù)權(quán)利要求4的設(shè)備,其中,如果該編碼信息小于預(yù)定的值,則該第二正弦脈沖編碼單元將所述子頻帶的較低頻帶確定為該第二正弦脈沖編碼操作的執(zhí)行區(qū)域,并且如果該編碼信息大于或等于該預(yù)定的值,則將所述子頻帶的較高頻帶確定為該第二正弦脈沖編碼操作的執(zhí)行區(qū)域。
7.一種用于對(duì)音頻信號(hào)進(jìn)行解碼的方法,包括 接收變換后的音頻信號(hào);將變換后的音頻信號(hào)劃分為多個(gè)子頻帶; 對(duì)所述子頻帶執(zhí)行第一正弦脈沖解碼操作;基于該第一正弦脈沖解碼操作的解碼信息,在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域;以及對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖解碼操作, 其中,根據(jù)該解碼信息來變化地執(zhí)行該第一正弦脈沖解碼操作。
8.根據(jù)權(quán)利要求7的方法,其中,該解碼信息是關(guān)于為該第一正弦脈沖解碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為該第一正弦脈沖解碼操作所分配的脈沖數(shù)目的信息。
9.根據(jù)權(quán)利要求7的方法,其中,所述基于該第一正弦脈沖解碼操作的解碼信息、在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域的步驟包括如果該解碼信息小于預(yù)定的值,則將所述子頻帶的較低頻帶確定為該第二正弦脈沖解碼操作的執(zhí)行區(qū)域;以及如果該解碼信息大于或等于該預(yù)定的值,則將所述子頻帶的較高頻帶確定為該第二正弦脈沖解碼操作的執(zhí)行區(qū)域。
10.一種用于對(duì)音頻信號(hào)進(jìn)行解碼的設(shè)備,包括 輸入單元,被配置為接收變換后的音頻信號(hào);操作單元,被配置為將變換后的音頻信號(hào)劃分為多個(gè)子頻帶; 第一正弦脈沖解碼單元,被配置為對(duì)所述子頻帶執(zhí)行第一正弦脈沖解碼操作;以及第二正弦脈沖解碼單元,被配置為基于該第一正弦脈沖解碼操作的解碼信息,在所述子頻帶之中確定第二正弦脈沖解碼操作的執(zhí)行區(qū)域,并且對(duì)所確定的執(zhí)行區(qū)域執(zhí)行該第二正弦脈沖解碼操作,其中,該第一正弦脈沖解碼單元根據(jù)該解碼信息來變化地執(zhí)行該第一正弦脈沖解碼操作。
11.根據(jù)權(quán)利要求10的設(shè)備,其中,該解碼信息是關(guān)于為該第一正弦脈沖解碼操作所分配的比特?cái)?shù)目的信息、或者關(guān)于為該第一正弦脈沖解碼操作所分配的脈沖數(shù)目的信息。
12.根據(jù)權(quán)利要求10的設(shè)備,其中,如果該解碼信息小于預(yù)定的值,則該第二正弦脈沖解碼單元將所述子頻帶的較低頻帶確定為該第二正弦脈沖解碼操作的執(zhí)行區(qū)域,并且如果該解碼信息大于或等于該預(yù)定的值,則將所述子頻帶的較高頻帶確定為該第二正弦脈沖解碼操作的執(zhí)行區(qū)域。
全文摘要
本發(fā)明涉及一種用于對(duì)音頻信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備。根據(jù)本發(fā)明一個(gè)實(shí)施例的用于對(duì)音頻信號(hào)進(jìn)行編碼的方法包括接收轉(zhuǎn)換后的音頻信號(hào);將轉(zhuǎn)換后的音頻信號(hào)劃分為多個(gè)子頻帶;對(duì)所述多個(gè)子頻帶執(zhí)行第一正弦脈沖編碼;在所述多個(gè)子頻帶之中,確定其中要執(zhí)行第二正弦脈沖編碼的區(qū)塊;以及在對(duì)應(yīng)的區(qū)塊上執(zhí)行第二正弦脈沖編碼,其中,取決于編碼信息來變化地執(zhí)行第一正弦脈沖編碼步驟。根據(jù)本發(fā)明,當(dāng)使用層級(jí)的正弦脈沖編碼來對(duì)較高層中的音頻信號(hào)進(jìn)行編碼或解碼時(shí),還考慮較低層的正弦脈沖編碼,以用于更加提高合成信號(hào)的質(zhì)量。
文檔編號(hào)G10L19/02GK102460574SQ201080032331
公開日2012年5月16日 申請(qǐng)日期2010年5月19日 優(yōu)先權(quán)日2009年5月19日
發(fā)明者成鐘模, 李炳墡, 李美淑, 梁熙植, 裵賢珠, 金炫佑 申請(qǐng)人:韓國(guó)電子通信研究院