專利名稱:對音頻和/或語音信號進(jìn)行編碼和/或解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體構(gòu)思涉及編解碼器,更具體地,涉及用于對語音信號和/或音 頻信號進(jìn)行編碼和解碼的方法和設(shè)備。
背景技術(shù):
傳統(tǒng)的編解碼器分為語音編解碼器和音頻編解碼器。語音編解碼器主要
用于通過使用語音語調(diào)模型對與從50Hz到7kHz范圍的頻帶相應(yīng)的信號進(jìn)行 編碼和解碼。通常,語音編解碼器通過提取通過對聲帶和聲強(qiáng)建模表示語音
信號的參數(shù)來執(zhí)行編碼和解碼。音頻編解碼器主要用于通過應(yīng)用聲學(xué)模型(例 如,高效先進(jìn)音頻編碼(HE-AAC))來對與從OHz到24Hz范圍的頻帶相應(yīng) 的信號進(jìn)行編碼和解碼。音頻編解碼器通常利用人類聽覺特征通過省略低敏 感度信號來執(zhí)行編碼和解碼。
然而,僅使用語音編解碼器和音頻編解碼器中的一個難以有效執(zhí)行語音 信號和音頻信號兩者的編碼和解碼。語音編解碼器適用于對語音信號進(jìn)行編 碼和解碼,但是如果將其用于對音頻信號進(jìn)行編碼和解碼,則聲音質(zhì)量降^氐。 如果音頻編解碼器用于對音頻信號進(jìn)行編碼和解碼,則壓縮效率優(yōu),但是如 果將其用于對語音信號進(jìn)行編碼和解碼,則壓縮效率降低。因此,需要研究 這樣一種方法和設(shè)備在使用少量比特提高聲音質(zhì)量的同時能夠?qū)φZ音信號、 音頻信號以及語音信號和音頻信號的混合信號進(jìn)行編碼或解碼。
發(fā)明內(nèi)容
本發(fā)明總體構(gòu)思提供了一種對語音信號和/或音頻信號進(jìn)行有效編碼和/ 或解碼的方法和設(shè)備。
將在接下來的描述中的 一部分闡述本發(fā)明總體構(gòu)思另外的方面和效用, 還有一部分通過描述將是清楚的,或者可以通過本發(fā)明總體構(gòu)思的實施而得 知。
可通過提供對信號進(jìn)行編碼的方法來實現(xiàn)本發(fā)明總體構(gòu)思的前述和/或其它方面和效用,所述方法包括將輸入信號變換到至少一個域;使用預(yù)定
的單元的信號進(jìn)行編碼。
還可通過提供對信號進(jìn)行編碼的方法來達(dá)到本發(fā)明總體構(gòu)思的前述和/
或其它方面和效用,所述方法包括確定一個或更多域,在所述域中將輸入 信號編碼到預(yù)定的單元中;將分配到預(yù)定的各個單元的信號變換到確定的域,
并隨后對變換的信號進(jìn)行編碼。
還可通過提供對信號進(jìn)行解碼的方法來達(dá)到本發(fā)明總體構(gòu)思的前述和/
或其它方面和效用,所述方法包括確定多個域,在所述多個域中預(yù)定的單 元的信號已經(jīng)被分別編碼;分別對預(yù)定的域中的信號進(jìn)行解碼;通過將解碼 的信號組合來恢復(fù)原始信號。
還可通過提供對信號進(jìn)行編碼的設(shè)備來達(dá)到本發(fā)明總體構(gòu)思的前述和/ 或其它方面和效用,所述設(shè)備包括變換單元,將輸入信號變換到至少一個 域并使用預(yù)定的單元中的輸入信號或變換的信號確定將被編碼的域;編碼單 元,對分配到確定的域中的單元的信號進(jìn)行編碼。
還可通過提供對信號進(jìn)行解碼的設(shè)備來達(dá)到本發(fā)明總體構(gòu)思的前述和/ 或其它方面和效用,所述設(shè)備包括解復(fù)用單元,確定多個域,在所述多個 域中預(yù)定的單元的信號已經(jīng)被分別編碼;解碼單元,分別對確定的域中的信 號進(jìn)行解碼;變換單元,通過將解碼的信號組合來恢復(fù)原始信號。
還可通過提供對信號進(jìn)行編碼和/或解碼的設(shè)備來達(dá)到本發(fā)明總體構(gòu)思 的前述和/或其它方面和效用,所述設(shè)備包括編碼器,將輸入信號變換到至 少一個域并使用預(yù)定的單元中的輸入信號或變換的信號確定將被編碼的域, 并且對分配到確定的域中的單元的信號進(jìn)行編碼;解碼器,確定編碼的信號 被分配的確定的域,分別對確定的域中的信號進(jìn)行解碼,通過將解碼的信號 組合來恢復(fù)輸入信號。
還可通過提供包含作為執(zhí)行以下方法的程序的計算機(jī)可讀代碼的計算機(jī) 可讀介質(zhì)來達(dá)到本發(fā)明總體構(gòu)思的前述和/或其它方面和效用將輸入信號變 換到至少一個域;使用預(yù)定的單元中的輸入信號或變換的信號確定將被編碼 的域;對分配到確定的域中的單元的信號進(jìn)行編碼;確定多個域,在所述多 個域中用于預(yù)定的單元的信號已經(jīng)被分別編碼;分別對預(yù)定的域中的信號進(jìn) 行解碼;通過將解碼的信號組合來恢復(fù)原始信號。
通過下面結(jié)合附圖對實施例進(jìn)行的描述,本發(fā)明總體構(gòu)思的這些和其它
方面和效用將會變得清楚并更加易于理解,其中
圖1是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號編碼設(shè)備
的框圖2是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的包括在圖1中示出的音頻和/ 或語音信號編碼設(shè)備中的頻域編碼單元的框圖3是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的包括在圖1中示出的音 頻和/或語音信號編碼設(shè)備中的頻域編碼單元的框圖4是示出根據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖5是示出根據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖6是示出根據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖7是示出根據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖8是示出根據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖9是示出才艮據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖10是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼設(shè)備的框圖11是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號解碼設(shè) 備的框圖12是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的包括在圖11中示出的音頻 和/或語音信號編碼設(shè)備中的頻域解碼單元的框圖13是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的包括在圖11中示出的 音頻和/或語音信號編碼設(shè)備中的頻域解碼單元的框圖14是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解
8碼設(shè)備的框圖15是示出根據(jù)本發(fā)明總體構(gòu)思的另 碼設(shè)備的框圖16是示出根據(jù)本發(fā)明總體構(gòu)思的另 碼設(shè)備的框圖17是示出根據(jù)本發(fā)明總體構(gòu)思的另 碼設(shè)備的框圖18是示出根據(jù)本發(fā)明總體構(gòu)思的另 碼設(shè)備的框圖19是示出根據(jù)本發(fā)明總體構(gòu)思的另 碼設(shè)備的框圖20是示出根據(jù)本發(fā)明總體構(gòu)思的另 碼設(shè)備的框圖21是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號編碼方 法的流程圖22是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的圖21中示出的編碼方法的 操作的流程圖23是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的圖21中示出的編碼方 法的操作的流程圖24是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖25是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖26是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖27是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖28是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖29是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程一實施例的音頻和/或語音信號解 一實施例的音頻和/或語音信號解 一實施例的音頻和/或語音信號解 一實施例的音頻和/或語音信號解 一實施例的音頻和/或語音信號解 一實施例的音頻和/或語音信號解圖30是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編
碼方法的流程圖31是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號解碼方 法的流程圖32是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的圖31中示出的解碼方法的 操作的流程圖33是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的圖31中示出的解碼方 法的操作的流程圖34是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖35是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖36是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖37是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖38是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖39是示出4艮據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖;和
圖40是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。
具體實施例方式
將詳細(xì)描述本發(fā)明總體構(gòu)思的實施例,其示例在附圖中表示,其中,相 同的標(biāo)號始終表示相同的部件。以下通過參考附圖描述實施例以解釋本發(fā)明 總體構(gòu)思。
圖1是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號編碼設(shè)備 的框圖。編碼設(shè)備包括第一域變換單元100、頻域編碼單元110和復(fù)用單元 120。
第一域變換單元100將經(jīng)由輸入端子IN接收的輸入信號從時域變換到頻域,并隨后將頻帶劃分為子代。這里,第一域變換單元100根據(jù)第一變換方 法將輸入信號從時域變換到頻域,還根據(jù)第二變換方法將輸入信號從時域變 換到頻域,以將聲學(xué)模型應(yīng)用到輸入信號,第二變換方法與第一變換方法不 同。使用根據(jù)第一變換方法變換的信號對輸入信號進(jìn)行編碼,使用根據(jù)第二 變換方法變換的信號以將聲學(xué)模型應(yīng)用到輸入信號。
例如,第一域變換單元100可通過將修正的離散余弦變換(mdct)用 作第一變換方法將輸入信號變換到頻域來使用實數(shù)表示輸入信號,并通過將 修正的離散正弦變換(mdst)用作第二變換方法將輸入信號變換到頻域來 使用虛數(shù)表示輸入信號。這里,作為使用mdct的結(jié)果的使用實數(shù)表示的信 號用于對輸入信號進(jìn)行編碼,作為使用mdst的結(jié)果的使用虛數(shù)表示的信號 和實數(shù)一起用于將聲學(xué)模型應(yīng)用到輸入信號。因此,由于還可表示輸入信號 的相位信息,故對與時域相應(yīng)的信號執(zhí)行離散傅里葉變換(dft),并隨后對 mdct系數(shù)進(jìn)行量化,從而避免發(fā)生失配。
頻域編碼單元110從由第一域變換單元100根據(jù)第一變換方法變換的信 號的每個子帶選擇重要譜分量并對其進(jìn)行量化,并隨后提取剩余譜分量,計 算并量化剩余譜分量的噪聲等級??扇鐖D2或圖3中所示來構(gòu)建頻域編碼單 元110。
圖2是示出#^居本發(fā)明總體構(gòu)思的實施例的頻域編碼單元110的框圖。 參照圖1和圖2,頻域編碼單元110包括聲學(xué)模型應(yīng)用單元200、重要譜分量 選擇單元210、量化單元220和噪聲處理單元230。
聲學(xué)模型應(yīng)用單元200將聲學(xué)模型應(yīng)用到輸入信號以去除由人類聽覺特 征引起的感知冗余。這里,聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù) 學(xué)模型。
聲學(xué)模型應(yīng)用單元200通過應(yīng)用使用人類聽覺系統(tǒng)的聲學(xué)模型從輸入信 號省略或排除低敏感度特殊信息,并分配指示頻率單元中的感知強(qiáng)度的信號 掩蔽比(smr)。聲學(xué)模型應(yīng)用單元200通過使用根據(jù)第二變換方法變換的信 號來應(yīng)用聲學(xué)模型。第二變換方法的示例是mdst。
重要譜分量選擇單元210從在頻域中表示并經(jīng)由輸入端子IN 1接收的信 號的每個子帶選擇重要譜分量。在這種情況下,重要譜分量選擇單元210可 使用各種方法以選^r重要譜分量。在第一種方法中,計算信號的smR,隨后, 如果smr大于掩蔽值的倒數(shù),則確定信號為重要譜分量。在第二種方法中,
ii通過在考慮預(yù)定權(quán)重的情況下提取譜峰來選擇重要譜分量。在第三種方法中,
計算每個子帶的信號噪聲比(SNR),隨后,從具有小SNR的子帶中選擇峰
值等于或大于預(yù)定值的譜分量。可單獨執(zhí)行上述三種方法,或者可執(zhí)行三種 方法中的一種或至少兩種的組合。
量化單元220對由重要譜分量選擇單元210通過使用由聲學(xué)模型應(yīng)用單 元200分配的SMR來選擇的重要語分量進(jìn)行量化,并隨后經(jīng)由輸出端子 0UT1輸出量化結(jié)果。
噪聲處理單元230從經(jīng)由輸入端子IN 1接收的在頻域中表示的信號提取 除了由重要語分量選擇單元210選擇的重要譜分量之外的剩余語分量,并隨 后計算并量化剩余譜分量的噪聲等級。這里,噪聲處理單元230經(jīng)由輸出端 子OUT2輸出量化結(jié)果。
圖3是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的頻域編碼單元110的框 圖。參照圖1和圖3,頻域編碼單元110包括語音工具編碼單元300、聲學(xué)模 型應(yīng)用單元310、重要譜分量選擇單元320、量化單元330和噪聲處理單元 340。
臨界值的強(qiáng)攻擊信號的信號進(jìn)行精確編碼,并在輸出端子OUT3輸出結(jié)果。 這里,信號可以是根據(jù)第一變換方法變換的信號。
聲學(xué)模型應(yīng)用單元310將聲學(xué)模型應(yīng)用到輸入信號以去除由人類聽覺特 征引起的感知冗余。另外,聲學(xué)模型應(yīng)用單元310計算分配給經(jīng)由輸入端子 IN 2接收的在頻域中表示的信號的各個子帶的比特數(shù)。
聲學(xué)模型應(yīng)用單元310通過應(yīng)用使用人類聽覺系統(tǒng)的聲學(xué)模型從輸入信 號省略或排除低敏感度特殊信息,并在改變SMR時分配指示頻率單元中的感 知強(qiáng)度的SMR。聲學(xué)模型應(yīng)用單元310通過使用根據(jù)第二變換方法變換的信 號來應(yīng)用聲學(xué)模型。第二變換方法的示例是MDST。
號的每個子帶選擇重要譜分量。在這種情況下,重要鐠分量選擇單元320可 使用各種方法以選#^重要語分量。第一,計算信號的SMR,隨后,如果SMR 大于掩蔽值的倒數(shù),則確定信號為重要譜分量。第二,通過在考慮預(yù)定權(quán)重 的情況下提取譜峰來選擇重要譜分量。第三,計算每個子帶的信號噪聲比 (SNR),隨后,從具有小SNR的子帶中選擇峰值等于或大于預(yù)定值的譜分量??蓡为殘?zhí)行上述三種方法,或者可執(zhí)行三種方法中的一種或至少兩種的 組合。
量化單元330對由重要譜分量選擇單元320通過使用由聲學(xué)模型應(yīng)用單 元310分配的SMR來選擇的重要譜分量進(jìn)行量化,并隨后經(jīng)由輸出端子 OUT4輸出量化結(jié)果。
噪聲處理單元340從經(jīng)由輸入端子IN 2接收的在頻域中表示的信號提取 除了由重要譜分量選^奪單元320選擇的重要譜分量之外的剩余譜分量,并隨 后計算并量化剩余譜分量的噪聲等級。這里,噪聲處理單元340經(jīng)由輸出端 子OUT5輸出量化結(jié)果。
這里,可通過執(zhí)行線性預(yù)測分析來計算噪聲等級。使用自相關(guān)方法執(zhí)行 線性預(yù)測分析,但也可使用協(xié)方差方法或Durbin方法執(zhí)行線性預(yù)測分析。線 性預(yù)測允許編碼單元預(yù)測在當(dāng)前幀中存在的噪聲分量的量。如果存在較多噪 聲分量,則剩余譜分量被直接發(fā)送而不改變它們的噪聲等級。如果存在較少 的噪聲分量并存在較多的音調(diào)分量,則通過減小剩余^"分量的噪聲等級來發(fā) 送剩余譜分量。另外,在使用指示噪聲快速改變的小窗口的情況下,通過另 外減d、剩余譜分量的噪聲等級來直接發(fā)送剩余譜分量。
圖1的復(fù)用單元120通過對頻域編碼單元110的編碼結(jié)果進(jìn)行復(fù)用來產(chǎn) 生比特流,并經(jīng)由輸出端子OUT輸出比特流。這里,頻域編碼單元110的編 碼結(jié)果表示這樣的編碼結(jié)果由量化單元220在輸出端子0UT1對重要譜分 量量化的結(jié)果和由噪聲處理單元230在輸出端子OUT2對剩余譜分量量化的 結(jié)果(見圖2),或由語音工具編碼單元300在輸出端子OUT3的編碼結(jié)果、 由量化單元330在輸出端子OUT4對重要譜分量量化的結(jié)果和由噪聲處理單 元340在輸出端子OUT5對剩余譜分量量化的結(jié)果(見圖3 )。
圖4是示出根據(jù)本發(fā)明總體構(gòu)思的另 一 實施例的音頻和/或語音信號編碼 設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括域變換單元400、模式確定單 元410、時域編碼單元420、頻域編碼單元430和復(fù)用單元440。
域變換單元400將經(jīng)由輸入端子IN 4接收的輸入信號從時域變換到頻 域,將信號劃分為子帶單元,并隨后將預(yù)定的一個或預(yù)定的幾個子帶從頻域 變換到時域。
域變換單元400可一皮實施為4丸行接收在時域中表示的信號以及在時域和 頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈活的方
13法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的時間分 辨率在頻帶單元中被適當(dāng)?shù)乜刂?,以表示頻域中的信號的預(yù)定的一個或預(yù)定
的幾個子帶。此外,域變換單元400使用虛數(shù)來產(chǎn)生將應(yīng)用到聲學(xué)模型的信
號。這種變換方法的示例是頻變調(diào)制重疊變換(FV-MLT)。
域變換單元400包括第一域變換單元403和第二域逆變換單元406。 第一域變換單元403將經(jīng)由輸入端子IN4接收的輸入信號從時域變換到 頻域,并將信號劃分為子帶單元。這里,第一域變換單元403根據(jù)第一變換 方法將輸入信號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換 方法將輸入信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到輸入信號。使用根 據(jù)第一變換方法變換的信號對輸入信號進(jìn)行編碼,使用根據(jù)第二變換方法變 換的信號以將聲學(xué)模型應(yīng)用到輸入信號。
例如,第一域變換單元403可通過將MDCT用作第一變換方法將輸入信 號變換到頻域來使用實數(shù)表示輸入信號,并通過將MDST用作第二變換方法 將輸入信號變換到頻域來使用虛數(shù)表示輸入信號。這里,作為使用MDCT的 結(jié)果的使用實數(shù)表示的信號用于對輸入信號進(jìn)行編碼,作為使用MDST的結(jié) 果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到輸入信號。因此,由于還可 表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT,并隨后對MDCT 系數(shù)進(jìn)行量化,從而避免發(fā)生失配。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽 反應(yīng)的數(shù)學(xué)模型。
第二域逆變換單元406根據(jù)第一變換方法的逆變換方法將由第一域變換 單元403變換到頻域的預(yù)定的子代從頻域逆變換到時域。例如,第二域逆變 換單元406執(zhí)行作為第一變換方法的逆變換的修正的離散余弦逆變換 (IMDCT )。
模式確定單元410確定在頻域中對由第一域變換單元403變換到頻域的 信號的每個子帶進(jìn)行編碼是否合適。換句話說,模式確定單元410基于預(yù)定 的原理確定在頻域還是在時域中對信號的每個子帶進(jìn)行編碼。另外,模式確 定單元410對指示由模式確定單元410為每個子帶確定的域的標(biāo)識符進(jìn)行量 化,并隨后將量化結(jié)果輸出到復(fù)用單元440。
當(dāng)模式確定單元410確定是否在頻域中對每個子帶進(jìn)行編碼時,可使用 與頻域相應(yīng)的并從第 一域變換單元403接收的信號以及與時域相應(yīng)的并經(jīng)由 輸入端子IN4接收的信號中的一個或兩者。
14第二域逆變換單元406根據(jù)第一變換方法的逆變換方法將多個子帶中由
模式確定單元410確定不在頻域中編碼的子帶從頻域逆變換到時域。
時域編碼單元420在時域中對由第二域逆變換單元406逆變換到時域的 子帶的一個或多個信號進(jìn)行編碼。
被確定不在頻域中編碼的子帶的信號不僅可由時域編碼單元420在時域 中進(jìn)行編碼,還可由頻域編碼單元430在頻域中進(jìn)行編碼。因此,不僅可在 時域中對預(yù)定的子帶進(jìn)行編碼,還可在頻域中對預(yù)定的子帶進(jìn)行編碼。在這 種情況下,表示預(yù)定的子帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識 符被量化,隨后,量化的結(jié)果被輸出到復(fù)用單元440。
頻域編碼單元430在頻域中對由模式確定單元410確定在頻域中進(jìn)行編 碼的子帶進(jìn)行編碼??扇鐖D2和圖3所示構(gòu)造頻域編碼單元430。
復(fù)用單元440通過對指示已經(jīng)對每個子帶進(jìn)行編碼的域的標(biāo)識符量化的 結(jié)果、由時域編碼單元420編碼的結(jié)果以及頻域編碼單元430的編碼結(jié)果進(jìn) 行復(fù)用來產(chǎn)生比特流,并經(jīng)由輸出端子OUT輸出比特流。這里,頻域編碼單 元430的編碼結(jié)果表示由量化單元220對重要鐠分量量化的結(jié)果和由噪聲 處理單元230對剩余譜分量量化的結(jié)果(見圖2 ),或由語音工具編碼單元300 編碼的結(jié)果、由量化單元330對重要譜分量量化的結(jié)果和由噪聲處理單元340 對剩余譜分量量化的結(jié)果(見圖3)。
圖5是示出才艮據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括立體聲編碼單元500、第一域 變換單元510、頻域編碼單元520和復(fù)用單元530。
如果經(jīng)由輸入端子IN接收的輸入信號是立體聲信號,則立體聲編碼單元 500通過分析輸入信號來提取參數(shù),并隨后對輸入信號下混頻。提取的參數(shù) 是解碼端將從編碼端接收的單信號上混頻到立體聲信號所需的信息。參數(shù)的 示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。 立體聲編碼單元500對參數(shù)進(jìn)行量化并隨后將量化結(jié)果輸出到復(fù)用單元530。
第一域變換單元510將由立體聲編碼單元500下混頻的信號從時域變換 到頻域,并隨后將信號劃分為子帶單元。這里,第一域變換單元510根據(jù)第 一變換方法將下混頻的信號從時域變換到頻域,并根據(jù)不同于第一變換方法 的第二變換方法將輸入信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到輸入信 號。使用根據(jù)第一變換方法變換的信號對輸入信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到輸入信號。聲學(xué)模型表示關(guān)于人類 聽覺系統(tǒng)的掩蔽反映的數(shù)學(xué)模型。
例如,第一域變換單元510可通過將修正的離散余弦變換(MDCT)用
作第一變換方法將輸入信號變換到頻域來使用實數(shù)表示輸入信號,并通過將
修正的離散正弦變換(MDST)用作第二變換方法將輸入信號變換到頻域來 使用虛數(shù)表示輸入信號。這里,作為使用MDCT的結(jié)果的使用實數(shù)表示的信 號用于對輸入信號進(jìn)行編碼,作為使用MDST的結(jié)果的使用虛數(shù)表示的信號 用于將聲學(xué)模型應(yīng)用到輸入信號。因此,由于還可表示輸入信號的相位信息,
故對與時域相應(yīng)的信號執(zhí)行離散傅里葉變換(DFT),并隨后對MDCT系數(shù) 進(jìn)行量化,從而避免發(fā)生失配。
頻域編碼單元520從由第 一域變換單元500才艮據(jù)第 一變換方法變換的信 號的每個子帶選擇重要譜分量并對其進(jìn)行量化,并隨后提取剩余譜分量,計 算并量化剩余鐠分量的噪聲等級??扇鐖D2或圖3中所示來構(gòu)建頻域編碼單 元520。
復(fù)用單元530通過對由立體聲編碼單元500量化的參數(shù)以及頻域編碼單 元520的編碼結(jié)果進(jìn)4亍復(fù)用來產(chǎn)生比特流,并隨后經(jīng)由輸出端子OUT輸出比 特流。這里,頻域編碼單元520的編碼結(jié)果表示由量化單元220對重要鐠 分量量化的結(jié)果和由噪聲處理單元230對剩余譜分量量化的結(jié)果(見圖2), 或由語音工具編碼單元300編碼的結(jié)果、由量化單元330對重要譜分量量化 的結(jié)果和由噪聲處理單元340對剩余譜分量量化的結(jié)果(見圖3)。
圖6是示出根據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括立體聲編碼單元500、域變換 單元610、模式確定單元620、時域編碼單元630、頻i或編碼單元640和復(fù)用 單元650。
如果經(jīng)由輸入端子IN接收的輸入信號是立體聲信號,則立體聲編碼單元 600通過分析輸入信號來提取參數(shù),并隨后對輸入信號下混頻。提取的參數(shù) 是解碼端將從編碼端接收的單信號上混頻到立體聲信號所需的信息。參數(shù)的 示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。 立體聲編碼單元600對參數(shù)進(jìn)行量化并隨后將量化結(jié)果輸出到復(fù)用單元650。
域變換單元610將由立體聲編碼單元600下混頻的信號從時域變換到頻 域,將信號劃分為子帶單元,并對預(yù)定的一個或預(yù)定的幾個子帶進(jìn)行逆變換。這里,域變換單元610可被實施為執(zhí)行接收在時域中表示的信號以及在 時域和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈 活的方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的 時間分辨率在頻帶單元中被適當(dāng)?shù)乜刂?,以表示頻域中的信號的預(yù)定的一個
或預(yù)定的幾個子帶。此外,域變換單元610使用虛數(shù)來產(chǎn)生將應(yīng)用到聲學(xué)模 型的信號。這種變換方法的示例是頻變調(diào)制重疊變換(FV-MLT)。
域變換單元610包括第一域變換單元613和第二域逆變換單元616。 第一域變換單元613將由立體聲編碼單元600下混頻的信號從時域變換 到頻域,并隨后將信號劃分為子帶單元。這里,第一域變換單元613根據(jù)第 一變換方法將下混頻的信號從時域變換到頻域,并根據(jù)不同于第一變換方法 的第二變換方法將輸入信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到輸入信
號。使用根據(jù)第一變換方法變換的信號對下混頻的信號進(jìn)行編碼,使用根據(jù) 第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到下混頻的信號。
例如,第一域變換單元613可通過將MDCT用作第一變換方法將輸入信 號變換到頻域來使用實數(shù)表示輸入信號,并通過將MDST用作第二變換方法 將輸入信號變換到頻域來使用虛數(shù)表示輸入信號。這里,作為使用MDCT的 結(jié)果的使用實數(shù)表示的信號用于對下混頻的信號進(jìn)行編碼,作為使用MDST 的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到下混頻的信號。因此, 由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行離散傅里葉 變換(DFT),并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。
第二域逆變換單元616根據(jù)第一變換方法的逆變換方法將由第一域變換 單元613變換到頻域的預(yù)定的子帶從頻域逆變換到時域。例如,第二域逆變 換單元616執(zhí)行作為第 一變換方法的逆變換的IMDCT。
模式確定單元620確定在頻域中對由第一域變換單元613變換到頻域的 信號的每個子帶進(jìn)行編碼是否合適。換句話說,模式確定單元620確定在頻 域還是在時域中對信號的每個子帶進(jìn)行編碼。另外,模式確定單元620對指 示由模式確定單元620為每個子帶確定的域的標(biāo)識符進(jìn)行量化,并隨后將量 化結(jié)果輸出到復(fù)用單元650。
當(dāng)模式確定單元620確定是否在頻域中對每個子帶進(jìn)行編碼時,可使用 與頻域相應(yīng)的并從第一域變換單元613接收的信號以及與時域相應(yīng)的并從立 體聲編碼單元600接收的信號中的一個或兩者。第二域逆變換單元616根據(jù)第一變換方法的逆變換方法將多個子帶中由
^t式確定單元620確定不在頻域中編碼的子帶從頻域逆變換到時域。例如,
時域編碼單元630在時域中對由第二域逆變換單元616逆變換到時域的 子帶的一個或多個信號進(jìn)行編碼。
被確定不在頻域中編碼的子帶的信號不僅可由時域編碼單元630在時域 中進(jìn)行編碼,還可由頻域編碼單元640在頻域中進(jìn)行編碼。因此,不僅可在 時域中對預(yù)定的子帶進(jìn)行編碼,還可在頻域中對預(yù)定的子帶進(jìn)行編碼。在這 種情況下,表示預(yù)定的子帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識 符被量化,隨后,量化的結(jié)果被輸出到復(fù)用單元650。
頻域編碼單元640在頻域中對由模式確定單元620確定在頻域中進(jìn)行編 碼的子帶進(jìn)行編碼。可如圖2和圖3所示構(gòu)造頻域編碼單元640。
復(fù)用單元650通過對由立體聲編碼單元600量化的參數(shù)、對指示對每個 子帶進(jìn)行編碼的域的標(biāo)識符量化的結(jié)果、由時域編碼單元630編碼的結(jié)果以 及頻域編碼單元640的編碼結(jié)果進(jìn)行復(fù)用來產(chǎn)生比特流,并經(jīng)由輸出端子 OUT輸出比特流。這里,頻域編碼單元640的編碼結(jié)果表示由量化單元220 對重要譜分量量化的結(jié)果和由噪聲處理單元230對剩余譜分量量化的結(jié)果 (見圖2),或由語音工具編碼單元300編碼的結(jié)果、由量化單元330對重要 譜分量量化的結(jié)果和由噪聲處理單元340對剩余鐠分量量化的結(jié)果(見圖3 )。
圖7是示出才艮據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編碼 設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括帶劃分單元700、第一域變換 單元710、頻域編碼單元720、高頻帶編碼單元730和復(fù)用單元740。
帶劃分單元700基于預(yù)定的頻率將經(jīng)由輸入端子IN接收的輸入信號劃分 為低頻帶信號和高頻帶信號。
第一域變換單元710將從帶劃分單元700接收的低頻帶信號從時域變換 到頻域,并隨后將低頻帶信號劃分為子帶單元。這里,第一域變換單元710 根據(jù)第一變換方法將低頻帶信號從時域變換到頻域,并根據(jù)不同于第一變換 方法的第二變換方法將低頻帶信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到 低頻帶信號。使用根據(jù)第一變換方法變換的信號對低頻帶信號進(jìn)行編碼,使 用根據(jù)第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到低頻帶信號。聲學(xué)模型
表示關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。例如,第一域變換單元710可通過將MDCT用作第一變換方法將低頻帶 信號變換到頻域來使用實數(shù)表示低頻帶信號,并通過將MDST用作第二變換 方法將低頻帶信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。
頻域編碼單元720從在頻域中表示并從第一域變換單元710接收的信號 的每個子帶選擇重要譜分量并對其進(jìn)行,并隨后提取剩余譜分量,計算并量 化剩余譜分量的噪聲等級??扇鐖D2或圖3中所示來構(gòu)建頻域編碼單元720。
高頻帶編碼單元730使用低頻帶信號對從帶劃分單元700接收的高頻帶 信號進(jìn)行編碼。
復(fù)用單元740通過對由頻域編碼單元720編碼的結(jié)果以及高頻帶編碼單 元730編碼的結(jié)果進(jìn)行復(fù)用來產(chǎn)生比特流,并隨后經(jīng)由輸出端子OUT輸出比 特流。這里,頻域編碼單元720的編碼結(jié)果表示由量化單元220對重要譜 分量量化的結(jié)果和由噪聲處理單元230對剩余譜分量量化的結(jié)果(見圖2), 或由語音工具編碼單元300編碼的結(jié)果、由量化單元330對重要譜分量量化 的結(jié)果和由噪聲處理單元340對剩余譜分量量化的結(jié)果(見圖3)。
圖8是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編碼 設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括帶劃分單元800、域變換單元 810、模式確定單元820、時域編碼單元830、頻域編碼單元840、高頻帶編 碼單元850和復(fù)用單元860。
帶劃分單元800基于預(yù)定的頻率將從輸入端子IN^t妄收的輸入信號劃分為 低頻帶信號和高頻帶信號。
域變換單元810將從帶劃分單元800接收的低頻帶信號從時域變換到頻 域,將低頻帶信號劃分為子帶單元,并將預(yù)定的一個或預(yù)定的幾個子帶逆變 換到時域。
這里,第一域變換單元710可被實施為執(zhí)行接收在時域中表示的信號以 及在時域和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法 是靈活的方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信 號的時間分辨率在頻帶單元中被適當(dāng)?shù)乜刂?,以表示頻域中的信號的預(yù)定的一個或預(yù)定的幾個子帶。此外,域變換單元610使用虛數(shù)來產(chǎn)生將應(yīng)用到聲
學(xué)對莫型的信號。這種變換方法的示例是FV-MLT。
域變換單元810包括第一域變換單元813和第二域逆變換單元816。
到頻域,并隨后將低頻帶信號劃分為子帶單元。這里,第一域變換單元813 根據(jù)第一變換方法將低頻帶信號從時域變換到頻域,并根據(jù)不同于第一變換 方法的第二變換方法將低頻帶信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到 低頻帶信號。使用根據(jù)第一變換方法變換的信號對低頻帶信號進(jìn)行編碼,使 用根據(jù)第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到低頻帶信號。
例如,第一域變換單元813可通過將MDCT用作第一變換方法將低頻帶 信號變換到頻域來使用實數(shù)表示低頻帶信號,并通過將MDST用作第二變換 方法將低頻帶信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。
第二域逆變換單元816^4居第一變換方法的逆變4奐方法將由第一域變換 單元813變換到頻域的預(yù)定的一個或預(yù)定的幾個子帶^^頻域逆變換到時域。 例如,第二域逆變換單元816執(zhí)行作為第一變換方法的逆變換方法的IMDCT。
;漠式確定單元820確定在頻域中對由第一域變換單元813變換到頻域的 低頻帶信號的每個子帶進(jìn)行編碼是否合適。換句話說,模式確定單元820確 定在頻域還是在時域中對低頻帶信號的每個子帶進(jìn)行編碼。另外,模式確定 單元820對指示由模式確定單元820為每個子帶確定的域的標(biāo)識符進(jìn)行量化, 并隨后將量化結(jié)果輸出到復(fù)用單元860。
當(dāng)模式確定單元820確定是否在頻域中對每個子帶進(jìn)行編碼時,可使用 與頻域相應(yīng)的并從第一域變換單元813接收的信號以及與時域相應(yīng)的并從帶 劃分單元800接收的信號中的一個或兩者。
第二域逆變換單元816根據(jù)第一變換方法的逆變換方法將多個子帶中的 由模式確定單元820確定不在頻域中編碼的子帶從頻域逆變換到時域。例如, 第二域逆變換單元816通過執(zhí)行IMDCT來將子帶從頻域逆變換到時域。
時域編碼單元830在時域中對由第二域逆變換單元816逆變換到時域的
20子帶的一個或多個信號進(jìn)行編碼。
在預(yù)定的一個或預(yù)定的幾個子帶的情況下,被確定不在頻域中編碼的子 帶的信號不僅可由時域編碼單元830在時域中進(jìn)行編石馬,還可由頻域編碼單
元840在頻域中進(jìn)行編碼。因此,不僅可在時域中對預(yù)定的子帶進(jìn)行編碼, 還可在頻域中對預(yù)定的子帶進(jìn)行編碼。在這種情況下,表示預(yù)定的子帶的信 號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識符被量化,隨后,量化的結(jié)果被 輸出到復(fù)用單元860。
頻域編碼單元840在頻域中對由模式確定單元820確定在頻域中進(jìn)行編 碼的子帶進(jìn)行編碼。可如圖2和圖3所示構(gòu)造頻域編碼單元840。
高頻帶編碼單元850使用低頻帶信號對從帶劃分單元800接收的高頻帶 信號進(jìn)行編碼。
復(fù)用單元860通過對指示對每個子帶進(jìn)行編碼的域的標(biāo)識符量化的結(jié) 果、由時域編碼單元830編碼的結(jié)果、頻域編碼單元840編碼的結(jié)果以及由 高頻帶編碼單元850編碼的結(jié)果進(jìn)行復(fù)用來產(chǎn)生比特流,并隨后經(jīng)由輸出端 子OUT輸出比特流。這里,頻域編碼單元840的編碼結(jié)果表示由量化單元 220對重要譜分量量化的結(jié)果和由噪聲處理單元230對剩余諳分量量化的結(jié) 果(見圖2),或由語音工具編碼單元300編碼的結(jié)果、由量化單元330對重 要譜分量量化的結(jié)果和由噪聲處理單元340對剩余譜分量量化的結(jié)果(見圖 3)。
圖9是示出才艮據(jù)本發(fā)明總體構(gòu)思的另 一實施例的音頻和/或語音信號編碼 設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括立體聲編碼單元900、帶劃分 單元910、第一域變換單元920、頻域編碼單元930、高頻帶編碼單元940和 復(fù)用單元950。
如果經(jīng)由輸入端子IN接收的輸入信號是立體聲信號,則立體聲編碼單元
900通過分析輸入信號來提取參數(shù),并隨后對輸入信號下混頻。提取的參數(shù) 是解碼端將從編碼端接收的單信號上混頻到立體聲信號所需的信息。參數(shù)的
示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。 立體聲編碼單元900對參數(shù)進(jìn)行量化并隨后將量化結(jié)果輸出到復(fù)用單元650。
帶劃分單元910基于預(yù)定的頻率將由立體聲編碼單元900下混頻的信號 劃分為低頻帶信號和高頻帶信號。
第一域變換單元920將從帶劃分單元910接收的低頻帶信號從時域變換到頻域,并隨后將信號劃分為子帶單元。這里,第一域變換單元920根據(jù)第
一變換方法將低頻帶信號從時域變換到頻域,并根據(jù)不同于第一變換方法的 第二變換方法將低頻帶信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到低頻帶 信號。使用根據(jù)第一變換方法變換的信號對低頻帶信號進(jìn)行編碼,使用根據(jù) 第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到低頻帶信號。聲學(xué)模型表示關(guān) 于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。
例如,第一域變換單元920可通過將MDCT用作第一變換方法將低頻帶 信號變換到頻域來使用實數(shù)表示低頻帶信號,并通過將MDST用作第二變換 方法將低頻帶信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行離散傅 里葉變換(DFT),并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。
頻域編碼單元930從在頻域中表示并從第一域變換單元920接收的信號 的每個子帶選擇重要譜分量并對其進(jìn)行量化,并隨后提取剩余譜分量,計算 并量化剩余譜分量的噪聲等級??扇鐖D2或圖3中所示來構(gòu)建頻域編碼單元 930。
高頻帶編碼單元940使用低頻帶信號對從帶劃分單元910接收的高頻帶 信號進(jìn)行編碼。
復(fù)用單元950通過對由立體聲編碼單元900量化的參數(shù)、由頻域編碼單 元930編碼的結(jié)果以及由高頻帶編碼單元940編碼的結(jié)果進(jìn)行復(fù)用來產(chǎn)生比 特流,并隨后經(jīng)由輸出端子OUT輸出比特流。這里,頻域編碼單元930的編 碼結(jié)果表示由量化單元220對重要語分量量化的結(jié)果和由噪聲處理單元230 對剩余譜分量量化的結(jié)果(見圖2),或由語音工具編碼單元300編碼的結(jié)果、 由量化單元330對重要譜分量量化的結(jié)果和由噪聲處理單元340對剩余譜分 量量化的結(jié)果(見圖3)。
圖10是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼設(shè)備的框圖。音頻和/或語音信號編碼設(shè)備包括立體聲編碼單元1000、帶劃 分單元1010、域變換單元1020、模式確定單元1030、時域編碼單元1040、 頻域編碼單元1050、高頻帶編碼單元1060和復(fù)用單元1070。
如果經(jīng)由輸入端子IN接收的輸入信號是立體聲信號,則立體聲編碼單元
221000通過分析輸入信號來提取參數(shù),并隨后對輸入信號下混頻。提取的參數(shù) 是解碼端將從編碼端接收的單信號上混頻到立體聲信號所需的信息。參數(shù)的 示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。
立體聲編碼單元.iooo對參數(shù)進(jìn)行量化并隨后將量化結(jié)果輸出到復(fù)用單元 650。
帶劃分單元1010基于預(yù)定的頻率將由立體聲編碼單元1000下混頻的信 號劃分為低頻帶信號和高頻帶信號。
域變換單元102o將從帶劃分單元1010接收的低頻帶信號從時域變換到 頻域,將低頻帶信號劃分為子帶單元,并將預(yù)定的一個或預(yù)定的幾個子帶逆 變換到時域。
這里,域變換單元1020可被實施為執(zhí)行接收在時域中表示的信號以及在 時域和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈 活的方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的 時間分辨率在頻帶單元中被適當(dāng)?shù)乜刂?,以表示頻域中的信號的預(yù)定的一個 或預(yù)定的幾個子帶。此外,域變換單元1020使用虛數(shù)來產(chǎn)生將應(yīng)用到聲學(xué)模 型的信號。這種變換方法的示例是FV-MLT。
域變換單元1020包括第一域變換單元1023和第二域逆變換單元1026。
第一域變換單元1023將從帶劃分單元IOIO接收的低頻帶信號從時域變 換到頻域,并隨后將信號劃分為子帶單元。這里,第一域變換單元1023根據(jù) 第一變換方法將低頻帶信號從時域變換到頻域,并根據(jù)不同于第一變換方法 的第二變換方法將低頻帶信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到低頻 帶信號。使用根據(jù)第一變換方法變換的信號對低頻帶信號進(jìn)行編碼,使用根 據(jù)第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到低頻帶信號。聲學(xué)模型表示 關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。
例如,第一域變換單元1023可通過將MDCT用作第一變換方法將低頻 帶信號變換到頻域來使用實數(shù)表示低頻帶信號,并通過將MDST用作第二變 換方法將低頻帶信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使 用MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使 用MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。 因此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。第二域逆變換單元1026根據(jù)第一變換方法的逆變換方法將由第一域變
換單元1023變換到頻域的預(yù)定的一個或預(yù)定的幾個子帶從頻域逆變換到時 域。例如,第二域逆變換單元1026執(zhí)行作為第一變換方法的逆變換方法的 IMDCT。
模式確定單元1030確定在頻域中對由第一域變換單元1023變換到頻域 的低頻帶信號的每個子帶進(jìn)行編碼是否合適。換句話說,模式確定單元1030 確定在頻域還是在時域中對低頻帶信號的每個子帶進(jìn)行編碼。另外,模式確 定單元1030對指示由模式確定單元1030為每個子帶確定的域的標(biāo)識符進(jìn)行 量化,并隨后將量化結(jié)果輸出到復(fù)用單元1070。
當(dāng)模式確定單元1030確定是否在頻域中對每個子帶進(jìn)行編碼時,可使用 與頻域相應(yīng)的并從第一域變換單元1023接收的信號以及與時域相應(yīng)的并從 帶劃分單元IOIO接收的信號中的一個或兩者。
第二域逆變換單元1026根據(jù)第一變換方法的逆變換方法將多個子帶中 的由模式確定單元820確定不在頻域中編碼的子帶從頻域逆變換到時域。例 如,第二域逆變換單元1026通過執(zhí)行IMDCT來逆變換子帶。
時域編碼單元1040在時域中對由第二域逆變換單元1026逆變換到時域 的子帶的 一個或多個信號進(jìn)行編碼。
被確定不在頻域中編碼的子帶的信號不僅可由時域編碼單元1040在時 域中進(jìn)行編碼,還可由頻域編碼單元1050在頻域中進(jìn)行編碼。因此,不僅可 在時域中對預(yù)定的子帶進(jìn)行編碼,還可在頻域中對預(yù)定的子帶進(jìn)行編碼。在 這種情況下,表示預(yù)定的子帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo) 識符被量化,隨后,量化的結(jié)果被輸出到復(fù)用單元1070。
頻域編碼單元1050在頻域中對由模式確定單元1030確定在頻域中進(jìn)行 編^碼的子帶進(jìn)行編碼??扇鐖D2或圖3中所示來構(gòu)建頻域編碼單元1050。
高頻帶編碼單元1060通過使用低頻帶信號對從帶劃分單元IOIO接收的 高頻帶信號進(jìn)行編碼。
復(fù)用單元1070通過對由立體聲編碼單元IOOO量化的參數(shù)、對指示已經(jīng) 對每個子帶進(jìn)行編碼的域的標(biāo)識符量化的結(jié)果、由時域編碼單元1040編碼的 結(jié)果、由頻域編碼單元1050編碼的結(jié)果以及由高頻帶編碼單元850編碼的結(jié) 果進(jìn)行復(fù)用來產(chǎn)生比特流,并隨后經(jīng)由輸出端子OUT輸出比特流。這里,頻 域編碼單元1050的編碼結(jié)果表示由量化單元220對重要譜分量量化的結(jié)果和由噪聲處理單元230對剩余譜分量量化的結(jié)果(見圖2),或由語音工具編 碼單元300編碼的結(jié)果、由量化單元330對重要語分量量化的結(jié)果和由噪聲 處理單元340對剩余譜分量量化的結(jié)果(見圖3 )。
圖11是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和成語音信號解碼設(shè) 備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1100、頻域解碼單元 1110和第二域逆變換單元1120。
解復(fù)用單元IIOO經(jīng)由輸入端子IN接收來自編碼端(未示出)的比特流 并對所述比特流解復(fù)用。這里,從解復(fù)用單元IIOO輸出的比特流的解復(fù)用結(jié) 果包括對編碼終端在頻域中編碼的重要譜分量量化的結(jié)果和對剩余譜分量的 噪聲等級量化的結(jié)果。此外,比特流的解復(fù)用結(jié)果還包括使用語音工具編碼 的結(jié)果。
頻域解碼單元1110對從解復(fù)用單元IIOO接收的由編碼端在頻域中編碼 的結(jié)果進(jìn)行解碼。更具體地,頻域解碼單元1110對從每個子帶選擇的重要譜 分量以及剩余譜分量的噪聲等級進(jìn)行解碼。可如圖12或圖13所示構(gòu)造頻域 解碼單元1110。
圖12是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的包括在圖11的音頻和/或語 音信號解碼設(shè)備中的頻域解碼單元1110的框圖。頻域解碼單元1110包括反 量化單元1200和噪聲解碼單元1210。
反量化單元1200經(jīng)由輸入端子IN1接收反量化重要鐠分量的結(jié)果并隨后 將其反量化,其中,重要語分量被使用不同數(shù)量的比特分別進(jìn)行編碼,所述 比特通過應(yīng)用聲學(xué)模型而被分配,聲學(xué)模型去除由人類聽覺特征引起的感知 冗余。這里,聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。
噪聲解碼單元1210經(jīng)由輸入端子IN2接收除了重要譜分量之外的剩余譜 分量的噪聲等級的解復(fù)用結(jié)果,并隨后對其解碼。另外,噪聲解碼單元1210 將解碼的噪聲等級與由反量化單元1200反量化的重要譜分量進(jìn)行組合。噪聲 解碼單元1210經(jīng)由輸出端子OUT1輸出組合的結(jié)果。
圖13是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的包括在圖11的音頻和/ 或語音信號解碼設(shè)備中的頻域解碼單元1110的框圖。頻域解碼單元1110包 括反量化單元1300、噪聲解碼單元1310和語音工具解碼單元1320。
反量化單元1300經(jīng)由輸入端子IN3接收反量化重要諳分量的結(jié)果并隨后 將其反量化,其中,重要譜分量被使用不同數(shù)量的比特分別進(jìn)行編碼,所述
25比特通過應(yīng)用聲學(xué)模型而被分配,聲學(xué)模型去除由人類聽覺特征引起的感知 冗余。
噪聲解碼單元1310經(jīng)由輸入端子IN4接收除了重要譜分量之外的剩余譜 分量的噪聲等級的解復(fù)用結(jié)果,并隨后對其解碼。另外,噪聲解碼單元1310 將解碼的噪聲等級與由反量化單元1300反量化的重要譜分量進(jìn)行組合。
語音工具解碼單元1320經(jīng)由輸入終端IN5接收由編碼端(未示出)通過 使用語音工具編碼的結(jié)果,并隨后對其解碼。另外,語音工具解碼單元1320 將語音工具解碼單元1320解碼的結(jié)果與噪聲解碼單元1310組合的結(jié)果進(jìn)行 組合。這里,語音工具解碼單元1320經(jīng)由輸出端子OUT2輸出組合的結(jié)果。
參照圖11,第二域逆變換單元1120根據(jù)第二逆變換方法將由頻域解碼 單元1100解碼的結(jié)果從頻域逆變換到時域。這里,第二逆變換方法是上述第 二變換方法的逆操作。第二逆變換方法的示例是IMDCT (修正的離散余弦逆 變換)。另外,第二域逆變換單元1120經(jīng)由輸出端子OUT輸出逆變換的結(jié)果。 例如,第二域逆變換單元1120通過執(zhí)行IMDCT將作為在圖12的噪聲解碼單 元1210的輸出端子0UT1接收的組合結(jié)果的信號以及作為在圖13的語音工 具解碼單元1320的輸出端子OUT2接收的組合結(jié)果的信號從頻域逆變換到時 域。
圖14是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1400、模式確定 單元1410、頻域解碼單元1420、時域解碼單元1430和域變換單元1440。
解復(fù)用單元1400經(jīng)由輸入端子IN從編碼端(未示出)接收比特流并隨 后對比特流解復(fù)用。從解復(fù)用單元1400輸出的對比特流解復(fù)用的結(jié)果包括關(guān) 于對每個子帶已經(jīng)進(jìn)行編碼的域的信息、由編碼端在頻域中對預(yù)定子帶編碼 的結(jié)果以及編碼端在時域中對預(yù)定子帶編碼的結(jié)果。
這里,在頻域中編碼的結(jié)果可包括重要譜分量的量化結(jié)果和剩余語分量 的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工具編 碼的結(jié)果。
模式確定單元1410讀取從解復(fù)用單元1400接收的關(guān)于對每個子帶已經(jīng) 進(jìn)行編碼的域的信息,并隨后確定每個子帶已經(jīng)在頻域中還是在時域中被編碼。
頻域解碼單元1420在頻域中對由才莫式確定單元1410確定在頻域中已經(jīng)被編碼的一個或更多子帶進(jìn)行解碼。更具體地,頻域解碼單元1420對從每個
子帶選擇的重要諳分量和剩余譜分量的噪聲等級進(jìn)行解碼??扇鐖D12或圖 13所示構(gòu)造頻域解碼單元1420。
時域解碼單元1430在時域中對由模式確定單元1410確定在時域中巳經(jīng) 被編碼的一個或更多子帶進(jìn)行解碼。
可能的是,即使編碼端確定特定子帶在時域中被編碼時,所述特定子帶 也可以在頻域和時域兩者中凈皮編碼。頻域解碼單元1420在頻域中對特定子帶 的編碼結(jié)果進(jìn)行解碼,時域解碼單元1430在時域中對特定子帶的編碼結(jié)果進(jìn) 行解碼。
域變換單元1440將時域解碼單元1430解碼的結(jié)果從時域變換到頻域, 并將頻域解碼單元1420解碼的結(jié)果與從時域解碼單元1430接收的信號變換 到頻域的結(jié)果組合,并隨后將組合結(jié)果從頻域變換到時域。
這里,域變換單元1440可被實施為執(zhí)行接收以預(yù)定的帶單元劃分的多個 信號以及在時域或頻域中表示信號并隨后將信號變換到時域的各種變換方 法。這種變換方法的示例是FV-MLT。
域變換單元1440包括第二域變換單元1443和第二域逆變換單元1446。
第二域變換單元1443根據(jù)第二變換方法將由時域解碼單元1430解碼的 信號從時域變換到頻域。例如,第二變換方法可以是MDCT。
第二域變換單元1443變換的子帶的信號進(jìn)行組合,并隨后根據(jù)第二逆變換方 法將組合結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的 逆操作,可以是IMDCT。第二域逆變換單元1446經(jīng)由輸出端子OUT輸出逆 變換的結(jié)果。
圖15是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1500、頻域解碼 單元1510、第二域逆變換單元1520和立體聲解碼單元1530。
解復(fù)用單元1500經(jīng)由輸入端子IN從編碼端(未示出)比特流并對比特 流解復(fù)用。從解復(fù)用單元IIOO輸出的對比特流解復(fù)用的結(jié)果包括編碼端在頻 域中編碼的結(jié)果和用于將單信號上混頻到立體聲信號的參數(shù)。在頻域中編碼 的結(jié)果包含重要語分量的量化結(jié)果和剩余語分量的噪聲等級的量化結(jié)果。此 外,比特流的復(fù)用結(jié)果還可包括使用語音工具編碼的結(jié)果。頻域解碼單元1510在頻域中對從解復(fù)用單元1500 4矣收的由編碼端編碼的結(jié)果進(jìn)行解碼。更具體地,頻域解碼單元1510對從每個子帶選擇的重要i普 分量和剩余譜分量的噪聲等級進(jìn)行解碼??扇鐖D12或圖13所示構(gòu)造頻域解 碼單元1510。第二域逆變換單元1520根據(jù)第二逆變換方法將由頻域解碼單元1510解 碼的結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的逆操 作。第二逆變換方法的示例是IMDCT。立體聲解碼單元1530通過使用用于上混頻的參數(shù)來將由第二域逆變換 單元1520逆變換的單信號上混頻到立體聲信號。參數(shù)的示例包括兩個信道的 能量等級之間的差或兩個信道之間的相關(guān)性或相千性。立體聲解碼單元1530 經(jīng)由輸出端子OUT輸出上混頻的立體聲信號。圖16是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1600、模式確定 單元1610、頻域解碼單元1620、時域解碼單元1630、域變換單元1640和立 體聲解碼單元1650。解復(fù)用單元1600經(jīng)由輸入端子IN從編碼端(未示出)接收比特流并對 比特流解復(fù)用。這里,從解復(fù)用單元1600輸出的解復(fù)用結(jié)果包括關(guān)于對每個 子帶已經(jīng)進(jìn)行編碼的域的信息、由編碼端在頻域中對預(yù)定子帶編碼的結(jié)果、 編碼端在時域中對預(yù)定子帶編碼的結(jié)果以及將單信號上混頻到立體聲信號的 參數(shù)。這里,在頻域中編碼的結(jié)果可包括重要譜分量的量化結(jié)果和剩余譜分量 的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工具編 碼的結(jié)果。模式確定單元1610讀取從解復(fù)用單元1600接收的關(guān)于對每個子帶已經(jīng) 進(jìn)行編碼的域的信息,并隨后確定每個子帶已經(jīng)在頻域中還是在時域中被編 碼。頻域解碼單元1620在頻域中對由模式確定單元1610確定在頻域中已經(jīng) 被編碼的一個或更多子帶進(jìn)行解碼。更具體地,頻域解碼單元1620對從每個 子帶選擇的重要譜分量和剩余譜分量的噪聲等級進(jìn)行解碼??扇鐖D12或圖 13所示構(gòu)造頻域解碼單元1620。時域解碼單元1630在時域中對由模式確定單元1610確定在時域中已經(jīng)28被編碼的一個或更多子帶進(jìn)行解碼??赡艿氖牵词咕幋a端確定特定子帶在時域中被編碼時,所述特定子帶 也可以在頻域和時域兩者中被編碼。頻域解碼單元1620在頻域中對特定子帶的編碼結(jié)果進(jìn)行解碼,時域解碼單元1630在時域中對特定子帶的編碼結(jié)果進(jìn) 行解碼。域變換單元1640將時域解碼單元1630的解碼結(jié)果從時域變換到頻域, 并將頻域解碼單元1620解碼的結(jié)果與從時域解碼單元1630接收的信號變換 到頻域的結(jié)果組合,并隨后將組合結(jié)果從頻域變換到時域。這里,域變換單元1640可被實施為執(zhí)行接收以預(yù)定的帶單元劃分的多個法。這種變換方法的示例是FV-MLT。域變換單元1640包括第二域變換單元1643和第二域逆變換單元1646。第二域變換單元1643根據(jù)第二變換方法將由時域解碼單元1630解碼的 信號從時域變換到頻域。例如,第二變換方法可以是MDCT。第二域逆變換單元1646將由頻域解碼單元1620解碼的子帶的信號與由 第二域變換單元1643變換的子帶的信號進(jìn)行組合,并隨后根據(jù)第二逆變換方 法將組合結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的 逆操作,可以是IMDCT。立體聲解碼單元1650通過使用用于將單信號上混頻到立體聲信號的參 數(shù)來將由第二域逆變換單元1646逆變換的單信號上混頻到立體聲信號。參數(shù) 的示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干 性。另外,立體聲解碼單元1650經(jīng)由輸出端子OUT輸出上混頻的立體聲信圖17是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1700、頻域解碼 單元1710、高頻帶解碼單元1720、第二域逆變換單元1730和帶混頻器1740。解復(fù)用單元1700經(jīng)由輸入端子IN從編碼端(未示出)4妻收比特流并對 比特流解復(fù)用。這里,從解復(fù)用單元noo輸出的對比特流解復(fù)用的結(jié)果包括 由編碼端在頻域中編碼的結(jié)果和用于使用低頻帶信號對高頻帶信號進(jìn)行解碼 的信息。在頻域中編碼的結(jié)果包含重要譜分量的量化結(jié)果和剩余譜分量的噪 聲等級的量化結(jié)果。此外,對比特流解復(fù)用的結(jié)果還可包括使用語音工具編碼的結(jié)果。頻域解碼單元1710對從解復(fù)用單元1700接收的由編碼端在頻域中編碼 的結(jié)果進(jìn)行解碼。更具體地,頻域解碼單元1710對從每個子帶選擇的重要譜 分量和剩余鐠分量的噪聲等級進(jìn)行解碼??扇鐖D12或圖13所示構(gòu)造頻域解 碼單元1710。第二域逆變換單元1730根據(jù)第二逆變換方法將由頻域解碼單元1710解 碼的結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的逆操 作。第二逆變換方法的示例是IMDCT。高頻帶解碼單元1720從解復(fù)用單元1700接收用于使用^^頻帶信號對高 頻帶信號進(jìn)行解碼的信息,并隨后^f吏用低頻帶信號產(chǎn)生高頻帶信號。帶混頻器1740將由第二域逆變換單元1730逆變換的低頻帶信號與由高 頻帶解碼單元1720產(chǎn)生的高頻帶信號進(jìn)行混頻。隨后,帶混頻器1740經(jīng)由 輸出端子OUT輸出混頻的結(jié)果。圖18是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1800、模式確定 單元1810、頻域解碼單元1820、時i^戈解碼單元1830、域變換單元1840、高 頻帶解碼單元1850和帶混頻器1860。解復(fù)用單元1800經(jīng)由輸入端子IN從編碼端(未示出)接收比特流并對 比特流解復(fù)用。這里,從解復(fù)用單元1800輸出的對比特流解復(fù)用的結(jié)果包括 關(guān)于對每個子帶已經(jīng)進(jìn)行編碼的域的信息、由編碼端在頻域中對預(yù)定子帶編碼的結(jié)果、編碼端在時域中對預(yù)定子帶編碼的結(jié)果以及用于使用低頻帶信號 對高頻帶信號進(jìn)行解碼的信息。這里,在頻域中編碼的結(jié)果可包括重要語分量的量化結(jié)果和剩余譜分量 的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工具編 碼的結(jié)果。模式確定單元1810讀取從解復(fù)用單元1800接收的關(guān)于對每個子帶已經(jīng) 進(jìn)行編碼的域的信息,并隨后確定每個子帶已經(jīng)在頻域中還是在時域中被編 碼。頻域解碼單元1820在頻域中對由模式確定單元1810確定在頻域中已經(jīng) 被編碼的一個或更多子帶進(jìn)行解碼。更具體地,頻域解碼單元1820對從每個 子帶選擇的重要譜分量和剩余語分量的噪聲等級進(jìn)行解碼??扇鐖D12或圖13所示構(gòu)造頻域解碼單元1820。時域解碼單元1830在時域中對由模式確定單元1810確定在時域中已經(jīng)被編碼的一個或更多子帶進(jìn)行解碼??赡艿氖牵词咕幋a端確定特定子帶在時域中被編碼時,所述特定子帶也可以在頻域和時域兩者中被編碼。頻域解碼單元1420在頻域中對特定子帶 行解碼。域逆變換單元1840將時域解碼單元1830解碼的結(jié)果從時域變換到頻域, 并將頻域解碼單元1820解碼的結(jié)果與從時域解碼單元1830接收的信號變換 到頻域的結(jié)果組合,并隨后將組合結(jié)果從頻域變換到時域。這里,域變換單元1840可被實施為執(zhí)行接收以預(yù)定的帶單元劃分的多個 信號以及在時域或頻域中表示信號并隨后將信號變換到時域的各種變換方 法。這種變換方法的示例是FV-MLT。域變換單元1840包括第二域變換單元1843和第二域逆變換單元1846。第二域變換單元1843根據(jù)第二變換方法將由時域解碼單元1830解碼的 信號從時域變換到頻域。例如,第二變換方法可以是MDCT。第二域變換單元1843變換的子帶的信號進(jìn)行組合,并隨后根據(jù)第二逆變換方 法將組合結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的 逆操作,可以是IMDCT。高頻帶解碼單元1850從解復(fù)用單元1800接收用于使用低頻帶信號對高 頻帶信號進(jìn)行解碼的信息,并隨后使用低頻帶信號產(chǎn)生高頻帶信號。帶混頻器1860將由第二域逆變換單元1846逆變換的低頻帶信號與由高 頻帶解碼單元1850產(chǎn)生的高頻帶信號進(jìn)行組合。隨后,帶混頻器1860經(jīng)由 輸出端子OUT輸出組合的結(jié)果。圖19是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元1900、頻域解碼 單元1910、第二域逆變換單元1920、高頻帶解碼單元1930、帶混頻器1940 和立體聲解碼單元1950。解復(fù)用單元1900經(jīng)由輸入端子IN從編碼端(未示出)接收比特流并對 比特流解復(fù)用。這里,從解復(fù)用單元1900輸出的對比特流解復(fù)用的結(jié)果包括31由編碼端在頻域中編碼的結(jié)果、用于使用低頻帶信號對高頻帶信號進(jìn)行解碼 的信息以及用于將單信號上混頻到立體聲信號的參數(shù)。在頻域中編碼的結(jié)果 包含重要譜分量的量化結(jié)果和剩余譜分量的噪聲等級的量化結(jié)果。此外,對 比特流解復(fù)用的結(jié)果還可包括使用語音工具編碼的結(jié)果。頻域解碼單元1910對從解復(fù)用單元1900接收的由編碼端在頻域中編石馬 的結(jié)果進(jìn)行解碼。更具體地,頻域解碼單元1910對從每個子帶選擇的重要i普 分量和剩余語分量的噪聲等級進(jìn)行解碼??扇鐖D12或圖13所示構(gòu)造頻域解 碼單元1910。第二域逆變換單元1920根據(jù)第二逆變換方法將由頻域解碼單元1910解 碼的結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的逆操 作。第二逆變換方法的示例是IMDCT。高頻帶解碼單元1930從解復(fù)用單元1900接收用于使用低頻帶信號對高 頻帶信號進(jìn)行解碼的信息,并隨后使用低頻帶信號產(chǎn)生高頻帶信號。帶混頻器940將由第二域逆變換單元1920逆變換的低頻帶信號與由高 頻帶解碼單元1930產(chǎn)生的高頻帶信號進(jìn)行混頻。立體聲解碼單元1950通過使用從解復(fù)用單元1900接收的用于將單信號 上混頻到立體聲信號的參數(shù)來將從帶混頻器1940接收的單信號上混頻到立 體聲信號。參數(shù)的示例包括兩個信道的能量等級之間的差或兩個信道之間的 相關(guān)性或相干性。另外,立體聲解碼單元1930經(jīng)由輸出端子OUT輸出上混 頻的立體聲信號。圖20是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼設(shè)備的框圖。音頻和/或語音信號解碼設(shè)備包括解復(fù)用單元2000、模式確定 單元2010、頻域解碼單元2020、時域解碼單元2030、域逆變換單元2040、 高頻帶解碼單元2050、帶混頻器2060和立體聲解碼單元2070。解復(fù)用單元2000經(jīng)由輸入端子IN從編碼端(未示出)比特流并對比特 流解復(fù)用。這里,從解復(fù)用單元2000輸出的解復(fù)用的結(jié)果包括關(guān)于對每個子 帶已經(jīng)進(jìn)行編碼的域的信息、由編碼端在頻域中對預(yù)定子帶編碼的結(jié)果、編 碼端在時域中對預(yù)定子帶編碼的結(jié)果以及用于使用低頻帶信號對高頻帶信號 進(jìn)行解碼的信息。這里,在頻域中編碼的結(jié)果可包括重要譜分量的量化結(jié)果和剩余譜分量 的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工具編32說明書第28/48頁碼的結(jié)果。模式確定單元2010讀取從解復(fù)用單元2000接收的關(guān)于對每個子帶已經(jīng)碼。頻域解碼單元2020在頻域中對由模式確定單元2010確定在頻域中已經(jīng) 被編碼的一個或更多子帶進(jìn)行解碼。更具體地,頻域解碼單元2020對乂人每個 子帶選擇的重要譜分量和剩余譜分量的噪聲等級進(jìn)行解碼。可如圖12或圖 13所示構(gòu)造頻域解碼單元2020。時域解碼單元2030在時域中對由^t式確定單元2010確定在時域中已經(jīng) 被編碼的一個或更多子帶進(jìn)行解碼??赡艿氖?,即使編碼端確定特定子帶在時域中被編碼時,所述特定子帶 也可以在頻域和時域兩者中被編碼。頻域解碼單元2020在頻域中對特定子帶 的編碼結(jié)果進(jìn)行解碼,時域解碼單元2030在時域中對特定子帶的編碼結(jié)果進(jìn) 行解碼。域逆變換單元2040將時域解碼單元2030解碼的結(jié)果從時域變換到頻域, 并將頻域解碼單元2020解碼的結(jié)果與從時域解碼單元2030接收的信號變換 到頻域的結(jié)果組合,并隨后將組合結(jié)果從頻域變換到時域。信號以及在時域或頻域中表示信號并隨后將信號變換到時域的各種變換方法。這種變換方法的示例是FV-MLT。域變換單元2040包括第二域變換單元2043和第二域逆變換單元2046。 第二域變換單元2043根據(jù)第二變換方法將由時域解碼單元2030解碼的信號從時域變換到頻域。例如,第二變換方法可以是MDCT。第二域變換單元2043變換的子帶的信號進(jìn)行組合,并隨后根據(jù)第二逆變換方 法將組合結(jié)果從頻域逆變換到時域。第二逆變換方法是上述第二變換方法的 逆操作,可以是IMDCT。高頻帶解碼單元2050從解復(fù)用單元2000接收用于使用低頻帶信號對高 頻帶信號進(jìn)行解碼的信息,并隨后使用低頻帶信號產(chǎn)生高頻帶信號。帶混頻器2060將由第二域逆變換單元2046逆變4灸的4氐頻帶信號與由高 頻帶解碼單元2050產(chǎn)生的高頻帶信號進(jìn)行混頻。立體聲解碼單元2070通過使用從解復(fù)用單元2000接收的用于將單信號 上混頻到立體聲信號的參數(shù)來將從帶混頻器2060接收的單信號上混頻到立 體聲信號。參數(shù)的示例包括兩個信道的能量等級之間的差或兩個信道之間的 相關(guān)性或相干性。另外,立體聲解碼單元2070經(jīng)由輸出端子OUT輸出上混 頻的立體聲信號。圖21是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號編碼方 法的流程圖。首先,將輸入信號從時域變換到頻域,并隨后劃分為子帶單元 (操作2100)。在操作2100,根據(jù)第一變換方法將輸入信號從時域變換到頻 域,并根據(jù)不同于第一變換方法的第二變換方法將輸入信號從時域變換到頻 域,以將聲學(xué)模型應(yīng)用到輸入信號。使用根據(jù)第一變換方法變換的信號對輸 入信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信號以將聲學(xué)模型應(yīng)用到輸 入信號。例如,在操作2100,可根據(jù)作為第一變換方法的MDCT通過將輸入信 號變換到頻域來使用實數(shù)表示輸入信號,并根據(jù)作為第二變換方法的MDST 通過將輸入信號變換到頻域來使用虛數(shù)表示輸入信號。這里,作為使用MDCT 的結(jié)果的使用實數(shù)表示的信號用于對輸入信號進(jìn)行編碼,作為使用MDST的 結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到輸入信號。因此,由于還 可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT,并隨后對 MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。接下來,從在操作2100中根據(jù)第一變換方法變換的信號的每個子帶選擇 重要譜分量,量化選擇的分量,提取除了重要譜分量的剩余譜分量,并隨后 計算并量化剩余譜分量的噪聲等級(操作2110)??扇鐖D22或圖23所示執(zhí) 行操作2110。圖22是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的圖21中示出的編碼方法的 操作2110的流程圖。首先,將聲學(xué)模型應(yīng)用到輸入信號以去除由人類聽覺特征引起的感知冗 余。這里,聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。在操作2200,通過應(yīng)用使用人類聽覺系統(tǒng)的聲學(xué)才莫型來省略低敏感度特 殊信息,并以頻率單元分配指示感知強(qiáng)度的信號掩蔽比(SMR)。在操作2200, 通過使用根據(jù)第二變換方法變換的信號來應(yīng)用聲學(xué)模型。第二變換方法的示 例是MDST。在操作2200之后,從在頻域中表示的信號的每個子帶選擇重要譜分量 (操作2205 )。在這種情況下,可使用各種方法以選擇重要語分量。第一, 計算信號的SMR,隨后,如果SMR大于掩蔽值的倒數(shù),則確定信號為重要 語分量。第二,通過在考慮預(yù)定權(quán)重的情況下提取譜A奪來選擇重要譜分量。 第三,計算每個子帶的信號噪聲比(SNR),隨后,從具有小SNR的子帶中選擇峰值等于或大于預(yù)定值的譜分量??蓡为殘?zhí)行上述三種方法,或者可執(zhí) 行三種方法中的一種或至少兩種的組合。接下來,使用在操作2200分配的SMR來對在操作2205選擇的重要譜 分量進(jìn)行量化(操作2210)。在操作2210之后,從在頻域中表示的信號提取除了在操作2205選擇的 重要譜分量之外的剩余譜分量,并隨后計算并量化剩余譜分量的噪聲等級(操 作2220 )。圖23是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的圖21中示出的音頻和/ 或語音信號編碼方法的操作2110的流程圖。首先,通過將信號劃分為短變換長度來對被確定為強(qiáng)攻擊信號的信號進(jìn) 行精確編碼(操作2300)。在操作2300之后,將聲學(xué)模型應(yīng)用到輸入信號以去除由人類聽覺特征弓1 起的感知冗余(操作2305 )。在操作2305,通過應(yīng)用使用人類聽覺系統(tǒng)的聲學(xué)才莫型省略低敏感度特殊 信息,并在改變SMR時以頻率單元分配指示感知強(qiáng)度的SMR。在操作2305, 通過使用根據(jù)第二變換方法變換的信號來應(yīng)用聲學(xué)模型。第二變換方法的示 例是MDST。在操作2305之后,從在頻域中表示的信號的每個子帶選擇重要語分量 (操作2310)。在這種情況下,可使用各種方法以選4奪重要譜分量。第一, 計算信號的SMR,隨后,如果SMR大于掩蔽值的倒數(shù),則確定信號為重要 譜分量。第二,通過在考慮預(yù)定權(quán)重的情況下提取譜^峰來選擇重要譜分量。 第三,計算每個子帶的信號噪聲比(SNR),隨后,從具有小SNR的子帶中 選擇峰值等于或大于預(yù)定值的語分量。可單獨執(zhí)行上述三種方法,或者可執(zhí) 行三種方法中的一種或至少兩種的組合。隨后,使用在^t喿作2305中分配的SMR來對在^t喿作2310中選擇的重要 譜分量進(jìn)行量化。在操作2320之后,從在頻域中表示的信號提取除了在操作2310中選擇 的重要譜分量之外的剩余譜分量,并隨后以子帶單元計算并量化剩余譜分量 的噪聲等級(操作2330 )。這里,可通過執(zhí)行線性預(yù)測分析來計算噪聲等級。使用自相關(guān)方法執(zhí)行 線性預(yù)測分析,但也可使用協(xié)方差方法或Durbin方法執(zhí)行線性預(yù)測分析。線 性預(yù)測允許編碼單元預(yù)測在當(dāng)前幀中存在的噪聲分量的量。如果存在較多噪 聲分量,則剩余譜分量被直接發(fā)送而不改變它們的噪聲等級。如果存在較少 的噪聲分量并且存在較多的音調(diào)分量,則通過減小剩余譜分量的噪聲等級來 發(fā)送剩余譜分量。另外,在指示噪聲快速改變的小窗口的情況下,通過另外 減小剩余譜分量的噪聲等級來發(fā)送剩余譜分量。接下來,參照圖21,在操作2110編碼的結(jié)果被復(fù)用為比特流(操作2120 )。 在操作2110編碼的結(jié)果包括圖22示出的在操作2210對重要譜分量量化的 結(jié)果和在操作2220對剩余譜分量量化的結(jié)果,或包括圖23示出的在操作2300 編碼的結(jié)果、在操作2320對重要譜分量量化的結(jié)果和在操作2330對剩余譜 分量量化的結(jié)果。圖24是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖。首先,將輸入信號從時域變換到頻:威,并隨后劃分為子帶 單元(操作2400)。在操作2400,根據(jù)第一變換方法將輸入信號從時域變換 到頻域,并根據(jù)不同于第一變換方法的第二變換方法將輸入信號從時域變換 到頻域,以將聲學(xué)模型應(yīng)用到輸入信號。使用根據(jù)第一變換方法變換的信號 對輸入信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信號以將聲學(xué)模型應(yīng)用 到輸入信號。例如,在操作2400,可根據(jù)作為第一變換方法的MDCT通過將輸入信 號變換到頻域來使用實數(shù)表示輸入信號,并根據(jù)作為第二變換方法的MDST 通過將輸入信號變換到頻域來使用虛數(shù)表示輸入信號。這里,作為使用MDCT 的結(jié)果的使用實數(shù)表示的信號用于對輸入信號進(jìn)行編碼,作為使用MDST的 結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到輸入信號。因此,由于還 可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT,并隨后對 MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng) 的掩蔽反應(yīng)的數(shù)學(xué)模型。接下來,確定在頻域中對在操作2400變換到頻域的信號的每個子帶進(jìn)行36編碼是否合適(操作2410)。換句話說,在操作2410,基于預(yù)定的基準(zhǔn)確定 在頻域還是在時域中對變換到頻域的信號的每個子帶進(jìn)行編碼。另外,在操 作2410,對指示在此確定的每個子帶的域的標(biāo)識符進(jìn)行量化。在搡作2410,可使用在搡作2400變換到頻域的信號和與時域相應(yīng)的輸 入信號中的一個或兩者,以確定是否將在頻域中對預(yù)定子帶編碼。如果在操作2410確定將在頻域中對預(yù)定子帶編碼,則在頻域中對其進(jìn)行 編碼(操作2420 )。如圖22或圖23所示執(zhí)行操作2420。如果在操作2410確定將不在頻域中對預(yù)定子帶編碼,則根據(jù)第一變換方 法的逆變換方法將其從頻域逆變換到時域(操作2430 )。例如,第一變換方 法的逆變換方法可以是IMDCT。操作2400和操作2430可被實施為執(zhí)行接收在時域中表示的信號以及在 時域和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈 活的方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的 時間分辨率在頻帶單元中被適當(dāng)?shù)乜刂?,以表示頻域中的信號的預(yù)定的一個 或預(yù)定的幾個子帶。此外,使用虛數(shù)應(yīng)用到聲學(xué)模型的信號被產(chǎn)生。這種變 換方法的示例是F V-MLT。接下來,在時域中對在操作2430中以子帶單元被逆變換到時域的信號進(jìn) 行編碼(操作2440 )。可能的是,即使在操作2410確定特定子帶不在頻域中被編碼時,所述特 定子帶的信號可以在頻域和時域兩者中被編碼。因此, 一個或更多預(yù)定的子 帶不僅在時域中被編碼,還在頻域中被編碼。在這種情況下,指示預(yù)定的子 帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識符:陂量化。在操作2420或操作2440之后,將指示對每個子帶進(jìn)行編碼的域的標(biāo)識 符的量化結(jié)果、操作2440編碼的結(jié)果以及在操作2420編碼的結(jié)果復(fù)用為比 特流(操作2450)。操作2420的編碼結(jié)果包括圖22示出的在操作2210對 重要鐠分量量化的結(jié)果和在操作2220對剩余譜分量量化的結(jié)果,或包括圖 23示出的在操作2300編碼的結(jié)果、在操作2320對重要譜分量量化的結(jié)果和 在操作2330對剩余譜分量量化的結(jié)果。圖25是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖。首先,如果輸入信號是立體聲信號,則分析輸入信號以提 取參數(shù),并隨后對輸入信號下混頻(操作2500)。在操作2500提取的參數(shù)指說明書第33/48頁示解碼單元將從編碼單元接收的單信號上混頻到立體聲信號所需的信息。參 數(shù)的示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干 性。另外,在操作2500對提取的參數(shù)進(jìn)行量化。將在操作2500下混頻的信號從時域變換到頻域,并隨后將信號劃分為子 帶單元(操作2510)。在操作2510,根據(jù)第一變換方法將在操作2500下混頻 的信號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換方法將輸 入信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到輸入信號。使用根據(jù)第一變 換方法變換的信號對輸入信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信號 以將聲學(xué)模型應(yīng)用到輸入信號。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng) 的數(shù)學(xué)模型。例如,在操作2510,根據(jù)用作為第一變換方法的MDCT通過將輸入信 號變換到頻域來使用實數(shù)表示輸入信號,并根據(jù)用作為第二變換方法的 MDST通過將輸入信號變換到頻域來使用虛數(shù)表示輸入信號。這里,作為使 用MDCT的結(jié)果的^f吏用實數(shù)表示的信號用于對輸入信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到輸入信號。因此, 由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT,并隨 后對MDCT系凄t進(jìn)4亍量化,從而避免發(fā)生失配。接下來,從操作2100中根據(jù)第一變換方法變換的信號的每個子帶選擇重 要譜分量,并量化選擇的分量,提取除了重要譜分量之外的剩余譜分量,并 隨后計算并量化剩余譜分量的噪聲等級(操作2520)??扇鐖D22或圖23中 所示來執(zhí)行操作2520。接下來,在操作2500提取的參數(shù)和在操作2520量化的結(jié)果被復(fù)用為比 特流(操作2530)。在操作2520的編碼結(jié)果包括圖22示出的在搡作2210 對重要譜分量量化的結(jié)果和在操作2220對剩余譜分量量化的結(jié)果,或包括圖 23示出的在操作2300編碼的結(jié)果、在操作2320對重要譜分量量化的結(jié)果和 在操作2330對剩余譜分量量化的結(jié)果。圖26是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖。首先,如果輸入信號是立體聲信號,則分析輸入信號以提 取參數(shù),并隨后對輸入信號下混頻(操作2600)。在操作2600提取的參數(shù)指 示解碼單元將從編碼單元接收的單信號上混頻到立體聲信號所需的信息。參 數(shù)的示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干38性。另外,在操作2600對提取的參數(shù)進(jìn)行量化。將在操作2600下混頻的信號從時域變換到頻域,并隨后將信號劃分為子 帶單元(操作2610 )。在操作2610,根據(jù)第一變換方法將在操作2600下混頻 的信號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換方法將在 操作2600下混頻的信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到輸入信號。 使用根據(jù)第 一 變換方法變換的信號對輸入信號進(jìn)行編碼,使用根據(jù)第二變換 方法變換的信號以將聲學(xué)模型應(yīng)用到輸入信號。例如,在操作2610,根據(jù)用作為第一變換方法的MDCT通過將輸入信 號變換到頻域來使用實數(shù)表示輸入信號,并根據(jù)用作為第二變換方法的 MDST通過將輸入信號變換到頻域來使用虛數(shù)表示輸入信號。這里,作為使 用MDCT的結(jié)果的使用實數(shù)表示的信號用于對輸入信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到輸入信號。因此, 由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT,并隨 后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。聲學(xué)模型表示關(guān)于人類聽覺 系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。接下來,確定在頻域中對在操作2610變換到頻域的信號的每個子帶進(jìn)行 編碼是否合適(4喿作2610)。換句話說,在操作2620,基于預(yù)定的基準(zhǔn)確定 在頻域還是在時域中對變換到頻域的信號的每個子帶進(jìn)行編碼。另外,在操 作2620,對指示在此確定的每個子帶的域的標(biāo)識符進(jìn)行量化。在操作2620,可使用在操作2610變換到頻域的信號和在操作2600被下 混頻的與時域相應(yīng)的輸入信號中的一個或兩者,以確定是否將在頻域中對預(yù) 定子帶編碼。如果在操作2620確定將在頻域中對每個子帶編碼,則在頻域中對其進(jìn)行 編碼(操作2630 )。如圖22或圖23所示執(zhí)行操作2630。如果在操作2620確定將不在頻域中對每個子帶編碼,則根據(jù)第一變換方 法的逆變換方法將其從頻域逆變換到時域(操作2640)。例如,第一變換方 法的逆變換方法可以是IMDCT。操作2610和操作2640可被實施為接收在時域中表示的信號以及在時域 和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈活的 方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的時間 分辨率在頻帶單元中被適當(dāng)?shù)乜刂疲员硎绢l域中的信號的預(yù)定的一個或預(yù)定的幾個子帶。此外,使用虛數(shù)應(yīng)用到聲學(xué)模型的信號被產(chǎn)生。這種變換方法的示例是FV-MLT。接下來,在時域中對在操作2640中以子帶單元被逆變換到時域的信號進(jìn) 行編碼(操作2640 )。可能的是,即使在操作2620確定特定子帶不在頻域中被編碼,所述特定 子帶的信號也可以在頻域和時域兩者中被編碼。因此, 一個或更多預(yù)定的子 帶不僅在時域中被編碼,還在頻域中被編碼。在這種情況下,指示預(yù)定的子 帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識符凈皮量化。在操作2630或操作2650之后,將指示已經(jīng)對每個子帶進(jìn)行編碼的域的 標(biāo)識符的量化結(jié)果、操作2600編碼的結(jié)果、操作2630編碼的結(jié)果以及操作 2650編碼的結(jié)果復(fù)用為比特流。操作2630編碼的結(jié)果包括圖22示出的在 操作2210對重要譜分量量化的結(jié)果和在操作2220對剩余譜分量量化的結(jié)果, 或包括圖23示出的在操作2300編碼的結(jié)果、在操作2320對重要譜分量量化 的結(jié)果和在操作2330對剩余譜分量量化的結(jié)果。圖27是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖。首先,基于預(yù)定頻率將輸入信號劃分為低頻帶信號和高頻 帶信號(操作2700 )。隨后,將在操作2700獲得的低頻帶信號從時域變換到頻域,并隨后將其 劃分為子帶單元(操作2710)。在操作2700,根據(jù)第一變換方法將低頻帶信 號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換方法將低頻帶 信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到低頻帶信號。使用根據(jù)第一變 換方法變換的信號對低頻帶信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信 號以將聲學(xué)模型應(yīng)用到低頻帶信號。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽 反應(yīng)的數(shù)學(xué)模型。例如,在操作2710,可通過根據(jù)作為第一變換方法的MDCT將輸入信 號變換到頻域來使用實數(shù)表示低頻帶信號,并通過根據(jù)作為第二變換方法的 MDST將輸入信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。40接下來,從操作2710中根據(jù)第一變換方法變換的信號的每個子帶中選擇 重要譜分量,并量化選擇的分量,提取除了重要譜分量之外的剩余譜分量,并隨后計算并量化編碼剩余譜分量的噪聲等級(操作2720)。可如圖22或圖 23中所示來4丸行操作2720。使用低頻帶信號對在操作2700獲得的高頻帶信號進(jìn)行編碼(操作2730 )。 隨后,將操作2720編碼的結(jié)果、操作2730編碼的結(jié)果以及用于使用低 頻帶信號對高頻帶信號進(jìn)行解碼的信息復(fù)用為比特流(操作2740 )。操作2720 編碼的結(jié)果包括圖22示出的在操作2210對重要語分量量化的結(jié)果和在操 作2220對剩余譜分量量化的結(jié)果,或包括圖23示出的在操作2300編碼的結(jié) 果、在操作2320對重要譜分量量化的結(jié)果和在操作2330對剩余譜分量量化 的結(jié)果。圖28是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖。首先,基于預(yù)定頻率將輸入信號劃分為低頻帶信號和高頻 帶信號(操作2800 )。隨后,將在操作2800獲得的低頻帶信號從時域變換到頻域,并隨后將其 劃分為子帶單元(操作2810)。在操作2810,根據(jù)第一變換方法將低頻帶信 號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換方法將低頻帶 信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到低頻帶信號。使用根據(jù)第一變 換方法變換的信號對低頻帶信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信 號以將聲學(xué)模型應(yīng)用到低頻帶信號。例如,在操作2810,可通過根據(jù)作為第一變換方法的MDCT將輸入信 號變換到頻域來使用實數(shù)表示低頻帶信號,并通過根據(jù)作為第二變換方法的 MDST將輸入信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。聲學(xué)模型表示關(guān)于人類 聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。接下來,確定在頻域中對在操作2810變換到頻域的信號的每個子帶進(jìn)行 編碼是否合適(操作2820 )。換句話說,在操作2820,基于預(yù)定的基準(zhǔn)確定 在頻域還是在時域中對變換到頻域的信號的每個子帶進(jìn)行編碼。另外,在操作2820,對指示在此確定的每個子帶的域的標(biāo)識符進(jìn)行量化。在操作2820,可使用在操作2810變換到頻域的信號和與時域相應(yīng)的低 頻帶信號中的一個或兩者,以確定是否將在頻域中對預(yù)定子帶編碼。如果在操作2820確定將在頻域中對每個子帶編碼,則在頻域中對其進(jìn)行 編碼(操作2830 )。如圖22或圖23所示執(zhí)行操作2830。如果在操作2820確定將不在頻域中對每個子帶編碼,則根據(jù)第一變換方 法的逆變換方法將其從頻域逆變換到時域(操作2840)。例如,第一變換方 法的逆變換方法可以是IMDCT。操作2810和操作2840可被實施為接收在時域中表示的信號以及在時域 和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈活的 方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的時間 分辨率在頻帶單元中被適當(dāng)?shù)乜刂?,以表示頻域中的信號的預(yù)定的一個或預(yù)定的幾個子帶。此外,使用虛數(shù)應(yīng)用到聲學(xué)模型的信號被產(chǎn)生。這種變換方 法的示例是FV-MLT。接下來,在時域中對在操作2840中以子帶單元被逆變換到時域的信號進(jìn) 行編碼(操作2850)??赡艿氖?,即使在操作2820確定特定子帶不在頻域中被編碼時,所述特 定子帶的信號也可以在頻域和時域兩者中被編碼。因此, 一個或更多預(yù)定的 子帶不僅在時域中被編碼,還在頻域中被編碼。在這種情況下,指示預(yù)定的 子帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識符被量化。使用低頻帶信號對在操作2800獲得的高頻帶信號進(jìn)行編碼(操作2860 )。在操作2830或操作2850之后,將指示對每個子帶進(jìn)行編碼的域的標(biāo)識 符的量化結(jié)果、操作2830編碼的結(jié)果、操作2850編碼的結(jié)果以及用于使用 低頻帶信號對高頻帶信號進(jìn)行解碼的信息復(fù)用為比特流(操作2870)。操作 2830編碼的結(jié)果包括圖22示出的在操作2210對重要譜分量量化的結(jié)果和 在搡作2220對剩余語分量量化的結(jié)果,或包括圖23示出的在操作2300編碼 的結(jié)果、在操作2320對重要語分量量化的結(jié)果和在操作2330對剩余譜分量 量化的結(jié)果。圖29是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編 碼方法的流程圖。首先,如果輸入信號是立體聲信號,則分析輸入信號以提 取參數(shù),并隨后對輸入信號下混頻(操作2900)。在操作2900提取的參數(shù)指示解碼單元將從編碼單元接收的單信號上混頻到立體聲信號所需的信息。參 數(shù)的示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干 性。另外,在操作2900對提取的參數(shù)進(jìn)行量化。隨后,基于預(yù)定頻率將在操作2900下混頻的信號劃分為低頻帶信號和高 頻帶信號(操作2910)。隨后,將在操作2910獲得的低頻帶信號從時域變換到頻域,并隨后將其 劃分為子帶單元(操作2920)。在操作2920,根據(jù)第一變換方法將低頻帶信 號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換方法將低頻帶 信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到低頻帶信號。使用根據(jù)第一變換方法變換的信號對低頻帶信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信 號以將聲學(xué)模型應(yīng)用到低頻帶信號。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。例如,在操作2920,可通過根據(jù)作為第一變換方法的MDCT將輸入信 號變換到頻域來使用實數(shù)表示低頻帶信號,并通過根據(jù)作為第二變換方法的 MDST將輸入信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。接下來,從搡作2920中變換到頻域的信號的每個子帶中選擇重要譜分 量,并量化選擇的分量,提取除了重要譜分量之外的剩余譜分量,并隨后計 算并量化剩余譜分量的噪聲等級(操作2930 )。可如圖22或圖23中所示來 執(zhí)行操作2930。接下來,使用低頻帶信號對在操作2910獲得的高頻帶信號進(jìn)行編碼(操 作2940 )。接下來,將操作2900中參數(shù)量化的結(jié)果、操作2930編碼的結(jié)果以及操 作2940編碼的結(jié)果復(fù)用為比特流。這里,操作2930編碼的結(jié)果包括圖22 示出的在操作2210對重要譜分量量化的結(jié)果和在操作2220對剩余譜分量量 化的結(jié)果,或包括圖23示出的在操作2300編碼的結(jié)果、在操作2320對重要 譜分量量化的結(jié)果和在操作2330對剩余譜分量量化的結(jié)果。圖30是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號編43碼方法的流程圖。首先,如果輸入信號是立體聲信號,則分析輸入信號以提取參數(shù),并隨后對輸入信號下混頻(操作3000)。在操作3000提取的參數(shù)指 示解碼單元將從編碼單元接收的單信號上混頻到立體聲信號所需的信息。參數(shù)的示例包括兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干 性。另外,在操作3000對提取的參數(shù)進(jìn)行量化。接下來,基于預(yù)定頻率將在操作3000下混頻的信號劃分為低頻帶信號和 高頻帶信號(操作3010)。隨后,將在操作3010獲得的低頻帶信號從時域變換到頻域,并隨后將其 劃分為子帶單元(操作3020)。在操作3020,根據(jù)第一變換方法將低頻帶信 號從時域變換到頻域,并根據(jù)不同于第一變換方法的第二變換方法將低頻帶 信號從時域變換到頻域,以將聲學(xué)模型應(yīng)用到低頻帶信號。使用根據(jù)第一變 換方法變換的信號對低頻帶信號進(jìn)行編碼,使用根據(jù)第二變換方法變換的信 號以將聲學(xué)模型應(yīng)用到低頻帶信號。例如,在操作3020,可通過根據(jù)作為第一變換方法的MDCT將輸入信 號變換到頻域來使用實數(shù)表示低頻帶信號,并通過根據(jù)作為第二變換方法的 MDST將輸入信號變換到頻域來使用虛數(shù)表示低頻帶信號。這里,作為使用 MDCT的結(jié)果的使用實數(shù)表示的信號用于對低頻帶信號進(jìn)行編碼,作為使用 MDST的結(jié)果的使用虛數(shù)表示的信號用于將聲學(xué)模型應(yīng)用到低頻帶信號。因 此,由于還可表示輸入信號的相位信息,故對與時域相應(yīng)的信號執(zhí)行DFT, 并隨后對MDCT系數(shù)進(jìn)行量化,從而避免發(fā)生失配。聲學(xué)模型表示關(guān)于人類 聽覺系統(tǒng)的掩蔽反應(yīng)的數(shù)學(xué)模型。接下來,確定在頻域中對在操作3020變換到頻域的信號的每個子帶進(jìn)行 編碼是否合適(操作3030)。換句話說,在操作3030,基于預(yù)定的基準(zhǔn)確定 在頻域還是在時域中對變換到頻域的信號的每個子帶進(jìn)行編碼。另外,在操 作3030,對指示在此確定的每個子帶的域的標(biāo)識符進(jìn)行量化。在操作3030,可使用在操作3020變換到頻域的信號和在操作3020變換 的與時域相應(yīng)的低頻帶信號中的一個或兩者,以確定是否將在頻域中對預(yù)定 子帶編碼。如果在操作3020確定將在頻域中對每個子帶編碼,則在頻域中對其進(jìn)行 編碼(操作3040 )。如圖22或圖23所示執(zhí)行操作3040。如果在操作3020確定將不在頻域中對每個子帶編碼,則根據(jù)第一變換方法的逆變換方法將其從頻域逆變換到時域(操作3050 )。例如,第一變換方 法的逆變換方法可以是IMDCT。操作3020和操作3050可被實施為接收在時域中表示的信號以及在時域 和頻域兩者中表示信號的各種變換方法。更具體地,各種變換方法是靈活的 方法,在這些方法中,在時域中表示的信號被變換到頻域,隨后信號的時間 分辨率在頻帶單元中被適當(dāng)?shù)乜刂疲员硎绢l域中的信號的預(yù)定的一個或預(yù) 定的幾個子帶。此外,使用虛數(shù)應(yīng)用到聲學(xué)模型的信號被產(chǎn)生。這種變換方 法的示例是FV-MLT。接下來,在時域中對在操作3050中以子帶單元被逆變換到時域的信號進(jìn) 行編碼(操作3060 )。可能的是,即使在操作3050確定特定子帶不在頻域中被編碼時,所述特 定子帶的信號也可以在頻域和時域兩者中^^皮編碼。因此, 一個或更多預(yù)定的 子帶不僅在時域中^L編碼,還在頻域中被編碼。在這種情況下,指示預(yù)定的 子帶的信號已經(jīng)在時域和頻域兩者中進(jìn)行編碼的標(biāo)識符被量化。使用低頻帶信號對在操作3010獲得的高頻帶信號進(jìn)行編碼(操作3070 )。隨后,將操作3000中量化的參數(shù)、指示對每個子帶進(jìn)行編碼的域的標(biāo)識 符的量化結(jié)果、操作3040編碼的結(jié)果、操作3060編碼的結(jié)果以及用于使用 低頻帶信號對高頻帶信號進(jìn)行解碼的信息復(fù)用為比特流(操作3080)。操作 3080編碼的結(jié)果包括圖22示出的在操作2210對重要譜分量量化的結(jié)果和 在操作2220對剩余譜分量量化的結(jié)果,或包括圖23示出的在操作2300編碼 的結(jié)果、在操作2320對重要譜分量量化的結(jié)果和在操作2330對剩余譜分量 量化的結(jié)果。圖31是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的音頻和/或語音信號解碼方 法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操作 3100)。操作3100中的解復(fù)用結(jié)果包括由編碼端對在頻域中編碼的重要譜分 量量化的結(jié)果;對剩余譜分量的噪聲等級量化的結(jié)果等。此外,解復(fù)用結(jié)果 還可包括使用語音工具編碼的結(jié)果。接下來,在頻域中對操作3100中被解復(fù)用的在頻域中的編碼結(jié)果進(jìn)行解 碼(操作3110)。更具體地,在操作3110,對從每個子帶選擇的重要譜分量 以及除了重要譜分量之外的剩余譜分量的噪聲等級進(jìn)行解碼??扇鐖D32或圖 33所示執(zhí)行操作3110。圖32是示出根據(jù)本發(fā)明總體構(gòu)思的實施例的圖31中示出的音頻和/或語 音信號解碼方法的操作3110的流程圖。首先,通過應(yīng)用聲學(xué)模型對使用分配的不同數(shù)量的比特被分別進(jìn)行編碼的重要譜分量的解復(fù)用結(jié)果進(jìn)行反量化(操作3200),其中,聲學(xué)模型去除 由人類聽覺特征引起的感知冗余。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反 應(yīng)的數(shù)學(xué)模型。接下來,對在操作3200中反量化的除了重要譜分量之外的剩余譜分量的 噪聲等級的解復(fù)用結(jié)果進(jìn)行解碼(操作3210)。另外,在操作3210,將解碼 的噪聲等級與在操作3200中解碼的重要譜分量進(jìn)行組合。圖33是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的圖31中示出的音頻和/ 或語音信號解碼方法的搡作3110的流程圖。首先,通過應(yīng)用聲學(xué)模型對使用分配的不同數(shù)量的比特^f皮分別進(jìn)行編碼 的重要譜分量的解復(fù)用結(jié)果進(jìn)行反量化(操作3300 ),其中,聲學(xué)模型去除 由人類聽覺特征引起的感知冗余。聲學(xué)模型表示關(guān)于人類聽覺系統(tǒng)的掩蔽反 應(yīng)的數(shù)學(xué)模型。接下來,對在操作3300中反量化的除了重要譜分量之外的剩余譜分量的 噪聲等級的解復(fù)用結(jié)果進(jìn)行解碼(操作3310)。另外,在操作3310,將解碼 的噪聲等級與在操作3200中解碼的重要譜分量進(jìn)行組合。在操作3310之后,編碼單元通過使用語音工具編碼的結(jié)果的解復(fù)用結(jié)果 被解碼(操作3320 )。另外,在操作3320,在操作3320的解碼結(jié)果與在操作 3310的混頻結(jié)果進(jìn)行組合。接下來,根據(jù)第二逆變換方法將操作3110解碼的結(jié)果從頻域逆變換到時 域(操作3120)。這里,第二逆變換方法是上述第二變換方法的逆操作。第 二逆變換方法的示例是IMDCT。例如,在操作3120,通過使用IMDCT將圖 32的操作3200中混頻的結(jié)果從頻域逆變換到時域,通過使用IMDCT將圖 33的搡作3320中混頻的結(jié)果從頻域逆變換到時域。圖34是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操 作3400)。操作3400中的解復(fù)用結(jié)果包括關(guān)于對每個子帶已經(jīng)進(jìn)行編碼的域 的信息、由編碼端在頻域中對預(yù)定子帶編碼的結(jié)果以及編碼端在時域中對預(yù) 定子帶編碼的結(jié)果。這里,編碼終端在頻域中編碼的結(jié)果包括重要譜分量的量化結(jié)果和剩余 譜分量的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音 工具編碼的結(jié)果。接下來,讀取關(guān)于對在操作3400解復(fù)用的每個子帶已經(jīng)進(jìn)行編碼的域的 信息,以確定每個子帶已經(jīng)在頻域中還是在時域中被編碼(操作3410)。如果在操作3410確定已經(jīng)在頻域中對一個或多個子帶編碼,則在頻域中 對子帶進(jìn)行解碼(操作3420)。更具體地,在操作3420,從每個子帶選擇的 重要譜分量被解碼,除了重要譜分量之外的剩余譜分量的噪聲等級被解碼。 可如圖32或圖33所示執(zhí)行操作3420。如果在操作3410確定已經(jīng)在時域中對一個或多個子帶編碼,則在時域中 對子帶進(jìn)行編碼(操作3430 )。在預(yù)定的一個或預(yù)定的幾個子帶的情況下,即使確定特定子帶在時域中 被編碼,所述特定子帶也可以在頻域和時域兩者中被編碼。在這種情況下, 不僅在時域中的特定子帶的編碼結(jié)果被解碼,而且在頻域中的特定子帶的編 碼結(jié)果被解碼。接下來,根據(jù)第二變換方法將操作3430解碼的結(jié)果從時域變換到頻域 (操作3440 )。第二變換方法的示例是MDCT。接下來,將在操作3420解碼的子帶的信號與在操作3440變換的結(jié)果的 信號進(jìn)行組合,并隨后根據(jù)第二逆變換方法將組合結(jié)果從頻域逆變換到時域 (搡作3450)。第二逆變換方法是上述第二變換方法的逆操作。第二逆變換 方法的示例是IMDCT。操作3440和操作3450可被實施為接收以預(yù)定的帶單元劃分并在時域或 頻域中表示的信號并隨后將信號變換到時域的各種變換方法。這種變換方法 的示例是FV-MLT。圖35是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操 作3500)。操作3500中解復(fù)用的結(jié)果包括編碼端在頻域中的編碼結(jié)果以及用 于將單信號上混頻到立體聲信號的參數(shù)。這里,編碼端在頻域中編碼的結(jié)果包括重要譜分量的量化結(jié)果和剩余譜分量的噪聲等級的量化結(jié)果。此外,在 頻域中編碼的結(jié)果可包括使用語音工具編碼的結(jié)果。接下來,在頻域中對在操作3500解復(fù)用的在頻域中的編碼結(jié)果進(jìn)行解47碼。更具體地,在操作3510,從子帶選擇的重要譜分量和除了重要譜分量之外的剩余譜分量的噪聲等級被解碼??扇鐖D32或圖33所示執(zhí)行操作3510。 接下來,根據(jù)第二逆變換方法將操作3510解碼的結(jié)果從頻域逆變換到時域(操作3520)。這里,第二逆變換方法是上述第二變換方法的逆操作。第二逆變換方法的示例是IMDCT。通過使用用于將單信號上混頻到立體聲信號的參數(shù)來將作為操作3520的逆變換結(jié)果的單信號上混頻到立體聲信號(操作3530)。參數(shù)的示例是兩圖36是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操 作3600)。操作3600中解復(fù)用的結(jié)果包括關(guān)于對每個子帶已經(jīng)進(jìn)行編碼的域 的信息、編碼端在頻i^中對預(yù)定子帶編碼的結(jié)果以及編碼端在時域中對預(yù)定 子帶編碼的結(jié)果。這里,編碼端在頻域中編碼的結(jié)果包括重要譜分量的量化結(jié)果和剩余譜 分量的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工 具編碼的結(jié)果。接下來,讀取關(guān)于對在操作3400解復(fù)用的每個子帶已經(jīng)進(jìn)行編碼的域的 信息,以確定每個子帶已經(jīng)在頻域中還是在時域中被編碼(操作3610)。如果在操作3610確定已經(jīng)在頻域中對一個或多個子帶編碼,則在頻域中 對子帶進(jìn)行編碼(操作3620)。更具體地,在操作3620,從每個子帶選擇的 重要譜分量被解碼,除了重要諳分量之外的剩余譜分量的噪聲等級被解碼。 可如圖32或圖33所示4丸行操作3620。如果在操作3610確定已經(jīng)在時域中對一個或多個子帶編碼,則在時域中 對子帶進(jìn)行解碼(操作3630)。在預(yù)定的一個或預(yù)定的幾個子帶的情況下,即使確定特定子帶在時域中 被編碼,所述特定子帶也可以已經(jīng)在頻域和時域兩者中被編碼。在這種情況 下,不僅在時域中的特定子帶的編碼結(jié)果被解碼,而且在頻域中的特定子帶 的編碼結(jié)果被解碼。接下來,根據(jù)第二變換方法將操作3630解碼的結(jié)果從時域變換到頻域 (操作3640)。第二變換方法的示例是MDCT。接下來,將在操作3620解碼的子帶的信號與在操作3640變換的結(jié)果的信號進(jìn)行組合,并隨后根據(jù)第二逆變換方法將組合結(jié)果從頻域逆變換到時域(操作3650)。第二逆變換方法是上述第二變換方法的逆操作。第二逆變換 方法的示例是IMDCT。操作3640和操作3650可被實施為接收以預(yù)定的帶單元劃分并在時域或 頻域中表示的信號并隨后將信號變換到時域的各種變換方法。這種變換方法 的示例是FV-MLT。以下,通過使用用于將單信號上混頻到立體聲信號的參數(shù)來將作為操作 3650的逆變換結(jié)果的單信號上混頻到立體聲信號(操作3660)。參數(shù)的示例 是兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。圖37是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操 作3700)。操作3700中解復(fù)用的結(jié)果包括編碼端在頻域中編碼的結(jié)果以及用 于通過使用低頻帶信號對高頻帶信號進(jìn)行解碼的信息。這里,編碼端在頻域 中編碼的結(jié)果包括重要譜分量的量化結(jié)果和剩余謙分量的噪聲等級的量化結(jié) 果。此外,在頻域中編碼的結(jié)果可包括"使用語音工具編碼的結(jié)果。接下來,在頻域中對在操作3700解復(fù)用的在頻域中編碼的結(jié)果進(jìn)行解碼 (操作3710)。更具體地,在操作3710,從子帶選擇的重要譜分量和除了重 要譜分量之外的剩余譜分量的噪聲等級被解碼??扇鐖D32或圖33所示執(zhí)行 操作3710。接下來,根據(jù)第二逆變換方法將操作3710解碼的結(jié)果從頻域逆變換到時 域(操作3520)。這里,第二逆變換方法是上述第二變換方法的逆操作。第 二逆變換方法的示例是IMDCT。隨后,基于用于通過使用低頻帶信號對高頻帶信號進(jìn)行解碼的信息來使 用作為操作3720逆變換的結(jié)果的低頻帶信號對高頻帶信號進(jìn)行解碼(操作 3730)。以下,將在操作3720中逆變換的低頻帶信號與在操作3730中解碼的高 頻帶信號進(jìn)行混頻(操作3740)。圖38是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(搡 作3800)。操作3800中解復(fù)用的結(jié)果包括關(guān)于對每個子帶已經(jīng)進(jìn)行編碼的域 的信息、編碼端在頻域中對預(yù)定子帶編碼的結(jié)果以及編碼端在時域中對預(yù)定子帶編碼的結(jié)果。這里,編碼端在頻域中編碼的結(jié)果包括重要語分量的量化結(jié)果和剩余譜 分量的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工 具編碼的結(jié)果。接下來,讀取關(guān)于對在操作3800解復(fù)用的每個子帶已經(jīng)進(jìn)行編碼的域的 信息,以確定每個子帶已經(jīng)在頻域中還是在時域中被編碼(操作3810)。如果在搡作3810確定已經(jīng)在頻域中對一個或多個子帶編碼,則在頻域中 對子帶進(jìn)行解碼(操作3820)。更具體地,在操作3820,從每個子帶選擇的 重要譜分量被解碼,除了重要譜分量之外的剩余譜分量的噪聲等級被解碼。 可如圖32或圖33所示^L行操作3820。如果在操作3810確定已經(jīng)在時域中對一個或多個子帶編碼,則在時域中 對子帶進(jìn)行解碼(操作3830)。在預(yù)定的一個或預(yù)定的幾個子帶的情況下,即使確定特定子帶在時域中 被編碼時,所述特定子帶可以已經(jīng)在頻域和時域兩者中被編碼。在這種情況 下,不僅在時域中的特定子帶的編碼結(jié)果被解碼,而且在頻域中的特定子帶 的編碼結(jié)果被解碼。接下來,根據(jù)第二變換方法將操作3830解碼的結(jié)果從時域變換到頻域 (操作3840)。第二變換方法的示例是MDCT。接下來,將在操作3820解碼的子帶的信號與在操作3840變換的結(jié)果的 信號進(jìn)行組合,并隨后根據(jù)第二逆變換方法將組合結(jié)果從頻域逆變換到時域 (操作3850)。第二逆變換方法是上述第二變換方法的逆操作。第二逆變換 方法的示例是IMDCT。操作3840和操作3850可被實施為接收以預(yù)定的帶單元劃分并在時域或 頻域中表示的信號并隨后將信號變換到時域的各種變換方法。這種變換方法 的示例是FV-MLT。隨后,基于用于通過使用低頻帶信號對高頻帶信號進(jìn)行解碼的信息來使 用在操作3800解復(fù)用的低頻帶信號對高頻帶信號進(jìn)行解碼(操作3860 )。以下,將在操作3850中逆變換的低頻帶信號與在操作3860中解碼的高 頻帶信號進(jìn)行組合(操作3870 )。圖39是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程國。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操作3900)。操作3900中解復(fù)用的結(jié)果包括編碼端在頻^^中編碼的結(jié)果、用于 通過使用低頻帶信號對高頻帶信號進(jìn)行解碼的信息以及用于將單信號上混頻 到立體聲信號的參數(shù)。這里,編碼端在頻域中編碼的結(jié)果包括重要譜分量的 量化結(jié)果和剩余譜分量的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果 可包括使用語音工具編碼的結(jié)果。接下來,在頻域中對在操作3900解復(fù)用的結(jié)果進(jìn)行解碼(操作3910)。 更具體地,在操作3910,從子帶選擇的重要譜分量和除了重要譜分量之外的 剩余譜分量的噪聲等級被解碼??扇鐖D32或圖33所示執(zhí)行操作3910。接下來,根據(jù)第二逆變換方法將操作3910解碼的結(jié)果從頻域逆變換到時 域(操作3520)。這里,第二逆變換方法是上述第二變換方法的逆操作。第 二逆變4奐方法的示例是IMDCT。隨后,基于用于通過使用低頻帶信號對高頻帶信號進(jìn)行解碼的信息來使 用在操作3900解復(fù)用的低頻帶信號對高頻帶信號進(jìn)行解碼(操作3930 )。以下,將在操作3920中逆變換的低頻帶信號與在操作3930中解碼的高 頻帶信號進(jìn)行混頻(操作3940 )。接下來,通過^f吏用用于將單信號上混頻到立體聲^f言號的參數(shù)來將作為操 作3940的混頻結(jié)果的單信號上混頻到立體聲信號(^t喿作3950 )。參數(shù)的示例 是兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。圖40是示出根據(jù)本發(fā)明總體構(gòu)思的另一實施例的音頻和/或語音信號解 碼方法的流程圖。首先,從編碼端接收比特流并隨后對所述比特流解復(fù)用(操 作4000)。操作4000中解復(fù)用的結(jié)果包括關(guān)于對每個子帶已經(jīng)進(jìn)行編碼的域 的信息、編碼端在頻域中對預(yù)定子帶編碼的結(jié)果以及編碼端在時域中對預(yù)定 子帶編碼的結(jié)果。這里,編碼端在頻域中編碼的結(jié)果包括重要譜分量的量化結(jié)果和剩余譜 分量的噪聲等級的量化結(jié)果。此外,在頻域中編碼的結(jié)果可包括使用語音工 具編碼的結(jié)果。接下來,讀取關(guān)于對在操作4000解復(fù)用的每個子帶已經(jīng)進(jìn)行編碼的域的 信息,以確定每個子帶已經(jīng)在頻域中還是在時域中—皮編碼(操作4010)。如果在操作4010確定已經(jīng)在頻域中對一個或多個子帶編碼,則在頻域中 對子帶進(jìn)行解碼(操作4020)。更具體地,在操作4020,從每個子帶選擇的 重要譜分量被解碼,除了重要譜分量之外的剩余諳分量的噪聲等級被解碼。51可如圖32或圖33所示執(zhí)行操作4020。如果在操作4010確定已經(jīng)在時域中對一個或多個子帶編碼,則在時i成中 對子帶進(jìn)行解碼(操作4030)。在預(yù)定的一個或預(yù)定的幾個子帶的情況下,即使確定特定子帶在時域中 被編碼,所述特定子帶也可以已經(jīng)在頻域和時域兩者中被編碼。在這種情況 下,不僅在時域中的特定子帶的編碼結(jié)果被解碼,而且在頻域中的特定子帶 的編碼結(jié)果被解碼。接下來,根據(jù)第二變換方法將操作4030解碼的結(jié)果從時域變換到頻域 (操作4040)。第二變換方法的示例是MDCT。接下來,將在操作4020解碼的子帶的信號與在操作4040變換的結(jié)果的 信號進(jìn)行組合,并隨后根據(jù)第二逆變換方法將組合結(jié)果從頻域逆變換到時域 (操作4050)。第二逆變換方法是上述第二變換方法的逆操作。第二逆變換 方法的示例是IMDCT。搡作4040和操作4050可被實施為接收以預(yù)定的帶單元劃分并在時域或 頻域中表示的信號并隨后將信號變換到時域的各種變換方法。這種變換方法 的示例是FV-MLT。隨后,基于用于通過使用低頻帶信號對高頻帶信號進(jìn)行解碼的信息來使 用作為在操作4000解復(fù)用的結(jié)果的低頻帶信號對高頻帶信號進(jìn)行解碼(操作 4060 )。接下來,將在操作4050中逆變形的低頻帶信號與在操作4060中解碼的 高頻帶信號進(jìn)行混頻(操作4070 )。以下,通過使用用于將單信號上混頻到立體聲信號的參數(shù)來將作為操作 4070的逆變換結(jié)果的單信號上混頻到立體聲信號(操作4080)。參數(shù)的示例 是兩個信道的能量等級之間的差或兩個信道之間的相關(guān)性或相干性。本發(fā)明總體構(gòu)思可被實施為計算機(jī)可讀介質(zhì)中的計算機(jī)可讀代碼,其中, 計算機(jī)包括具有信息處理功能的設(shè)備。計算機(jī)可讀介質(zhì)可以是能夠存儲作為 能夠被計算機(jī)系統(tǒng)讀取的程序的數(shù)據(jù)的任何記錄設(shè)備,諸如,只讀存儲器 (ROM)、隨機(jī)訪問存儲器(RAM)、光盤(CD) ROM、磁帶、軟盤、光學(xué) 數(shù)據(jù)存儲裝置等。另外,計算機(jī)可讀介質(zhì)可以是通過例如互聯(lián)網(wǎng)發(fā)送數(shù)據(jù)的 載波。根據(jù)本發(fā)明總體構(gòu)思的音頻和/或語音信號編碼和解碼方法和設(shè)備能夠?qū)φZ音信號、音頻信號以及語音信號和音頻信號的混頻信號進(jìn)行有效編碼或
解碼。另外,可使用少量比特來執(zhí)行編碼和解碼,從而提高聲音質(zhì)量??墒?用單編解碼器來執(zhí)行上述音頻和/或語音信號編碼和解碼方法和設(shè)備的編碼
和/或解碼操作。
雖然已經(jīng)具體示出和描述了本發(fā)明總體構(gòu)思的一些實施例,但是本領(lǐng)域 的普通技術(shù)人員應(yīng)該理解,在不脫離本發(fā)明總體構(gòu)思的原理和精神的情況下, 可以對這些實施例進(jìn)行改變,在權(quán)利要求及其等同物中限定本發(fā)明總體構(gòu)思 的范圍。
權(quán)利要求
1、一種對信號進(jìn)行編碼的方法,包括將輸入信號變換到至少一個域;使用預(yù)定的單元中的輸入信號或變換的信號確定將被編碼的域;以及對分配到確定的域中的單元的信號進(jìn)行編碼。
2、 如權(quán)利要求l所述的方法,其中,在所述域中,所述信號將被表示為 時域和頻域兩者。
3、 如權(quán)利要求l所述的方法,其中,所述域包括兩個或更多頻域。
4、 如權(quán)利要求1所述的方法,其中,對輸入信號進(jìn)行變換的步驟和對信 號進(jìn)行編碼的步驟中的 一個包括使用頻變調(diào)制重疊變換FV-MLT。
5、 如權(quán)利要求l所述的方法,其中,在所述域中,將在預(yù)定的單元中表 示所述信號。
6、 如權(quán)利要求l所述的方法,其中 輸入信號是低頻信號;所述方法還包括步驟通過使用低頻信號對高頻信號進(jìn)行編碼。
7、 如權(quán)利要求l所述的方法,其中 輸入信號是單信號;所述方法還包括步驟分析立體聲信號以提取參數(shù),將立體聲信號下混 頻到單信號。
8、 如權(quán)利要求1所述的方法,其中,使用預(yù)定的單元內(nèi)的輸入信號或變 換的信號確定將被編碼的域的步驟包括確定將在時域中被編碼的用于一個或 更多單元的一個或更多信號中的預(yù)定的一個或預(yù)定的幾個信號也將在頻域中 被編碼。
9、 如權(quán)利要求l所述的方法,其中,對分配到確定的域中的單元的信號 進(jìn)行編碼的步驟包括根據(jù)預(yù)定的條件從一個或更多單元的一個或更多信號選擇一個或更多譜 分量并隨后對選擇的語分量進(jìn)行編碼,所述信號將在頻域中被編碼;以及對除了從分配到一個或更多單元的信號選擇的譜分量之外的殘余譜分量 進(jìn)行編碼,所述信號^皮確定將在頻域中編碼。
10、 一種對信號進(jìn)行編碼的方法,包括確定一個或更多域,在所述域中將輸入信號編碼到預(yù)定的單元中;以及將分配到預(yù)定的各個單元的信號變換到確定的域,并隨后對變換的信號 進(jìn)行編碼。
11、 如權(quán)利要求IO所述的方法,其中,在所述域中,所述信號將被表示為時域和頻域兩者。
12、 如;k利要求IO所述的方法,其中,所述域包:fe兩個或更多頻域。
13、 如權(quán)利要求IO所述的方法,其中,在所述域中,將在預(yù)定的單元中 表示所述信號。
14、 如權(quán)利要求IO所述的方法,其中,輸入信號是低頻信號, 所述方法還包括步驟通過使用輸入信號對高頻信號進(jìn)行編碼。
15、 如權(quán)利要求IO所述的方法,其中,輸入信號是單信號,所述方法還包括步驟分析立體聲信號以提取參數(shù)并隨后將立體聲信號 下混頻到單信號。
16、 如權(quán)利要求IO所述的方法,其中,確定將以預(yù)定的單元進(jìn)行編碼的 一個或更多域的步驟包括確定將在時域中^^皮編碼的一個或更多單元的一個或 更多信號中的預(yù)定的一個或預(yù)定的幾個信號也將在頻域中被編碼。
17、 如權(quán)利要求IO所述的方法,其中,將預(yù)定的各個單元的信號變換到 確定的域并對變換的信號進(jìn)行編碼的步驟包括根據(jù)預(yù)定的條件從一個或更多單元的一個或更多信號選擇一個或更多譜 分量并隨后對選4奪的譜分量進(jìn)行編碼,所述信號被確定將在頻域中編碼;以 及.對除了從一個或更多單元的信號選擇的譜分量之外的殘余譜分量進(jìn)行編 碼,所述信號^C確定將在頻域中編碼。
18、 一種對信號進(jìn)行解碼的方法,包括確定多個域,在所述多個域中預(yù)定的單元的信號已經(jīng)被分別編碼; 分別對預(yù)定的域中的信號進(jìn)行解碼;以及 通過將解碼的信號組合來恢復(fù)原始信號。
19、 如權(quán)利要求18所述的方法,其中,在所述域中,所述信號將被表示 為時域和頻域兩者。
20、 如權(quán)利要求18所述的方法,其中,在所述域中,將在預(yù)定的單元中 表示所述信號。
21、 如權(quán)利要求18所述的方法,其中,對確定的域中的信號進(jìn)行解碼的 步驟包括使用頻變調(diào)制重疊變換FV-MLT。
22、 如權(quán)利要求18所述的方法,其中 恢復(fù)的信號是低頻信號;所述方法還包括步驟通過使用恢復(fù)的信號對高頻信號進(jìn)行解碼。
23、 如權(quán)利要求18所述的方法,其中 恢復(fù)的信號是單信號;所述方法還包括步驟對用于將單信號上混頻到立體聲信號的參數(shù)進(jìn)行 解碼;通過使用解碼的參數(shù)將恢復(fù)的信號上混頻到立體聲信號。
24、 如權(quán)利要求18所述的方法,其中,確定預(yù)定的單元的信號已經(jīng)被分 別編碼的多個域的步驟包括確定已經(jīng)在時域中被編碼的一個或更多單元的一 個或更多信號中的預(yù)定的一個或預(yù)定的幾個信號也已經(jīng)在頻域中被編碼。
25、 如權(quán)利要求18所述的方法,其中,分別對預(yù)定的域中的信號進(jìn)行解 碼的步驟包括對被確定為已經(jīng)在頻域中編碼的 一個或更多單元的 一個或更多譜分量進(jìn) 行解碼;以及對解碼的譜分量之外的殘余譜分量進(jìn)行解碼。
26、 一種對信號進(jìn)行編碼的設(shè)備,包括變換單元,將輸入信號變換到至少一個域并使用預(yù)定的單元中的輸入信 號或變換的信號確定將被編碼的域;和編碼單元,對分配到確定的域中的單元的信號進(jìn)行編碼。
27、 一種對信號進(jìn)行解碼的設(shè)備,包括解復(fù)用單元,確定多個域,在所述多個域中預(yù)定的單元的信號已經(jīng)被分 別編碼;解碼單元,分別對確定的域中的信號進(jìn)行解碼;和 變換單元,通過將解碼的信號組合來恢復(fù)原始信號。
28、 一種對信號進(jìn)行編碼和/或解碼的設(shè)備,包括編碼器,將輸入信號變換到至少一個域并使用預(yù)定的單元中的輸入信號 或變換的信號確定將被編碼的域,并且對分配到確定的域中的單元的信號進(jìn) 行編碼;和解碼器,確定編碼信號被分配的確定的域分別對確定的域中的信號進(jìn)4亍 解碼,通過將解碼的信號組合來恢復(fù)輸入信號。
全文摘要
一種對語音信號和/或音頻信號進(jìn)行編碼和/或解碼的方法和設(shè)備。所述設(shè)備包括第一域變換單元、頻域編碼單元和復(fù)用單元,用于對語音信號和/或音頻信號進(jìn)行編碼。所述設(shè)備包括解復(fù)用單元、頻域解碼單元和第二域逆變換單元,用于對語音信號和/或音頻信號進(jìn)行解碼。所述方法和設(shè)備能夠?qū)λ姓Z音信號、音頻信號以及語音信號和音頻信號的混頻信號進(jìn)行有效地編碼或解碼,并通過使用少量比特提高聲音的質(zhì)量。
文檔編號G10L19/00GK101583994SQ200780050101
公開日2009年11月18日 申請日期2007年11月16日 優(yōu)先權(quán)日2006年11月17日
發(fā)明者吳殷美, 孫昌用, 朱基峴, 金重會 申請人:三星電子株式會社