音頻編碼器,音頻解碼器,編碼與解碼音頻信號的方法及音頻設(shè)備的制作方法
【專利摘要】本發(fā)明涉及音頻編碼器和解碼器以及用于音頻編碼和解碼的方法。在編碼器中,優(yōu)選通過僅使用諸如混響時間和混響幅度的幾個參數(shù)的表示,將音頻信號分成無回聲信號部分和關(guān)于與音頻信號相關(guān)的混響場的信息。然后使用音頻編解碼器對無回聲信號進行編碼。在解碼器上,使用音頻編解碼器恢復(fù)無回聲信號部分,并且通過根據(jù)和混響場有關(guān)的信息來施加混響,優(yōu)選通過與基于混響場信息生成的房間脈沖響應(yīng)進行卷積,將所恢復(fù)的無回聲信號變換成基本上原始的音頻信號。根據(jù)本發(fā)明,所涉及的音頻編解碼器只需要能夠?qū)o回聲音頻信號進行編碼,從而解決參數(shù)音頻編解碼器對混響音頻信號提供差的性能的問題。
【專利說明】音頻編碼器,音頻解碼器,編碼與解碼音頻信號的方法及音 頻設(shè)備
[〇〇〇1] 本發(fā)明申請是一個分案申請,其原申請的國際申請日為2005年6月3日、申請?zhí)?為200580018839. 7,并且原申請的發(fā)明創(chuàng)造名稱為"音頻編碼器,音頻解碼器,編碼與解碼 音頻信號的方法及音頻設(shè)備"。 【技術(shù)領(lǐng)域】
[0002] 本發(fā)明涉及音頻信號編碼領(lǐng)域。尤其是,本發(fā)明涉及對混響音頻信號進行高效編 碼的領(lǐng)域。本發(fā)明涉及一種編碼器、一種解碼器、用于編碼和解碼的方法、一種編碼的音頻 信號、具有表示這種編碼信號的數(shù)據(jù)的存儲器和傳輸介質(zhì)以及具有編碼器和/或解碼器的 音頻設(shè)備。 【背景技術(shù)】
[0003] 混響是由在其中記錄聲音的環(huán)境例如音樂廳的音響效果引起的。它由相對于該環(huán) 境表面的反射構(gòu)成。因此,所記錄的聲音信號不僅包含直達"干(dry)"音頻信號,而且包含 一系列延遲和衰減的反射。即混響分量由直達"干"聲音的延遲和衰減的形式構(gòu)成,結(jié)果, 該混響分量與該直達信號相關(guān)。這里,"干"是指"無回聲的",即基本上不包含回聲或混響。
[0004] 實驗顯示,一些非透明的聲音編解碼器并不通過對具有大量混響的聲音信號進行 編碼而正確地運行,即這些編解碼器產(chǎn)生具有清楚可聽的人工產(chǎn)物(artefact)的聲音信 號。然而,相同的聲音編解碼器可以對具有非?;蚣兇?干"信號的聲音信號、即在無回聲 的環(huán)境中記錄的聲音信號或者不添加混響的人工創(chuàng)建的聲音運行良好。
[0005] 在許多應(yīng)用中,混響被認為是聲音信號的負面特性。例如,當語音包含混響時,自 動語音識別系統(tǒng)的性能會降級,并且在通信應(yīng)用中,混響對語音的可理解性和質(zhì)量產(chǎn)生消 極的影響。該問題的解決方案可以是從信號中除去混響,即去混響,并且這也在一些系統(tǒng)中 被實現(xiàn)(Basbug等人,2003),參見參考文獻的列表。
[0006] 然而,在高質(zhì)量的音頻編碼中,情形有所不同。音頻編碼爭取透明性,并因此也需 要對混響進行編碼。而且,在音樂中混響分量是信號的重要部分,并且具有該分量的音頻信 號比沒有該分量的信號更受歡迎,沒有該分量的信號聽起來"干"或單調(diào)乏味,并且該聲音 缺乏記錄環(huán)境的顯著個性。
[0007] 據(jù)本發(fā)明人所知,在現(xiàn)有技術(shù)中沒有采取專門的預(yù)防措施來對聲音信號的混響分 量進行編碼,這會導(dǎo)致質(zhì)量問題。
【發(fā)明內(nèi)容】
[0008] 可以視為本發(fā)明的目的的是,提供一種通過使用音頻編解碼器而能夠高質(zhì)量地處 理混響音頻信號的方法以及音頻編碼器和解碼器。
[0009] 根據(jù)本發(fā)明的第一方面,該目的通過提供一種適于對音頻信號進行編碼的音頻編 碼器而被履行,該音頻編碼器包括: -分離裝置,適于將音頻信號分為基本上無回聲的音頻信號和描述與該音頻信號相關(guān) 的混響場的信息, -編碼器裝置,適于將所述基本上無回聲的音頻信號編碼為第一編碼信號部分以及將 描述混響場的信息編碼為第二編碼信號部分。
[〇〇1〇] 該分離裝置用來將音頻信號分為無回聲的即"干"部分以及分為有關(guān)涉及該音頻 信號的混響方面的信息。換句話說,對該音頻信號進行去混響,并且提取描述與該音頻信號 相關(guān)的混響場的信息,即能夠基本上透明地再造混響的信息。
[0011] 該編碼器裝置分別地處理該"干"部分和混響部分。因此,有可能將用于編碼"干" 部分的音頻編解碼器應(yīng)用于第一編碼信號部分,同時可以根據(jù)適于描述混響的完全不同的 算法來編碼混響部分,例如對于在編碼器處基本上再造該信號的混響部分足夠精確的參數(shù) 描述。
[0012] 這減輕了音頻編解碼器編碼混響分量的任務(wù),從而解決了編碼混響聲音信號的問 題。作為替代,用于編碼混響音頻信號的混響部分的裝置可以包括基于例如使用非常有限 數(shù)目的參數(shù)的、原始音頻信號的混響部分的參數(shù)描述的混響算法。結(jié)果,參數(shù)編解碼器可以 單獨用來編碼非常適合這種編解碼器的"干"信號。由此,有可能與用于編碼混響音頻信號 的混響部分的裝置相結(jié)合來利用音頻編解碼器,基本上透明地編碼和解碼混響音頻信號。
[0013] 另外,與直接編碼混響聲音信號相比,編碼效率得到提高。這歸因于這樣的事實, 即根據(jù)第一方面的編碼器最大程度地利用通過混響場引入到聲音信號中的相關(guān)性,從而導(dǎo) 致更高的編碼效率。即,專門考慮混響部分中的冗余性。
[0014] 在一個實施例中,編碼器可以適于根據(jù)參數(shù)音頻編解碼器來編碼基本上無回聲的 音頻信號。例如(Schuijers等人,2003)。在另一優(yōu)選實施例中,分離裝置適于將Unoki 的去混響算法應(yīng)用于音頻信號,以便將其分為基本上無回聲的部分和描述混響場的信息。 Unoki的去混響算法被理解為在下述中描述的去混響原理:M. Unoki, M. Furukawa, K. Sakata 和 M. Akagi 的"A Method based on the MTF Concept for dereverberating the Power Envelope from the Reverberant Signal", in Proc. IEEE Int. Conf. on Acoust., Speech, Signal Processing, Hong Kong, China, April 6-19, Vol. I,pp. 840-843,2003。由此該論文被結(jié)合以供參考。
[0015] 本發(fā)明的第二方面提供一種音頻解碼器,其適于由具有第一和第二部分的編碼音 頻信號再生音頻信號,該音頻解碼器包括: -解碼器裝置,適于將第一編碼信號部分解碼為基本上無回聲的音頻信號,該解碼器 裝置還適于由第二編碼信號部分生成描述與該音頻信號相關(guān)的混響場的信息,以及 -變換裝置,適于基于描述混響場的信息來將混響添加到基本上無回聲的音頻信號 上。
[0016] 因此,根據(jù)第二方面的音頻解碼器適于解碼來自根據(jù)第一方面的音頻編碼器的編 碼信號,并從而構(gòu)成一個編碼器/解碼器系統(tǒng)。
[0017] 在解碼器裝置中重建"干"信號。然后基于混響信息通過變換裝置來將混響添加 至IJ "干"信號上。這從現(xiàn)有的人工混響發(fā)生器或房間模擬器可知,它們能夠基于幾個參數(shù)來 產(chǎn)生高音頻質(zhì)量的混響。該方法的特別優(yōu)點即在解碼器中添加混響在于,該混響屏蔽了解 碼的"干"信號中的一些潛在人工產(chǎn)物。
[0018] 優(yōu)選地,變換裝置包括用于將該再生的無回聲音頻信號與作為時間t的函數(shù)的脈 沖響應(yīng)h (t)進行卷積的裝置,其中h (t)基于第二編碼信號部分。
[0019] 優(yōu)選地,第二編碼信號部分包括下述的表示: -與音頻信號的混響時間相關(guān)的第一參數(shù)T,以及 -與音頻信號的混響幅度相關(guān)的第二參數(shù)A。
[0020] 該解碼器裝置可以適于根據(jù)參數(shù)音頻編解碼器來解碼第一編碼信號部分。
[0021] 在第三方面,本發(fā)明提供一種編碼音頻信號的方法,包括以下步驟: -將音頻信號分為基本上無回聲的部分和描述與該音頻信號相關(guān)的混響場的信息, -將所述音頻信號的基本上無回聲部分編碼為第一編碼信號, -將描述混響場的信息編碼為第二編碼信號。
[0022] 在第四方面,本發(fā)明提供一種解碼表示原始音頻信號的編碼音頻信號的方法,該 方法包括以下步驟: -將第一編碼信號部分解碼為第一音頻信號, -將第二編碼信號部分解碼為描述與原始音頻信號相關(guān)的混響場的信息,以及 -基于描述混響場的信息,通過添加混響來變換第一音頻信號,以便再生該原始音頻 信號。
[0023] 在第五方面,本發(fā)明提供一種表示原始音頻信號的編碼音頻信號,該編碼信號包 括: -第一部分,表示該原始音頻信號的基本上無回聲的部分,以及 -第二部分,表示有關(guān)與該原始音頻信號相關(guān)的混響場的信息。
[0024] 該編碼信號可以是具有根據(jù)標準數(shù)字音頻格式的格式的數(shù)字電信號。該信號可以 利用兩個音頻設(shè)備之間的電連接電纜來傳輸。然而,該編碼信號可以是無線信號,例如使用 射頻載波的空中傳播的信號,或者它可以是適于利用光纖傳輸?shù)墓庑盘枴?br>
[0025] 在第六方面,本發(fā)明提供一種存儲介質(zhì),包括表示根據(jù)第五方面的編碼音頻信號 的數(shù)據(jù)。該存儲介質(zhì)優(yōu)選是標準的音頻數(shù)據(jù)存儲介質(zhì),例如DVD、CD、可讀寫CD、小型光盤、 MP3盤、小型閃存,記憶棒等等。然而,它還可以是計算機數(shù)據(jù)存儲介質(zhì),例如計算機硬盤、計 算機存儲器、軟盤等等。
[0026] 在第七方面,本發(fā)明提供一種包括根據(jù)第一方面的音頻編碼器的音頻設(shè)備。
[0027] 在第八方面,本發(fā)明提供一種包括根據(jù)第二方面的音頻解碼器的音頻設(shè)備。
[0028] 根據(jù)第七和第八方面的優(yōu)選音頻設(shè)備是所有不同類型的磁帶、磁盤或基于存儲器 的音頻記錄器和播放器。例如:MP3播放器、DVD播放器以及用于計算機的音頻處理器等等。 另外,它對于移動電話會是有利的。 【專利附圖】
【附圖說明】
[0029] 在下文中參考附圖1對本發(fā)明進行更詳細的描述,附圖1說明了根據(jù)本發(fā)明的優(yōu) 選編碼器和解碼器的框圖。
[0030] 盡管本發(fā)明容易進行各種變型和替代形式,但是已經(jīng)通過附圖中的例子示出了特 定實施例,并將在此對其進行詳細描述。然而,應(yīng)當理解,本發(fā)明并不打算限于所公開的特 定形式。更確切地說,本發(fā)明要覆蓋落在如由所附權(quán)利要求書限定的本發(fā)明的精神和范圍 之內(nèi)的所有變型、等同和替代方案。 【具體實施方式】
[0031] 圖1示出了相對于信號流說明編碼器1和解碼器2的優(yōu)選實施例的原理的框圖。
[0032] 在編碼器1的輸入端IN接收音頻信號。首先,由混響提取器REV EXT處理該音頻 信號。此處,使用Unoki的去混響算法(Unoki等人,2003)對該音頻信號進行去混響。應(yīng)當 注意,對于單聲道信號,從混響音頻信號中提取混響分量并非是無足輕重的。然而,該提取 不必是完全的,并且增益可能已經(jīng)通過除去混響場部分而獲得。對于多聲道信號,已經(jīng)存在 良好的去混響算法。
[0033] 然后,在例如(Schuijers等人,2003)中描述的編碼器裝置ENC中的SSC編碼器 部分中對所得到的"干"信號進行編碼,同時該編碼器裝置ENC的另一部分對由混響提取器 REV EXT提取的混響部分進行編碼。來自編碼器1的輸出具有兩部分:第一部分是由編碼 器裝置ENC的SSC編碼器部分提供的比特流3,以及第二部分包括由混響提取器REV EXT提 供的兩個混響參數(shù)4,即所除去的原始音頻信號的混響部分的參數(shù)描述。優(yōu)選地,這兩個混 響參數(shù)4是混響時間Τ κ和混響幅度常數(shù)A,它們與原始音頻信號的混響部分相對于該音頻 信號的"干"部分的電平相關(guān),是房間混響脈沖響應(yīng)h (t)的非常簡短的描述。也可以在信 號的開始發(fā)送完整的房間混響脈沖響應(yīng)h (t),并且當需要時在信號期間進行更新;這也是 高效的,因為h (t)通常變化緩慢或者根本不變化。編碼器裝置ENC中對混響部分進行編 碼的編碼器部分高度依賴于由混響提取器REV EXT所傳送的混響部分的實際形式。在混響 提取器REV EXT僅傳送幾個混響參數(shù)的情況下,混響部分的編碼可以被說成是包含在提取 本身當中,從而編碼器裝置ENC可能不需要對從混響提取器REV EXT接收到的混響部分添 加進一步的編碼。
[0034] 解碼器2從編碼器1接收SSC編碼的信號3和兩個混響參數(shù)4。應(yīng)當理解,圖1僅 僅說明了編碼器/解碼器系統(tǒng)的原理。編碼信號3、4或表示這些信號3、4的數(shù)據(jù)通??梢?存儲在數(shù)據(jù)載體或存儲介質(zhì)上,例如用于MP3播放器的音頻盤等。
[0035] 在解碼器2中,由解碼器裝置DEC的SSC解碼器部分對SSC編碼的信號3進行解 碼,從而恢復(fù)基本上"干"的音頻信號。然后,將該恢復(fù)的"干"信號饋送給混響處理器REV。 該混響處理器REV還接收已經(jīng)由解碼器裝置DEC的另一部分解碼的兩個混響參數(shù)4,并且基 于這些參數(shù)4,混響處理器REV基于在這兩個混響參數(shù)4中所提取的混響信息生成脈沖響 應(yīng),即基于這兩個混響參數(shù)4創(chuàng)建房間脈沖響應(yīng)。通過與所生成的混響脈沖響應(yīng)進行卷積, 將原始音頻信號的混響部分施加給來自解碼器裝置DEC的SSC解碼器部分的所恢復(fù)"干"音 頻信號。因此將所恢復(fù)的"干"音頻信號變換為恢復(fù)的或者至少基本上恢復(fù)的原始音頻信 號。最終,在編碼器2的輸出端OUT提供此恢復(fù)的原始音頻信號。
[0036] 在混響處理器REV中生成的房間混響脈沖響應(yīng)h (t)優(yōu)選是下述的形式,其中t 表示時間:
【權(quán)利要求】
1. 一種適于編碼音頻信號的音頻編碼器(1 ),所述音頻編碼器(1)包括: -分離裝置,適于將所述音頻信號分為基本上無回聲的音頻信號和描述與所述音頻信 號相關(guān)的混響場的信息; -編碼器裝置,適于將所述基本上無回聲的音頻信號編碼為第一編碼信號部分(3)以 及將描述混響場的信息編碼為第二編碼信號部分(4),其中根據(jù)適于描述混響的算法來編 碼描述混響場的信息。
2. 根據(jù)權(quán)利要求1所述的音頻編碼器(1),其中所述分離裝置適于將Unoki的去混響 算法應(yīng)用于所述音頻信號,以便將所述音頻信號分為基本上無回聲的部分和描述混響場的 信息。
3. 根據(jù)權(quán)利要求1所述的音頻編碼器(1),其中所述編碼器裝置適于根據(jù)參數(shù)音頻編 解碼器對基本上無回聲的音頻信號進行編碼。
4. 一種適于從具有第一編碼信號部分(3)和第二編碼信號部分(4)的編碼音頻信號中 再生音頻信號的音頻解碼器(2),所述音頻解碼器(2)包括: -解碼器裝置,適于將第一編碼信號部分(3)解碼為基本上無回聲的音頻信號,所述解 碼器裝置進一步適于從第二編碼信號部分(4)中生成描述與所述音頻信號相關(guān)的混響場的 信息,其中根據(jù)適于描述混響的算法來編碼描述混響場的信息;以及 -變換裝置,適于基于描述混響場的信息將混響添加到基本上無回聲的音頻信號上。
5. 根據(jù)權(quán)利要求4所述的音頻解碼器(2),其中所述變換裝置包括用于將基本上無回 聲的音頻信號與脈沖響應(yīng)h(t)進行卷積的裝置,其中所述脈沖響應(yīng)h(t)是時間t的函數(shù), 其中h(t)以描述混響場的信息為基礎(chǔ)。
6. 根據(jù)權(quán)利要求5所述的音頻解碼器(2),其中所述解碼器裝置適于從第二編碼信號 部分(4)中生成: -與音頻信號的混響時間相關(guān)的第一參數(shù)T;以及 -與音頻信號的混響幅度相關(guān)的第二參數(shù)A。
7. 根據(jù)權(quán)利要求6所述的音頻解碼器(2),其中所述變換裝置適于基于所述第一參數(shù) 和第二參數(shù)將所述脈沖響應(yīng)h(t)計算為h(t)=A*exp (k*t/T)*n(t),其中k表示常數(shù),和 n (t)表不白噪聲信號。
8. 根據(jù)權(quán)利要求4所述的音頻解碼器(2),其中所述解碼器裝置適于根據(jù)參數(shù)音頻編 解碼器來解碼第一編碼信號部分(3 )。
9. 一種編碼音頻信號的方法,包括以下步驟: -將所述音頻信號分為基本上無回聲的部分和描述與所述音頻信號相關(guān)的混響場的 信息; -將所述音頻信號的基本上無回聲的部分編碼為第一編碼信號; -根據(jù)適于描述混響的算法,將描述混響場的信息編碼為第二編碼信號。
10. -種解碼表示原始音頻信號的編碼音頻信號的方法,所述方法包括以下步驟: -將第一編碼信號部分解碼為第一音頻信號; -將第二編碼信號部分解碼為描述與原始音頻信號相關(guān)的混響場的信息,其中根據(jù)適 于描述混響的算法來編碼描述混響場的信息;以及 -基于描述混響場的信息,通過添加混響來變換第一音頻信號,以便再生原始音頻信 號。
11. 一種音頻設(shè)備,包括根據(jù)權(quán)利要求1所述的音頻編碼器(1)。
12. -種音頻設(shè)備,包括根據(jù)權(quán)利要求4所述的音頻解碼器(2)。
【文檔編號】G10L19/00GK104112450SQ201410351425
【公開日】2014年10月22日 申請日期:2005年6月3日 優(yōu)先權(quán)日:2004年6月8日
【發(fā)明者】N.H.范施恩德爾, A.J.杰里茨, C.博斯卡里諾 申請人:皇家飛利浦電子股份有限公司