專利名稱:用以產(chǎn)生合成音頻信號及將音頻信號編碼的裝置與方法
技術領域:
本發(fā)明是有關于音頻信號處理,及特別地,有關于用以產(chǎn)生一合成音頻信號的一裝置及一方法、用以編碼一音頻信號的一裝置及一方法及一編碼的音頻信號。
背景技術:
儲存及傳輸音頻信號經(jīng)常受到嚴格的比特率限制。這些限制通常通過信號的一中間編碼來解決。過去,當僅一極低比特率可利用時,編碼器被迫急劇減少所傳輸?shù)囊纛l帶寬?,F(xiàn)代的音頻編譯碼器通過使用頻寬延伸方法能夠編碼寬帶信號,如在 M. Dietz, L. Liljeryd, K. Kjorling and 0. Kunz,“Spectral Band Replication,a novel approach in audio coding” in 112th AESConvention, Munich, May 2002 ;S. Meltzer, R. Bohm and F. Henn,“SBRenhanced audio codecs for digital broadcasting such as “Digital RadioMondiale”(DRM),” in 112th AES Convention, Munich, May 2002 ; Τ.Ziegler, A. Ehret, P.Ekstrand and Μ. Lutzky, "Enhancing mp3 with SBR :Features andCapabilities of the new mp3PR0 Algorithm,,,in 112th AES Convention, Munich, May 2002 ;International Standard IS0/IEC 14496-3 :2001/FPDAM 1, "Bandwidth Extension,,,IS0/IEC, 2002. Speech bandwidth extension methodand apparatus Vasu Iyengar et al. US Patent 5,455,888 ;E. Larsen, R. Μ. Aarts, and Μ. Danessis. Efficient high-frequency bandwidth extension of music andspeech. In AES 112th Convention, Munich,Germany,May 2002 ;R.Μ. Aarts,Ε.Larsen,and 0. Ouweltjes. A unified approach to low-and high frequencybandwidth extension.In AES 115th Convention, New York, USA,0ctober2003 ;K. Kayhko. A Robust Wideband Enhancement for Narrowband SpeechSignal. Research Report,Helsinki University of Technology, Laboratory ofAcousties and Audio Signal Processing,2001 ;E. Larsen and R.M.Aarts. Audio Bandwidth Extension-Application to psychoacoustics, SignalProcessing and Loudspeaker Design. John Wiley & Sons,Ltd, 2004 ;E.Larsen, R. Μ. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension ofmusic and speech. In AES 112th Convention, Munich,Germany, May 2002 ;J. Makhou1. Spectral Analysis of Speech by Linear Prediction. IEEE Transactionsof Audio and Electroacoustics, AU-21(3), June 1973 ;United States PatentApplication 08/951,029, Ohmori, et al.Audio band width extending systemand method ;United States Patent 6895375, Malah,D & Cox, R. V. :System forbandwidth extension of Narrow-band speech, and Frederik Nage1, SaschaDisch, "A harmonic bandwidth extension method for audio codecs,,,ICASSPInternational Conference on Acoustics,Speech and Signal Processing, IEEECNF, Taipei, Taiwan, April 2009 巾%$。這些算法依靠對高頻內容(HF)的一參數(shù)表示。此表示是通過將譯碼信號的低頻部分(LF)變換至HF頻譜區(qū)域(“修補”)并應用一推動后處理的參數(shù)而產(chǎn)生。
在現(xiàn)有技術中,頻寬延伸方法,諸如頻帶復制(SBR)被用作一在一基于HFR(高頻重建)的編譯碼器中產(chǎn)生高頻信號的有效方法。頻帶復制(SBR),如M Dietz, L. Liljeryd, K. Kjorling and 0. Kunz, "Spectral Band Replication, a novel approach in audio coding" in 112th AESConvention, Munich,May 2002中所述,使用一正交鏡像濾波器組(QMF)來產(chǎn)生HF信息。利用所謂的“修補”,較低QMF頻帶信號被復制至較高QMF頻帶中,造成LF部分信息復制到HF部分中。產(chǎn)生的HF部分在調整頻譜包絡及音調的參數(shù)的幫助下之后適于原始HF部分。如在HE-AAC中標準化的,SBR中包括通過簡單復制而修補的所有操作始終在QMF 域中完成。然而,其它不同的修補方法可在不同域中完成,諸如FFT域或時域。人們可設想使SBR能夠可選替地選擇一在FFT域或時域中操作的修補算法,并需要一額外的轉換來反饋QMF分析步驟。在普通SBR中,僅可得一不計入硬件或軟件需求也不計入信號特性的修補算法。 因此,SBR不能夠適于修補算法。人們可能設想在兩不同修補算法之間簡單選擇。因為兩修補算法運行于不同域中,過渡區(qū)域易于產(chǎn)生區(qū)塊偽像,這使得在兩方法之間密集切換實際上不可能。WO 98/57436揭露了用于頻帶復制中的變換方法,其與頻譜包絡調整組合。WO 02/052545教導的是,信號可被分類為脈沖串樣(pulse-train-like)或非脈沖串樣(non-pulse-train-like)且基于此分類的一適應性切換變換器被提出。該切換變換器并行執(zhí)行兩修補算法及混合單元依賴該分類(脈沖串或非脈沖串)來組合這兩修補信號。變換器之間的實際切換或混合響應于包絡及控制數(shù)據(jù)在一包絡調整濾波器組中執(zhí)行。 再者,對于脈沖串樣信號,基礎信號被轉換到一濾波器組域中,一完成的頻率轉譯操作及對頻率轉譯結果的一包絡調整被執(zhí)行。這是一組合的修補/進一步處理程序。對于非脈沖樣信號,一頻域變換器(FD變換器)被提供及頻域變換器的結果接著被轉換到濾波器組域中, 其中包絡調整被執(zhí)行。因此,在一選替中具有一組合的修補/進一步處理方法、在另一選替中具有位于內部發(fā)生包絡調整的濾波器組外的頻域變換器的此程序的實施及靈活性,在靈活性與實施的可能性方面是成問題的。
發(fā)明內容
本發(fā)明的一目的是提供用以產(chǎn)生一能夠改良質量及允許一有效實施的合成音頻信號的一構想。此目的通過根據(jù)權利要求1的所述的一用以產(chǎn)生一合成音頻信號的裝置、根據(jù)權利要求10所述的一用以編碼一音頻信號的裝置、根據(jù)權利要求12所述的用以產(chǎn)生的一方法、根據(jù)權利要求13所述的用以編碼的一方法、根據(jù)權利要求14所述的一編碼音頻信號或根據(jù)權利要求15所述的一計算機程序來實現(xiàn)。本發(fā)明是基于此基本思想當執(zhí)行多個不同頻譜域修補算法之前一音頻信號的一時間部分被轉換為一頻譜表示時,剛才提到的改良質量及/或有效實施可被實現(xiàn),其中每一修補算法產(chǎn)生一修改的頻譜表示,該修改的頻譜表示包含自該音頻信號的一核心頻帶中對應于頻譜成分獲得的在一上頻帶中的頻譜成分,及依據(jù)一修補控制信號針對一第一時間部分自該多個修補算法中選擇一第一頻域修補算法,并針對一第二不同時間部分自該多個修補算法中選擇一第二頻域修補算法。以此方式,由于在不同域中兩修補算法之間的一切換,一降低的質量及/或靈活性可被預防及進而在保持感知質量的同時處理可較不復雜。依據(jù)本發(fā)明的一實施例,一種使用一修補控制信號來產(chǎn)生一合成音頻信號的裝置包含一第一轉換器、一頻域修補發(fā)生器、一高頻重建操控器及一組合器。該第一轉換器被配置用于將一音頻信號的一時間部分轉換為一頻譜表示。該頻域修補發(fā)生器被配置用以執(zhí)行多個不同的頻域修補算法,其中每一修補算法產(chǎn)生一修改的頻譜表示,該修改的頻譜表示包含自該音頻信號的一核心頻帶中的相對應頻譜成分獲得的在一上頻帶中的頻譜成分。該頻域修補發(fā)生器進一步被配置成依據(jù)該修補控制信號針對一第一時間部分自該多個修補算法中選擇一第一頻域修補算法,及針對一第二不同時間部分自該多個修補算法中選擇一第二頻域修補算法,來獲得該修改的頻譜表示。該高頻重建操控器被配置用以依據(jù)一頻譜帶復制參數(shù)操控該修改的頻譜表示或自該修改的頻譜表示獲得的一信號,來獲得一頻寬延伸信號。該組合器被配置用以將在該核心頻帶中有頻譜成分的該音頻信號或是自該音頻信號獲得的一信號與該頻寬延伸信號相組合來獲得合成音頻信號。依據(jù)本發(fā)明的另一實施例,一種用以編碼一音頻信號的裝置包含一核心編碼器、 一參數(shù)提取器及一參數(shù)計算器。該音頻信號包含一核心頻帶及一上頻帶。該核心編碼器被配置用以編碼在該核心頻帶中的該音頻信號。該參數(shù)提取器被配置用以自該音頻信號提取一修補控制信號,該修補控制信號指示多個不同頻域修補算法中的一選定的修補算法,該選定的修補算法在一頻域中被執(zhí)行以在一頻寬延伸譯碼器中產(chǎn)生一合成音頻信號。該參數(shù)計算器被配置用以由該上頻帶計算該頻帶復制參數(shù)。依據(jù)另一實施例,一編碼的音頻信號數(shù)據(jù)流包含一在一核心頻帶中被編碼的編碼音頻信號及一修補控制信號,該修補控制信號指示多個不同頻域修補算法中的一選定的修補算法,該選定的修補算法在該頻域中被執(zhí)行以在一頻寬延伸譯碼器中產(chǎn)生一合成音頻信號及一頻帶復制參數(shù)由該音頻信號的一上頻帶而被計算。因此,本發(fā)明的實施例有關于一用以在頻域中的一修補算法組中的至少兩不同頻域修補算法之間切換的構想。該修補算法組可包含一包括一基于一單相語音編碼器的諧波變換及非諧波復制SBR功能的第一修補算法、一包含一基于一多相語音編碼器的諧波移調的第二修補算法、一包含非諧波復制SBR功能的第三算法及一包含一非線性失真的第四修補算法。此外,頻寬延伸可被執(zhí)行使得該頻寬延伸信號包含具有一至少四倍于核心頻帶中的交叉頻率的最大頻率的上頻帶。因此,通過在頻域中該至少兩不同修補算法之間切換,諸如在一頻寬延伸情形中能以相同感知質量取得一降低的復雜性。本發(fā)明的進一步的實施例有關于一不包含一時間/頻率轉換器的裝置,該時間/ 頻率轉換器的裝置用以將自該修改的頻譜表示獲得的一時域信號轉換為該頻域。因此,實施例允許高頻重建操控器可在修改的頻譜表示上直接操作而不需要自該時域至該頻域的一進一步轉換(例如,一 QMF分析),諸如在一組合修補/進一步處理方法在不同域中操作的情況中。本發(fā)明的進一步的實施例有關于一參數(shù)提取器,該參數(shù)提取器被配置用于自該多個不同頻域修補算法中決定一選定的修補算法。這里,該選定的修補算法是基于該音頻信號或一自該音頻信號獲得的信號與多個頻寬延伸信號之間的一比較,該多個頻寬延伸信號是藉由執(zhí)行該頻域中的該多個修補算法及操控該音頻信號的一時間部分的一修改的頻譜表示而被獲得。因此,實施例提供一種選擇該最佳修補算法來在一頻寬延伸譯碼器中產(chǎn)生一合成音頻信號的方法??刂茀?shù)可被用于決定哪一修補是最合適的。為實現(xiàn)此目標,一綜合分析級可被使用;亦即,所有修補可被施加而依據(jù)一目標最好的被選擇。在本發(fā)明的較佳模式中,目標是得到恢復的最佳感知質量。在選替模式中,一目標函數(shù)必須被優(yōu)化。例如,該目標可以是維持原始HF的頻譜平坦度盡可能近。一方面,修補選擇藉由考慮原始信號、分析的信號或此兩者可僅在編碼器完成。決策(修補控制信號)接著被傳輸至譯碼器。另一方面,僅考慮該同步信號的核心頻寬,選擇可在編碼器與譯碼器端被同步執(zhí)行。后一方法不需要產(chǎn)生額外的旁側信息。圖式簡單說明下面,參考附圖來闡述本發(fā)明的實施例,其中
第IA圖示出一使用一修補控制信號產(chǎn)生一合成音頻信號的裝置的一實施例的一方框圖;第IB圖示出第IA圖的一頻域修補發(fā)生器的一實施的一方框圖;第2A圖示出一用以產(chǎn)生一合成音頻信號的裝置的一進一步實施例的一方框圖;第2B圖示出一頻寬延伸方案的一示意說明;第3圖示出一示范第一修補算法的一示意說明;第4圖示出一示范第二修補算法的一示意說明;第5圖示出一示范第三修補算法的一示意說明;第6圖示出一示范第四修補算法的一示意說明;第7圖示出第IA圖的沒有一時間/頻率轉換器置于該頻域修補發(fā)生器之后的一實施例的一方框圖;第8圖示出第IA圖的有一第二轉換器(時間/頻率轉換器)的一實施例的一方框圖;第9圖示出一用以編碼一音頻信號的裝置的一實施例的一方框圖;第10圖示出用以編碼一音頻信號的裝置的一進一步實施例的一方框圖;第11圖示出一頻域中的一修補方案的一實施例的一概觀。
具體實施例方式第Ia圖示出一依據(jù)本發(fā)明的一實施例的使用一修補控制信號119來產(chǎn)生一合成音頻信號145的裝置100的一方框圖。裝置100包含一第一轉換器110、一頻域修補發(fā)生器120、一高頻重建操控器130及一組合器140。第一轉換器110被配置用于將一音頻信號 105的一時間部分轉換為一頻譜表示115。頻域修補發(fā)生器120被配置用于執(zhí)行多個117-1 不同的頻域修補算法,其中每一修補算法產(chǎn)生一修改的頻譜表示125,該修改的頻譜表示 125包含自音頻信號105的一核心頻帶中的相對應頻譜成分獲得的一在上頻帶中的頻譜成分。如第Ib圖所示,頻域發(fā)生器120可被配置成依據(jù)修補控制信號119針對一第一時間部分107-1自多個117-1修補算法中選擇一第一頻域修補算法117-2,及針對一第二不同時間部分107-2自多個117-1修補算法選擇一第二頻域修補算法117-3來獲得修改的頻譜表示 125。高頻重建操控器130被配置用于依據(jù)一頻譜帶復制參數(shù)127來操控修改的頻譜表示125或自修改的頻譜表示125獲得的一信號來獲得一頻寬延伸信號135。自修改的頻譜表示125獲得的信號可以是例如一 QMF域中的一信號,其在將一 QMF分析施于一基于修改的頻譜表示125的修改的時域信號之后已被獲得。組合器140被配置用于將在核心頻帶中有頻譜成分的音頻信號105或是自音頻信號105獲得的一信號與頻寬延伸信號135相組合來獲得合成音頻信號145。這里,自音頻信號105獲得的信號可以是,例如一在譯碼核心頻帶中的一編碼的音頻信號之后已被獲得的譯碼的低頻信號。如第Ia圖可見,裝置100的頻域修補發(fā)生器120被實施成在一頻域中而非在一時域中操作。第加圖示出一用以產(chǎn)生合成音頻信號145的裝置200的一進一步實施例的一方框圖。這里,第加圖裝置200與第Ia圖裝置100中的相同成分被忽略且未被再次示出或描繪。在第加圖所示的實施例中,裝置200的頻域修補發(fā)生器120被配置用于執(zhí)行頻域中修補算法組203中的至少兩不同的頻域修補算法。修補算法組203包含一包括一基于一單相語音編碼器的諧波變換及非諧波復制SBR功能的第一修補算法205-1、一包含一基于一多相語音編碼器的諧波變換的第二修補算法205-2、一包含非諧波復制SBR功能的第三修補算法205-3及一包含一非線性失真的第四修補算法205-4。如第2b圖所示,裝置200可適于執(zhí)行一頻寬延伸使得頻寬延伸信號135包含上頻帶220,該上頻帶220具有至少四倍于核心頻帶210中的交叉頻率215的一最大頻率225。 在SBR的情況下,被定義為核心頻帶210的最高頻率的交叉頻率215的典型值可以是,例如在小于4kHz、5kHz或6kHz的一范圍中。因此,上頻帶220的最大頻率225可以是例如,約 16kHz、20kHz 或 24kHz。第3圖示出一示范第一修補算法205-1的一示意說明。特別地,頻域修補發(fā)生器 120被配置用于執(zhí)行至少兩不同的頻域修補算法中的一選定的修補算法,該選定的修補算法包含第一修補算法205-1。第一修補算法205-1包含一基于一單相語音編碼器305的諧波變換,該單相語音編碼器305包含一為2的頻寬延伸因子(σ ),控制自一自核心頻帶210 提取的源頻帶310至一第一目標頻帶310’的一轉換。這里,源頻帶310中頻譜成分的相位乘以頻寬延伸因子(σ)使得第一目標頻帶310具有范圍為交叉頻率(fx)到兩倍于交叉頻率(fx)的頻率。第一修補算法205-1進一步包含非諧波復制SBR功能315,用以由一第一復制將第一目標頻帶310’中的頻譜成分轉換為一第二目標頻帶320’使得第二目標頻帶320 具有范圍為兩倍于交叉頻率(fx)到三倍于交叉頻率(fx)的頻率,且用以由一第二復制將第二目標頻帶320’中的頻譜成分進一步轉換為一第三目標頻帶330’使得第三目標頻帶330 具有包括在上頻帶220中范圍為三倍于交叉頻率(fx)到四倍于交叉頻率(fx)的頻率,上頻帶220包含第一 310’、第二 320’及第三330’目標頻帶。特別地,如第3圖所示,頻寬延伸信號135包含自核心頻帶210產(chǎn)生的上頻帶220,其中上頻帶220具有四倍于交叉頻率(fx) 的一最大頻率。第4圖示出一示范第二修補算法205-2的一示意說明。這里特別地,頻域修補發(fā)生器120被配置用于執(zhí)行至少兩不同的頻域修補算法中的一選定的修補算法,該選定的修補算法包含第二修補算法205-2。第二修補算法205-2包含一基于一多相語音編碼器405 的諧波變換,該多相語音編碼器405包含一為2的第一頻寬延伸因子(ο ^,控制自一自核心頻帶210提取的源頻帶410至一第一目標頻帶410’的一轉換。這里,第一源頻帶410中頻譜成分的相位乘以第一頻寬延伸因子(Q1)使得第一目標頻帶410’具有范圍為交叉頻率(fx)到兩倍于交叉頻率(fx)的頻率。第二修補算法205-2進一步包含一為3的第二頻寬延伸因子(σ 2),控制自一自核心頻帶210提取的一第二源頻帶420-1、420-2至一第二目標頻帶420,、420”的一轉換。這里,第二源頻帶420-1、420-2中頻譜成分的相位乘以第二頻寬延伸因子(σ2),使得第二目標頻帶420’、420”分別具有范圍為兩倍于交叉頻率(fx)到三倍于交叉頻率(fx)或范圍為交叉頻率(fx)到三倍于交叉頻率(fx)的頻率。最后,第二修補算法205-2進一步包含一為4的第三頻寬延伸因子(ο 3),控制自一自核心頻帶210提取的一第三源頻帶430-1、430-2至一第三目標頻帶430,、430”的一轉換。這里,第三源頻帶430-1、430-2中頻譜成分的相位乘以第三頻寬延伸因子(σ 3),使得第三目標頻帶430’、 430”分別具有包括在上頻帶220中范圍為三倍于交叉頻率(fx)到四倍于交叉頻率(fx)或范圍為交叉頻率(fx)到四倍于交叉頻率(fx)的頻率。如第3圖所示的第一修補算法205-1 中,頻寬延伸信號135的上頻帶220包含第一 410,、第二 420,、420”及第三430,、430”目標頻帶,具有四倍于交叉頻率(fx)的一最大頻率。第5圖示出一示范第三修補算法205-3的一示意說明。在第5圖的實施例中,頻域修補發(fā)生器120被配置用于執(zhí)行至少兩不同的頻域修補算法中的一選定的修補算法,該選定的修補算法包含第三修補算法205-3。第三修補算法205-3包含非諧波復制SBR功能 505,用以由一第一復制將在一源頻帶510中為核心頻帶210的頻譜成分轉換為一目標頻帶 510’,使得第一目標頻帶510’具有范圍為交叉頻率(fx)到兩倍于交叉頻率(fx)的頻率。 第一目標頻帶510’中的頻譜成分被一第二復制進一步轉換為一第二目標頻帶520’,使得第二目標頻帶520’具有范圍為兩倍于交叉頻率(fx)到三倍于交叉頻率(fx)的頻率。最后,第二目標頻帶520,中的頻譜成分被一第三復制進一步轉換為一第三目標頻帶530,,使得第三目標頻帶530’具有包括在上頻帶220中范圍為三倍于交叉頻率(fx)到四倍于交叉頻率(fx)的頻率。此外,頻寬延伸信號135的上頻帶220包含第一 510’、第二 520’及第三 530’目標頻帶,具有四倍于交叉頻率(fx)的一最大頻率。第6圖示出一示范第四修補算法205-4的一示意說明。在第6圖的實施例中,頻域修補發(fā)生器120被配置用于執(zhí)行至少兩不同的頻域修補算法中的一選定的修補算法,該選定的修補算法包含第四修補算法205-4。這里,第四修補算法205-4包含一非線性失真用以產(chǎn)生上頻帶220中具有范圍為交叉頻率(fx)到四倍于交叉頻率(fx)的頻率的頻譜成分。一般地,在如上所述第3-6圖的實施例中,頻域修補算法205-1 ;205-2 ;205-4 ; 205-4隨該頻域修補發(fā)生器120被配置用于將自核心頻帶210獲得的一初始頻帶310、 310,、320,;410、420-1、420-2、430-1、430-2 ;510、510,、520,中的一頻譜成分或不包括于核心頻帶210中的一上頻帶轉換為上頻帶220中的一目標頻譜成分而被執(zhí)行,使得該目標頻譜成分針對每一頻域修補算法是不同的。特別地,頻域修補發(fā)生器120可包含一頻通濾波器以自核心頻帶210或上頻帶220 來提取初始頻帶,其中該頻通濾波器的一頻通特性可被選擇,使得該初始頻帶將被轉換為第 3-6 圖所示的一相對應的頻帶 310,、320,、330,;410,、420,、430,;510,、520,、530,。不同的頻域修補算法205-1、205-2、205-3、205_4可依據(jù)一需要的性能而被執(zhí)行,
諸如第2b圖的頻寬延伸方案。具體地,通過分別使用例如第3圖或第4圖所示的一單或多相語音編碼器,頻率結構被諧波地正確延伸至高頻域,因為基頻(例如,核心頻帶210)被頻譜延伸偶數(shù)倍(例如, O1 = 2, σ2 = 3, O3 = 4),及因為基頻中的頻譜成分被與額外產(chǎn)生的頻譜成分相組合。如果基頻已被牢牢地限制于頻寬,例如,通過僅使用一很低位率,一基于相語音編碼器的修補算法可以是有利的。因此,上頻成分的重建已在一相對低的頻率開始。在此情況中,典型地交叉頻率不到約5KHz(或甚至不到4KHz)。在此區(qū)域,人類耳朵由于不正確定位的諧波而對不諧和很敏感。這可導致給人“不自然”音調的印象。另外,頻譜緊密間隔的音調(具有約30Hz至300Hz的頻譜不諧和)被感知為粗音調?;l帶的頻率結構的諧波延續(xù)避免了這些不正確及欠佳聽覺印象。此外,通過使用例如第5圖所示的非諧波復制SBR功能,頻譜區(qū)域可朝子頻帶方向被復制至一較高頻率區(qū)域或要被復制頻率區(qū)域。此外,復制依賴于觀測,這適用于所有較高頻信號的頻譜性質在許多方面類似于基頻帶信號的性質的修補方法。彼此之間僅有極少變化。另外,人類耳朵通常在高頻(典型地始于約5KHz)并不很敏感,特別是就一非精確頻譜映射而言。實際上,這大體上是頻帶復制的主要思想。特別地,復制包含實施簡單且快速的優(yōu)點。此修補算法對修補邊界也具有一高靈活性,因為對頻譜的復制可在任一子頻帶邊界執(zhí)行。最后,非線性失真的修補算法(見第6圖)可包含通過裁減、限制、平方等產(chǎn)生諧波。如果舉例而言,一展開信號被頻譜很稀疏占用(例如,在施以上述相位語音編碼器修補算法之后),展開頻譜能可取舍地被一失真信號相加補充以避免不想要的頻率孔。要注意的是,除了修補算法組203 (見第加圖)中上面提到的修補算法之外,頻域中的其它修補算法,諸如一頻譜鏡像,可被執(zhí)行。在第7圖的實施例中,一可對應于第Ia圖的裝置100的裝置700被示出為不包含一用以將自修改的頻譜表示125獲得的一時域信號轉換為頻域的時間/頻率轉換器。這就是說,在此情況中,高頻重建操控器130將接收修改的頻譜表示125而非自這一時間/頻率轉換器獲得的一頻域信號來作為其輸入。所描述的配置可以是有利的,因為在此情況中,高頻重建操控器130所執(zhí)行的對修改頻譜表示125的進一步處理在相同域(例如,F(xiàn)FT或QMF 域)中可易于發(fā)生,因為頻域修補發(fā)生器120所執(zhí)行的修補算法在其中有效。因此,不同域之間的一進一步轉換,諸如自時域至頻域的一轉換將不需要,這樣就造成一較簡單實施。在第8圖的實施例中,一裝置800被示出進一步包含一用以將修改的頻譜表示125 轉換為時域的第二轉換器810。再者,對應于第Ia圖裝置100的組件的第8圖裝置800的組件被忽略。如第8圖示出,第二轉換器810可適于施加一匹配于第一轉換器110所施加的一分析的合成。這里,第一轉換器110被配置用于執(zhí)行一具有一第一轉換長度111的轉換,而第二轉換器810被配置用于執(zhí)行一具有一第二轉換長度的轉換。特別地,第二轉換長度可依靠一頻寬延伸特性,因為上頻帶220中最大頻率(fmax)與核心頻帶210中交叉頻率 (fx)的一比值及第一轉換長度111被說明。在本發(fā)明的實施例中,第一轉換器110例如可實施為執(zhí)行一快速傅利葉變換(FFT)、一短時間傅利葉變換(STFT)、一離散傅利葉變換(DFT)或一 QMF分析,而第二轉換器 810例如可實施為執(zhí)行一快速傅利葉逆變換(IFFT)、一短時間傅利葉逆變換(ISTFT)、一離散傅利葉逆變換(IDFT)或一 QMF合成。具體地,第二轉換長度可被選定使得它將等于fmax/fx比值乘以第一轉換長度111。 以此方式,第二轉換器應用的第二轉換長度或頻率分辨率將易適于第2b圖所示頻寬延伸方案的頻寬延伸特性。這是因為根據(jù)Nyquist原理頻寬延伸特性實質上受上面對應于一較高有效取樣率的fmax/fx比來控制。第9圖示出一編碼一音頻信號105的裝置900的一實施例的一方框圖。音頻信號 105包含一核心頻帶210及一上頻帶220。特別地,用以編碼的裝置900包含一核心編碼器910、一參數(shù)提取器920及一參數(shù)計算器930。核心編碼器910被配置用于編碼核心頻帶 210中的音頻信號105來獲得核心頻帶210中的一編碼的音頻信號915。此外,參數(shù)提取器 920被配置用于自音頻信號105提取一修補控制信號119,該修補控制信號119指示自多個 117-1不同頻域修補算法中的一選定的修補算法。具體地,選定的修補算法可在一頻域中執(zhí)行以在一頻寬延伸譯碼器中產(chǎn)生合成音頻信號。最后,參數(shù)計算器930被配置用于由上頻帶220計算一 SBR參數(shù)127。由上頻帶220計算的SBR參數(shù)127、指示選定的修補算法的修補控制信號119及在核心頻帶210中被編碼的編碼音頻信號915可構成一在一比特流中被儲存或傳輸?shù)木幋a音頻信號935。在第9圖的實施例中,參數(shù)提取器920可被配置用于分析音頻信號105或一自音頻信號105獲得的信號來基于分析信號的一信號特性決定修補控制信號119。舉例而言,修補控制信號119可指示針對被分析信號的特征為‘語音’的一第一時間部分107-1的一第一修補算法,及針對被分析信號的特征為‘靜音樂’的一第二時間部分107-2的一第二修補算法。因此,如果是一語音信號,一基于一語音源模型的處理或諸如在一 LPC(線性預測編碼)內的一信息產(chǎn)生模型可使用。在前一情況中,產(chǎn)生聲音的人類語音/聲音產(chǎn)生系統(tǒng)被說明,在后一情況中,接收聲音的人類聽覺系統(tǒng)被說明。另外,一依信號而定的處理方案可通過在一包含一瞬時事件的時間部分的一諧波變換與一不包含一瞬時事件的時間部分的一非諧波復制操作之間切換來實施。上面對應于一開環(huán)的程序是基于對音頻信號105或一自音頻信號105獲得的信號在其信號特性方面的一直接分析??蛇x擇地,參數(shù)提取器920也可在一對應于“綜合分析”實施的閉回路中操作。在第10圖的實施例中,在這一綜合分析實施中一用以編碼一音頻信號105的裝置 1000被說明。具體地,用以編碼的裝置1000的參數(shù)提取器920可被配置用于自多個117-1 不同頻域修補算法中決定選定的修補算法。這里,選定的修補算法可以是基于音頻信號105 或一自音頻信號105獲得的信號與多個1005頻寬延伸信號的一比較,該多個1005頻寬延伸信號是通過在頻域中執(zhí)行多個117-1修補算法及操控音頻信號105的一時間部分的一修改的頻譜表示125而獲得。該比較可例如由一修補算法選擇單元1010通過計算多個1005 頻寬延伸信號與音頻信號105(SFM,ef)的頻譜平坦度(SFM)參數(shù)(SFMltltl5)、比較計算的SFM 參數(shù)SFM1■與SFM&及自多個117-1修補算法選擇一特定(最佳)修補算法而完成,借此比較的SFM參數(shù)的一偏差是最小的。最后,選定的最佳修補算法可在參數(shù)提取器920的輸出出現(xiàn)的修補控制信號119指示。第11圖示出一頻域中的一修補方案的一實施例的一概觀。特別地,一用以產(chǎn)生諸如在第2b圖的頻寬延伸方案中的一頻寬延伸信號的裝置1100被描繪。在第11圖的實施例中,音頻信號105被具有IOM取樣的一幀長度的PCM(脈沖編碼調制)數(shù)據(jù)1101表示,PCM 數(shù)據(jù)1101可以是例如一譯碼的低頻信號,該譯碼的低頻信號包含一自編碼音頻信號935獲得的基頻帶,該編碼的音頻信號935已自用以編碼的一裝置傳輸,諸如編碼器900。接著, 例如一降取樣器1110可用于以一因子2將PCM資料1101降取樣來獲得一降取樣的信號 1115。該降取樣的信號1115被進一步提供給一分析窗口化器1120,該分析窗口化器1120 由用“窗口 ”表示的一區(qū)塊來指示,“窗口”被配置用于產(chǎn)生音頻取樣的多個重疊窗口化連續(xù)區(qū)塊。這里,多個連續(xù)區(qū)塊中的每一區(qū)塊例如可包含512音頻取樣。另外,音頻取樣的兩連續(xù)區(qū)塊之間的一第一時間距離例如可被調整為對應于如用“Inc = 64”表示的64取樣。音頻取樣的連續(xù)區(qū)塊的重疊通過自分析窗口化器1120施以的多個不同分析窗口函數(shù)中選擇一適當(最佳)分析窗口函數(shù)可另外被控制??蓪谝纛l取樣的多個連續(xù)區(qū)塊中的一連續(xù)區(qū)塊的音頻信號105的一時間部分1125被進一步提供給第一轉換器110,該第一轉換器 110可被實施為例如一具有N = 512的第一轉換長度111的FFT處理器1130。該FFT處理器1130可被配置用于將時間部分1125轉換為例如能以一極坐標形式1135-1被實施的頻譜表示115。特別地,此頻譜表示1135-1包含振幅信息1135-2及相位信息1135-3,其受一可對應于第加圖的頻域修補發(fā)生器120的頻域修補發(fā)生器1141進一步處理。第11圖的頻域修補發(fā)生器1141可包含一用“相位語音編碼器加復制”表示、對應于第一修補算法205-1 的第一修補算法1141-1、一用“相位語音編碼器”表示、對應于第二修補算法205-2的第二修補算法1143-1、一用“類似SBR函數(shù)”表示、對應于第三修補算法205-3的第三修補算法、 一用“其它函數(shù),諸如非線性失真”表示、對應于第加圖所示修補算法組203中的第四修補算法205-4的第四修補算法1147-1。如前面在第加圖情況下的相應描述,第一修補算法1141-1包含一單一相位語音編碼器1141-2及非諧波復制功能1141-3、1141-4。此外,基于一多相語音編碼器操作的第二修補算法1143-1包含一第一相位語音編碼器1143-2、一第二相位語音編碼器1143-3及一第三語音編碼器1143-4。此外,第三修補算法1145-1包含執(zhí)行一第一復制操作1145-2、 一第二復制操作1145-3及一第三復制操作1145-4的非諧波復制SBR功能。最后,第四修補算法1147-1包含一非線性失真功能。特定地,在第11圖實施例中,修補算法區(qū)塊1141-1、1143-1、1145-1、1147-1可對應于第加圖的區(qū)塊205-1、205-2、204-3、205-4。另外,符號(xover頻帶)可對應于交叉頻率(fx)。再者,一修補選擇器1150可被用來提供一對應于修補控制信號119的修補控制信號1155來控制頻域修補發(fā)生器1141使得修補算法組1141-1、1143-1、1145-1、1147-1中的至少兩不同的頻域修補算法將被執(zhí)行,造成對應于修改的頻譜表示125的一修改的頻譜表示 1149。修改的頻譜表示1149可(可取舍地)被一隨后內插器1160處理來獲得一內插修改的頻譜表示1165。該內插修改的頻譜表示1165接著可被提供至第二轉換器810,該第二轉換器810可被實施為一具有N = 2048的一第二轉換長度的iFFT處理器1170。這里,如第8圖相應描述,N = 2048的第二轉換長度被調整為正好高于N = 512的第一轉換長度的四倍。因此,如以不同頻域修補算法執(zhí)行的頻寬延伸方案的頻寬延伸特性可被說明,這在前面已詳細闡述。iFFT處理器1170可被配置用于將內插修改的頻譜表示1165轉換為一對應于第8 圖修改的時域信號815的修改的時域信號1175。該修改的時域信號1175可接著被提供至一合成窗口化器1180供將一合成窗口函數(shù)施于修改的時域信號1175來獲得一修改的窗口化時域信號1185。這里,合成窗口函數(shù)被匹配于分析窗口函數(shù)使得應用分析窗口函數(shù)的效果由應用合成窗口函數(shù)來補償。因為由于頻寬延伸修改的窗口化時域信號1185較之原始取樣率(例如,8KHz)必須以一較高有效取樣率(例如,32KHz)來取樣,修改的窗口化時域信號1185可最后在一用 “重疊與相加”表示的區(qū)塊1190中被重疊相加,因為例如被區(qū)塊1190應用、用“Inc = 256” 表示的256取樣的一第二時間距離,與例如被分析窗口化器1120應用的64取樣的第一時間距離之比(例如比值為4)將等于較高有效取樣率與原始取樣率之比。以此方式,一輸出信號1195可被獲得,其具有與原始(降取樣)信號1115相同的重疊特性。裝置1100提供的輸出信號1195可自第Ia圖所示高頻重建操控器130開始進一步被處理,以最終獲得一在頻寬上延伸的復制信號。要注意的是,在第11圖的實施例中,所有不同的修補算法都在同一域中被實施, 例如在頻域中。該域可以是QMF域(因為其以SBR來完成)或任一其它域,諸如傅利葉變換的域。實際修補數(shù)據(jù)產(chǎn)生可以在一不同域中完成。在此情況中,整個修補然而,始終在同一域中完成。此外,不同源模型可關聯(lián)于在選擇中考慮的修補。例如,如在語音頻寬延伸中使用的一語音源模型可針對語音信號而選擇,而一靜態(tài)源模型可針對靜音樂采用。以如前所述相同方式,瞬時可有它們自己針對修補的模型。再者,通過將時間-頻率變換的分析與合成窗口重疊,不同修補方案之間的平滑過渡被保證??蛇x擇地,分析與合成的特殊窗口可被使用,以便使較少重疊成為可能??傊?,在第11圖的實施例中,修補方法可在對相鄰頻率段的一簡單復制操作、一基于相位語音編碼器的諧波變換方案、及一基于相位語音編碼器的包括復制相鄰頻率段的諧波變換方案當中選擇。雖然本發(fā)明在其中區(qū)塊表示實際或邏輯硬件組件的方框圖的情況中予以描述,但本發(fā)明也可由一計算機實施方法來實施。在計算機實施方法中,區(qū)塊表示相對應的方法步驟,其中這些步驟代表相對應邏輯或實體硬件區(qū)塊執(zhí)行的功能。所予以描述的實施例僅僅是說明本發(fā)明的原理。明白的是,對本文所予以描述的安排及細節(jié)的修改及改變對其他熟于此技者而言將是顯而易見的。因此,意圖是僅受后附的申請專利范圍的范圍限制,而不受以本文實施例的說明及解釋方式呈現(xiàn)的特性細節(jié)限制。依靠發(fā)明方法的某些實施需求,發(fā)明方法可在硬件或軟件中實施。該實施可使用一數(shù)字儲存媒體而被執(zhí)行,特別是其上儲存有電子可讀取控制信號的一磁盤、一 DVD或一 CD,它們可與可程序化計算機系統(tǒng)合作使得發(fā)明方法可被執(zhí)行。大體上,因此本發(fā)明可被實施為一計算機程序產(chǎn)品,其中一程序被儲存于一機器可讀取載體上,當該計算機程序產(chǎn)品運行于一計算機上時該程序代碼可被操作執(zhí)行發(fā)明方法。換言之,發(fā)明方法因而是一具有一程序代碼的計算機程序,當該計算機程序運行于一計算機上時該程序代碼執(zhí)行發(fā)明方法當中的至少一方法。發(fā)明編碼音頻信號可被儲存于任一機器可讀取儲存媒體上,諸如一數(shù)字儲存媒體。本發(fā)明的實施例容許頻寬延伸計入修補過程的聲音、硬件、及信號特性。對最適合修補的決策可在一開環(huán)或一死循環(huán)中完成。因此,恢復質量可被控制及增強。所呈現(xiàn)的構想也有不同修補算法之間的一平滑過渡可易于達到、基于信號允許對頻寬延伸的一快速且準確的適應的優(yōu)點。大部分突出的應用是音頻譯碼器,其經(jīng)常在手持裝置上被實施及因而靠一電池供電操作。
權利要求
1.一種使用一修補控制信號(119 ;1155)來產(chǎn)生一合成音頻信號(14 的裝置(100 ; 200 ;700 ;800 ;1100),所述裝置(100 ;200 ;700 ;800 ;1100)包含一第一轉換器(110 ;1130),其用以將一音頻信號(105 ;1101)的一時間部分(107-1 ; 107-2 ;1125)轉換為一頻譜表示(115 ;1135-1);一頻域修補發(fā)生器(120;1141),其用以執(zhí)行多個(117-1)不同的頻域修補算法,其中每一修補算法產(chǎn)生一修改的頻譜表示(125 ;1149),所述修改的頻譜表示包含自所述音頻信號(105;1101)的一核心頻帶O10)中的相對應頻譜成分獲得的在一上頻帶O20)中的頻譜成分,及其中所述頻域修補發(fā)生器(120 ;1141)被配置用于依據(jù)所述修補控制信號 (119 ;1155),針對一第一時間部分(107-1)自該多個(117-1)修補算法中選擇一第一頻域修補算法(117-2),及針對一第二不同時間部分(107-2)自所述多個(117-1)修補算法中選擇一第二頻域修補算法(117-3),來獲得所述修改的頻譜表示(125 ;1149);一高頻重建操控器(130),其用以依據(jù)一頻譜帶復制參數(shù)(127)操控所述修改的頻譜表示(125 ; 1149)或自所述修改的頻譜表示獲得的一信號(125 ;1195)來獲得一頻寬延伸信號(135),及一組合器(140),其用以將在所述核心頻帶(210)中有頻譜成分的所述音頻信號(105 ; 1101)或是自所述音頻信號(105;1101)獲得的一信號與所述頻寬延伸信號(135)相組合來獲得所述合成音頻信號(145)。
2.根據(jù)權利要求1所述的裝置(100;200 ;700 ;800 ;1100),其中所述頻域修補發(fā)生器 (120 ;1141)被實施成在一頻域而非一時域中操作。
3.根據(jù)權利要求1或2所述的裝置000),其中所述頻域修補發(fā)生器(120)被配置用于執(zhí)行頻域中一修補算法組O03)中的至少兩不同的頻域修補算法,所述修補算法組(203) 包含一包括一基于一單相語音編碼器的諧波變換及非諧波復制頻帶復制功能的第一修補算法005-1)、一包含一基于多相語音編碼器的諧波變換的第二修補算法Q05-2)、一包含非諧波復制頻帶復制功能的第三修補算法(205- 及一包含一非線性失真的第四修補算法005-4),所述裝置(200)適于執(zhí)行一頻寬延伸,使得所述頻寬延伸信號(13 包含具有一至少四倍于所述核心頻帶中的交叉頻率的最大頻率025;fmax)的上頻帶020)。
4.根據(jù)權利要求3所述的裝置,其中頻域修補發(fā)生器(120)被配置用于執(zhí)行所述至少兩不同的頻域修補算法中的一選定的修補算法,所述選定的修補算法包含所述第一修補算法005-1),所述第一修補算法(205-1)包含一基于一單相語音編碼器(305)的諧波變換, 所述單相語音編碼器包含一為二的頻寬延伸因子(ο),控制自一自所述核心頻帶(210)提取的源頻帶(310)至一第一目標頻帶(310’)的一轉換,其中所述源頻帶(310)中的所述頻譜成分的相位乘以所述頻寬延伸因子(ο),使得所述第一目標頻帶(310’ )具有范圍為所述交叉頻率(fx)到兩倍于所述交叉頻率(fx)的頻率,所述第一修補算法(205-1)進一步包含非諧波復制頻帶復制功能(315),用以由一第一復制將所述第一目標頻帶(310’)中的頻譜成分轉換為一第二目標頻帶(320’),使得所述第二目標頻帶(320’ )具有范圍為兩倍于所述交叉頻率(fx)到三倍于所述交叉頻率(fx)的頻率,及用以由一第二復制將所述第二目標頻帶(320’ )中的頻譜成分進一步轉換為一第三目標頻帶(330’),使得所述第三目標頻帶(330’)具有包括于所述上頻帶O20)中范圍為三倍于所述交叉頻率(fx)到四倍于所述交叉頻率(fx)的頻率,所述上頻帶(220)包含第一(310’)、第二(320’ )及第三目標頻帶(330,)。
5.根據(jù)權利要求3所述的裝置,其中所述頻域修補發(fā)生器(120)被配置用于執(zhí)行所述至少兩不同的頻域修補算法中的一選定的修補算法,所述選定的修補算法包含所述第二修補算法O05-2),所述第二修補算法(205- 包含一基于一多相語音編碼器(40 的諧波變換,所述多相語音編碼器包含一為二的第一頻寬延伸因子(ο D,控制自一自所述核心頻帶 (210)提取的第一源頻帶(410)至一第一目標頻帶010’)的一轉換,其中所述第一源頻帶中所述等頻譜成分的相位乘以所述第一頻寬延伸因子(O i),使得所述第一目標頻帶具有范圍為所述交叉頻率(fx)到兩倍于所述交叉頻率(fx)的頻率,所述第二修補算法(205-2) 進一步包含一為三的第二頻寬延伸因子(o2),控制自一自核心頻帶提取的一第二源頻帶 (420-1 ;420-2)至一第二目標頻帶(420,;420”)的一轉換,其中所述第二源頻帶(420-1 ; 420-2)中所述等頻譜成分的相位乘以所述第二頻寬延伸因子(o2),使得所述第二目標頻帶020’;420”)具有范圍為兩倍于所述交叉頻率(fx)到三倍于所述交叉頻率(fx)或范圍為所述交叉頻率(fx)到三倍于所述交叉頻率(fx)的頻率,所述第二修補算法(205-2)進一步包含一為四的第三頻寬延伸因子(ο 3),控制自一自核心頻帶(210)提取的一第三源頻帶(430-1,430-2)至一第三目標頻帶030,;430”)的一轉換,其中所述第三源頻帶030,; 430”)中所述等頻譜成分的相位乘以所述第三頻寬延伸因子(σ3),使得所述第三目標頻帶 (430' ;430”)具有包括在所述上頻帶Ο20)中范圍為三倍于所述交叉頻率(fx)到四倍于所述交叉頻率(fx)或范圍為所述交叉頻率(fx)到所述四倍于交叉頻率(fx)的頻率,所述上頻帶(220)包含第一 (410,)、第二 (420,;420”)、及第三目標頻帶(430,;430”)。
6.根據(jù)權利要求3所述的裝置,其中所述頻域修補發(fā)生器(120)被配置用于執(zhí)行所述至少兩不同的頻域修補算法中的一選定的修補算法,所述選定的修補算法包含所述第三修補算法005-3),所述第三修補算法(205- 包含非諧波復制頻帶復制功能(505),用以由一第一復制將在一源頻帶(510)中為核心頻帶O10)的頻譜成分轉換為一第一目標頻帶 (510’),使得所述第一目標頻帶(510’ )具有范圍為所述交叉頻率(fx)到兩倍于所述交叉頻率(fx)的頻率,用以由一第二復制將所述第一目標頻帶(510’ )中的頻譜成分進一步轉換為一第二目標頻帶(520’),使得所述第二目標頻帶(520’ )具有范圍為兩倍于所述交叉頻率(fx)到三倍于所述交叉頻率(fx)的頻率,及用以由一第三復制將所述第二目標頻帶 (520’ )中的頻譜成分進一步轉換為一第三目標頻帶(530’),使得所述第三目標頻帶具有包括在所述上頻帶O20)中范圍為三倍于所述交叉頻率(fx)到四倍于所述交叉頻率(fx) 的頻率,所述上頻帶(220)包含第一(510,)、第二及(520,)第三目標頻帶(530,)。
7.根據(jù)權利要求3所述的裝置,其中所述頻域修補發(fā)生器(120)被配置用于執(zhí)行所述至少兩不同頻域修補算法中的一選定的修補算法,所述選定的修補算法包含所述第四修補算法005-4),所述第四修補算法(205-4)包含一非線性失真,以產(chǎn)生在所述上頻帶(220) 中具有范圍為所述交叉頻率(fx)到四倍于所述交叉頻率(fx)的頻譜成分。
8.根據(jù)前述權利要求中任一項所述的裝置(700),所述裝置(700)不包含一用以將一自所述修改的頻譜表示(12 獲得的時域信號(70 轉換為所述頻域的時間/頻率轉換器 (710)。
9.根據(jù)前述權利要求中任一項所述的裝置(800),所述裝置(800)進一步包含一用以將所述修改的頻譜表示(12 轉換為所述時域的第二轉換器(810),其中所述第二轉換器(810)適于施加一匹配于所述第一轉換器(110)所施加的一分析的合成,其中所述第一轉換器(110)被配置用于執(zhí)行一具有一第一轉換長度(111)的轉換,及其中所述第二轉換器 (810)被配置用于執(zhí)行一具有一第二轉換長度的轉換,所述第二轉換長度依靠一頻寬延伸特性,因為在所述上頻帶O20)中的所述最大頻率(fmax)與所述核心頻帶O10)中的所述交叉頻率(fx)的一比值與所述第一轉換長度(111)被說明。
10.一種用以編碼一音頻信號(10 的裝置(900; 1000),所述音頻信號(10 包含一核心頻帶(210)及一上頻帶(220),所述裝置(900 ; 1000)包含一核心編碼器(910),其用以編碼所述核心頻帶O10)中的所述音頻信號(105),一參數(shù)提取器(920),其用以自所述音頻信號(10 提取一修補控制信號(119),所述修補控制信號(119)指示多個(117-1)不同頻域修補算法中的一選定的修補算法,所述選定的修補算法在一頻域中執(zhí)行以在一頻寬延伸譯碼器中產(chǎn)生一合成音頻信號;及一參數(shù)計算器(930),其用以由所述上頻帶(220)計算一頻帶復制參數(shù)(127)。
11.根據(jù)權利要求10所述的譯碼裝置(1000),其中所述參數(shù)提取器(920)被配置用于自所述多個(117-1)不同頻域修補算法中決定所述選定的修補算法,所述選定的修算法是基于所述音頻信號(105)或自所述音頻信號(105)獲得的一信號與多個(1005)頻寬延伸信號之間的一比較,所述多個頻寬延伸信號是通過在所述頻域中執(zhí)行所述多個(117-1)修補算法及操控所述音頻信號(10 的一時間部分的一修改的頻譜表示(12 而獲得。
12.一種使用一修補控制信號(190 ;1155)產(chǎn)生一合成音頻信號(14 的方法(100 ; 200 ;700 ;800 ;1100),所述方法(100 ;200 ;700 ;800 ;1100)包含將一音頻信號的一時間部分(107-1 ; 107-2 ;1125)轉換(110 ;1130)為一頻譜表示 (115 ;1135-1);執(zhí)行(120 ;1141)多個(117-1)不同頻域修補算法,其中每一修補算法產(chǎn)生一修改的頻譜表示(125 ;1149),所述修改的頻譜表示包含自所述音頻信號(105 ;1101)的一核心頻帶 (210)中相對應的頻譜成分獲得的一上頻帶O20)中的頻譜成分,及依據(jù)所述修補控制信號(119 ;1155)針對一第一時間部分(107-1)自所述多個(117-1)修補算法中選擇(120 ; 1141) 一第一頻域修補算法(117-2),及針對一第二時間部分(107-2)自所述多個(117-1) 修補算法中選擇一第二頻域修補算法(117-3),來獲得所述修改的頻譜表示(125 ; 1149);依據(jù)一頻帶復制參數(shù)(127)操控(130)所述修改的頻譜表示(125 ; 1149)或一自所述修改的頻譜表示而獲得的信號(125;1195),來獲得一頻寬延伸信號(135);及將在所述核心頻帶O10)中具有頻譜成分的所述音頻信號(105 ;1101)或一自所述音頻信號(105 ;1101)獲得的信號,與所述頻寬延伸信號(13 相組合(140)來獲得所述合成音頻信號(145)。
13.一種用以編碼一音頻信號的方法(900 ;1000),所述音頻信號(10 包含一核心頻帶(210)及一上頻帶(220),所述方法(900 ; 1000)包含編碼(910)所述核心頻帶O10)內的所述音頻信號(105);自所述音頻信號(10 提取(920) —修補控制信號(119),所述修補控制信號(119)指示多個(117-1)不同頻域修補算法中的一選定的修補算法,所述選定的修補算法在一頻域中執(zhí)行以在一頻寬延伸譯碼器中產(chǎn)生一合成音頻信號;及由所述上頻帶(220)計算(930) —頻帶復制參數(shù)(127)。
14.一種編碼的音頻信號(935),其包含一在一核心頻帶O10)中被編碼的編碼的音頻信號(915);一修補控制信號(119),所述修補控制信號(119)指示多個(117-1)不同頻域修補算法中的一選定的修補算法,所述選定的修補算法在一頻域中執(zhí)行以在一頻寬延伸譯碼器中產(chǎn)生一合成音頻信號(14 ;及一由所述音頻信號(10 的一上頻帶(220)而計算的頻帶復制參數(shù)(127)。
15.一種計算機程序,具有當所述計算機程序在一計算機上執(zhí)行時用以執(zhí)行根據(jù)權利要求13或14所述的方法的程序代碼。
全文摘要
一種使用一修補控制信號產(chǎn)生一合成音頻信號的裝置包含一第一轉換器、一頻域修補發(fā)生器、一高頻重建操控器及一組合器。該第一轉換器被配置用于將一音頻信號的一時間部分轉換為一頻譜表示。該頻域修補發(fā)生器被配置用于執(zhí)行多個不同頻域修補算法,其中每一修補算法產(chǎn)生一修改的頻譜表示,該修改的頻譜表示包含自該音頻信號的一核心頻帶中相對應的頻譜成分被獲得的一在上頻帶的頻譜成分。該頻域修補發(fā)生器進一步被配置用于依據(jù)該修補控制信號針對一第一時間部分自該多個修補算法選擇一第一頻域修補算法及針對一第二不同時間部分自該多個修補算法選擇一第二頻域修補算法來獲得該修改的頻譜表示。該高頻重建操控器被配置用于依據(jù)一頻帶復制參數(shù)操控該修改的頻譜表示或一自該修改的頻譜表示而獲得的信號來獲得一頻寬延伸信號。最后,該組合器被配置用于將在該核心頻帶中具有頻譜成分的該音頻信號或一自該音頻信號獲得的信號與該頻寬延伸信號相組合來獲得該合成音頻信號。
文檔編號G10L19/14GK102177545SQ201080002866
公開日2011年9月7日 申請日期2010年4月1日 優(yōu)先權日2009年4月9日
發(fā)明者斯特凡·拜爾, 朱利安·羅比利亞德, 福雷德里克·納格爾, 約翰內斯·希爾珀特, 紀堯姆·福奇斯, 耶雷米·勒科米特, 馬庫斯·穆賴特魯斯 申請人:弗蘭霍菲爾運輸應用研究公司