国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      利用頻域維納濾波對(duì)空間音頻編碼進(jìn)行時(shí)間包絡(luò)整形的制作方法

      文檔序號(hào):2835843閱讀:152來(lái)源:國(guó)知局
      專利名稱:利用頻域維納濾波對(duì)空間音頻編碼進(jìn)行時(shí)間包絡(luò)整形的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及基于塊的音頻編碼器,其中音頻信息在被解碼時(shí)具有由塊率限定的時(shí)間包絡(luò)分辨率,該編碼器包括感知的且參數(shù)化的音頻編碼器、解碼器及系統(tǒng),本發(fā)明還涉及對(duì)應(yīng)的方法,用于實(shí)現(xiàn)這種方法的計(jì)算機(jī)程序,以及由這種編碼器生成的位流。
      背景技術(shù)
      很多降低比特率的音頻編碼技術(shù)都是“基于塊”的,其中,編碼包括如下處理對(duì)解碼成多個(gè)時(shí)間塊的一個(gè)或更多個(gè)音頻信號(hào)中的每一個(gè)進(jìn)行劃分,并且以不高于塊率的頻率對(duì)與解碼音頻相關(guān)聯(lián)的一些附帶信息(side information)進(jìn)行更新。因此,音頻信息在被解碼時(shí)具有由塊率限定的時(shí)間包絡(luò)分辨率。因此,基于時(shí)間的解碼音頻信號(hào)的具體結(jié)構(gòu)被保留的時(shí)間段不小于編碼技術(shù)的粒度(granularity)(通常在每塊8到50毫秒的范圍內(nèi))。這種基于塊的音頻編碼技術(shù)不僅包括已經(jīng)建立的感知編碼技術(shù),已知有AC_3、AAC 以及各種MPEG,在該技術(shù)中通常通過編碼/解碼處理保留離散的聲道,而且包括最近引入的比特率受限編碼技術(shù),有時(shí)將其稱為“心理聲學(xué)編碼(Binaural Cue Coding)”以及“參數(shù)立體聲編碼”,在該技術(shù)中通過編碼/解碼處理將多個(gè)輸入聲道縮混為單個(gè)聲道,并且從單個(gè)聲道上混為多個(gè)聲道。這種編碼系統(tǒng)的詳情包含在不同文檔中,包括下面在標(biāo)題“引用并入”下所引用的那些文檔。由于在這種編碼系統(tǒng)中使用了單個(gè)聲道,所以重構(gòu)的輸出信號(hào)必須是彼此幅度成比例的——對(duì)于特定塊,不同輸出信號(hào)必須具有基本上相同的精細(xì)包絡(luò)結(jié)構(gòu)。雖然所有基于塊的音頻編碼技術(shù)都可因?yàn)槠浣獯a音頻信號(hào)的時(shí)間包絡(luò)分辨率的提高而得益,但是在整個(gè)編碼/解碼處理中不保留離散聲道的、基于塊的編碼技術(shù)中,對(duì)這種提高的需要尤為強(qiáng)烈。對(duì)于這種系統(tǒng)來(lái)說,特定類型的輸入信號(hào)(例如,歡呼)尤其存在問題,該輸入信號(hào)使得再現(xiàn)的感覺到的空間圖像變窄或塌縮。


      圖1是實(shí)施本發(fā)明方面的編碼器或編碼功能的示意性功能框圖。圖2是實(shí)施本發(fā)明方面的解碼器或解碼功能的示意性功能框圖。

      發(fā)明內(nèi)容
      根據(jù)本發(fā)明第一方面,提供了一種用于音頻信號(hào)編碼的方法,其中,將一個(gè)或更多個(gè)音頻信號(hào)編碼為位流,該位流包括音頻信息和與該音頻信息相關(guān)聯(lián)且在對(duì)該位流進(jìn)行解碼時(shí)有用的附帶信息,所述編碼包括以下處理將所述一個(gè)或更多個(gè)音頻信號(hào)中的每一個(gè)劃分為多個(gè)時(shí)間塊;并且以不高于塊率的頻率對(duì)至少一些所述附帶信息進(jìn)行更新,使得所述音頻信息在被解碼時(shí)具有由所述塊率限定的時(shí)間包絡(luò)分辨率。將至少一個(gè)音頻信號(hào)的時(shí)間包絡(luò)與經(jīng)估計(jì)解碼重構(gòu)的每一個(gè)所述至少一個(gè)音頻信號(hào)的時(shí)間包絡(luò)進(jìn)行比較,該經(jīng)估計(jì)的重構(gòu)采用至少一些所述音頻信息和至少一些所述附帶信息,比較結(jié)果的表示有助于提高至少一些所述音頻信息在被解碼時(shí)的時(shí)間包絡(luò)分辨率。。根據(jù)本發(fā)明另一方面,提供了一種音頻信號(hào)編碼及解碼的方法,其中,將一個(gè)或更多個(gè)輸入音頻信號(hào)編碼為位流,該位流包括音頻信息和與該音頻信息相關(guān)聯(lián)且在對(duì)該位流進(jìn)行解碼時(shí)有用的附帶信息,接收所述位流并利用所述附帶信息對(duì)所述音頻信息進(jìn)行解碼來(lái)提供一個(gè)或更多個(gè)輸出音頻信號(hào),所述編碼和解碼包括如下處理將所述一個(gè)或更多個(gè)輸入音頻信號(hào)中的每一個(gè)和經(jīng)解碼的位流分別劃分為多個(gè)時(shí)間塊,所述編碼以不高于塊率的頻率對(duì)至少一些所述附帶信息進(jìn)行更新,使得所述音頻信息在被解碼時(shí)具有其分辨率被所述塊率限定的時(shí)間包絡(luò)。在至少一個(gè)輸入音頻信號(hào)的時(shí)間包絡(luò)與經(jīng)估計(jì)解碼重構(gòu)的每一個(gè)所述至少一個(gè)輸入音頻信號(hào)的時(shí)間包絡(luò)之間進(jìn)行比較,該經(jīng)估計(jì)的重構(gòu)采用至少一些所述音頻信息和至少一些所述附帶信息,所述比較提供了比較結(jié)果的表示,所述表示有助于提高至少一些所述音頻信息在被解碼時(shí)的時(shí)間包絡(luò)分辨率。進(jìn)行對(duì)至少一些所述表示的輸出,并且進(jìn)行對(duì)所述位流的解碼,所述解碼采用所述音頻信息、所述附帶信息以及所述輸出的表示。根據(jù)本發(fā)明又一方面,提供了一種音頻信號(hào)解碼的方法,其中,將一個(gè)或更多個(gè)輸入音頻信號(hào)編碼為位流,該位流包括音頻信息和與該音頻信息相關(guān)聯(lián)且在對(duì)該位流進(jìn)行解碼時(shí)有用的附帶信息,所述編碼包括如下處理將所述一個(gè)或更多個(gè)輸入音頻信號(hào)中的每一個(gè)分為多個(gè)時(shí)間塊,并且以不高于塊率的頻率對(duì)至少一些所述附帶信息進(jìn)行更新,使得所述音頻信息在采用所述附帶信息對(duì)其解碼時(shí)具有由所述塊率限定的時(shí)間包絡(luò)分辨率,所述編碼進(jìn)一步包括在至少一個(gè)輸入音頻信號(hào)的時(shí)間包絡(luò)與經(jīng)估計(jì)解碼重構(gòu)的每一個(gè)所述至少一個(gè)輸入音頻信號(hào)的時(shí)間包絡(luò)之間進(jìn)行比較,該經(jīng)估計(jì)的重構(gòu)采用至少一些所述音頻信息和至少一些所述附帶信息,所述比較提供了比較結(jié)果的表示,所述表示有助于提高至少一些所述音頻信息在被解碼時(shí)的時(shí)間包絡(luò)分辨率,并且所述編碼進(jìn)一步包括輸出至少一些所述表示。進(jìn)行對(duì)所述位流的接收和解碼,所述解碼采用所述音頻信息、所述附帶信息以及所述輸出的表示。本發(fā)明的其他方面包括適于執(zhí)行上述方法的設(shè)備、存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上以用于使計(jì)算機(jī)執(zhí)行上述方法的計(jì)算機(jī)程序、由上述方法生成的位流、以及由適于進(jìn)行上述方法的設(shè)備生成的位流。
      具體實(shí)施例方式圖1示出了可以采用本發(fā)明方面的編碼器或編碼處理環(huán)境的示例。將諸如PCM信號(hào)的多個(gè)音頻輸入信號(hào)、各個(gè)模擬音頻信號(hào)的時(shí)間采樣(1到Π)應(yīng)用到相應(yīng)的時(shí)域到頻域轉(zhuǎn)換器或者轉(zhuǎn)換功能塊(“T/F”)2-l至2-n。音頻信號(hào)例如可表示諸如左、中、右等的空間方向。例如可通過如下操作來(lái)實(shí)現(xiàn)各T/F 將輸入音頻采樣劃分為多個(gè)塊、對(duì)這些塊進(jìn)行加窗(windowing)、使這些塊交疊、通過計(jì)算離散頻率變換(DFT)來(lái)將經(jīng)加窗和交疊的塊中的每一塊變換到頻域、并且采用例如等效矩形頻帶(ERB)尺度(scale)將所得頻譜劃分為模擬人耳臨界頻帶的多個(gè)頻帶,例如二十一個(gè)頻帶。這種DFT處理在本領(lǐng)域中是廣為公知的??刹捎闷渌臅r(shí)域到頻域轉(zhuǎn)換參數(shù)和技術(shù)。具體參數(shù)或是具體技術(shù)對(duì)于本發(fā)明來(lái)說并非關(guān)鍵。然而,出于易于解釋的目的,下面的描述假設(shè)采用這種DFT轉(zhuǎn)換技術(shù)。T/F 2-1至2-n的多個(gè)頻域輸出中的每一個(gè)是一組譜系數(shù)。這些組可分別表示為 ?化^至?化]…可將所有這些組應(yīng)用于基于塊的編碼器或編碼器功能塊(“基于塊的編碼器”)4?;趬K的編碼器例如可以是上述的已知基于塊的編碼器中的單獨(dú)任一種或有時(shí)是它們的組合,或者是包括上述這些編碼器的變型的任何未來(lái)的基于塊的編碼器。盡管本發(fā)明的方面尤其適于與在編碼和解碼期間不保留離散聲道的基于塊的編碼器結(jié)合來(lái)使用,但是本發(fā)明的方面事實(shí)上與任何基于塊的編碼器結(jié)合都是有用的。典型的基于塊的編碼器4的輸出的特征為“音頻信息”和“附帶信息”。音頻信息例如可包括表示多個(gè)信號(hào)聲道的數(shù)據(jù)(如可能在基于塊的編碼系統(tǒng)(例如,AC-3、AAC及其他)中存在的),或者該音頻信息可僅包括通過縮混多個(gè)輸入聲道而獲得的單個(gè)聲道, 例如上述心理聲學(xué)編碼系統(tǒng)及參數(shù)立體聲編碼系統(tǒng)(還可利用例如AAC或某一其他適合編碼對(duì)心理聲學(xué)編碼編碼器或參數(shù)立體聲編碼系統(tǒng)中的縮混聲道進(jìn)行感知編碼)。該音頻信息還可以包括通過縮混多個(gè)輸入聲道而獲得的單個(gè)聲道或多個(gè)聲道,例如在Davis等人于 2004 年 7 月 14 日提交的題為"Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information"的美國(guó)臨時(shí)專利申請(qǐng)S. N. 60/588256中所公開的。在此通過引用并入所述 S. N. 60/588256的全部?jī)?nèi)容。附帶信息可包括與音頻信息相關(guān)且在對(duì)其進(jìn)行解碼時(shí)有用的數(shù)據(jù)。在各種縮混編碼系統(tǒng)的情況下,附帶信息例如可包括如下空間參數(shù),諸如聲道間幅值差、聲道間時(shí)間差或相位差以及聲道間互相關(guān)性。然后可將來(lái)自基于塊的編碼器4的音頻信息和附帶信息應(yīng)用于相應(yīng)的頻域到時(shí)域轉(zhuǎn)換器或轉(zhuǎn)換功能塊(“F/T”)6,所述頻域到時(shí)域轉(zhuǎn)換器或轉(zhuǎn)換功能塊(“F/T”)6中的每一個(gè)通常執(zhí)行上述T/F的相反功能,即逆FFT,接著進(jìn)行加窗和交疊相加。將來(lái)自F/T 6 的時(shí)域信息應(yīng)用于提供經(jīng)編碼的位流輸出的位流打包器或打包功能塊(“位流打包器”)10。 另選的是,如果編碼器要提供表示頻域信息的位流,則可省略F/T 6。還將來(lái)自基于塊的編碼器4的頻域音頻信息和附帶信息應(yīng)用于解碼估計(jì)器或估計(jì)功能塊(“解碼估計(jì)器”)14。解碼估計(jì)器14可模擬被設(shè)計(jì)用來(lái)對(duì)位流打包器10提供的編碼位流進(jìn)行解碼的解碼器或解碼功能塊的至少一部分。下面結(jié)合圖2來(lái)描述這種解碼器或解碼功能塊的示例。解碼估計(jì)器14可提供多組譜系數(shù)X [k]工到X[k]n,多組譜系數(shù)X [k]工到)Uk]n近似于對(duì)應(yīng)輸入音頻信號(hào)的多組譜系數(shù)YDO1到Y(jié)[k]n(期望要在解碼器或解碼功能塊處獲得)。另選的是,可以為少于所有輸入音頻信號(hào)、為少于輸入音頻信號(hào)的所有時(shí)間塊、以及/或者為少于所有頻帶,提供這種譜系數(shù)(即,它可能不提供所有譜系數(shù))。這例如可能起因于希望僅改進(jìn)表示被認(rèn)為比其他聲道更重要的聲道的輸入信號(hào)。作為另一示例, 這可能起因于希望僅改進(jìn)信號(hào)中的、人耳對(duì)其時(shí)間波形包絡(luò)的精細(xì)細(xì)節(jié)更為敏感的較低頻部分。將T/F 2-1至2-Π的頻域輸出、即多組譜系數(shù)Y [k]工到Y(jié) R] n中的每一個(gè)也分別應(yīng)用于相應(yīng)的比較設(shè)備或功能塊(“比較”)12-1至12-n。在相應(yīng)的比較12-1至12_n中將這些組與對(duì)應(yīng)多組對(duì)應(yīng)時(shí)間塊的估計(jì)譜系數(shù)X[k]jlj XDOn的進(jìn)行比較。將各比較12-1至 12-n中的比較結(jié)果分別應(yīng)用于濾波器計(jì)算器或計(jì)算功能塊(“濾波器計(jì)算”)15-1至15-n。該信息應(yīng)當(dāng)足以進(jìn)行各濾波器計(jì)算以限定各時(shí)間塊的濾波器系數(shù),所述濾波器在應(yīng)用于輸入信號(hào)的解碼重構(gòu)之后應(yīng)得到具有提高的分辨率的時(shí)域包絡(luò)的信號(hào)。換言之,該濾波器將對(duì)信號(hào)進(jìn)行整形以使得它更為接近地復(fù)制原始信號(hào)的時(shí)間包絡(luò)。提高的分辨率是比塊率更精細(xì)的分辨率。下面將進(jìn)一步具體闡述優(yōu)選濾波器。盡管圖1中的示例示出了在頻域上的比較和濾波器計(jì)算,但是原理上也可在時(shí)域上進(jìn)行比較和濾波器計(jì)算。無(wú)論在頻域還是在時(shí)域上進(jìn)行,每時(shí)間塊僅確定一個(gè)濾波器結(jié)構(gòu)(盡管可將相同的濾波器結(jié)構(gòu)應(yīng)用于某一數(shù)量的連續(xù)時(shí)間塊)。盡管原理上可逐帶地(例如,每ERB尺度的頻帶地)確定濾波器結(jié)構(gòu),但是執(zhí)行該操作將需要發(fā)送大量附帶信息位, 這將消除本發(fā)明的優(yōu)勢(shì),即,以較低的比特率增長(zhǎng)來(lái)提高時(shí)域包絡(luò)分辨率。將各比較12-1至12-n中的比較測(cè)定值分別應(yīng)用于判定設(shè)備或功能塊(“判定”)16-1至16-n。各判定將比較測(cè)定值與閾值相比較。比較測(cè)定值可采取各種形式且并非關(guān)鍵。例如,可計(jì)算各對(duì)應(yīng)系數(shù)值之差的絕對(duì)值并對(duì)這些差求和,來(lái)提供單個(gè)數(shù)目,其值表示在一時(shí)間塊期間信號(hào)波形彼此不同的程度??蓪⒃摂?shù)目與閾值進(jìn)行比較,使得如果該數(shù)目超過了閾值,則向?qū)?yīng)的濾波器計(jì)算提供“是”指示。在沒有“是”指示的情況下,可能禁止對(duì)于該塊的濾波器計(jì)算,或者如果計(jì)算的話,則它們可能不通過濾波器計(jì)算輸出。各信號(hào)的這種是/否信息構(gòu)成了可能還應(yīng)用于位流打包器10以包括在位流中的標(biāo)志(因此,可能有多個(gè)標(biāo)志,每個(gè)輸入信號(hào)一個(gè),并且這些標(biāo)志中的每一個(gè)可由一位來(lái)表示)。另選的是,代替來(lái)自對(duì)應(yīng)比較12-1至12-n的信息,或者除了來(lái)自對(duì)應(yīng)比較12_1 至12-n的信息之外,各判定16-1至16-n還可能接收來(lái)自對(duì)應(yīng)濾波器計(jì)算14_1至14_n的信息。相應(yīng)的判定16可采用計(jì)算出的濾波器特性(如,其平均值或其峰值幅值)作為進(jìn)行判定的基礎(chǔ)或輔助進(jìn)行判定。如上所述,各濾波器計(jì)算14-1至14-n提供了比較結(jié)果的表示,這可能構(gòu)成濾波器系數(shù),所述濾波器在應(yīng)用于經(jīng)解碼重構(gòu)的輸入信號(hào)時(shí)將得到具有分辨率提高的時(shí)間包絡(luò)的信號(hào)。如果譜估計(jì)譜系數(shù))(DO1到XDOn是不完全的(在解碼估計(jì)器針對(duì)少于所有輸入音頻信號(hào)、針對(duì)少于輸入音頻信號(hào)的所有時(shí)間塊、并且/或者針對(duì)少于所有頻帶,提供譜系數(shù)的情況下),則可能對(duì)于所有時(shí)間塊、頻帶和輸入信號(hào),不存在各比較12-1至12-n的輸出。 讀者應(yīng)當(dāng)注意,X [k]工到X [k]n是指經(jīng)重構(gòu)的輸出,而Y DO工到Y(jié) [k]n是指輸入。可將各濾波器計(jì)算14-1至14-n的輸出應(yīng)用于位流集合器10。盡管可將濾波器信息與位流分開發(fā)送,但是優(yōu)選地將其作為位流的一部分并作為附帶信息的一部分來(lái)發(fā)送。 當(dāng)將本發(fā)明的方面應(yīng)用于現(xiàn)有的基于塊的編碼系統(tǒng)時(shí),可將由本發(fā)明的方面提供的附加信息插入到這些系統(tǒng)的位流的、旨在載帶附加信息的部分中。在實(shí)際實(shí)施例中,可以按照某種方式,不僅對(duì)音頻信息而且或許對(duì)附帶信息和濾波器系數(shù)進(jìn)行量化或編碼來(lái)是它們的發(fā)送成本最小化。然而,出于簡(jiǎn)潔表示的目的并因?yàn)檫@種細(xì)節(jié)是廣為公知的且無(wú)助于理解本發(fā)明,在圖中未示出量化和反量化。頻域中的維納濾波器設(shè)計(jì)濾波器計(jì)算設(shè)備或功能塊14-1至14-n中的每一個(gè)優(yōu)選地在頻域表征了 HR濾波器,其表示獲得信號(hào)聲道的原始時(shí)間包絡(luò)的更精確再現(xiàn)所需的時(shí)域中的乘法改變。該濾波器問題可公式化為最小二乘問題,這通常稱作維納濾波器設(shè)計(jì)。例如參見X. Rong Li, Probability, Random Signals,and Statistics,CRC Press 1999,New York,pp.423。應(yīng)用維納濾波器技術(shù)具有減少將整形濾波器信息傳輸?shù)浇獯a器所需的附加位的優(yōu)點(diǎn)。通常在時(shí)域設(shè)計(jì)并應(yīng)用維納濾波器的常規(guī)應(yīng)用。 可如下定義頻域最小二乘濾波器設(shè)計(jì)問題給定原始信號(hào)的DFT譜表示Y[k]以及
      這種原始聲道的近似的DFT譜表示XDO,計(jì)算使式1最小化的一組濾波器系數(shù)(am)。注意,
      Y[k]和X[k]是復(fù)數(shù)值,由此通常也是復(fù)數(shù)。

      權(quán)利要求
      1.一種用于音頻信號(hào)解碼的方法,其中,一個(gè)或更多個(gè)輸入音頻信號(hào)已被編碼為位流, 該位流包括音頻信息和與該音頻信息相關(guān)聯(lián)且在對(duì)該位流進(jìn)行解碼時(shí)有用的附帶信息,所述編碼包括如下處理將所述一個(gè)或更多個(gè)輸入音頻信號(hào)中的每一個(gè)劃分為多個(gè)時(shí)間塊, 并且以不高于塊率的頻率對(duì)至少一些所述附帶信息進(jìn)行更新,使得所述音頻信息在被使用附帶信息解碼時(shí)具有受所述塊率限制的分辨率,所述編碼進(jìn)一步包括將至少一個(gè)輸入音頻信號(hào)的包絡(luò)與以經(jīng)編碼的所述至少一個(gè)輸入音頻信號(hào)為基礎(chǔ)的信號(hào)的包絡(luò)進(jìn)行比較,所述比較提供了比較結(jié)果的表示,所述表示有助于提高至少一些所述音頻信息在被解碼時(shí)的分辨率,并且所述編碼進(jìn)一步包括輸出至少一些所述表示,所述方法包括接收所述位流,以及對(duì)所述位流進(jìn)行解碼,所述解碼采用所述音頻信息、所述附帶信息以及所輸出的表示。
      2.根據(jù)權(quán)利要求1所述的方法,其中所述以經(jīng)編碼的所述至少一個(gè)輸入音頻信號(hào)為基礎(chǔ)的信號(hào)包括所述至少一個(gè)輸入音頻信號(hào)的經(jīng)估計(jì)解碼的重構(gòu),該經(jīng)估計(jì)的重構(gòu)采用至少一些所述音頻信息和至少一些所述附帶信息。
      3.根據(jù)權(quán)利要求1所述的方法,其中所述被比較的包絡(luò)包括時(shí)間包絡(luò)。
      4.根據(jù)權(quán)利要求1所述的方法,其中所述輸入音頻信號(hào)包括頻域表示。
      5.根據(jù)權(quán)利要求1所述的方法,其中所述輸入音頻信號(hào)包括時(shí)域表示。
      6.一種音頻信號(hào)解碼器,其中,一個(gè)或更多個(gè)輸入音頻信號(hào)已被編碼為位流,該位流包括音頻信息和與該音頻信息相關(guān)聯(lián)且在對(duì)該位流進(jìn)行解碼時(shí)有用的附帶信息,所述編碼包括以下處理將所述一個(gè)或更多個(gè)輸入音頻信號(hào)中的每一個(gè)劃分為多個(gè)時(shí)間塊;并且以不高于塊率的頻率對(duì)至少一些所述附帶信息進(jìn)行更新,使得所述音頻信息在被使用附帶信息解碼時(shí)具有受所述塊率限制的分辨率,所述編碼進(jìn)一步包括將至少一個(gè)輸入音頻信號(hào)的包絡(luò)與以經(jīng)編碼的所述至少一個(gè)輸入音頻信號(hào)為基礎(chǔ)的信號(hào)的包絡(luò)進(jìn)行比較,所述比較提供了比較結(jié)果的表示,所述表示有助于提高至少一些所述音頻信息在被解碼時(shí)的分辨率, 并且所述編碼進(jìn)一步包括輸出至少一些所述表示,所述音頻信號(hào)解碼器包括用于接收所述位流的裝置,以及用于對(duì)所述位流進(jìn)行解碼的裝置,所述解碼采用所述音頻信息、所述附帶信息以及所輸出的表示。
      7.根據(jù)權(quán)利要求6所述的解碼器,其中所述以經(jīng)編碼的至少一個(gè)輸入音頻信號(hào)為基礎(chǔ)的信號(hào)包括所述至少一個(gè)輸入音頻信號(hào)的經(jīng)估計(jì)解碼的重構(gòu),該經(jīng)估計(jì)的重構(gòu)采用至少一些所述音頻信息和至少一些所述附帶信息。
      8.根據(jù)權(quán)利要求6所述的解碼器,其中所述被比較的包絡(luò)包括時(shí)間包絡(luò)。
      9.根據(jù)權(quán)利要求6所述的解碼器,其中所述輸入音頻信號(hào)包括頻域表示。
      10.根據(jù)權(quán)利要求6所述的解碼器,其中所述輸入音頻信號(hào)包括時(shí)域表示。
      11.一種音頻解碼器,包括位流解包器,被配置為接收經(jīng)編碼的信號(hào)并且從所述經(jīng)編碼的信號(hào)中提取經(jīng)編碼的音頻信息和附帶信息;基于塊的解碼器,被配置為對(duì)經(jīng)編碼的音頻信息進(jìn)行解碼;整形濾波器,被配置為基于至少部分所述附帶信息對(duì)所述經(jīng)解碼的音頻信息進(jìn)行整形。
      12.根據(jù)權(quán)利要求11所述的音頻解碼器,其中附帶信息包括音頻信號(hào)的包絡(luò)與經(jīng)編碼的該音頻信號(hào)的包絡(luò)的包絡(luò)比較。
      13.根據(jù)權(quán)利要求11所述的音頻解碼器,其中所述音頻解碼器被配置為以所述經(jīng)編碼的信號(hào)的塊率對(duì)所述附帶信息進(jìn)行更新。
      14.根據(jù)權(quán)利要求11所述的音頻解碼器,其中所述音頻解碼器被配置為從經(jīng)編碼的信號(hào)來(lái)解碼多個(gè)音頻信道,并且基于相應(yīng)的經(jīng)解碼的信道的原始音頻信號(hào)使用整形比較對(duì)每個(gè)經(jīng)解碼的音頻信道進(jìn)行整形。
      15.一種用于對(duì)合成的輸出信號(hào)的時(shí)間包絡(luò)進(jìn)行整形以更接近地近似于輸入信號(hào)的時(shí)間包絡(luò)的方法,所述方法包括接收包含縮混信號(hào)和包絡(luò)附帶信息的經(jīng)空間編碼的位流,其中所述縮混信號(hào)包括被劃分成時(shí)隙的音頻信息,并且包絡(luò)附帶信息與音頻信息相關(guān)并且在對(duì)合成的輸出信號(hào)的時(shí)間包絡(luò)進(jìn)行整形時(shí)有用,包絡(luò)附帶信息表示輸入信號(hào)的包絡(luò)與從縮混信號(hào)導(dǎo)出的信號(hào)的包絡(luò)的比較的結(jié)果,縮混信號(hào)至少?gòu)乃鲚斎胄盘?hào)縮混,對(duì)所述經(jīng)空間編碼的位流進(jìn)行解碼以產(chǎn)生合成的輸出信號(hào),以及根據(jù)包絡(luò)附帶信息對(duì)合成的輸出信號(hào)的時(shí)間包絡(luò)進(jìn)行整形以更接近地近似于輸入信號(hào)的時(shí)間包絡(luò)。
      16.根據(jù)權(quán)利要求15所述的方法,其中,時(shí)隙的粒度與相對(duì)于縮混信號(hào)的包絡(luò)的輸入信號(hào)的包絡(luò)相關(guān)。
      17.根據(jù)權(quán)利要求15所述的方法,其中,對(duì)位流進(jìn)行解碼包括利用所述包絡(luò)附帶信息控制去相關(guān)整形濾波器。
      18.根據(jù)權(quán)利要求15所述的方法,其中,輸入信號(hào)的包絡(luò)與從縮混信號(hào)導(dǎo)出的信號(hào)的包絡(luò)的比較包括被比較的包絡(luò)的附帶信息中的表示。
      19.根據(jù)權(quán)利要求15所述的方法,其中,經(jīng)空間編碼的位流包括由一個(gè)或多個(gè)輸入音頻信號(hào)構(gòu)成的位流。
      20.根據(jù)權(quán)利要求19所述的方法,其中,所述一個(gè)或多個(gè)輸入音頻信號(hào)包括多信道聲場(chǎng)。
      21.根據(jù)權(quán)利要求15所述的方法,其中,音頻信息被劃分成的時(shí)隙中的每一個(gè)包含時(shí)間塊。
      22.根據(jù)權(quán)利要求21所述的方法,其中,時(shí)隙的粒度包含由時(shí)間塊的塊率限制的分辨率。
      23.根據(jù)權(quán)利要求21所述的方法,其中,時(shí)間塊具有限制包絡(luò)附帶信息的分辨率的塊率。
      24.根據(jù)權(quán)利要求15所述的方法,其中,從縮混信號(hào)導(dǎo)出的信號(hào)包括所述輸入信號(hào)的經(jīng)估計(jì)解碼的重構(gòu)。
      25.一種用于對(duì)合成的輸出信號(hào)的時(shí)間包絡(luò)進(jìn)行整形以更接近地近似于輸入信號(hào)的時(shí)間包絡(luò)的設(shè)備,所述設(shè)備包括用于接收包含縮混信號(hào)和包絡(luò)附帶信息的經(jīng)空間編碼的位流的裝置,其中所述縮混信號(hào)包括被劃分成時(shí)隙的音頻信息,并且包絡(luò)附帶信息與音頻信息相關(guān)并且在對(duì)合成的輸出信號(hào)的時(shí)間包絡(luò)進(jìn)行整形時(shí)有用, 包絡(luò)附帶信息表示輸入信號(hào)的包絡(luò)與從縮混信號(hào)導(dǎo)出的信號(hào)的包絡(luò)的比較的結(jié)果,縮混信號(hào)至少?gòu)乃鲚斎胄盘?hào)縮混,用于對(duì)所述經(jīng)空間編碼的位流進(jìn)行解碼以產(chǎn)生合成的輸出信號(hào)的裝置,以及用于根據(jù)包絡(luò)附帶信息對(duì)合成的輸出信號(hào)的時(shí)間包絡(luò)進(jìn)行整形以更接近地近似于輸入信號(hào)的時(shí)間包絡(luò)的裝置。
      26.根據(jù)權(quán)利要求25所述的設(shè)備,其中,時(shí)隙的粒度與相對(duì)于縮混信號(hào)的包絡(luò)的輸入信號(hào)的包絡(luò)相關(guān)。
      27.根據(jù)權(quán)利要求25所述的設(shè)備,其中,用于對(duì)位流進(jìn)行解碼的裝置包括用于利用所述包絡(luò)附帶信息控制去相關(guān)整形濾波器的裝置。
      28.根據(jù)權(quán)利要求25所述的設(shè)備,其中,輸入信號(hào)的包絡(luò)與從縮混信號(hào)導(dǎo)出的信號(hào)的包絡(luò)的比較包括被比較的包絡(luò)的附帶信息中的表示。
      29.根據(jù)權(quán)利要求25所述的設(shè)備,其中,經(jīng)空間編碼的位流包括由一個(gè)或多個(gè)輸入音頻信號(hào)構(gòu)成的位流。
      30.根據(jù)權(quán)利要求四所述的設(shè)備,其中,所述一個(gè)或多個(gè)輸入音頻信號(hào)包括多信道聲場(chǎng)。
      31.根據(jù)權(quán)利要求25所述的設(shè)備,其中,音頻信息被劃分成的時(shí)隙中的每一個(gè)包含時(shí)間塊。
      32.根據(jù)權(quán)利要求31所述的設(shè)備,其中,時(shí)隙的粒度包含由時(shí)間塊的塊率限制的分辨率。
      33.根據(jù)權(quán)利要求31所述的設(shè)備,其中,時(shí)間塊具有限制包絡(luò)附帶信息的分辨率的塊率。
      34.根據(jù)權(quán)利要求25所述的設(shè)備,其中,從縮混信號(hào)導(dǎo)出的信號(hào)包括所述輸入信號(hào)的經(jīng)估計(jì)解碼的重構(gòu)。
      全文摘要
      本發(fā)明涉及利用頻域維納濾波對(duì)空間音頻編碼進(jìn)行時(shí)間包絡(luò)整形。特定類型的參數(shù)空間編碼編碼器采用聲道間幅值差、聲道間時(shí)間差以及聲道間相干或相關(guān)性來(lái)建立多聲道聲場(chǎng)的參數(shù)模型,解碼器采用該參數(shù)模型來(lái)構(gòu)造對(duì)原始聲場(chǎng)的近似。然而,所述參數(shù)模型沒有構(gòu)造聲場(chǎng)聲道的原始時(shí)間包絡(luò),而聲場(chǎng)聲道的原始時(shí)間包絡(luò)被發(fā)現(xiàn)對(duì)于一些音頻信號(hào)極為重要。本發(fā)明在空間編碼系統(tǒng)中對(duì)一個(gè)或更多個(gè)解碼聲道的時(shí)間包絡(luò)進(jìn)行整形以更好地與一個(gè)或更多個(gè)原始時(shí)間包絡(luò)相匹配。
      文檔編號(hào)G10L19/02GK102270453SQ201110236398
      公開日2011年12月7日 申請(qǐng)日期2005年8月15日 優(yōu)先權(quán)日2004年8月25日
      發(fā)明者阿蘭·J·澤費(fèi)爾特, 馬克·S·溫頓 申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1