国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      音頻編碼器、音頻解碼器、提供編碼及解碼音頻信息的方法、計(jì)算機(jī)程序及使用信號適應(yīng)...的制作方法_3

      文檔序號:9510214閱讀:來源:國知局
      別輸入音 頻信息的不能以足夠或所要的質(zhì)量解碼的部分。換言之,偵測器240應(yīng)辨識(shí)何時(shí)低頻部分 的編碼表示222單獨(dú)地不允許具有足夠質(zhì)量的盲帶寬擴(kuò)展。不同而言,偵測器240較佳識(shí) 別輸入音頻信息的部分,對于該部分,不可以足夠(或所要的)準(zhǔn)確度來基于低頻部分估計(jì) 帶寬擴(kuò)展參數(shù)從而達(dá)成可接受(或所要的)音頻質(zhì)量。因此,偵測器240可針對輸入音頻 信息的不能基于使用盲帶寬擴(kuò)展(亦即,不自編碼器接收任何帶寬擴(kuò)展信息)的低頻部分 的編碼表示222以足夠或所要的質(zhì)量解碼的部分而使用控制信號242判定應(yīng)將帶寬擴(kuò)展信 息包括至編碼音頻信息中。等效地,偵測器可針對輸入音頻信息的不能以足夠或所要的準(zhǔn) 確度來基于低頻部分(或等效地,低頻部分的編碼表示222)估計(jì)帶寬擴(kuò)展參數(shù)的部分而使 用控制信號242判定應(yīng)將帶寬擴(kuò)展信息包括至編碼音頻信息中。
      [0075] 為了識(shí)別應(yīng)將帶寬擴(kuò)展信息包括至編碼音頻信息中的此等部分(或等效地,為了 識(shí)別輸入音頻信息的不必將帶寬擴(kuò)展信息包括至編碼音頻信息212中的部分),偵測器240 可使用不同策略。如上文所提及,偵測器240可接收不同類型的輸入信息。在一些狀況下, 是否應(yīng)將帶寬擴(kuò)展信息包括至編碼音頻信息212中的偵測器決策可僅基于輸入音頻信息 210。換言之,偵測器240可(例如)被配置為分析輸入音頻信息210以發(fā)現(xiàn),對于輸入音 頻信息的哪些部分(其對應(yīng)于編碼音頻信息212的部分),有必要將帶寬擴(kuò)展信息232包括 至編碼音頻信息212中以達(dá)成可接受(或所要的)音頻質(zhì)量。然而,偵測器240的決策可 替代地基于由低頻編碼器200提供的一些控制信息或中間信息224。替代地或另外,偵測器 240的決策可基于輸入音頻信息210的低頻部分的編碼表示222。因此,偵測器可評估不同 量以判定(或估計(jì))音頻解碼器側(cè)處的盲帶寬擴(kuò)展是否將導(dǎo)致足夠音頻質(zhì)量(或可能導(dǎo)致 足夠音頻質(zhì)量,或預(yù)期導(dǎo)致足夠音頻質(zhì)量)。
      [0076] 舉例而言,偵測器可判定輸入音頻信息210的部分是否為時(shí)間上穩(wěn)定的部分,且 輸入音頻信息210的部分是否具有低通性質(zhì)。舉例而言,偵測器240可推斷,對于被發(fā)現(xiàn)為 時(shí)間上穩(wěn)定的部分且具有低通性質(zhì)的部分,不必將帶寬擴(kuò)展信息包括至編碼音頻信息212 中,這是因?yàn)橐颜J(rèn)識(shí)到,通??稍谝纛l解碼器側(cè)處甚至使用盲帶寬擴(kuò)展以足夠良好的音頻 質(zhì)量來再現(xiàn)輸入音頻信息210的此等部分。這歸因于如下事實(shí):盲帶寬擴(kuò)展通常對輸入音 頻信息(或內(nèi)容)的不包含音頻內(nèi)容的強(qiáng)改變(或不包含音頻內(nèi)容的任何瞬變或其他強(qiáng)變 化)且可因此被視為在時(shí)間上穩(wěn)定的部分良好地起作用。此外,已發(fā)現(xiàn),盲帶寬擴(kuò)展對音頻 內(nèi)容的包含低通性質(zhì)的部分(亦即,對音頻內(nèi)容的低頻部分的強(qiáng)度高于高頻部分的強(qiáng)度的 部分)良好地起作用,這是因?yàn)榇饲樾螢榇蠖鄶?shù)盲帶寬擴(kuò)展概念的基礎(chǔ)假定。因此,對于具 有低通性質(zhì)的此等時(shí)間上穩(wěn)定的部分,偵測器240可使用控制信號242來用信號通知選擇 性地省略帶寬擴(kuò)展信息至編碼音頻信息212中的包括。
      [0077] 舉例而言,偵測器240可被配置為識(shí)別輸入音頻信息的包含有聲語音的部分,及/ 或輸入音頻信息的包含環(huán)境噪聲的部分,及/或輸入音頻信息的包含無打擊樂器聲的音樂 的部分。輸入音頻信息的此等部分通常為時(shí)間上穩(wěn)定的且包含低通性質(zhì),使得對于此等部 分,偵測器240通常用信號通知省略帶寬擴(kuò)展信息至編碼音頻信息中的包括。
      [0078] 替代地或另外,偵測器240可分析是否可基于低頻部分的頻譜包絡(luò)以合理準(zhǔn)確度 (例如,使用由盲帶寬擴(kuò)展應(yīng)用的概念)預(yù)測輸入音頻信息的高頻部分中的頻譜形狀。因 此,偵測器可(例如)被配置為判定低頻部分的頻譜包絡(luò)(例如,其可由中間信息224或由 低頻部分的編碼表示222描述)與高頻部分的頻譜包絡(luò)(例如,其可由偵測器240基于輸 入音頻信息210判定)之間的差是否大于或等于預(yù)定義差度量。舉例而言,偵測器240可 依據(jù)強(qiáng)度差或依據(jù)形狀差異或依據(jù)隨頻率的變化或依據(jù)頻譜包絡(luò)的任何其他特性特征來 判定該差。因此,偵測器240可響應(yīng)于發(fā)現(xiàn)低頻部分的頻譜包絡(luò)與高頻部分的頻譜包絡(luò)之 間的差大于或等于預(yù)定義差度量而決定(及用信號通知)將帶寬擴(kuò)展信息232包括至輸入 音頻信息中。換言之,偵測器240可判定可基于低頻部分的頻譜包絡(luò)預(yù)測高頻部分的頻譜 包絡(luò)的良好程度,且若該預(yù)測不可能伴隨有良好結(jié)果(例如,其為若高頻部分的所預(yù)測頻 譜包絡(luò)與高頻部分的實(shí)際頻譜包絡(luò)存在很大不同的狀況),則可推斷在音頻解碼器側(cè)處將 需要帶寬擴(kuò)展信息232。然而,替代比較高頻部分的所預(yù)測頻譜包絡(luò)與高頻部分的實(shí)際頻譜 包絡(luò),偵測器240可替代地比較低頻部分的頻譜包絡(luò)與高頻部分的頻譜包絡(luò)。若假定在應(yīng) 用盲帶寬估計(jì)時(shí)高頻部分的頻譜包絡(luò)通常類似于低頻部分的頻譜包絡(luò),則此比較有意義。
      [0079] 替代地或另外,偵測器240可識(shí)別包含無聲語音的部分及/或包含打擊聲的部分。 由于在此等狀況下,高頻部分的頻譜包絡(luò)通常與低頻部分的頻譜包絡(luò)存在很大不同,因此 偵測器可針對輸入音頻信息(或編碼音頻信息)的包含無聲語音或包含打擊聲的此等部分 而用信號通知將帶寬擴(kuò)展信息包括至編碼音頻表示中。
      [0080] 然而,替代地或另外,偵測器240可分析輸入音頻信息210的部分的頻譜傾斜量。 又,偵測器240可使用關(guān)于輸入音頻信息的部分的頻譜傾斜量的信息以決定是否應(yīng)將帶寬 擴(kuò)展信息232包括至編碼音頻信息212中。此概念基于以下想法:盲帶寬擴(kuò)展對音頻內(nèi)容 的在與高頻范圍相比時(shí)在低頻范圍中存在更多能量(或大體上為強(qiáng)度)的部分良好地起 作用。相比之下,若高頻部分(亦指定為高頻范圍)為"占優(yōu)勢的",亦即,包含大量能量, 則盲帶寬擴(kuò)展通常不可良好地再現(xiàn)音頻內(nèi)容,使得應(yīng)將帶寬擴(kuò)展信息包括至編碼音頻信息 中。因此,在一些實(shí)施例中,偵測器判定頻譜傾斜量(其描述能量或大體上強(qiáng)度在頻率上的 分布)是否大于或等于固定或可變的傾斜量閾值。若頻譜傾斜量大于或等于固定或可變的 傾斜量閾值(其意謂至少在與能量或強(qiáng)度隨頻率增加而減小的"正常"狀況相比時(shí)在音頻 內(nèi)容的高頻部分中存在相對大的能量或強(qiáng)度),則偵測器可決定將帶寬擴(kuò)展信息包括至編 碼音頻信息中。
      [0081 ] 除上文所提及的特征中的一些或全部外,偵測器亦可評估輸入音頻信息的部分的 過零率。此外,是否包括帶寬擴(kuò)展信息的偵測器決策亦可基于所判定的過零率是否大于或 等于固定或可變的過零率閾值。此概念基于以下考慮:高過零率通常指示高頻在輸入音頻 信息中起重要作用,此又指示應(yīng)在音頻解碼器側(cè)處使用參數(shù)導(dǎo)引式帶寬擴(kuò)展。
      [0082] 此外,應(yīng)注意,偵測器240可較佳使用一些滯后以避免在以下兩者之間的過多切 換:帶寬擴(kuò)展信息232至編碼音頻信息中的包括,及該包括的省略。舉例而言,可將滯后應(yīng) 用于可變傾斜量閾值、可變過零率閾值或用以關(guān)于自帶寬擴(kuò)展信息的包括至該包括的避免 或自該包括的避免至該包括的轉(zhuǎn)變而作出決策的任何其他閾值。因此,滯后可使閾值變化, 以便減小在針對輸入音頻信息的當(dāng)前部分而包括帶寬擴(kuò)展信息時(shí)切換至帶寬擴(kuò)展信息的 包括的省略的機(jī)率。類似地,可使閾值變化,以減少在針對輸入音頻信息的當(dāng)前部分而避免 帶寬擴(kuò)展信息的包括時(shí)切換至帶寬擴(kuò)展信息的包括的機(jī)率。因此,可減少可由不同模式之 間的轉(zhuǎn)變引起的偽訊。
      [0083] 在下文中,將論述關(guān)于帶寬擴(kuò)展信息提供器230的一些細(xì)節(jié)。詳言之,將解釋響應(yīng) 于偵測器用信號通知應(yīng)將帶寬擴(kuò)展信息232包括至編碼音頻信息中而將哪一信息包括至 編碼音頻信息212中。出于解釋的目的,亦將參看圖3,其展示輸入音頻信息的頻率部分及 包括至編碼音頻表示中的參數(shù)的示意性表示。橫坐標(biāo)310描述頻率,且縱坐標(biāo)312描述不 同頻譜頻格(例如,如MDCT系數(shù)、QMF系數(shù)、FFT系數(shù)或其類似者)的強(qiáng)度(例如,如振幅或 能量的強(qiáng)度)。如可見的,輸入音頻信息的低頻部分可(例如)涵蓋自較低頻率邊界(例 如,0或50Hz,或300Hz,或任何其他合理的較低頻率邊界)直至大約6. 4kHz的頻率的頻率 范圍。如可見的,可為此低頻部分(例如,自300Hz至6. 4kHz,或其類似者)提供編碼表示 222。此外,存在(例如)范圍為自6. 4kHz至8kHz的高頻部分。然而,高頻部分當(dāng)然可涵 蓋通常由人類接聽者可感知的頻率范圍限制的不同頻率范圍。然而,在圖3中可見,作為一 實(shí)例,以參考數(shù)字320展示的頻譜包絡(luò)在高頻部分中包含不規(guī)則形狀。此外,可見頻譜包絡(luò) 320在高頻部分中包含相對大的能量,且甚至包含在7. 2kHz與7. 6kHz之間的相對高的能 量。作為比較,亦在圖3中展示第二頻譜包絡(luò)330,其中第二頻譜包絡(luò)330展示高頻部分中 的強(qiáng)度或能量(例如,每單位頻率)的減退。因此,頻譜包絡(luò)320通常將使偵測器針對包含 頻譜包絡(luò)320的部分而決定將帶寬擴(kuò)展信息包括至編碼音頻表示中,而頻譜包絡(luò)330通常 將使偵測器針對音頻內(nèi)容的包含頻譜包絡(luò)330的部分而決定省略帶寬擴(kuò)展信息的包括。
      [0084] 如進(jìn)一步可見的,對于音頻內(nèi)容的包含頻譜包絡(luò)320的部分,四個(gè)標(biāo)量參數(shù)將作 為帶寬擴(kuò)展信息包括至編碼音頻表示中。第一標(biāo)量參數(shù)可(例如)描述在6. 4kHz與6. SkHz 之間的頻率區(qū)域的頻譜包絡(luò)(或頻譜包絡(luò)的平均值),第二標(biāo)量參數(shù)可描述在6. SkHz與 7. 2kHz之間的頻率區(qū)域的頻譜包絡(luò)320 (或其平均值),第三標(biāo)量參數(shù)可描述在7. 2kHz與 7. 6kHz之間的頻率區(qū)域的頻譜包絡(luò)320 (或其平均值),且第四標(biāo)量參數(shù)可描述在7. 6kHz 與8kHz之間的頻率區(qū)域的頻譜包絡(luò)(或其平均值)。該標(biāo)量參數(shù)可以絕對或相對方式描述 (例如)關(guān)于頻譜上先前的頻率范圍(或區(qū)域)的頻譜包絡(luò)。舉例而言,第一標(biāo)量參數(shù)可描 述以下兩者之間的強(qiáng)度比率(例如,其可經(jīng)正規(guī)化至某一量):在6. 4kHz與6. SkHz之間的 頻率區(qū)域中的頻譜包絡(luò),及在較低頻率區(qū)域(例如,低于6. 4kHz)中的頻譜包絡(luò)。第二、第 三及第四標(biāo)量參數(shù)可(例如)描述鄰近頻率范圍中的頻譜包絡(luò)(的強(qiáng)度)之間的差(或比 率),使得(例如)第二標(biāo)量參數(shù)可描述以下兩者之間的比率:在6. SkHz與7. 2kHz之間的 頻率范圍中的頻譜包絡(luò)(的平均值),及在6. 4kHz與6. 8kHz之間的頻率范圍中的頻譜包 絡(luò)。
      [0085] 此外,應(yīng)注意到,在任何狀況下可包括低頻部分的編碼表示,亦即,低于6. 4kHz的 頻率部分??墒褂檬熘幋a概念中的任一者來編碼低于6. 4kHz的頻率部分(低頻部分), 例如,使用如AAC (或其衍生編碼)的"一般音頻"編碼或語音寫碼(例如,如CELP、ACELP 或其衍生編碼)。因此,對于音頻內(nèi)容的包含頻譜包絡(luò)320的部分,低頻部分的編碼表示與 四個(gè)標(biāo)量帶寬擴(kuò)展參數(shù)(可使用相對少量比特來量化該參數(shù))兩者將包括至編碼音頻表示 中。相比之下,對于音頻內(nèi)容的包含頻譜包絡(luò)330的部分,僅低頻部分的編碼表示將包括至 編碼音頻表示中,但無(標(biāo)量)帶寬擴(kuò)展參數(shù)將包括至編碼音頻表示中(然而,此情形不會(huì) 引起嚴(yán)重問題,這是因?yàn)轭l譜包絡(luò)330展現(xiàn)可使用盲帶寬擴(kuò)展來良好地再現(xiàn)的規(guī)則及減退 (低通)特性)。
      [0086] 總之,音頻編碼器200被配置為以信號適應(yīng)性方式選擇性地將表示輸入音頻信息 的高頻部分的頻譜包絡(luò)的參數(shù)作為帶寬擴(kuò)展信息包括至編碼音頻信息中。舉例而言,可以 信號適應(yīng)性方式將參看圖3所提及的標(biāo)量帶寬擴(kuò)展參數(shù)包括至編碼音頻信息中。一般而 言,較低頻率編碼器220可被配置為編碼輸入音頻信息210的低頻部分,該低頻部分包含 高達(dá)位于6kHz與7kHz之間的范圍中的最大頻率(其中已在圖3的實(shí)例中使用6. 4kHz的 邊界)的頻率。此外,音頻編碼器可被配置為選擇性地將三個(gè)至五個(gè)參數(shù)包括至編碼音頻 表示中,該參數(shù)描述具有在300Hz與500Hz之間的帶寬的高頻信號部分的強(qiáng)度。在圖3的 實(shí)例中,已展示描述具有大約400Hz的帶寬的高頻信號部分的強(qiáng)度的四個(gè)標(biāo)量參數(shù)。換言 之,音頻編碼器可被配置為將描述四個(gè)高頻信號部分的強(qiáng)度的四個(gè)標(biāo)量量化參數(shù)包括至編 碼音頻表示中,該高頻信號部分涵蓋高于低頻部分(例如,如參看圖3所解釋)的頻率范圍 (例如,如圖3中所展示)。舉例而言,音頻編碼器可被配置為選擇性地將描述頻譜上鄰近 的頻率部分的能量或強(qiáng)度之間的關(guān)系的多個(gè)參數(shù)包括至編碼音頻表示中,其中,該參數(shù)中 的一個(gè)描述第帶寬擴(kuò)展高頻部分的能量或強(qiáng)度與低頻部分的能量或強(qiáng)度之間的比率,且其 中,該參數(shù)中的其他參數(shù)描述其他帶寬擴(kuò)展高頻部分(其中,該帶寬擴(kuò)展高頻部分可為在 6. 4kHz 與 6. 8kHz 之間、在 6. 8kHz 與 7. 2kHz 之間、在 7. 2kHz 與 7. 6kHz 之間及在 7. 6kHz 與 SkHz之間的頻率部分的能量或強(qiáng)度之間的比率)。替代地,可向量量化三個(gè)至五個(gè)包絡(luò)形 狀參數(shù)(描述高頻信號部分的強(qiáng)度)。向量量化通常稍微比標(biāo)量量化更有效。另一方面,向 量量化比標(biāo)量量化更復(fù)雜。換言之,可替代地使用向量量化(而非使用標(biāo)量量化)執(zhí)行四 個(gè)帶寬擴(kuò)展能量值的量化。
      [0087] 總之,音頻編碼器可被配置為將相對簡單的帶寬擴(kuò)展信息包括至編碼音頻表示 中,使得僅對于輸入音頻信息(或編碼音頻表示)的由偵測器發(fā)現(xiàn)將需要參數(shù)導(dǎo)引式帶寬 擴(kuò)展的部分,稍微增加編碼音頻表示的比特率。
      [0088] 3.根據(jù)圖4的音頻解碼器
      [0089] 圖4展示根據(jù)本發(fā)明的實(shí)施例的音頻解碼器的方塊示意圖。根據(jù)圖4的音頻解碼 器400接收編碼音頻信息410 (例如,其可由音頻編碼器100或音頻編碼器200提供),且基 于編碼音頻信息提供解碼音頻信息412。
      [0090] 音頻解碼器400包含低頻解碼器420,其接收編碼音頻信息410 (或至少包括于其 中的低頻部分的編碼表示),解碼低頻部分的編碼表示且獲得低頻部分的解碼表示422。音 頻解碼器400亦包含帶寬擴(kuò)展430,被配置為針對(編碼)音頻內(nèi)容(由編碼音頻信息410 表示)的無帶寬擴(kuò)展參數(shù)包括于編碼音頻信息410中的部分而使用盲帶寬擴(kuò)展來獲得帶 寬擴(kuò)展信號432,且針對音頻內(nèi)容的有帶寬擴(kuò)展參數(shù)包括于編碼音頻信息(或編碼音頻表 示)410中的部分而使用參數(shù)導(dǎo)引式帶寬擴(kuò)展(使用包括于編碼音頻信息410中的帶寬擴(kuò) 展信息或帶寬擴(kuò)展參數(shù))來獲得帶寬擴(kuò)展信號432。
      [0091] 因此,音頻解碼器400能夠無關(guān)于帶寬擴(kuò)展參數(shù)是否包括于編碼音頻信息410中 而執(zhí)行帶寬擴(kuò)展。因此,音頻解碼器可適于編碼音頻信息410,且考慮存在盲帶寬擴(kuò)展與參 數(shù)導(dǎo)引式帶寬擴(kuò)展之間的切換的概念。因此,音頻解碼器400能夠處置編碼音頻信息410, 其中僅針對音頻內(nèi)容的不可使用盲帶寬擴(kuò)展以足夠質(zhì)量重建構(gòu)的部分(例如,幀)而包括 帶寬擴(kuò)展參數(shù)。因此,可提供解碼音頻信息4
      當(dāng)前第3頁1 2 3 4 5 6 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1