国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于確定音頻系統(tǒng)的感知質(zhì)量的方法和系統(tǒng)的制作方法

      文檔序號:7914039閱讀:232來源:國知局
      專利名稱:用于確定音頻系統(tǒng)的感知質(zhì)量的方法和系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種用于關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備(例如語音處理系統(tǒng))的輸出信號的感知質(zhì)量。本發(fā)明還涉及一種包括例如存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行代碼的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)可執(zhí)行代碼適于在由處理器執(zhí)行時(shí)執(zhí)行這樣的方法。最后,本發(fā)明涉及一種用于關(guān)于音頻系統(tǒng)的用作參考信號的輸入信號確定質(zhì)量指標(biāo)的系統(tǒng),該質(zhì)量指標(biāo)代表音頻系統(tǒng)的輸出信號的感知質(zhì)量。
      背景技術(shù)
      可以主觀或者客觀地確定音頻設(shè)備的質(zhì)量。主觀測試耗費(fèi)時(shí)間、昂貴并且難以再現(xiàn)。因此已經(jīng)開發(fā)若干方法以客觀方式測量音頻設(shè)備的輸出信號(特別是語音信號)的質(zhì)量。在這樣的方法中,通過與參考信號比較來確定如從語音信號處理系統(tǒng)接收的輸出信號的語音質(zhì)量。廣泛用于這一目的的當(dāng)前方法是在標(biāo)題為“Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs,,的 ITU-T Recommendation P.862 中描述的方法。在ITU-T Recommendation P. 862中將確定來自語音信號處理系統(tǒng)的輸出信號(該信號一般失真)的質(zhì)量。輸出信號和參考信號(例如語音信號處理系統(tǒng)的輸入信號) 根據(jù)人類聽覺系統(tǒng)的心理-生理(psycho-physical)感知模型映射到表示信號?;谶@些信號,確定差分信號,該差分信號代表如與參考信號相比的輸出信號內(nèi)的失真。然后根據(jù)其中已經(jīng)對基于測試的人類聽力感知的某些性質(zhì)建模的認(rèn)知模型處理差分信號以獲得質(zhì)量信號,該質(zhì)量信號是輸出信號的聽覺感知的質(zhì)量的測量。一般而言,客觀測量系統(tǒng)(比如PESQ)在質(zhì)量減少方面解釋噪聲。然而這一解釋過于簡單。在當(dāng)今電信系統(tǒng)(具體為使用IP語音(VOIP)和相似技術(shù)的系統(tǒng))中,噪聲對語音質(zhì)量的影響依賴于局部信號電平而變化。因而PESQ常常未提供在變得越來越流行的這樣的電信系統(tǒng)中處理的語音信號的最優(yōu)感知預(yù)測。

      發(fā)明內(nèi)容
      希望具有一種確定音頻系統(tǒng)的傳輸質(zhì)量的方法,該方法提供在如客觀測量確定的語音質(zhì)量與如在主觀測試中確定的語音質(zhì)量之間的改進(jìn)相關(guān)性。出于這一目的,本發(fā)明的實(shí)施例涉及一種用于關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備(例如語音處理系統(tǒng))的輸出信號的感知質(zhì)量,其中處理和比較參考信號和輸出信號,并且該處理包括將參考信號和輸出信號劃分成相互對應(yīng)時(shí)間幀,其中處理該還包括將參考信號縮放成固定聲強(qiáng)級;基于對縮放的參考信號執(zhí)行的測量來選擇輸出信號的時(shí)間幀;基于輸出信號的所選時(shí)間幀來計(jì)算噪聲對比度參數(shù),噪聲對比度參數(shù)是信號內(nèi)的噪聲對比度的測量; 基于噪聲對比度參數(shù)在感知響度域中應(yīng)用參考信號和輸出信號中的至少一個(gè)的噪聲抑制; 將參考信號和輸出信號感知相減以形成差值信號并且根據(jù)差值信號導(dǎo)出質(zhì)量指標(biāo)。質(zhì)量指標(biāo)提供音頻系統(tǒng)的傳輸質(zhì)量的客觀指示,該指示可以用來相互比較不同音頻系統(tǒng)??梢杂酶鶕?jù)PESQ已知的方式執(zhí)行質(zhì)量指示的導(dǎo)出。噪聲對比度涉及優(yōu)選隨時(shí)間測量的噪聲電平的變化。將考慮噪聲電平的絕對值和噪聲的方差。噪聲電平隨時(shí)間的變化可以在確定噪聲對比度參數(shù)時(shí)發(fā)揮相關(guān)作用。圖6A-6F 示出了作為時(shí)間函數(shù)的噪聲電平的示意圖以進(jìn)一步說明噪聲對比度的概念。圖6A示出了作為時(shí)間函數(shù)的噪聲電平的示例性圖,該圖示范噪聲對比度的概念。 在這一例子中,平均噪聲電平例如在時(shí)間段&期間一般駐留于某一基本電平周圍并且例如在時(shí)間段T1期間偶爾具有更高噪聲電平。圖6A中的信號的噪聲對比度涉及如在時(shí)間段T1 期間存在的高噪聲電平與如在時(shí)間段G期間存在的普通噪聲電平之間的差。噪聲對比度對音頻設(shè)備的輸出信號的感知質(zhì)量有影響。如果這樣的輸出信號將包括如圖6A中所示的噪聲模式,則超過正常噪聲電平的更高噪聲電平部分的存在可能如被收聽者體驗(yàn)為高度干擾。具體而言,噪聲電平的改變使收聽者集中于噪聲。可變噪聲電平因此一般被體驗(yàn)為比恒定噪聲電平更令人煩躁??梢酝ㄟ^相互比較信號的不同部分來確定噪聲對比度。每個(gè)部分可以具有某一長度。參考圖6B、6C中所示圖示范對在噪聲對比度評價(jià)中使用的信號部分時(shí)間區(qū)間長度的影響。圖6B、6C示出了兩個(gè)信號的噪聲電平。對于兩個(gè)信號,噪聲正態(tài)分布(normally distributed)。信號的噪聲電平具有相同均值噪聲電平,然而噪聲的方差不同。圖6B中的噪聲的3 ο置信度區(qū)間大于圖6C中所示3 ο置信度區(qū)間。注意置信度區(qū)間內(nèi)所示規(guī)則噪聲電平變化不可能在現(xiàn)實(shí)中出現(xiàn)并且僅用來示出信號可以在置信度區(qū)間內(nèi)廣泛變化。在圖6B、6C中,如果用來評價(jià)噪聲對比度的信號部分充分大(例如時(shí)間段/P,則在這些信號部分內(nèi)的平均噪聲電平值等于噪聲電平的均值。將針對所有信號部分發(fā)現(xiàn)這一個(gè)值從而產(chǎn)生等于零的噪聲對比度。然而如果用來評價(jià)噪聲對比度的部分的時(shí)間段相對短(例如圖6A、6B中所示長度 G),則在每個(gè)部分內(nèi)的噪聲電平的平均值將完全不同于長期均值噪聲電平值和其他部分。 噪聲對比度然后將因此不等于零。在這樣的情況下,噪聲電平的方差可以對噪聲對比度具有顯著影響。圖6B中的信號的噪聲方差大于圖6C中的信號的噪聲方差。由于圖6B的信號中的噪聲電平值的更寬展開,所以在所選短時(shí)間段內(nèi)的平均噪聲電平與更長期均值噪聲電平之間的差將一般大于在圖6C中所示信號的相似評價(jià)期間獲得的這樣的差值。因而,如果使用短時(shí)間段,則圖6B中的信號的噪聲對比度將大于圖6C中的信號的噪聲對比度。如參考圖6B、6C描述的噪聲對比度對于收聽者體驗(yàn)的干擾而言指示性更低。因此優(yōu)選將充分長的時(shí)間段選擇用于噪聲對比度的評價(jià)。一般而言,噪聲對比度參數(shù)可以定義為在信號的部分內(nèi)的噪聲對比度的測量。更具體而言,噪聲對比度參數(shù)是在輸出信號內(nèi)的所選部分(例如所選時(shí)間幀)之間的噪聲電平變化的測量。信號部分的選擇可以基于人類聽覺系統(tǒng)的心理生理感知模型。例如選擇用于測量噪聲電平并且計(jì)算噪聲對比度參數(shù)的信號部分可以牢記噪聲電平變化可以比測量的絕對噪聲電平更重要。這包含如下情形,在該情形中,收聽者將背景噪聲電平變化視為比具有略微更高平均噪聲電平而更少變化的噪聲更令人煩躁。尚未在用于確定音頻設(shè)備的傳輸性質(zhì)的感知質(zhì)量的當(dāng)前方法(諸如PESQ)中包括這樣的優(yōu)選。
      圖6D-6F還示范例如如下考慮,針對基于在信號的不同部分中測量的噪聲電平來計(jì)算噪聲對比度參數(shù)可以考慮的該考慮。圖6D描繪了作為時(shí)間函數(shù)的兩個(gè)信號(即信號I和信號II)的噪聲電平變化。在所示整個(gè)時(shí)間段內(nèi),信號I的噪聲電平大于信號II的噪聲電平。然而兩個(gè)信號的噪聲對比度相同。噪聲對比度參數(shù)可以是噪聲對比度的測量,其中考慮噪聲電平的絕對值或者其中僅考慮噪聲電平的絕對差值。信號II的噪聲電平變化與絕對噪聲電平成比例地更大??梢杂?jì)算噪聲對比度參數(shù)以考慮這一點(diǎn),使得信號II的噪聲對比度參數(shù)因此可以大于信號I 的噪聲對比度參數(shù)。通過在計(jì)算中使用絕對噪聲電平,噪聲對比度參數(shù)現(xiàn)在可以理解為比在更高噪聲電平的噪聲對比度更易受在更低噪聲電平的噪聲對比度影響。使用這一類型的測量可以有益于改進(jìn)音頻信號的感知質(zhì)量的確定,因?yàn)槭章犝咄ǔυ诘驮肼曤娖降脑肼曤娖阶兓葘υ诟咴肼曤娖降南嗨圃肼曤娖阶兓舾?。另外,噪聲電平的單個(gè)迅速改變可以使收聽者集中于干擾背景噪聲并且因此可以造成這一背景噪聲電平對感知的總語音質(zhì)量的更大影響。還可以定義噪聲對比度參數(shù)使得它如將參考圖6E、6F所示對于不同類型的噪聲電平變化而言不同。在這些圖中,僅示出了信號的均值噪聲電平。圖6E示出了作為時(shí)間函數(shù)的噪聲電平的圖,其中噪聲電平始于高噪聲電平并且在時(shí)間段T5內(nèi)保持于該電平。噪聲電平然后在時(shí)間段T6期間逐漸下降到更低噪聲電平并且在時(shí)間段T5內(nèi)保持于這一電平。圖6F示出了作為時(shí)間函數(shù)的噪聲電平的圖,其中噪聲電平始于低噪聲電平并且在時(shí)間段T5內(nèi)保持于該電平。噪聲電平然后在時(shí)間段T6內(nèi)上升并且在時(shí)間段T5內(nèi)保持于該更高噪聲電平。在所示時(shí)間區(qū)間(8口 IiT5 + T6)期間,圖6E、6F中所示信號的平均噪聲電平相同。 然而,即使平均噪聲電平相同,噪聲電平的感知可以對于噪聲電平不同,這些噪聲電平與隨時(shí)間減少的噪聲電平對照隨時(shí)間增加。具體而言,如果所示時(shí)間區(qū)間代表其中無語音的時(shí)間區(qū)間,則在這樣的靜默時(shí)段期間的噪聲增加可以被體驗(yàn)為比噪聲減少更令人煩躁?,F(xiàn)在可以用考慮這一感知方面這樣的方式定義噪聲對比度參數(shù)。例如可以定義噪聲對比度參數(shù)使得向在評價(jià)的時(shí)間區(qū)間內(nèi)的更晚時(shí)間的信號部分給予比在時(shí)間區(qū)間內(nèi)的更早信號部分更多的權(quán)重。在圖6E、6F中所示情形的情況下,可以通過將在噪聲電平逐漸改變之前在時(shí)間段T5中測量的噪聲電平與在該逐漸改變之后在時(shí)間段T5中測量的噪聲電平相除來定義噪聲對比度參數(shù)。在這樣的情況下,圖6E中所示噪聲電平變化的噪聲對比度參數(shù)小于1,而圖6F中所示噪聲電平變化的噪聲對比度參數(shù)大于1。噪聲對比度參數(shù)因此用來進(jìn)一步解決主觀噪聲感知。使用信號內(nèi)的噪聲對比度改進(jìn)在客觀測量獲得的語音質(zhì)量與如在主觀測試期間確定的語音質(zhì)量之間的相關(guān)性。在一個(gè)實(shí)施例中,導(dǎo)出噪聲對比度參數(shù)包括取得輸出信號內(nèi)的第一所選時(shí)間幀; 取得輸出信號內(nèi)的第二所選時(shí)間幀;并且基于第一所選時(shí)間幀和第二所選時(shí)間幀來確定噪聲對比度參數(shù)。在又一實(shí)施例中,確定噪聲對比度參數(shù)可以包括通過將第一所選時(shí)間幀的強(qiáng)度值與第二所選時(shí)間幀的強(qiáng)度值相除來確定分?jǐn)?shù);通過使用具有預(yù)定壓縮系數(shù)的冪律 (power law)來壓縮分?jǐn)?shù)以便獲得噪聲對比度參數(shù)。如果壓縮的分?jǐn)?shù)在預(yù)定固定值以下,則可以將噪聲對比度參數(shù)設(shè)置成預(yù)定固定值。在一個(gè)實(shí)施例中,對參考信號應(yīng)用噪聲抑制包括在具有在閾值以下的檢測聲強(qiáng)級的多個(gè)時(shí)間幀內(nèi)計(jì)算參考平均噪聲譜密度;基于在客觀與主觀質(zhì)量評估信息之間的優(yōu)化相關(guān)性來確定參考噪聲抑制因子;并且基于參考噪聲抑制因子和參考平均噪聲譜密度來計(jì)算所需噪聲電平。對縮放的參考信號執(zhí)行的參考噪聲抑制因此可以被布置成將噪聲抑制直至如下噪聲電平,該噪聲電平被視為希望的低噪聲電平??梢栽谥饔^質(zhì)量評估實(shí)驗(yàn)中確定這樣的希望的低噪聲電平。在一個(gè)實(shí)施例中,對輸出信號應(yīng)用噪聲抑制包括在與參考信號內(nèi)的具有在閾值以下的檢測聲強(qiáng)級的時(shí)間幀對應(yīng)的多個(gè)時(shí)間幀內(nèi)計(jì)算平均輸出噪聲譜密度;基于在客觀與主觀質(zhì)量評估信息之間的優(yōu)化相關(guān)性來確定低噪聲電平常數(shù);基于在客觀與主觀質(zhì)量評估信息之間的優(yōu)化相關(guān)性來確定輸出噪聲抑制因子;并且通過使用低噪聲電平常數(shù)、輸出噪聲抑制因子和平均輸出噪聲譜密度來計(jì)算代表輸出信號中的干擾的噪聲電平。對輸出信號執(zhí)行的輸出噪聲抑制然后可以被布置成將噪聲抑制直至代表干擾的噪聲電平。輸出噪聲抑制可以依賴于頻率。在一個(gè)實(shí)施例中,該處理還包括將參考信號和輸出信號從時(shí)域變換到時(shí)間-頻率域;根據(jù)參考信號導(dǎo)出參考音調(diào)功率密度函數(shù)并且根據(jù)輸出信號導(dǎo)出輸出音調(diào)功率密度函數(shù);局部縮放參考音調(diào)功率密度函數(shù)以獲得局部縮放的參考音調(diào)功率密度函數(shù);關(guān)于頻率部分地補(bǔ)償輸出音調(diào)功率密度函數(shù)或者局部縮放的參考音調(diào)功率密度函數(shù);并且導(dǎo)出參考響度密度函數(shù)和輸出響度密度函數(shù)。在又一實(shí)施例中,該處理還包括將參考音調(diào)功率密度函數(shù)的強(qiáng)度從固定聲強(qiáng)級縮放成與輸出音調(diào)功率密度函數(shù)有關(guān)的聲強(qiáng)級以獲得在音調(diào)功率密度函數(shù)之間的聲強(qiáng)級差,該聲強(qiáng)級差允許量化聲強(qiáng)級對感知質(zhì)量的影響;在感知響度域中將輸出響度密度函數(shù)的響度縮放成固定響度級;并且在感知響度域中將參考響度密度函數(shù)的響度從與輸出有關(guān)的聲強(qiáng)級對應(yīng)的響度級縮放成與輸出響度密度函數(shù)的響度級有關(guān)的響度級以獲得在參考響度密度函數(shù)與輸出響度密度函數(shù)之間的響度級差,該響度級差允許量化響度對輸出信號的感知質(zhì)量的影響。在一些實(shí)施例中,本發(fā)明還涉及一種用于關(guān)于參考信號確定兩個(gè)質(zhì)量指標(biāo)的方法,這兩個(gè)質(zhì)量指標(biāo)代表音頻設(shè)備(例如語音處理系統(tǒng))的輸出信號的感知質(zhì)量,該方法包括執(zhí)行任一上述方法實(shí)施例用于關(guān)于總降級確定代表質(zhì)量的第一質(zhì)量指標(biāo);并且執(zhí)行任一上述方法實(shí)施例用于確定第二質(zhì)量指標(biāo),該第二質(zhì)量指標(biāo)關(guān)于與參考信號相比較添加的降級來代表質(zhì)量。在又一實(shí)施例中,確定第一質(zhì)量指標(biāo)包括標(biāo)識縮放的參考信號內(nèi)的具有在第一閾值以下的檢測聲強(qiáng)級的時(shí)間幀序列,并且確定第二質(zhì)量指標(biāo)包括標(biāo)識縮放的參考信號內(nèi)的具有在第二閾值以下的檢測聲強(qiáng)級的時(shí)間幀序列,該第二閾值大于第一閾值。在一個(gè)實(shí)施例中,選擇時(shí)間幀包括選擇與縮放的參考信號的滿足預(yù)定條件的時(shí)間幀對應(yīng)的輸出信號的時(shí)間幀。這樣的預(yù)定條件可以包括縮放的參考信號的作為靜默幀的時(shí)間幀具有在閾值以下的聲強(qiáng)級值。在又一實(shí)施例中,預(yù)定條件還包括縮放的參考信號的時(shí)間幀是作為靜默區(qū)間的一系列連續(xù)靜默幀的部分。使用靜默幀和/或靜默區(qū)間改進(jìn)噪聲對比度參數(shù)的可靠性,并且因此允許進(jìn)一步改進(jìn)在如可觀測量確定的語音質(zhì)量與如在主觀測試中確定的語音質(zhì)量之間的相關(guān)性。
      在實(shí)施例中,本發(fā)明涉及一種包括例如存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行代碼的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)可執(zhí)行代碼適于在由處理器執(zhí)行時(shí)執(zhí)行任一上述方法實(shí)施例。
      最后,在實(shí)施例中,本發(fā)明涉及一種用于關(guān)于音頻系統(tǒng)(例如語音處理設(shè)備)的用作參考信號的輸入信號X(t)確定質(zhì)量指標(biāo)的系統(tǒng),該質(zhì)量指標(biāo)代表音頻系統(tǒng)的輸出信號 Y(t)的感知質(zhì)量,該系統(tǒng)包括預(yù)處理設(shè)備,用于預(yù)處理參考信號和輸出信號;用于處理參考信號的第一處理設(shè)備和用于處理輸出信號的第二處理設(shè)備,用于分別獲得用于參考信號和輸出信號的表示信號R(X)、R(Y);差分設(shè)備,用于組合參考信號和輸出信號的表示信號以便獲得差分信號D ;以及建模設(shè)備,用于處理差分信號以獲得質(zhì)量信號Q,該質(zhì)量信號Q代表語音處理系統(tǒng)的感知質(zhì)量的估計(jì);其中預(yù)處理設(shè)備、第一處理設(shè)備和第二處理設(shè)備形成用于執(zhí)行任一上述方法實(shí)施例的處理系統(tǒng)。。


      在附圖中圖1示意地示出了包括用于關(guān)于參考信號確定質(zhì)量指標(biāo)的系統(tǒng)的總體設(shè)置,該質(zhì)量指標(biāo)代表音頻設(shè)備的輸出信號的感知質(zhì)量;圖2示意地示出了用于根據(jù)PESQ關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備的輸出信號的感知質(zhì)量;圖3示意地示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備的輸出信號的感知質(zhì)量;圖4示意地示出了應(yīng)用于圖2中所示方法的本發(fā)明一個(gè)實(shí)施例; 圖5示意地示出了應(yīng)用于其他方法的本發(fā)明一個(gè)實(shí)施例;并且圖6A-6F示出了在作為時(shí)間函數(shù)的噪聲電平的不同圖。
      具體實(shí)施方式
      下文是僅通過例子給出的對本發(fā)明某些實(shí)施例的描述。
      在該描述全文中,將關(guān)于對信號執(zhí)行的操作來使用術(shù)語“局部”和“全局”?!熬植俊?操作是指對時(shí)間信號的部分(例如對單幀)執(zhí)行的操作?!叭帧辈僮魇侵笇φ麄€(gè)信號執(zhí)行的操作。
      在該描述全文中,可以相對于從音頻系統(tǒng)(比如語音處理設(shè)備)的輸出發(fā)出的信號使用術(shù)語“輸出”和“失真”。在該描述全文中,可以相對于作為向音頻系統(tǒng)的輸入而賦予的信號使用術(shù)語“參考”和“原始”,該信號還用作輸出或者失真信號將與之比較的信號。
      圖1示意地示出了包括用于關(guān)于參考信號確定質(zhì)量指標(biāo)的系統(tǒng)的總體設(shè)置,該質(zhì)量指標(biāo)代表音頻設(shè)備(例如語音處理系統(tǒng))的輸出信號的感知質(zhì)量。該設(shè)置包括受考察的音頻系統(tǒng)10(例如電信網(wǎng)絡(luò)、網(wǎng)元或者在網(wǎng)絡(luò)或者移動(dòng)臺中的語音處理設(shè)備)。該設(shè)置也包括用于測量音頻系統(tǒng)的傳輸質(zhì)量的系統(tǒng)20,下文稱為質(zhì)量測量系統(tǒng)20。
      質(zhì)量測量系統(tǒng)20被布置成接收兩個(gè)輸入信號。第一輸入信號是向質(zhì)量測量系統(tǒng) 20直接提供(即未經(jīng)由音頻系統(tǒng)10提供)的并且用作參考信號的語音信號Ki)。第二輸入信號是與受音頻系統(tǒng)10影響的語音信號^TU對應(yīng)的語音信號iW。質(zhì)量測量系統(tǒng)20提供輸出質(zhì)量信號認(rèn)該輸出質(zhì)量信號C代表經(jīng)過音頻系統(tǒng)10的語音鏈路的感知質(zhì)量的估計(jì)。
      在這一實(shí)施例中,質(zhì)量測量系統(tǒng)20包括用于處理兩個(gè)輸入信號Ki)、Y(t)使得可以提供輸出信號Q的預(yù)處理部20a、處理部20b和信號組合部20c。
      預(yù)處理部20a包括被布置成執(zhí)行一個(gè)或者多個(gè)預(yù)處理動(dòng)作(諸如固定電平縮放和時(shí)間對準(zhǔn))以獲得預(yù)處理信號弋作)和??;作)的預(yù)處理設(shè)備30。
      質(zhì)量測量系統(tǒng)20的處理部20b被布置成根據(jù)人類聽覺系統(tǒng)的生理-心理感知模型將預(yù)處理信號映射到表示信號。在第一處理設(shè)備40a中處理預(yù)處理信號以獲得表示信號ΛΥΧ),而在第二處理設(shè)備40b中處理預(yù)處理信號??;作)以獲得表示信號及。
      質(zhì)量測量系統(tǒng)20的信號組合部20c被布置成通過使用差分設(shè)備50來組合表示信號R(X)、R(Y)以獲得差分信號隊(duì)最后,建模設(shè)備60根據(jù)如下模型處理差分信號從在該模型中已經(jīng)對人類的某些性質(zhì)建模以獲得質(zhì)量信號認(rèn)可以經(jīng)由對多個(gè)人類主體執(zhí)行的主觀聽力測試來獲得人類性質(zhì)(例如認(rèn)知性質(zhì))。
      預(yù)處理設(shè)備30、第一處理設(shè)備40a和第二處理設(shè)備40b可以形成可以用來執(zhí)行如后文將更詳細(xì)說明的本發(fā)明實(shí)施例的處理系統(tǒng)。處理系統(tǒng)或者其部件可以采用硬件處理器 (諸如專用集成電路(ASIC))或者計(jì)算機(jī)設(shè)備的形式,用于運(yùn)行軟件或者固件形式的計(jì)算機(jī)可執(zhí)行代碼。計(jì)算機(jī)設(shè)備可以例如包括處理器和通信耦合到處理器的存儲(chǔ)器。存儲(chǔ)器的例子包括但不限于只讀存儲(chǔ)器(ROM)、隨機(jī)訪問存儲(chǔ)器(RAM)、可擦除可編程ROM (EPROM),電可擦除可編程ROM (EEPROM)和閃存。
      計(jì)算機(jī)設(shè)備還可以包括用于實(shí)現(xiàn)外部用戶的指令或者通知輸入的用戶接口。用戶接口的例子包括但不限于鼠標(biāo)、鍵盤和觸屏。
      計(jì)算機(jī)設(shè)備可以被布置成加載存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)(例如緊致盤只讀存儲(chǔ)器 (CD ROM)、數(shù)字視頻盤(DVD))或者任何其它類型的已知計(jì)算機(jī)可讀數(shù)據(jù)載體上的計(jì)算機(jī)可執(zhí)行代碼。出于這一目的,計(jì)算機(jī)設(shè)備可以包括讀取單元。
      存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行代碼在代碼加載到計(jì)算機(jī)設(shè)備的存儲(chǔ)器中之后可以適于執(zhí)行后文將描述的本發(fā)明實(shí)施例。
      替代地或者除此之外,這樣的本發(fā)明實(shí)施例可以采用包括計(jì)算機(jī)可執(zhí)行代碼的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可執(zhí)行代碼用于在計(jì)算機(jī)設(shè)備上執(zhí)行時(shí)執(zhí)行這樣的方法。 該方法然后可以在計(jì)算機(jī)可執(zhí)行代碼加載到計(jì)算機(jī)設(shè)備的存儲(chǔ)器中之后由計(jì)算機(jī)設(shè)備的處理器執(zhí)行。
      因此,客觀感知測量方法以預(yù)測音頻系統(tǒng)(諸如語音編解碼器、電話鏈路和移動(dòng)手持社保)的主觀感知質(zhì)量為目標(biāo)在計(jì)算機(jī)程序中模擬主體的聲音感知。受測試的設(shè)備的輸入和輸出的物理信號映射到與在人類的頭部以內(nèi)的內(nèi)部表示盡可能接近匹配的生理心理表示?;趦?nèi)部表示的差值判斷受測試設(shè)備的質(zhì)量。最知名的當(dāng)前可用的客觀感知測量方法是PESQ (語音質(zhì)量的感知評價(jià))。
      圖2示意地示出了用于根據(jù)如在ITU-T Recommendation P. 862中制定的PESQ(下文稱為PESQ)關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備的輸出信號的感知質(zhì)量。PESQ可以使用于如圖1中示意地示出的設(shè)置中。在PESQ中,比較參考信號與輸出信號ιγ 入該輸出信號m)是經(jīng)過音頻系統(tǒng)(例如語音處理系統(tǒng)(比如通信系統(tǒng))) 傳遞X(t)的結(jié)果。PESQ的輸出質(zhì)量信號(也稱為PESQ分?jǐn)?shù))是主體在主觀聽力測試中將向IYi)給予的感知質(zhì)量的預(yù)測。PESQ分?jǐn)?shù)采用所謂的平均意見分?jǐn)?shù)(MOS)的形式。出于這一目的,PESQ輸出映射到類似于MOS的標(biāo)度(即范圍為-0. 5至4. 5的單個(gè)數(shù)字),盡管對于多數(shù)情況而言輸出范圍將在1. 0與4. 5之間,這是在絕對類別評級(ACR)聽力質(zhì)量實(shí)驗(yàn)中發(fā)現(xiàn)的MOS值的通常范圍。
      PESQ中的預(yù)處理包括兩個(gè)信號Ki)、IYi)的電平對準(zhǔn)以分別獲得信號毛作入 YJt)以及中間參考系統(tǒng)(IRS)濾波以分別獲得信號Ji^ri)、Ymssω。電平對準(zhǔn)涉及到將強(qiáng)度縮放成固定電平,在PESQ中為79dB SPL0執(zhí)行IRS濾波以保證測量傳輸質(zhì)量的方法對例如移動(dòng)電話等電信系統(tǒng)單元的濾波相對不敏感。最后確定在參考信號Xi^作)與Y脳⑴ 之間的時(shí)間延遲從而導(dǎo)致時(shí)移輸出信號Yirs/⑴。現(xiàn)在假設(shè)在參考信號與輸出信號之間的比較關(guān)于相同時(shí)間發(fā)生。
      人耳執(zhí)行時(shí)間-頻率變換。在PESQ中,通過對時(shí)間信號I皿㈦和YIRSS,⑴用漢寧窗執(zhí)行短期快速傅里葉變換(FFT)來對這一變換建模。漢寧窗通常具有32ms的大小。下文稱為幀的相鄰時(shí)間窗通常重疊50%。丟棄相位信息。復(fù)FFT分量(即功率譜)的平方實(shí)部與平方虛部之和用來獲得功率表示人和/^zmf人,其中《表示考慮的幀。在下文稱為FFT頻帶的頻帶中劃分功率表示。
      人類聽覺系統(tǒng)在低頻比在高頻具有更細(xì)微的頻率分辨率。音調(diào)標(biāo)度反映這一現(xiàn)象,并且出于這一原因,PESQ將頻率規(guī)整成音調(diào)標(biāo)度(在這一情況下規(guī)整成所謂Bark標(biāo)度)。(離散)頻率軸的轉(zhuǎn)換涉及到使FFT頻帶入倉(binning)以形成Bark頻帶(通常為對個(gè))。所得信號稱為音調(diào)功率密度或者音調(diào)功率密度函數(shù)并且表示為/^Tras//人和 PPXWIRSS(f)n??紤]感知頻率,音調(diào)功率密度函數(shù)提供與音頻信號在人類聽覺系統(tǒng)中的心理生理表示類似的內(nèi)部表示。
      為了處理在待測試的音頻系統(tǒng)中的濾波,參考和輸出音調(diào)功率密度的功率譜隨時(shí)間平均。根據(jù)輸出譜與參考譜之比計(jì)算部分補(bǔ)償因子。每幀η的參考音調(diào)功率密度 /^^zmf人然后與該部分補(bǔ)償因子相乘以均衡參考與輸出信號。這產(chǎn)生逆濾波參考音調(diào)功每密葭PPX' RSS(f)n。使用這一部分補(bǔ)償是因?yàn)闇睾蜑V波幾乎不值得注意而嚴(yán)重濾波可能打擾收聽者。對參考信號執(zhí)行補(bǔ)償是因?yàn)檩敵鲂盘柺侵黧w在ACR聽力實(shí)驗(yàn)中判斷的信號。
      為了補(bǔ)償短期增益變化,計(jì)算局部縮放因子。局部縮放因子然后與輸出音調(diào)功率密度函數(shù)/^ZTras//人相乘以獲得局部縮放音調(diào)功率密度函數(shù)人。
      在對參考信號執(zhí)行的濾波的部分補(bǔ)償和對輸出信號執(zhí)行的短期增益變化的部分補(bǔ)償之后,使用Zwicker定律將參考和降級音調(diào)功率密度變換成宋(Sone)響度標(biāo)度。所得二維數(shù)組ZiT/人和Ζ7Γ/人分別稱為用于參考信號和輸出信號的響度密度函數(shù)。對于^iT/) Λ,這意味著
      權(quán)利要求
      1.一種用于關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,所述質(zhì)量指標(biāo)代表音頻設(shè)備例如語音處理系統(tǒng)的輸出信號的感知質(zhì)量,其中處理和比較所述參考信號和所述輸出信號,并且所述處理包括將所述參考信號和所述輸出信號劃分成相互對應(yīng)時(shí)間幀,其中所述處理還包括-將所述參考信號縮放成固定聲強(qiáng)級;-基于對縮放的參考信號執(zhí)行的測量來選擇所述輸出信號的時(shí)間幀; -基于所述輸出信號的選擇的時(shí)間幀來計(jì)算噪聲對比度參數(shù),所述噪聲對比度參數(shù)是所述信號內(nèi)的所述噪聲對比度的測量;-基于所述噪聲對比度參數(shù)在感知響度域中對所述參考信號和所述輸出信號中的至少一個(gè)應(yīng)用噪聲抑制.Ibis.根據(jù)權(quán)利要求所述1的方法,還包括以下步驟將所述參考信號和所述輸出信號感知相減以形成差值信號并且根據(jù)所述差值信號導(dǎo)出所述質(zhì)量指標(biāo)。
      2.根據(jù)權(quán)利要求1所述的方法,其中計(jì)算所述噪聲對比度參數(shù)包括-通過將所述輸出信號內(nèi)的第一所選時(shí)間幀的強(qiáng)度值除以所述輸出信號內(nèi)的第二所選時(shí)間幀的強(qiáng)度值來確定分?jǐn)?shù);-通過使用具有預(yù)定壓縮系數(shù)的冪律來壓縮所述分?jǐn)?shù)以便獲得所述噪聲對比度參數(shù)。
      3.根據(jù)權(quán)利要求2所述的方法,其中如果壓縮的分?jǐn)?shù)在預(yù)定固定值以下,則將所述噪聲對比度參數(shù)設(shè)置成所述預(yù)定固定值。
      4.根據(jù)任一前述權(quán)利要求所述的方法,其中對所述參考信號應(yīng)用所述噪聲抑制包括 -在具有在閾值以下的檢測聲強(qiáng)級的多個(gè)時(shí)間幀內(nèi)計(jì)算參考平均噪聲譜密度;-基于在客觀與主觀質(zhì)量評估信息之間的優(yōu)化相關(guān)性來確定參考噪聲抑制因子;并且 -基于所述參考噪聲抑制因子和所述參考平均噪聲譜密度來計(jì)算所需噪聲電平。
      5.根據(jù)任一前述權(quán)利要求所述的方法,其中對所述輸出信號應(yīng)用所述噪聲抑制包括 -在與所述參考信號內(nèi)的具有在閾值以下的檢測聲強(qiáng)級的時(shí)間幀對應(yīng)的多個(gè)時(shí)間幀內(nèi)計(jì)算平均輸出噪聲譜密度;-基于在客觀與主觀質(zhì)量評估信息之間的優(yōu)化相關(guān)性來確定低噪聲電平常數(shù); -基于在客觀與主觀質(zhì)量評估信息之間的優(yōu)化相關(guān)性來確定輸出噪聲抑制因子;并且 -通過使用所述低噪聲電平常數(shù)、所述輸出噪聲抑制因子和所述平均輸出噪聲譜密度來計(jì)算代表所述輸出信號中的干擾的噪聲電平。
      6.根據(jù)任一前述權(quán)利要求所述的方法,其中所述處理還包括-將所述參考信號和所述輸出信號從時(shí)域變換到時(shí)間-頻率域; -根據(jù)所述參考信號導(dǎo)出參考音調(diào)功率密度函數(shù)并且根據(jù)所述輸出信號導(dǎo)出輸出音調(diào)功率密度函數(shù);-局部縮放所述參考音調(diào)功率密度函數(shù)以獲得局部縮放的參考音調(diào)功率密度函數(shù); -關(guān)于頻率部分地補(bǔ)償所述輸出音調(diào)功率密度函數(shù)或者局部縮放的參考音調(diào)功率密度函數(shù);并且-導(dǎo)出參考響度密度函數(shù)和輸出響度密度函數(shù)。
      7.根據(jù)權(quán)利要求6所述的方法,其中所述處理還包括-將所述參考音調(diào)功率密度函數(shù)的強(qiáng)度從所述固定聲強(qiáng)級縮放成與輸出音調(diào)功率密度函數(shù)有關(guān)的聲強(qiáng)級以獲得在所述音調(diào)功率密度函數(shù)之間的聲強(qiáng)級差,所述聲強(qiáng)級差允許量化聲強(qiáng)級對感知質(zhì)量的影響;-在所述感知響度域中將所述輸出響度密度函數(shù)的響度縮放成固定響度級;并且-在所述感知響度域中將所述參考響度密度函數(shù)的響度從與輸出有關(guān)的聲強(qiáng)級對應(yīng)的響度級縮放成與所述輸出響度密度函數(shù)的響度級有關(guān)的響度級以獲得在所述參考響度密度函數(shù)與所述輸出響度密度函數(shù)之間的響度級差,所述響度級差允許量化響度對所述輸出信號的所述感知質(zhì)量的影響。
      8.一種用于關(guān)于參考信號確定兩個(gè)質(zhì)量指標(biāo)的方法,所述質(zhì)量指標(biāo)代表音頻設(shè)備例如語音處理系統(tǒng)的輸出信號的感知質(zhì)量,所述方法包括-執(zhí)行根據(jù)任一前述權(quán)利要求所述的方法用于關(guān)于總降級確定代表質(zhì)量的第一質(zhì)量指標(biāo);并且-執(zhí)行根據(jù)任一前述權(quán)利要求所述的方法用于確定第二質(zhì)量指標(biāo),所述第二質(zhì)量指標(biāo)關(guān)于與所述參考信號相比較添加的降級來代表質(zhì)量。
      9.根據(jù)權(quán)利要求8所述的方法,其中確定第一質(zhì)量指標(biāo)包括標(biāo)識縮放的參考信號內(nèi)的具有在第一閾值以下的檢測聲強(qiáng)級的時(shí)間幀序列,并且確定第二質(zhì)量指標(biāo)包括標(biāo)識所述縮放的參考信號內(nèi)的具有在第二閾值以下的檢測聲強(qiáng)級的時(shí)間幀序列,所述第二閾值大于所述第一閾值。
      10.根據(jù)任一前述權(quán)利要求所述的方法,其中選擇時(shí)間幀包括選擇所述輸出信號的與所述縮放的參考信號的滿足預(yù)定條件的時(shí)間幀對應(yīng)的時(shí)間幀。
      11.根據(jù)權(quán)利要求10所述的方法,其中所述預(yù)定條件包括所述縮放的參考信號的作為靜默幀的時(shí)間幀具有在閾值以下的聲強(qiáng)級值。
      12.根據(jù)權(quán)利要求11所述的方法,其中所述預(yù)定條件還包括所述縮放的參考信號的時(shí)間幀是作為靜默區(qū)間的一系列連續(xù)靜默幀的部分。
      13.一種計(jì)算機(jī)程序產(chǎn)品,包括例如存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行代碼,所述計(jì)算機(jī)可執(zhí)行代碼適于在由處理器執(zhí)行時(shí)執(zhí)行如權(quán)利要求1-12中的任一權(quán)利要求限定的方法。
      14.一種用于關(guān)于音頻系統(tǒng)(10)例如語音處理設(shè)備的用作參考信號的輸入信號X(t) 確定質(zhì)量指標(biāo)的系統(tǒng)(20),所述質(zhì)量指標(biāo)代表所述音頻系統(tǒng)(10)的輸出信號Y(t)的感知質(zhì)量,所述系統(tǒng)包括-預(yù)處理設(shè)備(30),用于預(yù)處理所述參考信號和所述輸出信號;-用于處理所述參考信號的第一處理設(shè)備(40a)和用于處理所述輸出信號的第二處理設(shè)備(40b ),用于分別獲得用于所述參考信號和所述輸出信號的表示信號R (X)、R (Y);-差分設(shè)備(50 ),用于組合所述參考信號和所述輸出信號的所述表示信號以便獲得差分信號D ;以及-建模設(shè)備(60),用于處理所述差分信號以獲得質(zhì)量信號Q,所述質(zhì)量信號Q代表所述語音處理系統(tǒng)的所述感知質(zhì)量的估計(jì);其中所述預(yù)處理設(shè)備、所述第一處理設(shè)備和所述第二處理設(shè)備形成用于執(zhí)行根據(jù)權(quán)利要求1-12中的任一權(quán)利要求所述的方法的處理系統(tǒng)。
      全文摘要
      本發(fā)明涉及一種用于關(guān)于參考信號確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備的輸出信號的感知質(zhì)量。這樣的音頻設(shè)備可以例如是語音處理系統(tǒng)。在該方法中,處理和比較參考信號和輸出信號。該處理包括將參考信號和輸出信號劃分成相互對應(yīng)時(shí)間幀。該處理還包括將參考信號縮放成固定聲強(qiáng)級。基于對縮放的參考信號執(zhí)行的測量來選擇輸出信號的時(shí)間幀。然后基于輸出信號的所選時(shí)間幀來計(jì)算噪聲對比度參數(shù)?;谠肼晫Ρ榷葏?shù)對參考信號和輸出信號中的至少一個(gè)應(yīng)用噪聲抑制。最后,將參考信號和輸出信號感知相減以形成差值信號并且根據(jù)差值信號導(dǎo)出質(zhì)量指標(biāo)。
      文檔編號H04M3/22GK102549657SQ201080046390
      公開日2012年7月4日 申請日期2010年8月9日 優(yōu)先權(quán)日2009年8月14日
      發(fā)明者J.比倫德斯, J.范武格特 申請人:皇家Kpn公司, 荷蘭應(yīng)用自然科學(xué)研究組織
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1