国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種音頻信號(hào)分類方法和裝置與流程

      文檔序號(hào):11136040閱讀:來(lái)源:國(guó)知局

      技術(shù)特征:

      1.一種音頻信號(hào)分類方法,其特征在于,包括:

      將輸入音頻信號(hào)進(jìn)行分幀處理;

      獲得當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度;所述線性預(yù)測(cè)殘差能量?jī)A斜度表示音頻信號(hào)的線性預(yù)測(cè)殘差能量隨線性預(yù)測(cè)階數(shù)的升高而變化的程度;

      將線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)到存儲(chǔ)器中;

      根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類。

      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)到存儲(chǔ)器中之前還包括:

      根據(jù)所述當(dāng)前音頻幀的聲音活動(dòng)性,確定是否將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中;并在確定需要存儲(chǔ)時(shí)將將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中。

      3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量為預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差;所述根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類包括:

      將預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差與音樂(lè)分類閾值相比較,當(dāng)所述預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差小于音樂(lè)分類閾值時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀;否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀。

      4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,還包括:

      獲得當(dāng)前音頻幀的頻譜波動(dòng)、頻譜高頻帶峰度和頻譜相關(guān)度,并存儲(chǔ)于對(duì)應(yīng)的存儲(chǔ)器中;

      其中,所述根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類包括:

      分別獲得存儲(chǔ)的頻譜波動(dòng)、頻譜高頻帶峰度、頻譜相關(guān)度和線性預(yù)測(cè)殘差能量?jī)A斜度中有效數(shù)據(jù)的統(tǒng)計(jì)量,根據(jù)所述有效數(shù)據(jù)的統(tǒng)計(jì)量將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述有效數(shù)據(jù)的統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的有效數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。

      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,分別獲得存儲(chǔ)的頻譜波動(dòng)、頻譜高頻帶峰度、頻譜相關(guān)度和線性預(yù)測(cè)殘差能量?jī)A斜度中有效數(shù)據(jù)的統(tǒng)計(jì)量,根據(jù)所述有效數(shù)據(jù)的統(tǒng)計(jì)量將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀包括:

      分別獲得存儲(chǔ)的頻譜波動(dòng)有效數(shù)據(jù)的均值,頻譜高頻帶峰度有效數(shù)據(jù)的均值,頻譜相關(guān)度有效數(shù)據(jù)的均值和線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差;

      當(dāng)下列條件之一滿足時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:所述頻譜波動(dòng)有效數(shù)據(jù)的均值小于第一閾值;或者頻譜高頻帶峰度有效數(shù)據(jù)的均值大于第二閾值;或者所述頻譜相關(guān)度有效數(shù)據(jù)的均值大于第三閾值;或者線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差小于第四閾值。

      6.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,還包括:

      獲得當(dāng)前音頻幀的頻譜音調(diào)個(gè)數(shù)和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,并存儲(chǔ)于對(duì)應(yīng)的存儲(chǔ)器;

      其中,所述根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類包括:

      分別獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量;

      根據(jù)所述線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。

      7.根據(jù)權(quán)利要求6所述的方法,其特征在于,分別獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量包括:

      獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的方差;

      獲得存儲(chǔ)的頻譜音調(diào)個(gè)數(shù)的均值;

      根據(jù)所述線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀包括:

      當(dāng)當(dāng)前音頻幀為活動(dòng)幀,且滿足下列條件之一,則將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:

      線性預(yù)測(cè)殘差能量?jī)A斜度的方差小于第五閾值;或

      頻譜音調(diào)個(gè)數(shù)的均值大于第六閾值;或

      頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率小于第七閾值。

      8.根據(jù)權(quán)利要求1-7所述的任一方法,其特征在于,獲得當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度包括:

      根據(jù)下列公式計(jì)算當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度:

      <mrow> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mo>_</mo> <mi>t</mi> <mi>i</mi> <mi>l</mi> <mi>t</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

      其中,epsP(i)表示當(dāng)前音頻幀第i階線性預(yù)測(cè)的預(yù)測(cè)殘差能量;n為正整數(shù),表示線性預(yù)測(cè)的階數(shù),其小于等于線性預(yù)測(cè)的最大階數(shù)。

      9.根據(jù)權(quán)利要求6-7所述的任一方法,其特征在于,獲得當(dāng)前音頻幀的頻譜音調(diào)個(gè)數(shù)和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率包括:

      統(tǒng)計(jì)當(dāng)前音頻幀在0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量作為頻譜音調(diào)個(gè)數(shù);

      計(jì)算當(dāng)前音頻幀在0~4kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量與0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量的比值,作為頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率。

      10.一種信號(hào)分類裝置,用于對(duì)輸入的音頻信號(hào)進(jìn)行分類,其特征在于,包括:

      分幀單元,用于對(duì)輸入音頻信號(hào)進(jìn)行分幀處理;

      參數(shù)獲得單元,用于獲得當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度;所述線性預(yù)測(cè)殘差能量?jī)A斜度表示音頻信號(hào)的線性預(yù)測(cè)殘差能量隨線性預(yù)測(cè)階數(shù)的升高而變化的程度;

      存儲(chǔ)單元,用于存儲(chǔ)線性預(yù)測(cè)殘差能量?jī)A斜度;

      分類單元,用于根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類。

      11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,還包括:

      存儲(chǔ)確認(rèn)單元,用于根據(jù)所述當(dāng)前音頻幀的聲音活動(dòng)性,確定是否將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中;

      所述存儲(chǔ)單元具體用于,當(dāng)存儲(chǔ)確認(rèn)單元確認(rèn)需要確定需要存儲(chǔ)時(shí)將將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中。

      12.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,

      預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量為預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差;

      所述分類單元具體用于將預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差與音樂(lè)分類閾值相比較,當(dāng)所述預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差小于音樂(lè)分類閾值時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀;否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀。

      13.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,參數(shù)獲得單元還用于:獲得當(dāng)前音頻幀的頻譜波動(dòng)、頻譜高頻帶峰度和頻譜相關(guān)度,并存儲(chǔ)于對(duì)應(yīng)的存儲(chǔ)器中;

      所述分類單元具體用于:分別獲得存儲(chǔ)的頻譜波動(dòng)、頻譜高頻帶峰度、頻譜相關(guān)度和線性預(yù)測(cè)殘差能量?jī)A斜度中有效數(shù)據(jù)的統(tǒng)計(jì)量,根據(jù)所述有效數(shù)據(jù)的統(tǒng)計(jì)量將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述有效數(shù)據(jù)的統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的有效數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。

      14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述分類單元包括:

      計(jì)算單元,用于分別獲得存儲(chǔ)的頻譜波動(dòng)有效數(shù)據(jù)的均值,頻譜高頻帶峰度有效數(shù)據(jù)的均值,頻譜相關(guān)度有效數(shù)據(jù)的均值和線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差;

      判斷單元,用于當(dāng)下列條件之一滿足時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:所述頻譜波動(dòng)有效數(shù)據(jù)的均值小于第一閾值;或者頻譜高頻帶峰度有效數(shù)據(jù)的均值大于第二閾值;或者所述頻譜相關(guān)度有效數(shù)據(jù)的均值大于第三閾值;或者線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差小于第四閾值。

      15.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述參數(shù)獲得單元還用于:獲得當(dāng)前音頻幀的頻譜音調(diào)個(gè)數(shù)和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,并存儲(chǔ)于存儲(chǔ)器;

      所述分類單元具體用于:分別獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量;根據(jù)所述線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述有效數(shù)據(jù)的統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。

      16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述分類單元包括:

      計(jì)算單元,用于獲得線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差和存儲(chǔ)的頻譜音調(diào)個(gè)數(shù)的均值;

      判斷單元,用于當(dāng)當(dāng)前音頻幀為活動(dòng)幀,且滿足下列條件之一,則將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:線性預(yù)測(cè)殘差能量?jī)A斜度的方差小于第五閾值;或頻譜音調(diào)個(gè)數(shù)的均值大于第六閾值;或頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率小于第七閾值。

      17.根據(jù)權(quán)利要求10-16所述的任一裝置,其特征在于,所述參數(shù)獲得單元根據(jù)下列公式計(jì)算當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度:

      <mrow> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mo>_</mo> <mi>t</mi> <mi>i</mi> <mi>l</mi> <mi>t</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <mi>e</mi> <mi>p</mi> <mi>s</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

      其中,epsP(i)表示當(dāng)前音頻幀第i階線性預(yù)測(cè)的預(yù)測(cè)殘差能量;n為正整數(shù),表示線性預(yù)測(cè)的階數(shù),其小于等于線性預(yù)測(cè)的最大階數(shù)。

      18.根據(jù)權(quán)利要求15-16所述的任一裝置,其特征在于,所述參數(shù)獲得單元用于統(tǒng)計(jì)當(dāng)前音頻幀在0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量作為頻譜音調(diào)個(gè)數(shù);所述參數(shù)獲得單元用于計(jì)算當(dāng)前音頻幀在0~4kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量與0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量的比值,作為頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率。

      當(dāng)前第2頁(yè)1 2 3 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1