1.一種音頻信號(hào)分類方法,其特征在于,包括:
將輸入音頻信號(hào)進(jìn)行分幀處理;
獲得當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度;所述線性預(yù)測(cè)殘差能量?jī)A斜度表示音頻信號(hào)的線性預(yù)測(cè)殘差能量隨線性預(yù)測(cè)階數(shù)的升高而變化的程度;
將線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)到存儲(chǔ)器中;
根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)到存儲(chǔ)器中之前還包括:
根據(jù)所述當(dāng)前音頻幀的聲音活動(dòng)性,確定是否將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中;并在確定需要存儲(chǔ)時(shí)將將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量為預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差;所述根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類包括:
將預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差與音樂(lè)分類閾值相比較,當(dāng)所述預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差小于音樂(lè)分類閾值時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀;否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,還包括:
獲得當(dāng)前音頻幀的頻譜波動(dòng)、頻譜高頻帶峰度和頻譜相關(guān)度,并存儲(chǔ)于對(duì)應(yīng)的存儲(chǔ)器中;
其中,所述根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類包括:
分別獲得存儲(chǔ)的頻譜波動(dòng)、頻譜高頻帶峰度、頻譜相關(guān)度和線性預(yù)測(cè)殘差能量?jī)A斜度中有效數(shù)據(jù)的統(tǒng)計(jì)量,根據(jù)所述有效數(shù)據(jù)的統(tǒng)計(jì)量將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述有效數(shù)據(jù)的統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的有效數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,分別獲得存儲(chǔ)的頻譜波動(dòng)、頻譜高頻帶峰度、頻譜相關(guān)度和線性預(yù)測(cè)殘差能量?jī)A斜度中有效數(shù)據(jù)的統(tǒng)計(jì)量,根據(jù)所述有效數(shù)據(jù)的統(tǒng)計(jì)量將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀包括:
分別獲得存儲(chǔ)的頻譜波動(dòng)有效數(shù)據(jù)的均值,頻譜高頻帶峰度有效數(shù)據(jù)的均值,頻譜相關(guān)度有效數(shù)據(jù)的均值和線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差;
當(dāng)下列條件之一滿足時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:所述頻譜波動(dòng)有效數(shù)據(jù)的均值小于第一閾值;或者頻譜高頻帶峰度有效數(shù)據(jù)的均值大于第二閾值;或者所述頻譜相關(guān)度有效數(shù)據(jù)的均值大于第三閾值;或者線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差小于第四閾值。
6.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,還包括:
獲得當(dāng)前音頻幀的頻譜音調(diào)個(gè)數(shù)和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,并存儲(chǔ)于對(duì)應(yīng)的存儲(chǔ)器;
其中,所述根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類包括:
分別獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量;
根據(jù)所述線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,分別獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量包括:
獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的方差;
獲得存儲(chǔ)的頻譜音調(diào)個(gè)數(shù)的均值;
根據(jù)所述線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀包括:
當(dāng)當(dāng)前音頻幀為活動(dòng)幀,且滿足下列條件之一,則將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:
線性預(yù)測(cè)殘差能量?jī)A斜度的方差小于第五閾值;或
頻譜音調(diào)個(gè)數(shù)的均值大于第六閾值;或
頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率小于第七閾值。
8.根據(jù)權(quán)利要求1-7所述的任一方法,其特征在于,獲得當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度包括:
根據(jù)下列公式計(jì)算當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度:
其中,epsP(i)表示當(dāng)前音頻幀第i階線性預(yù)測(cè)的預(yù)測(cè)殘差能量;n為正整數(shù),表示線性預(yù)測(cè)的階數(shù),其小于等于線性預(yù)測(cè)的最大階數(shù)。
9.根據(jù)權(quán)利要求6-7所述的任一方法,其特征在于,獲得當(dāng)前音頻幀的頻譜音調(diào)個(gè)數(shù)和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率包括:
統(tǒng)計(jì)當(dāng)前音頻幀在0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量作為頻譜音調(diào)個(gè)數(shù);
計(jì)算當(dāng)前音頻幀在0~4kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量與0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量的比值,作為頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率。
10.一種信號(hào)分類裝置,用于對(duì)輸入的音頻信號(hào)進(jìn)行分類,其特征在于,包括:
分幀單元,用于對(duì)輸入音頻信號(hào)進(jìn)行分幀處理;
參數(shù)獲得單元,用于獲得當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度;所述線性預(yù)測(cè)殘差能量?jī)A斜度表示音頻信號(hào)的線性預(yù)測(cè)殘差能量隨線性預(yù)測(cè)階數(shù)的升高而變化的程度;
存儲(chǔ)單元,用于存儲(chǔ)線性預(yù)測(cè)殘差能量?jī)A斜度;
分類單元,用于根據(jù)存儲(chǔ)器中預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量,對(duì)所述音頻幀進(jìn)行分類。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,還包括:
存儲(chǔ)確認(rèn)單元,用于根據(jù)所述當(dāng)前音頻幀的聲音活動(dòng)性,確定是否將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中;
所述存儲(chǔ)單元具體用于,當(dāng)存儲(chǔ)確認(rèn)單元確認(rèn)需要確定需要存儲(chǔ)時(shí)將將所述線性預(yù)測(cè)殘差能量?jī)A斜度存儲(chǔ)于存儲(chǔ)器中。
12.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,
預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)量為預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差;
所述分類單元具體用于將預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差與音樂(lè)分類閾值相比較,當(dāng)所述預(yù)測(cè)殘差能量?jī)A斜度部分?jǐn)?shù)據(jù)的方差小于音樂(lè)分類閾值時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀;否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀。
13.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,參數(shù)獲得單元還用于:獲得當(dāng)前音頻幀的頻譜波動(dòng)、頻譜高頻帶峰度和頻譜相關(guān)度,并存儲(chǔ)于對(duì)應(yīng)的存儲(chǔ)器中;
所述分類單元具體用于:分別獲得存儲(chǔ)的頻譜波動(dòng)、頻譜高頻帶峰度、頻譜相關(guān)度和線性預(yù)測(cè)殘差能量?jī)A斜度中有效數(shù)據(jù)的統(tǒng)計(jì)量,根據(jù)所述有效數(shù)據(jù)的統(tǒng)計(jì)量將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述有效數(shù)據(jù)的統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的有效數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述分類單元包括:
計(jì)算單元,用于分別獲得存儲(chǔ)的頻譜波動(dòng)有效數(shù)據(jù)的均值,頻譜高頻帶峰度有效數(shù)據(jù)的均值,頻譜相關(guān)度有效數(shù)據(jù)的均值和線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差;
判斷單元,用于當(dāng)下列條件之一滿足時(shí),將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:所述頻譜波動(dòng)有效數(shù)據(jù)的均值小于第一閾值;或者頻譜高頻帶峰度有效數(shù)據(jù)的均值大于第二閾值;或者所述頻譜相關(guān)度有效數(shù)據(jù)的均值大于第三閾值;或者線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差小于第四閾值。
15.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述參數(shù)獲得單元還用于:獲得當(dāng)前音頻幀的頻譜音調(diào)個(gè)數(shù)和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,并存儲(chǔ)于存儲(chǔ)器;
所述分類單元具體用于:分別獲得存儲(chǔ)的線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量;根據(jù)所述線性預(yù)測(cè)殘差能量?jī)A斜度的統(tǒng)計(jì)量、頻譜音調(diào)個(gè)數(shù)的統(tǒng)計(jì)量和頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率,將所述音頻幀分類為語(yǔ)音幀或者音樂(lè)幀;所述有效數(shù)據(jù)的統(tǒng)計(jì)量指對(duì)存儲(chǔ)器中存儲(chǔ)的數(shù)據(jù)運(yùn)算操作后獲得的數(shù)據(jù)值。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述分類單元包括:
計(jì)算單元,用于獲得線性預(yù)測(cè)殘差能量?jī)A斜度有效數(shù)據(jù)的方差和存儲(chǔ)的頻譜音調(diào)個(gè)數(shù)的均值;
判斷單元,用于當(dāng)當(dāng)前音頻幀為活動(dòng)幀,且滿足下列條件之一,則將所述當(dāng)前音頻幀分類為音樂(lè)幀,否則將所述當(dāng)前音頻幀分類為語(yǔ)音幀:線性預(yù)測(cè)殘差能量?jī)A斜度的方差小于第五閾值;或頻譜音調(diào)個(gè)數(shù)的均值大于第六閾值;或頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率小于第七閾值。
17.根據(jù)權(quán)利要求10-16所述的任一裝置,其特征在于,所述參數(shù)獲得單元根據(jù)下列公式計(jì)算當(dāng)前音頻幀的線性預(yù)測(cè)殘差能量?jī)A斜度:
其中,epsP(i)表示當(dāng)前音頻幀第i階線性預(yù)測(cè)的預(yù)測(cè)殘差能量;n為正整數(shù),表示線性預(yù)測(cè)的階數(shù),其小于等于線性預(yù)測(cè)的最大階數(shù)。
18.根據(jù)權(quán)利要求15-16所述的任一裝置,其特征在于,所述參數(shù)獲得單元用于統(tǒng)計(jì)當(dāng)前音頻幀在0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量作為頻譜音調(diào)個(gè)數(shù);所述參數(shù)獲得單元用于計(jì)算當(dāng)前音頻幀在0~4kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量與0~8kHz頻帶上頻點(diǎn)峰值大于預(yù)定值的頻點(diǎn)數(shù)量的比值,作為頻譜音調(diào)個(gè)數(shù)在低頻帶上的比率。