一種用于提高音頻分類器的gdm特征選擇方法
【專利摘要】本發(fā)明公開了一種用于提高音頻分類器性能的GDM特征選擇方法,對每一種音頻類型c,c∈[1,C],訓(xùn)練每種特征f的高斯混合模型Gfc;挑選第一個特征f1,對每一個特征,計(jì)算每兩類別之間的分離度,選擇第一個特征滿足使所有類別之間的平均分離度最大;在選出第一個特征f1后,從待選擇的特征集合中去掉特征f1,并找出f1對應(yīng)的各個類別中分離度最小的兩個類c1和c2;選擇第二個特征f2,選擇使得步驟三中找出的兩個類c1和c2分離度最大的特征f2;在選出第二個特征f2后,從待選則特征集合中去掉特征f2,并用選出的特征f1和f2組成一個特征矢量,最終得到選出的特征為。本發(fā)明選出的特征子集能夠使得最容易混淆的類別區(qū)分性最好,能夠提高分類器整體的分類精度。
【專利說明】一種用于提高音頻分類器的GDM特征選擇方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于音頻特征提取領(lǐng)域,尤其涉及一種用于提高音頻分類器的GDM特征選擇方法。
【背景技術(shù)】
[0002]音頻特征,是影響音頻分類器性能的另一關(guān)鍵因素。一段原始音頻流本身僅僅是一種非語義符號表示和非結(jié)構(gòu)化的二進(jìn)制流,除了含有采樣頻率、量化精度以及編碼方法等有限的信息外,本身并不包含明確的結(jié)構(gòu)信息和語義信息。
[0003]人耳具有極強(qiáng)的分辨能力,給定一段音頻流,不僅可以立即分辨出音頻的類型,還能分辨出音頻中說話人的情緒以及音樂的基調(diào)(興奮或壓抑等)等很難描述的聲音特征。要使計(jì)算機(jī)能夠具備像人耳一樣對音頻進(jìn)行分類和識別的功能,首先需要將音頻流從一系列的二值符號轉(zhuǎn)變?yōu)槟軌蚍从巢煌纛l類型之間差異的特征參數(shù),即特征提取。特征提取是各種分類問題的基礎(chǔ)。
[0004]根據(jù)特定問題和特定領(lǐng)域的性質(zhì),選擇有明顯區(qū)分能力的特征,是設(shè)計(jì)分類過程中非常關(guān)鍵的一部分。在有限訓(xùn)練樣本的情況下,我們希望用盡可能少的特征設(shè)計(jì)具有良好通用性的分類器。
[0005]傳統(tǒng)特征選擇的算法基于使所有類別的平均離散程度最大(GMM based MeanSeparability Maximizat1n,簡稱GMSM)準(zhǔn)則,這種特征選擇算法的性能很容易受易分類別的影響。而實(shí)際上,多類音頻分類器的性能除了受易分類別的影響外,更多的是受易混淆類別的影響,要提高分類器的性能,提高易混淆類別間的分類精度是問題的關(guān)鍵所在,因此,特征選擇時,應(yīng)該選取那些使得易混淆類別更容易區(qū)分的特征。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供一種用于提高音頻分類器的GDM特征選擇方法,旨在提高易混淆類別間的分類精度。
[0007]本發(fā)明是這樣實(shí)現(xiàn)的,一種用于提高音頻分類器的GDM特征選擇方法的具體步驟如下:
[0008]步驟一、訓(xùn)練模型,對每一種音頻類型C,c e [1,C],訓(xùn)練每種特征f的高斯混合模型Gf。;
[0009]步驟二、挑選第一個特征,對每一個特征,計(jì)算每兩類別之間的分離度,選擇第一個特征滿足使所有類別之間的平均分離度最大,即:
[0010]
【權(quán)利要求】
1.一種用于提高音頻分類器的GDM特征選擇方法,其特征在于,所述的用于提高音頻分類器的GDM特征選擇方法的具體步驟如下: 步驟一、訓(xùn)練模型,對每一種音頻類型c,c e [1,C],訓(xùn)練每種特征f的高斯混合模型Gfc ; 步驟二、挑選第一個特征Π,對每一個特征,計(jì)算每兩類別之間的分離度,選擇第一個特征滿足使所有類別之間的平均分離度最大,即:./; = arg max V V S1 (Gil, Gij);
步驟三、在選出第一個特征fi后,從待選擇的特征集合中去掉特征fi,并找出fi對應(yīng)的各個類別中分離度最小的兩個類C1和C2,即:
步驟四、選擇第二個特征f2,選擇使得步驟三中找出的兩個類C1和C2分離度最大的特征4,即:
步驟五、在選出第二個特征f2后,從待選則特征集合中去掉特征f2,并用選出的特征和f2組成一個特征矢量,迭代步驟三-步驟四,在迭代時,用下面的公式分別代替步驟三和步驟四中的兩個公式,即:
其中,I表示迭代的次數(shù); 判斷是否滿足迭代截止條件,若1〈L,則返回步驟三,否則,停止迭代,得到選出的特征為:4,f2,…,fL。
2.如權(quán)利要求1所述的用于提高音頻分類器的GDM特征選擇方法,其特征在于,用于提高音頻分類器的GDM特征選擇方法的問題描述如下: 假設(shè)有C個音頻類型,F(xiàn)種特征,要從中選出L個子特征,首先,對于每一種特征f,訓(xùn)練每一個類別的高斯混合模型GMMf。,c e [1,C],第c類高斯混合分布的概率密度函數(shù)為:
其中,K表示混合分量的個數(shù),?c = (Ji 1;..., Ji κ, θ 1;..., θ κ),表示模型的參數(shù),π j,表示第i個混合分量的權(quán)重,滿足約束條件
Qi= {μ” Σ^,表示第i個混合分?-1量的參數(shù); P (Xl θ J為每一個高斯分量,其表達(dá)形式如下:
其中,μ i為D維的均值矢量,表示高斯分量的均值; Si SDXD的協(xié)方差矩陣; 定義兩個類別之間的分離度(Separability)為:
Sf (GMMfk, GMMfl) = dis (GMMfk, GMMfl) dis(.,.)表示兩個高斯混合模型之間的距離,采用改進(jìn)的對稱距離度量K-L2距離,計(jì)算公式如下:
【文檔編號】G06K9/62GK104077382SQ201410298526
【公開日】2014年10月1日 申請日期:2014年6月27日 優(yōu)先權(quán)日:2014年6月27日
【發(fā)明者】王榮燕, 戎麗霞 申請人:德州學(xué)院