一種聲音重錄攻擊的識(shí)別方法與流程

文檔序號(hào)：11136028閱讀：來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種聲音重錄攻擊的識(shí)別方法與制造工藝

技術(shù)特征：

1.一種聲音重錄攻擊的識(shí)別方法，其特征在于，主要包括以下步驟：

首先，提取MFCC；

其次，對(duì)語音片段x(n)分幀；

所述語音片段x(n)分幀分成N幀，則每幀分別提取前L維MFCC系數(shù)、前L維一次差分MFCC系數(shù)(ΔMFCC)和前L維二次差分MFCC系數(shù)(ΔΔMFCC)，獲得3個(gè)L維向量，記x(n)第i幀的MFCC向量的第j個(gè)元素為v_ij，則x(n)所有幀的MFCC向量的第j個(gè)元素V_j可表示為

V_j＝{v_1j，v_2j，…，v_Nj}，j＝1，2，…，L (1)

第三，提取語音識(shí)別特征；

使用兩種統(tǒng)計(jì)矩，即向量V_j的均值E_j和V_j與V_j的相關(guān)系數(shù)C_jj，即

E_j＝E(V_j)，j＝1，2，…，L (2)

$<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <mi>C</mi> <mrow> <msup> <mi>jj</mi> <mo>′</mo> </msup> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <mi>cov</mi> <mrow> <mo>(</mo> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>V</mi> <msup> <mi>j</mi> <mo>′</mo> </msup> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <mi>V</mi> <mi>A</mi> <mi>R</mi> <mrow> <mo>(</mo> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </msqrt> <msqrt> <mrow> <mi>V</mi> <mi>A</mi> <mi>R</mi> <mrow> <mo>(</mo> <msub> <mi>V</mi> <msup> <mi>j</mi> <mo>′</mo> </msup> </msub> <mo>)</mo> </mrow> </mrow> </msqrt> </mrow> </mfrac> </mrow> </mtd> <mtd> <mrow> <mn>1</mn> <mo>≤</mo> <mi>j</mi> <mo><</mo> <msup> <mi>j</mi> <mo>′</mo> </msup> <mo>≤</mo> <mi>L</mi> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

兩種統(tǒng)計(jì)特征聯(lián)合組成基于MFCC的統(tǒng)計(jì)特征向量，即

F_MFCC＝[E₁，E₂，…，E_L，C₁₂，C₁₃，…，C_(L-1)L] (4)

其中，F(xiàn)_MFCC的維數(shù)為L(zhǎng)+1+2+…+(L-1)＝L+L*(L-1)/2＝(L²+L)/2，對(duì)ΔMFCC向量和ΔΔMFCC向量計(jì)算相同的統(tǒng)計(jì)特征向量F_ΔMFCC和F_ΔΔMFCC，將F_MFCC、F_ΔMFCC和F_ΔΔMFCC連在一起組成x(n)的特征向量F，即

F＝[F_MFCC，F(xiàn)_ΔMFCC，F(xiàn)_ΔΔMFCC] (5)

其中，F(xiàn)的維數(shù)為3*(L²+L)/2；F即為本發(fā)明采用的識(shí)別特征；

第四，訓(xùn)練出SVM分類器；輸入原始語音作為正例訓(xùn)練樣本，輸入錄制語音作為反例訓(xùn)練樣本，從正反例樣本中提取特征F以訓(xùn)練出SVM分類器；

最后，測(cè)試識(shí)別；提取特征測(cè)試語音的特征F并輸入SVM分類器進(jìn)行判別。

2.根據(jù)權(quán)利要求1所述的一種聲音重錄攻擊的識(shí)別方法，其特征在于，所述提取MFCC主要包括以下步驟：

首先，加窗和計(jì)算頻譜，窗長(zhǎng)度為N，

其中的MFCC采用了N＝1024點(diǎn)的海明窗：

$<mrow> <mtable> <mtr> <mtd> <mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>0.53836</mn> <mo>-</mo> <mn>0.46164</mn> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>π</mi> <mi>n</mi> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mn>0</mn> <mo>≤</mo> <mi>n</mi> <mo><</mo> <mi>N</mi> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>$

對(duì)源信號(hào)x(n)加窗后作FFT變換：

$<mrow> <mtable> <mtr> <mtd> <mrow> <mi>F</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>x</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>·</mo> <mi>w</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>·</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mfrac> <mrow> <mn>2</mn> <mi>π</mi> </mrow> <mi>N</mi> </mfrac> <mo>·</mo> <mi>k</mi> <mo>·</mo> <mi>n</mi> </mrow> </msup> </mrow> </mtd> <mtd> <mrow> <mn>0</mn> <mo>≤</mo> <mi>n</mi> <mo><</mo> <mi>N</mi> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>$

其次，Mel分段和對(duì)數(shù)變換，Mel分段為三角濾波，

加權(quán)窗口使用三角窗，其公式如下：

$<mrow> <msub> <mi>H</mi> <mi>m</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>k</mi> <mo><</mo> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mfrac> <mrow> <mi>k</mi> <mo>-</mo> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> <mrow> <msub> <mi>k</mi> <mi>m</mi> </msub> <mo>-</mo> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </mfrac> </mtd> <mtd> <mrow> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>≤</mo> <mi>k</mi> <mo>≤</mo> <msub> <mi>k</mi> <mi>m</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mfrac> <mrow> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <mi>k</mi> </mrow> <mrow> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>k</mi> <mi>m</mi> </msub> </mrow> </mfrac> </mtd> <mtd> <mrow> <msub> <mi>k</mi> <mi>m</mi> </msub> <mo><</mo> <mi>k</mi> <mo>≤</mo> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>k</mi> <mo>></mo> <msub> <mi>k</mi> <mrow> <mi>m</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>$

其中，k_m＝f(m)·N/F_s，F(xiàn)_s為抽樣頻率，利用三角窗對(duì)FFT的能量譜加權(quán)后作對(duì)數(shù)變換：

$<mrow> <mtable> <mtr> <mtd> <mrow> <mi>Y</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>[</mo> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mo>|</mo> <mi>F</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>·</mo> <msub> <mi>H</mi> <mi>m</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>]</mo> </mrow> </mtd> <mtd> <mrow> <mn>1</mn> <mo>≤</mo> <mi>m</mi> <mo>≤</mo> <mi>M</mi> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>$

再次，得出MFCC，

$<mrow> <mtable> <mtr> <mtd> <mrow> <mi>M</mi> <mi>F</mi> <mi>C</mi> <mi>C</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>M</mi> </mfrac> <munderover> <mo>Σ</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mi>Y</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>-</mo> <mn>0.5</mn> <mo>)</mo> </mrow> <mi>π</mi> </mrow> <mi>M</mi> </mfrac> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mn>1</mn> <mo>≤</mo> <mi>m</mi> <mo>≤</mo> <mi>M</mi> </mrow> </mtd> <mtd> <mrow> <mn>0</mn> <mo>≤</mo> <mi>n</mi> <mo>≤</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>$

利用余弦反變換，即可得到Mel倒譜系數(shù)，即MFCC。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)