移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)的制作方法

文檔序號(hào)：2825458閱讀：975來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)，所述聲紋注冊(cè)方法包括：將語(yǔ)音進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；將聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；根據(jù)模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成聲紋注冊(cè)。在聲紋注冊(cè)階段，根據(jù)模型統(tǒng)計(jì)量注冊(cè)聲紋模型；在認(rèn)證階段，模型統(tǒng)計(jì)量和存儲(chǔ)的聲紋模型進(jìn)行比對(duì)。本發(fā)明降低了聲紋模型的計(jì)算量并減少了聲紋特征的存儲(chǔ)空間，解決了移動(dòng)設(shè)備對(duì)算法實(shí)時(shí)性的需求，不需要通過(guò)聯(lián)網(wǎng)進(jìn)行注冊(cè)和認(rèn)證，也不需要將用戶(hù)聲紋數(shù)據(jù)上傳到服務(wù)器，提升了用戶(hù)使用體驗(yàn)也保證了用戶(hù)隱私安全。
【專(zhuān)利說(shuō)明】移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)設(shè)備加密領(lǐng)域，尤其是涉及移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)。
【背景技術(shù)】
[0002]對(duì)于各種移動(dòng)設(shè)備，如手機(jī)、平板電腦、電子書(shū)等，需要加密時(shí)一般是通過(guò)密碼的方式進(jìn)行加密，例如密碼鎖屏、收件箱加密、文件夾加密、通訊錄加密等等。倘若密碼泄漏或者被盜取時(shí)，手機(jī)很容易被解鎖，達(dá)不到原有的保護(hù)用戶(hù)隱私的目標(biāo)。另外，用戶(hù)在使用密碼進(jìn)行解鎖時(shí)，通常需要記住之前設(shè)定的密碼，也為用戶(hù)的使用帶來(lái)不便。
[0003]聲紋識(shí)別屬于生物識(shí)別技術(shù)的一種，是一項(xiàng)根據(jù)語(yǔ)音波形中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù)，自動(dòng)識(shí)別說(shuō)話人身份的技術(shù)。與語(yǔ)音識(shí)別不同的是，聲紋識(shí)別利用的是語(yǔ)音信號(hào)中說(shuō)話人的語(yǔ)音特點(diǎn)，而不考慮語(yǔ)音中的字詞意思，即它強(qiáng)調(diào)說(shuō)話人的個(gè)性信息；而語(yǔ)音識(shí)別的目的是識(shí)別出語(yǔ)音信號(hào)中的言語(yǔ)(文本)內(nèi)容，并不考慮說(shuō)話人是誰(shuí)，它強(qiáng)調(diào)不同說(shuō)話人之間文本內(nèi)容共性信息。目前，基于聲紋的特征識(shí)別技術(shù)已經(jīng)有所發(fā)展。基于聲紋特征識(shí)別技術(shù)的認(rèn)證相對(duì)普通的密碼認(rèn)證解鎖有很大的優(yōu)勢(shì)，它不需要記憶密碼，直接利用用戶(hù)的語(yǔ)音特征作為身份認(rèn)證的方式，而且也不會(huì)發(fā)生密碼泄漏或者被盜取的問(wèn)題。
[0004]一般的聲紋處理系統(tǒng)，如基于聲紋的身份認(rèn)證系統(tǒng)，通常采用聯(lián)網(wǎng)的方式進(jìn)行聲紋驗(yàn)證，即，將采集的聲紋發(fā)送給服務(wù)器，然后由服務(wù)器返回認(rèn)證結(jié)果。發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn):這種方式的缺點(diǎn)是每次都需要連接網(wǎng)絡(luò)，不適用于沒(méi)有網(wǎng)絡(luò)連接或用戶(hù)不想聯(lián)網(wǎng)的場(chǎng)景，而且也無(wú)法保護(hù)用戶(hù)的隱私，但是，如果在手機(jī)、電子書(shū)、平板電腦等移動(dòng)設(shè)備實(shí)現(xiàn)離線聲紋認(rèn)證，則會(huì)因?yàn)樗惴◤?fù)雜度高、計(jì)算量較大、計(jì)算時(shí)間較長(zhǎng)而帶來(lái)實(shí)時(shí)性難以保證的問(wèn)題，導(dǎo)致用戶(hù)體驗(yàn)度的降低，實(shí)用性較差。

【發(fā)明內(nèi)容】

[0005]有鑒于此，本發(fā)明實(shí)施例的目的是提供移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)，以使移動(dòng)設(shè)備可以離線進(jìn)行聲紋注冊(cè)、認(rèn)證。
[0006]一方面，本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋注冊(cè)方法，所述方法包括:
[0007]將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；
[0008]將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；
[0009]根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成聲紋注冊(cè)。
[0010]優(yōu)選的，所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征，具體包括:
[0011]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；
[0012]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
[0013]優(yōu)選的，所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量，具體包括:
[0014]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；
[0015]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0016]優(yōu)選的，所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算，所述對(duì)數(shù)計(jì)算采用如下方式完成:
[0017]將待計(jì)算的數(shù)據(jù)拆分成兩部分，所述兩部分包括2的整冪數(shù)部分和余下的部分；將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果；所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算，擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
[0018]優(yōu)選的，所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前，還包括:
[0019]對(duì)所述語(yǔ)音進(jìn)行降噪處理。
[0020]優(yōu)選的，所述對(duì)所述語(yǔ)音進(jìn)行降噪處理，具體包括:
[0021]對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
[0022]另一方面，本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋認(rèn)證方法，其特征在于，所述方法包括:
[0023]將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；
[0024]將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；
[0025]根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；
[0026]將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比，然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
[0027]優(yōu)選的，所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征，具體包括:
[0028]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；
[0029]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
[0030]優(yōu)選的，所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量，具體包括:
[0031]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；
[0032]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0033]優(yōu)選的，所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算，所述對(duì)數(shù)計(jì)算采用如下方式完成:
[0034]待計(jì)算的數(shù)據(jù)拆分成兩部分，所述兩部分包括2的整冪數(shù)部分和余下的部分；將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果；所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算，擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
[0035]優(yōu)選的，所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前，還包括:
[0036]對(duì)所述語(yǔ)音進(jìn)行降噪處理。
[0037]優(yōu)選的，所述對(duì)所述語(yǔ)音進(jìn)行降噪處理，具體包括:
[0038]對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
[0039]再一方面，本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋注冊(cè)系統(tǒng)，所述系統(tǒng)包括:
[0040]聲紋特征數(shù)據(jù)獲取模塊，用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；
[0041]聲紋特征數(shù)據(jù)壓縮模塊，用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；
[0042]模型統(tǒng)計(jì)量獲取模塊，用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0043]聲紋注冊(cè)模塊，用于根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成聲紋注冊(cè)。
[0044]優(yōu)選的，所述聲紋特征數(shù)據(jù)壓縮模塊具體用于:
[0045]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；
[0046]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮；
[0047]所述模型統(tǒng)計(jì)量獲取模塊具體用于:
[0048]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；
[0049]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0050]優(yōu)選的，所述系統(tǒng)還包括:
[0051]降噪模塊，用于對(duì)所述語(yǔ)音進(jìn)行降噪處理；
[0052]所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
[0053]再一方面，本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋認(rèn)證系統(tǒng)，所述系統(tǒng)包括:
[0054]聲紋特征數(shù)據(jù)獲取模塊，用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；
[0055]聲紋特征數(shù)據(jù)壓縮模塊，用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；
[0056]模型統(tǒng)計(jì)量獲取模塊，用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0057]聲紋認(rèn)證模塊，用于將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比，然后根據(jù)所得匹配度進(jìn)行認(rèn)證。[0058]優(yōu)選的，所述聲紋特征數(shù)據(jù)壓縮模塊具體用于:
[0059]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；
[0060]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮；
[0061]所述模型統(tǒng)計(jì)量獲取模塊具體用于:
[0062]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；
[0063]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0064]優(yōu)選的，所述系統(tǒng)還包括:
[0065]降噪模塊，用于對(duì)所述語(yǔ)音進(jìn)行降噪處理；
[0066]所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音
[0067]本發(fā)明實(shí)施例在初步提取聲紋特征之后，對(duì)原始的聲紋特征做了進(jìn)一步處理，以降低后續(xù)聲紋模型注冊(cè)、認(rèn)證的計(jì)算量以及減少聲紋特征的存儲(chǔ)空間。具體來(lái)講，本發(fā)明實(shí)施例對(duì)原始的聲紋特征數(shù)據(jù)進(jìn)行了壓縮映射，將原始的聲紋特征映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，通過(guò)直接查詢(xún)存儲(chǔ)的數(shù)據(jù)表代替實(shí)際計(jì)算，從而加快了模型訓(xùn)練和聲紋認(rèn)證的速度，減少了計(jì)算時(shí)間，保證移動(dòng)設(shè)備上的用戶(hù)體驗(yàn)和正常使用；而且由于壓縮映射已經(jīng)建立了和數(shù)據(jù)存儲(chǔ)表直接的映射關(guān)系，所以對(duì)聲紋特征只需存儲(chǔ)其對(duì)應(yīng)的在數(shù)據(jù)存儲(chǔ)表中的索弓I，而只存儲(chǔ)索引的聲紋特征所占據(jù)的空間比直接存儲(chǔ)原始聲紋特征要小，適合手機(jī)這類(lèi)資源受限的移動(dòng)設(shè)備平臺(tái)。因此，最終解決了移動(dòng)設(shè)備離線實(shí)現(xiàn)聲紋注冊(cè)、認(rèn)證等聲紋處理時(shí)對(duì)算法實(shí)時(shí)性的需求，不需要通過(guò)聯(lián)網(wǎng)服務(wù)器進(jìn)行注冊(cè)和認(rèn)證，也不需要將用戶(hù)聲紋數(shù)據(jù)上傳到服務(wù)器，增加了用戶(hù)在使用時(shí)的良好體驗(yàn)，也保證了用戶(hù)的隱私安全。
[0068]另外，本發(fā)明實(shí)施例還構(gòu)建了模型成分選擇器，用來(lái)為每一幀聲紋特征選擇對(duì)應(yīng)的模型成分，然后利用選擇出來(lái)的模型成分為每幀聲紋特征計(jì)算模型統(tǒng)計(jì)量，這樣可以從算法上節(jié)約大量的計(jì)算量，進(jìn)而加速聲紋模型注冊(cè)的計(jì)算速度，保證了聲紋認(rèn)證結(jié)果的及時(shí)響應(yīng)。
[0069]此外，針對(duì)移動(dòng)設(shè)備由于受硬件的限制，和PC機(jī)以及服務(wù)器相比計(jì)算能力差距較大，尤其浮點(diǎn)計(jì)算能力降低比較明顯的問(wèn)題，本發(fā)明實(shí)施例還在聲紋提取過(guò)程中，對(duì)對(duì)數(shù)運(yùn)算做了相應(yīng)的優(yōu)化處理，從而也降低了計(jì)算量。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0070]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0071]圖1是本發(fā)明實(shí)施例一方法的流程圖；
[0072]圖2是兩層樹(shù)形結(jié)構(gòu)模型成分選擇器示意圖；[0073]圖3是多級(jí)分段線性擬合示意圖；
[0074]圖4是本發(fā)明實(shí)施例二方法的流程圖；
[0075]圖5是本發(fā)明實(shí)施例三用戶(hù)注冊(cè)總框架示意圖；
[0076]圖6是本發(fā)明實(shí)施例三注冊(cè)階段聲紋識(shí)別框圖；
[0077]圖7是本發(fā)明實(shí)施例三認(rèn)證階段聲紋識(shí)別框圖；
[0078]圖8是本發(fā)明實(shí)施例三降噪模塊流程示意圖；
[0079]圖9是本發(fā)明實(shí)施例三聲紋注冊(cè)界面示意圖；
[0080]圖10是本發(fā)明實(shí)施例三聲紋認(rèn)證界面示意圖；
[0081]圖11是本發(fā)明實(shí)施例四系統(tǒng)的示意圖；
[0082]圖12是本發(fā)明實(shí)施例五系統(tǒng)的示意圖。
【具體實(shí)施方式】
[0083]下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。
[0084]實(shí)施例一
[0085]參見(jiàn)圖1，為本發(fā)明實(shí)施例一方法的流程圖。本實(shí)施例提供了一種移動(dòng)設(shè)備聲紋注冊(cè)方法，所述方法包括:
[0086]SlOl:將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)。欲在手機(jī)等移動(dòng)設(shè)備上實(shí)現(xiàn)聲紋加密的應(yīng)用，首先也是最重要的就是進(jìn)行聲紋的注冊(cè)。而聲紋注冊(cè)的需要先獲取聲紋特征數(shù)據(jù)，其基本過(guò)程如下:首先對(duì)用戶(hù)的錄音數(shù)據(jù)分幀處理，每一巾貞語(yǔ)音計(jì)算頻譜分析，在估計(jì)噪聲對(duì)語(yǔ)音頻譜的影響時(shí)候，引入聽(tīng)覺(jué)感知機(jī)制，估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小，由此來(lái)構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，最后初步得到聲紋特征數(shù)據(jù)，即原始的聲紋特征。由于本步驟可以直接使用現(xiàn)有技術(shù)，故本實(shí)施例不再詳細(xì)贅述。
[0087]S102:將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)。為了減少聲紋特征在后續(xù)建模和對(duì)比認(rèn)證中的計(jì)算量，本實(shí)施例對(duì)上一步獲取到的原始聲紋特征進(jìn)行了規(guī)整和壓縮映射。聲紋特征壓縮映射是指將原始的聲紋特征映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，數(shù)據(jù)表中的特征數(shù)據(jù)是根據(jù)統(tǒng)計(jì)分布情況選取的固定數(shù)值，故對(duì)后續(xù)的一些計(jì)算量可以通過(guò)事先計(jì)算出，存儲(chǔ)在數(shù)據(jù)表中，在使用中，通過(guò)直接查詢(xún)存儲(chǔ)的數(shù)據(jù)表代替實(shí)際計(jì)算，加快模型訓(xùn)練和聲紋認(rèn)證的速度。
[0088]優(yōu)選的，S102具體可以包括以下步驟:
[0089]S1021:使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布。本步驟簡(jiǎn)言之即特征分布估計(jì)。量化的聲紋特征數(shù)據(jù)表是一個(gè)正態(tài)分布表，通過(guò)估計(jì)注冊(cè)時(shí)的聲紋或者認(rèn)證時(shí)的聲紋的特征數(shù)據(jù)的統(tǒng)計(jì)分布，建立和數(shù)據(jù)存儲(chǔ)表之間的映射關(guān)系。為了簡(jiǎn)化特征分布估計(jì)的復(fù)雜度，用特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布，隨著直方圖的段數(shù)的增加，可以逐漸逼近聲紋特征的真實(shí)分布。通過(guò)選擇合適的段數(shù)，可以在特征估計(jì)的計(jì)算量和精確度之間做一個(gè)折中。[0090]S1022:將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。本步驟簡(jiǎn)言之即特征壓縮映射。根據(jù)聲紋特征在分布中的位置作為與數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)索引將原始的聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，利用映射后的索引查詢(xún)對(duì)應(yīng)的數(shù)據(jù)表數(shù)值。
[0091]特征壓縮映射可以帶來(lái)兩個(gè)好處:第一，通過(guò)特征壓縮映射，可以量化原始的聲紋特征數(shù)據(jù)，壓縮數(shù)據(jù)的聲紋特征的范圍，降低后續(xù)模型訓(xùn)練和聲紋認(rèn)證的計(jì)算量。第二，由于壓縮映射已經(jīng)建立了和數(shù)據(jù)存儲(chǔ)表直接的映射關(guān)系，所以對(duì)聲紋特征只需存儲(chǔ)其對(duì)應(yīng)的在數(shù)據(jù)存儲(chǔ)表中的索引，而只存儲(chǔ)索引的聲紋特征所占據(jù)的空間比直接存儲(chǔ)原始聲紋特征要小，適合手機(jī)這種資源受限的平臺(tái)情況。
[0092]S103:根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量。本實(shí)施例對(duì)聲紋進(jìn)行處理時(shí)所期望的成果即獲取到模型統(tǒng)計(jì)量，這也是聲紋處理要完成的最核心內(nèi)容。本步驟可以直接使用現(xiàn)有技術(shù)。但是，為了進(jìn)一步的提高處理速度，降低計(jì)算量，本發(fā)明實(shí)施例對(duì)S103進(jìn)行了優(yōu)化，所以?xún)?yōu)選的，S103具體可以包括:
[0093]S1031:對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分。
[0094]S1032:根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0095]發(fā)明人通過(guò)分析現(xiàn)有的聲紋注冊(cè)和認(rèn)證算法發(fā)現(xiàn)，實(shí)現(xiàn)過(guò)程的耗時(shí)主要在根據(jù)聲紋特征計(jì)算對(duì)應(yīng)的模型統(tǒng)計(jì)量中，而模型統(tǒng)計(jì)量計(jì)算的次數(shù)又和模型成分的數(shù)目N密切相關(guān)。在現(xiàn)有的聲紋系統(tǒng)中，由于在服務(wù)器端運(yùn)行，資源充分，所以在計(jì)算模型統(tǒng)計(jì)量時(shí)，所有的模型成分都參與計(jì)算。
[0096]而本實(shí)施例為了降低模型統(tǒng)計(jì)量計(jì)算的次數(shù)，通過(guò)對(duì)比模型統(tǒng)計(jì)量的數(shù)值與模型成分以及聲紋特征之間的關(guān)聯(lián)，發(fā)現(xiàn)在計(jì)算模型統(tǒng)計(jì)量時(shí)，可以對(duì)不同的聲紋特征選擇相應(yīng)的部分模型成分參與統(tǒng)計(jì)量計(jì)算，不必采用全部的模型成分，這樣既能保證模型訓(xùn)練與聲紋認(rèn)證的精度，又能提高估計(jì)模型統(tǒng)計(jì)量的速度。實(shí)驗(yàn)結(jié)果表明，對(duì)于特定的每一幀聲紋特征而言，這些模型成分對(duì)計(jì)算模型統(tǒng)計(jì)量的貢獻(xiàn)度是不一樣的，因此可以為每一幀聲紋特征選擇相應(yīng)的貢獻(xiàn)較大的的模型成分計(jì)算相應(yīng)的模型統(tǒng)計(jì)量，而無(wú)須用全部的模型統(tǒng)計(jì)量參與計(jì)算模型統(tǒng)計(jì)量。
[0097]為了實(shí)現(xiàn)能夠?qū)Σ煌穆暭y特征選擇對(duì)應(yīng)的模型成分，本實(shí)施例設(shè)計(jì)了一種兩層樹(shù)形結(jié)構(gòu)的模型成分選擇器，參見(jiàn)圖2所示，通過(guò)模型成分選擇器，選擇對(duì)應(yīng)的K個(gè)模型成分參與模型統(tǒng)計(jì)量計(jì)算。而K要遠(yuǎn)小于模型成分?jǐn)?shù)據(jù)N，所以能夠?qū)崿F(xiàn)降低模型訓(xùn)練和聲紋認(rèn)證復(fù)雜度的目的。
[0098]模型成分選擇步驟如下:
[0099]a、模型成分選擇:對(duì)于注冊(cè)和認(rèn)證的聲紋特征，首先和模型成分選擇器的第一層的G廣Gk共K個(gè)成分計(jì)算統(tǒng)計(jì)量，選擇對(duì)應(yīng)的統(tǒng)計(jì)量最大的選擇器成分。將此選擇器第一層中最大的成分對(duì)應(yīng)的第二層模型成分用來(lái)計(jì)算真正的模型統(tǒng)計(jì)量。模型選擇器的作用就是找出N個(gè)模型成分中對(duì)統(tǒng)計(jì)量的計(jì)算起到關(guān)鍵作用的對(duì)應(yīng)的成分，保證后續(xù)計(jì)算統(tǒng)計(jì)量的精確度。
[0100]b、選擇后統(tǒng)計(jì)量計(jì)算:聲紋特征只和模型選擇器中第二層的模型成分計(jì)算統(tǒng)計(jì)量，而對(duì)沒(méi)有選擇的模型成分對(duì)應(yīng)的統(tǒng)計(jì)量不參與后續(xù)的模型注冊(cè)和聲紋認(rèn)證的計(jì)算，從而降低計(jì)算復(fù)雜度。
[0101]對(duì)于不同幀的聲紋特征而言，其所對(duì)應(yīng)的貢獻(xiàn)較大的模型成分是不同的，所以本實(shí)施例構(gòu)建了模型成分選擇器，用來(lái)為每一幀聲紋特征選擇對(duì)應(yīng)的模型成分，然后，利用選擇出來(lái)的模型成分為每幀聲紋特征計(jì)算模型統(tǒng)計(jì)量，這樣，可以從算法上節(jié)約大量的計(jì)算量。進(jìn)而，加速聲紋模型注冊(cè)的計(jì)算速度，以及保證聲紋認(rèn)證結(jié)果的及時(shí)響應(yīng)。
[0102]本實(shí)施例針對(duì)手機(jī)運(yùn)算能力的限制，提出了一種選擇貢獻(xiàn)較大模型成分并計(jì)算模型統(tǒng)計(jì)量的方法。比如，模型有512個(gè)模型成分，針對(duì)其中一幀聲紋特征，對(duì)模型統(tǒng)計(jì)量有決定性貢獻(xiàn)的模型成分僅僅只有10個(gè)，剩下的502個(gè)模型成分對(duì)該幀聲紋特征幾乎沒(méi)有貢獻(xiàn)。那么在計(jì)算模型統(tǒng)計(jì)量的時(shí)候，只需要計(jì)算該幀聲紋特征在此10個(gè)模型成分上產(chǎn)生的模型統(tǒng)計(jì)量，而忽略剩余的502個(gè)模型成分，從而可以成倍的提高計(jì)算模型統(tǒng)計(jì)量的速度，以此提高注冊(cè)和認(rèn)證的速度。
[0103]S104:根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成聲紋注冊(cè)。即將發(fā)出該段語(yǔ)音的人的聲紋相關(guān)特征以模型的方式存儲(chǔ)在移動(dòng)設(shè)備上，以待后續(xù)使用。從模型統(tǒng)計(jì)量到聲紋模型的過(guò)程，是屬于現(xiàn)有技術(shù)，在教材或者網(wǎng)絡(luò)資料上都能找到，比如HMM、GMM模型等，本實(shí)施例不再贅述。
[0104]此外，優(yōu)選的，在SlOl之前，還可以包括:
[0105]SlOO:對(duì)所述語(yǔ)音進(jìn)行降噪處理。在比較嘈雜的環(huán)境中，用戶(hù)注冊(cè)和認(rèn)證的語(yǔ)音受到環(huán)境的干擾，導(dǎo)致聲紋認(rèn)證的性能也受到影響。針對(duì)環(huán)境噪聲，在聲紋特征注冊(cè)及認(rèn)證的過(guò)程中可以加入降噪模塊，程序在獲得用戶(hù)的錄制語(yǔ)音之后，首先經(jīng)過(guò)降噪模塊的處理，然后再進(jìn)行后續(xù)的靜音檢測(cè)判決，以及聲紋特征提取等。處理后的聲紋特征可以更加有效提高聲紋認(rèn)證系統(tǒng)的魯棒性。
[0106]所述對(duì)所述語(yǔ)音進(jìn)行降噪處理，具體可以包括:
[0107]對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。首先對(duì)用戶(hù)的錄音數(shù)據(jù)分幀處理，每一幀語(yǔ)音計(jì)算頻譜分析，在估計(jì)噪聲對(duì)語(yǔ)音頻譜的影響時(shí)候，引入聽(tīng)覺(jué)感知機(jī)制，估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小，由此來(lái)構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，然后通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
[0108]另外，由于手機(jī)硬件的限制，和PC機(jī)以及服務(wù)器相比，計(jì)算能力差距較大，尤其浮點(diǎn)計(jì)算能力降低比較明顯，而在聲紋提取過(guò)程中主要就是浮點(diǎn)的計(jì)算。除了采用常規(guī)的算法定點(diǎn)化的移植外，針對(duì)在聲紋特征提取中對(duì)數(shù)運(yùn)算的計(jì)算部分耗時(shí)較多，本實(shí)施例對(duì)對(duì)數(shù)運(yùn)算做了相應(yīng)的優(yōu)化處理。在上文一個(gè)或多個(gè)步驟中都會(huì)遇到對(duì)數(shù)計(jì)算，例如，參數(shù)變換壓縮處理的過(guò)程中，降噪的頻譜分析和降噪處理中等等。通過(guò)對(duì)數(shù)優(yōu)化，可以降低語(yǔ)音降噪模塊的計(jì)算量。
[0109]具體的，所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算，所述對(duì)數(shù)計(jì)算采用如下方式完成:
[0110]將待計(jì)算的數(shù)據(jù)拆分成兩部分，所述兩部分包括2的整冪數(shù)部分和余下的部分；將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果；所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算，擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
[0111]換句話說(shuō)，對(duì)數(shù)計(jì)算優(yōu)化處理過(guò)程可以分為如下兩步:
[0112]I)拆分步驟:由于硬件實(shí)現(xiàn)二進(jìn)制的移位運(yùn)算比較快速和方便，為了能采用硬件的這一優(yōu)點(diǎn)，首先將數(shù)據(jù)X拆成兩部分，即2的整冪數(shù)A和余下的部分B=X-A兩部分，由于數(shù)值在硬件存儲(chǔ)是按照二進(jìn)制存儲(chǔ)，所以A部分計(jì)算的結(jié)果就是在硬件中存儲(chǔ)的位數(shù)。B部分的計(jì)算采用近似計(jì)算以提高速度。
[0113]2)近似計(jì)算步驟:選用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算，B/A部分的輸入限制在(0，I)之間。其原始結(jié)果可參見(jiàn)圖3中實(shí)線所示，擬合的結(jié)果可參見(jiàn)圖3中虛線所示。擬合的誤差可以通過(guò)分段的級(jí)數(shù)自動(dòng)控制。線性計(jì)算的耗時(shí)比直接的對(duì)數(shù)計(jì)算相比降低很多。
[0114]實(shí)施例二
[0115]參見(jiàn)圖4，為本發(fā)明實(shí)施例二方法的流程圖。本實(shí)施例提供了一種移動(dòng)設(shè)備聲紋認(rèn)證方法。本實(shí)施例與實(shí)施例一相呼應(yīng)，本實(shí)施例的前三步與實(shí)施例一中的SlOf S103相同，不同點(diǎn)在于:實(shí)施例一中，S103獲取到聲紋的模型統(tǒng)計(jì)量之后，所接下來(lái)的步驟是S104，即進(jìn)行聲紋的注冊(cè)；而在本實(shí)施例中，在獲取到聲紋的模型統(tǒng)計(jì)量，接下來(lái)的步驟為:
[0116]S105:將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比，然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
[0117]即輸入一段語(yǔ)音，通過(guò)以上方法提取聲紋相關(guān)特征后與已注冊(cè)的聲紋特征進(jìn)行比較、匹配，從而判斷是否是同一人的聲紋，實(shí)現(xiàn)聲紋認(rèn)證。聲紋認(rèn)證的過(guò)程與上述聲紋注冊(cè)的過(guò)程大致相同，都是針對(duì)一段語(yǔ)音進(jìn)行特征提取、壓縮等、建模處理，所不同的是，在聲紋注冊(cè)階段，在聲紋特征提取、壓縮、建模后，接下來(lái)是存儲(chǔ)，即將聲紋模型存儲(chǔ)在移動(dòng)設(shè)備上待用，從而完成了聲紋注冊(cè)。而在聲紋認(rèn)證階段，在聲紋特征提取、壓縮、建模后，進(jìn)行的是與所存儲(chǔ)的聲紋模型進(jìn)行比對(duì)的步驟。在聲紋注冊(cè)階段，根據(jù)模型統(tǒng)計(jì)量注冊(cè)聲紋模型；在認(rèn)證階段，模型統(tǒng)計(jì)量和存儲(chǔ)的聲紋模型進(jìn)行比對(duì)。與實(shí)施例一相同的部分本實(shí)施例不再贅述。
[0118]實(shí)施例三
[0119]下面結(jié)合上述實(shí)施例，并具體以Android系統(tǒng)的手機(jī)為例，對(duì)聲紋注冊(cè)及認(rèn)證的過(guò)程進(jìn)行進(jìn)一步說(shuō)明。
[0120]Android手機(jī)中的鎖屏應(yīng)用一個(gè)普遍的問(wèn)題是鎖不住,通過(guò)按下home或者調(diào)出狀態(tài)欄下拉之類(lèi)的操作，可以跳過(guò)鎖屏界面，直接進(jìn)入系統(tǒng)。這樣應(yīng)用的鎖屏功能就是虛設(shè)了，達(dá)不到鎖屏的目的，用戶(hù)手機(jī)中的隱私也難以得到保護(hù)。本實(shí)施例允許用戶(hù)自己定義密碼，也可以由系統(tǒng)隨機(jī)產(chǎn)生一個(gè)數(shù)字密碼提供給用戶(hù)，用戶(hù)在使用的時(shí)候，不需要記住此密碼，只要按照正常語(yǔ)速讀出提示文字，系統(tǒng)根據(jù)用戶(hù)語(yǔ)音提取用戶(hù)聲紋特征，和用戶(hù)的注冊(cè)聲紋進(jìn)行對(duì)比匹配，作為認(rèn)證解鎖的依據(jù)。即便密碼內(nèi)容為其他用戶(hù)非法獲取，也可以通過(guò)聲紋認(rèn)證的方法對(duì)非法用戶(hù)進(jìn)行身份拒絕判定。用戶(hù)除了使用系統(tǒng)提供的隨機(jī)數(shù)字密碼以夕卜，還可以自己定義個(gè)人密碼，方便用戶(hù)使用，而且可以有效的提高系統(tǒng)的安全性。本實(shí)施例實(shí)現(xiàn)了一種在Android系統(tǒng)平臺(tái)上能夠完全鎖住用戶(hù)屏幕的方法。通過(guò)利用Android系統(tǒng)中一個(gè)能夠位于屏幕所有Π最前方的窗口的特性，加以改進(jìn)用來(lái)生成聲紋認(rèn)證的鎖屏界面，保證鎖屏界面能夠真正鎖住而不被跳過(guò)。
[0121]手機(jī)離線聲紋系統(tǒng)分為兩個(gè)部分，用戶(hù)聲紋注冊(cè)部分和聲紋認(rèn)證部分:[0122]用戶(hù)聲紋注冊(cè)部分分為聲紋注冊(cè)設(shè)置和用戶(hù)備用密碼設(shè)置，參見(jiàn)圖5所示，首先用戶(hù)開(kāi)始注冊(cè)，然后進(jìn)行聲紋注冊(cè)，設(shè)置備用密碼，最后完成注冊(cè)，其中進(jìn)行聲紋注冊(cè)又包括聲紋特征采集，然后分別判斷聲紋特征是否合格、是否達(dá)到規(guī)定的次數(shù)。聲紋注冊(cè)部分利用系統(tǒng)產(chǎn)生隨機(jī)數(shù)字串密碼，或者用戶(hù)采用自己的自定義密碼，用戶(hù)根據(jù)系統(tǒng)提示的文本內(nèi)容，讀出相應(yīng)的文本內(nèi)容，例如系統(tǒng)設(shè)置次數(shù)為5遍。用戶(hù)的錄音數(shù)據(jù)經(jīng)過(guò)系統(tǒng)降噪模塊，聲紋特征提取模塊，然后再訓(xùn)練用戶(hù)聲紋模型，聲紋模型的數(shù)據(jù)存儲(chǔ)在用戶(hù)手機(jī)中以備認(rèn)證時(shí)使用，參見(jiàn)圖6所示:首先用戶(hù)提供語(yǔ)音，然后輸入隨機(jī)密碼，開(kāi)啟應(yīng)用程序，語(yǔ)音經(jīng)語(yǔ)音降噪模塊后進(jìn)入聲紋提取模塊，然后判斷錄制次數(shù)是否滿(mǎn)足，最后注冊(cè)模型，保存用戶(hù)數(shù)據(jù)。模型訓(xùn)練模塊估計(jì)用戶(hù)的聲紋特征數(shù)據(jù)的分布，將用戶(hù)的分布參數(shù)作為用戶(hù)特征壓縮存儲(chǔ)在手機(jī)數(shù)據(jù)庫(kù)中。
[0123]為了適應(yīng)在不適合用戶(hù)錄音的環(huán)境中使用，增加了系統(tǒng)備份密碼的設(shè)置。
[0124]聲紋認(rèn)證時(shí)，用戶(hù)同樣讀出系統(tǒng)的提示文本或者自定義文本，語(yǔ)音同樣經(jīng)過(guò)降噪處理后，提取聲紋特征后和系統(tǒng)中保存的用戶(hù)模型進(jìn)行匹配認(rèn)證。。認(rèn)證階段的流程與注冊(cè)階段基本相同，參見(jiàn)圖7所示。
[0125]聲紋提取模塊對(duì)降噪后的語(yǔ)音進(jìn)行靜音檢測(cè)，去除對(duì)聲紋模型訓(xùn)練無(wú)用的數(shù)據(jù)，同時(shí)，也可以提高模型訓(xùn)練的速度。如果檢測(cè)靜音太多，或者語(yǔ)音數(shù)據(jù)不足，系統(tǒng)提示用戶(hù)錄音過(guò)短，重新進(jìn)行錄音，當(dāng)達(dá)到5次有效錄音時(shí)，提取用戶(hù)的聲紋特征。
[0126]降噪模塊流程圖可參見(jiàn)圖8所示，用戶(hù)錄音數(shù)據(jù)進(jìn)行分幀處理，然后進(jìn)行降噪處理，經(jīng)語(yǔ)音恢復(fù)后得到增強(qiáng)后的語(yǔ)音，而分幀處理的結(jié)果也可以經(jīng)頻譜分析，聽(tīng)覺(jué)感知建模，自適應(yīng)參數(shù)估計(jì)，再進(jìn)入降噪處理。
[0127]系統(tǒng)實(shí)現(xiàn):
[0128]手機(jī)聲紋注冊(cè)界面如圖9所示。在界面上顯示有注冊(cè)的文本內(nèi)容，實(shí)時(shí)錄音大小提示，以及當(dāng)前的錄音次數(shù)，用戶(hù)注冊(cè)使用聲紋總共需要5次錄音內(nèi)容。每次錄音，用戶(hù)需要保持錄音按鈕按下?tīng)顟B(tài)，松開(kāi)后，系統(tǒng)處理本次錄音數(shù)據(jù)，并給出此次錄音是否合格的提示。當(dāng)5次錄音全部合格,提取聲紋特征并訓(xùn)練聲紋模型。
[0129]聲紋模型存儲(chǔ)在手機(jī)的數(shù)據(jù)庫(kù)中，由于聲紋模型數(shù)據(jù)的安全對(duì)系統(tǒng)的正常使用很重要，所以，在手機(jī)數(shù)據(jù)庫(kù)中的聲紋數(shù)據(jù)是壓縮存儲(chǔ)，脫離出系統(tǒng)使用是沒(méi)有意義的。保證了用戶(hù)聲紋數(shù)據(jù)的絕對(duì)安全。
[0130]聲紋認(rèn)證時(shí)的系統(tǒng)框架流程圖如圖7所示，語(yǔ)音降噪模塊和聲紋特征提取模塊與注冊(cè)時(shí)一樣，系統(tǒng)調(diào)用手機(jī)已經(jīng)注冊(cè)的用戶(hù)聲紋模型，分析對(duì)比認(rèn)識(shí)時(shí)提供的聲紋特征，進(jìn)行一個(gè)確認(rèn)判決，接受或拒絕。
[0131]在基于Android的手機(jī)系統(tǒng)上，利用聲紋認(rèn)證實(shí)現(xiàn)手機(jī)鎖屏的解鎖，主要分為兩部分:
[0132]i)手機(jī)鎖屏實(shí)現(xiàn)
[0133]當(dāng)用戶(hù)開(kāi)啟手機(jī)或者系統(tǒng)從休眠狀態(tài)恢復(fù)時(shí)，需要運(yùn)行或者喚醒聲紋認(rèn)證界面。首先關(guān)閉系統(tǒng)原有的鎖屏功能，用聲紋認(rèn)證的界面替換系統(tǒng)的鎖屏界面。
[0134]①開(kāi)機(jī)狀態(tài)的鎖屏啟動(dòng)，Android系統(tǒng)在系統(tǒng)啟動(dòng)完畢后，會(huì)發(fā)送廣播消息，在程序中添加服務(wù)監(jiān)聽(tīng)此廣播消息，進(jìn)而啟動(dòng)定制的鎖屏界面。
[0135]②休眠狀態(tài)的鎖屏啟動(dòng)，為了方便用戶(hù)使用，用戶(hù)可以自定義休眠后的啟動(dòng)時(shí)間，在實(shí)現(xiàn)上，當(dāng)檢測(cè)到手機(jī)屏幕關(guān)閉，進(jìn)入休眠狀態(tài)時(shí)，創(chuàng)建系統(tǒng)警報(bào)服務(wù)，并同時(shí)創(chuàng)建一個(gè)接收服務(wù)，監(jiān)聽(tīng)當(dāng)用戶(hù)設(shè)定的時(shí)間到達(dá)時(shí)，啟動(dòng)聲紋鎖屏界面，當(dāng)手機(jī)從休眠狀態(tài)恢復(fù)時(shí)，直接可以利用聲紋進(jìn)行屏幕解鎖。
[0136]作為聲紋鎖屏應(yīng)用，利用聲紋控制包能夠保證用戶(hù)不能跳過(guò)鎖屏界面，而直接進(jìn)入系統(tǒng)。目前Android系統(tǒng)的鎖屏應(yīng)用中均有鎖不住的問(wèn)題。由于andorid系統(tǒng)從安全性出發(fā)，不允許同時(shí)屏蔽Home按鍵和狀態(tài)欄的下拉條，所以，當(dāng)應(yīng)用屏蔽其中的任意一個(gè)，都可以通過(guò)另外一個(gè)跳過(guò)鎖屏。
[0137]本實(shí)施例利用andorid系統(tǒng)中的系統(tǒng)警告的窗口能夠懸浮在所有界面UI最如面的特性，對(duì)此懸浮窗口結(jié)合聲紋認(rèn)證進(jìn)行調(diào)整，在此窗口中加入如圖9或10所示的聲紋認(rèn)證界面。保證了聲紋認(rèn)證界面能夠在最前方顯示，同時(shí)配合屏蔽home鍵。這樣，保證用戶(hù)不能通過(guò)home鍵和下拉條跳過(guò)聲紋認(rèn)證界面。
[0138]聲紋鎖屏同時(shí)還要具有系統(tǒng)鎖屏界面的一些常用功能，比如能夠直接接聽(tīng)來(lái)電，而不需要事先解鎖，我們通過(guò)在系統(tǒng)中添加對(duì)應(yīng)的服務(wù)，監(jiān)聽(tīng)用戶(hù)的來(lái)電狀態(tài)，當(dāng)有來(lái)電時(shí)，控制程序直接退出鎖屏界面，等待用戶(hù)接聽(tīng)完畢，再重新啟動(dòng)鎖屏界面。
[0139]ii)聲紋認(rèn)證與屏幕解鎖實(shí)現(xiàn)
[0140]如圖10所示的聲紋認(rèn)證界面中，界面上顯示錄音的文本信息,用戶(hù)點(diǎn)擊錄音后，顯示錄音計(jì)時(shí)和實(shí)時(shí)的錄音能量提示。當(dāng)用戶(hù)松開(kāi)錄音按鈕后，將錄音數(shù)據(jù)送入聲紋認(rèn)證模塊進(jìn)行處理，并返回認(rèn)證的結(jié)果。如果認(rèn)證通過(guò)，則關(guān)閉當(dāng)前認(rèn)證界面，用戶(hù)可以進(jìn)入系統(tǒng)。
[0141]實(shí)施例四
[0142]本實(shí)施例基于實(shí)施例一，提供了一種移動(dòng)設(shè)備聲紋注冊(cè)系統(tǒng)，參見(jiàn)圖11所示，所述系統(tǒng)包括:
[0143]聲紋特征數(shù)據(jù)獲取模塊1101，用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；
[0144]聲紋特征數(shù)據(jù)壓縮模塊1102，用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；
[0145]模型統(tǒng)計(jì)量獲取模塊1103，用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；
[0146]聲紋注冊(cè)模塊1104，用于根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成
聲紋注冊(cè)。
[0147]優(yōu)選的，所述聲紋特征數(shù)據(jù)壓縮模塊具體用于:
[0148]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；
[0149]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
[0150]優(yōu)選的，所述模型統(tǒng)計(jì)量獲取模塊具體用于:
[0151]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；
[0152]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。[0153]優(yōu)選的，所述系統(tǒng)還包括:
[0154]降噪模塊，用于對(duì)所述語(yǔ)音進(jìn)行降噪處理。
[0155]優(yōu)選的，所述降噪模塊具體用于:
[0156]對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
[0157]實(shí)施例五
[0158]本實(shí)施例基于實(shí)施例二，提供了一種移動(dòng)設(shè)備聲紋認(rèn)證系統(tǒng)，參見(jiàn)圖12所示。本實(shí)施例中的裝置仍包含實(shí)施例四所述的聲紋特征數(shù)據(jù)獲取模塊1101、聲紋特征數(shù)據(jù)壓縮模塊1102和模型統(tǒng)計(jì)量獲取模塊1103，所不同的是本實(shí)施例使用聲紋認(rèn)證模塊1105代替了實(shí)施例四中的聲紋注冊(cè)模塊1104，所述聲紋認(rèn)證模塊用于將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比，然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
[0159]與實(shí)施例四相同的部分本實(shí)施例不再贅述。
[0160]可以理解的是，本發(fā)明可用于眾多通用或?qū)Ｓ玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如:個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
[0161]本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述，例如程序模塊。一般地，程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類(lèi)型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明，在這些分布式計(jì)算環(huán)境中，由通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中，程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
`[0162]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成，所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中，這里所稱(chēng)得的存儲(chǔ)介質(zhì)，如:R0M、RAM、磁碟、光盤(pán)等。
[0163]還需要說(shuō)明的是，在本文中，諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái)，而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且，術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素，而且還包括沒(méi)有明確列出的其他要素，或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下，由語(yǔ)句“包括一個(gè)……”限定的要素，并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0164]以上所述僅為本發(fā)明的較佳實(shí)施例而已，并非用于限定本發(fā)明的保護(hù)范圍。本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了閘述，以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想；同時(shí)，對(duì)于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處。綜上所述，本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等，均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種移動(dòng)設(shè)備聲紋注冊(cè)方法，其特征在于，所述方法包括: 將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成聲紋注冊(cè)。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征，具體包括: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量，具體包括: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算，所述對(duì)數(shù)計(jì)算采用如下方式完成: 將待計(jì)算的數(shù)據(jù)拆分成兩部分，所述兩部分包括2的整冪數(shù)部分和余下的部分；將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果；所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算，擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前，還包括: 對(duì)所述語(yǔ)音進(jìn)行降噪處理。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述對(duì)所述語(yǔ)音進(jìn)行降噪處理，具體包括: 對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
7.一種移動(dòng)設(shè)備聲紋認(rèn)證方法，其特征在于，所述方法包括: 將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比，然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征，具體包括: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
9.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量，具體包括: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
10.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算，所述對(duì)數(shù)計(jì)算采用如下方式完成: 待計(jì)算的數(shù)據(jù)拆分成兩部分，所述兩部分包括2的整冪數(shù)部分和余下的部分；將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果；所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算，擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
11.根據(jù)權(quán)利要求7任一項(xiàng)所述的方法，其特征在于，所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前，還包括: 對(duì)所述語(yǔ)音進(jìn)行降噪處理。
12.根據(jù)權(quán)利要求11所述的方法，其特征在于，所述對(duì)所述語(yǔ)音進(jìn)行降噪處理，具體包括: 對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
13.—種移動(dòng)設(shè)備聲紋注冊(cè)系統(tǒng)，其特征在于，所述系統(tǒng)包括: 聲紋特征數(shù)據(jù)獲取模塊，用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；聲紋特征數(shù)據(jù)壓縮模塊，用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；模型統(tǒng)計(jì)量獲取模塊，用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；聲紋注冊(cè)模塊，用于根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ)，完成聲紋注冊(cè)。
14.根據(jù)權(quán)利要求13所述的系統(tǒng)，其特征在于，所述聲紋特征數(shù)據(jù)壓縮模塊具體用于: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮；所述模型統(tǒng)計(jì)量獲取模塊具體用于: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
15.根據(jù)權(quán)利要求13所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括: 降噪模塊，用于對(duì)所述語(yǔ)音進(jìn)行降噪處理；所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
16.一種移動(dòng)設(shè)備聲紋認(rèn)證系統(tǒng)，其特征在于，所述系統(tǒng)包括: 聲紋特征數(shù)據(jù)獲取模塊，用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波，以獲取聲紋特征數(shù)據(jù)；聲紋特征數(shù)據(jù)壓縮模塊，用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；模型統(tǒng)計(jì)量獲取模塊，用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量；聲紋認(rèn)證模塊，用于將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比，然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
17.根據(jù)權(quán)利要求16所述的系統(tǒng)，其特征在于，所述聲紋特征數(shù)據(jù)壓縮模塊具體用于: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布；將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引，通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù)，以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮；所述模型統(tǒng)計(jì)量獲取模塊具體用于: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分；根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
18.根據(jù)權(quán)利要求16所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括: 降噪模塊，用于對(duì)所述語(yǔ)音進(jìn)行降噪處理；所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理，為每一幀語(yǔ)音計(jì)算頻譜分析，根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù)，經(jīng)過(guò)頻域?yàn)V波后，得到降噪后的語(yǔ)音頻譜，再通過(guò)頻域逆變換，恢復(fù)出降噪后的語(yǔ)音。
【文檔編號(hào)】G10L17/02GK103685185SQ201210342473
【公開(kāi)日】2014年3月26日申請(qǐng)日期:2012年9月14日優(yōu)先權(quán)日:2012年9月14日
【發(fā)明者】劉青松, 許星東, 許敏強(qiáng) 申請(qǐng)人:上海掌門(mén)科技有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉青松;許星東;許敏強(qiáng);
技術(shù)所有人：上海掌門(mén)科技有限公司;
我是此專(zhuān)利的發(fā)明人

上一篇：基于特定人語(yǔ)音的實(shí)時(shí)在線支付技術(shù)及其應(yīng)用的制作方法
上一篇：語(yǔ)義辨識(shí)方法

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

移動(dòng)設(shè)備箱相關(guān)技術(shù)

聲紋認(rèn)證相關(guān)技術(shù)

手機(jī)靚號(hào)相關(guān)技術(shù)

聲紋識(shí)別系統(tǒng)相關(guān)技術(shù)

聲紋采集終端系統(tǒng)相關(guān)技術(shù)

聲紋識(shí)別系統(tǒng)報(bào)價(jià)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)的制作方法