移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng),所述聲紋注冊(cè)方法包括:將語(yǔ)音進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù);將聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;根據(jù)模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成聲紋注冊(cè)。在聲紋注冊(cè)階段,根據(jù)模型統(tǒng)計(jì)量注冊(cè)聲紋模型;在認(rèn)證階段,模型統(tǒng)計(jì)量和存儲(chǔ)的聲紋模型進(jìn)行比對(duì)。本發(fā)明降低了聲紋模型的計(jì)算量并減少了聲紋特征的存儲(chǔ)空間,解決了移動(dòng)設(shè)備對(duì)算法實(shí)時(shí)性的需求,不需要通過(guò)聯(lián)網(wǎng)進(jìn)行注冊(cè)和認(rèn)證,也不需要將用戶(hù)聲紋數(shù)據(jù)上傳到服務(wù)器,提升了用戶(hù)使用體驗(yàn)也保證了用戶(hù)隱私安全。
【專(zhuān)利說(shuō)明】移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)設(shè)備加密領(lǐng)域,尤其是涉及移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng)。
【背景技術(shù)】
[0002]對(duì)于各種移動(dòng)設(shè)備,如手機(jī)、平板電腦、電子書(shū)等,需要加密時(shí)一般是通過(guò)密碼的方式進(jìn)行加密,例如密碼鎖屏、收件箱加密、文件夾加密、通訊錄加密等等。倘若密碼泄漏或者被盜取時(shí),手機(jī)很容易被解鎖,達(dá)不到原有的保護(hù)用戶(hù)隱私的目標(biāo)。另外,用戶(hù)在使用密碼進(jìn)行解鎖時(shí),通常需要記住之前設(shè)定的密碼,也為用戶(hù)的使用帶來(lái)不便。
[0003]聲紋識(shí)別屬于生物識(shí)別技術(shù)的一種,是一項(xiàng)根據(jù)語(yǔ)音波形中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù),自動(dòng)識(shí)別說(shuō)話人身份的技術(shù)。與語(yǔ)音識(shí)別不同的是,聲紋識(shí)別利用的是語(yǔ)音信號(hào)中說(shuō)話人的語(yǔ)音特點(diǎn),而不考慮語(yǔ)音中的字詞意思,即它強(qiáng)調(diào)說(shuō)話人的個(gè)性信息;而語(yǔ)音識(shí)別的目的是識(shí)別出語(yǔ)音信號(hào)中的言語(yǔ)(文本)內(nèi)容,并不考慮說(shuō)話人是誰(shuí),它強(qiáng)調(diào)不同說(shuō)話人之間文本內(nèi)容共性信息。目前,基于聲紋的特征識(shí)別技術(shù)已經(jīng)有所發(fā)展。基于聲紋特征識(shí)別技術(shù)的認(rèn)證相對(duì)普通的密碼認(rèn)證解鎖有很大的優(yōu)勢(shì),它不需要記憶密碼,直接利用用戶(hù)的語(yǔ)音特征作為身份認(rèn)證的方式,而且也不會(huì)發(fā)生密碼泄漏或者被盜取的問(wèn)題。
[0004]一般的聲紋處理系統(tǒng),如基于聲紋的身份認(rèn)證系統(tǒng),通常采用聯(lián)網(wǎng)的方式進(jìn)行聲紋驗(yàn)證,即,將采集的聲紋發(fā)送給服務(wù)器,然后由服務(wù)器返回認(rèn)證結(jié)果。發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn):這種方式的缺點(diǎn)是每次都需要連接網(wǎng)絡(luò),不適用于沒(méi)有網(wǎng)絡(luò)連接或用戶(hù)不想聯(lián)網(wǎng)的場(chǎng)景,而且也無(wú)法保護(hù)用戶(hù)的隱私,但是,如果在手機(jī)、電子書(shū)、平板電腦等移動(dòng)設(shè)備實(shí)現(xiàn)離線聲紋認(rèn)證,則會(huì)因?yàn)樗惴◤?fù)雜度高、計(jì)算量較大、計(jì)算時(shí)間較長(zhǎng)而帶來(lái)實(shí)時(shí)性難以保證的問(wèn)題,導(dǎo)致用戶(hù)體驗(yàn)度的降低,實(shí)用性較差。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明實(shí)施例的目的是提供移動(dòng)設(shè)備聲紋注冊(cè)、認(rèn)證的方法及系統(tǒng),以使移動(dòng)設(shè)備可以離線進(jìn)行聲紋注冊(cè)、認(rèn)證。
[0006]一方面,本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋注冊(cè)方法,所述方法包括:
[0007]將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù);
[0008]將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0009]根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成聲紋注冊(cè)。
[0010]優(yōu)選的,所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征,具體包括:
[0011]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布;
[0012]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
[0013]優(yōu)選的,所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量,具體包括:
[0014]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分;
[0015]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0016]優(yōu)選的,所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算,所述對(duì)數(shù)計(jì)算采用如下方式完成:
[0017]將待計(jì)算的數(shù)據(jù)拆分成兩部分,所述兩部分包括2的整冪數(shù)部分和余下的部分;將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果;所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算,擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
[0018]優(yōu)選的,所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前,還包括:
[0019]對(duì)所述語(yǔ)音進(jìn)行降噪處理。
[0020]優(yōu)選的,所述對(duì)所述語(yǔ)音進(jìn)行降噪處理,具體包括:
[0021]對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
[0022]另一方面,本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋認(rèn)證方法,其特征在于,所述方法包括:
[0023]將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù);
[0024]將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);
[0025]根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0026]將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比,然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
[0027]優(yōu)選的,所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征,具體包括:
[0028]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布;
[0029]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
[0030]優(yōu)選的,所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量,具體包括:
[0031]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分;
[0032]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0033]優(yōu)選的,所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算,所述對(duì)數(shù)計(jì)算采用如下方式完成:
[0034]待計(jì)算的數(shù)據(jù)拆分成兩部分,所述兩部分包括2的整冪數(shù)部分和余下的部分;將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果;所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算,擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
[0035]優(yōu)選的,所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前,還包括:
[0036]對(duì)所述語(yǔ)音進(jìn)行降噪處理。
[0037]優(yōu)選的,所述對(duì)所述語(yǔ)音進(jìn)行降噪處理,具體包括:
[0038]對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
[0039]再一方面,本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋注冊(cè)系統(tǒng),所述系統(tǒng)包括:
[0040]聲紋特征數(shù)據(jù)獲取模塊,用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù);
[0041]聲紋特征數(shù)據(jù)壓縮模塊,用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);
[0042]模型統(tǒng)計(jì)量獲取模塊,用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0043]聲紋注冊(cè)模塊,用于根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成聲紋注冊(cè)。
[0044]優(yōu)選的,所述聲紋特征數(shù)據(jù)壓縮模塊具體用于:
[0045]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布;
[0046]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮;
[0047]所述模型統(tǒng)計(jì)量獲取模塊具體用于:
[0048]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分;
[0049]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0050]優(yōu)選的,所述系統(tǒng)還包括:
[0051]降噪模塊,用于對(duì)所述語(yǔ)音進(jìn)行降噪處理;
[0052]所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
[0053]再一方面,本發(fā)明實(shí)施例公開(kāi)了一種移動(dòng)設(shè)備聲紋認(rèn)證系統(tǒng),所述系統(tǒng)包括:
[0054]聲紋特征數(shù)據(jù)獲取模塊,用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù);
[0055]聲紋特征數(shù)據(jù)壓縮模塊,用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);
[0056]模型統(tǒng)計(jì)量獲取模塊,用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0057]聲紋認(rèn)證模塊,用于將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比,然后根據(jù)所得匹配度進(jìn)行認(rèn)證。[0058]優(yōu)選的,所述聲紋特征數(shù)據(jù)壓縮模塊具體用于:
[0059]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布;
[0060]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮;
[0061]所述模型統(tǒng)計(jì)量獲取模塊具體用于:
[0062]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分;
[0063]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0064]優(yōu)選的,所述系統(tǒng)還包括:
[0065]降噪模塊,用于對(duì)所述語(yǔ)音進(jìn)行降噪處理;
[0066]所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音
[0067]本發(fā)明實(shí)施例在初步提取聲紋特征之后,對(duì)原始的聲紋特征做了進(jìn)一步處理,以降低后續(xù)聲紋模型注冊(cè)、認(rèn)證的計(jì)算量以及減少聲紋特征的存儲(chǔ)空間。具體來(lái)講,本發(fā)明實(shí)施例對(duì)原始的聲紋特征數(shù)據(jù)進(jìn)行了壓縮映射,將原始的聲紋特征映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,通過(guò)直接查詢(xún)存儲(chǔ)的數(shù)據(jù)表代替實(shí)際計(jì)算,從而加快了模型訓(xùn)練和聲紋認(rèn)證的速度,減少了計(jì)算時(shí)間,保證移動(dòng)設(shè)備上的用戶(hù)體驗(yàn)和正常使用;而且由于壓縮映射已經(jīng)建立了和數(shù)據(jù)存儲(chǔ)表直接的映射關(guān)系,所以對(duì)聲紋特征只需存儲(chǔ)其對(duì)應(yīng)的在數(shù)據(jù)存儲(chǔ)表中的索弓I,而只存儲(chǔ)索引的聲紋特征所占據(jù)的空間比直接存儲(chǔ)原始聲紋特征要小,適合手機(jī)這類(lèi)資源受限的移動(dòng)設(shè)備平臺(tái)。因此,最終解決了移動(dòng)設(shè)備離線實(shí)現(xiàn)聲紋注冊(cè)、認(rèn)證等聲紋處理時(shí)對(duì)算法實(shí)時(shí)性的需求,不需要通過(guò)聯(lián)網(wǎng)服務(wù)器進(jìn)行注冊(cè)和認(rèn)證,也不需要將用戶(hù)聲紋數(shù)據(jù)上傳到服務(wù)器,增加了用戶(hù)在使用時(shí)的良好體驗(yàn),也保證了用戶(hù)的隱私安全。
[0068]另外,本發(fā)明實(shí)施例還構(gòu)建了模型成分選擇器,用來(lái)為每一幀聲紋特征選擇對(duì)應(yīng)的模型成分,然后利用選擇出來(lái)的模型成分為每幀聲紋特征計(jì)算模型統(tǒng)計(jì)量,這樣可以從算法上節(jié)約大量的計(jì)算量,進(jìn)而加速聲紋模型注冊(cè)的計(jì)算速度,保證了聲紋認(rèn)證結(jié)果的及時(shí)響應(yīng)。
[0069]此外,針對(duì)移動(dòng)設(shè)備由于受硬件的限制,和PC機(jī)以及服務(wù)器相比計(jì)算能力差距較大,尤其浮點(diǎn)計(jì)算能力降低比較明顯的問(wèn)題,本發(fā)明實(shí)施例還在聲紋提取過(guò)程中,對(duì)對(duì)數(shù)運(yùn)算做了相應(yīng)的優(yōu)化處理,從而也降低了計(jì)算量。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0070]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0071]圖1是本發(fā)明實(shí)施例一方法的流程圖;
[0072]圖2是兩層樹(shù)形結(jié)構(gòu)模型成分選擇器示意圖;[0073]圖3是多級(jí)分段線性擬合示意圖;
[0074]圖4是本發(fā)明實(shí)施例二方法的流程圖;
[0075]圖5是本發(fā)明實(shí)施例三用戶(hù)注冊(cè)總框架示意圖;
[0076]圖6是本發(fā)明實(shí)施例三注冊(cè)階段聲紋識(shí)別框圖;
[0077]圖7是本發(fā)明實(shí)施例三認(rèn)證階段聲紋識(shí)別框圖;
[0078]圖8是本發(fā)明實(shí)施例三降噪模塊流程示意圖;
[0079]圖9是本發(fā)明實(shí)施例三聲紋注冊(cè)界面示意圖;
[0080]圖10是本發(fā)明實(shí)施例三聲紋認(rèn)證界面示意圖;
[0081]圖11是本發(fā)明實(shí)施例四系統(tǒng)的示意圖;
[0082]圖12是本發(fā)明實(shí)施例五系統(tǒng)的示意圖。
【具體實(shí)施方式】
[0083]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0084]實(shí)施例一
[0085]參見(jiàn)圖1,為本發(fā)明實(shí)施例一方法的流程圖。本實(shí)施例提供了一種移動(dòng)設(shè)備聲紋注冊(cè)方法,所述方法包括:
[0086]SlOl:將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù)。欲在手機(jī)等移動(dòng)設(shè)備上實(shí)現(xiàn)聲紋加密的應(yīng)用,首先也是最重要的就是進(jìn)行聲紋的注冊(cè)。而聲紋注冊(cè)的需要先獲取聲紋特征數(shù)據(jù),其基本過(guò)程如下:首先對(duì)用戶(hù)的錄音數(shù)據(jù)分幀處理,每一巾貞語(yǔ)音計(jì)算頻譜分析,在估計(jì)噪聲對(duì)語(yǔ)音頻譜的影響時(shí)候,引入聽(tīng)覺(jué)感知機(jī)制,估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小,由此來(lái)構(gòu)建對(duì)應(yīng)的濾波器參數(shù),最后初步得到聲紋特征數(shù)據(jù),即原始的聲紋特征。由于本步驟可以直接使用現(xiàn)有技術(shù),故本實(shí)施例不再詳細(xì)贅述。
[0087]S102:將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù)。為了減少聲紋特征在后續(xù)建模和對(duì)比認(rèn)證中的計(jì)算量,本實(shí)施例對(duì)上一步獲取到的原始聲紋特征進(jìn)行了規(guī)整和壓縮映射。聲紋特征壓縮映射是指將原始的聲紋特征映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,數(shù)據(jù)表中的特征數(shù)據(jù)是根據(jù)統(tǒng)計(jì)分布情況選取的固定數(shù)值,故對(duì)后續(xù)的一些計(jì)算量可以通過(guò)事先計(jì)算出,存儲(chǔ)在數(shù)據(jù)表中,在使用中,通過(guò)直接查詢(xún)存儲(chǔ)的數(shù)據(jù)表代替實(shí)際計(jì)算,加快模型訓(xùn)練和聲紋認(rèn)證的速度。
[0088]優(yōu)選的,S102具體可以包括以下步驟:
[0089]S1021:使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布。本步驟簡(jiǎn)言之即特征分布估計(jì)。量化的聲紋特征數(shù)據(jù)表是一個(gè)正態(tài)分布表,通過(guò)估計(jì)注冊(cè)時(shí)的聲紋或者認(rèn)證時(shí)的聲紋的特征數(shù)據(jù)的統(tǒng)計(jì)分布,建立和數(shù)據(jù)存儲(chǔ)表之間的映射關(guān)系。為了簡(jiǎn)化特征分布估計(jì)的復(fù)雜度,用特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布,隨著直方圖的段數(shù)的增加,可以逐漸逼近聲紋特征的真實(shí)分布。通過(guò)選擇合適的段數(shù),可以在特征估計(jì)的計(jì)算量和精確度之間做一個(gè)折中。[0090]S1022:將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。本步驟簡(jiǎn)言之即特征壓縮映射。根據(jù)聲紋特征在分布中的位置作為與數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)索引將原始的聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),利用映射后的索引查詢(xún)對(duì)應(yīng)的數(shù)據(jù)表數(shù)值。
[0091]特征壓縮映射可以帶來(lái)兩個(gè)好處:第一,通過(guò)特征壓縮映射,可以量化原始的聲紋特征數(shù)據(jù),壓縮數(shù)據(jù)的聲紋特征的范圍,降低后續(xù)模型訓(xùn)練和聲紋認(rèn)證的計(jì)算量。第二,由于壓縮映射已經(jīng)建立了和數(shù)據(jù)存儲(chǔ)表直接的映射關(guān)系,所以對(duì)聲紋特征只需存儲(chǔ)其對(duì)應(yīng)的在數(shù)據(jù)存儲(chǔ)表中的索引,而只存儲(chǔ)索引的聲紋特征所占據(jù)的空間比直接存儲(chǔ)原始聲紋特征要小,適合手機(jī)這種資源受限的平臺(tái)情況。
[0092]S103:根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量。本實(shí)施例對(duì)聲紋進(jìn)行處理時(shí)所期望的成果即獲取到模型統(tǒng)計(jì)量,這也是聲紋處理要完成的最核心內(nèi)容。本步驟可以直接使用現(xiàn)有技術(shù)。但是,為了進(jìn)一步的提高處理速度,降低計(jì)算量,本發(fā)明實(shí)施例對(duì)S103進(jìn)行了優(yōu)化,所以?xún)?yōu)選的,S103具體可以包括:
[0093]S1031:對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分。
[0094]S1032:根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
[0095]發(fā)明人通過(guò)分析現(xiàn)有的聲紋注冊(cè)和認(rèn)證算法發(fā)現(xiàn),實(shí)現(xiàn)過(guò)程的耗時(shí)主要在根據(jù)聲紋特征計(jì)算對(duì)應(yīng)的模型統(tǒng)計(jì)量中,而模型統(tǒng)計(jì)量計(jì)算的次數(shù)又和模型成分的數(shù)目N密切相關(guān)。在現(xiàn)有的聲紋系統(tǒng)中,由于在服務(wù)器端運(yùn)行,資源充分,所以在計(jì)算模型統(tǒng)計(jì)量時(shí),所有的模型成分都參與計(jì)算。
[0096]而本實(shí)施例為了降低模型統(tǒng)計(jì)量計(jì)算的次數(shù),通過(guò)對(duì)比模型統(tǒng)計(jì)量的數(shù)值與模型成分以及聲紋特征之間的關(guān)聯(lián),發(fā)現(xiàn)在計(jì)算模型統(tǒng)計(jì)量時(shí),可以對(duì)不同的聲紋特征選擇相應(yīng)的部分模型成分參與統(tǒng)計(jì)量計(jì)算,不必采用全部的模型成分,這樣既能保證模型訓(xùn)練與聲紋認(rèn)證的精度,又能提高估計(jì)模型統(tǒng)計(jì)量的速度。實(shí)驗(yàn)結(jié)果表明,對(duì)于特定的每一幀聲紋特征而言,這些模型成分對(duì)計(jì)算模型統(tǒng)計(jì)量的貢獻(xiàn)度是不一樣的,因此可以為每一幀聲紋特征選擇相應(yīng)的貢獻(xiàn)較大的的模型成分計(jì)算相應(yīng)的模型統(tǒng)計(jì)量,而無(wú)須用全部的模型統(tǒng)計(jì)量參與計(jì)算模型統(tǒng)計(jì)量。
[0097]為了實(shí)現(xiàn)能夠?qū)Σ煌穆暭y特征選擇對(duì)應(yīng)的模型成分,本實(shí)施例設(shè)計(jì)了一種兩層樹(shù)形結(jié)構(gòu)的模型成分選擇器,參見(jiàn)圖2所示,通過(guò)模型成分選擇器,選擇對(duì)應(yīng)的K個(gè)模型成分參與模型統(tǒng)計(jì)量計(jì)算。而K要遠(yuǎn)小于模型成分?jǐn)?shù)據(jù)N,所以能夠?qū)崿F(xiàn)降低模型訓(xùn)練和聲紋認(rèn)證復(fù)雜度的目的。
[0098]模型成分選擇步驟如下:
[0099]a、模型成分選擇:對(duì)于注冊(cè)和認(rèn)證的聲紋特征,首先和模型成分選擇器的第一層的G廣Gk共K個(gè)成分計(jì)算統(tǒng)計(jì)量,選擇對(duì)應(yīng)的統(tǒng)計(jì)量最大的選擇器成分。將此選擇器第一層中最大的成分對(duì)應(yīng)的第二層模型成分用來(lái)計(jì)算真正的模型統(tǒng)計(jì)量。模型選擇器的作用就是找出N個(gè)模型成分中對(duì)統(tǒng)計(jì)量的計(jì)算起到關(guān)鍵作用的對(duì)應(yīng)的成分,保證后續(xù)計(jì)算統(tǒng)計(jì)量的精確度。
[0100]b、選擇后統(tǒng)計(jì)量計(jì)算:聲紋特征只和模型選擇器中第二層的模型成分計(jì)算統(tǒng)計(jì)量,而對(duì)沒(méi)有選擇的模型成分對(duì)應(yīng)的統(tǒng)計(jì)量不參與后續(xù)的模型注冊(cè)和聲紋認(rèn)證的計(jì)算,從而降低計(jì)算復(fù)雜度。
[0101]對(duì)于不同幀的聲紋特征而言,其所對(duì)應(yīng)的貢獻(xiàn)較大的模型成分是不同的,所以本實(shí)施例構(gòu)建了模型成分選擇器,用來(lái)為每一幀聲紋特征選擇對(duì)應(yīng)的模型成分,然后,利用選擇出來(lái)的模型成分為每幀聲紋特征計(jì)算模型統(tǒng)計(jì)量,這樣,可以從算法上節(jié)約大量的計(jì)算量。進(jìn)而,加速聲紋模型注冊(cè)的計(jì)算速度,以及保證聲紋認(rèn)證結(jié)果的及時(shí)響應(yīng)。
[0102]本實(shí)施例針對(duì)手機(jī)運(yùn)算能力的限制,提出了一種選擇貢獻(xiàn)較大模型成分并計(jì)算模型統(tǒng)計(jì)量的方法。比如,模型有512個(gè)模型成分,針對(duì)其中一幀聲紋特征,對(duì)模型統(tǒng)計(jì)量有決定性貢獻(xiàn)的模型成分僅僅只有10個(gè),剩下的502個(gè)模型成分對(duì)該幀聲紋特征幾乎沒(méi)有貢獻(xiàn)。那么在計(jì)算模型統(tǒng)計(jì)量的時(shí)候,只需要計(jì)算該幀聲紋特征在此10個(gè)模型成分上產(chǎn)生的模型統(tǒng)計(jì)量,而忽略剩余的502個(gè)模型成分,從而可以成倍的提高計(jì)算模型統(tǒng)計(jì)量的速度,以此提高注冊(cè)和認(rèn)證的速度。
[0103]S104:根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成聲紋注冊(cè)。即將發(fā)出該段語(yǔ)音的人的聲紋相關(guān)特征以模型的方式存儲(chǔ)在移動(dòng)設(shè)備上,以待后續(xù)使用。從模型統(tǒng)計(jì)量到聲紋模型的過(guò)程,是屬于現(xiàn)有技術(shù),在教材或者網(wǎng)絡(luò)資料上都能找到,比如HMM、GMM模型等,本實(shí)施例不再贅述。
[0104]此外,優(yōu)選的,在SlOl之前,還可以包括:
[0105]SlOO:對(duì)所述語(yǔ)音進(jìn)行降噪處理。在比較嘈雜的環(huán)境中,用戶(hù)注冊(cè)和認(rèn)證的語(yǔ)音受到環(huán)境的干擾,導(dǎo)致聲紋認(rèn)證的性能也受到影響。針對(duì)環(huán)境噪聲,在聲紋特征注冊(cè)及認(rèn)證的過(guò)程中可以加入降噪模塊,程序在獲得用戶(hù)的錄制語(yǔ)音之后,首先經(jīng)過(guò)降噪模塊的處理,然后再進(jìn)行后續(xù)的靜音檢測(cè)判決,以及聲紋特征提取等。處理后的聲紋特征可以更加有效提高聲紋認(rèn)證系統(tǒng)的魯棒性。
[0106]所述對(duì)所述語(yǔ)音進(jìn)行降噪處理,具體可以包括:
[0107]對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。首先對(duì)用戶(hù)的錄音數(shù)據(jù)分幀處理,每一幀語(yǔ)音計(jì)算頻譜分析,在估計(jì)噪聲對(duì)語(yǔ)音頻譜的影響時(shí)候,引入聽(tīng)覺(jué)感知機(jī)制,估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小,由此來(lái)構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,然后通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
[0108]另外,由于手機(jī)硬件的限制,和PC機(jī)以及服務(wù)器相比,計(jì)算能力差距較大,尤其浮點(diǎn)計(jì)算能力降低比較明顯,而在聲紋提取過(guò)程中主要就是浮點(diǎn)的計(jì)算。除了采用常規(guī)的算法定點(diǎn)化的移植外,針對(duì)在聲紋特征提取中對(duì)數(shù)運(yùn)算的計(jì)算部分耗時(shí)較多,本實(shí)施例對(duì)對(duì)數(shù)運(yùn)算做了相應(yīng)的優(yōu)化處理。在上文一個(gè)或多個(gè)步驟中都會(huì)遇到對(duì)數(shù)計(jì)算,例如,參數(shù)變換壓縮處理的過(guò)程中,降噪的頻譜分析和降噪處理中等等。通過(guò)對(duì)數(shù)優(yōu)化,可以降低語(yǔ)音降噪模塊的計(jì)算量。
[0109]具體的,所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算,所述對(duì)數(shù)計(jì)算采用如下方式完成:
[0110]將待計(jì)算的數(shù)據(jù)拆分成兩部分,所述兩部分包括2的整冪數(shù)部分和余下的部分;將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果;所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算,擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
[0111]換句話說(shuō),對(duì)數(shù)計(jì)算優(yōu)化處理過(guò)程可以分為如下兩步:
[0112]I)拆分步驟:由于硬件實(shí)現(xiàn)二進(jìn)制的移位運(yùn)算比較快速和方便,為了能采用硬件的這一優(yōu)點(diǎn),首先將數(shù)據(jù)X拆成兩部分,即2的整冪數(shù)A和余下的部分B=X-A兩部分,由于數(shù)值在硬件存儲(chǔ)是按照二進(jìn)制存儲(chǔ),所以A部分計(jì)算的結(jié)果就是在硬件中存儲(chǔ)的位數(shù)。B部分的計(jì)算采用近似計(jì)算以提高速度。
[0113]2)近似計(jì)算步驟:選用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算,B/A部分的輸入限制在(0,I)之間。其原始結(jié)果可參見(jiàn)圖3中實(shí)線所示,擬合的結(jié)果可參見(jiàn)圖3中虛線所示。擬合的誤差可以通過(guò)分段的級(jí)數(shù)自動(dòng)控制。線性計(jì)算的耗時(shí)比直接的對(duì)數(shù)計(jì)算相比降低很多。
[0114]實(shí)施例二
[0115]參見(jiàn)圖4,為本發(fā)明實(shí)施例二方法的流程圖。本實(shí)施例提供了一種移動(dòng)設(shè)備聲紋認(rèn)證方法。本實(shí)施例與實(shí)施例一相呼應(yīng),本實(shí)施例的前三步與實(shí)施例一中的SlOf S103相同,不同點(diǎn)在于:實(shí)施例一中,S103獲取到聲紋的模型統(tǒng)計(jì)量之后,所接下來(lái)的步驟是S104,即進(jìn)行聲紋的注冊(cè);而在本實(shí)施例中,在獲取到聲紋的模型統(tǒng)計(jì)量,接下來(lái)的步驟為:
[0116]S105:將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比,然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
[0117]即輸入一段語(yǔ)音,通過(guò)以上方法提取聲紋相關(guān)特征后與已注冊(cè)的聲紋特征進(jìn)行比較、匹配,從而判斷是否是同一人的聲紋,實(shí)現(xiàn)聲紋認(rèn)證。聲紋認(rèn)證的過(guò)程與上述聲紋注冊(cè)的過(guò)程大致相同,都是針對(duì)一段語(yǔ)音進(jìn)行特征提取、壓縮等、建模處理,所不同的是,在聲紋注冊(cè)階段,在聲紋特征提取、壓縮、建模后,接下來(lái)是存儲(chǔ),即將聲紋模型存儲(chǔ)在移動(dòng)設(shè)備上待用,從而完成了聲紋注冊(cè)。而在聲紋認(rèn)證階段,在聲紋特征提取、壓縮、建模后,進(jìn)行的是與所存儲(chǔ)的聲紋模型進(jìn)行比對(duì)的步驟。在聲紋注冊(cè)階段,根據(jù)模型統(tǒng)計(jì)量注冊(cè)聲紋模型;在認(rèn)證階段,模型統(tǒng)計(jì)量和存儲(chǔ)的聲紋模型進(jìn)行比對(duì)。與實(shí)施例一相同的部分本實(shí)施例不再贅述。
[0118]實(shí)施例三
[0119]下面結(jié)合上述實(shí)施例,并具體以Android系統(tǒng)的手機(jī)為例,對(duì)聲紋注冊(cè)及認(rèn)證的過(guò)程進(jìn)行進(jìn)一步說(shuō)明。
[0120]Android手機(jī)中的鎖屏應(yīng)用一個(gè)普遍的問(wèn)題是鎖不住,通過(guò)按下home或者調(diào)出狀態(tài)欄下拉之類(lèi)的操作,可以跳過(guò)鎖屏界面,直接進(jìn)入系統(tǒng)。這樣應(yīng)用的鎖屏功能就是虛設(shè)了,達(dá)不到鎖屏的目的,用戶(hù)手機(jī)中的隱私也難以得到保護(hù)。本實(shí)施例允許用戶(hù)自己定義密碼,也可以由系統(tǒng)隨機(jī)產(chǎn)生一個(gè)數(shù)字密碼提供給用戶(hù),用戶(hù)在使用的時(shí)候,不需要記住此密碼,只要按照正常語(yǔ)速讀出提示文字,系統(tǒng)根據(jù)用戶(hù)語(yǔ)音提取用戶(hù)聲紋特征,和用戶(hù)的注冊(cè)聲紋進(jìn)行對(duì)比匹配,作為認(rèn)證解鎖的依據(jù)。即便密碼內(nèi)容為其他用戶(hù)非法獲取,也可以通過(guò)聲紋認(rèn)證的方法對(duì)非法用戶(hù)進(jìn)行身份拒絕判定。用戶(hù)除了使用系統(tǒng)提供的隨機(jī)數(shù)字密碼以夕卜,還可以自己定義個(gè)人密碼,方便用戶(hù)使用,而且可以有效的提高系統(tǒng)的安全性。本實(shí)施例實(shí)現(xiàn)了一種在Android系統(tǒng)平臺(tái)上能夠完全鎖住用戶(hù)屏幕的方法。通過(guò)利用Android系統(tǒng)中一個(gè)能夠位于屏幕所有Π最前方的窗口的特性,加以改進(jìn)用來(lái)生成聲紋認(rèn)證的鎖屏界面,保證鎖屏界面能夠真正鎖住而不被跳過(guò)。
[0121]手機(jī)離線聲紋系統(tǒng)分為兩個(gè)部分,用戶(hù)聲紋注冊(cè)部分和聲紋認(rèn)證部分:[0122]用戶(hù)聲紋注冊(cè)部分分為聲紋注冊(cè)設(shè)置和用戶(hù)備用密碼設(shè)置,參見(jiàn)圖5所示,首先用戶(hù)開(kāi)始注冊(cè),然后進(jìn)行聲紋注冊(cè),設(shè)置備用密碼,最后完成注冊(cè),其中進(jìn)行聲紋注冊(cè)又包括聲紋特征采集,然后分別判斷聲紋特征是否合格、是否達(dá)到規(guī)定的次數(shù)。聲紋注冊(cè)部分利用系統(tǒng)產(chǎn)生隨機(jī)數(shù)字串密碼,或者用戶(hù)采用自己的自定義密碼,用戶(hù)根據(jù)系統(tǒng)提示的文本內(nèi)容,讀出相應(yīng)的文本內(nèi)容,例如系統(tǒng)設(shè)置次數(shù)為5遍。用戶(hù)的錄音數(shù)據(jù)經(jīng)過(guò)系統(tǒng)降噪模塊,聲紋特征提取模塊,然后再訓(xùn)練用戶(hù)聲紋模型,聲紋模型的數(shù)據(jù)存儲(chǔ)在用戶(hù)手機(jī)中以備認(rèn)證時(shí)使用,參見(jiàn)圖6所示:首先用戶(hù)提供語(yǔ)音,然后輸入隨機(jī)密碼,開(kāi)啟應(yīng)用程序,語(yǔ)音經(jīng)語(yǔ)音降噪模塊后進(jìn)入聲紋提取模塊,然后判斷錄制次數(shù)是否滿(mǎn)足,最后注冊(cè)模型,保存用戶(hù)數(shù)據(jù)。模型訓(xùn)練模塊估計(jì)用戶(hù)的聲紋特征數(shù)據(jù)的分布,將用戶(hù)的分布參數(shù)作為用戶(hù)特征壓縮存儲(chǔ)在手機(jī)數(shù)據(jù)庫(kù)中。
[0123]為了適應(yīng)在不適合用戶(hù)錄音的環(huán)境中使用,增加了系統(tǒng)備份密碼的設(shè)置。
[0124]聲紋認(rèn)證時(shí),用戶(hù)同樣讀出系統(tǒng)的提示文本或者自定義文本,語(yǔ)音同樣經(jīng)過(guò)降噪處理后,提取聲紋特征后和系統(tǒng)中保存的用戶(hù)模型進(jìn)行匹配認(rèn)證。。認(rèn)證階段的流程與注冊(cè)階段基本相同,參見(jiàn)圖7所示。
[0125]聲紋提取模塊對(duì)降噪后的語(yǔ)音進(jìn)行靜音檢測(cè),去除對(duì)聲紋模型訓(xùn)練無(wú)用的數(shù)據(jù),同時(shí),也可以提高模型訓(xùn)練的速度。如果檢測(cè)靜音太多,或者語(yǔ)音數(shù)據(jù)不足,系統(tǒng)提示用戶(hù)錄音過(guò)短,重新進(jìn)行錄音,當(dāng)達(dá)到5次有效錄音時(shí),提取用戶(hù)的聲紋特征。
[0126]降噪模塊流程圖可參見(jiàn)圖8所示,用戶(hù)錄音數(shù)據(jù)進(jìn)行分幀處理,然后進(jìn)行降噪處理,經(jīng)語(yǔ)音恢復(fù)后得到增強(qiáng)后的語(yǔ)音,而分幀處理的結(jié)果也可以經(jīng)頻譜分析,聽(tīng)覺(jué)感知建模,自適應(yīng)參數(shù)估計(jì),再進(jìn)入降噪處理。
[0127]系統(tǒng)實(shí)現(xiàn):
[0128]手機(jī)聲紋注冊(cè)界面如圖9所示。在界面上顯示有注冊(cè)的文本內(nèi)容,實(shí)時(shí)錄音大小提示,以及當(dāng)前的錄音次數(shù),用戶(hù)注冊(cè)使用聲紋總共需要5次錄音內(nèi)容。每次錄音,用戶(hù)需要保持錄音按鈕按下?tīng)顟B(tài),松開(kāi)后,系統(tǒng)處理本次錄音數(shù)據(jù),并給出此次錄音是否合格的提示。當(dāng)5次錄音全部合格,提取聲紋特征并訓(xùn)練聲紋模型。
[0129]聲紋模型存儲(chǔ)在手機(jī)的數(shù)據(jù)庫(kù)中,由于聲紋模型數(shù)據(jù)的安全對(duì)系統(tǒng)的正常使用很重要,所以,在手機(jī)數(shù)據(jù)庫(kù)中的聲紋數(shù)據(jù)是壓縮存儲(chǔ),脫離出系統(tǒng)使用是沒(méi)有意義的。保證了用戶(hù)聲紋數(shù)據(jù)的絕對(duì)安全。
[0130]聲紋認(rèn)證時(shí)的系統(tǒng)框架流程圖如圖7所示,語(yǔ)音降噪模塊和聲紋特征提取模塊與注冊(cè)時(shí)一樣,系統(tǒng)調(diào)用手機(jī)已經(jīng)注冊(cè)的用戶(hù)聲紋模型,分析對(duì)比認(rèn)識(shí)時(shí)提供的聲紋特征,進(jìn)行一個(gè)確認(rèn)判決,接受或拒絕。
[0131]在基于Android的手機(jī)系統(tǒng)上,利用聲紋認(rèn)證實(shí)現(xiàn)手機(jī)鎖屏的解鎖,主要分為兩部分:
[0132]i)手機(jī)鎖屏實(shí)現(xiàn)
[0133]當(dāng)用戶(hù)開(kāi)啟手機(jī)或者系統(tǒng)從休眠狀態(tài)恢復(fù)時(shí),需要運(yùn)行或者喚醒聲紋認(rèn)證界面。首先關(guān)閉系統(tǒng)原有的鎖屏功能,用聲紋認(rèn)證的界面替換系統(tǒng)的鎖屏界面。
[0134]①開(kāi)機(jī)狀態(tài)的鎖屏啟動(dòng),Android系統(tǒng)在系統(tǒng)啟動(dòng)完畢后,會(huì)發(fā)送廣播消息,在程序中添加服務(wù)監(jiān)聽(tīng)此廣播消息,進(jìn)而啟動(dòng)定制的鎖屏界面。
[0135]②休眠狀態(tài)的鎖屏啟動(dòng),為了方便用戶(hù)使用,用戶(hù)可以自定義休眠后的啟動(dòng)時(shí)間,在實(shí)現(xiàn)上,當(dāng)檢測(cè)到手機(jī)屏幕關(guān)閉,進(jìn)入休眠狀態(tài)時(shí),創(chuàng)建系統(tǒng)警報(bào)服務(wù),并同時(shí)創(chuàng)建一個(gè)接收服務(wù),監(jiān)聽(tīng)當(dāng)用戶(hù)設(shè)定的時(shí)間到達(dá)時(shí),啟動(dòng)聲紋鎖屏界面,當(dāng)手機(jī)從休眠狀態(tài)恢復(fù)時(shí),直接可以利用聲紋進(jìn)行屏幕解鎖。
[0136]作為聲紋鎖屏應(yīng)用,利用聲紋控制包能夠保證用戶(hù)不能跳過(guò)鎖屏界面,而直接進(jìn)入系統(tǒng)。目前Android系統(tǒng)的鎖屏應(yīng)用中均有鎖不住的問(wèn)題。由于andorid系統(tǒng)從安全性出發(fā),不允許同時(shí)屏蔽Home按鍵和狀態(tài)欄的下拉條,所以,當(dāng)應(yīng)用屏蔽其中的任意一個(gè),都可以通過(guò)另外一個(gè)跳過(guò)鎖屏。
[0137]本實(shí)施例利用andorid系統(tǒng)中的系統(tǒng)警告的窗口能夠懸浮在所有界面UI最如面的特性,對(duì)此懸浮窗口結(jié)合聲紋認(rèn)證進(jìn)行調(diào)整,在此窗口中加入如圖9或10所示的聲紋認(rèn)證界面。保證了聲紋認(rèn)證界面能夠在最前方顯示,同時(shí)配合屏蔽home鍵。這樣,保證用戶(hù)不能通過(guò)home鍵和下拉條跳過(guò)聲紋認(rèn)證界面。
[0138]聲紋鎖屏同時(shí)還要具有系統(tǒng)鎖屏界面的一些常用功能,比如能夠直接接聽(tīng)來(lái)電,而不需要事先解鎖,我們通過(guò)在系統(tǒng)中添加對(duì)應(yīng)的服務(wù),監(jiān)聽(tīng)用戶(hù)的來(lái)電狀態(tài),當(dāng)有來(lái)電時(shí),控制程序直接退出鎖屏界面,等待用戶(hù)接聽(tīng)完畢,再重新啟動(dòng)鎖屏界面。
[0139]ii)聲紋認(rèn)證與屏幕解鎖實(shí)現(xiàn)
[0140]如圖10所示的聲紋認(rèn)證界面中,界面上顯示錄音的文本信息,用戶(hù)點(diǎn)擊錄音后,顯示錄音計(jì)時(shí)和實(shí)時(shí)的錄音能量提示。當(dāng)用戶(hù)松開(kāi)錄音按鈕后,將錄音數(shù)據(jù)送入聲紋認(rèn)證模塊進(jìn)行處理,并返回認(rèn)證的結(jié)果。如果認(rèn)證通過(guò),則關(guān)閉當(dāng)前認(rèn)證界面,用戶(hù)可以進(jìn)入系統(tǒng)。
[0141]實(shí)施例四
[0142]本實(shí)施例基于實(shí)施例一,提供了一種移動(dòng)設(shè)備聲紋注冊(cè)系統(tǒng),參見(jiàn)圖11所示,所述系統(tǒng)包括:
[0143]聲紋特征數(shù)據(jù)獲取模塊1101,用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù);
[0144]聲紋特征數(shù)據(jù)壓縮模塊1102,用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);
[0145]模型統(tǒng)計(jì)量獲取模塊1103,用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量;
[0146]聲紋注冊(cè)模塊1104,用于根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成
聲紋注冊(cè)。
[0147]優(yōu)選的,所述聲紋特征數(shù)據(jù)壓縮模塊具體用于:
[0148]使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布;
[0149]將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
[0150]優(yōu)選的,所述模型統(tǒng)計(jì)量獲取模塊具體用于:
[0151]對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分;
[0152]根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。[0153]優(yōu)選的,所述系統(tǒng)還包括:
[0154]降噪模塊,用于對(duì)所述語(yǔ)音進(jìn)行降噪處理。
[0155]優(yōu)選的,所述降噪模塊具體用于:
[0156]對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
[0157]實(shí)施例五
[0158]本實(shí)施例基于實(shí)施例二,提供了一種移動(dòng)設(shè)備聲紋認(rèn)證系統(tǒng),參見(jiàn)圖12所示。本實(shí)施例中的裝置仍包含實(shí)施例四所述的聲紋特征數(shù)據(jù)獲取模塊1101、聲紋特征數(shù)據(jù)壓縮模塊1102和模型統(tǒng)計(jì)量獲取模塊1103,所不同的是本實(shí)施例使用聲紋認(rèn)證模塊1105代替了實(shí)施例四中的聲紋注冊(cè)模塊1104,所述聲紋認(rèn)證模塊用于將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比,然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
[0159]與實(shí)施例四相同的部分本實(shí)施例不再贅述。
[0160]可以理解的是,本發(fā)明可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如:個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
[0161]本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類(lèi)型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
`[0162]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,這里所稱(chēng)得的存儲(chǔ)介質(zhì),如:R0M、RAM、磁碟、光盤(pán)等。
[0163]還需要說(shuō)明的是,在本文中,諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0164]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了閘述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處。綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種移動(dòng)設(shè)備聲紋注冊(cè)方法,其特征在于,所述方法包括: 將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù); 將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù);根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量; 根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成聲紋注冊(cè)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征,具體包括: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布; 將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量,具體包括: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分; 根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算,所述對(duì)數(shù)計(jì)算采用如下方式完成: 將待計(jì)算的數(shù)據(jù)拆分成兩部分,所述兩部分包括2的整冪數(shù)部分和余下的部分;將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果;所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算,擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前,還包括: 對(duì)所述語(yǔ)音進(jìn)行降噪處理。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對(duì)所述語(yǔ)音進(jìn)行降噪處理,具體包括: 對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
7.一種移動(dòng)設(shè)備聲紋認(rèn)證方法,其特征在于,所述方法包括: 將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù); 將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù); 根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量; 將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比,然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征,具體包括: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布; 將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量,具體包括: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分; 根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
10.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法的至少一個(gè)處理步驟中包含對(duì)數(shù)計(jì)算,所述對(duì)數(shù)計(jì)算采用如下方式完成: 待計(jì)算的數(shù)據(jù)拆分成兩部分,所述兩部分包括2的整冪數(shù)部分和余下的部分;將硬件中存儲(chǔ)的位數(shù)作為所述2的整冪數(shù)部分的計(jì)算結(jié)果;所述余下的部分通過(guò)如下近似計(jì)算得到:利用多級(jí)分段線性擬合逼近原始的對(duì)數(shù)計(jì)算,擬合的誤差通過(guò)分段的級(jí)數(shù)控制。
11.根據(jù)權(quán)利要求7任一項(xiàng)所述的方法,其特征在于,所述將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波之前,還包括: 對(duì)所述語(yǔ)音進(jìn)行降噪處理。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述對(duì)所述語(yǔ)音進(jìn)行降噪處理,具體包括: 對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域 逆變換,恢復(fù)出降噪后的語(yǔ)音。
13.—種移動(dòng)設(shè)備聲紋注冊(cè)系統(tǒng),其特征在于,所述系統(tǒng)包括: 聲紋特征數(shù)據(jù)獲取模塊,用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù); 聲紋特征數(shù)據(jù)壓縮模塊,用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù); 模型統(tǒng)計(jì)量獲取模塊,用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量; 聲紋注冊(cè)模塊,用于根據(jù)所述模型統(tǒng)計(jì)量建立聲紋模型并標(biāo)記和存儲(chǔ),完成聲紋注冊(cè)。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述聲紋特征數(shù)據(jù)壓縮模塊具體用于: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布; 將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮; 所述模型統(tǒng)計(jì)量獲取模塊具體用于: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分; 根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
15.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 降噪模塊,用于對(duì)所述語(yǔ)音進(jìn)行降噪處理; 所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
16.一種移動(dòng)設(shè)備聲紋認(rèn)證系統(tǒng),其特征在于,所述系統(tǒng)包括: 聲紋特征數(shù)據(jù)獲取模塊,用于將語(yǔ)音依次進(jìn)行分幀處理、頻譜分析、聽(tīng)覺(jué)感知濾波,以獲取聲紋特征數(shù)據(jù); 聲紋特征數(shù)據(jù)壓縮模塊,用于將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲(chǔ)表上,以獲取壓縮后的聲紋特征數(shù)據(jù); 模型統(tǒng)計(jì)量獲取模塊,用于根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對(duì)應(yīng)的模型統(tǒng)計(jì)量; 聲紋認(rèn)證模塊,用于將所述模型統(tǒng)計(jì)量與存儲(chǔ)的聲紋模型對(duì)比,然后根據(jù)所得匹配度進(jìn)行認(rèn)證。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述聲紋特征數(shù)據(jù)壓縮模塊具體用于: 使用所述聲紋特征數(shù)據(jù)的直方圖分布估計(jì)聲紋特征的實(shí)際分布; 將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲(chǔ)表之間映射的索引,通過(guò)所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲(chǔ)表中的數(shù)據(jù),以實(shí)現(xiàn)聲紋特征數(shù)據(jù)的壓縮; 所述模型統(tǒng)計(jì)量獲 取模塊具體用于: 對(duì)于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻(xiàn)大小選擇指定的部分模型成分; 根據(jù)選擇出來(lái)的所述部分模型成分為該幀聲紋特征計(jì)算模型統(tǒng)計(jì)量。
18.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 降噪模塊,用于對(duì)所述語(yǔ)音進(jìn)行降噪處理; 所述降噪模塊具體用于:對(duì)所述語(yǔ)音進(jìn)行分幀處理,為每一幀語(yǔ)音計(jì)算頻譜分析,根據(jù)聽(tīng)覺(jué)感知機(jī)制估計(jì)每一幀語(yǔ)音頻譜所受到的噪聲影響大小并構(gòu)建對(duì)應(yīng)的濾波器參數(shù),經(jīng)過(guò)頻域?yàn)V波后,得到降噪后的語(yǔ)音頻譜,再通過(guò)頻域逆變換,恢復(fù)出降噪后的語(yǔ)音。
【文檔編號(hào)】G10L17/02GK103685185SQ201210342473
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2012年9月14日 優(yōu)先權(quán)日:2012年9月14日
【發(fā)明者】劉青松, 許星東, 許敏強(qiáng) 申請(qǐng)人:上海掌門(mén)科技有限公司