專利名稱:一種對文本無關(guān)的聲紋進(jìn)行識別的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于語音信號處理領(lǐng)域,涉及于對文本無關(guān)的聲紋進(jìn)行識別的方法。
背景技術(shù):
由于每個(gè)人的發(fā)音器官不同,所發(fā)出來的聲音極其音調(diào)各不相同,因此聲紋作為基本特征來實(shí)現(xiàn)人的身份識別具有實(shí)際的不可替代性和穩(wěn)定性。從聲紋識別的使用場合來看,需要判別的聲音其來源基本分為3中情況,即文本提示型、文本相關(guān)型和文本無關(guān)型。文本提示型和文本相關(guān)型都需要用戶根據(jù)規(guī)定的內(nèi)容發(fā)音,并根據(jù)發(fā)音的內(nèi)容建立模型進(jìn)行匹配,雖然這樣可以使得匹配效果較好,但需要用戶完全配合,靈活性和容錯(cuò)性欠佳;而對于文本無關(guān)型則不規(guī)定說話人的聲音內(nèi)容,只要系統(tǒng)中錄有說話人的聲音就能夠識別是否為該說話人,因此對文本無關(guān)的聲紋進(jìn)行識別的技術(shù)含量要求比較高,它不僅僅需要解決匹配判斷問題,還需要預(yù)先提取說話人的語音特征,才能進(jìn)行判斷。
發(fā)明內(nèi)容
本發(fā)明發(fā)明的一種對文本無關(guān)的聲紋進(jìn)行識別的方法,包括以下步驟
輸入待識別人的語音信號步驟;
對所述輸入的語音信號進(jìn)行預(yù)處理步驟;
對所述輸入的語音信號進(jìn)行特征值提取步驟;
根據(jù)所述提取的特征值建立待識別人的聲學(xué)模型步驟;
將所述聲學(xué)模型與語音特征庫中的全部聲學(xué)模型進(jìn)行匹配步驟;
返回計(jì)算所得最為匹配的模型編號,以此確定所述待識別的具體身份步驟;
在所述聲學(xué)模型與語音特征庫中的全部聲學(xué)模型進(jìn)行匹配步驟中,所述的全部聲學(xué)模型的建立是采用預(yù)先收錄用戶客人的語音信號建立的,建立聲學(xué)模型的步驟為
采集所述客人的連續(xù)語音作為輸入信號步驟;
對所述客人的連續(xù)語音信號進(jìn)行預(yù)處理步驟;
對所述客人的連續(xù)語音信號進(jìn)行特征值提取步驟;
對所提取的客人的連續(xù)語音信號的特征值建立聲學(xué)模型步驟;
將所述客人的聲學(xué)模型存儲在語音特征庫中。本發(fā)明發(fā)明的對文本無關(guān)的聲紋進(jìn)行識別的方法識別效率高,結(jié)果準(zhǔn)確。
下面結(jié)合附圖對本發(fā)明的具體實(shí)施方案做進(jìn)一步說明。圖I為本發(fā)明發(fā)明的一種對文本無關(guān)的聲紋進(jìn)行識別的方法中的建立針對用戶集得全部聲學(xué)模型步驟流程圖。圖2為本發(fā)明發(fā)明的一種對文本無關(guān)的聲紋進(jìn)行識別的方法中的針對當(dāng)前待識別用戶進(jìn)行模型匹配和識別的步驟流程圖。具體實(shí)施方案本發(fā)明發(fā)明的一種對文本無關(guān)的聲紋進(jìn)行識別的方法的步驟流程圖如圖I所示,包含以下步驟
首先建立針對用戶集的全部聲學(xué)模型,步驟流程圖如圖I所示通過外圍音頻采集設(shè)備對用戶的說話人語音信號進(jìn)行采集;對采集到得連續(xù)語音信號進(jìn)行預(yù)處理;對采集到的連續(xù)語音信號進(jìn)行特征值提?。皇褂锰崛〉降奶卣髦祵⒃撜f話人的聲學(xué)模型;將該聲學(xué)模型存儲在語音特征庫中;
然后針對當(dāng)前待識別用戶進(jìn)行模型匹配和識別,步驟流程圖如圖I所示利用外圍音 頻采集設(shè)備采集說話人的語音信號;對采集到得連續(xù)語音信號進(jìn)行預(yù)處理;對采集到的連續(xù)語音信號進(jìn)行特征值提??;使用提取到的特征值對建立當(dāng)前說話人的聲學(xué)模型;將當(dāng)前說話人的聲學(xué)模型與語音特征庫中的全部聲學(xué)模型進(jìn)行匹配;返回計(jì)算所得最為匹配的模型編號,以此確定所述待識別人的具體身份。
權(quán)利要求
1.一種對文本無關(guān)的聲紋進(jìn)行識別的方法,其特征在于,包括以下步驟 輸入待識別人的語音信號步驟; 對所述輸入的語音信號進(jìn)行預(yù)處理步驟; 對所述輸入的語音信號進(jìn)行特征值提取步驟; 根據(jù)所述提取的特征值建立待識別人的聲學(xué)模型步驟; 將所述聲學(xué)模型與語音特征庫中的全部聲學(xué)模型進(jìn)行匹配步驟; 返回計(jì)算所得最為匹配的模型編號,以此確定所述待識別的具體身份步驟; 在所述聲學(xué)模型與語音特征庫中的全部聲學(xué)模型進(jìn)行匹配步驟中,所述的全部聲學(xué)模型的建立是采用預(yù)先收錄用戶客人的語音信號建立的,建立聲學(xué)模型的步驟為 采集所述客人的連續(xù)語音作為輸入信號步驟; 對所述客人的連續(xù)語音信號進(jìn)行預(yù)處理步驟; 對所述客人的連續(xù)語音信號進(jìn)行特征值提取步驟; 對所提取的客人的連續(xù)語音信號的特征值建立聲學(xué)模型步驟; 將所述客人的聲學(xué)模型存儲在語音特征庫中。
全文摘要
本發(fā)明發(fā)明的一種對文本無關(guān)的聲紋進(jìn)行識別的方法,屬于語音信號處理領(lǐng)域,涉及對文本無關(guān)的聲紋進(jìn)行識別的方法,首先建立針對用戶集的全部聲學(xué)模型使用外圍音頻采集設(shè)備對用戶的說話人語音信號進(jìn)行采集,并為該說話人建立聲學(xué)模型,并將該模型存儲在語音特征庫中;然后針對當(dāng)前待識別用戶進(jìn)行模型匹配和識別使用外圍音頻采集設(shè)備采集當(dāng)前說話人的語音信號,為當(dāng)前說話人建立聲學(xué)模型,將當(dāng)前說話人的聲學(xué)模型與語音特征庫中的全部聲學(xué)模型進(jìn)行匹配,返回計(jì)算所的最為匹配的模型編號,以此確定所述待識別人的具體身份。方法識別效率高,結(jié)果準(zhǔn)確。
文檔編號G10L15/02GK102831890SQ20111016057
公開日2012年12月19日 申請日期2011年6月15日 優(yōu)先權(quán)日2011年6月15日
發(fā)明者周曉東, 劉鎮(zhèn) 申請人:鎮(zhèn)江佳得信息技術(shù)有限公司