聲紋驗(yàn)證方法及其系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種聲紋驗(yàn)證方法,聲紋驗(yàn)證方法,包括如下步驟:發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求;根據(jù)所述業(yè)務(wù)操作請(qǐng)求轉(zhuǎn)換為攜帶驗(yàn)證語料的聲紋驗(yàn)證指令;獲取根據(jù)聲紋驗(yàn)證指令輸入的聲音數(shù)據(jù)以及需要查找的群組的ID;根據(jù)所述聲音數(shù)據(jù)生成聲紋信息;將所述聲紋信息與參考聲紋信息進(jìn)行一一識(shí)別,得到與每一個(gè)參考聲紋之間的相似度分值;選取相似度分值最高的參考聲紋,并且比較所述最高的形式度分值與預(yù)設(shè)閾值的大小,如果最高的形式度分值比預(yù)設(shè)閾值小,則驗(yàn)證失??;否則,驗(yàn)證成功。本發(fā)明還公開一種聲紋驗(yàn)證系統(tǒng)。采用本發(fā)明,大大簡化了需要檢查各種證件或者票據(jù)的真實(shí)性的流程。
【專利說明】
聲紋驗(yàn)證方法及其系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于聲紋識(shí)別技術(shù)領(lǐng)域,具體設(shè)及一種聲紋驗(yàn)證方法及其系統(tǒng)。
【背景技術(shù)】
[0002] 傳統(tǒng)票據(jù)驗(yàn)證需要人工核對(duì),例如火車票驗(yàn)票,需要工作人員先驗(yàn)票、驗(yàn)身份證, 之后再對(duì)比身份證照片和人臉,進(jìn)而判斷是否為車票所有者本人,驗(yàn)證過程費(fèi)時(shí)費(fèi)力,尤其 是對(duì)于人多、量大的情況下,會(huì)出現(xiàn)由于驗(yàn)票效率低,造成的人潮擁堵的問題。于此同時(shí),隨 著科技的發(fā)展,高科技的偽造技術(shù),造成了驗(yàn)證過程安全性不高的問題。
【發(fā)明內(nèi)容】
[0003] 為了解決上述問題,本發(fā)明的第一目的提供一種聲紋驗(yàn)證方法,大大簡化了需要 檢查各種證件或者票據(jù)的真實(shí)性的流程。
[0004] 為實(shí)現(xiàn)上述目的,本發(fā)明按W下技術(shù)方案予W實(shí)現(xiàn)的:
[0005] 本發(fā)明所述的聲紋驗(yàn)證方法,包括如下步驟:
[0006] 發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求;
[0007] 根據(jù)所述業(yè)務(wù)操作請(qǐng)求轉(zhuǎn)換為攜帶驗(yàn)證語料的聲紋驗(yàn)證指令;
[000引獲取根據(jù)聲紋驗(yàn)證指令輸入的聲音數(shù)據(jù)W及需要查找的群組的ID;
[0009] 根據(jù)所述聲音數(shù)據(jù)生成聲紋信息;
[0010] 將所述聲紋信息與參考聲紋信息進(jìn)行一一識(shí)別,得到與每一個(gè)參考聲紋之間的相 似度分值;
[0011] 選取相似度分值最高的參考聲紋,并且比較所述最高的形式度分值與預(yù)設(shè)闊值的 大小,如果最高的形式度分值比預(yù)設(shè)闊值小,則驗(yàn)證失敗;否則,驗(yàn)證成功。
[0012] 進(jìn)一步地,所述相似度分值采用的公式為:
[0013]
[0014] 其中,所述wl和w2為身份認(rèn)證矢量;T為向量轉(zhuǎn)置。
[0015] 進(jìn)一步地,所述參考聲紋信息為所述群組ID對(duì)應(yīng)的群組中預(yù)先存儲(chǔ)的所有合法用 戶的聲紋信息。
[0016] 進(jìn)一步地,所述業(yè)務(wù)類型表示票據(jù)的驗(yàn)證類型,包括:車票的驗(yàn)證、Π 票的驗(yàn)證;所 述業(yè)務(wù)操作請(qǐng)求表示票據(jù)的驗(yàn)證請(qǐng)求。
[0017] 進(jìn)一步地,所述群組是根據(jù)業(yè)務(wù)類型的不同而建立的獨(dú)立用戶群;所述群組的ID 則是所述獨(dú)立用戶群對(duì)應(yīng)的編碼。
[0018] 為了解決上述問題,本發(fā)明的第二目的提供一種聲紋驗(yàn)證系統(tǒng),具有自動(dòng)化檢查 各種證件或者票據(jù)的真實(shí)性的功能,大大簡化了現(xiàn)有人工檢查的流程,提升了檢查效率。
[0019] 為實(shí)現(xiàn)上述目的,本發(fā)明按W下技術(shù)方案予W實(shí)現(xiàn)的:
[0020] 本發(fā)明所述的聲紋驗(yàn)證系統(tǒng),包括:
[0021 ]通信連接的聲紋識(shí)別服務(wù)器和聲紋識(shí)別客戶端。
[0022] 進(jìn)一步地,所述聲紋識(shí)別客戶端包括第一發(fā)送模塊、第一接收模塊、第一獲取模塊 和第一提交模塊;所述第一發(fā)送模塊用于發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求至所述聲紋識(shí) 別服務(wù)器;所述第一接收模塊用于接收所述聲紋識(shí)別服務(wù)器將述業(yè)務(wù)操作請(qǐng)求轉(zhuǎn)換為攜帶 驗(yàn)證語料的聲紋驗(yàn)證指令;所述第一獲取模塊用于獲取根據(jù)聲紋驗(yàn)證指令輸入的聲音數(shù)據(jù) W及需要查找的群組的ID;所述第一提交模塊用于提交所述聲音數(shù)據(jù)W及需要查找群組的 ID至聲紋識(shí)別服務(wù)器。
[0023] 進(jìn)一步地,所述聲紋識(shí)別服務(wù)器包括第二接收模塊、第二發(fā)送模塊、第Ξ接收模 塊、第一生成模塊、第一識(shí)別模塊和第一確定模塊;所述第二接收模塊用于接收所述業(yè)務(wù)操 作請(qǐng)求;所述第二發(fā)送模塊用于發(fā)送所述攜帶驗(yàn)證語料的聲紋驗(yàn)證指令;所述第Ξ接收模 塊用于接收所述聲音數(shù)據(jù)W及需要查找的群組的ID;所述第一生成模塊用于將所述聲音數(shù) 據(jù)生成聲紋信息;所述第一識(shí)別模塊用于將所述聲紋信息與參考聲紋信息一一識(shí)別,并且 得到與每一個(gè)參考聲紋之間的相似度分值;所述第一確定模塊用于選取相似度分值最高的 參考聲紋,并且比較所述最高的形式度分值與預(yù)設(shè)闊值的大小,如果最高的形式度分值比 預(yù)設(shè)闊值小,則驗(yàn)證失敗;否則,驗(yàn)證成功。
[0024] 進(jìn)一步地,所述相似度分值采用的公式為:
[0025]
[0026] 其中,所述wl和w2為身份認(rèn)證矢量;T為向量轉(zhuǎn)置。
[0027] 進(jìn)一步地,所述參考聲紋信息為所述群組ID對(duì)應(yīng)的群組中預(yù)先存儲(chǔ)的所有合法用 戶的聲紋信息。
[0028] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
[0029] 本發(fā)明所述的聲紋驗(yàn)證方法,利用了聲紋唯一性和穩(wěn)定性的特點(diǎn),可W很好的解 決有關(guān)身份驗(yàn)證流程復(fù)雜的問題。操作過程中,只需要用戶在進(jìn)行業(yè)務(wù)操作的時(shí)候,先注冊(cè) 自己的聲紋模型,之后在驗(yàn)證某個(gè)人是否購買過某項(xiàng)服務(wù)時(shí),只需要對(duì)著聲紋識(shí)別客戶端 讀出需要的文本,聲紋識(shí)別服務(wù)器進(jìn)行聲紋判別,就可W識(shí)別出此人的身份,并查找到運(yùn)個(gè) 身份ID是否購買過此項(xiàng)服務(wù)。運(yùn)樣就大大的簡化了某些業(yè)務(wù)場景中需要檢查各種證件和票 據(jù)W及真假性等等復(fù)雜流程。
【附圖說明】
[0030] 下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)的說明,其中:
[0031 ]圖1是本發(fā)明所述的聲紋驗(yàn)證方法的流程圖;
[0032] 圖2是本發(fā)明所述的聲紋驗(yàn)證方法中注冊(cè)預(yù)料的流程圖;
[0033] 圖3是本發(fā)明所述的聲紋驗(yàn)證方法中識(shí)別、確定的流程圖
[0034] 圖4是本發(fā)明所述的聲紋驗(yàn)證系統(tǒng)的原理框架圖;
[0035] 圖5是本發(fā)明所述的聲紋驗(yàn)證系統(tǒng)中聲紋識(shí)別客戶端的原理框架圖;
[0036] 圖6是本發(fā)明所述的聲紋驗(yàn)證系統(tǒng)中聲紋識(shí)別服務(wù)器的原理框架圖。
[0037] 圖中;
[0038] 1:聲紋識(shí)別客戶端
[0039] 11:第一發(fā)送模塊12:第一接收模塊13:第一獲取模塊14:第一提交模塊
[0040] 2:聲紋識(shí)別服務(wù)器
[0041] 21:第二接收模塊22:第二發(fā)送模塊23:第Ξ接收模塊24:第一生成模塊
[0042] 25:第一識(shí)別模塊26:第一確定模塊
【具體實(shí)施方式】
[0043] W下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí) 施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0044] 如圖1所示,本發(fā)明所述的聲紋驗(yàn)證方法,是利用聲紋了唯一性和穩(wěn)定性的特點(diǎn), 很好的解決了有關(guān)身份驗(yàn)證流程復(fù)雜的問題。
[0045] 具體的實(shí)現(xiàn)過程如W下步驟:
[0046] SOI:發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求;
[0047] 所述業(yè)務(wù)類型表示票據(jù)的驗(yàn)證類型,包括:車票的驗(yàn)證、Π 票的驗(yàn)證;不僅限于此, 只要需要驗(yàn)證身份的業(yè)務(wù),都屬于保護(hù)的范疇。所述業(yè)務(wù)操作請(qǐng)求表示票據(jù)的驗(yàn)證請(qǐng)求。
[0048] S02:根據(jù)所述業(yè)務(wù)操作請(qǐng)求轉(zhuǎn)換為攜帶驗(yàn)證語料的聲紋驗(yàn)證指令;
[0049] S03:獲取根據(jù)聲紋驗(yàn)證指令輸入的聲音數(shù)據(jù)W及需要查找的群組的ID;
[0050] 所述群組是根據(jù)業(yè)務(wù)類型的不同而建立的獨(dú)立用戶群;
[0051 ] 所述群組的ID則是所述獨(dú)立用戶群對(duì)應(yīng)的編碼。
[0052] S04:根據(jù)所述聲音數(shù)據(jù)生成聲紋信息;
[0053] S05:將所述聲紋信息與參考聲紋信息進(jìn)行一一識(shí)別,得到與每一個(gè)參考聲紋之間 的相似度分值;
[0054] 相似度的計(jì)算方法可W采用任何一種聲紋識(shí)別計(jì)算方法,包括但不限于GMM模型、 iVector等。WiVector為例,每一個(gè)用戶有對(duì)應(yīng)的iVector,服務(wù)器將獲取到的語音轉(zhuǎn)換成 iVector,然后與參考的iVector進(jìn)行比較,可W有多種技術(shù)進(jìn)行比較,包括但不限于余弦方 法(Cosine),概率線性分析方法(Probabilistic Linear Discriminant Analysis,PLDA) 等。W余弦方法為例,對(duì)于得到的兩個(gè)iVecto;r,wi和W2,其相似度計(jì)算方式如下(其中Τ表示 向量轉(zhuǎn)置):
[0化5]
[0056] S06:選取相似度分值最高的參考聲紋,并且比較所述最高的形式度分值與預(yù)設(shè)闊 值的大小,如果最高的形式度分值比預(yù)設(shè)闊值小,則驗(yàn)證失?。环駝t,驗(yàn)證成功,具體如圖3 所示。驗(yàn)證成功代表在對(duì)應(yīng)的群組中有相應(yīng)的用戶,從而確認(rèn)通過。
[0057] 本發(fā)明所述的聲紋驗(yàn)證方法,只需要用戶在進(jìn)行業(yè)務(wù)操作的時(shí)候,先注冊(cè)自己的 聲紋模型,具體如圖2所示,之后在驗(yàn)證某個(gè)人是否購買過某項(xiàng)服務(wù)時(shí),只需要對(duì)著客服端 系統(tǒng)讀出需要的文本,服務(wù)器進(jìn)行聲紋判別就可W識(shí)別出此人的身份,并查找到運(yùn)個(gè)身份 ID是否購買過此項(xiàng)服務(wù)。運(yùn)樣就大大的簡化了某些業(yè)務(wù)場景中需要檢查各種證件和票據(jù)W 及真假性等等復(fù)雜流程。
[0058] 如圖4、圖5和圖6所示,本發(fā)明所述的聲紋驗(yàn)證系統(tǒng),包括通信連接的聲紋識(shí)別服 務(wù)器2和聲紋識(shí)別客戶端1。其中,所述聲紋識(shí)別客戶端1可W為普通的臺(tái)式機(jī)電腦、筆記本 電腦、手機(jī)、平板電腦、智能可穿戴設(shè)備、嵌入式設(shè)備等設(shè)備。所述聲紋識(shí)別客戶端1中可W 運(yùn)行至少一種類型的互聯(lián)網(wǎng)應(yīng)用,包括但不限于:游戲應(yīng)用、電商應(yīng)用等等。聲紋識(shí)別服務(wù) 器巧旨互聯(lián)網(wǎng)應(yīng)用的后臺(tái)服務(wù)器,用于處理互聯(lián)網(wǎng)應(yīng)用在實(shí)現(xiàn)相應(yīng)功能過程中的各種需求, 并可用于對(duì)互聯(lián)網(wǎng)應(yīng)用中的用戶的相關(guān)信息。
[0059] 所述聲紋識(shí)別客戶端1包括第一發(fā)送模塊11、第一接收模塊12、第一獲取模塊13和 第一提交模塊14。
[0060] 所述第一發(fā)送模塊11用于發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求至所述聲紋識(shí)別服 務(wù)器2,所述業(yè)務(wù)類型表示票據(jù)的驗(yàn)證類型,包括:車票的驗(yàn)證、Π 票的驗(yàn)證;所述業(yè)務(wù)操作 請(qǐng)求表示票據(jù)的驗(yàn)證請(qǐng)求。所述第一接收模塊12用于接收所述聲紋識(shí)別服務(wù)2器將述業(yè)務(wù) 操作請(qǐng)求轉(zhuǎn)換為攜帶驗(yàn)證語料的聲紋驗(yàn)證指令;所述第一獲取模塊13用于獲取根據(jù)聲紋驗(yàn) 證指令輸入的聲音數(shù)據(jù)W及需要查找的群組的ID,所述群組是根據(jù)業(yè)務(wù)類型的不同而建立 的獨(dú)立用戶群;所述群組的ID則是所述獨(dú)立用戶群對(duì)應(yīng)的編碼。所述第一提交模塊14用于 提交所述聲音數(shù)據(jù)W及需要查找群組的ID至聲紋識(shí)別服務(wù)器2。
[0061] 所述聲紋識(shí)別服務(wù)器2包括第二接收模塊21、第二發(fā)送模塊22、第Ξ接收模塊23、 第一生成模塊24、第一識(shí)別模塊25和第一確定模塊26。所述第二接收模塊21用于接收所述 業(yè)務(wù)操作請(qǐng)求;所述第二發(fā)送模塊22用于發(fā)送所述攜帶驗(yàn)證語料的聲紋驗(yàn)證指令;所述第 Ξ接收模塊23用于接收所述聲音數(shù)據(jù)W及需要查找的群組的ID;所述第一生成模塊24用于 將所述聲音數(shù)據(jù)生成聲紋信息;所述第一識(shí)別模塊25用于將所述聲紋信息與參考聲紋信息 一一識(shí)別,并且得到與每一個(gè)參考聲紋之間的相似度分值;所述第一確定模塊26用于選取 相似度分值最高的參考聲紋,并且比較所述最高的形式度分值與預(yù)設(shè)闊值的大小,如果最 高的形式度分值比預(yù)設(shè)闊值小,則驗(yàn)證失敗;否則,驗(yàn)證成功。
[0062] 相似度的計(jì)算方法可W采用任何一種聲紋識(shí)別計(jì)算方法,包括但不限于GMM模型、 iVector等。WiVector為例,每一個(gè)用戶有對(duì)應(yīng)的iVector,服務(wù)器將獲取到的語音轉(zhuǎn)換成 iVector,然后與參考的iVector進(jìn)行比較,可W有多種技術(shù)進(jìn)行比較,包括但不限于余弦方 法(Cosine),概率線性分析方法(Probabilistic Linear Discriminant Analysis,PLDA) 等。W余弦方法為例,對(duì)于得到的兩個(gè)iVecto;r,wi和W2,其相似度計(jì)算方式如下(其中Τ表示 向量轉(zhuǎn)置):
[0063]
[0064] W上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,故 凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)W上實(shí)施例所作的任何修改、 等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種聲紋驗(yàn)證方法,其特征在于,包括如下步驟: 發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求; 根據(jù)所述業(yè)務(wù)操作請(qǐng)求轉(zhuǎn)換為攜帶驗(yàn)證語料的聲紋驗(yàn)證指令; 獲取根據(jù)聲紋驗(yàn)證指令輸入的聲音數(shù)據(jù)以及需要查找的群組的ID; 根據(jù)所述聲音數(shù)據(jù)生成聲紋信息; 將所述聲紋信息與參考聲紋信息進(jìn)行一一識(shí)別,得到與每一個(gè)參考聲紋之間的相似度 分值; 選取相似度分值最高的參考聲紋,并且比較所述最高的形式度分值與預(yù)設(shè)閾值的大 小,如果最高的形式度分值比預(yù)設(shè)閾值小,則驗(yàn)證失敗;否則,驗(yàn)證成功。2. 根據(jù)權(quán)利要求1所述的聲紋驗(yàn)證方法,其特征在于: 所述相似度分值采用的公式為:其中,所述wl和w2為身份認(rèn)證矢量;T為向量轉(zhuǎn)置。3. 根據(jù)權(quán)利要求1所述的聲紋驗(yàn)證方法,其特征在于: 所述參考聲紋信息為所述群組ID對(duì)應(yīng)的群組中預(yù)先存儲(chǔ)的所有合法用戶的聲紋信息。4. 根據(jù)權(quán)利要求1所述的聲紋驗(yàn)證方法,其特征在于: 所述業(yè)務(wù)類型表示票據(jù)的驗(yàn)證類型,包括:車票的驗(yàn)證、門票的驗(yàn)證; 所述業(yè)務(wù)操作請(qǐng)求表示票據(jù)的驗(yàn)證請(qǐng)求。5. 根據(jù)權(quán)利要求4所述的聲紋驗(yàn)證方法,其特征在于: 所述群組是根據(jù)業(yè)務(wù)類型的不同而建立的獨(dú)立用戶群; 所述群組的ID則是所述獨(dú)立用戶群對(duì)應(yīng)的編碼。6. -種聲紋驗(yàn)證系統(tǒng),其特征在于,包括: 通信連接的聲紋識(shí)別服務(wù)器和聲紋識(shí)別客戶端。7. 根據(jù)權(quán)利要求6所述的聲紋驗(yàn)證系統(tǒng),其特征在于: 所述聲紋識(shí)別客戶端包括第一發(fā)送模塊、第一接收模塊、第一獲取模塊和第一提交模 塊; 所述第一發(fā)送模塊用于發(fā)送攜帶業(yè)務(wù)類型的業(yè)務(wù)操作請(qǐng)求至所述聲紋識(shí)別服務(wù)器; 所述第一接收模塊用于接收所述聲紋識(shí)別服務(wù)器將述業(yè)務(wù)操作請(qǐng)求轉(zhuǎn)換為攜帶驗(yàn)證 語料的聲紋驗(yàn)證指令; 所述第一獲取模塊用于獲取根據(jù)聲紋驗(yàn)證指令輸入的聲音數(shù)據(jù)以及需要查找的群組 的ID; 所述第一提交模塊用于提交所述聲音數(shù)據(jù)以及需要查找群組的ID至聲紋識(shí)別服務(wù)器。8. 根據(jù)權(quán)利要求7所述的聲紋驗(yàn)證系統(tǒng),其特征在于: 所述聲紋識(shí)別服務(wù)器包括第二接收模塊、第二發(fā)送模塊、第三接收模塊、第一生成模 塊、第一識(shí)別模塊和第一確定模塊; 所述第二接收模塊用于接收所述業(yè)務(wù)操作請(qǐng)求; 所述第二發(fā)送模塊用于發(fā)送所述攜帶驗(yàn)證語料的聲紋驗(yàn)證指令; 所述第三接收模塊用于接收所述聲音數(shù)據(jù)以及需要查找的群組的ID; 所述第一生成模塊用于將所述聲音數(shù)據(jù)生成聲紋信息; 所述第一識(shí)別模塊用于將所述聲紋信息與參考聲紋信息一一識(shí)別,并且得到與每一個(gè) 參考聲紋之間的相似度分值; 所述第一確定模塊用于選取相似度分值最高的參考聲紋,并且比較所述最高的形式度 分值與預(yù)設(shè)閾值的大小,如果最高的形式度分值比預(yù)設(shè)閾值小,則驗(yàn)證失?。环駝t,驗(yàn)證成 功。9. 根據(jù)權(quán)利要求8所述的聲紋驗(yàn)證系統(tǒng),其特征在于: 所述相似度分值采用的公式為:其中,所述wl和w2為身份認(rèn)證矢量;T為向量轉(zhuǎn)置。10. 根據(jù)權(quán)利要求8所述的聲紋驗(yàn)證系統(tǒng),其特征在于: 所述參考聲紋信息為所述群組ID對(duì)應(yīng)的群組中預(yù)先存儲(chǔ)的所有合法用戶的聲紋信息。
【文檔編號(hào)】G07B11/00GK105825553SQ201610380827
【公開日】2016年8月3日
【申請(qǐng)日】2016年5月31日
【發(fā)明人】陳昊亮
【申請(qǐng)人】廣州勢(shì)必可贏網(wǎng)絡(luò)科技有限公司