結(jié)果小于等于第一設定閾值,則使用者身份認證失敗。
[0140] 優(yōu)選地,所述活體檢測包括語音識別和唇語識別。
[0141] 優(yōu)選地,活體檢測模塊包括:語音識別模塊,用于對所述語音信號進行語音識別, 獲得語音信號對應的語言信息;
[0142] 分幀模塊,用于對所述視頻信號進行分幀處理,獲得分幀后的每幀圖像中的嘴唇 位置;
[0143] 唇語識別模塊,用于對所述每幀圖像中的嘴唇位置進行唇語識別,獲得每幀圖像 的唇語識別對應的語言信息;
[0144] 計算模塊,用于使用時間對準算法計算語音信號對應的語言信息與唇語識別對應 的語言信息的相似度值,將所述相似度值作為活體檢測結(jié)果。
[0145] 優(yōu)選地,判斷模塊包括:聲紋識別模塊,用于對使用者的語音信號進行聲紋識別, 得到語音信號的聲紋識別打分;
[0146] 人臉識別模塊,用于對使用者的人臉視頻圖像,進行分幀,獲取人臉連續(xù)幀圖像, 對所述人臉連續(xù)幀圖像進行人臉識別,對獲得的人臉識別進行分數(shù)融合,得到人臉識別打 分;
[0147] 判決模塊,用于根據(jù)所述聲紋識別打分和人臉識別打分,獲得使用者身份認證的 判決得分;
[0148] 第二判斷模塊,用于若所述判決得分大于第二設定閾值,則使用者身份認證成 功;
[0149] 若所述判決得分小于第二設定閾值,則使用者身份認證失敗。
[0150] 優(yōu)選地,還包括:使用視頻圖像采集器獲取使用者視頻信號,使用語音采集器獲取 使用者的語音信號。
[0151] 本實施例,通過將獲取的語音信號和視頻信號先進行活體檢測,當活體檢測結(jié)果 小于等于第一設定閾值時,則身份認證失敗,當活體檢測結(jié)果大于第一設定閾值,則繼續(xù)對 獲取的語音信號和視頻信號進行聲紋識別和人臉認識,若聲紋識別和人臉識別全部通過, 則該使用者的身份認證通過,否則認證失敗,通過對獲取的語音信號和視頻信號進行活體 檢測、聲紋識別和人臉識別,從而極大的阻止了非法用戶的闖入,通過對使用者的語音信號 和視頻信號進行多重檢測,從而解決了現(xiàn)有技術(shù)單一生物特征識別技術(shù)的不足,進而提高 了身份認證的準確性、安全性和可靠性。
[0152] 對于系統(tǒng)實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關 之處參見方法實施例的部分說明即可。
[0153] 本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與 其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
[0154] 以上對本申請所提供的一種基于聲紋識別、人臉識別以及活體檢測的身份認證方 法和系統(tǒng),進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡 述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領域的 一般技術(shù)人員,依據(jù)本申請的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所 述,本說明書內(nèi)容不應理解為對本申請的限制。
【主權(quán)項】
1. 一種基于聲紋識別、人臉識別以及活體檢測的身份認證方法,其特征在于,包括: 獲取使用者的語音信號和視頻信號; 對所述語音信號和視頻信號進行活體檢測,獲得活體檢測結(jié)果; 若所述活體檢測結(jié)果大于第一設定閾值,則對獲取使用者的語音信號和視頻信號進行 聲紋識別和人臉識別,若聲紋識別和人臉識別全部通過,則身份認證通過,否則身份認證失 敗。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述活體檢測包括語音識別和唇語識別。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述語音信號和視頻信號進行活 體檢測,獲得活體檢測結(jié)果的步驟包括: 對所述語音信號進行語音識別,獲得語音信號對應的語言信息; 對所述視頻信號進行分幀處理,獲得分幀后的每幀圖像中的嘴唇位置; 對所述每幀圖像中的嘴唇位置進行唇語識別,獲得每幀圖像的唇語對應的語言信息; 使用時間對準算法計算語音信號對應的語言信息與唇語識別對應的語言信息的相似 度值,將所述相似度值作為活體檢測結(jié)果。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對獲取使用者的語音信號和視頻信 號進行聲紋識別和人臉識別的步驟包括: 對使用者的語音信號進行聲紋識別,得到語音信號的聲紋識別打分; 對使用者的人臉視頻圖像,進行分幀,獲取人臉連續(xù)幀圖像,對所述人臉連續(xù)幀圖像進 行人臉識別,對獲得的人臉識別進行分數(shù)融合,得到人臉識別打分; 根據(jù)所述聲紋識別打分和人臉識別打分,獲得使用者身份認證的判決得分; 若所述判決得分大于第二設定閾值,則使用者身份認證成功; 若所述判決得分小于第二設定閾值,則使用者身份認證失敗。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:使用視頻圖像采集器獲取使用者 視頻信號,使用語音采集器獲取使用者的語音信號。6. -種基于聲紋識別、人臉識別以及活體檢測的身份認證系統(tǒng),其特征在于,包括: 獲取模塊,用于獲取使用者的語音信號和視頻信號; 活體檢測模塊,用于對所述語音信號和視頻信號進行活體檢測,獲得活體檢測結(jié)果; 第一判斷模塊,用于若所述活體檢測結(jié)果大于第一設定閾值,則對獲取使用者的語音 信號和視頻信號進行聲紋識別和人臉識別;若聲紋識別和人臉識別全部通過,則身份認證 通過,否則身份認證失敗。7. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述活體檢測包括語音識別和唇語識別。8. 根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,活體檢測模塊包括: 語音識別模塊,用于對所述語音信號進行語音識別,獲得語音信號對應的語言信息; 分幀模塊,用于對所述視頻信號進行分幀處理,獲得分幀后的每幀圖像中的嘴唇位 置; 唇語識別模塊,用于對所述每幀圖像中的嘴唇位置進行唇語識別,獲得每幀圖像的唇 語識別對應的語言信息; 計算模塊,用于使用時間對準算法計算語音信號對應的語言信息與唇語識別對應的語 言信息的相似度值,將所述相似度值作為活體檢測結(jié)果。9. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,判斷模塊包括: 聲紋識別模塊,用于對使用者的語音信號進行聲紋識別,得到語音信號的聲紋識別打 分; 人臉識別模塊,用于對使用者的人臉視頻圖像,進行分幀,獲取人臉連續(xù)幀圖像,對所 述人臉連續(xù)幀圖像進行人臉識別,對獲得的人臉識別進行分數(shù)融合,得到人臉識別打分; 判決模塊,用于根據(jù)所述聲紋識別打分和人臉識別打分,獲得使用者身份認證的判決 得分; 第二判斷模塊,用于若所述判決得分大于第二設定閾值,則使用者身份認證成功; 若所述判決得分小于第二設定閾值,則使用者身份認證失敗。10. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,還包括:使用視頻圖像采集器獲取使用 者視頻信號,使用語音采集器獲取使用者的語音信號。
【專利摘要】本申請?zhí)峁┝艘环N基于聲紋識別、人臉識別以及活體檢測的身份認證方法和系統(tǒng),包括:獲取使用者的語音信號和視頻信號;對所述語音信號和視頻信號進行活體檢測,獲得活體檢測結(jié)果;若所述活體檢測結(jié)果大于第一設定閾值,則對獲取使用者的語音信號和視頻信號進行聲紋識別和人臉識別,若聲紋識別和人臉識別全部通過,則身份認證通過,否則身份認證失敗,通過對獲取的語音信號和視頻信號進行活體檢測、聲紋識別和人臉識別,從而極大的阻止了非法用戶的闖入,通過對使用者的語音信號和視頻信號進行多重檢測,從而解決了現(xiàn)有技術(shù)單一生物特征識別技術(shù)的不足,進而提高了身份認證的準確性、安全性和可靠性。
【IPC分類】G06F21/32
【公開號】CN105426723
【申請?zhí)枴緾N201510811908
【發(fā)明人】鄭方, 李藍天, 鄔曉鈞, 王剛, 陳柳村, 瞿世才, 劉樂, 王小鋼, 郝明濤
【申請人】北京得意音通技術(shù)有限責任公司, 清華大學
【公開日】2016年3月23日
【申請日】2015年11月20日