專利名稱:一種基于話者聲紋的無可信第三方公鑰認(rèn)證方法
技術(shù)領(lǐng)域:
本發(fā)明屬于網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,具體涉及一種基于話者聲紋的無可信第三方公鑰 認(rèn)證方法,其能夠為網(wǎng)絡(luò)即時通話的雙方在事先沒有約定密鑰的情況下,方便且安全地開 啟一段加密會話提供技術(shù)支撐。
背景技術(shù):
公鑰密碼體制廣泛應(yīng)用于網(wǎng)絡(luò)加密通信的各個領(lǐng)域?,F(xiàn)有的公鑰密碼體制有三種 模式基于證書的、基于身份的和自認(rèn)證的,這三種模式都需要一個可信第三方的存在?;?于證書的模式以公鑰基礎(chǔ)設(shè)施PKI為基礎(chǔ),公鑰證書需要一個可信的證書頒發(fā)機構(gòu)(CA)給 予頒發(fā),使用者向CA求證證書的可靠性?;谏矸莸哪J街苯右杂脩舻纳矸菪畔⒆鳛槠涔?鑰,無需證書頒發(fā)機構(gòu)頒發(fā)公鑰,但需要一個可信的密鑰托管機構(gòu)托管私鑰。自認(rèn)證模式由 用戶自己產(chǎn)生或者和CA共同產(chǎn)生私鑰,CA不再知道用戶私鑰,不存在密鑰托管問題,但用 戶的可自認(rèn)證公鑰需要用戶和CA共同產(chǎn)生,即依然需要一個可信第三方的參與?,F(xiàn)實的網(wǎng)絡(luò)通信環(huán)境中,會出現(xiàn)通信雙方想即時地進行加密通信,但不想牽涉到 第三方的情況。此時,現(xiàn)有的公鑰密碼體制難以實現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明針對網(wǎng)絡(luò)加密通信中的一類需求,提出了一種基于話者聲紋的無可信第三 方公鑰認(rèn)證方法,該方法在加密通信過程中無需可信第三方參與,通信雙方直接通過語音 通話傳遞并認(rèn)證公鑰信息,在話者聲紋不能被實時偽造的假設(shè)下,該方法可以防止中間人 攻擊,其安全性高(與基于證書的公鑰密碼模式相當(dāng)),具體步驟如下第一步,通信雙方確定話音通道,要求能對話音通道輸入輸出的語音流進行數(shù)字 信號處理;第二步,通信雙方開啟語音通話,在對話過程中,收集對方的語音信息并訓(xùn)練對方 的話者聲紋的GMM模型(高斯混合模型);第三步,通信雙方各自獨立生成公私鑰對,保留私鑰,交換公鑰;以下步驟通信雙方的操作是對稱的,為了方便敘述,只敘述一方的操作過程,敘述 中將發(fā)送公鑰的一方稱為公鑰發(fā)送方,另一方稱為公鑰接收方第四步,公鑰發(fā)送方通過語音直接向接收方述說公鑰;第五步,公鑰接收方用第二步生成的有關(guān)公鑰發(fā)送方的話者GMM模型對述說公鑰 的語音流進行聲紋識別,判斷該語音流是否是發(fā)送方本人所述;若是,則進行第六步,若否, 則拒絕本次公鑰;第六步,公鑰接收方提取通話語音中的公鑰,并生成一段隨機數(shù)及其摘要(隨機 數(shù)摘要由通用HASH算法生成,如MD5、SHA1等,MD5、SHA1等通用HASH算法在本技術(shù)領(lǐng)域內(nèi) 是通用算法,不再詳述),用公鑰對隨機數(shù)及其摘要加密后發(fā)送給公鑰發(fā)送方;第七步,公鑰發(fā)送方收到隨機數(shù)及其摘要密文后,用本方私鑰解密并驗證摘要值,若正確則用本方私鑰對隨機數(shù)及其摘要加密,并發(fā)送給接收方;接收方收到該段密文后,用 第六步提取到的公鑰解密并驗證隨機數(shù)及其摘要值,通過則公鑰認(rèn)證成功,未通過則公鑰 認(rèn)證失敗。本發(fā)明取話者語音的GMM模型表征話者語音所含有的獨特生物測定學(xué)特征,如果 攻擊者要偽造公鑰,它需要替換話者述說公鑰的話音流,而替換后的話音流必須能通過聲 紋檢測,這就要求攻擊者不僅能實時偽造話音流,還要能實時偽造符合話者獨特生物測定 學(xué)特征的話音流。這在現(xiàn)有技術(shù)條件下難以實現(xiàn)。
圖1為基于話者聲紋的公鑰認(rèn)證示意圖。圖2為話者聲紋的GMM模型建立流程圖。圖3為話者聲紋識別流程圖。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進一步說明。在網(wǎng)絡(luò)環(huán)境中傳遞公鑰需要解決的一個重要問題就是怎樣使公鑰接收方確認(rèn)公 鑰和擁有此公鑰的私鑰用戶之間的對應(yīng)關(guān)系。在本發(fā)明中,這一對應(yīng)關(guān)系的確認(rèn)是通過將 公鑰與話者語音所含有的獨特生物測定學(xué)特征綁定在一起,從而確認(rèn)公鑰是話者所發(fā),即 確認(rèn)了公鑰和擁有此公鑰的私鑰用戶之間的對應(yīng)關(guān)系,參見圖1。本發(fā)明基于話者聲紋的無 可信第三方公鑰認(rèn)證方法按如下步驟第一步,通信雙方確定話音通道,要求能對話音通道輸入輸出的語音流進行數(shù)字
信號處理。第二步,通信雙方開啟語音通話,在對話過程中,收集對方的語音信息并訓(xùn)練對方 的話者聲紋的GMM模型(高斯混合模型)。話者的聲紋模型訓(xùn)練過程分3步1、對輸入的語音序列(PCM碼流)進行去除靜默信號及分幀處理;2、提取每一幀語音信號的MFCC參數(shù)(梅爾倒譜系數(shù))并保存;3、用第2步提取的MFCC參數(shù)訓(xùn)練話者的GMM(高斯混合模型),得到專屬某話者的 GMM聲紋模型。如輸入的語音序列不是PCM碼流,則先解碼為PCM碼流再進行處理。以256個采 樣點為一個音框單位,以128為音框之間的重疊單位,對輸入語音流進行分幀。計算并保存所有各幀語音信號的MFCC參數(shù),每幀語音信號產(chǎn)生20個MFCC參數(shù)。GMM模型計算流程如圖2所示,涉及的主要公式為
M(1) p(x\X) = Y,Plbl(x),(1)
i=\f為D維隨機矢量,與r []對應(yīng)-M交V = 1,...,似是M組D維高斯概率密度函數(shù);Pi,
M
i = 1,...,M是M組高斯向量的混合數(shù),;E凡=1
廣1o(2) D維高斯概率密度函數(shù)公式
4
b炳
-exp^--(x.-//.)'(XT1 )(a)
(3)話者GMM模型參數(shù)組A = {Pi, Ui, E J, i = 1, . . . ,MGMM模型訓(xùn)練的目的即得到特定話者的GMM參數(shù)組\ = {Pi, u,, E J , i = 1,...,
Mo步驟為1)、讀入訓(xùn)練語音的MFCC參數(shù)序列,即Xi[]=巧□,i = 1, ,T ;T =訓(xùn)練語音 的總幀數(shù)。?入設(shè)定起始參數(shù)值汍^氕,.,‘!^ },/ = !,3)、用期望值最大化算法(簡稱EM),迭代計算i = {A,H_ },/ = 1,...,似,直至
|i-/l||<s,算法停止。得到的\即為特定話者GMM參數(shù)組。步驟2)具體算法為
— 1P0l = ■M .
由k-均值算法獲取;用以訓(xùn)練k-均值的向量數(shù)量為1.. T ;20/ =
CTi
為協(xié)方差矩陣,i = 1,…,M,D是MFCC參數(shù)矢量維度=20,為計算方便,假設(shè)其為對角陣。 a0l =
I
,JC t
2
_2
‘戸L為廠”
,CT
2、的一組矢量,共M組C
X“‘ ^。,.朱廣iDTi為經(jīng)k_均值算法后歸于uM組的訓(xùn)練語音幀。步驟3)具體算法為a)準(zhǔn)備好T個訓(xùn)練向量,記為義={馬,..+乂}b)計算事后概率戶(叫式,義)= Pl ’)
代后獲得的GMM參數(shù)組。
1 T
權(quán)利要求
一種基于話者聲紋的無可信第三方公鑰認(rèn)證方法,其特征是按如下步驟第一步,通信雙方確定話音通道,能對話音通道輸入輸出的語音流進行數(shù)字信號處理;第二步,通信雙方開啟語音通話,在對話過程中,收集對方的語音信息并訓(xùn)練對方的話者聲紋的GMM模型;第三步,通信雙方各自獨立生成公私鑰對,保留私鑰,交換公鑰;以下步驟通信雙方的操作是對稱的,只敘述一方的操作過程,發(fā)送公鑰的一方稱為公鑰發(fā)送方,另一方稱為公鑰接收方第四步,公鑰發(fā)送方通過語音直接向接收方述說公鑰;第五步,公鑰接收方用第二步生成的有關(guān)公鑰發(fā)送方的話者GMM模型對述說公鑰的語音流進行聲紋識別,判斷該語音流是否是發(fā)送方本人所述;若是,則進行第六步,若否,則拒絕本次公鑰;第六步,公鑰接收方提取通話語音中的公鑰,并生成一段隨機數(shù)及其摘要用公鑰加密后發(fā)送給公鑰發(fā)送端;第七步,公鑰發(fā)送方收到隨機數(shù)后,用私鑰對隨機數(shù)及其摘要加密,并發(fā)送給接收方;接收方收到該段密文后,用第六步提取到的公鑰解密并驗證,通過則公鑰認(rèn)證成功,未通過則公鑰認(rèn)證失敗。
2.如權(quán)利要求1所述的基于話者聲紋的無可信第三方公鑰認(rèn)證方法,其特征是所述 的第二步中話者的聲紋模型訓(xùn)練過程分3步(1)對輸入的語音序列進行去除靜默信號及分幀處理,語音序列是PCM碼流;(2)提取每一幀語音信號的MFCC參數(shù)并保存;(3)用第2步提取的MFCC參數(shù)訓(xùn)練話者的GMM模型,得到專屬話者的GMM聲紋模型。
3.如權(quán)利要求2所述的基于話者聲紋的無可信第三方公鑰認(rèn)證方法,其特征是所述 的第(1)步中若輸入的語音序列不是PCM碼流,則先解碼為PCM碼流再進行處理;以256 個采樣點為一個音框單位,以128為音框之間的重疊單位,對輸入語音流進行分幀。
4.如權(quán)利要求2所述的基于話者聲紋的無可信第三方公鑰認(rèn)證方法,其特征是所述 的第(2)步中計算并保存所有各幀語音信號的MFCC參數(shù),每幀語音信號產(chǎn)生20個MFCC 參數(shù)。
全文摘要
本發(fā)明公開基于話者聲紋的無可信第三方公鑰認(rèn)證方法,其步驟1.雙方確定話音通道;2.雙方開啟語音通話,建立對方話者聲紋的GMM模型;3.雙方各生成公私鑰對;以下雙方是對稱的;4.公鑰發(fā)送方通過語音向接收方述說公鑰;5.公鑰接收方用話者GMM模型對述說公鑰的語音流進行聲紋識別,判斷是否是發(fā)送方;若是,進行第6步,若否,拒絕;6.公鑰接收方提取通話語音的公鑰,并生成隨機數(shù)用公鑰加密后發(fā)給公鑰發(fā)送端;7.公鑰發(fā)送方收到隨機數(shù)后,用私鑰加密,并發(fā)送給接收方;接收方收到后,用第6步的公鑰解密并驗證,通過則公鑰認(rèn)證成功,未通過則失敗。本發(fā)明無需第三方參與,使用方便靈活,通信雙方直接通過語音通話傳遞并認(rèn)證公鑰,有效防止他人攻擊。
文檔編號H04L9/30GK101938489SQ20101028301
公開日2011年1月5日 申請日期2010年9月14日 優(yōu)先權(quán)日2010年9月14日
發(fā)明者吳震東 申請人:杭州電子科技大學(xué)