專利名稱:隨機(jī)式聲紋密碼驗(yàn)證系統(tǒng)、隨機(jī)式聲紋密碼鎖及其產(chǎn)生方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種隨機(jī)式聲紋驗(yàn)證系統(tǒng)、隨機(jī)式聲紋密碼鎖及其產(chǎn)生方 法,特別是關(guān)于利用數(shù)個(gè)聲紋特征單元隨機(jī)組合形成一個(gè)或多個(gè)參考聲紋密 碼組,通過選擇任一個(gè)或多個(gè)參考聲紋密碼組構(gòu)成隨機(jī)式聲紋密碼鎖,以便 執(zhí)行一聲紋驗(yàn)證作業(yè)的隨機(jī)式聲紋驗(yàn)證系統(tǒng),及該隨機(jī)式聲紋驗(yàn)證系統(tǒng)提供 聲紋密碼鎖及其產(chǎn)生方法。
背景技術(shù):
在辨識(shí)技術(shù)上,目前可供辨識(shí)的生物特征包含臉孔辨識(shí)、指紋辨識(shí)、掌紋辨
識(shí)、聲紋辨識(shí)、目艮球虹膜辨識(shí)及脫氧核糖核酸(DNA)排序配對(duì)辨識(shí)等。
一般針對(duì)電子數(shù)據(jù)安全保護(hù)、金融交易安全及保全系統(tǒng)只使用個(gè)人密碼 加以保護(hù),但單純的個(gè)人密碼無法提供有效的安全保護(hù),例如密碼外泄或破 解等。因此,電子數(shù)據(jù)安全保護(hù)、金融交易安全及保全系統(tǒng)必須尋求其它保 護(hù)措施,通過強(qiáng)化個(gè)人身分辨識(shí)的功能,以提升電子數(shù)據(jù)安全、金融交易安 全及保全系統(tǒng)。若基于考量辨識(shí)技術(shù)的架構(gòu)成本及實(shí)際操作時(shí),可發(fā)現(xiàn)聲紋 辨識(shí)相對(duì)較適合被選擇做為個(gè)人身分辨識(shí)的用途。
舉例而言,現(xiàn)有聲紋驗(yàn)證方法,如中國臺(tái)灣專利公告第490655號(hào)、發(fā)明 名稱為"利用聲譜信息辯識(shí)使用者的方法與其裝置"的發(fā)明專利,其利用不 同使用者特有的聲譜信息辨識(shí)使用者的身份,以決定使用者是否經(jīng)過授權(quán)。該 方法包含步驟(1)使用者發(fā)出語音后,檢測(cè)語音的終點(diǎn);(2)從該語音的 聲譜中取出語音特征;(3)決定是否需要訓(xùn)練,若是,則將該語音特征作為 一參考樣本,同時(shí)設(shè)定一界限;若否,則進(jìn)行下一步驟;(4)將該語音特征
與參考樣本進(jìn)行圖樣對(duì)比;(5)依對(duì)比結(jié)果計(jì)算兩者之間距的距離;(6)
將計(jì)算結(jié)果與設(shè)定界限比較;(7)依比較結(jié)果決定該使用者是否為一授權(quán)使
用者。該方法使用于行動(dòng)電話,其利用聲譜分析方法將語音的獨(dú)特信息取出,
由此進(jìn)行辨識(shí)使用者的方法。該第490655號(hào)專利主要利用每一時(shí)框(frame) 的主要值與使用者設(shè)定的界限進(jìn)行比較,決定語音的始點(diǎn)與終點(diǎn)后,再利用 Princen-Bradley濾波器轉(zhuǎn)換已檢測(cè)的語音信號(hào),以便取得其對(duì)應(yīng)聲譜圖案。 該聲譜圖案與預(yù)先儲(chǔ)存的參考聲譜樣本進(jìn)行對(duì)比,以辨識(shí)使用者的聲紋。
簡(jiǎn)言之,第490655號(hào)專利需要進(jìn)行圖案的匹配及距離的運(yùn)算,若該運(yùn)算 距離未超過界限時(shí),使用者即可通過聲紋辨識(shí)。然而,第490655號(hào)專利在進(jìn) 行圖案的匹配及距離的運(yùn)算時(shí),必須計(jì)算在參考樣本及測(cè)試樣本之間的距離。 事實(shí)上,第490655號(hào)專利僅設(shè)定單一參考樣本,因此其可能遭受非法破解, 例如播放非法預(yù)錄聲紋數(shù)據(jù)。
因此,第490655號(hào)專利仍有必要進(jìn)一步改良其單一參考樣本的問題,如 此才能在聲紋驗(yàn)證作業(yè)上避免遭受非法破解,強(qiáng)化聲紋驗(yàn)證作業(yè)的安全機(jī)制。
有鑒于此,本發(fā)明為了改良上述缺點(diǎn),在一隨機(jī)式聲紋驗(yàn)證系統(tǒng)內(nèi)利用 數(shù)個(gè)聲紋特征單元隨機(jī)組合形成一個(gè)或多個(gè)參考聲紋密碼組,通過選擇任一 個(gè)或多個(gè)參考聲紋密碼組設(shè)定隨機(jī)式聲紋密碼鎖,以便執(zhí)行一聲紋驗(yàn)證作業(yè), 以提供聲紋驗(yàn)證作業(yè)的安全機(jī)制。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種隨機(jī)式聲紋驗(yàn)證系統(tǒng)、隨機(jī)式聲紋密碼 鎖及其產(chǎn)生方法,其在隨機(jī)式聲紋驗(yàn)證系統(tǒng)內(nèi)利用數(shù)個(gè)聲紋特征單元隨機(jī)組 合形成至少一個(gè)參考聲紋密碼組,通過該參考聲紋密碼組構(gòu)成隨機(jī)式聲紋密 碼鎖,以便進(jìn)行一聲紋驗(yàn)證作業(yè),使本發(fā)明具有提升聲紋驗(yàn)證可靠度的功效。
本發(fā)明的另一目的在于提供一種隨機(jī)式聲紋驗(yàn)證系統(tǒng)、隨機(jī)式聲紋密碼 鎖及其產(chǎn)生方法,其在隨機(jī)式聲紋驗(yàn)證系統(tǒng)內(nèi)利用數(shù)個(gè)聲紋特征單元隨機(jī)組
合形成多個(gè)參考聲紋密碼組,通過多個(gè)參考聲紋密碼組構(gòu)成隨才幾式聲紋密碼 鎖,以便執(zhí)行一聲紋驗(yàn)證作業(yè),使本發(fā)明具有提升聲紋驗(yàn)證可靠度的功效。
根據(jù)本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng)包含一訓(xùn)練系統(tǒng)、 一隨機(jī)密碼產(chǎn)生器 及一測(cè)試系統(tǒng),以便對(duì)原始輸入語音數(shù)據(jù)進(jìn)行訓(xùn)練或測(cè)試作業(yè)。在訓(xùn)練語音 上,所述訓(xùn)練系統(tǒng)從原始輸入語音數(shù)據(jù)獲得一指定聲紋特征模型參數(shù)組,并 從指定聲紋特征模型參數(shù)組取得數(shù)個(gè)聲紋特征單元,通過一個(gè)或多個(gè)該聲紋 特征單元組合形成至少一個(gè)參考聲紋密碼組,以供該測(cè)試系統(tǒng)執(zhí)行語音測(cè)試 作業(yè)。在執(zhí)行測(cè)試語音上,所述隨機(jī)密碼產(chǎn)生器從指定聲紋特征模型參數(shù)組 的聲紋特征單元隨機(jī)產(chǎn)生至少 一個(gè)參考聲紋密碼組,以形成一隨機(jī)式聲紋密 碼鎖。在進(jìn)行解鎖作業(yè)上,所述測(cè)試系統(tǒng)所需要的測(cè)試語音數(shù)據(jù)必須對(duì)應(yīng)于 參考聲紋密碼組,以便完成語音測(cè)試作業(yè)。
所述隨機(jī)式聲紋驗(yàn)證系統(tǒng)還包含一前端處理部及一特征擷取部。在執(zhí)行 訓(xùn)練語音上,所述訓(xùn)練系統(tǒng)利用前端處理部從原始輸入語音數(shù)據(jù)擷取有效訓(xùn)
練語音信息;再利用所述特征擷取部進(jìn)行擷取所述有效訓(xùn)練語音特征;再進(jìn) 行運(yùn)算有效訓(xùn)練語音信息以獲得最相似路徑,以便作為指定聲紋特征模型參 數(shù)組。在執(zhí)行測(cè)試語音上,所述測(cè)試系統(tǒng)利用前端處理部從原始輸入語音數(shù)
據(jù)擷取有效測(cè)試語音信息;再利用特征擷取部進(jìn)行擷取有效測(cè)試語音特征;
再進(jìn)行運(yùn)算測(cè)試語音特征與模型參數(shù)之間相似機(jī)率以便輸出 一辨識(shí)結(jié)果。
根據(jù)本發(fā)明的隨機(jī)式聲紋密碼鎖,其包含數(shù)個(gè)聲紋特征單元,利用該聲 紋特征單元隨機(jī)組合形成一個(gè)或多個(gè)參考聲紋密碼組,通過一個(gè)或多個(gè)參考
聲紋密碼組設(shè)定隨機(jī)式聲紋密碼鎖。在進(jìn)行解鎖作業(yè)上,該隨機(jī)式聲紋密碼 鎖所需要的測(cè)試語音數(shù)據(jù)必須對(duì)應(yīng)于參考聲紋密碼組,以便完成語音測(cè)試作 業(yè)。
從所述原始輸入語音數(shù)據(jù)產(chǎn)生一個(gè)指定聲紋特征模型參數(shù)組,所述聲紋 特征單元從所述指定聲紋特征模型參數(shù)組取得。
本發(fā)明隨機(jī)式聲紋密碼鎖產(chǎn)生方法,其包含步驟輸入一原始輸入語音
數(shù)據(jù);從原始輸入語音數(shù)據(jù)取得一指定聲紋特征才莫型參數(shù)組;從指定聲紋特 征模型參數(shù)組取得數(shù)個(gè)聲紋特征單元;通過一個(gè)或多個(gè)聲紋特征單元組合形 成至少 一 個(gè)參考聲紋密碼組,以提供隨機(jī)式聲紋密碼鎖。
根據(jù)該方法,還包含步驟從所述原始輸入語音數(shù)據(jù)取得一個(gè)指定聲紋 特征模型參數(shù)組,這樣,從所述指定聲紋特征模型參數(shù)組取得所述聲紋特征 單元。
根據(jù)該方法,所迷聲紋特征單元是利用一個(gè)訓(xùn)練系統(tǒng)取得。 根據(jù)該方法,所述參考聲紋密碼組是利用一個(gè)隨機(jī)密碼產(chǎn)生器取得。 本發(fā)明的有益效果在于本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng)具有隨機(jī)密碼產(chǎn) 生器,其隨機(jī)產(chǎn)生一個(gè)或多個(gè)參考聲紋密碼組,即隨機(jī)式聲紋驗(yàn)證系統(tǒng)完成 設(shè)定形成隨機(jī)式聲紋密碼鎖,因而其達(dá)到不易遭受非法破解的效果。
圖1為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋密碼鎖產(chǎn)生方法的流程圖2為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)架構(gòu)的流程方塊圖3A為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)進(jìn)行語音訓(xùn)練作業(yè)的流 程方塊圖3B為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)進(jìn)行語音訓(xùn)練作業(yè)的流 程方塊圖4A為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)利用短時(shí)能結(jié)合越零率 進(jìn)行端點(diǎn)檢測(cè)所獲得的能量及音框關(guān)系圖4B為本發(fā)明圖4A的局部放大圖5A為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)利用熇算法進(jìn)行端點(diǎn)檢 測(cè)所獲得的能量及音框關(guān)系圖5B為本發(fā)明圖5A的局部放大圖6A為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)輸入l0個(gè)語音的能量時(shí)序圖6B為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)對(duì)圖6A所示的輸入語音
利用熵算法進(jìn)行端點(diǎn)檢測(cè)所獲得的能量及音框關(guān)系圖6C為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)利用圖6B所示的端點(diǎn)檢 測(cè)所決定選取音框的音框數(shù)列圖7為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)在截音作業(yè)完成后未重 組及進(jìn)行重組的能量時(shí)序圖8為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的狀態(tài)及音框的關(guān)系示 意圖9為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的音框與狀態(tài)的初始分 配模式示意圖10為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的狀態(tài)轉(zhuǎn)換示意圖11為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的最相似路徑示意圖12為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的均分音框示意圖13為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的第 一次重新分配音框 示意圖14為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的第二次重新分配音框 示意圖15為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的最佳分配音框示意
圖16為本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的隨機(jī)密碼產(chǎn)生器隨機(jī)
產(chǎn)生參考聲紋密碼組的示意圖。
主要組件符號(hào)說明
1、網(wǎng)絡(luò)聲紋數(shù)據(jù)庫 10、訓(xùn)練系統(tǒng) 20、隨機(jī)密碼產(chǎn)生器 30、測(cè)試系統(tǒng)
具體實(shí)施例方式
為了讓本發(fā)明的上述及其它目的、特征、優(yōu)點(diǎn)能更明顯易懂,下文將特 舉本發(fā)明較佳實(shí)施例,并配合所附圖式,作詳細(xì)說明如下。
圖l揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋密碼鎖產(chǎn)生方法的流程圖。本發(fā) 明較佳實(shí)施例的隨機(jī)式聲紋密碼鎖產(chǎn)生方法依序包含三個(gè)主要步驟,其用以 達(dá)成產(chǎn)生一隨機(jī)式聲紋密碼鎖。在一般應(yīng)用上,該隨機(jī)式聲紋密碼鎖產(chǎn)生方 法及其隨機(jī)式聲紋密碼鎖可應(yīng)用于個(gè)人電子數(shù)據(jù)的存取、金融交易的身f分認(rèn) 證及保全系統(tǒng)的辨識(shí)身扮。
請(qǐng)?jiān)賲⒄請(qǐng)D1 ,本發(fā)明的隨機(jī)式聲紋密碼鎖產(chǎn)生方法包含取得原始輸入語 音數(shù)據(jù)(見步驟S1)、產(chǎn)生指定聲紋特征模型參數(shù)組(見步驟S2)及產(chǎn)生隨 機(jī)式聲紋密碼鎖(見步驟S3)。
圖2揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)架構(gòu)的流程方塊圖。請(qǐng) 參照?qǐng)D2,本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)1包含一訓(xùn)練系統(tǒng)10、 一 隨機(jī)密碼產(chǎn)生器20及一測(cè)試系統(tǒng)30,以便對(duì)原始輸入語音數(shù)據(jù)進(jìn)行訓(xùn)練或測(cè) 試作業(yè)。
圖3A揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)進(jìn)行語音訓(xùn)練作業(yè)的 流程方塊圖;圖3B揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)進(jìn)行語音訓(xùn) 練作業(yè)的流程方塊圖。請(qǐng)參照?qǐng)Dl、 3A及3B所示,本發(fā)明的隨機(jī)式聲紋驗(yàn)證系 統(tǒng)1還包含一A/D轉(zhuǎn)換器、 一語音檢測(cè)器、 一前端處理部及一特征擷取部,其 用以執(zhí)行語音訓(xùn)練作業(yè)及語音測(cè)試作業(yè)。本發(fā)明的語音訓(xùn)練或測(cè)試作業(yè)的最 重要步驟是在原始輸入語音數(shù)據(jù)中尋找語音信號(hào)的位置,即尋找其起始點(diǎn) (starting point)及纟冬點(diǎn)(terminal point),其4交4圭采用端點(diǎn)才全觀ll方式 (endpoint detection)尋找該起始點(diǎn)及終點(diǎn)的正確位置。本發(fā)明所采用的 端點(diǎn)#r測(cè)方式包含短時(shí)距能量((Short-Time Energy )、越零率 (Zero—Crossing Rate)及娟算法(Entropy—Based Algorithm) c利用結(jié)合 短時(shí)距能量及越零率針對(duì)原始輸入語音數(shù)據(jù)的能量進(jìn)行端點(diǎn)檢測(cè);另外,再 利用熵算法針對(duì)原始輸入語音數(shù)據(jù)的能量進(jìn)行端點(diǎn)檢測(cè)。接著,通過截音作
業(yè),將原始輸入語音數(shù)據(jù)的靜音(silence)及噪聲(noise)去除,并將截 音完成語音數(shù)據(jù)再進(jìn)行縮小排列,以取得有效語音。
圖4A揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)利用短時(shí)能結(jié)合越零 率進(jìn)行端點(diǎn)檢測(cè)所獲得的能量及音框關(guān)系圖。圖4B揭示本發(fā)明第4A圖的局部 放大圖。請(qǐng)參照?qǐng)D4A和4B所示,利用結(jié)合短時(shí)距能量及越零率針對(duì)原始輸入 語音數(shù)據(jù)進(jìn)行端點(diǎn)檢測(cè)作業(yè),將檢測(cè)結(jié)果繪示一能量及音框關(guān)系圖。從能量 及音框關(guān)系圖可判定為數(shù)個(gè)端點(diǎn)。最后,本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng)可判 定原始輸入語音數(shù)據(jù)的各個(gè)起始點(diǎn)及終點(diǎn)。
圖5A揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)利用熵算法進(jìn)行端點(diǎn) 檢測(cè)所獲得的能量及音框關(guān)系圖。圖5B揭示本發(fā)明圖5A的局部放大圖。請(qǐng)參 照?qǐng)D5A及5B所示,利用熵算法針對(duì)原始輸入語音數(shù)據(jù)進(jìn)行端點(diǎn)檢測(cè)作業(yè),并 自其能量及音框關(guān)系圖同樣獲得數(shù)個(gè)端點(diǎn)。最后,本發(fā)明的隨機(jī)式聲紋驗(yàn)證 系統(tǒng)同樣可判定原始輸入語音數(shù)據(jù)的各個(gè)起始點(diǎn)及終點(diǎn)。
請(qǐng)?jiān)賲⒄請(qǐng)D4B及5B,本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)通過端點(diǎn) 斗企測(cè)避免發(fā)生4昔誤拒絕(false rejection )及4昔誤4妄受(false acceptance ), 以提升辨識(shí)率。簡(jiǎn)言之,本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng)一方面可避免將語音 判定為靜音及噪聲,即避免發(fā)生錯(cuò)誤拒絕;其另一方面可避免將靜音及噪聲 判定為語音,即避免發(fā)生錯(cuò)誤接受。
圖6A揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)輸入l0個(gè)語音的能量 時(shí)序圖。請(qǐng)參照?qǐng)D6A,將0、 1、 2、 3、 4、 5、 6、 7、 8及9的語音依序輸入至 本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng),以便舉例說明如何進(jìn)行端點(diǎn)檢測(cè)作業(yè)。
圖6B揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)對(duì)圖6A所示的輸入語 音利用熵算法進(jìn)行端點(diǎn)檢測(cè)所獲得的能量及音框關(guān)系圖。請(qǐng)參照?qǐng)D6A及6B, 本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng)對(duì)圖6A所示的輸入語音利用熵算法進(jìn)行端點(diǎn)檢 測(cè)。此時(shí),從0、 1、 2、 3、 4、 5、 6、 7、 8及9的輸入語音獲得10個(gè)端點(diǎn)區(qū)域, 其分別代表0、 1、 2、 3、 4、 5、 6、 7、 8及9的個(gè)別語音的起始點(diǎn)及終點(diǎn)。
圖6C揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)利用圖6B所示的端點(diǎn)
檢測(cè)所決定選取音框的音框數(shù)列圖。請(qǐng)參照?qǐng)D6A至6C,本發(fā)明的隨機(jī)式聲紋 驗(yàn)證系統(tǒng)從圖6B所示的個(gè)別語音的起始點(diǎn)及終點(diǎn)決定選取10個(gè)音框區(qū),其分 別代表0、 1、 2、 3、 4、 5、 6、 7、 8及9的個(gè)別語音的音框區(qū),以便進(jìn)行截音 作業(yè)及進(jìn)行重組作業(yè)。
圖7揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)在完成截音作業(yè)后未 重組及進(jìn)行重組的能量時(shí)序圖。請(qǐng)參照?qǐng)D7,在完成截音作業(yè)后,對(duì)每個(gè)音框 取能量特征值。接著,將每個(gè)音框取能量特征值進(jìn)行重組作業(yè)。本發(fā)明的隨 機(jī)式聲紋驗(yàn)證系統(tǒng)可利用該完成重組的能量特征值進(jìn)行聲紋驗(yàn)證。
請(qǐng)?jiān)賲⒄請(qǐng)D2,使用者進(jìn)入本發(fā)明的隨機(jī)式聲紋驗(yàn)證系統(tǒng)l時(shí),首先必須 輸入帳號(hào),以便進(jìn)行確認(rèn)身分。接著,該系統(tǒng)依輸入帳號(hào)查詢數(shù)據(jù)庫,是否 輸入帳號(hào)屬于已建立。若輸入帳號(hào)未建立時(shí),進(jìn)入訓(xùn)練系統(tǒng)10進(jìn)行語音訓(xùn)練 作業(yè),以便建立及儲(chǔ)存該輸入帳號(hào)的語音數(shù)據(jù)。若該輸入帳號(hào)已建立時(shí),進(jìn) 入測(cè)試系統(tǒng)30進(jìn)行語音測(cè)試作業(yè),以便辨識(shí)輸入帳號(hào)的語音特征是否符合已 儲(chǔ)存該輸入帳號(hào)的語音數(shù)據(jù);此時(shí),該隨機(jī)密碼產(chǎn)生器20即可隨機(jī)產(chǎn)生一個(gè) 或多個(gè)參考聲紋密碼組,即隨機(jī)式聲紋驗(yàn)證系統(tǒng)l完成設(shè)定形成一隨機(jī)式聲紋 密碼鎖,以供測(cè)試系統(tǒng)3O進(jìn)行語音測(cè)試作業(yè)。
請(qǐng)?jiān)賲⒄請(qǐng)D1及3A,首先,本發(fā)明的隨機(jī)式聲紋密碼鎖產(chǎn)生方法執(zhí)行取得 原始輸入語音數(shù)據(jù)(見步驟S1),其通過初步執(zhí)行語音訓(xùn)練作業(yè)的前段方式 達(dá)成。因此,使用者直接輸入聲音至語音檢測(cè)器,即可完成執(zhí)行取得原始輸 入語音數(shù)據(jù)(步驟S1),如圖3A所示。 一旦完成步驟l的取得原始輸入語音數(shù) 據(jù)時(shí),原始輸入語音數(shù)據(jù)可供執(zhí)行下個(gè)步驟。
請(qǐng)?jiān)賲⒄請(qǐng)D1及3A,接著,本發(fā)明的隨機(jī)式聲紋密碼鎖產(chǎn)生方法執(zhí)行產(chǎn)生 指定聲紋特征模型參數(shù)組(見步驟S"。在執(zhí)行步驟S2的產(chǎn)生指定聲紋特征 模型參數(shù)組后,將該指定聲紋特征模型參數(shù)組儲(chǔ)存在隨機(jī)式聲紋驗(yàn)證系統(tǒng)l 內(nèi)。 一旦完成步驟S卩的產(chǎn)生指定聲紋特征模型參數(shù)組時(shí),該指定聲紋特征模型參數(shù)組可供執(zhí)行下個(gè)步驟。
請(qǐng)?jiān)賲⒄請(qǐng)D2及3A,為了進(jìn)行語音訓(xùn)練作業(yè),隨機(jī)式聲紋驗(yàn)證系統(tǒng)l指定
使用者的原始輸入語音數(shù)據(jù)必需對(duì)應(yīng)于一特定語音序列,例如0、 1、 2、 3、 4、 5、 6、 7、 8、 9、 A、 B、 C、 D、 E、 F、 G、 H、 I、 J、 K…等。如此,訓(xùn)練系統(tǒng) IO可產(chǎn)生一指定聲紋特征模型參數(shù)組,其包含數(shù)個(gè)聲紋特征單元。舉例而言, 數(shù)個(gè)聲紋特征單元逐一對(duì)應(yīng)于O、 1、 2、 3、 4、 5、 6、 7、 8、 9、 A、 B、 C、 D、 E、 F、 G、 H、 I、 J、 K…等。為了進(jìn)行語音測(cè)試作業(yè),隨機(jī)式聲紋驗(yàn)證系統(tǒng)l 的隨機(jī)密碼產(chǎn)生器20從指定聲紋特征模型參數(shù)組隨機(jī)產(chǎn)生至少一個(gè)參考聲紋 密碼組。接著,依據(jù)隨機(jī)密碼產(chǎn)生器20所選擇的參考聲紋密碼組進(jìn)行語音測(cè) 試作業(yè)。
請(qǐng)?jiān)賲⒄請(qǐng)D3A,在擷取語音特征之前,利用前端處理部將有效語音信息 從原始輸入語音數(shù)據(jù)擷取,以濾除無效語音信息。本發(fā)明所采用的端點(diǎn)檢測(cè) 方式包含短時(shí)距能量及越零率。舉例而言,本發(fā)明采用結(jié)合高斯機(jī)率分布的 計(jì)算方法,其方程式如下
其中;為原始信號(hào)將其分為數(shù)個(gè)D維的音框、i = i,…,M,為所屬
機(jī)率、"'為背景噪聲的期望值及^'為背景噪聲的變異數(shù)。在此,因?yàn)?^)'中 的D-256為一個(gè)定值,故將其省略不予計(jì)算,將方程式(l)簡(jiǎn)化如下
上式中的指數(shù)運(yùn)算,在運(yùn)算數(shù)據(jù)上有可能過大,故將其取對(duì)數(shù)后,將方 程式(2)簡(jiǎn)化如下<formula>complex formula see original document page 13</formula>
擷取原輸入語音數(shù)據(jù)前端256點(diǎn),計(jì)算短時(shí)距能量及越零率的期望值及變 異數(shù),接著將該兩個(gè)數(shù)及原輸入語音數(shù)據(jù)代入方程式(3)進(jìn)行運(yùn)算。利用短時(shí) 距能量與越零率的分布機(jī)率區(qū)分有效語音信息及無效語音信息,將無效語音 信息加以濾除,不但減少數(shù)據(jù)量,也能正確擷取有效語音信息。
另外,舉例而言,在特征擷取部進(jìn)行擷取特征上,本發(fā)明采用兩個(gè)語音
曰
識(shí)別特征參數(shù),其包含線性預(yù)測(cè)倒頻譜系數(shù)(Linear Prediction Cepstr咖 Coefficient, LPCC)及才每爾頻標(biāo)倒頻i普參凄丈(Mel Frequency Cepstrum Coefficient, MFCC )兩者各12個(gè)倒頻譜參數(shù)(cepstral coef f icients)及12 個(gè)一階倒頻譜參數(shù)(delta-cepstral coefficients)。將倒頻譜參數(shù)Cn對(duì)時(shí)間 做偏微分
<formula>complex formula see original document page 13</formula>
K為考慮音框數(shù)。
因?yàn)橐浑A倒頻譜參數(shù)的公式(4)過于復(fù)雜,故將其加以簡(jiǎn)化,下列各式為 僅考慮前后各兩個(gè)時(shí)框時(shí),方程式簡(jiǎn)化如下
<formula>complex formula see original document page 13</formula><formula>complex formula see original document page 14</formula>
方程式(5)至(9)中,Cn為n階特征值,L為信號(hào)中時(shí)框總數(shù),i為時(shí)框編號(hào)。 圖4揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的狀態(tài)及音框的關(guān)系 示意圖。
在訓(xùn)練語音上,語音具有所謂「狀態(tài)」的觀念,狀態(tài)是發(fā)音時(shí)嘴型以及 聲道的變化。 一般而言,每一次說話嘴型一定有變化,故每一個(gè)狀態(tài)都是一 個(gè)語音變化的特征表現(xiàn)。有時(shí)一個(gè)單音卻有可能含有多個(gè)狀態(tài)。 一個(gè)狀態(tài)并 不像音框一樣具有固定尺寸,通常一個(gè)狀態(tài)包含數(shù)個(gè)或數(shù)十個(gè)音框。
請(qǐng)參照?qǐng)D8,第一狀態(tài)包含三個(gè)音框、第二狀態(tài)包含六個(gè)音框及第三狀態(tài) 包含四個(gè)音框。
圖9揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的音框與狀態(tài)的初始 分配模式示意圖。該初始分配模式舉例三個(gè)樣本語音進(jìn)行均分動(dòng)作。
在初始模式將語音作均分動(dòng)作,在均分后可能無法整除,多余音框則將 其平分在第一個(gè)及最后一個(gè)狀態(tài)。請(qǐng)?jiān)賲⒄請(qǐng)D9,在分配模式中,樣本語音均 分必須考慮三點(diǎn)1、第一個(gè)音框一定屬于第一個(gè)狀態(tài);2、最后一個(gè)音框一 定屬于最后一個(gè)狀態(tài);3、音框的狀態(tài)變化,只有不變或變化至下一個(gè)。采用 高斯分配機(jī)率計(jì)算每個(gè)音框?qū)儆诿總€(gè)狀態(tài)的機(jī)率,并且利用維特比算法獲得 最相似路徑。
圖10揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的狀態(tài)轉(zhuǎn)換示意圖。 參照?qǐng)DIO,在三個(gè)狀態(tài)時(shí),L個(gè)音框可能狀態(tài)轉(zhuǎn)換的方向。將打叉音框視 為不可能屬于的狀態(tài),箭頭的方向視為可能狀態(tài)變化路徑。
圖11揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的最相似路徑示意圖。
請(qǐng)參照?qǐng)Dll,擷取特征的最相似路徑具有第一狀態(tài)包含第1至3音框、第 二狀態(tài)包含第4至5音框及第三狀態(tài)包含第7至10音框。
圖12揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的均分音框示意圖。
請(qǐng)參照?qǐng)D12,三個(gè)樣本語音在三個(gè)狀態(tài)的初始模式,其采均分后的分布。 第一樣本語音的每個(gè)樣本語音均分三個(gè)音框后,剩余兩個(gè)音框分別分配置第
一狀態(tài)及第二狀態(tài)。第二樣本語音的每個(gè)樣本語音均分四個(gè)音框。第三樣本 語音的每個(gè)樣本語音均分三個(gè)音框后,剩余一個(gè)音框分別分配置第一狀態(tài)。
在計(jì)算后,其最大相似機(jī)率為2156。
圖13揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的第 一次重新分配音 框示意圖。
請(qǐng)參照?qǐng)D13,在第一次重新分配音框后,其最大相似機(jī)率上升至3171。
圖14揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的第二次重新分配音 框示意圖。
請(qǐng)參照?qǐng)D14所示,在第二次重新分配音框后,其最大相似機(jī)率上升至 3571。
圖15揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的最佳分配音框示意圖。
請(qǐng)參照?qǐng)D15,在多次重新分配音框后,其最大相似機(jī)率3571不再上升, 因此其視為最佳分配音框。計(jì)算各狀態(tài)的期望值及變異數(shù)作為模型參數(shù),該 模型參數(shù)可供儲(chǔ)存在數(shù)據(jù)庫。
請(qǐng)?jiān)賲⒄請(qǐng)D2,在進(jìn)入訓(xùn)練系統(tǒng)10進(jìn)行語音訓(xùn)練作業(yè)時(shí),運(yùn)算方程式(l) 至(9)獲得有效訓(xùn)練語音特征。接著利用維特比算法獲得最相似路徑。接著計(jì) 算各狀態(tài)的期望值及變異數(shù)作為 一指定聲紋特征模型參數(shù)組,即完成語音訓(xùn) 練作業(yè)。在語音訓(xùn)練上,其最大相似機(jī)率小于一預(yù)定參考值時(shí),無法通過語 音訓(xùn)練且結(jié)束訓(xùn)練作業(yè),因而必須重新操作隨機(jī)式聲紋驗(yàn)證系統(tǒng)l;反之,其 最大相似機(jī)率大于該預(yù)定參考值時(shí),視其通過語音訓(xùn)練,因而將指定聲紋特 征模型參數(shù)組儲(chǔ)存在隨機(jī)式聲紋驗(yàn)證系統(tǒng)l。
請(qǐng)?jiān)賲⒄請(qǐng)D1及3A,接著,本發(fā)明的隨機(jī)式聲紋密碼鎖產(chǎn)生方法執(zhí)行產(chǎn)生
隨才幾式聲纟丈密碼鎖(見步駛《S3)。在產(chǎn)生隨4幾式聲紋密碼鎖的步-腺S3上,隨才幾
密碼產(chǎn)生器2 0從指定聲紋特征模型參數(shù)組隨機(jī)產(chǎn)生一個(gè)或多個(gè)參考聲紋密碼 組,即隨機(jī)式聲紋驗(yàn)證系統(tǒng)l完成設(shè)定形成隨機(jī)式聲紋密碼鎖。 一旦完成步驟 S 3的產(chǎn)生隨機(jī)式聲紋密碼鎖時(shí),隨機(jī)式聲紋密碼鎖可供測(cè)試系統(tǒng)30進(jìn)行語音 測(cè)試作業(yè),如圖2所示。
圖16揭示本發(fā)明較佳實(shí)施例的隨機(jī)式聲紋驗(yàn)證系統(tǒng)的隨機(jī)密碼產(chǎn)生器隨 機(jī)產(chǎn)生參考聲紋密碼組的示意圖。請(qǐng)參照?qǐng)D16,舉例而言,隨機(jī)密碼產(chǎn)生器 20可產(chǎn)生四個(gè)字段的參考聲紋密碼組。字段A的參考聲紋密碼組包含1279、 2385、 A1B2、 9F5U…等;字段B的參考聲紋密碼組包含1357…等;字段C的參 考聲紋密碼組包含ABCD…等;字段D的參考聲紋密碼組包含1234…等。隨機(jī)式 聲紋驗(yàn)證系統(tǒng)1是依據(jù)該隨機(jī)密碼產(chǎn)生器2O所選擇的參考聲紋密碼組進(jìn)行語 音測(cè)試作業(yè)。
請(qǐng)?jiān)賲⒄盏趫D2,測(cè)試系統(tǒng)30開始進(jìn)行語音測(cè)試作業(yè)時(shí),隨機(jī)密碼產(chǎn)生器 20即隨機(jī)產(chǎn)生一個(gè)或多個(gè)參考聲紋密碼組,即完成設(shè)定隨機(jī)式聲紋密碼鎖。 如同語音訓(xùn)練作業(yè)的程序,在進(jìn)入測(cè)試系統(tǒng)30進(jìn)行語音測(cè)試作業(yè)時(shí),利用運(yùn) 算方程式(1)至(9)獲得有效測(cè)試語音特征。
請(qǐng)?jiān)賲⒄請(qǐng)D2,接著,進(jìn)行運(yùn)算測(cè)試語音特征與參考聲紋密碼組之間相似 機(jī)率,以便輸出一辨識(shí)結(jié)果。在語音辨識(shí)上,其最小相似機(jī)率大于預(yù)定參考 值時(shí),視其通過語音辨識(shí),因而可進(jìn)入隨機(jī)式聲紋驗(yàn)證系統(tǒng)l;反之,其最小 相似機(jī)率小于預(yù)定參考值時(shí),無法通過語音辨識(shí)且結(jié)束測(cè)試作業(yè),因而必須 離開隨機(jī)式聲紋驗(yàn)證系統(tǒng)l 。
相較于中國臺(tái)灣專利公告第490655號(hào)的聲紋驗(yàn)證方法,其僅設(shè)定單一參 考樣本,因此其具有可能遭受非法破解的缺點(diǎn);反觀,本發(fā)明的隨機(jī)式聲紋 驗(yàn)證系統(tǒng)具有隨機(jī)密碼產(chǎn)生器20,其隨機(jī)產(chǎn)生一個(gè)或多個(gè)參考聲紋密碼組, 即隨機(jī)式聲紋驗(yàn)證系統(tǒng)1完成設(shè)定形成隨機(jī)式聲紋密碼鎖,因而其達(dá)成不易遭 受非法破解的功效。
上述實(shí)施例僅用于說明本發(fā)明,而非用于限定本發(fā)明。
權(quán)利要求
1、一種隨機(jī)式聲紋驗(yàn)證系統(tǒng),其特征在于,包含一個(gè)訓(xùn)練系統(tǒng),接受一個(gè)原始輸入語音數(shù)據(jù),并從該原始輸入語音數(shù)據(jù)產(chǎn)生一個(gè)指定聲紋特征模型參數(shù)組;一個(gè)隨機(jī)密碼產(chǎn)生器,利用所述指定聲紋特征模型參數(shù)組隨機(jī)產(chǎn)生至少一個(gè)參考聲紋密碼組,以完成設(shè)定一個(gè)隨機(jī)式聲紋密碼鎖;及一個(gè)測(cè)試系統(tǒng),利用所述隨機(jī)式聲紋密碼鎖進(jìn)行測(cè)試語音。
2、 根據(jù)權(quán)利要求l所述的隨機(jī)式聲紋驗(yàn)證系統(tǒng),其特征在于,還包含一 個(gè)前端處理部及一個(gè)特征擷取部,在執(zhí)行訓(xùn)練語音上,所述訓(xùn)練系統(tǒng)利用該 前端處理部從所述原始輸入語音數(shù)據(jù)擷取有效訓(xùn)練語音信息;再利用所述特 征擷取部進(jìn)行擷取所述有效訓(xùn)練語音特征;再進(jìn)行運(yùn)算該有效訓(xùn)練語音信息 以獲得最相似路徑,以作為所述指定聲紋特征模型參數(shù)組。
3、 根據(jù)權(quán)利要求l所述的隨機(jī)式聲紋驗(yàn)證系統(tǒng),其特征在于,還包含一 個(gè)前端處理部及一個(gè)特征擷取部,在執(zhí)行測(cè)試語音上,所述測(cè)試系統(tǒng)利用所 述前端處理部從所述原始輸入語音數(shù)據(jù)擷取有效測(cè)試語音信息;再利用所述 特征擷取部進(jìn)行擷取所述有效測(cè)試語音特征;再進(jìn)行運(yùn)算所述測(cè)試語音特征 與模型參數(shù)之間相似機(jī)率以輸出 一個(gè)辨識(shí)結(jié)果。
4、 一種隨機(jī)式聲紋密碼鎖,其特征在于,包含 數(shù)個(gè)聲紋特征單元,取自一個(gè)原始輸入語音數(shù)據(jù);及一個(gè)參考聲紋密碼組,利用所述聲紋特征單元隨機(jī)組合形成該參考聲紋 密碼組,以設(shè)定所述隨機(jī)式聲紋密碼鎖;其中在進(jìn)行解鎖作業(yè)上,所述隨機(jī)式聲紋密碼鎖所需要的測(cè)試語音數(shù)據(jù) 對(duì)應(yīng)所述參考聲紋密碼組,以完成語音測(cè)試作業(yè)。
5、 根據(jù)權(quán)利要求4所述的隨機(jī)式聲紋密碼鎖,其特征在于,從所述原始 輸入語音數(shù)據(jù)產(chǎn)生一個(gè)指定聲紋特征模型參數(shù)組,所述聲紋特征單元從所述 指定聲紋特征模型參數(shù)組取得。
6、 一種隨機(jī)式聲紋密碼鎖產(chǎn)生方法,其特征在于,包含步驟 輸入一個(gè)原始輸入語音數(shù)據(jù);從該原始輸入語音數(shù)據(jù)取得數(shù)個(gè)聲紋特征單元;及通過至少一個(gè)所述聲紋特征單元組合形成至少一個(gè)參考聲紋密碼組,以 提供一個(gè)隨機(jī)式聲紋密碼鎖。
7、 根據(jù)權(quán)利要求6所述的隨機(jī)式聲紋密碼鎖產(chǎn)生方法,其特征在于,還 包含步驟從所述原始輸入語音數(shù)據(jù)取得一個(gè)指定聲紋特征模型參數(shù)組,這 樣,從所述指定聲紋特征模型參數(shù)組取得所述聲紋特征單元。
8、 根據(jù)權(quán)利要求6所述的隨機(jī)式聲紋密碼鎖產(chǎn)生方法,其特征在于,所 述聲紋特征單元是利用 一個(gè)訓(xùn)練系統(tǒng)取得。
9、 根據(jù)權(quán)利要求6所述的隨機(jī)式聲紋密碼鎖產(chǎn)生方法,其特征在于,,所 述參考聲紋密碼組是利用一個(gè)隨機(jī)密碼產(chǎn)生器取得。
全文摘要
本發(fā)明提供一種隨機(jī)式聲紋驗(yàn)證系統(tǒng)包含一訓(xùn)練系統(tǒng)、一隨機(jī)密碼產(chǎn)生器及一測(cè)試系統(tǒng),以便對(duì)原始輸入語音數(shù)據(jù)進(jìn)行訓(xùn)練或測(cè)試作業(yè)。在訓(xùn)練語音上,訓(xùn)練系統(tǒng)從該原始輸入語音數(shù)據(jù)獲得一指定聲紋特征模型參數(shù)組,并從指定聲紋特征模型參數(shù)組取得數(shù)個(gè)聲紋特征單元并組合形成至少一個(gè)參考聲紋密碼組,以供測(cè)試系統(tǒng)執(zhí)行語音測(cè)試作業(yè)。在執(zhí)行測(cè)試語音上,隨機(jī)密碼產(chǎn)生器從指定聲紋特征模型參數(shù)組的聲紋特征單元隨機(jī)產(chǎn)生至少一個(gè)參考聲紋密碼組,以形成該隨機(jī)式聲紋密碼鎖。本發(fā)明通過隨機(jī)產(chǎn)生一個(gè)或多個(gè)參考聲紋密碼組,即隨機(jī)式聲紋驗(yàn)證系統(tǒng)完成設(shè)定形成隨機(jī)式聲紋密碼鎖,因而其達(dá)到不易遭受非法破解的效果。
文檔編號(hào)G10L17/00GK101197131SQ200610161138
公開日2008年6月11日 申請(qǐng)日期2006年12月7日 優(yōu)先權(quán)日2006年12月7日
發(fā)明者余坤郎, 歐陽彥杰 申請(qǐng)人:積體數(shù)位股份有限公司