国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于語音的認證方法及裝置的制作方法

      文檔序號:2833154閱讀:263來源:國知局
      專利名稱:一種基于語音的認證方法及裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計算機應(yīng)用技術(shù)領(lǐng)域,特別是涉及一種基于語音的認證方法及裝置。
      背景技術(shù)
      在信息化時代,如何準(zhǔn)確鑒定一個人的身份、保護信息安全,已成為一個廣為關(guān)注的問題。傳統(tǒng)的身份認證方式由于 極易偽造和丟失,已經(jīng)難以滿足需求,目前最為便捷與安全的解決方案無疑是生物特征識別技術(shù)。生物識別技術(shù)(Biometric IdentificationTechnology)是指利用人體生物特征進行身份認證的一種技術(shù)。其通過計算機與光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計學(xué)原理等高科技手段密切結(jié)合,利用人體固有的生理特征和行為特征來進行個人身份的鑒定。目前,應(yīng)用較為廣泛的生物特征包括臉部、指紋、掌紋、虹膜等特征,基于這些特征的認證/識別系統(tǒng)都要求具有圖像采集設(shè)備,而且對圖像質(zhì)量敏感,識別結(jié)果很容易受到拍攝角度、環(huán)境光線等因素干擾,這就對圖像采集設(shè)備提出了較高的要求。如果是基于指紋、掌紋、虹膜等特征的系統(tǒng),還要求配置特殊的采集裝置,進一步增加了實現(xiàn)成本,難以在手機、平板電腦等移動設(shè)備上得以實際應(yīng)用。聲紋(Voiceprint)是對語音中所包含的能唯一表征說話人身份的特征參數(shù)以及基于這些特征參數(shù)所建立的模型的總稱。聲紋識別則是根據(jù)某段語音識別說話人身份的方法。與指紋、掌紋、虹膜等識別方法相比,聲紋識別不會受到角度光線等因素影響,而且僅需要簡單的錄音設(shè)備即可,實現(xiàn)成本相對較低,目前絕大多數(shù)移動設(shè)備都具有錄音功能。然而,與指紋、虹膜等特征不同的是,聲音樣本可以較為容易地采集,因此利用錄音等手段,可以輕易實現(xiàn)對系統(tǒng)的欺騙。

      發(fā)明內(nèi)容
      為解決上述技術(shù)問題,本發(fā)明實施例提供一種基于語音的認證方法及裝置,以解決現(xiàn)有的聲紋識別技術(shù)所存在的安全隱患。技術(shù)方案如下本發(fā)明提供一種基于語音的認證方法,該方法包括生成文本認證信息;將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng);接收用戶回應(yīng)的語音信息,對所述語音信息進行聲紋認證及語音識別,根據(jù)識別結(jié)果確定用戶是否通過認證。在本發(fā)明的一種實施方式中,所述對該語音信息進行聲紋認證及語音識別,根據(jù)結(jié)果確定用戶是否通過認證,包括利用預(yù)先訓(xùn)練的聲紋模型,對所述語音信息進行聲紋認證;在聲紋認證通過的情況下,進一步對該語音信號進行語音識別;將語音識別結(jié)果與所述文本認證信息進行匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證。
      在本發(fā)明的一種實施方式中,該方法還包括在用戶通過認證的情況下,利用所述語音信號對所述聲紋模型進行修正。在本發(fā)明的一種實施方式中,所述生成文本認證信息,包括根據(jù)預(yù)置的字符集合,以字符為單位生成文本認證信息。在本發(fā)明的一種實施方式中,所述提示用戶回應(yīng)包括提示用戶以字符為單位,閱讀所述文本認證信息。在本發(fā)明的一種實施方式中,所述語音識別過程,以字符為基本識別單位。在本發(fā)明的一種實施方式中,所述將語音識別結(jié)果與所生成的文本認證信息進行 匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證,包括根據(jù)預(yù)先定義的所述字符集合中相似讀音字符的差異度,計算語音識別結(jié)果與文本認證信息的字符差異度,若計算結(jié)果小于預(yù)設(shè)的閾值,則確定該用戶通過認證。在本發(fā)明的一種實施方式中,所述預(yù)置的字符集合中,不包括讀音相似的字符。在本發(fā)明的一種實施方式中,所述生成文本認證信息,包括生成一問題形式的信息并確定問題答案;所述將文本認證信息顯示給待認證用戶并提示用戶回應(yīng),包括將問題顯示給待認證用戶并提示用戶回答所述文本認證信息中的問題。在本發(fā)明的一種實施方式中,所述將語音識別結(jié)果與所生成的文本認證信息進行匹配,包括將語音識別結(jié)果與所述問題答案進行匹配。本發(fā)明還提供一種基于語音的認證裝置,該裝置包括認證信息生成模塊,用于生成文本認證信息;顯示模塊,用于將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng);認證模塊,用于接收用戶回應(yīng)的語音信息,對所述語音信息進行聲紋認證及語音識別,根據(jù)識別結(jié)果確定用戶是否通過認證。在本發(fā)明的一種實施方式中,所述認證模塊,包括聲紋認證子模塊,用于接收用戶回應(yīng)的語音信息,利用預(yù)先訓(xùn)練的聲紋模型,對所述語音信息進行聲紋認證;語音識別子模塊,用于在聲紋認證通過的情況下,進一步對該語音信號進行語音識別;認證子模塊,用于將語音識別結(jié)果與所述文本認證信息進行匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證。在本發(fā)明的一種實施方式中,該裝置還包括修正模塊,用于在用戶通過認證的情況下,利用所述語音信號對所述聲紋模型進行修正。在本發(fā)明的一種實施方式中,所述認證信息生成模塊,具體用于根據(jù)預(yù)置的字符集合,以字符為單位生成文本認證信息。在本發(fā)明的一種實施方式中,所述顯示模塊具體用于提示用戶以字符為單位,閱讀所述文本認證信息。在本發(fā)明的一種實施方式中,所述語音識別子模塊以字符為基本識別單位。
      在本發(fā)明的一種實施方式中,所述認證子模塊具體用于根據(jù)預(yù)先定義的所述字符集合中相似讀音字符的差異度,計算語音識別結(jié)果與文本認證信息的字符差異度,若計算結(jié)果小于預(yù)設(shè)的閾值,則確定該用戶通過認證。在本發(fā)明的一種實施方式中,所述預(yù)置的字符集合中,不包括讀音相似的字符。在本發(fā)明的一種實施方式中,所述認證信息生成模塊具體用于生成一問題形式的信息并確定問題答案;所述顯示模塊具體用于將問題顯示給待認證用戶并提示用戶回答所述文本認證Ih息中的問題。
      在本發(fā)明的一種實施方式中,所述認證子模塊具體用于將語音識別結(jié)果與所述問題答案進行匹配。本發(fā)明實施例所提供的技術(shù)方案,將聲紋認證技術(shù)和語音識別技術(shù)相結(jié)合,一方面,通過聲紋認證來確定用戶的身份,另一方面,利用即時生成的認證信息讓用戶回應(yīng),再通過語音識別判斷用戶的回應(yīng)語音信息內(nèi)容是否與所生成的認證內(nèi)容相符,從而可以有效地避免錄音欺騙,解決單一的聲紋識別技術(shù)所存在的安全隱患。


      為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本發(fā)明實施例基于語音的認證方法的流程圖;圖2為本發(fā)明實施例基于語音的認證方法的另一種流程圖;圖3為本發(fā)明實施例基于語音的認證裝置的結(jié)構(gòu)示意圖;圖4為本發(fā)明實施例基于語音的認證裝置的另一種結(jié)構(gòu)圖。
      具體實施例方式人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生理物理過程,人在講話時使用的發(fā)聲器官如舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。聲紋的具體應(yīng)用分為兩類一類是聲紋識另I」,即說話人辨認(SpeakerIdentification);另一類是聲紋認證,即說話人確認(Speaker Verification)。前者用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;而后者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。不同的應(yīng)用場景會使用不同的聲紋識別技術(shù),如用于刑偵時可能需要識別技術(shù),而門禁等應(yīng)用場景則需要認證技術(shù)。與聲紋識別相比,聲紋認證并不需要較高的精度,但是對于機器而言,在進行認證時接收到的只是一段音頻信息,難以區(qū)分是真人說話還是錄音,因此如果如果沒有其他輔助手段(例如人工監(jiān)督),僅憑聲紋信息對用戶身份進行認證,很容易利用錄音的方式進行欺騙,存在較大的安全隱患。
      針對上述問題,本發(fā)明實施例提供了一種基于語音的認證方法,參見圖I所示,該方法可以包括以下步驟S101,生成文本認證信息;S102,將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng);S103,接收用戶回應(yīng)的語音信息,對所述語音信息進行聲紋認證及語音識別,根據(jù)識別結(jié)果確定用戶是否通過認證。語音識別,是一種讓語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。目前已經(jīng)在多種領(lǐng)域得以應(yīng)用。本發(fā)明實施例所提供的技術(shù)方案,將聲紋認證技術(shù)和語音識別技術(shù)相結(jié)合,一方面,通過聲紋認證來確定用戶的身份,另一方面,利用即時生成的認證信息讓用戶回應(yīng),再通過語音識別判斷用戶的回應(yīng)語音信息內(nèi)容是否與所生成的認證內(nèi)容相符,從而可以有效地避免錄音欺騙,解決單一的聲紋識別技術(shù)所存在的安全隱患。為了使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行詳細地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本發(fā)明保護的范圍??梢岳斫獾氖?,聲紋認證和語音識別可以是兩個相對獨立的過程,理論上可以分別進行,然后根據(jù)聲紋認證和語音識別的結(jié)果綜合判定。例如,要求用戶說一段話(這段話可以是固定),用于進行聲紋認證;同時要求用戶閱讀一段指定文字或者回答指定問題,用于進行語音識別;如果聲紋認證和語音識別同時滿足,則用戶通過認證。在實際應(yīng)用中,語音識別的實現(xiàn)復(fù)雜度要高于與聲紋認證,在前述方案中,主要還是利用聲紋認證確認用戶身份,而語音識別則起到輔佐作用,目的是避免錄音欺騙。而且聲紋認證和語音識別都是基于語音信息的,因此,為了降低系統(tǒng)復(fù)雜度,提高認證的效率,本發(fā)明方案僅要求用戶輸入一段語音認證信息,并且僅當(dāng)該段信息通過聲紋認證之后,才進一步進行語音識別。圖2所示為本發(fā)明一種具體實施方式
      的流程圖,包括以下步驟S201,生成文本認證信息;S202,將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng);S203,接收用戶回應(yīng)的語音信息,利用預(yù)先訓(xùn)練的聲紋模型,對所述語音信息進行聲紋認證;S204,在聲紋認證通過的情況下,進一步對該語音信號進行語音識別;S205,將語音識別結(jié)果與所述文本認證信息進行匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證。與指紋、虹膜等特征相比,人類的語音特征會隨著時間發(fā)生漂移,為了能夠跟蹤說話人的語音漂移,在本發(fā)明的優(yōu)選實施方案中,在一次正確的認證之后,可以利用本次正確認證的語音信息,對已有的聲紋模型進行訓(xùn)練,修正模型參數(shù),從而保證系統(tǒng)的識別性能。由于手機、平板電腦等便攜設(shè)備都配備有麥克風(fēng),因此本發(fā)明所提供的認證方案,可以應(yīng)用于便攜設(shè)備的解鎖操作。但是目前實用化的語音識別系統(tǒng)結(jié)構(gòu)和算法極其復(fù)雜,有時還需要借助云計算平臺實現(xiàn),而目前的移動設(shè)備系統(tǒng)資源有限。針對這一情況,本發(fā)明提出的方案是在語音識別過程,采用小詞表的孤立詞識別,可以在計算資源緊張的移動終端上實現(xiàn)語音識別,不需要訪問云計算服務(wù)器,解鎖時不依賴網(wǎng)絡(luò)接入。另一方面,使用小、詞表的文本相關(guān)算法,提高識別率易達到實際應(yīng)用的需求,算法簡單有效,易于在嵌入式系統(tǒng)上實現(xiàn)。在本發(fā)明的一種具體實施方式
      中,選取識別集合為一個小的孤立詞集合,具體可以包含但不限于以下幾種方案a) “O 9” 10個阿拉伯?dāng)?shù)字字符;b) “a z” 26個英文字母字符;c) “O 9”加上”a z” 一共36個字符;d)去除前述三種方案中讀音近似的字符(例如” I”和”7”),剩下的子集。本發(fā)明的方案可具體分為設(shè)置階段和解鎖階段實施,以下將分別進行詳細介紹I)設(shè)置階段。主要用于訓(xùn)練說話人確認模型??梢园ㄒ韵虏襟E·S301,系統(tǒng)檢測語音輸入設(shè)備(麥克風(fēng))是否可用,可用則進入步驟S302 ;不可用則提示用戶語音輸入設(shè)備不可用,并退出設(shè)定程序;S302,系統(tǒng)開啟語音輸入功能,顯示訓(xùn)練字符串在屏幕上,要求用戶閱讀,為了保證訓(xùn)練成功,訓(xùn)練字符需要足夠的長度,例如要求30秒以上;如果有必要,還可以要求用戶多次輸入,以增加模板樣本數(shù)量。S303,系統(tǒng)自動檢測語音輸入長度是否滿足要求,如果是則開始訓(xùn)練,否則返回步驟S302,要求用戶重新輸入;S304,如果訓(xùn)練成功,提示用戶設(shè)定成功,進入步驟S305 ;如果訓(xùn)練失敗,提示用戶設(shè)定失敗。S305,訓(xùn)練成功之后需要進行一次測試。測試是和解鎖步驟基本一致,系統(tǒng)隨機產(chǎn)生一個字符串,要求字符串長度讀音能滿足識別需要,然后對輸入語音數(shù)據(jù)進行識別和判決;S306,檢測此次解鎖是否成功,如果成功則提示用戶訓(xùn)練成功;如果失敗則進入步驟S305重試,重試3次連續(xù)失敗則提示用戶訓(xùn)練失敗,退出設(shè)定程序。2)解鎖階段。用戶試圖解鎖設(shè)備。S401,進入解鎖程序;S402,系統(tǒng)開啟語音輸入,隨機產(chǎn)生字符串并顯示在屏幕上,要求用戶閱讀;或者產(chǎn)生一問題形式的認證信息(同時也會確定問題的答案),例如簡單的算術(shù)題,將問題部分顯示給用戶,并且要求用戶回答該問題。S403,用戶根據(jù)提示輸入語音后,系統(tǒng)自動檢測語音長度是否滿足要求,語音長度滿足要求后系統(tǒng)開始進行語音識別,否則重新執(zhí)行步驟S402 ;S404,聲紋認證模塊對用戶輸入內(nèi)容進行認證,如果認證通過,則繼續(xù)執(zhí)行S405,否則提示認證失敗S405,語音識別模塊對用戶輸入內(nèi)容進行識別,與S402所產(chǎn)生的隨機字符串進行比較(或者是與問題的答案進行比較),如果完全一致或者相似度達到一定的閾值,則判斷為合法用戶,進行解鎖操作;如果判決為非法用戶,則繼續(xù)鎖定設(shè)備,重新執(zhí)行步驟S402 ;S406,正確解鎖之后,利用本次正確識別的語音數(shù)據(jù)對說話人確認模型進行訓(xùn)練,此步驟可以有效跟蹤說話人特征隨時間的漂移,提高識別精度;下面對本發(fā)明方案中所涉及的算法的具體實現(xiàn)進行介紹
      I)聲紋認證算法本發(fā)明利用聲紋認證算法來確認用戶身份,每個人的語音包含了說話人的特殊特征。通過對語音特征的鑒別,就能區(qū)分是否為同一個人,聲紋認證主要包括特征提取和特征匹配兩方面,具體實現(xiàn)方式可直接應(yīng)用現(xiàn)有的技術(shù),本發(fā)明對此并不需要進行限定。由于人類語音特征一般會隨著時間發(fā)生漂移,為了能夠跟蹤說話人的語音特征漂移,在一次正確的識別之后,利用語音數(shù)據(jù)對模型進行訓(xùn)練,修正模型參數(shù),可以提高系統(tǒng)識別正確率。2)語音識別算法語音識別是根據(jù)語音輸入信號,識別出說話內(nèi)容的方法,語音識別可以分為孤立詞語音識別和連續(xù)語音識別。目前孤立詞語音識別算法已經(jīng)非常成熟,識別率達到了應(yīng)用要求,例如采用動態(tài)時間規(guī)整(DTW),隱馬爾科夫模型(HMM),矢量量化(VQ)等算法。孤立詞識別算法不但精度高,而且復(fù)雜度較低,易于在移動設(shè)備上實現(xiàn)。3)判決算法在判決時,設(shè)置兩個閾值Tl和T2。Tl為聲紋認證閾值,聲紋認證模塊的輸出值Tspeaker是輸入語音和聲紋模型的距離,表征了輸入特征和設(shè)置特征的相似度,將Tspeaker和Tl進行比較若Tspeaker >= Tl,則判斷為合法說話人若Tspeaker < Tl,則判斷為非法說話人T2為語音識別文本差異度,用以判斷輸入文字和識別文字是否相同,本系統(tǒng)中語音識別作為輔助判斷是否為錄音仿冒,因此在字符度長度足夠的情況下,不必要求必須每個字符完全相同,小于預(yù)先設(shè)置閾值T2則可認為合法。漢語中的很多字發(fā)音相似,在計算文本差異度Ttext時,可以考慮字音相似導(dǎo)致的語音識別系統(tǒng)誤判。本發(fā)明提出了一種基于發(fā)音相似度的判決算法,詳細如下假設(shè)預(yù)設(shè)的字符集為“O 9”加上”a z” 一共36個字符,為字符集的相似發(fā)音字符建立一張表,對字符之間的差異度賦值。未出現(xiàn)在表中的字符間差異度均默認為1,相同字符間差異度為O。表I列出了部分數(shù)字和英文字母中文讀音差異度,差異度值可以根據(jù)語音數(shù)據(jù)訓(xùn)練得到。
      權(quán)利要求
      1.一種基于語音的認證方法,其特征在于,該方法包括 生成文本認證信息; 將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng); 接收用戶回應(yīng)的語音信息,對所述語音信息進行聲紋認證及語音識別,根據(jù)識別結(jié)果確定用戶是否通過認證。
      2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述對該語音信息進行聲紋認證及語音識別,根據(jù)結(jié)果確定用戶是否通過認證,包括 利用預(yù)先訓(xùn)練的聲紋模型,對所述語音信息進行聲紋認證; 在聲紋認證通過的情況下,進一步對該語音信號進行語音識別; 將語音識別結(jié)果與所述文本認證信息進行匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證。
      3.根據(jù)權(quán)利要求I或2所述的方法,其特征在于,該方法還包括 在用戶通過認證的情況下,利用所述語音信號對所述聲紋模型進行修正。
      4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述生成文本認證信息,包括 根據(jù)預(yù)置的字符集合,以字符為單位生成文本認證信息。
      5.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述提示用戶回應(yīng)包括提示用戶以字符為單位,閱讀所述文本認證信息。
      6.根據(jù)權(quán)利要求5所述的方法,其特征在于, 所述語音識別過程,以字符為基本識別單位。
      7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述將語音識別結(jié)果與所生成的文本認證信息進行匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證,包括 根據(jù)預(yù)先定義的所述字符集合中相似讀音字符的差異度,計算語音識別結(jié)果與文本認證信息的字符差異度,若計算結(jié)果小于預(yù)設(shè)的閾值,則確定該用戶通過認證。
      8.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述預(yù)置的字符集合中,不包括讀音相似的字符。
      9.根據(jù)權(quán)利要求I所述的方法,其特征在于, 所述生成文本認證信息,包括生成一問題形式的信息并確定問題答案; 所述將文本認證信息顯示給待認證用戶并提示用戶回應(yīng),包括將問題顯示給待認證用戶并提示用戶回答所述文本認證信息中的問題。
      10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述將語音識別結(jié)果與所生成的文本認證信息進行匹配,包括 將語音識別結(jié)果與所述問題答案進行匹配。
      11.一種基于語音的認證裝置,其特征在于,該裝置包括 認證信息生成模塊,用于生成文本認證信息; 顯示模塊,用于將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng); 認證模塊,用于接收用戶回應(yīng)的語音信息,對所述語音信息進行聲紋認證及語音識別,根據(jù)識別結(jié)果確定用戶是否通過認證。
      12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述認證模塊,包括 聲紋認證子模塊,用于接收用戶回應(yīng)的語音信息,利用預(yù)先訓(xùn)練的聲紋模型,對所述語音信息進行聲紋認證; 語音識別子模塊,用于在聲紋認證通過的情況下,進一步對該語音信號進行語音識別; 認證子模塊,用于將語音識別結(jié)果與所述文本認證信息進行匹配,根據(jù)匹配結(jié)果確定該用戶是否通過認證。
      13.根據(jù)權(quán)利要求11或12所述的裝置,其特征在于,該裝置還包括 修正模塊,用于在用戶通過認證的情況下,利用所述語音信號對所述聲紋模型進行修正。
      14.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述認證信息生成模塊,具體用于 根據(jù)預(yù)置的字符集合,以字符為單位生成文本認證信息。
      15.根據(jù)權(quán)利要求14所述的裝置,其特征在于, 所述顯示模塊具體用于提示用戶以字符為單位,閱讀所述文本認證信息。
      16.根據(jù)權(quán)利要求15所述的裝置,其特征在于, 所述語音識別子模塊以字符為基本識別單位。
      17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述認證子模塊具體用于 根據(jù)預(yù)先定義的所述字符集合中相似讀音字符的差異度,計算語音識別結(jié)果與文本認證信息的字符差異度,若計算結(jié)果小于預(yù)設(shè)的閾值,則確定該用戶通過認證。
      18.根據(jù)權(quán)利要求14所述的裝置,其特征在于, 所述預(yù)置的字符集合中,不包括讀音相似的字符。
      19.根據(jù)權(quán)利要求11所述的裝置,其特征在于, 所述認證信息生成模塊具體用于生成一問題形式的信息并確定問題答案; 所述顯示模塊具體用于將問題顯示給待認證用戶并提示用戶回答所述文本認證信息中的問題。
      20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述認證子模塊具體用于 將語音識別結(jié)果與所述問題答案進行匹配。
      全文摘要
      本發(fā)明公開了一種基于語音的認證方法及裝置。一種基于語音的認證方法包括生成文本認證信息;將所述文本認證信息顯示給待認證用戶并提示用戶回應(yīng);接收用戶回應(yīng)的語音信息,對所述語音信息進行聲紋認證及語音識別,根據(jù)識別結(jié)果確定用戶是否通過認證。本發(fā)明實施例所提供的技術(shù)方案,將聲紋認證技術(shù)和語音識別技術(shù)相結(jié)合,一方面,通過聲紋認證來確定用戶的身份,另一方面,利用即時生成的認證信息讓用戶回應(yīng),再通過語音識別判斷用戶的回應(yīng)語音信息內(nèi)容是否與所生成的認證內(nèi)容相符,從而可以有效地避免錄音欺騙,解決單一的聲紋識別技術(shù)所存在的安全隱患。
      文檔編號G10L17/00GK102737634SQ201210171368
      公開日2012年10月17日 申請日期2012年5月29日 優(yōu)先權(quán)日2012年5月29日
      發(fā)明者唐虹剛, 馬旭 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1