專利名稱:通過多模態(tài)基于web的界面的用戶驗證的制作方法
技術領域:
本發(fā)明涉及使用多模態(tài)(multimodal)基于Web的界面驗證用戶身份。
背景技術:
多模態(tài)界面允許用戶通過可視和口語方式與應用或其它系統(tǒng)通信。例如,用戶可通過圖形用戶界面(GUI)進行通信,這可以通過發(fā)出一個或多個口頭言詞或通過提供GUI 輸入和話音輸入的組合。多模態(tài)交互可以向用戶提供與系統(tǒng)通信的更多直覺方式。關于便攜式計算設備,諸如智能電話、個人數(shù)字助理、以及其它具有小型表格要素的設備,多模態(tài)界面允許用戶基于情況選擇交互方式。在某些情形中,使用GUI可能是有利的,而在其它情形中,話音數(shù)據(jù)輸入可能更有利或更方便。例如,在通常情況下,用戶可以選擇話音交互,因為這是直覺性和迅捷的。話音數(shù)據(jù)輸入進一步免除了用戶不得不使用微型小鍵盤或小型GUI,所述二者在使用上都可能是麻煩并緩慢的。不過,在嘈雜環(huán)境中,話音數(shù)據(jù)輸入也許是不可能的。周圍的噪聲級可能掩蓋用戶話音輸入,以至于對用戶語音的精確識別是不可能的。在其它情況下,諸如當驗證用戶身份時,用戶也可能選擇小鍵盤輸入或非口語交互。典型地,使用用戶名和口令來實施用戶驗證。因為將這樣的信息說出到多模態(tài)界面中可能允許其他人無意聽到機密信息,所以用戶通常使用GUI或小鍵盤輸入這樣的信息。不過,如所述,在便攜式計算設備上以此方式輸入這樣的信息可以是麻煩并緩慢的。使用口令還有其它缺點。典型地,口令難于記住并且不太安全??紤]到用戶擁有的過多的帳戶,其中每個帳戶都需要用戶名和口令,則記住口令可能是特別困難的。為避免不得不記住每個口令,用戶傾向于對于多個帳戶使用一個通用口令、將口令寫在訪問卡(即 ATM卡)的背面、或所使用的口令與用戶對于該帳戶的用戶名相同。這些行為中的任一種都可能將用戶帳戶的安全置于危險中。而且,由于諸如銀行、航線預訂、產(chǎn)品購買等等的功能開始遷移到多模態(tài)基于Web 的界面,用戶驗證將變得越來越重要。這樣的系統(tǒng)僅在交易是安全的并且系統(tǒng)確保該用戶是用戶所聲明的那個人之時才可以是成功的。因此,提供一種克服了上述缺陷的、通過多模態(tài)界面驗證用戶的技術將是有利的。
發(fā)明內(nèi)容
本發(fā)明提供了一種在通信網(wǎng)絡上驗證用戶身份的解決方案。本發(fā)明的一實施例可以包括一種使用多模態(tài)基于Web的界面來驗證用戶身份的方法。所述方法可以包括將多模態(tài)標記語言文檔發(fā)送到遠程計算設備,所述多模態(tài)標記語言文檔當由所述遠程計算設備呈現(xiàn)時向用戶查詢用戶標識符并使得用戶話音的音頻發(fā)送到多模態(tài)基于Web的應用。所述用戶標識符和記錄可以大約同時從客戶端設備接收。所述音頻可以與關聯(lián)于所述用戶標識符的話音印跡進行比較。因此,根據(jù)從所述比較步驟獲得的結果,位于所述遠程計算設備的用戶可以被選擇性地準許對聯(lián)機系統(tǒng)的訪問。本發(fā)明的另 一實施例可以包括一種用于驗證用戶身份的系統(tǒng)。所述系統(tǒng)可以包括具有包括多個話音印跡的話音印跡數(shù)據(jù)庫的驗證系統(tǒng),每個話音印跡關聯(lián)于用戶標識符。所述系統(tǒng)還可以包括多模態(tài)應用,其被配置發(fā)送多模態(tài)標記語言文檔到客戶端設備。 所述多模態(tài)標記語言文檔可以指定隨機腳本,并當執(zhí)行時使得用戶標識符和包括大聲讀出所述隨機腳本的說話者的數(shù)字表示的音頻被發(fā)送回所述多模態(tài)應用。所述多模態(tài)應用可以將所述腳本、所述記錄和所述用戶標識符提交給所述驗證系統(tǒng),用于通過比較所述記錄和從關聯(lián)于所述用戶標識符的多個話音印跡中選擇的話音印跡來驗證說話者的身份。本發(fā)明的其它實施例可以包括機器可讀存儲裝置,其被編程以使得機器實施這里描述的各種步驟。
現(xiàn)在將僅通過示例并參考附圖來描述本發(fā)明的實施例,在附圖中圖1是說明了根據(jù)這里公開的發(fā)明方案的使用多模態(tài)基于Web的界面來實施用戶驗證的系統(tǒng)的示圖;圖2是說明了根據(jù)這里公開的發(fā)明方案的出于用戶驗證目的對用戶進行登記的方法的流程圖;以及圖3是說明了根據(jù)這里公開的發(fā)明方案的實施用戶驗證的方法的流程圖。
具體實施例方式以下是對用于通過使用多模態(tài)基于Web的界面來驗證用戶身份的示例性技術和系統(tǒng)的描述。用戶身份可以通過使用話音識別技術來驗證??梢韵蛴脩羰境鰪亩嗄B(tài)基于 Web的應用接收的多模態(tài)文檔。所述多模態(tài)文檔(即網(wǎng)頁類型的界面)可以請求用戶提供用戶標識符或用戶名(下文為“用戶ID”)以及話音樣本。用戶ID和話音樣本可以被提供回多模態(tài)基于Web的應用??梢砸罁?jù)話音樣本并參考用戶ID實施話音驗證。基于話音驗證的結果,用戶可以被準許對聯(lián)機系統(tǒng)的訪問或被拒絕進入。圖1是說明了根據(jù)這里公開的發(fā)明方案的使用多模態(tài)基于Web的界面來實施用戶驗證的系統(tǒng)100的示圖。如圖所示,系統(tǒng)100可包括客戶端設備105、包括多模態(tài)應用120 的服務器110、以及具有話音印跡數(shù)據(jù)庫130的驗證系統(tǒng)125。在一實施例中,客戶端設備105可以是多種計算設備中的任一種,諸如臺式計算機、服務器等等。在另一實施例中,計算設備105可以是便攜式和/或移動計算設備,諸如膝上型計算機、或者有線或者無線的被配置用于因特網(wǎng)通信的個人數(shù)字助理(PDA)、移動電話等等。在任意情形中,客戶端設備105可以包括適當?shù)能浖?,其用于發(fā)送請求到服務器110 和從服務器110接收信息。例如,客戶端設備105可以包括能夠呈現(xiàn)標記語言文檔(包括多模態(tài)標記語言(MML)文檔)的適當?shù)臑g覽器。MML文檔可以指定用于用戶交互的可視和話音組件。因此,MML文檔可包括基于任意標記語言的文檔或文件,當其被呈現(xiàn)時允許用戶通過可視方式(諸如圖形用戶界面 (GUI))以及通過可聽方式(通過說出或提供雙音多頻輸入)來提供輸入。這樣的標記語言的一個示例是X+V標記語言。X+V是所提出的用于開發(fā)多模態(tài)網(wǎng)頁的標記語言,其結合了可擴展超文本標記語言(XHTML)和話音可擴展標記語言(VoiceXML) 的子集。一般而言,XHTML是已被調(diào)整為符合可擴展標記語言(XML)的規(guī)則的HTML 4. O的一版本。VoiceXML是通過萬維網(wǎng)協(xié)會(W3C)開發(fā)的基于XML的語言。VoiceXML提供用于構造基于語音的應用的標準化格式。XHTML和VoiceXML (X+V)共同使得Web開發(fā)者能夠?qū)⒃捯糨斎牒洼敵鎏砑拥絺鹘y(tǒng)的基于圖形的網(wǎng)頁。MML的另一示例是基于將語音應用語言標志(SALT)添加到宿主標記語言,所述宿主標記語言諸如XHTML、超文本標記語言(HTML)或者可縮放向量圖形(SVG)。SALT是所提出的可以用于開發(fā)支持可視和語音模式的用戶交互的多模態(tài)網(wǎng)頁的標記語言。SALT是通過 SALT論壇開發(fā)的基于XML的語言。服務器110可以是多種能夠在通信網(wǎng)絡上回復請求并提供信息的信息處理系統(tǒng)中的任一種,例如Web服務器。如圖所示,服務器110和客戶端設備105可以在通信網(wǎng)絡115 上通信,所述通信網(wǎng)絡115諸如因特網(wǎng)、局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、移動或蜂窩式網(wǎng)絡、另外的多種通信網(wǎng)絡、或它們的任意組合。多模態(tài)應用120可以在服務器110內(nèi)執(zhí)行。因此,多模態(tài)應用120可以從客戶端設備105接收請求和信息,并作為回復提供諸如標記語言文檔(多模態(tài)的或非多模態(tài)的) 的信息。盡管未示出,多模態(tài)應用120還可以包括或訪問音頻處理服務,諸如文本到語音 (TTS)、語音識別、和/或雙音多頻處理。這些服務可以位于服務器110內(nèi)或者可以位于與多模態(tài)應用120在通信上鏈接的不同計算系統(tǒng)內(nèi)。驗證系統(tǒng)125可以通過比較用戶話音的記錄和存儲在話音印跡數(shù)據(jù)庫130中的話音印跡來驗證用戶身份。話音印跡數(shù)據(jù)庫130可以包括來自已經(jīng)在驗證系統(tǒng)125中進行登記的用戶的多個不同的話音印跡。每個話音印跡可以對應于或者關聯(lián)于用戶ID。當接收到話音記錄時,驗證系統(tǒng)125可以比較所述話音記錄和話音印跡數(shù)據(jù)庫130中的話音印跡,以確定是否存在匹配。在操作中,客戶端設備105可以發(fā)送請求MML文檔的請求135到多模態(tài)應用120。 多模態(tài)應用120可以通過發(fā)送MML文檔140 (即多模態(tài)網(wǎng)頁)進行響應。在呈現(xiàn)MML文檔 140之時,客戶端設備105可以在MML文檔的指示下請求來自用戶的用戶ID和話音樣本。 在一實施例中,所述文檔可以提供當用戶提供話音樣本時將由用戶讀出的腳本。需要注意, 任意提示可以是音頻提示(已記錄音頻或TTS)或者在客戶端設備105的顯示屏幕上顯示的文本提示??蛻舳嗽O備105例如當用戶大聲讀出腳本時可以產(chǎn)生對用戶話音的數(shù)字記錄。一旦用戶話音的記錄和用戶ID已經(jīng)由客戶端設備105獲得時,客戶端設備105可以在MML文檔140的指示下發(fā)送上述二者到多模態(tài)應用120。記錄145和用戶ID 150可以幾乎同時被發(fā)送。在接收到用戶ID 150和記錄145之時,多模態(tài)應用120可以將上述二者提供給驗證系統(tǒng)125進行處理。驗證系統(tǒng)125可以使用所提供的用戶ID 150在話音印跡數(shù)據(jù)庫130 中定位話音印跡。驗證系統(tǒng)125接著可以比較話音印跡和記錄150,以確定記錄150是否匹配該話音印跡。如果匹配,則用戶可以被準許對聯(lián)機系統(tǒng)的訪問,所述聯(lián)機系統(tǒng)諸如用于銀行、預訂等等的網(wǎng)站。如果不 匹配,訪問可以被拒絕。在另一實施例中,音頻不需要在客戶端設備105中進行記錄,而是在數(shù)據(jù)連接上從客戶端設備105流向多模態(tài)應用120。諸如支持在數(shù)據(jù)信道上的話音(被稱為IP上的話音(VoIP))的蜂窩式電話的移動設備可以支持音頻的流動。在音頻從客戶端設備105流出的情形中,音頻可以被多模態(tài)應用120記錄。圖2是說明了根據(jù)這里公開的發(fā)明方案的出于用戶驗證目的對用戶進行登記的方法200的流程圖。方法200可以由參考圖1描述的系統(tǒng)或者另一適當?shù)南到y(tǒng)來實施。方法200可以在步驟205開始,其中對于聯(lián)機系統(tǒng)是新用戶的用戶可以訪問多模態(tài)基于Web 的應用。用戶可以通過客戶端設備訪問多模態(tài)基于Web的應用。在步驟210中,多模態(tài)基于Web的應用可以提供安全的MML文檔給位于客戶端設備的用戶。如所述,MML文檔可以指定基于Web的多模態(tài)界面或網(wǎng)頁。這樣,其可以指定用于接收用戶ID以及其它可能是必要的個人信息(諸如電話號碼、地址、電子郵件地址等等) 的字段。MML文檔可以進一步指定登記腳本。登記腳本可以包括文本、數(shù)字、符號、字母等寸。在步驟215,在呈現(xiàn)MML文檔之時,客戶端設備可以提示用戶大聲讀出登記腳本。 所述提示可以是基于文本的,即網(wǎng)頁中的書面指令,或者可以是可聽提示,或者是TTS或者是預先記錄的音頻。登記腳本可以在客戶端設備的顯示屏幕上作為文本顯示。在步驟220, 用戶可以大聲讀出登記腳本,即說出登記腳本。在步驟225,客戶端設備記錄大聲讀取登記腳本的用戶,并獲得用戶ID和用戶提供的任意其它個人信息。根據(jù)本發(fā)明的一實施例,MML 文檔內(nèi)的記錄指令可以指示客戶端設備產(chǎn)生對用戶語音的數(shù)字記錄。例如,在用χ+v編寫的MML文檔內(nèi),可以使用記錄(record)標志。在步驟230,當用戶已結束大聲讀出登記腳本時,客戶端設備可以將所記錄的音頻轉發(fā)到在服務器上執(zhí)行的多模態(tài)應用。除了所記錄的音頻之外,被輸入到MML文檔的字段中的任意信息(特別是用戶ID)可以被發(fā)送到多模態(tài)基于Web的應用。應該理解,從MML文檔的字段獲得的數(shù)據(jù)和所記錄的音頻可以同時或幾乎同時被發(fā)送。客戶端設備轉發(fā)當MML 文檔被執(zhí)行時由其所指定的這樣的信息。如所述,在另一實施例中,登記和/或驗證音頻可以從客戶端設備流向多模態(tài)基于Web的應用。在這樣的實施例中,音頻可以由多模態(tài)基于Web的應用所記錄。在此情形中,MML文檔中的流指令可以指示客戶端設備將用戶語音的音頻流向多模態(tài)基于Web的應用。在步驟235,多模態(tài)基于Web的應用可以接收音頻以及在客戶端設備被輸入到MML 文檔中的任意其它信息,諸如用戶ID。在步驟240,多模態(tài)基于Web的應用發(fā)送用戶ID、音頻和登記腳本到驗證系統(tǒng)。在步驟245,驗證系統(tǒng)可以通過登記腳本的文本和音頻創(chuàng)建用戶的唯一話音印跡。得到的話音印跡可以關聯(lián)于用戶ID并存儲在話音印跡數(shù)據(jù)庫中。在成功的用戶登記之后,在步驟250,多模態(tài)基于Web的應用可以發(fā)送安全的歡迎頁給用戶,并允許用戶訪問該服務器或另一服務器內(nèi)的其它安全頁。圖3是說明了根據(jù)這里公開的發(fā)明方案的實施用戶驗證的方法300的流程圖。方法300可以通過使用參考圖1描述的系統(tǒng)或者另一類似的系統(tǒng)來實施。在步驟305,已注冊用戶可以經(jīng)由客戶端設備訪問多模態(tài)基于Web的應用,以請求網(wǎng)頁或?qū)ο到y(tǒng)的登錄。在步驟310,多模態(tài)應用可以發(fā)送MML 文檔,在此情形中是安全的基于Web的登錄頁,其可以在步驟315中由客戶端設備呈現(xiàn)。安全的登錄頁可以指定用于接收諸如用戶ID的用戶輸入的一個或多個字段。安全的登錄頁可以進一步指定腳本。腳本可以是字母、數(shù)字和/或字詞的隨機序列。腳本可以由多模態(tài)基于Web的應用例如通過從所述文本的集合中選擇字詞、字母和/或數(shù)字而生成。在一實施例中,腳本可以包括從登記腳本中隨機選擇的任意字詞、字母或數(shù)字。隨機生成的腳本防止冒充者試圖欺騙驗證系統(tǒng)。如果冒充者嘗試播放已注冊用戶的語音的預先記錄的部分,則預先記錄的語音將不會匹配將在話音印跡比較中使用的預期的用戶語音。預先記錄的用戶語音將包括不同于在隨機生成的腳本中所指定的字詞。因此, 用戶驗證將失敗。因此,根據(jù)本發(fā)明的一實施例,除話音驗證之外還可以使用語音識別,以防止冒充者使用預先記錄的用戶語音來欺騙系統(tǒng)。在步驟320,用戶可以將他或她的用戶ID輸入到當前呈現(xiàn)在客戶端設備的顯示器上的MML文檔的適當字段中。用戶可以使用語音、小鍵盤輸入、指示筆輸入等來輸入用戶 ID。用戶輸入用戶ID的具體方式并不意味著限制本發(fā)明。在任意情形中,用戶ID可以被臨時存儲在客戶端設備中。在步驟325,用戶可以被指示大聲讀出在客戶端設備的顯示器上示出的腳本。用戶可以通過TTS提示、音頻提示或通過在所示出的MML文檔中顯示的文本指令而被提示。在步驟330,客戶端設備可以產(chǎn)生對大聲讀出腳本的用戶的數(shù)字記錄。在一實施例中,數(shù)字記錄可以被存儲為PCM數(shù)據(jù)。不過,應該理解,數(shù)字音頻文件的具體格式化并不意味著限制本發(fā)明,在音頻在數(shù)據(jù)連接上流向多模態(tài)基于Web的應用的情形中,可以使用多種不同的數(shù)字音頻格式中的任一種,諸如ADPCM、MP3、AAC或壓縮DSR。在步驟335,當用戶結束說話時,客戶端設備可以發(fā)送腳本和用戶ID到多模態(tài)基于Web的應用。用戶ID和音頻(即驗證音頻)可以幾乎同時從客戶端提交,并幾乎同時由多模態(tài)基于Web的應用接收,或者作為整個記錄或者作為流式音頻。在步驟340,多模態(tài)基于Web的應用可以接收音頻和用戶ID。在步驟345,多模態(tài)基于Web的應用可以將音頻、腳本和用戶ID轉發(fā)給驗證系統(tǒng)。在步驟350,驗證系統(tǒng)通過使用用戶ID作為參考從話音印跡數(shù)據(jù)庫中定位或檢索用戶的話音印跡。在步驟355,驗證系統(tǒng)可以比較音頻和匹配用戶ID的話音印跡,以確定所述音頻是否匹配所述話音印跡。如果匹配,則所述方法可以進行到步驟360,其中安全的歡迎頁可以從多模態(tài)基于Web的應用提供給位于用戶設備的用戶,所述安全的歡迎頁可以是傳統(tǒng)的可視網(wǎng)頁或多模態(tài)網(wǎng)頁。已經(jīng)被驗證的用戶可以被允許訪問站點和其它安全的網(wǎng)頁。如果所記錄的音頻不匹配話音印跡,則在步驟365用戶被多模態(tài)基于Web的應用拒絕訪問ο本發(fā)明提供了一種使用基于Web的多模態(tài)界面來驗證用戶身份的解決方案。根據(jù)本發(fā)明,說話者驗證系統(tǒng)基于說話者話音的物理特性來驗證說話者的身份。通過多模態(tài)界面,用戶既可以進行注冊,也可以稍后被驗證系統(tǒng)進行驗證。登記變得更便利在于,登記腳本作為可視文本被示出給用戶,所以用戶不需要必須記住長的文本段落。說話者驗證部分要求用戶說出由多模態(tài)應用提供的隨機腳本。隨機腳本防止冒充者試圖播放在嘗試欺騙驗證系統(tǒng)時另一用戶說出的預先記錄的部分。預先記錄的語音將不匹配由隨機生成的腳本所指定的預期的用戶語音。用來驗證用戶身份的腳本(類似于登記腳本)也可以被可視地示出。使用多模態(tài)界面的驗證可以比僅使用一種模態(tài)更安全,因為可以同時要求可視口令和語音驗證。 本發(fā)明可以以硬件、軟件或軟硬件的組合來實現(xiàn)。本發(fā)明可以在一個計算機系統(tǒng)中以集中的方式實現(xiàn),或者以分布的方式(其中不同的單元跨若干互連計算機系統(tǒng)分布) 實現(xiàn)。適于執(zhí)行這里所描述的方法的任何種類的計算機系統(tǒng)或其它裝置是適合的。典型的軟硬件組合可以是具有計算機程序的通用計算機系統(tǒng),所述計算機程序在被加載和執(zhí)行時控制該計算機系統(tǒng),使得該計算機系統(tǒng)執(zhí)行這里所描述的方法。本發(fā)明還可以嵌入在計算機程序產(chǎn)品中,所述計算機程序產(chǎn)品包括使能這里描述的方法的實現(xiàn)的所有特征,并且當其被加載到計算機系統(tǒng)中時能夠執(zhí)行這些方法。本上下文中的計算機程序、軟件應用和/或這些術語的其它變體指的是指令集以任何語言、代碼或符號形式的任何表示法,所述指令集能夠使具有信息處理能力的系統(tǒng)直接地或在下述兩種方式之一或兩者完成之后來實施特定功能,所述兩種方式包括a)轉換到另一種語言、 代碼或符號;或者b)以不同的物質(zhì)形式再現(xiàn)。本發(fā)明可以用其它形式實現(xiàn)而不會背離其基本屬性或精神。因此,在指示本發(fā)明的范圍時,應該參考權利要求而不是前述說明書。
權利要求
1.一種使用多模態(tài)基于Web的界面來驗證用戶身份的方法,包括從遠程計算設備接收對于多模態(tài)標記語言文檔的請求;將多模態(tài)標記語言文檔發(fā)送到遠程計算設備,所述多模態(tài)標記語言文檔當由所述遠程計算設備呈現(xiàn)時向用戶查詢用戶標識符和用戶話音的音頻,所述多模態(tài)標記語言文檔指定將由用戶大聲讀出的腳本;在所述多模態(tài)標記語言文檔的控制下,在多模態(tài)基于Web的應用處接收所述用戶標識符和所述音頻;比較所述音頻和關聯(lián)于所述用戶標識符的話音印跡;以及根據(jù)從所述比較步驟獲得的結果選擇性地準許位于所述遠程計算設備的用戶對聯(lián)機系統(tǒng)的訪問。
2.根據(jù)權利要求1所述的方法,其中所述多模態(tài)標記語言文檔包括使所述音頻流動的指令,所述方法進一步包括響應于呈現(xiàn)所述多模態(tài)標記語言文檔和解釋所述使所述音頻流動的指令,所述遠程計算設備使所述音頻流向所述多模態(tài)基于Web的應用。
3.根據(jù)權利要求1所述的方法,其中所述多模態(tài)標記語言文檔包括記錄所述音頻的指令,所述方法進一步包括響應于呈現(xiàn)所述多模態(tài)標記語言文檔和解釋所述記錄指令,所述遠程計算設備產(chǎn)生對用戶話音的數(shù)字記錄。
4.根據(jù)權利要求1所述的方法,其中所述音頻是用戶大聲讀出所述腳本的數(shù)字表示。
5.根據(jù)權利要求4所述的方法,所述比較步驟進一步包括所述多模態(tài)基于Web的應用首先將所述音頻、所述腳本和所述用戶標識符發(fā)送到驗證系統(tǒng)。
6.根據(jù)前面任一權利要求所述的方法,進一步包括首先將指定登記腳本的多模態(tài)標記語言文檔發(fā)送到所述遠程計算設備;接收所述用戶標識符和包括用戶說出所述登記腳本的數(shù)字表示的音頻;以及通過確定來自用戶說出所述登記腳本的音頻的話音印跡以及將所述話音印跡關聯(lián)于所述用戶標識符,將所述用戶登記到聯(lián)機系統(tǒng)中。
7.一種用于驗證用戶身份的系統(tǒng),包括具有包括多個話音印跡的話音印跡數(shù)據(jù)庫的驗證系統(tǒng),每個話音印跡關聯(lián)于用戶標識符;多模態(tài)應用,被配置為從客戶端設備接收對于多模態(tài)標記語言文檔的請求,并發(fā)送多模態(tài)標記語言文檔到客戶端設備,所述多模態(tài)標記語言文檔指定將由用戶讀出的腳本,且當由所述客戶端設備呈現(xiàn)時使得用戶標識符和音頻被發(fā)送回所述多模態(tài)應用,其中在多模態(tài)標記語言文檔的控制下將所述音頻和所述用戶標識符從客戶端設備提交給多模態(tài)應用; 以及其中所述多模態(tài)應用可操作用于將所述音頻和所述用戶標識符提交給所述驗證系統(tǒng), 用于通過比較所述音頻和關聯(lián)于所述用戶標識符的話音印跡來驗證所述說話者的身份。
8.根據(jù)權利要求7所述的系統(tǒng),其中所述比較進一步包括多模態(tài)基于Web的應用首先將所述音頻、腳本和用戶標識符發(fā)送到驗證系統(tǒng)。
9.根據(jù)權利要求7所述的系統(tǒng),其中所述多模態(tài)標記語言文檔包括記錄音頻的指令, 使得響應于呈現(xiàn)所述多模態(tài)標記語言文檔和解釋所述記錄指令,客戶端設備記錄說話者大聲讀出所述腳本。
10.根據(jù)權利要求7所述的系統(tǒng),其中所述多模態(tài)標記語言文檔包括使所述音頻流動的指令,所述方法進一步包括響應于呈現(xiàn)所述多模態(tài)標記語言文檔和解釋所述使所述音頻流動的指令,所述遠程計算設備使所述音頻流向所述多模態(tài)應用。
全文摘要
一種使用基于Web的多模態(tài)界面來驗證用戶身份的方法可以包括將多模態(tài)標記語言文檔發(fā)送到遠程計算設備,所述多模態(tài)標記語言文檔當由所述遠程計算設備呈現(xiàn)時向用戶查詢用戶標識符并使得用戶話音被發(fā)送到多模態(tài)基于Web的應用。所述用戶標識符和所述音頻可以大約同時從客戶端設備接收。所述音頻可以與關聯(lián)于所述用戶標識符的話音印跡進行比較。根據(jù)從所述比較步驟獲得的結果,位于所述遠程計算設備的用戶可以被選擇性地準許對系統(tǒng)的訪問。
文檔編號G06F21/00GK102222190SQ20111016025
公開日2011年10月19日 申請日期2006年1月19日 優(yōu)先權日2005年2月22日
發(fā)明者D·哈拉米略, G·麥柯布 申請人:紐昂斯通訊公司