專利名稱:一種實現(xiàn)語音郵件服務(wù)的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于一種電子郵件技術(shù)和Web語音服務(wù),特別是一種實現(xiàn) 語音郵件服務(wù)的方法。
背景技術(shù):
目前國內(nèi)外均有電信服務(wù)提供商為客戶開通語音郵件服務(wù),已有 的語音郵件服務(wù)有以下幾個特點1. 大多數(shù)語音郵件服務(wù)都建立在簡單、封閉的交互機(jī)制上,其 數(shù)據(jù)來源基本上依靠事先的預(yù)制錄音、操作流程為筒單的菜單式按鍵 選擇、沒有充分利用已經(jīng)步入實用階段的語音瀏覽技術(shù)、成本較高、 不易普及、市場占有率較低等。2. 雖然各類服務(wù)商聲稱可以利用電話訪問郵件,但實際上只是 針對某一特定郵箱,而不是所有郵箱。例如,只能通過電話訪問域名 為5)phone2mai1. com的郵箱,而不能訪問域名為S)163. com或 扭sohu. com否勺大;0:由卩l(xiāng)i。3. 這些語音郵件服務(wù)僅限于公用電話網(wǎng)內(nèi),電話用戶所訪問的 郵箱都存放在電信服務(wù)提供商的語音網(wǎng)關(guān)上,并沒有利用互聯(lián)網(wǎng)資 源。語音郵件系統(tǒng)沒有采用基于Web服務(wù)方式的體系結(jié)構(gòu),和Web服 務(wù)幾乎沒有關(guān)系。語音技術(shù)是研究機(jī)器識別、產(chǎn)生或存儲、傳送語音的一種數(shù)字技 術(shù),本專利申請所涉及到的語音技術(shù)主要包括語音識別技術(shù)和語音合 成技術(shù)。語音合成技術(shù)支持將文本信息實時轉(zhuǎn)化為音頻信號;語音識 別主要指讓機(jī)器聽懂人說的"話",根據(jù)人發(fā)聲的頻率大小等基本因
素進(jìn)行語音識別,將人發(fā)出的語音指令識別為機(jī)器可以解析的文本命 令,并通過相應(yīng)指令來達(dá)到控制機(jī)器操作目的。目前語音合成和語音 識別技術(shù)還不足以支持廣泛的商業(yè)應(yīng)用,但現(xiàn)有的研究成果已經(jīng)能夠 較好地支持語音郵件服務(wù)的實驗。2000年5月22日,W3C采納VoiceXML標(biāo)記語言作為開發(fā)Web語 音應(yīng)用系統(tǒng)的對話標(biāo)記語言?;赩oiceXML的語音瀏覽技術(shù)的發(fā)展 使得通過語音來發(fā)送、接受郵件成為可能。發(fā)明內(nèi)容本發(fā)明的目標(biāo)是將Web服務(wù)從互聯(lián)網(wǎng)擴(kuò)展到電話網(wǎng)并支持語音郵 件服務(wù),它以VoiceXML語音瀏覽技術(shù)為基礎(chǔ),提出語音郵件客戶端 的邏輯結(jié)構(gòu)及核心模塊的處理方法,而提供一種實現(xiàn)語音郵件服務(wù)的 方法,以克服上述的不足。為了實現(xiàn)上述目標(biāo),本發(fā)明所采用的方法是使用現(xiàn)有的商業(yè)語 音服務(wù)器,接受和識別用戶通過電話終端發(fā)出的語音指令,將人的語 音指令轉(zhuǎn)換成計算機(jī)可以識別的操作指令,并將包含有操作指令的HTTP請求發(fā)送給Web服務(wù)器;將語音郵件客戶端部署在特定的Web 服務(wù)器上,實現(xiàn)對郵件服務(wù)器的訪問以及相關(guān)的操作(發(fā)送郵件和接 受郵件)。上述語音郵件客戶端包括三個核心模塊身份驗證模塊,發(fā)送郵 件模塊,接受郵件模塊,其中身份驗證模塊通過電話采集語音郵箱賬號和口令,經(jīng)過驗證后, 以數(shù)字字符串形式的賬號和口令被轉(zhuǎn)換成傳統(tǒng)的郵箱賬號和口令,并 提交給SMTP/POP3郵件服務(wù)器;發(fā)送郵件模塊由合成語音郵件,發(fā)送郵件和備份郵件等3個基
本部分構(gòu)成,合成語音郵件共有3個步驟從郵件服務(wù)器獲得聯(lián)系人 列表供用戶選擇;采集用戶通過電話輸入的郵件內(nèi)容,語音郵件內(nèi)容 被轉(zhuǎn)換成音頻文件并添加為郵件附件;填寫郵件所需其他信息(主題, 發(fā)送時間等);接受郵件模塊由下載郵件和閱讀郵件兩部分組成,下載郵件 包括2個步驟篩選語音郵件和下載語音郵件,篩選語音郵件是匹配 郵件主題的過程,目的是確認(rèn)哪一封郵件是語音郵件,隨后將根據(jù)篩 選結(jié)果將新的語音郵件下載到本地并存儲在 居庫內(nèi);閱讀郵件是才艮 據(jù)用戶的語音選擇,查詢數(shù)據(jù)庫并播放相應(yīng)的郵件附件(利用電話錄 制的音頻文件)。本發(fā)明具有以下特點1.提出電話(包括SIP電話或VOIP電話 等)訪問電子郵箱的語音郵件服務(wù)模式;2.將語音瀏覽技術(shù)與電子 郵件技術(shù)相結(jié)合,提出了基于VoiceXML的語音郵件客戶端的邏輯結(jié) 構(gòu)及核心模塊的處理流程。
圖1為本發(fā)明的邏輯結(jié)構(gòu)框圖。 圖2為本發(fā)明的身份驗證才莫塊的處理流程圖。 圖3為本發(fā)明的發(fā)送郵件模塊的處理流程圖。 圖4為本發(fā)明的接受郵件模塊的處理流程圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明作進(jìn)一步的詳細(xì)描述。 本發(fā)明語音郵件客戶端主要包括三個模塊身份驗證模塊,發(fā) 送郵件模塊,接受郵件模塊。傳統(tǒng)的郵箱賬號和口令均為結(jié)構(gòu)不規(guī)則的字符串,不利于語音識
別器進(jìn)行識別和分析;數(shù)字字符串形式的郵箱賬號和口令結(jié)構(gòu)規(guī)則, 易于識別,因此在身份驗證模塊中采集的語音郵箱賬號和口令均為數(shù) 字字符串的形式。身份驗證模塊通過電話采集語音郵箱賬號和口令, 經(jīng)過驗證后,數(shù)字字符串形式的賬號和口令被轉(zhuǎn)換成傳統(tǒng)的郵箱賬號 和口令,并提交給SMTP/P0P3郵件服務(wù)器(圖2 )。發(fā)送郵件模塊主要是由合成語音郵件,發(fā)送郵件和備份郵件等3 個基本部分組成,其中最關(guān)鍵的部分是合成語音郵件。合成語音郵件 共有3個步驟從郵件服務(wù)器獲得聯(lián)系人列表供用戶選擇;采集用戶 通過電話輸入的郵件內(nèi)容,語音郵件內(nèi)容^L轉(zhuǎn)換成音頻文件并添加為 郵件附件;填寫郵件所需其他信息(主題,發(fā)送時間等)。由于郵件 地址的復(fù)雜結(jié)構(gòu)和語音識別的限制,目前只能通過選擇聯(lián)系人列表來 獲取發(fā)送對象地址。由于目前語音識別設(shè)備無法將無語法約束的自然 語言轉(zhuǎn)換成文本,只能通過錄音將郵件內(nèi)容直接轉(zhuǎn)換成音頻文件(圖 3)。接受郵件模塊主要由下載郵件和閱讀郵件兩部分組成。下載郵件 主要包括2個步驟篩選語音郵件,下載語音郵件。篩選語音郵件是 匹配郵件主題的過程,目的是確認(rèn)哪一封郵件是語音郵件。篩選郵件 是必須的,只有符合語音郵件特征的郵件才能通過電話接收;隨后將 根據(jù)篩選結(jié)果將新的語音郵件下載到本地并存儲在數(shù)據(jù)庫內(nèi)。閱讀郵 件主要是根據(jù)用戶的語音選擇,查詢數(shù)據(jù)庫并播放相應(yīng)的郵件附件 (利用電話錄制的音頻文件)(圖4 )。本發(fā)明的開發(fā)和測試平臺需要Web服務(wù)器和語音服務(wù)器;調(diào)試過 程中需要網(wǎng)絡(luò)電話作為通信工具。在開發(fā)過程中使用的主要平臺和 工具有1) Web服務(wù)器resin
Resin的官方網(wǎng)站是www. caucho. com,相比其它開源Web服務(wù)器, 它提供了最快的jsp/servlet運行平臺。在Java和javascript的支 持下,Resin可以為任務(wù)靈活選用合適的開發(fā)語言。
2) 語音網(wǎng)關(guān)(語音服務(wù)器)Caf 6 Bevocal和Voxeo 開發(fā)過程中的供調(diào)試使用的語音網(wǎng)關(guān)采用Caf 6 Bevocal。同其它語音開發(fā)平臺相比,Caf6 Bevocal具有更多的調(diào)試手^殳和代碼監(jiān) 測程序。
開發(fā)過程結(jié)束后供部署或測試使用的語音網(wǎng)關(guān)是Voxeo。該語音 網(wǎng)關(guān)的速度比同類網(wǎng)關(guān)快,適合部署和后期集成測試。
3) 完成郵件收發(fā)功能采用Java類庫JavaMail API 1.4。
4) 組織語音界面流程的語言VoiceXML
5) 調(diào)試、部署過程中的通信工具X-Lite或Skype。 應(yīng)用實施例1:發(fā)送郵件系統(tǒng)選擇語音界面的語言,選擇中文說Chinese或者按1號鍵選擇英文說English或者按O號鍵。 用戶Chinese (只能用英文回答)系統(tǒng)你好,這里是語音電子郵件客戶端的演示平臺。該平臺提供兩 個基本功能,通過電話發(fā)送和接收郵件。你可以利用普通電話, 網(wǎng)絡(luò)電話或手持通信工具,通過語音來控制電子郵件客戶端, 完成收發(fā)郵件等基本功能。請注意,使用該演示平臺之前必須 在指定網(wǎng)站進(jìn)行注冊并獲得用戶賬號和口令。語音提示可以選 擇中文或英文,但用戶的回答必須是英文。
系統(tǒng)是否已經(jīng)獲得注冊賬號和口令?
用戶Yes 如果用戶回答yes系統(tǒng)該演示平臺提供兩種方式登錄,第一種方式是驗證聲音特征, 第二種方式是驗證注冊賬號和口令。如果你想使用聲音特征來 登錄,請說voice;如果你想使用傳統(tǒng)的賬號和口令來登錄, 請說traditional。用戶Traditional系統(tǒng)下面開始進(jìn)行賬號口令驗證。系統(tǒng)請輸入賬號用戶123456系統(tǒng)岡'J才輸入的賬號是one two three four five six,是否確定?用戶Yes系統(tǒng)請輸入口令用戶123456系統(tǒng)重新輸入口令用戶123456系統(tǒng)請稍等,正在驗證賬戶口令的有效性 如果系統(tǒng)驗證通過系統(tǒng)開始選擇郵箱操作,發(fā)送郵件,請說Send;接收郵件,請說Receive.,用戶Send系統(tǒng)該賬號一共有two個聯(lián)系人,從下面列表中選擇一個聯(lián)系人, 選擇聯(lián)系人hello,請說hello,選擇聯(lián)系人suggestion,請 說suggestion。
用戶Hello系統(tǒng)剛才選擇的聯(lián)系人是hello,是否確定? 用戶Yes系統(tǒng)聯(lián)系人hello的電子郵件是fenggen20035)sohu. com。聽到提示音后開始錄音。 用戶(隨便說幾句話,可以是中文)春節(jié)愉快。 系統(tǒng)錄音結(jié)束。播放錄音,請說replay;重新錄音,請說record;發(fā)送郵件,請說send。 用戶Send系統(tǒng)請稍等,正在發(fā)送郵件。(等待)發(fā)送成功。 系統(tǒng)是否繼續(xù)進(jìn)行郵件操作。 用戶No應(yīng)用實施例2: 4妄受郵件 系統(tǒng)選擇語音界面的語言,選擇中文說Chinese或者按1號鍵,選擇英文說English或者按O號鍵。 用戶Chinese (只能用英文回答)系統(tǒng)你好,這里是語音電子郵件客戶端的演示平臺。該平臺提供兩 個基本功能,通過電話發(fā)送和接收郵件。你可以利用普通電話, 網(wǎng)絡(luò)電話或手持通信工具,通過語音來控制電子郵件客戶端, 完成收發(fā)郵件等基本功能。請注意,使用該演示平臺之前必須 在指定網(wǎng)站進(jìn)行注冊并獲得用戶賬號和口令。語音提示可以選 擇中文或英文,但用戶的回答必須是英文。系統(tǒng)是否已經(jīng)獲得注冊賬號和口令?用戶Yes
如果用戶回答yes系統(tǒng)該演示平臺提供兩種方式登錄,第一種方式是-瞼證聲音特征, 第二種方式是驗證注冊賬號和口令。如果你想使用聲音特征來 登錄,請說voice;如果你想使用傳統(tǒng)的賬號和口令來登錄, 請說traditional。用戶Traditional系統(tǒng)下面開始進(jìn)行賬號口令驗證。系統(tǒng)請輸入賬號用戶123456系統(tǒng)剛才輸入的賬號是one two three four five six,是否確定?用戶Yes系統(tǒng)請輸入口令用戶123456系統(tǒng)重新l命入口令用戶123456系統(tǒng)請稍等,正在驗證賬戶口令的有效性 如果系統(tǒng)驗證通過系統(tǒng)開始選擇郵箱操作,發(fā)送郵件,請說Send;接收郵件,請說Receive。用戶Receive系統(tǒng)請稍等,正在下載郵件,(等待片刻),接收郵件成功。 系統(tǒng)該賬號共有two封郵件,開始閱讀郵件列表。One,發(fā)信人 fenggen2007肌63. com,發(fā)送日期為2007.3.2 (英文發(fā)音), 發(fā)送時間為 12: 51 (英文發(fā)音)。Two,發(fā)信人fenggen2003扭sohu. com,發(fā)送日期為2007. 3. 2 (英文發(fā)音),發(fā)送時間為13: 51 (英文發(fā)音)。 系統(tǒng)從上面列表中選擇一封郵件 用戶One系統(tǒng)您選擇的郵件序號為one,開始閱讀郵件(錄音)"春節(jié)愉快"。 系統(tǒng)重新閱讀郵件,請說r印lay;刪除該郵件,^"i兌delete。 用戶Delete系統(tǒng)請稍等,正在刪除郵件。(等待)刪除成功。 系統(tǒng)是否繼續(xù)其它的郵件操作? 用戶No本說明書中未作詳細(xì)描述的內(nèi)容屬于本領(lǐng)域?qū)I(yè)技術(shù)人員公知 的現(xiàn)有技術(shù)。
權(quán)利要求
1、一種實現(xiàn)語音郵件服務(wù)的方法,采用的方法是使用現(xiàn)有的商業(yè)語音服務(wù)器,接受和識別用戶通過電話終端發(fā)出的語音指令,將人的語音指令轉(zhuǎn)換成計算機(jī)可以識別的操作指令,并將包含有操作指令的HTTP請求發(fā)送給Web服務(wù)器;將語音郵件客戶端部署在特定的Web服務(wù)器上,實現(xiàn)對郵件服務(wù)器的訪問以及相關(guān)的操作。
2、 如權(quán)利要求1所述的實現(xiàn)客戶端的語音郵件服務(wù)的方法,其 特征在于語音郵件客戶端包括三個核心模塊身份驗證模塊,發(fā)送 郵件模塊,接受郵件模塊,其中身份驗證模塊通過電話采集語音郵箱賬號和口令,經(jīng)過驗證后, 以數(shù)字字符串形式的賬號和口令被轉(zhuǎn)換成傳統(tǒng)的郵箱賬號和口令,并 提交給SMTP/POP3郵件服務(wù)器;發(fā)送郵件模塊由合成語音郵件,發(fā)送郵件和備份郵件等3個基本部分構(gòu)成,合成語音郵件共有3個步驟從郵件服務(wù)器獲得聯(lián)系人列表供用戶選擇;采集用戶通過電話輸入的郵件內(nèi)容,語音郵件內(nèi)容被轉(zhuǎn)換成音頻文件并添加為郵件附件;填寫郵件所需其他信息;接受郵件模塊由下載郵件和閱讀郵件兩部分組成,下載郵件 包括2個步驟篩選語音郵件和下載語音郵件,篩選語音郵件是匹配 郵件主題的過程,目的是確認(rèn)哪一封郵件是語音郵件,隨后將根據(jù)篩 選結(jié)果將新的語音郵件下載到本地并存儲在數(shù)據(jù)庫內(nèi);閱讀郵件是根 據(jù)用戶的語音選擇,查詢數(shù)據(jù)庫并播放相應(yīng)的郵件附件。
全文摘要
本發(fā)明涉及一種實現(xiàn)語音郵件服務(wù)的方法,所采用的方法是使用現(xiàn)有的商業(yè)語音服務(wù)器,接受和識別用戶通過電話終端發(fā)出的語音指令,將人的語音指令轉(zhuǎn)換成計算機(jī)可以識別的操作指令,并將包含有操作指令的HTTP請求發(fā)送給Web服務(wù)器;將語音郵件客戶端部署在特定的Web服務(wù)器上,實現(xiàn)對郵件服務(wù)器的訪問和相關(guān)操作(發(fā)送郵件和接受郵件)。本發(fā)明具有以下特點1.提出電話(包括SIP電話或VOIP電話等)訪問電子郵箱的語音郵件服務(wù)模式;2.將語音瀏覽技術(shù)與電子郵件技術(shù)相結(jié)合,提出了基于VoiceXML的語音郵件客戶端的邏輯結(jié)構(gòu)及核心模塊的處理流程。
文檔編號H04L29/06GK101127733SQ20071005285
公開日2008年2月20日 申請日期2007年7月26日 優(yōu)先權(quán)日2007年7月26日
發(fā)明者根 馮, 青 楊 申請人:武漢理工大學(xué)