專利名稱:一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電信增值業(yè)務(wù)的自動語音識別應(yīng)用,尤其涉及的是,一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng)和方法。
背景技術(shù):
ASR(Auto Speech Recognize,自動語音識別)為根據(jù)事先定義的語法規(guī)則,對用戶說話的內(nèi)容進行識別,并輸出識別結(jié)果,免去按鍵的煩惱;即使用語法信息的形式來識別用戶的回答。系統(tǒng)可以根據(jù)識別的結(jié)果再結(jié)合ASR應(yīng)用與用戶進行交互完成比較復(fù)雜的業(yè)務(wù)。如語音電話本、自動聲訊臺等應(yīng)用都有ASR的應(yīng)用案例。
隨著電信、聯(lián)通、移動和網(wǎng)通等各大運營商增值業(yè)務(wù)的發(fā)展,大多數(shù)的業(yè)務(wù)都由SP(Service Provider,業(yè)務(wù)提供商)來完成,在SP提供的業(yè)務(wù)中,ASR資源的使用越來越廣泛。目前大多的SP業(yè)務(wù)開發(fā)能力很強,但對于ASR資源的集成則比較困難,且識別服務(wù)器品牌也比較多。目前,各廠商的ASR主要由客戶端和服務(wù)器兩個模塊組成。不同的廠商使用自定義接口,所以,對于SP來說必須針對不同廠商進行不同的開發(fā),對于SP來說開發(fā)難度較大。如果各個SP都建設(shè)自己的ASR資源平臺,還存在資源的浪費、使用不均衡問題,同時,SP各建一套對于運營商在管理上也會帶來問題,無法對SP有效的監(jiān)管。
因此,現(xiàn)有技術(shù)存在缺陷,需要改進。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng)和方法,用戶可以統(tǒng)一使用ASR資源平臺。
本發(fā)明的技術(shù)方案如下一種提供自動語音識別統(tǒng)一開發(fā)平臺的方法,包括以下步驟A1、用戶調(diào)用客戶端的自動語音識別接口;A2、所述客戶端發(fā)送自動語音識別的語法信息到服務(wù)器端;A3、所述服務(wù)器端解析所述語法信息,判斷所述語法信息正確,執(zhí)行步驟A4,否則不再執(zhí)行后續(xù)步驟;A4、所述服務(wù)器端向所述客戶端返回開始識別語音數(shù)據(jù)的請求;A5、所述客戶端連接到所述服務(wù)器端,并發(fā)送用戶的語音數(shù)據(jù);A6、所述服務(wù)器端進行自動語音識別,將識別結(jié)果返回到所述客戶端;A7、所述客戶端向用戶返回所述識別結(jié)果。
所述的方法,其中,所述步驟A2具體包括B1、所述客戶端連接到代理服務(wù)器端、初始化用戶參數(shù);B2、所述客戶端通過所述代理服務(wù)器端,發(fā)送自動語音識別的語法信息到服務(wù)器端;并且,所述步驟A4具體包括所述服務(wù)器端通過所述代理服務(wù)器端,向所述客戶端返回開始識別語音數(shù)據(jù)的請求。
所述的方法,其中,所述步驟B2之前還包括步驟所述客戶端向所述代理服務(wù)器端發(fā)送鑒權(quán)請求,鑒權(quán)成功則繼續(xù)執(zhí)行步驟B2,否則不再執(zhí)行后續(xù)步驟。
所述的方法,其中,所述步驟A6具體包括所述服務(wù)器端進行自動語音識別后,將識別結(jié)果通過所述代理服務(wù)器端,返回到所述客戶端。
所述的方法,其中,所述步驟A6還包括所述代理服務(wù)器端根據(jù)所述識別結(jié)果進行計費。
一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng),其中,包括客戶端模塊和服務(wù)器端模塊;所述客戶端模塊包括數(shù)據(jù)發(fā)送單元和識別單元;其中,所述數(shù)據(jù)發(fā)送單元用于接受所述識別單元的控制、向所述服務(wù)器端模塊發(fā)送語音數(shù)據(jù),所述識別單元還用于為用戶提供自動語音識別轉(zhuǎn)換接口;所述服務(wù)器端模塊用于實現(xiàn)用戶的自動語音識別功能。
所述的系統(tǒng),其中,其還包括代理服務(wù)器模塊;同時,所述客戶端模塊還包括初始化單元,用于初始化用戶參數(shù)、建立與所述代理服務(wù)器模塊的連接,所述識別單元還用于向所述代理服務(wù)器模塊發(fā)起自動語音識別請求和交互;所述代理服務(wù)器模塊包括主控單元和協(xié)議處理單元,所述主控單元用于實現(xiàn)所述協(xié)議處理單元、所述客戶端模塊和所述服務(wù)器端模塊之間的信息轉(zhuǎn)發(fā),所述協(xié)議處理單元用于處理所述自動語音識別請求、并與所述服務(wù)器端模塊交互自動語音識別信息;并且,所述識別單元還用于根據(jù)確定的所述自動語音識別信息,控制所述數(shù)據(jù)發(fā)送單元向所述服務(wù)器端模塊發(fā)送語音數(shù)據(jù)。
所述的系統(tǒng),其中,所述代理服務(wù)器模塊還包括與所述主控單元相交互的鑒權(quán)單元,用于認證用戶是否具備自動語音識別服務(wù)權(quán)限;所述識別單元還用于攜帶用戶的鑒權(quán)請求;所述主控單元還用于將所述鑒權(quán)請求信息發(fā)送給所述鑒權(quán)單元,得到鑒權(quán)結(jié)果,并返回給所述識別單元。
所述的系統(tǒng),其中,所述代理服務(wù)器模塊還包括與所述主控單元相連接的計費單元,用于對自動語音識別過程進行計費。
所述的系統(tǒng),其中,所述代理服務(wù)器模塊分別和所述客戶端模塊、所述服務(wù)器模塊通過TCP/IP協(xié)議連接,所述客戶端模塊和所述服務(wù)器模塊通過TCP/IP協(xié)議通訊。
采用上述方案,本發(fā)明為各運營商統(tǒng)一建立一套ASR資源平臺,各SP可以按需使用,SP在此基礎(chǔ)上可以很方便的在業(yè)務(wù)中集成ASR功能,同時ASR資源統(tǒng)一調(diào)配使用,大大提高資源的利用率,運營商可以對SP使用ASR資源計費,這種資源平臺建設(shè)模式既減少了總體投入成本,又促進了增值業(yè)務(wù)發(fā)展,可以真正實現(xiàn)了SP和運營商的雙贏??蓮V泛應(yīng)用于電信、移動、聯(lián)通的基于語音的業(yè)務(wù)范疇,完成各種語音識別的相關(guān)業(yè)務(wù),如語音電話本、自動聲訊臺等,可以提高運營商資源的利用率和系統(tǒng)安全性。本發(fā)明采用了分層架構(gòu),整個系統(tǒng)可擴展性強,ASR客戶端模塊、代理服務(wù)器模塊和ASR服務(wù)器模塊均可根據(jù)容量進行擴容,同時還具備了容量大的特點。
圖1為本發(fā)明系統(tǒng)的ASR統(tǒng)一開發(fā)平臺原理示意圖;圖2為本發(fā)明系統(tǒng)的ASR統(tǒng)一開發(fā)平臺結(jié)構(gòu)示意圖;圖3為本發(fā)明方法的ASR統(tǒng)一開發(fā)平臺系統(tǒng)ASR識別處理流程圖;圖4為本發(fā)明系統(tǒng)的ASR統(tǒng)一開發(fā)平臺具體實施示意圖;圖5為本發(fā)明方法的流程圖。
具體實施例方式
本發(fā)明提供了ASR平臺系統(tǒng)及方法,可以向第三方提供統(tǒng)一的ASR開發(fā)接口,實現(xiàn)ASR功能,并對第三方進行計費。以下對本發(fā)明的較佳實施例加以詳細說明。
如圖5所示,本發(fā)明提供了一種提供自動語音識別統(tǒng)一開發(fā)平臺的方法,包括以下步驟。
A1、用戶調(diào)用客戶端的自動語音識別接口;A2、所述客戶端發(fā)送自動語音識別的語法信息到服務(wù)器端;A3、所述服務(wù)器端解析所述語法信息,判斷所述語法信息正確,執(zhí)行步驟A4,否則不再執(zhí)行后續(xù)步驟;A4、所述服務(wù)器端向所述客戶端返回開始識別語音數(shù)據(jù)的請求;A5、所述客戶端連接到所述服務(wù)器端,并發(fā)送用戶的語音數(shù)據(jù);A6、所述服務(wù)器端進行自動語音識別,將識別結(jié)果返回到所述客戶端;A7、所述客戶端向用戶返回所述識別結(jié)果。
在具體實施中,一種實施方式是,所述步驟A2可以具體包括
B1、所述客戶端連接到代理服務(wù)器端、初始化用戶參數(shù);所述用戶參數(shù)可以包括用戶名、密碼、IP地址等等;B2、所述客戶端通過所述代理服務(wù)器端,發(fā)送自動語音識別的語法信息到服務(wù)器端。
并且,所述步驟A4具體包括所述服務(wù)器端通過所述代理服務(wù)器端,向所述客戶端返回開始識別語音數(shù)據(jù)的請求。
此時,具體實施中,在所述步驟B2之前還可以包括鑒權(quán)步驟所述客戶端向所述代理服務(wù)器端發(fā)送鑒權(quán)請求,鑒權(quán)成功則繼續(xù)執(zhí)行步驟B2,否則不再執(zhí)行后續(xù)步驟。
在實施代理服務(wù)步驟的基礎(chǔ)上,步驟A6具體可以包括所述服務(wù)器端進行自動語音識別后,將識別結(jié)果通過所述代理服務(wù)器端,返回到所述客戶端。還可以包括后續(xù)步驟所述代理服務(wù)器端根據(jù)所述識別結(jié)果進行計費,從而可以實現(xiàn)對客戶端的計費功能。
并且,如圖1所示,本發(fā)明還提供了一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng),該系統(tǒng)的第一種實施方式包括客戶端模塊和服務(wù)器端模塊;所述客戶端模塊包括數(shù)據(jù)發(fā)送單元和識別單元;其中,所述數(shù)據(jù)發(fā)送單元用于接受所述識別單元的控制、向所述服務(wù)器端模塊發(fā)送語音數(shù)據(jù),所述識別單元還用于為用戶提供自動語音識別轉(zhuǎn)換接口;所述服務(wù)器端模塊用于實現(xiàn)用戶的自動語音識別功能。
在第一種實施方式的基礎(chǔ)上,還可以提出所述系統(tǒng)的第二種實施方式,該系統(tǒng)還可以包括代理服務(wù)器模塊;同時,所述客戶端模塊包括數(shù)據(jù)發(fā)送單元、識別單元和初始化單元,所述初始化單元用于初始化參數(shù)、建立與所述代理服務(wù)器模塊的連接;此時,所述識別單元還用于向所述代理服務(wù)器模塊發(fā)起自動語音識別請求和交互。
此時,所述代理服務(wù)器模塊具體包括主控單元和協(xié)議處理單元,所述主控單元用于實現(xiàn)所述協(xié)議處理單元、所述客戶端模塊和所述服務(wù)器端模塊之間的信息轉(zhuǎn)發(fā),所述協(xié)議處理單元用于處理所述自動語音識別請求、并與所述服務(wù)器端模塊交互自動語音識別信息;并且,所述識別單元還用于根據(jù)確定的所述自動語音識別信息,控制所述數(shù)據(jù)發(fā)送單元向所述服務(wù)器端模塊發(fā)送語音數(shù)據(jù)。
在第二種實施方式的基礎(chǔ)上,還可以提出所述系統(tǒng)的第三種實施方式,所述代理服務(wù)器模塊還可以包括與所述主控單元相交互的鑒權(quán)單元,用于認證用戶是否具備自動語音識別服務(wù)權(quán)限;此時,所述識別單元還用于攜帶用戶的鑒權(quán)請求;并且,所述主控單元還用于將所述鑒權(quán)請求信息發(fā)送給所述鑒權(quán)單元,得到鑒權(quán)結(jié)果,并返回給所述識別單元。
在第三種實施方式的基礎(chǔ)上,還可以提出所述系統(tǒng)的第四種實施方式,所述代理服務(wù)器模塊還可以包括與所述主控單元相連接的計費單元,用于對自動語音識別過程進行計費。
本發(fā)明系統(tǒng)的一個實施例如圖1所示,其由ASR客戶端模塊、代理服務(wù)器模塊、ASR服務(wù)器模塊三個模塊組成。ASR客戶端模塊與代理服務(wù)器模塊間通過TCP/IP協(xié)議連接;代理服務(wù)器模塊與ASR服務(wù)器模塊間通過TCP/IP協(xié)議連接;ASR客戶端模塊與ASR服務(wù)器模塊間通過TCP/IP協(xié)議通訊。以下對各模塊的功能進行具體描述。
如圖2所示,所述ASR客戶端模塊,主要包括ASR初始化單元、ASR識別單元和ASR數(shù)據(jù)發(fā)送單元。其中,ASR數(shù)據(jù)發(fā)送單元是利用現(xiàn)有技術(shù)。具體的說,所述ASR初始化單元功能是完成與所述代理服務(wù)器模塊TCP連接的建立、參數(shù)初始化;所述ASR識別單元功能是對用戶提供ASR轉(zhuǎn)換接口,實現(xiàn)用戶鑒權(quán)信息的生成,向所述主控單元發(fā)起鑒權(quán)請求,根據(jù)用戶輸入的識別語法信息向所述代理服務(wù)器模塊的主控單元發(fā)起ASR請求,與所述主控單元進行識別過程協(xié)議交互并指示所述ASR數(shù)據(jù)發(fā)送單元向所述ASR服務(wù)器模塊發(fā)送語音數(shù)據(jù)進行識別;所述ASR數(shù)據(jù)發(fā)送單元功能是根據(jù)所述ASR識別單元的指示向所述ASR服務(wù)器模塊發(fā)送語音識別所需要的語音數(shù)據(jù)。
如圖2所示,所述代理服務(wù)器模塊主要包括主控單元、ASR協(xié)議處理單元、鑒權(quán)單元和計費單元。具體的說,所述主控單元功能是完成本模塊內(nèi)部各單元消息的轉(zhuǎn)發(fā),與ASR客戶端模塊和ASR服務(wù)器模塊進行消息轉(zhuǎn)發(fā);所述ASR協(xié)議處理單元功能是響應(yīng)來自ASR客戶端模塊的ASR請求,對ASR內(nèi)部協(xié)議進行解析,分配內(nèi)部資源,向ASR服務(wù)器模塊發(fā)起ASR轉(zhuǎn)換請求;所述鑒權(quán)單元功能是根據(jù)ASR識別單元帶上的鑒權(quán)信息進行用戶鑒權(quán),與ASR服務(wù)器模塊之間進行ASR鏈路建立,向ASR客戶端模塊返回鑒權(quán)結(jié)果;所述計費單元功能是對ASR識別過程進行計費。
所述ASR服務(wù)器模塊,用于實現(xiàn)ASR的識別功能,為各ASR服務(wù)廠商均提供標準的MRCP協(xié)議。
本發(fā)明系統(tǒng)的又一個實施例的處理流程如圖3所示,具體說明如下第一步用戶(包括SP)調(diào)用ASR識別相關(guān)接口函數(shù)。所述ASR初始化單元向所述代理服務(wù)器模塊進行TCP連接的建立及參數(shù)的初始化。
第二步所述ASR識別單元將組織鑒權(quán)信息和ASR識別語法信息向所述主控單元發(fā)起鑒權(quán)請求。所述主控單元解析鑒權(quán)請求,并轉(zhuǎn)發(fā)給所述ASR鑒權(quán)單元,如果鑒權(quán)成功,則進入第三步,否則,向所述ASR識別單元返回鑒權(quán)錯誤信息。
第三步所述主控單元向所述ASR服務(wù)器模塊發(fā)送需要的ASR識別語法信息,如果ASR服務(wù)器模塊解析語法正確,則向所述ASR識別單元返回開始識別請求。
第四步所述ASR數(shù)據(jù)發(fā)送單元向所述的ASR服務(wù)器模塊發(fā)送語音數(shù)據(jù)。
第五步所述ASR服務(wù)器模塊接收語音數(shù)據(jù),進行識別并將識別結(jié)果返回給所述主控單元,所述主控單元將根據(jù)識別結(jié)果則進行計費,同時,將識別結(jié)果返回給所述ASR識別單元。
第六步所述ASR識別單元向用戶返回結(jié)果。
本發(fā)明的系統(tǒng)由三個模塊組成,如圖2所示,ASR客戶端模塊、代理服務(wù)器模塊和ASR服務(wù)器模塊。實際應(yīng)用中,ASR客戶端一般是多個,最多支持上百個;根據(jù)實際情況,代理服務(wù)器模塊和ASR服務(wù)器模塊由多個組成,下面以三個ASR客戶端模塊,一個代理服務(wù)器模塊和二個ASR服務(wù)器模塊為例,說明ASR統(tǒng)一開發(fā)平臺的一種具體實施方式
,如圖4所示。需要說明的是,實際應(yīng)用中,也可以有多個代理服務(wù)器模塊。
ASR客戶端模塊,功能是向SP提供ASR識別接口,為了SP使用方便,接口函數(shù)采用了成熟的同步操作機制,由一個函數(shù)完成初始化,識別工作所述ASR初始化單元完成與所述代理服務(wù)器模塊TCP連接的建立和初始化;所述ASR識別單元完成用戶鑒權(quán)信息和ASR語法請求的封裝,并向所述代理服務(wù)器模塊發(fā)送ASR請求,與所述代理服務(wù)器進行MRCP協(xié)議(媒體錄制控制協(xié)議)交互。多個ASR客戶端模塊可由運營商統(tǒng)一分配用戶名密碼,如果更嚴格一些可以將IP與用戶名一起綁定進行鑒權(quán)。各ASR客戶端模塊間是相互獨立的。
代理服務(wù)器模塊,功能是對各SP的ASR請求進行鑒權(quán)認證,只有申請此功能的SP才能進行ASR轉(zhuǎn)換,保證SP的合法性;對ASR請求進行協(xié)議解析,對來自SP的ASR請求進行內(nèi)部資源的分配及路由,維護ASR服務(wù)器的負荷并進行負荷分擔,轉(zhuǎn)發(fā)ASR請求到相應(yīng)的ASR服務(wù)器;根據(jù)ASR識別結(jié)果進行計費,計費方式可按識別占用服務(wù)器資源時長計費、可識別次數(shù)計費等方式,計費單元可以使用標準的AAA(Authenticate/Authorize/Account)服務(wù)器進行計費也可以使用內(nèi)部協(xié)議進行計費。代理服務(wù)器模塊根據(jù)話務(wù)情況可以配置一個也可以配置多個。實際上,由于ASR采用的傳輸協(xié)議是標準的MRCP協(xié)議,所以,在不需要對用戶進行認證的情況下,此處的代理服務(wù)器也可以不用,由ASR客戶端直接與ASR服務(wù)器進行協(xié)議交互。
ASR服務(wù)器模塊,功能是對來自代理服務(wù)器模塊的ASR請求進行響應(yīng),并進行識別,接收來自ASR客戶端的語音數(shù)據(jù)并返回識別結(jié)果。根據(jù)具體現(xiàn)實情況ASR服務(wù)器模塊可以一套也可多套,多套間由代理服務(wù)器模塊進行負荷分擔處理。如圖4所示,為兩套ASR服務(wù)器模塊提供ASR服務(wù)。
下面結(jié)合附圖3、圖4對ASR統(tǒng)一開發(fā)平臺的使用方法及處理流程進行詳細說明。
第一步,如圖4所示,在這個系統(tǒng)SP業(yè)務(wù)提供商有兩個SP1和SP2,SP通過調(diào)用ASR客戶端模塊的接口函數(shù)ASRInit(),向代理服務(wù)器的主控單元發(fā)起初始化請求,建立與代理服務(wù)器的連接。
第二步,SP調(diào)用ASR客戶端模塊提供的ASR識別接口函數(shù)DoASR()組織用戶名、密碼等信息為鑒權(quán)請求,并且組織語法信息。
第三步,ASR識別單元發(fā)送ASR識別請求到代理服務(wù)器模塊的主控單元。
第四步,主控單元接收到ASR命令后,先解析ASR的鑒權(quán)請求,后轉(zhuǎn)發(fā)給鑒權(quán)單元進行鑒權(quán),如果成功則進入第五步,否則,向相應(yīng)的ASR識別單元返回錯誤。
第五步,主控單元將ASR開始請求轉(zhuǎn)發(fā)給ASR協(xié)議處理單元,ASR協(xié)議處理單元收到此命令后,首先分配內(nèi)部通道資源,然后根據(jù)如圖4所示的兩個ASR服務(wù)模塊的負荷情況決定由哪個ASR服務(wù)器模塊來負責此次ASR識別,即完成ASR服務(wù)器模塊的分配,將ASR識別請求封裝為MRCP協(xié)議轉(zhuǎn)發(fā)給ASR服務(wù)器模塊分配ASR通道資源和解析識別語法,如果成功則通過主控單元向ASR識別單元返回,并進入第六步,否則,向ASR識別單元返回錯誤。
第六步,ASR識別單元指示ASR數(shù)據(jù)發(fā)送單元向相應(yīng)的ASR服務(wù)器模塊發(fā)送識別需要的語音數(shù)據(jù)。
第七步,用戶調(diào)用接口函數(shù)向相應(yīng)的ASR服務(wù)器模塊發(fā)送識別需要的語音數(shù)據(jù),其中,該接口函數(shù)可由ASR數(shù)據(jù)發(fā)送單元提供。
第八步,ASR服務(wù)器模塊按語法對語音進行識別,并將識別結(jié)果返回給主控單元,主控單元根據(jù)識別結(jié)果進行計費,同時向ASR識別單元返回識別結(jié)果。
本發(fā)明提出的系統(tǒng)平臺可以給運營商統(tǒng)一建立一套ASR資源平臺,各SP可以按需使用,SP在此基礎(chǔ)上可以很方便的在業(yè)務(wù)中集成ASR功能,這樣SP可以專注于業(yè)務(wù)的開發(fā)而不必關(guān)心底層的技術(shù)實現(xiàn),同時ASR資源統(tǒng)一調(diào)配使用,大大提高資源的利用率,運營商可以對SP使用ASR資源計費,可以很快收回投資成本。因此,這種資源平臺建設(shè)模式既減少了總體投入成本,又促進了增值業(yè)務(wù)發(fā)展,可以真正實現(xiàn)了SP和運營商的雙贏。
該統(tǒng)一ASR開發(fā)平臺可廣泛應(yīng)用于電信、移動、聯(lián)通的基于語音的業(yè)務(wù)范疇,適用于通信、金融、醫(yī)院、集團公司和其他電話服務(wù)行業(yè),如銀行、電信運營商Call Center業(yè)務(wù)、醫(yī)院的掛號服務(wù)業(yè)務(wù)、各種增值服務(wù)業(yè)務(wù)、企業(yè)的客戶服務(wù)業(yè)務(wù)以及各種公共的電話服務(wù)業(yè)務(wù)。通過為運營商提供統(tǒng)一的ASR開發(fā)平臺,由SP進行基于ASR的業(yè)務(wù)開發(fā),完成各種語音識別的相關(guān)業(yè)務(wù),如語音電話本、自動聲訊臺等,可以提高運營商資源的利用率和系統(tǒng)安全性。
并且,本發(fā)明的系統(tǒng)采用了分層架構(gòu),整個系統(tǒng)可擴展性強,其中的ASR客戶端模塊、代理服務(wù)器模塊和ASR服務(wù)器模塊均可根據(jù)容量進行擴容,因此該系統(tǒng)還具備容量大的特點。
應(yīng)當理解的是,對本領(lǐng)域普通技術(shù)人員來說,可以根據(jù)上述說明加以改進或變換,而所有這些改進和變換都應(yīng)屬于本發(fā)明所附權(quán)利要求的保護范圍。
權(quán)利要求
1.一種提供自動語音識別統(tǒng)一開發(fā)平臺的方法,包括以下步驟A1、用戶調(diào)用客戶端的自動語音識別接口;A2、所述客戶端發(fā)送自動語音識別的語法信息到服務(wù)器端;A3、所述服務(wù)器端解析所述語法信息,判斷所述語法信息正確,執(zhí)行步驟A4,否則不再執(zhí)行后續(xù)步驟;A4、所述服務(wù)器端向所述客戶端返回開始識別語音數(shù)據(jù)的請求;A5、所述客戶端連接到所述服務(wù)器端,并發(fā)送用戶的語音數(shù)據(jù);A6、所述服務(wù)器端進行自動語音識別,將識別結(jié)果返回到所述客戶端;A7、所述客戶端向用戶返回所述識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A2具體包括B1、所述客戶端連接到代理服務(wù)器端、初始化用戶參數(shù);B2、所述客戶端通過所述代理服務(wù)器端,發(fā)送自動語音識別的語法信息到服務(wù)器端;并且,所述步驟A4具體包括所述服務(wù)器端通過所述代理服務(wù)器端,向所述客戶端返回開始識別語音數(shù)據(jù)的請求。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟B2之前還包括步驟所述客戶端向所述代理服務(wù)器端發(fā)送鑒權(quán)請求,鑒權(quán)成功則繼續(xù)執(zhí)行步驟B2,否則不再執(zhí)行后續(xù)步驟。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述步驟A6具體包括所述服務(wù)器端進行自動語音識別后,將識別結(jié)果通過所述代理服務(wù)器端,返回到所述客戶端。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟A6還包括所述代理服務(wù)器端根據(jù)所述識別結(jié)果進行計費。
6.一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng),其特征在于,包括客戶端模塊和服務(wù)器端模塊;所述客戶端模塊包括數(shù)據(jù)發(fā)送單元和識別單元;其中,所述數(shù)據(jù)發(fā)送單元用于接受所述識別單元的控制、向所述服務(wù)器端模塊發(fā)送語音數(shù)據(jù),所述識別單元還用于為用戶提供自動語音識別轉(zhuǎn)換接口;所述服務(wù)器端模塊用于實現(xiàn)用戶的自動語音識別功能。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,其還包括代理服務(wù)器模塊;同時,所述客戶端模塊還包括初始化單元,用于初始化用戶參數(shù)、建立與所述代理服務(wù)器模塊的連接,所述識別單元還用于向所述代理服務(wù)器模塊發(fā)起自動語音識別請求和交互;所述代理服務(wù)器模塊包括主控單元和協(xié)議處理單元,所述主控單元用于實現(xiàn)所述協(xié)議處理單元、所述客戶端模塊和所述服務(wù)器端模塊之間的信息轉(zhuǎn)發(fā),所述協(xié)議處理單元用于處理所述自動語音識別請求、并與所述服務(wù)器端模塊交互自動語音識別信息;并且,所述識別單元還用于根據(jù)確定的所述自動語音識別信息,控制所述數(shù)據(jù)發(fā)送單元向所述服務(wù)器端模塊發(fā)送語音數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述代理服務(wù)器模塊還包括與所述主控單元相交互的鑒權(quán)單元,用于認證用戶是否具備自動語音識別服務(wù)權(quán)限;所述識別單元還用于攜帶用戶的鑒權(quán)請求;所述主控單元還用于將所述鑒權(quán)請求信息發(fā)送給所述鑒權(quán)單元,得到鑒權(quán)結(jié)果,并返回給所述識別單元。
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于,所述代理服務(wù)器模塊還包括與所述主控單元相連接的計費單元,用于對自動語音識別過程進行計費。
10.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述代理服務(wù)器模塊分別和所述客戶端模塊、所述服務(wù)器模塊通過TCP/IP協(xié)議連接,所述客戶端模塊和所述服務(wù)器模塊通過TCP/IP協(xié)議通訊。
全文摘要
本發(fā)明公開了一種提供自動語音識別統(tǒng)一開發(fā)平臺的系統(tǒng)和方法,所述方法包括以下步驟A1.用戶調(diào)用客戶端的自動語音識別接口;A2.所述客戶端發(fā)送自動語音識別的語法信息到服務(wù)器端;A3.所述服務(wù)器端解析所述語法信息,判斷所述語法信息正確,執(zhí)行步驟A4,否則不再執(zhí)行后續(xù)步驟;A4.所述服務(wù)器端向所述客戶端返回開始識別語音數(shù)據(jù)的請求;A5.所述客戶端連接到所述服務(wù)器端,并發(fā)送用戶的語音數(shù)據(jù);A6.所述服務(wù)器端進行自動語音識別,將識別結(jié)果返回到所述客戶端;A7.所述客戶端向用戶返回所述識別結(jié)果。從而為各運營商統(tǒng)一建立一套ASR資源平臺,各SP可以按需使用,SP在此基礎(chǔ)上可以很方便的在業(yè)務(wù)中集成ASR功能。
文檔編號G10L15/22GK101079885SQ20071007613
公開日2007年11月28日 申請日期2007年6月26日 優(yōu)先權(quán)日2007年6月26日
發(fā)明者王景平, 劉斌, 何悅, 唐必勝 申請人:中興通訊股份有限公司