專利名稱:用于語音門戶服務(wù)器的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于語音門戶服務(wù)器的方法和裝置。其特別涉及服務(wù)于環(huán)球網(wǎng)門戶應(yīng)用的語音門戶服務(wù)器的方法和裝置。
背景技術(shù):
許多移動的雇員在汽車內(nèi)或者諸如下列其他地點花費了相當多的時間,在上述地點語音電話(有線的或者蜂窩的)是唯一可行的通信手段和唯一的訪問遠程信息源的方法。隨著越來越多的工作必須對商務(wù)應(yīng)用進行自助訪問,自動語音訪問成為關(guān)鍵之需。據(jù)估計,大約一半的蜂窩電話呼叫來源于汽車。對于職業(yè)勞動者中的相當一部分來說,移動電話已經(jīng)開發(fā)了每周上下班交通時間的數(shù)個小時以用于高效的商務(wù)目的。提供電話訪問的公司相對于那些沒有提供電話訪問的公司獲得了競爭的優(yōu)勢。當新的移動計算設(shè)備提供遠程訪問時,它們小的可視化顯示器和受限的輸入能力常常會帶來令人沮喪和厭煩的體驗。例如,利用語音從長列表或菜單中進行項目的選擇就要高效得多,其簡化了諸如在地址簿中查找姓名、在日歷中選擇日期或查找具有特定主題行的記錄的動作。
有些具有殘疾的雇員無法使用可視化界面的設(shè)備,而另一些雇員無法使用依賴完好的手控制的輸入設(shè)備。對于這些個人,語音訪問不僅具有競爭優(yōu)勢;它還是完成他們的工作的基本需要。如果語音訪問不僅是支持語音可視化界面;它就需要對用于談話交互的應(yīng)用進行根本上的重新設(shè)計。
語音界面的主要障礙是計算機生成的語音具有不自然和難于理解的性質(zhì)。近來在文本到話音連接技術(shù)的利用中的突破已經(jīng)消除了這種限制并使得語音質(zhì)量可以與人類的話音相比。話音識別的準確性也繼續(xù)得到改進,使得日常生活中成百萬的人們使用他們的語音通過說出一個人的名稱來“撥打”電話號碼、管理他們的投資證券,以及訪問天氣信息、體育比分或者其他信息。除了技術(shù)上的改進,對交談對話設(shè)計的持續(xù)細化也帶來了比早期語音激活系統(tǒng)所提供的體驗高效得多并且愉快得多的用戶體驗。硬件上的進步也使得能夠部署對大量同時的呼叫者的自動支持而無需大量資本的投入。特別是CPU處理能力、存儲器和電話接口卡的成本已經(jīng)通過摩爾定律的法則大大降低。
接著出現(xiàn)的最重要的一部分是VoiceXML的可利用性,VoiceXML是由所有主要的話音技術(shù)提供者支持的基于開放標準的語音應(yīng)用設(shè)計協(xié)議。該標準被設(shè)計為允許語音應(yīng)用在所有企業(yè)質(zhì)量的計算機硬件和操作系統(tǒng)平臺上運行。這些公司能夠確信它們在VoiceXML應(yīng)用基礎(chǔ)架構(gòu)上的投資不會將它們鎖定到對于關(guān)鍵系統(tǒng)組件的單一提供商。語音應(yīng)用開發(fā)通常需要各種技能、知識和編程技術(shù),包括專用集成語音響應(yīng)(IVR)應(yīng)用開發(fā)環(huán)境;專用IVR環(huán)境和中間件應(yīng)用之間的接口連接;利用話音識別和話音合成技術(shù);談話設(shè)計以及中間件設(shè)計。
特別將VoiceXML引入用于消除對私有IVR應(yīng)用設(shè)計環(huán)境的需要,以便利用環(huán)球網(wǎng)應(yīng)用設(shè)計的基于視圖和表單(view-and-form)的模型而自動提供中間件的集成,并創(chuàng)建到話音識別和話音合成技術(shù)的標準接口。VoiceXML使得語音應(yīng)用服務(wù)器能夠以與環(huán)球網(wǎng)應(yīng)用服務(wù)器集成HTML接口能力相同的方式集成語音接口能力。該協(xié)議利用在全部訪問形態(tài)中可共享的通用組件提供模塊化的應(yīng)用設(shè)計環(huán)境。
不僅僅是語音技術(shù)得到了發(fā)展,環(huán)球網(wǎng)門戶形式的用戶界面技術(shù)也得到了發(fā)展。門戶用作為針對數(shù)個環(huán)球網(wǎng)應(yīng)用的簡單的、同步統(tǒng)一的訪問點。門戶提供了一種運行時間平臺和工具,它們給出多頁面間一致的展示視圖、對訪問應(yīng)用的導(dǎo)航控制以及個性化的選擇和用戶定制內(nèi)容。IBM WebSphere門戶服務(wù)器基礎(chǔ)架構(gòu)通過提供以下功能完成上述這些提供對全體范圍內(nèi)的用戶、設(shè)備和用戶定制選項的信息進行訪問;整合商務(wù)流程并使其自動化;建立、連接并管理應(yīng)用。提供廣泛存在的門戶是新一代應(yīng)用的一部分,新一代應(yīng)用被設(shè)計用于從各種遠程訪問設(shè)備中獲得信息并執(zhí)行事務(wù)。此外,門戶平臺理想地用于通過通用個性化存儲并共享的商務(wù)邏輯支持語音和可視化訪問。
大多數(shù)現(xiàn)有的自動的語音方案都是利用與到后端商務(wù)邏輯和數(shù)據(jù)的客戶界面相結(jié)合的私有語音應(yīng)用環(huán)境創(chuàng)建的。這些客戶界面難以與常規(guī)的GUI環(huán)球網(wǎng)訪問方案相集成。然而,IBM WebSphere語音應(yīng)用訪問(WVAA)將IBM WebSphere門戶服務(wù)器的模塊化應(yīng)用設(shè)計與VoiceXML相結(jié)合,以便將語音訪問添加到由WebSphere門戶服務(wù)器支持的其他形態(tài)中。通過建立在VoiceXML之上,不僅語音應(yīng)用開發(fā)者不斷擴大的社區(qū)可以直接操控WVAA平臺,而且平臺客戶也應(yīng)該能夠在指引話音識別和文本到話音提供之間進行選擇。
語音界面,如利用WVAA提供的那些語音界面和門戶中純可視化環(huán)球網(wǎng)應(yīng)用相比具有顯著的優(yōu)勢。圖形用戶界面(GUI)趨向于在每一屏上具有大量能夠飽和用戶的文本。相對于寫出的指令,大多數(shù)人都會更容易地遵循所說的對話。也許最大的優(yōu)勢是對話焦點——通過一步一步地談話提示引導(dǎo)用戶。另一方面,在自然的談話中,人們可以以各種方式回答即使是非常簡單的問題,經(jīng)常超出問題的范圍之外。例如,他們可以回答問題并然后解釋他們的答案。設(shè)計一個自動系統(tǒng),使之能夠“理解”這些任意的輸入中的大部分通常是相當復(fù)雜和不可行的。因此,重要的是引導(dǎo)人們所說的輸入,使之與計算機語音識別強度相匹配。
基于多個應(yīng)用部署的體驗,為電話訪問所設(shè)計的語音界面在過去的數(shù)年間已經(jīng)有了顯著的發(fā)展。所獲得的最重要的方面中的一些包括談話流必須是高效的、一致的和直觀的。使用自信分值避免確認每個條目;確認導(dǎo)航命令在門戶中的所有應(yīng)用中一致;談話流應(yīng)該對大多數(shù)用戶都是“有意義的”。提示必須經(jīng)過仔細推敲,短而明確。大多數(shù)用戶都應(yīng)該清楚到底要對系統(tǒng)說什么。幫助提示必須短。對于每個提示,用戶可以簡單地不必記住比一條信息還多得多的信息。該系統(tǒng)應(yīng)該在適當?shù)臅r候向用戶“披露自己”。可以在談話陷于困境時使用依賴于上下文的幫助,并在事情順利時提供快捷方式以幫助用戶逐漸掌握系統(tǒng)。
可視化和語音界面之間的另一不同是門戶導(dǎo)航??梢暬T戶設(shè)計是基于在一個單獨的可看見的頁面中展示頂級視圖的概念,但大多數(shù)用戶并不關(guān)心頁面上的組件來自不同的門戶組件??梢暬T戶組件的導(dǎo)航問題是尋找包含正確應(yīng)用的頁面。為了支持大量應(yīng)用,門戶可以將相似的頁面劃分為一個頁面組。這些可視化概念對于語音界面沒有用。盡管這里會有些重疊,例如主要的類型在可視化和語音之間可以是相同的,語音的導(dǎo)航菜單結(jié)構(gòu)很可能非常不同,這是出于以下幾點原因會存在一些只能是可視化的門戶組件和一些只能是語音的門戶組件;應(yīng)用可以被放在頁面上,因為它們可視化地放在一起很適合,而在語音菜單中不同的組織將更具有意義;并且許多語音目標可以作為快捷方式而不是普通菜單選擇實現(xiàn),以便將提示保持為短提示。換句話說,語音界面決不僅僅是可視化界面簡單的語音支持。
語音應(yīng)用的大多數(shù)都將是指導(dǎo)性對話設(shè)計,因為這些創(chuàng)建起來最簡單,并且在很多情況下也是最易于使用的。自動系統(tǒng)控制指導(dǎo)性的對話設(shè)計,提供一組特定的選擇。這一范例(也已知為系統(tǒng)主動(systeminitiative))對于用戶是最易學(xué)的,但是對于復(fù)雜的應(yīng)用,它可能是低效的和令人厭煩的?;旌现鲃訉υ捲O(shè)計允許系統(tǒng)和用戶在適當時對對話進行控制。因為大多數(shù)語音訪問應(yīng)用都將是指導(dǎo)性對話,因此IBMWebSphere語音應(yīng)用訪問為指導(dǎo)性對話應(yīng)用提供了高級應(yīng)用設(shè)計環(huán)境。重點放在利用針對談話對話的最佳實現(xiàn)促使迭代實現(xiàn)、調(diào)試和加強設(shè)計的工具上。
圖1示出環(huán)球網(wǎng)瀏覽器提供的示例性環(huán)球網(wǎng)門戶20,在該門戶的頁面1上具有兩個門戶組件24和26。環(huán)球網(wǎng)聚集器提供標題行,左側(cè)的頁面菜單,為每個門戶組件提供了標題欄(“皮膚”),并要求每個門戶組件對自己進行呈現(xiàn)。沒有選擇頁面2和3,則其以灰色顯示。門戶24是電子郵件門戶,菜單項24A、24B和24C分別為“查電子郵件”、“寫信”以及“移動到文件夾”。門戶26是日歷門戶,菜單項26A、26B和26C分別包括“新條目”;“新環(huán)球網(wǎng)會議”以及“編輯”。圖上可以看到其他菜單項,但并沒有被引用。功能性的和示例性的語音應(yīng)用門戶組件可以在系統(tǒng)安裝時包括進來或者通過下載獲得。關(guān)鍵的功能性門戶組件的例子是對電子郵件和日歷的Lotus Notes R5訪問。其它門戶組件的例子是對聯(lián)系信息的Lotus Notes R5訪問;以及Microsoft Exchange 2000的訪問。
圖2示出用于例如環(huán)球網(wǎng)門戶20的各個單元的層次結(jié)構(gòu),環(huán)球網(wǎng)門戶20具有圖1中的頁面1、2和3。頁面1包括兩個門戶24和26。這兩個門戶包括至少三個菜單項24A、24B、24C和26A、26B、26C。其他門戶組件27和28以及對應(yīng)的菜單項沒有詳細示出,但是在許多組合中可以存在?,F(xiàn)有的環(huán)球網(wǎng)門戶的語音聚集將生成一個遵循相同層次結(jié)構(gòu)的語音門戶菜單,例如讓電話用戶首先選擇門戶頁面1、2或3。在例如頁面1被選擇后,讓用戶其次選擇門戶組件21、22或23。之后,例如門戶組件21被選擇,讓用戶第三選擇門戶組件中的哪個菜單項,例如26A、26B或26C。在具有三個連續(xù)的菜單選擇組的語音環(huán)境中,選擇正確的菜單項十分令人厭煩。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,提供了一種為門戶組件的集合建立語音提示菜單的方法,其包括獲得門戶組件的列表;建立包括語音菜單項的語音菜單以激活每個門戶組件;獲得包含定制信息的門戶組件特征文件;以及利用門戶組件特征文件中的定制信息調(diào)整語音菜單。
該實施方式的特征是環(huán)球網(wǎng)門戶組件可以針對語音聚集器考慮的事項例如在語音門戶菜單的層次結(jié)構(gòu)中針對其菜單項的位置處定義用戶特性。
該實施方式擴展了門戶體系結(jié)構(gòu),允許門戶組件限定影響整個頁面如何呈現(xiàn)的特性。門戶組件優(yōu)選的特性列表被稱為“門戶組件特征文件”。視圖聚集器基于門戶組件優(yōu)選的特性創(chuàng)建標記,并處理門戶組件之間任何的沖突特性。
優(yōu)選地,調(diào)整步驟增加了用于激活門戶組件中的功能的語音菜單項。例如,門戶組件包括菜單項的層次結(jié)構(gòu),在前建立的語音菜單可以包括所有門戶組件的頂級菜單項列表,并且附加菜單項是用于一個或多個門戶組件中處于較低級的菜單項。
有利地,向語音菜單增加語音菜單項的步驟向語音菜單增加了另一選項。另一可選方案是替代門戶組件的選項,使得門戶組件的頂級菜單不能再被訪問。
適當?shù)兀{(diào)整步驟用特征文件中指定的DTMF鍵替代了用于激活特定的菜單項的缺省DTMF鍵。該調(diào)整步驟可以向語音菜單增加語音識別語法詞語。
現(xiàn)在將參照附圖僅以示例的方式描述本發(fā)明的實施方式。在附圖中圖1示出來自示例門戶的環(huán)球網(wǎng)瀏覽器生成的環(huán)球網(wǎng)門戶頁面,其包括兩個門戶組件;圖2示出示例環(huán)球網(wǎng)門戶中單元的層次結(jié)構(gòu);圖3是包括語音門戶服務(wù)器的本發(fā)明優(yōu)選實施方式的裝置的示意圖;以及圖4是優(yōu)選實施方式的方法的更詳細系統(tǒng)圖。
具體實施例方式
圖3示出優(yōu)選實施方式的主要組件,包括語音門戶服務(wù)器10、語音服務(wù)器12、電話服務(wù)器14和電話16。HTTP VoiceXML標記11被傳送到包括 VoiceXML瀏覽器和基礎(chǔ)自動話音識別和文本到話音(ASR/TTS 62)技術(shù)的語音服務(wù)器12。話音服務(wù)器12是基于IBM語音服務(wù)器5.0版本的。電話服務(wù)器14(基于IBM WebSphere語音響應(yīng)3.1版本(WVR))通過電話網(wǎng)絡(luò)18提供與用戶電話16的連通性。電話網(wǎng)絡(luò)18是PSTN或VoIP。
語音門戶服務(wù)器10是基于IBM WebSphere語音應(yīng)用訪問2.0版本(WVAA)的。語音門戶服務(wù)器10包括門戶組件24、26、27、28和語音聚集器46。門戶組件傳送VoiceXML標記,并且語音聚集器合并來自所有的門戶組件的VoiceXML標記并且創(chuàng)建包括對全局主菜單的支持的單獨的完整VoiceXML文檔。門戶組件24、26和27具有相關(guān)聯(lián)的portlet.xml文件54A、54B和54C以及特征文件56A、56B和56C,所有的文件都包含在語音應(yīng)用服務(wù)器10內(nèi)的門戶組件容器58中。
門戶服務(wù)器是可以將由數(shù)個小應(yīng)用(門戶組件)產(chǎn)生的內(nèi)容聚集到一個單獨的視圖中的應(yīng)用服務(wù)器。語音門戶服務(wù)器將內(nèi)容聚集到一個單獨的語音表現(xiàn)中。在門戶服務(wù)器內(nèi)部,門戶組件容器控制每個門戶組件的生命周期。門戶組件可以被放置在頁面上。可以賦予用戶對頁面和門戶組件的訪問許可。門戶組件容器確保頁面和門戶組件僅對于那些具有正確的許可的用戶是可訪問的。
標準門戶組件規(guī)范(JSR168)已經(jīng)說明,每個門戶組件具有稱為portlet.xml的部署描述符文件(見56A、56B和56C)。這些文件向門戶組件容器提供了有關(guān)門戶組件的信息,如門戶組件類型名稱、門戶組件標題,以及所支持的模式。該實施方式引入了語音門戶的另一資源,“門戶組件特征文件”(profile.xml),其向聚集器提供了有關(guān)門戶組件的信息。門戶組件特征文件限定了聚集器將在語音菜單聚集中遵循并使用的特性列表。該聚集器將根據(jù)這些特性改變其輸出。
聚集器46是負責基于頁面和門戶組件呈現(xiàn)單獨門戶語音界面的組件。不同的聚集器可以為不同的標記話言(例如html、wml、vxml)呈現(xiàn)視圖。語音聚集器46是運行時間模塊,其使得當前用戶可以支持語音應(yīng)用并實現(xiàn)了導(dǎo)航到特定應(yīng)用所需的語音菜單。在該實施方式中,語音聚集器46包括特征文件控制器48、VoiceXML建立器50和剖析器(profiler)52。
特征文件控制器48獲取對于每個門戶組件的特征文件信息。
VoiceXML建立器50針對每個門戶組件定義缺省值并生成缺省VoiceXML。
剖析器52根據(jù)由特征文件控制器48獲得的特征文件中的信息調(diào)整缺省VoiceXML應(yīng)用。
語音服務(wù)器12包括瀏覽器60;自動話音識別(ASR)62和文本到話音引擎(TTS)63。語音服務(wù)器12通過電話服務(wù)器14連接到用戶電話66。
電話服務(wù)器14提供連接到電話網(wǎng)絡(luò)(如PSDN或VoIP)的技術(shù),并基于根據(jù)IBM WebSphere語音響應(yīng)3.1版本的電話接口。
VoiceXML標記由聚集器46利用標準HTTP連接發(fā)送到順應(yīng)性VoiceXML瀏覽器60。VoiceXML瀏覽器60與ASR 62/TTS 63一起工作以便解釋話音輸入,并生成語音輸出。瀏覽器60也可以接受DTMF(電話小鍵盤)作為輸入,并使用預(yù)先錄制的音頻文件作為輸出。為了解釋語音輸入,ASR 62使用標識可識別詞語的活躍的詞匯。這些詞匯還限定了允許的詞語序列;詞匯和特定詞語排序的組合被稱為話音識別語法。語法中的每個詞語通過拼寫表示,但它實際為ASR 62所使用的詞語的讀音。盡管ASR 62和TTS 63話音技術(shù)具有詞語讀音的大詞典,但是應(yīng)用會經(jīng)常使用該詞典之外的詞語或縮寫,這就需要對新讀音進行定義。
通過缺省值,聚集器46使用門戶組件的標題作為激活語法。在本實施方式中,語音門戶聚集器支持由每個門戶組件的特征文件所包含的“激活語法”特性。激活語法限定用戶可以說什么來激活門戶組件。除了接受缺省以外,電子郵件門戶組件可以限定其激活語法為“消息”或“郵件”。聚集器將使得這些存儲在每個門戶組件的特征文件中的語法能夠激活電子郵件門戶組件。
需要工具促成建立語法和讀音,并創(chuàng)建良好質(zhì)量的談話呼叫流。語音工具包70是基于IBM語音應(yīng)用訪問工具包70的。語音工具包70是用于創(chuàng)建并調(diào)試語音聚集、語音門戶組件并且用于定制WVS話音技術(shù)的工具的集合。
圖4利用正在進行的例子示出了聚集器的方法。
在步驟101,聚集器46獲取待聚集的門戶組件,并取回任何相關(guān)聯(lián)的特征文件56A和56B。在此情況下,取回了電子郵件門戶組件24和日歷門戶組件26。取回了電子郵件門戶組件特征文件56A(在此例中,日歷門戶組件特征文件被視為空)。
電子郵件門戶組件特征文件56A識別由標志“menu.email”指定的缺省頂級菜單項24,并將兩個偏好與該菜單項相關(guān)聯(lián)。第一偏好是將頂級菜單項與DTMF鍵“3”而不是缺省DTMF鍵相關(guān)聯(lián)。第二偏好是將附加語法“消息”與頂層菜單項相關(guān)聯(lián)。
電子郵件門戶組件特征文件56A還識別由標志“menu.email.get_email”指定的頂級菜單之下的菜單項24A,并將兩個偏好與該菜單項相關(guān)聯(lián)。。第一偏好是將菜單項24A與DTMF鍵“4”而不是缺省DTMF鍵相關(guān)聯(lián)。第二偏好是將語法“獲取郵件”與該菜單項相關(guān)聯(lián)。注意從名稱“獲取郵件”得到的缺省語法與特征文件語法“獲取郵件”之間的區(qū)別。
在步驟102,聚集器基于門戶信息建立缺省VoiceXML菜單110。在本例中,缺省VoiceXML菜單110以表格形式示出而不是純XML。聚集器46選擇第一門戶,在本例中是電子郵件門戶44A,并向頂級菜單項24分配第一DTMF鍵,在本例中是“1”。聚集器46進一步將由名稱確定的語法分配給菜單項24,在本例中為“電子郵件”。聚集器46之后選擇第二門戶,在本例中為日歷門戶44B,向頂級菜單項26分配第二DTMF鍵,在本例中為“2”。聚集器46進一步將由名稱確定的語法分配給菜單項26,在本例中為“日歷”。
在步驟103,聚集器將特征文件56A與缺省VoiceXML菜單110合并以便創(chuàng)建所剖析的VoiceXML菜單120。對于菜單項24,缺省DTMF鍵“1”變?yōu)樗饰龅腄TMF鍵“3”并將“消息”加入到語法中。菜單項26沒有變化。具有標志為“menu.email.get_email”的附加菜單項24A被加入菜單120,并給出與名稱對應(yīng)的一個缺省DTMF鍵4(下一可用鍵)和一個缺省語法“獲取電子郵件”。根據(jù)特征文件,增加另一語法“獲取郵件”。
將出現(xiàn)這樣的情況,網(wǎng)頁上的兩個門戶組件具有相互沖突的特征文件特性。例如兩個語音門戶組件都需要“3”的熱鍵特性,兩者都希望通過dtmf鍵3來激活。在此情況下,優(yōu)先權(quán)根據(jù)環(huán)球網(wǎng)頁上門戶組件的位置確定。優(yōu)先權(quán)從左至右,而后從上到下進行。
在本實施方式中,由特征文件已修改的或添加的門戶組件特性包括DTMF熱鍵,激活語法以及菜單項的層次結(jié)構(gòu)??梢孕薷幕蛟黾悠渌匦?,諸如菜單項結(jié)束的順序。
本領(lǐng)域的技術(shù)人員將很清楚本發(fā)明的方法可以適當?shù)貙崿F(xiàn)為不同于圖3中示出的邏輯安排。
本領(lǐng)域的技術(shù)人員也將很清楚本發(fā)明的邏輯安排也可以適當?shù)卦谌缦逻壿嬔b置中實現(xiàn),該裝置包括用于執(zhí)行該方法的步驟的邏輯裝置,這樣的邏輯裝置可以包括諸如在例如可編程邏輯陣列中的邏輯門之類的部件。這種邏輯安排可以進一步在如下使能裝置中實現(xiàn),該裝置用于臨時地或永久地在這種陣列中利用例如虛擬硬件描述符語言建立邏輯結(jié)構(gòu),其可利用固定的或可傳輸?shù)某休d介質(zhì)進行存儲。
將會理解,上述方法也適于在一個或多個處理器(未示出)上運行的軟件中全部或部分地執(zhí)行,并且該軟件可以作為在任何適當?shù)臄?shù)據(jù)載體(未示出)(如磁或光計算機盤上)執(zhí)行的計算機程序單元來提供。用于傳輸數(shù)據(jù)的信道也可以包括存儲所有描述符的存儲介質(zhì)以及信號承載介質(zhì),如有線或無線信號介質(zhì)。
本發(fā)明可以適當?shù)貙崿F(xiàn)為與計算機系統(tǒng)一起使用的計算機程序產(chǎn)品。這種實現(xiàn)可以包括一系列計算機可讀指令,其或者固定在有形介質(zhì),如計算機可讀介質(zhì)(例如磁盤、CD-ROM、ROM或硬盤)上或者也可以經(jīng)由調(diào)制解調(diào)器或其他接口設(shè)備通過有形介質(zhì)(包括但不限于光或模擬通信線路)或無形地利用無線技術(shù)(包括但不限于微波、紅外或其他傳輸技術(shù))傳輸給計算機系統(tǒng)。這一系列計算機可讀指令實現(xiàn)了這里前述的所有功能或部分功能。
本領(lǐng)域的技術(shù)人員將會理解,這種計算機可讀指令可以寫成多種編程語言,以用于利用多種計算機體系結(jié)構(gòu)或操作系統(tǒng)的。此外,這些指令可以利用當前或?qū)淼娜魏未鎯夹g(shù)進行存儲,或利用當前或?qū)淼娜魏瓮ㄐ偶夹g(shù)進行傳輸,上述存儲技術(shù)包括但不限于半導(dǎo)體、磁或光技術(shù),上述通信技術(shù)包括但不限于光、紅外或微波技術(shù)。應(yīng)當理解,這種計算機程序產(chǎn)品可以被發(fā)布為具有附帶打印的或電子的文檔的可移動介質(zhì)(例如用收縮性薄膜包裝的軟件)、被預(yù)裝載到計算機系統(tǒng)(例如,在系統(tǒng)ROM或固定盤上),或者經(jīng)由網(wǎng)絡(luò)(例如因特網(wǎng)或萬維網(wǎng))從服務(wù)器或者電子公告牌進行發(fā)布。
還應(yīng)當理解,本發(fā)明的實施方式可以以代表客戶部署的服務(wù)的形式進行提供,以提供隨需服務(wù)。
還應(yīng)當理解,上述優(yōu)選實施方式的各種進一步修改對于本領(lǐng)域的技術(shù)人員將是明顯的。
權(quán)利要求
1.一種為門戶組件集合建立語音提示菜單的方法,包括獲得門戶組件列表;建立包括語音菜單項的語音菜單,以激活所述每個門戶組件;獲得包含定制信息的門戶組件特征文件;以及利用所述門戶組件特征文件中的所述定制信息調(diào)整所述語音菜單。
2.根據(jù)權(quán)利要求1的方法,其中所述調(diào)整步驟增加用于激活門戶組件內(nèi)功能的語音菜單項。
3.根據(jù)權(quán)利要求1的方法,其中所述定制信息定義所述語音門戶菜單中菜單項的位置。
4.根據(jù)權(quán)利要求1、2或3的方法,其中所述調(diào)整步驟將用于激活特定菜單項的缺省DTMF鍵替代為所述特征文件中指定的DTMF鍵。
5.根據(jù)前述任一權(quán)利要求的方法,其中所述調(diào)整步驟向所述語音菜單增加語音識別語法詞語。
6.一種為門戶組件集合建立語音提示菜單的系統(tǒng),包括門戶組件控制器,用于獲得門戶組件列表并獲得包含定制信息的門戶組件特征文件;語音菜單建立器,用于建立包括語音菜單項的語音菜單,以激活所述每個門戶組件;以及剖析器,用于利用所述門戶組件特征文件中的所述定制信息調(diào)整所述語音菜單。
7.根據(jù)權(quán)利要求6的系統(tǒng),其中所述剖析器增加用于激活門戶組件內(nèi)功能的語音菜單項。
8.根據(jù)權(quán)利要求7的系統(tǒng),其中所述剖析器增加所述語音菜單項作為所述語音菜單的另一選項。
9.根據(jù)權(quán)利要求6、7或8的系統(tǒng),其中所述剖析器將用于激活特定菜單項的缺省DTMF鍵替代為所述特征文件中指定的DTMF鍵
10.根據(jù)權(quán)利要求6-9中任一項的系統(tǒng),其中所述剖析器向所述語音菜單增加語音識別語法詞語。
11.一種計算機程序產(chǎn)品,包括計算機可讀記錄介質(zhì),該介質(zhì)具有存儲在其上的用于為門戶組件集合建立語音提示菜單的計算機可讀代碼,當在計算機系統(tǒng)上加載并運行所述計算機可讀代碼時,執(zhí)行根據(jù)權(quán)利要求1-5中任一項的方法中的步驟。
全文摘要
本發(fā)明涉及一種用于服務(wù)于環(huán)球網(wǎng)門戶應(yīng)用的語音門戶服務(wù)器的方法和裝置。描述了為門戶組件集合建立語音提示菜單的方法、系統(tǒng)和計算機程序產(chǎn)品,包括獲得門戶組件列表;建立包括語音菜單項的語音菜單,以激活每個門戶組件;獲得包含定制信息的門戶組件特征文件;以及利用門戶組件特征文件中的定制信息調(diào)整語音菜單。本發(fā)明實施方式的特征是環(huán)球網(wǎng)門戶組件可以針對語音聚集器考慮的事項例如在語音門戶菜單的層次結(jié)構(gòu)中針對其菜單項的位置處定義用戶特性。
文檔編號H04M3/493GK1937674SQ20061012653
公開日2007年3月28日 申請日期2006年8月25日 優(yōu)先權(quán)日2005年8月27日
發(fā)明者馬修·詹姆斯·龐斯福德, 戴維·西格·倫肖, 威廉·約翰·伊澤德, 戴爾·魯濱遜·休伊特, 塞繆爾·喬納森·史密斯 申請人:國際商業(yè)機器公司