專利名稱:用于自動(dòng)生成語(yǔ)音xml文件的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及如何為網(wǎng)絡(luò)用戶自動(dòng)生成可以在萬(wàn)維網(wǎng)上發(fā)布消息的超文件置標(biāo)語(yǔ)言文件,具體地說(shuō),涉及如何為網(wǎng)絡(luò)用戶自動(dòng)生成可以在萬(wàn)維網(wǎng)上發(fā)布語(yǔ)音消息的VoiceXML(語(yǔ)音XML)文件。
目前流行的各種瀏覽器(例如Netscape Navigator)成為網(wǎng)絡(luò)用戶訪問(wèn)萬(wàn)維網(wǎng)的有效工具之一。這些瀏覽器是有助于網(wǎng)絡(luò)用戶請(qǐng)求和顯示來(lái)自WWW的文件信息或圖形信息的用戶接口。由瀏覽器顯示的信息除文件、圖形之外,還包括聲音和超鏈接等,因此人們通常將瀏覽器顯示的文件稱為超文本。在計(jì)算機(jī)中表達(dá)文字信息時(shí),若采用超文本方式,則既保留了信息的線性組織結(jié)構(gòu),又增加了鏈接結(jié)構(gòu)。它使文件信息的閱讀可以跳躍進(jìn)行,給閱讀者帶來(lái)許多方便。
隨著PvC設(shè)備的普及和流行,人們已不再滿足僅僅通過(guò)閱讀來(lái)瀏覽網(wǎng)絡(luò)信息,音頻廣播正在成為移動(dòng)用戶瀏覽網(wǎng)絡(luò)信息的主要方式之一。但是,瀏覽音頻文件不如瀏覽文本文件那么方便。其主要障礙是缺少交互方法。在這種情況下,用戶僅能被動(dòng)地收聽廣播信息。當(dāng)用戶聽到感興趣的話題時(shí),無(wú)法象在網(wǎng)絡(luò)上瀏覽HTML文件那樣選擇信息或獲得進(jìn)一步詳細(xì)的信息?;谡Z(yǔ)音識(shí)別技術(shù),通過(guò)對(duì)話/會(huì)話來(lái)選擇信息或獲得詳細(xì)信息的技術(shù)正日趨成熟。VoiceXML就是用于此用途的。但是對(duì)于普通網(wǎng)絡(luò)用戶來(lái)說(shuō),編寫VoiceXML文件不是一件容易的事情,需要用戶掌握和熟記大量規(guī)則、語(yǔ)法和標(biāo)記的定義。為此,本發(fā)明提供了一種用于自動(dòng)生成VoiceXML文件的方法和系統(tǒng)。
根據(jù)本發(fā)明的一個(gè)方面的用于自動(dòng)生成VoiceXML文件的方法,包括步驟提供圖形用戶界面,在所述圖形用戶界面中定義多個(gè)圖標(biāo),每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一個(gè)或多個(gè)屬性;記錄用戶調(diào)用所述圖形用戶界面中的圖標(biāo)的動(dòng)作流;以及,基于VoiceXML標(biāo)記庫(kù)對(duì)所述動(dòng)作流進(jìn)行解釋,生成VoiceXML文件。
根據(jù)本發(fā)明的另一個(gè)方面的用于自動(dòng)生成VoiceXML文件的系統(tǒng),包括圖形用戶接口,定義多個(gè)圖標(biāo),每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一個(gè)或多個(gè)屬性;VoiceXML標(biāo)記生成器,基于VoiceXML標(biāo)記庫(kù)解釋系統(tǒng)記錄的用戶動(dòng)作流,產(chǎn)生相應(yīng)的VoiceXML標(biāo)記;以及,VoiceXML文件生成器,根據(jù)VoiceXML語(yǔ)法,將需要播放的內(nèi)容與VoiceXML標(biāo)記生成器產(chǎn)生的標(biāo)記相組合,生成VoiceXML文件。
通過(guò)以下結(jié)合附圖的說(shuō)明,將使本發(fā)明的優(yōu)點(diǎn)、特點(diǎn)更加清楚和明確。
圖1示出如何為一段音頻加上超鏈接以及用戶如何與該超鏈接進(jìn)行交互;圖2示出根據(jù)本發(fā)明一優(yōu)選實(shí)施例的用于自動(dòng)生成VoiceXML文件的系統(tǒng)的方框圖;圖3示出根據(jù)本發(fā)明一優(yōu)選實(shí)施例的圖形用戶接口;圖4示出根據(jù)本發(fā)明另一優(yōu)選實(shí)施例的圖形用戶接口;圖5和圖6示出根據(jù)本發(fā)明一優(yōu)選實(shí)施例,使用圖2所示系統(tǒng)自動(dòng)生成VoiceXML文件的動(dòng)作流;圖7是一流程圖,示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例為TTSVoiceXML流加入超鏈接的工作過(guò)程;以及圖8是一流程圖,示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例為實(shí)時(shí)錄制的音頻VoiceXML流加入超鏈接的工作過(guò)程。
圖1描述了如何為一段音頻加上超鏈接以及用戶如何與該超鏈接進(jìn)行交互。如圖1所示,對(duì)于要播放的“IBM is the biggest ITcompany in the world”這樣一段文字,既可以組織成傳統(tǒng)的TTS(文件-語(yǔ)音)流,也可以是實(shí)時(shí)錄制的音頻流。為了便于用戶得到有關(guān)“IBM”的進(jìn)一步信息,可以為其加上一些屬性,如語(yǔ)音再現(xiàn)屬性、鏈接屬性等。這樣在播放以上文字時(shí),語(yǔ)音瀏覽器能以不同的語(yǔ)調(diào)(或其他屬性)強(qiáng)調(diào)“IBM”,以引起用戶注意。在播放過(guò)程中,當(dāng)用戶以DTMF音或其他方式選擇了“IBM”,語(yǔ)音瀏覽器則檢索與超鏈接相關(guān)的地址處的文檔,將有關(guān)“IBM”的進(jìn)一步信息播放給用戶。這樣,用戶就不僅僅是被動(dòng)地收聽廣播信息。當(dāng)用戶聽到感興趣的話題時(shí),可以象在網(wǎng)絡(luò)上瀏覽HTML文件那樣選擇信息或獲得進(jìn)一步詳細(xì)的信息。隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展,用戶不但可以通過(guò)DTMF音選擇超文本,并且對(duì)嵌入了語(yǔ)音識(shí)別器引擎的語(yǔ)音瀏覽器,用戶可以口授要選擇的超文本。
盡管VoiceXML具有以上種種優(yōu)點(diǎn),但是對(duì)于普通網(wǎng)絡(luò)用戶來(lái)說(shuō),編寫VoiceXML文件不是一件容易的事情,需要用戶掌握和熟記大量規(guī)則、語(yǔ)法和標(biāo)記的定義。為此,本發(fā)明提供了一種用于自動(dòng)生成VoiceXML文件的方法和系統(tǒng)。
圖2示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的用于自動(dòng)生成VoiceXML文件的系統(tǒng)的方框圖。如圖2所示,該系統(tǒng)包括定義多個(gè)圖標(biāo),每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一個(gè)或多個(gè)屬性的圖形用戶接口101;基于VoiceXML標(biāo)記庫(kù)解釋系統(tǒng)記錄的用戶動(dòng)作流,產(chǎn)生相應(yīng)的VoiceXML標(biāo)記的VoiceXML標(biāo)記生成器102;以及根據(jù)VoiceXML語(yǔ)法將需要播放的內(nèi)容和VoiceXML標(biāo)記生成器產(chǎn)生的標(biāo)記相組合生成VoiceXML文件的VoiceXML文件生成器103。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,該系統(tǒng)還可以包括用于存儲(chǔ)播放內(nèi)容的存儲(chǔ)器104;記錄用戶動(dòng)作流的記錄器105;語(yǔ)音識(shí)別器106;VoiceXML標(biāo)記庫(kù)107;以及VoiceXML語(yǔ)法庫(kù)108。當(dāng)使用該系統(tǒng)為一段TTS語(yǔ)音生成VoiceXML文件時(shí),用戶首先與系統(tǒng)的圖形用戶接口進(jìn)行交互。對(duì)于一段TTS流,用戶可以在圖形用戶接口提供的編輯區(qū)中編輯TTS語(yǔ)音流,標(biāo)記或鍵入需要加上VoiceXML屬性的部分,調(diào)用相應(yīng)的圖標(biāo)。圖3示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例的圖形用戶接口,并示出了一些用于說(shuō)明本發(fā)明的圖標(biāo)。這些圖標(biāo)可以對(duì)應(yīng)VoiceXML的一個(gè)或多個(gè)屬性,例如·語(yǔ)音再現(xiàn)屬性包括播音員的性別、語(yǔ)氣、速度等;·由增強(qiáng)的Barge-in功能實(shí)現(xiàn)的“指向”功能;·超鏈接等。
系統(tǒng)的動(dòng)作流記錄器105記錄用戶的動(dòng)作流,即用戶對(duì)圖形用戶接口中的圖標(biāo)的調(diào)用過(guò)程。然后,系統(tǒng)的VoiceXML標(biāo)記生成器102基于VoiceXML標(biāo)記庫(kù)107對(duì)用戶的動(dòng)作流進(jìn)行解釋,產(chǎn)生相應(yīng)的VoiceXML標(biāo)記。系統(tǒng)的VoiceXML文件生成器根據(jù)VoiceXML語(yǔ)法將產(chǎn)生的VoiceXML標(biāo)記與要播放的內(nèi)容相組合,生成VoiceXML文件。
當(dāng)使用該系統(tǒng)為一段實(shí)時(shí)錄制的音頻流生成VoiceXML時(shí),同樣,用戶也是首先與系統(tǒng)的圖形用戶接口進(jìn)行交互。在圖形用戶接口提供的編輯區(qū)中編輯實(shí)時(shí)錄制的音頻流,標(biāo)記或鍵入需要加入VoiceXML屬性的部分,調(diào)用相應(yīng)的圖標(biāo)。對(duì)于實(shí)時(shí)錄制的音頻流,當(dāng)用戶在編輯區(qū)內(nèi)鍵入需要加入VoiceXML屬性的部分時(shí),系統(tǒng)的VoiceXML標(biāo)記生成器102在對(duì)用戶的動(dòng)作流進(jìn)行解釋時(shí)要激活語(yǔ)音識(shí)別器106,尋找實(shí)時(shí)錄制的音頻流中與用戶鍵入部分相匹配的部分,以便在實(shí)時(shí)錄制的音頻流的相應(yīng)部分上加入VoiceXML屬性。以下分別是對(duì)于TTS語(yǔ)音流和實(shí)時(shí)錄制的音頻流使用該系統(tǒng)自動(dòng)生成的VoiceXML文件的例子。
例1<pre listing-type="program-listing"><![CDATA[<VoiceXML>…… ?。紁rompt bargein="true"><render.echo>IBM</render.echo>is thebiggest IT company in the world</prompt> ?。糽ink next="http//www.ibm.com/vxml/mail.vxml"> <grammer>IBM</grammer> <dtmf>1</dtmf> ?。?link> …… ?。?VXML>]]></pre>例2<pre listing-type="program-listing"><![CDATA[<VXML> …… <prompt bargein="true"><audio src="ibmwelcome.wav"></prompt><link next="http//www.ibm.com/vxml/mail.vxml"> <grammer>IBM</grammer> <dtmf>1</dtmf> ?。?link> …… </VXML>]]></pre>此外,當(dāng)用在圖形用戶界面的編輯區(qū)中多次標(biāo)記或鍵入相同的需要加入VoiceXML屬性的部分時(shí),并且指定的VoiceXML屬性相同時(shí),或者當(dāng)用戶在圖形用戶界面的編輯區(qū)中標(biāo)記或鍵入了需要加入VoiceXML屬性的部分,并且指定了VoiceXML屬性之后,在編輯區(qū)內(nèi)選擇了批處理方式之后,系統(tǒng)的VoiceXML文件生成器對(duì)整個(gè)存儲(chǔ)的TTS流或整個(gè)實(shí)時(shí)錄制的音頻流進(jìn)行處理,在與鍵入或標(biāo)記的需要加入VoiceXML屬性的部分相匹配的各個(gè)部分上分別加入標(biāo)記生成器根據(jù)用戶對(duì)圖標(biāo)的調(diào)用所指定的VoiceXML屬性,這樣將大大提高系統(tǒng)自動(dòng)生成VoiceXML文件的效率。
以上介紹了如何運(yùn)用圖2所示的系統(tǒng)自動(dòng)生成VoiceXML文件,簡(jiǎn)要地說(shuō),即如何為TTS流和實(shí)時(shí)錄制的音頻流加上各種VoiceXML屬性。在VoiceXML的各種屬性中,有一種非常重要的屬性超鏈接。正如前文所述,在計(jì)算機(jī)中表達(dá)文字信息時(shí),若采用超文本(超鏈接)方式,則既保留了信息的線性組織結(jié)構(gòu),又增加了鏈接結(jié)構(gòu)。它使文件信息的閱讀可以跳躍進(jìn)行,給閱讀者帶來(lái)許多方便。同樣,對(duì)于TTS流或?qū)崟r(shí)錄制的音頻流來(lái)說(shuō),加上超鏈接之后,網(wǎng)絡(luò)用戶可以向?yàn)g覽HTML文件那樣,在收聽VoiceXML文件過(guò)程中選擇信息或獲得進(jìn)一步的詳細(xì)信息。為此,根據(jù)本發(fā)明一優(yōu)選實(shí)施例的自動(dòng)生成VoiceXML文件的系統(tǒng),在圖形用戶接口中,提供了一個(gè)為VoiceXML文件自動(dòng)加入超鏈接的圖形用戶接口,如圖4所示,其中在該圖形用戶接口中,用戶通過(guò)標(biāo)記或鍵入相應(yīng)的需要加入超鏈接部分并鍵入相應(yīng)的超鏈接地址,則系統(tǒng)自動(dòng)為TTS流或?qū)崟r(shí)錄制的音頻流加上超鏈接。
圖5和圖6示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例使用圖2所示系統(tǒng)自動(dòng)生成VoiceXML文件的動(dòng)作流。如圖5所示,在第一步要生成VoiceXML文件頭,所以用戶在圖形用戶接口中調(diào)用與文件頭屬性相對(duì)應(yīng)的圖標(biāo)(例如圖3中左邊第一個(gè)圖標(biāo)301)。然后用戶調(diào)用圖標(biāo)302,系統(tǒng)則播放存儲(chǔ)在存儲(chǔ)器104中的內(nèi)容。例如是主菜單,0天氣預(yù)報(bào)、1股票、2訂票、3其他。用戶進(jìn)入圖4所示的圖形用戶接口鍵入或標(biāo)記出“0天氣預(yù)報(bào)”,并且鍵入鏈接地址。在此之后按照?qǐng)D6所示進(jìn)行以下工作。首先仍然是在圖形用戶接口中調(diào)用與文件頭屬性相對(duì)應(yīng)的圖標(biāo)。然后播放TTS流或?qū)崟r(shí)錄制的音頻流。在播放到“省”或“市”時(shí),調(diào)用相應(yīng)的圖標(biāo),為其加上VoiceXML屬性(或者VoiceXML超鏈接)。在用戶按以上方式通過(guò)用戶接口與系統(tǒng)完成交互之后,用戶動(dòng)作流記錄器就會(huì)記錄下用戶的整個(gè)操作過(guò)程,或者確切地說(shuō),是用戶對(duì)圖形用戶接口中圖標(biāo)的調(diào)用過(guò)程。系統(tǒng)的VoiceXML標(biāo)記生成器102對(duì)此動(dòng)作流進(jìn)行解釋生成相應(yīng)的VoiceXML屬性,系統(tǒng)的VoiceXML文件生成器103在TTS流或?qū)崟r(shí)錄制的音頻流上加上相應(yīng)的VoiceXML屬性,從而生成VoiceXML文件。
圖7是一流程圖,示出了根據(jù)本發(fā)明一優(yōu)選實(shí)施例為TTS流加入超鏈接的工作過(guò)程。如圖7所示,用戶首先在圖形用戶界面的編輯區(qū)中編輯TTS文件,這與編輯普通HTML文件一樣。對(duì)于需要加入VoiceXML超鏈接的部分,用戶可以鍵入亦可以標(biāo)記。調(diào)用相應(yīng)的圖標(biāo),并在此之后,用鍵入相應(yīng)的超鏈接地址。
圖8是一流程圖,示出了根據(jù)本發(fā)明的一優(yōu)選實(shí)施例為實(shí)時(shí)錄制的音頻流加入超鏈接的工作過(guò)程。其中當(dāng)用戶在圖形用戶接口的編輯區(qū)中鍵入需要加入超鏈接部分時(shí),要使用語(yǔ)音識(shí)別技術(shù)在實(shí)時(shí)錄制的音頻流中尋找與需要加入超鏈接部分相匹配的部分。
以上結(jié)合附圖描述了本發(fā)明的優(yōu)選實(shí)施例。正如本領(lǐng)域一般技術(shù)人所熟知的,在不背離本發(fā)明的精神實(shí)質(zhì)的情況下,本發(fā)明可以有許多修改和變型,因此,本發(fā)明旨在涵蓋所有的這些修改和變型。本發(fā)明的保護(hù)范圍由所附權(quán)利要求書限定。
權(quán)利要求
1.一種用于自動(dòng)生成VoiceXML文件的方法,包括步驟提供圖形用戶界面,在所述圖形用戶界面中定義多個(gè)圖標(biāo),每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一個(gè)或多個(gè)屬性;記錄用戶調(diào)用所述圖形用戶界面中的圖標(biāo)的動(dòng)作流;以及基于VoiceXML標(biāo)記庫(kù)對(duì)所述動(dòng)作流進(jìn)行解釋,生成VoiceXML文件。
2.根據(jù)權(quán)利要求1的方法,其特征在于所述圖形用戶界面包括為VoiceXML文件自動(dòng)加入超鏈接的圖形用戶界面,其中在該圖形用戶界面中定義的每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一種超鏈接。
3.根據(jù)權(quán)利要求2的方法,其特征在于當(dāng)需要加入超鏈接的VoiceXML文件是TTS VoiceXML流時(shí),用戶在圖形用戶界面的編輯區(qū)中編輯TTSVoiceXML文件、標(biāo)記或鍵入需要加入超鏈接的部分、調(diào)用相應(yīng)的圖標(biāo)并且鍵入相應(yīng)的超鏈接地址。
4.根據(jù)權(quán)利要求2的方法,其特征在于當(dāng)需要加入超鏈接的VoiceXML文件是實(shí)時(shí)錄制的音頻VoiceXML流時(shí),用戶在圖形用戶界面的編輯區(qū)中標(biāo)記或鍵入需要加入超鏈接的部分、調(diào)用相應(yīng)的圖標(biāo)并且鍵入相應(yīng)的超鏈接地址,并且在基于VoiceXML標(biāo)記庫(kù)對(duì)用戶動(dòng)作流進(jìn)行解釋時(shí),使用語(yǔ)音識(shí)別技術(shù)來(lái)尋找實(shí)時(shí)錄制的VoiceXML流中與用戶鍵入部分相匹配的部分。
5.根據(jù)權(quán)利要求3或4的方法,其特征在于當(dāng)用戶在圖形用戶界面的編輯區(qū)中多次標(biāo)記或鍵入相同的需要加入超鏈接部分,并且指定的鏈接屬性相同時(shí),以批處理方式對(duì)整個(gè)TTSVoiceXML流或?qū)崟r(shí)音頻VoiceXML流加入超鏈接。
6.一種用于自動(dòng)生成VoiceXML文件的系統(tǒng),包括圖形用戶接口,定義多個(gè)圖標(biāo),每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一個(gè)或多個(gè)屬性;VoiceXML標(biāo)記生成器,基于VoiceXML標(biāo)記庫(kù)解釋系統(tǒng)記錄的用戶動(dòng)作流,產(chǎn)生相應(yīng)的VoiceXML標(biāo)記;以及VoiceXML文件生成器,根據(jù)VoiceXML語(yǔ)法,將需要播放的內(nèi)容與VoiceXML標(biāo)記生成器產(chǎn)生的標(biāo)記相組合,生成VoiceXML文件。
7.根據(jù)權(quán)利要求6的系統(tǒng),其特征在于所述圖形用戶接口包括為VoiceXML文件自動(dòng)加入超鏈接的圖形用戶接口,其中在該圖形用戶接口中定義的每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一種超鏈接。
8.根據(jù)權(quán)利要求7的系統(tǒng),其特征在于當(dāng)需要加入超鏈接的VoiceXML文件是TTS VoiceXML流時(shí),用戶在圖形用戶接口提供的編輯區(qū)中編輯TTSVoiceXML文件、標(biāo)記或鍵入需要加入超鏈接的部分、調(diào)用相應(yīng)的圖標(biāo)并且鍵入相應(yīng)的超鏈接地址。
9.根據(jù)權(quán)利要求7的系統(tǒng),其特征在于當(dāng)需要加入超鏈接的VoiceXML文件是實(shí)時(shí)錄制的音頻VoiceXML流時(shí),用戶在圖形用戶接口提供的編輯區(qū)中標(biāo)記或鍵入需要加入超鏈接的部分、調(diào)用相應(yīng)的圖標(biāo)并且鍵入相應(yīng)的超鏈接地址,并且在基于VoiceXML標(biāo)記庫(kù)對(duì)用戶動(dòng)作流進(jìn)行解釋時(shí),使用語(yǔ)音識(shí)別技術(shù)來(lái)尋找實(shí)時(shí)錄制的VoiceXML流中與用戶鍵入部分相匹配的部分。
10.根據(jù)權(quán)利要求8或9的系統(tǒng),其特征在于當(dāng)用戶在圖形用戶接口提供的編輯區(qū)中多次標(biāo)記或鍵入相同的需要加入超鏈接部分,并且指定的鏈接屬性相同時(shí),以批處理方式對(duì)整個(gè)TTS VoiceXML流或?qū)崟r(shí)錄制的音頻VoiceXML流加入超鏈接。
全文摘要
本發(fā)明提供一種用于自動(dòng)生成VoiceXML文件的系統(tǒng),包括:圖形用戶接口,定義多個(gè)圖標(biāo),每一圖標(biāo)對(duì)應(yīng)于VoiceXML中的一個(gè)或多個(gè)屬性;VoiceXML標(biāo)記生成器,基于VoiceXML標(biāo)記庫(kù)解釋系統(tǒng)記錄的用戶動(dòng)作流,產(chǎn)生相應(yīng)的VoiceXML標(biāo)記;以及VoiceXML文件生成器,根據(jù)VoiceXML語(yǔ)法,將需要播放的內(nèi)容與VoiceXML標(biāo)記生成器產(chǎn)生的標(biāo)記相組合,生成VoiceXML文件。該系統(tǒng)可以為TTS流和實(shí)時(shí)錄制的音頻流自動(dòng)生成VoiceXML文件。
文檔編號(hào)G06F9/00GK1368719SQ01103368
公開日2002年9月11日 申請(qǐng)日期2001年2月2日 優(yōu)先權(quán)日2001年2月2日
發(fā)明者詹姆斯·耶赫, 蘇輝, 王茜鶯 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司