專利名稱:遠(yuǎn)程訪問系統(tǒng)和方法以及其智能代理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用自動語音識別來訪問計算機(jī)系統(tǒng)的遠(yuǎn)程訪問系統(tǒng)和方法。本發(fā)明也涉及計算機(jī)系統(tǒng)上的智能代理,該智能代理用于通過語音識別或文本轉(zhuǎn)語音回讀來幫助遠(yuǎn)程訪問和接收該計算機(jī)系統(tǒng)上的信息。
背景技術(shù):
臺式計算機(jī)和更大型計算機(jī)系統(tǒng)日益劇增地用于為客戶和商業(yè)用戶等存儲私有、安全和個人的信息。該信息不容易被客戶或商業(yè)用戶從他們所處的任何遠(yuǎn)程位置訪問到。諸如Visto和GoToMyPC等公司已開發(fā)了移動電話數(shù)據(jù)技術(shù),以允許遠(yuǎn)程客戶檢索一些他們辦公地點存儲在服務(wù)器或個人計算機(jī)上的信息,但是這些程序需要非常好的數(shù)據(jù)覆蓋網(wǎng)絡(luò)、高價智能移動設(shè)備、高昂的數(shù)據(jù)設(shè)計并且要求用戶有相當(dāng)?shù)募记?。除此之外,駕駛期間在汽車中使用它們是不實用或不安全的。
在此期望解決或改進(jìn)遠(yuǎn)程訪問計算機(jī)系統(tǒng)的現(xiàn)有方法中存在的一個或多個缺點或不足,或至少提供其有用的替代。
發(fā)明內(nèi)容
本發(fā)明的一個方面涉及一種通過公共網(wǎng)絡(luò)提供遠(yuǎn)程訪問計算機(jī)系統(tǒng)的方法,該方法包括的步驟為在服務(wù)器系統(tǒng)上接收來自計算機(jī)系統(tǒng)用戶的語音呼叫;處理語音呼叫期間從該用戶處接收的信息來生成識別信息;基于該識別信息認(rèn)證該用戶;至少部分地基于該識別信息建立該服務(wù)器系統(tǒng)和該計算機(jī)系統(tǒng)之間的連接;在服務(wù)器系統(tǒng)上接收來自該用戶的語音命令;基于所述的語音命令生成第一分組數(shù)據(jù);通過公共網(wǎng)絡(luò)將該第一分組數(shù)據(jù)傳送給該計算機(jī)系統(tǒng)上的代理;
從響應(yīng)該第一分組數(shù)據(jù)的代理處將第二分組數(shù)據(jù)接收到服務(wù)器系統(tǒng);以及基于該第二分組數(shù)據(jù)生成到該用戶語音呼叫的語音信號。
優(yōu)先地,該代理被構(gòu)造以解釋第一分組數(shù)據(jù)、詢問安裝在個人計算機(jī)上的應(yīng)用軟件以及基于該詢問生成第二分組數(shù)據(jù)。
在一個實施方案中,該方法還包括在服務(wù)器系統(tǒng)上接收來自位于計算機(jī)系統(tǒng)上的代理的計算機(jī)系統(tǒng)IP地址,其連接的建立也基于該IP地址。本實施方案適用于計算機(jī)系統(tǒng)被防火墻保護(hù)的情況。
本發(fā)明的另一方面涉及一種通過網(wǎng)絡(luò)提供遠(yuǎn)程訪問個人計算機(jī)的系統(tǒng),該系統(tǒng)包括一個連接到該網(wǎng)絡(luò)和電話網(wǎng)絡(luò)上的服務(wù)器系統(tǒng),該服務(wù)器系統(tǒng)被構(gòu)造為通過電話網(wǎng)絡(luò)接收來自個人計算機(jī)用戶的語音呼叫,以及在語音呼叫期間從該用戶接收信息和語音命令;至少部分地基于從該用戶接收的信息來確定該個人計算機(jī)的IP地址;基于該語音命令生成第一分組數(shù)據(jù);通過該網(wǎng)絡(luò)將該第一分組數(shù)據(jù)傳送給運(yùn)行在該個人計算機(jī)上的代理;通過該個人計算機(jī)接收來自該代理的第二分組數(shù)據(jù);以及基于該第二分組數(shù)據(jù)生成到該用戶的語音信號。
在一相關(guān)方面,本發(fā)明也涉及計算機(jī)可讀程序存儲庫,其上存有計算機(jī)程序指令,當(dāng)該指令被計算機(jī)系統(tǒng)運(yùn)行時,該計算機(jī)系統(tǒng)執(zhí)行如上所述的可提供遠(yuǎn)程訪問的方法。
本發(fā)明的另一方面涉及一種提供自動通知用戶的方法,該方法包括的步驟為在與該用戶相關(guān)聯(lián)的計算機(jī)上提供至少一條可用來確定通知事件發(fā)生的規(guī)則;應(yīng)用該至少一條規(guī)則來確定通知事件的發(fā)生;生成描述該通知事件的通知數(shù)據(jù);通過網(wǎng)絡(luò)將該通知數(shù)據(jù)傳送給服務(wù)器系統(tǒng),該服務(wù)器系統(tǒng)基于該通知事件和該用戶電話進(jìn)行通知的通信;
生成與該通知相應(yīng)的語音信號;建立到該用戶電話的電話連接;以及將該語音信號傳送給該用戶電話。
在一相關(guān)方面,本發(fā)明也涉及一種用于提供自動通知用戶的系統(tǒng),其中該系統(tǒng)包括智能代理,該智能代理運(yùn)行在與該用戶相關(guān)聯(lián)的計算機(jī)上,并且該系統(tǒng)包括程序代碼,該程序代碼用于使該系統(tǒng)執(zhí)行上文所述的提供自動通知的方法的步驟。
在又一相關(guān)方面,本發(fā)明還涉及計算機(jī)可讀媒介,其上存有一個或多個計算機(jī)處理器可執(zhí)行的計算機(jī)程序指令,該指令可使一個或多個計算機(jī)處理器執(zhí)行上文所述的提供自動通知的方法的步驟。
本發(fā)明的再一方面還涉及一種向用戶提供通知的方法,該方法包括通過網(wǎng)絡(luò)從與該用戶相關(guān)聯(lián)的計算機(jī)上的代理處接收連接請求;通過該網(wǎng)絡(luò)接收來自代理的通知數(shù)據(jù);處理該通知數(shù)據(jù)來生成語音通知;基于該連接請求建立到該用戶電話的電話連接;以及通過該電話連接將該語音通知傳送給該用戶電話。
優(yōu)選地,建立該連接的步驟包括從連接指令確定用戶標(biāo)識符,訪問數(shù)據(jù)庫以基于該用戶的標(biāo)識符確定該用戶的電話號碼以及呼叫該電話號碼。
在一相關(guān)方面,本發(fā)明也涉及一種用于向用戶提供通知的系統(tǒng),其中該系統(tǒng)包括與該用戶和代理通信的服務(wù)器系統(tǒng),并且該服務(wù)器系統(tǒng)被編程,以執(zhí)行上文所述的提供通知的方法的步驟。
在又一相關(guān)方面,本發(fā)明也涉及計算機(jī)可讀媒介,其上存有計算機(jī)可執(zhí)行的計算機(jī)程序指令,該指令使計算機(jī)系統(tǒng)執(zhí)行上文所述的提供通知的方法的步驟。
在又一相關(guān)方面,本發(fā)明涉及一種用于通過公共網(wǎng)絡(luò)遠(yuǎn)程訪問計算機(jī)系統(tǒng)的系統(tǒng),該系統(tǒng)包括一個服務(wù)器系統(tǒng),該服務(wù)器系統(tǒng)與公共電話網(wǎng)絡(luò)通信,用于從用戶操作的電話處接收語音呼叫,以及用于自動地將生成的語音信號傳送到該電話;以及一個位于該計算機(jī)系統(tǒng)上的代理,該代理與該服務(wù)器系統(tǒng)通信,并且被編程,以使其基于預(yù)定的用戶規(guī)則索引該計算機(jī)系統(tǒng)可訪問的信息,以及響應(yīng)一預(yù)定事件將信息傳送給服務(wù)器系統(tǒng);其中,當(dāng)該服務(wù)器系統(tǒng)接收來自該代理的信息時,該服務(wù)器系統(tǒng)被編程,以使其自動生成與該信息相應(yīng)的語音信號,以及將該語音信號傳送到與該用戶相關(guān)聯(lián)的注冊電話上。
在一個實施方案中,該計算機(jī)系統(tǒng)通過防火墻與該服務(wù)器系統(tǒng)分開,其中該代理被編程,以使其周期性地將該計算機(jī)系統(tǒng)的IP地址傳送給該服務(wù)器系統(tǒng)。
在一個實施方案中,該計算機(jī)系統(tǒng)是個人計算機(jī)。可替換地,該計算機(jī)系統(tǒng)是服務(wù)器系統(tǒng),并且該用戶在該服務(wù)器系統(tǒng)上有用戶帳號。
在一個實施方案中,該預(yù)定事件是從該代理發(fā)起的通知事件,該通知事件是由該代理基于至少一條用戶定義的規(guī)則生成的。
優(yōu)選地,該服務(wù)器系統(tǒng)還包括語音服務(wù)器,該語音服務(wù)器通過公共電話網(wǎng)絡(luò)與用戶通信,其中對被接收到的語音信號使用自動語音識別,對被傳送的語音信號使用自動的文本至語音轉(zhuǎn)換。
優(yōu)選地,該服務(wù)器系統(tǒng)還包括語音中繼服務(wù)器,該語音中繼服務(wù)器與該語音服務(wù)器通信以及與該代理通信,從該代理處接收信息,以及根據(jù)在語音服務(wù)器上接收的用戶語音命令將命令請求數(shù)據(jù)傳送給該代理。
優(yōu)選地,該服務(wù)器系統(tǒng)包括一個用戶信息數(shù)據(jù)存儲庫,語音中繼服務(wù)器將用戶認(rèn)證信息與該用戶信息數(shù)據(jù)存儲庫作比較,以認(rèn)證用戶,使其對該計算機(jī)系統(tǒng)的訪問,其中用戶認(rèn)證信息對應(yīng)于語音服務(wù)器上從用戶處接收的標(biāo)識口音。
附圖簡述下面參考附圖,僅以實施例的方式,進(jìn)一步詳細(xì)描述本發(fā)明的實施方案,其中
圖1是根據(jù)一個實施方案的遠(yuǎn)程訪問系統(tǒng)的框圖;圖2是根據(jù)另一實施方案的語音中繼服務(wù)器的框圖;圖3是根據(jù)另一實施方案的智能代理的框圖;以及圖4是建立從用戶電話遠(yuǎn)程訪問用戶計算機(jī)系統(tǒng)的方法的處理流程圖;圖5是通過電話將該智能代理監(jiān)控的信息自動通知給用戶的方法的處理流程圖。
優(yōu)選實施方案的詳細(xì)描述在一個方面,本發(fā)明涉及使用人類聲音與服務(wù)器系統(tǒng)(包括語音服務(wù)器和語音中繼服務(wù)器)交互的配置,該服務(wù)器系統(tǒng)又轉(zhuǎn)而與運(yùn)行在遠(yuǎn)程計算機(jī)系統(tǒng)上的智能代理交互,以檢索和查看該計算機(jī)系統(tǒng)可訪問的信息,諸如個人信息。通常,本發(fā)明涉及的方法包括將語音輸入命令轉(zhuǎn)換成計算機(jī)命令,該計算機(jī)命令以安全的方式被傳送到與呼叫者、或者與該用戶帳號或用戶具體信息所處的服務(wù)器相關(guān)聯(lián)的特定計算機(jī)系統(tǒng)(即,PC或服務(wù)器)。該方法可以使用在該計算機(jī)系統(tǒng)不必具有公共地址(IP地址)或該服務(wù)器不必具有公共IP地址以及該P(yáng)C或服務(wù)器一直處在與因特網(wǎng)連接相連的防火墻的后面的情況。
本發(fā)明的另一方面涉及智能代理,該智能代理位于用戶的計算機(jī)系統(tǒng)中并且被編程,以使其對位于該計算機(jī)系統(tǒng)中或該計算機(jī)系統(tǒng)可訪問到的基于規(guī)則的事件作出反應(yīng)(諸如數(shù)據(jù)庫中出現(xiàn)新的數(shù)據(jù)項、或在新聞服務(wù)中出現(xiàn)帶有特定匹配關(guān)鍵詞的新聞項、或包括某個關(guān)鍵詞或短語的新郵件消息),然后通過該服務(wù)器系統(tǒng)將合成的語音消息送到(移動的或地面上的)電話上,以語音方式向用戶提醒該事件。
使用語音命令來訪問存儲在個人臺式計算機(jī)上的信息,以及將臺式計算機(jī)上的個人信息轉(zhuǎn)換成語音并通過語音線發(fā)送到電話上,需要保護(hù)該系統(tǒng)的三個組件之間的雙向安全通信。語音命令或標(biāo)識短語將該呼叫者識別到服務(wù)器上,該服務(wù)器作為初始語音呼叫和呼叫者的家庭或辦公地點的臺式計算機(jī)或服務(wù)器系統(tǒng)之間的中繼。該呼叫者必須通過用戶標(biāo)識符、個人身份號碼或通過生物語音模式識別來識別他自己,從而該語音中繼服務(wù)器可以直接地將呼叫者連接到她的個人電腦上或連接到包含其個人信息的服務(wù)器上。然后為了使該呼叫者可以發(fā)布語音命令收聽來自呼叫者個人計算機(jī)或服務(wù)器帳戶的信息,將該連接保持為可使用。
PC或服務(wù)器上的智能代理能夠從諸如因特網(wǎng)或本地應(yīng)用軟件程序等數(shù)據(jù)源處提取信息,為了安全地將該信息傳遞到該語音服務(wù)器,該信息將被轉(zhuǎn)換成語音模式,以使該呼叫者聽到該信息。該用戶可以發(fā)布語音命令,以停止或開始用戶臺式計算機(jī)或服務(wù)器上的服務(wù)和程序,或添加、刪除、轉(zhuǎn)發(fā)或回答信息,其信息可由智能代理生成或訪問到。該用戶也可以發(fā)布語音命令,以在該P(yáng)C或服務(wù)器上合成或創(chuàng)建新數(shù)據(jù)對象,諸如日歷項目、郵件或數(shù)據(jù)庫項目。
現(xiàn)在參考圖1,示出了遠(yuǎn)程訪問系統(tǒng)100的框圖。該遠(yuǎn)程訪問系統(tǒng)100包括服務(wù)器系統(tǒng)120,該服務(wù)器系統(tǒng)120通過公共電話網(wǎng)絡(luò)的連接115連接到使用移動或地線電話110的呼叫者。服務(wù)器系統(tǒng)120處理從該用戶接收的語音信號并用合成的語音信號回應(yīng),以方便語音服務(wù)器120和電話110用戶口頭交互。
遠(yuǎn)程訪問系統(tǒng)100還包括一個或多個計算機(jī)系統(tǒng)(圖2和3中示為280),該計算機(jī)系統(tǒng)遠(yuǎn)離服務(wù)器120,但通過諸如因特網(wǎng)等的公共網(wǎng)絡(luò)140與服務(wù)器120通信。這樣的遠(yuǎn)程計算機(jī)系統(tǒng)280可以包括個人計算機(jī)(PC)145或服務(wù)器150,該個人計算機(jī)145或服務(wù)器150具有對服務(wù)器120是已知的固定IP地址。替代地或此外,計算機(jī)系統(tǒng)280可以包括在各自防火墻170后的PC160或服務(wù)器165。服務(wù)器150和服務(wù)器165可以分別具有多個與其相關(guān)聯(lián)的用戶帳號155或175,從而服務(wù)器存儲有用戶賬號。計算機(jī)系統(tǒng)280可以是任何類型的計算機(jī)系統(tǒng),包括能夠通過公共網(wǎng)絡(luò)140進(jìn)行通信的智能移動設(shè)備和大型服務(wù)器系統(tǒng)。
對于防火墻170所保護(hù)的PC160或服務(wù)器165,該防火墻對服務(wù)器120隱藏該IP。因此,為了使服務(wù)器120與PC160或服務(wù)器165通信,PC160和服務(wù)器165必須將它們各自的IP地址傳輸?shù)椒?wù)器120。通過智能代理180執(zhí)行這樣的通知,該智能代理180位于PC160或服務(wù)器165上并且被編程以周期性地向服務(wù)器120通知PC160或服務(wù)器165上IP地址的任何變化。替代地,即使PC160或服務(wù)器165沒有被防火墻170保護(hù),該智能代理也可以執(zhí)行這樣的通知功能。例如,如果PC160通過因特網(wǎng)服務(wù)供應(yīng)商的撥號調(diào)制解調(diào)器連接連接到因特網(wǎng)140上,則該P(yáng)C160可以沒有靜態(tài)IP地址。因此,為了服務(wù)器120建立到PC160的連接,PC160必須向服務(wù)器120通知其當(dāng)前的IP地址。位于該P(yáng)C160或服務(wù)器165上的智能代理通過網(wǎng)絡(luò)140將通知分組數(shù)據(jù)173發(fā)送到服務(wù)器120以向服務(wù)器120通知PC160或服務(wù)器165的IP地址。下面參考圖2和3更詳細(xì)地描述該智能代理180。
服務(wù)器系統(tǒng)120包括語音服務(wù)器122、語音中繼服務(wù)器124、用戶表135和管理界面138。語音服務(wù)器122負(fù)責(zé)口音的自動語音識別(ASR)以及文本至語音(TTS)自動轉(zhuǎn)換,所述的口音是通過在連接115的公共電話從電話110的用戶接收的,所述的文本至語音轉(zhuǎn)換用于將從用戶的PC145、160或服務(wù)器帳號155、175處接收的信息轉(zhuǎn)換成向電話110的用戶通信的音頻語音信號。語音服務(wù)器122優(yōu)選地是IBM語音平臺,該IBM語音平臺包括IBM websphere語音響應(yīng)服務(wù)器-電話和應(yīng)用集成,該應(yīng)用集成與用于語音響應(yīng)的IBM websphere語音服務(wù)器-TTS/ASR連接。替代地,語音服務(wù)器122可以是運(yùn)行ASR和TTS數(shù)據(jù)源管理的VoiceGenie語音服務(wù)器。
如果通過語音服務(wù)器122的(ASR)模塊來識別在語音服務(wù)器122上從電話110的用戶處接收的語音信號,則通過雙向數(shù)據(jù)連接125將該ASR模塊所生成的相應(yīng)文本字符串傳送到語音中繼服務(wù)器124。語音中繼服務(wù)器124處理接收自語音服務(wù)器122,經(jīng)過轉(zhuǎn)換的語音,并且基于所處理的語音開始適當(dāng)?shù)膭幼?。例如,在開始遠(yuǎn)程訪問處理期間,該用戶需要提供用戶標(biāo)識符(ID)和密碼。當(dāng)語音中繼服務(wù)器124從語音服務(wù)器122處接收到這些信息時,語音中繼服務(wù)器124將該用戶標(biāo)識符和密碼與用戶表135(或數(shù)據(jù)庫的其它形式)中的項目比較,以驗證該用戶是遠(yuǎn)程訪問系統(tǒng)100的有效用戶。一旦該用戶被服務(wù)器120認(rèn)證,則語音中繼服務(wù)器124還將從語音服務(wù)器122轉(zhuǎn)換的語音視為用戶與該遠(yuǎn)程計算機(jī)系統(tǒng)進(jìn)行交互的命令。語音中繼服務(wù)器124也使用用戶表135來存儲與每個用戶相關(guān)聯(lián)的計算機(jī)系統(tǒng)的當(dāng)前或最后知道的IP地址。一旦該用戶被服務(wù)器120認(rèn)證,語音中繼服務(wù)器124向用戶計算機(jī)系統(tǒng)傳送的數(shù)據(jù)將被導(dǎo)向與用戶表135中的用戶相關(guān)聯(lián)的IP地址。
用戶管理界面138用于輸入PC145和服務(wù)器150的固定IP地址,以及插入和更新用戶表135中使用的用戶電話號碼、身份證號碼和密碼。
圖1示出了具有數(shù)據(jù)連接142的遠(yuǎn)程訪問系統(tǒng)100,該數(shù)據(jù)連接142通過網(wǎng)絡(luò)140將服務(wù)器120與PC145、160和服務(wù)器150、165連接。應(yīng)該理解的是,數(shù)據(jù)連接142可以是根據(jù)公共網(wǎng)絡(luò)140使用的適當(dāng)網(wǎng)絡(luò)協(xié)議的任何類型連接(虛擬或物理)。數(shù)據(jù)連接142不一定是物理連接。此外,數(shù)據(jù)連接142對于每個與服務(wù)器120通信的PC或服務(wù)器不一定是相同的。而且,每個PC145、160或服務(wù)器150、165獨立地與服務(wù)器系統(tǒng)120通信。數(shù)據(jù)連接142優(yōu)先地是安全套接層協(xié)議(SSL)連接。
現(xiàn)在參考圖2,更詳細(xì)地示出和描述了語音中繼服務(wù)器124。語音中繼服務(wù)器124包括幾個與語音服務(wù)器122、智能代理180以及用戶表135相互作用的功能模塊。語音中繼服務(wù)器124包括voiceXML轉(zhuǎn)換模塊210,該voiceXML轉(zhuǎn)換模塊用于接收從語音服務(wù)器122輸入的語音命令以及將這些命令翻譯成內(nèi)部數(shù)據(jù)結(jié)構(gòu)(下面將更詳細(xì)地描述),以與語音中繼服務(wù)器124的命令請求模塊230通信。該命令請求模塊230基于被voiceXML轉(zhuǎn)換模塊210處理的語音命令來解釋該內(nèi)部數(shù)據(jù)結(jié)構(gòu)和生成分組數(shù)據(jù)。命令請求模塊230通過諸如因特網(wǎng)等的公共網(wǎng)絡(luò)的數(shù)據(jù)連接142將與轉(zhuǎn)換的語音命令相應(yīng)的分組數(shù)據(jù)傳送給用戶,與智能代理180進(jìn)行通信。
語音中繼服務(wù)器124還包括通知模塊220,該通知模塊220用于將從智能代理180(在涉及圖5時將被進(jìn)一步描述)處接收的分組數(shù)據(jù)轉(zhuǎn)換成voiceXML轉(zhuǎn)換模塊210能識別的內(nèi)部數(shù)據(jù)結(jié)構(gòu),用于傳送給電話110的用戶,傳送時使用了語音服務(wù)器122的文本至語音轉(zhuǎn)換特征。該通知模塊220可以直接地或通過命令請求模塊230接收來自智能代理180處的輸入分組數(shù)據(jù)。
語音中繼服務(wù)器124還包括網(wǎng)絡(luò)ID注冊模塊250,該網(wǎng)絡(luò)ID注冊模塊250用于接收被周期性發(fā)送的計算機(jī)系統(tǒng)280上的IP地址,其中智能代理180位于該計算機(jī)系統(tǒng)上。這僅由位于具有動態(tài)IP地址或不能提供固定IP地址的計算機(jī)系統(tǒng)上的智能代理180執(zhí)行。網(wǎng)絡(luò)ID注冊模塊250接收IP地址通知分組173以及將該IP地址存儲在具有該相應(yīng)用戶項目的用戶表135中。為了這個目的,該IP地址通知分組(或多個分組)指示了用戶ID(以及可選擇地還可以是密碼),經(jīng)更新的IP地址正是被提供給這個ID用戶。智能代理180從它被第一次安裝在該用戶計算機(jī)系統(tǒng)280上起就知道語音中繼服務(wù)器124的IP地址。
語音中繼服務(wù)器124也具有用戶認(rèn)證模塊270,該用戶認(rèn)證模塊270用于在語音中繼服務(wù)器124和用戶計算機(jī)系統(tǒng)280上的智能代理180的通信建立之前認(rèn)證該用戶。用戶認(rèn)證模塊270與語音服務(wù)器122通信,以接收轉(zhuǎn)換的文本串,該文本串與該用戶的口頭標(biāo)識和密碼口音相應(yīng)。然后用戶認(rèn)證270查詢用戶表135,并且將從語音服務(wù)器122處接收的用戶ID和密碼字符串與用戶表135中的項目比較。如果存在所接收的字符串與用戶項目的匹配,則該用戶被認(rèn)證,以建立到該用戶計算機(jī)系統(tǒng)280的連接,以及將用戶表130中為該用戶存儲的最后知道的IP地址提供給語音中繼服務(wù)器124,以開始與位于用戶計算機(jī)系統(tǒng)280上的智能代理180的通信。
如果用戶認(rèn)證模塊270不能將接收到的用戶ID及密碼字符串與用戶表135中的項目匹配,則用戶認(rèn)證模塊270將該匹配失敗傳輸給語音服務(wù)器122,該語音服務(wù)器向用戶的電話110提供相應(yīng)的合成語音消息。如果語音中繼服務(wù)器124不能獲取一個針對從語音中繼服務(wù)器124傳送至智能代理180的初始分組的響應(yīng),或者如果智能代理180或用戶計算機(jī)系統(tǒng)280不能識別該用戶ID和密碼,則也從語音服務(wù)器122向該用戶傳送這樣的消息。
現(xiàn)在參考圖3,更詳細(xì)地示出和描述了智能代理180。智能代理180包括命令請求模塊310,該命令請求模塊310用于處理與命令(或初始化)相關(guān)的分組數(shù)據(jù)在語音中繼服務(wù)器124和智能代理180之間的傳輸。如果命令請求模塊310從語音中繼服務(wù)器124處接收一初始化分組,以建立與智能代理180所位于的計算機(jī)系統(tǒng)280的連接,則命令請求模塊310通過將該分組轉(zhuǎn)發(fā)給智能代理180中的用戶確認(rèn)模塊370來檢查嵌在初始化分組中的用戶ID和密碼。如果用戶驗證模塊370將初始化分組中的用戶ID和密碼與在服務(wù)器280上存儲的有效用戶帳號的用戶ID和密碼匹配,則該用戶被該計算機(jī)系統(tǒng)驗證通過。否則,用戶驗證模塊370向命令請求模塊310指示所接收的用戶ID和密碼不對應(yīng)于服務(wù)器280上的一有效帳號,并且相應(yīng)的消息被發(fā)送回語音中繼服務(wù)器124,以通過語音服務(wù)器122向該用戶通信。
智能代理180還包括緩沖模塊320,該緩沖模塊320與命令請求模塊310通信以及與索引模塊340通信。緩沖模塊320保持個人的或其它信息的本地存儲,該本地存儲可以被快速檢索到,同時不必從外部數(shù)據(jù)源獲取信息,諸如通過網(wǎng)絡(luò)390可獲得的數(shù)據(jù)源。
該智能代理180還包括索引模塊340、獲取模塊350、以及規(guī)則引擎360。該規(guī)則引擎360被編程,以根據(jù)許多用戶定義的規(guī)則的預(yù)定原則獲得信息。這些規(guī)則可以指定要獲得的信息類型,諸如郵件、日歷項、新聞項、數(shù)據(jù)庫項目或其它隨時被更新或最新創(chuàng)建的信息的動態(tài)形式。
該規(guī)則引擎360應(yīng)用時結(jié)合獲取模塊350,用以獲取信息,其主要目的是提醒用戶(根據(jù)該用戶定義的規(guī)則)其感興趣的新或更新的信息,以及據(jù)此安排對該用戶的電話呼叫,并由語音服務(wù)器122將該信息的主要細(xì)節(jié)讀取給該用戶。替代地,規(guī)則引擎360可以用于構(gòu)造該用戶連接到該用戶的計算機(jī)系統(tǒng)上時所遇到的用戶界面。例如,根據(jù)該規(guī)則,智能代理180只將未讀郵件提供給用戶供其檢索,并通過語音服務(wù)器122使其收聽到,而不是使用戶郵箱中的所有郵件都可獲取。
該獲取模塊負(fù)責(zé)周期性地從網(wǎng)絡(luò)390或計算機(jī)系統(tǒng)280的數(shù)據(jù)源處獲取信息(根據(jù)規(guī)則引擎360中的規(guī)則)。網(wǎng)絡(luò)390可以是局域網(wǎng)或大型網(wǎng)絡(luò),諸如因特網(wǎng)。獲取模塊350向索引模塊340提供數(shù)據(jù)源信息,該索引模塊340壓縮并索引該信息以及將其提供給緩沖模塊320,該緩沖模塊320將被壓縮和索引的信息存儲在計算機(jī)系統(tǒng)280可訪問的數(shù)據(jù)源或數(shù)據(jù)庫330中。獲取模塊350可以從計算機(jī)系統(tǒng)280中獲得信息,也可以改為從網(wǎng)絡(luò)390中的數(shù)據(jù)源處獲得信息。
智能代理180還包括網(wǎng)絡(luò)ID通知模塊380,如果智能代理180位于沒有固定IP地址的計算機(jī)系統(tǒng)280上,則該網(wǎng)絡(luò)ID通知模塊380基于常規(guī)(預(yù)定)原則將通知分組傳送到語音中繼服務(wù)器124的網(wǎng)絡(luò)ID注冊模塊250。
現(xiàn)在參考圖4,示出和描述了用于創(chuàng)建從用戶電話110遠(yuǎn)程訪問計算機(jī)系統(tǒng)280的方法400。方法400從步驟405開始,此時用戶呼叫語音服務(wù)器122。該語音服務(wù)器122可以接收來自移動或地面電話網(wǎng)絡(luò)的呼叫。用戶被運(yùn)行在語音服務(wù)器122上的交互語音響應(yīng)系統(tǒng)要求提供其ID和密碼。這可以通過語音口音或通過該用戶電話(或其它遠(yuǎn)程通信設(shè)備)110鍵盤直接輸入來實現(xiàn),或是通過這些結(jié)合。在步驟410,語音服務(wù)器122的自動語音識別功能將用戶的口音轉(zhuǎn)換成一個或多個文本字符串。如果該口音在步驟415中具有不可識別性,則在步驟420,語音服務(wù)器122請求該用戶再次嘗試提供該用戶ID和密碼。
如果該文本在步驟415中被識別出來,則將該用戶ID和密碼字符串從語音服務(wù)器122傳送到語音中繼服務(wù)器124。在步驟425,該語音中繼服務(wù)器124對照用戶表135中的項目檢查該用戶ID和密碼,以驗證該用戶。如果該用戶ID和密碼沒被識別出來(即,沒有包含在用戶表135中),則步驟420提示該用戶再次輸入,步驟410和425被重復(fù)(直到一預(yù)定次數(shù))。
如果該用戶ID和密碼在步驟425中被識別出來,則在步驟430中與該匹配用戶ID和密碼相應(yīng)的最后知道的IP地址被確定。如果在步驟435中沒有發(fā)現(xiàn)相應(yīng)的IP地址,或雖然發(fā)現(xiàn)一個匹配的IP地址,但是那個IP地址不能響應(yīng)來自語音中繼服務(wù)器124的初始化分組,則在步驟440中用戶會被告知該系統(tǒng)沒有訪問到有效的或當(dāng)前的IP地址。然后在步驟420用戶被提示再次輸入或該語音呼叫被終止。
在步驟435,如果在用戶表135發(fā)現(xiàn)了與該用戶ID相應(yīng)的IP地址,則將通信初始化分組從語音中繼服務(wù)器124傳送到智能代理180及其計算機(jī)系統(tǒng)280上,在步驟445,該服務(wù)器系統(tǒng)120和用戶計算機(jī)系統(tǒng)280的通信會話被建立,除非該智能代理180不能作出一個確認(rèn)分組響應(yīng)。
一旦建立了通信會話,智能代理180和語音中繼服務(wù)器124交換分組數(shù)據(jù),從而可以通過智能代理180的命令請求模塊310檢索信息,以及為了檢索用戶所請求的信息可以從語音中繼服務(wù)器124的命令請求模塊230傳送命令。通過在計算機(jī)系統(tǒng)280和服務(wù)器系統(tǒng)120之間傳送分組數(shù)據(jù)可執(zhí)行這樣的命令傳送和相應(yīng)的信息檢索,而同時電話110用戶與語音服務(wù)器120實時通信,以發(fā)布語音命令和收聽從計算機(jī)系統(tǒng)280處檢索到的信息相應(yīng)的合成語音信號。
方法400用于促成遠(yuǎn)程訪問系統(tǒng)100的主要應(yīng)用,當(dāng)用戶遠(yuǎn)離其計算機(jī)系統(tǒng)280時,例如旅行或在家工作時,該遠(yuǎn)程訪問系統(tǒng)可使用戶訪問其計算機(jī)系統(tǒng)280上的信息。一旦該方法400被執(zhí)行,并且智能代理180和語音中繼服務(wù)器124之間的通信會話被建立,該用戶就可以如其所愿地檢索、創(chuàng)建或更改信息或?qū)ο?,包括文檔、郵件、新聞項、日歷、對象、數(shù)據(jù)庫項目或其它允許在語音和其它數(shù)據(jù)形式之間轉(zhuǎn)化的信息或?qū)ο蟆?br>
在另一方面,通過在智能代理180和服務(wù)器系統(tǒng)120之間自動建立連接,以及自動地將電話呼叫連接到被注冊給用戶的電話上,該遠(yuǎn)程訪問系統(tǒng)100可自動地將計算機(jī)系統(tǒng)280能獲取的新的或更新的信息(如被智能代理180獲取和索引的)通知給用戶。圖5中以方法500示出和描述了這樣的自動通知方法。
方法500從用戶創(chuàng)建規(guī)則開始,該規(guī)則用于自動獲取被提供給該用戶的信息。在步驟505,由該用戶創(chuàng)建這些規(guī)則,優(yōu)選地使用規(guī)則創(chuàng)建向?qū)韼椭撚脩艚⑺@得取的信息的類型,信息被獲取的頻率以及用戶被通知的條件或時間。該規(guī)則也可以指定獲得該信息的關(guān)鍵字或其它標(biāo)準(zhǔn)。
在步驟510,該智能代理180如上所述地從計算機(jī)系統(tǒng)280或網(wǎng)絡(luò)390處獲得信息。在步驟515,智能代理180檢查該源信息是否匹配一個或多個該用戶定義的規(guī)則。如果該信息不匹配規(guī)則,則該信息被放棄或至少不被索引模塊340索引,并且該智能代理在步驟510中繼續(xù)獲取信息。如果在步驟510中,該信息確實和用戶定義的其中一個規(guī)則匹配,則信息被索引模塊340和緩沖模塊320處理為內(nèi)容對象(在下文中描述)并被存儲在數(shù)據(jù)庫330中,直到通知用戶的預(yù)定時間。在該預(yù)定時間,滿足該用戶定義的規(guī)則的信息被從緩沖模塊320加載到命令請求模塊310中,并在步驟520中轉(zhuǎn)換成可打包的文本。附有通知信息的每個分組也包含了用戶ID。
在步驟525,步驟520構(gòu)造的通知信息分組被傳送到語音中繼服務(wù)器124的命令請求模塊230及傳遞到通知模塊220。在步驟530,通知模塊220使用計算機(jī)系統(tǒng)280接收的通知信息分組上附加的用戶ID,訪問用戶表135來確定與該用戶ID相應(yīng)的電話號碼。一旦語音中繼服務(wù)器124接收到所有的通知信息分組,該通知模塊220則處理這些分組,使它們處于VoiceXML轉(zhuǎn)換模塊210的一可讀形式,并且將該通知信息作為一個VoiceXML對象傳送到語音服務(wù)器122。在步驟535,語音服務(wù)器122轉(zhuǎn)換該VoiceXML,以合成傳送給該用戶的語音信號。
在步驟540,語音服務(wù)器122撥叫該用戶的電話號碼,如果該用戶接聽該呼叫,則該語音信號被傳送給該用戶。如果該用戶沒有接聽該呼叫,則語音服務(wù)器120可以向該用戶準(zhǔn)備非語音通知,諸如一個文本消息或其它形式的短消息,以提示用戶在服務(wù)器系統(tǒng)120上有一等待接收的通知,并為用戶提供回叫號碼,供其回?fù)芤詸z索該通知(根據(jù)方法400)。
有利的是,在用戶在其他情況下不能訪問到他或他想要的信息的遠(yuǎn)程位置處,遠(yuǎn)程訪問系統(tǒng)能夠使用戶從該遠(yuǎn)程位置容易地訪問到該用戶計算機(jī)系統(tǒng)280上的信息。更有利的是,該遠(yuǎn)程訪問系統(tǒng)100可以被該用戶構(gòu)造為主動向該用戶提供信息以及自動通知用戶可獲取的信息,其信息是用戶已表明過他或她希望遠(yuǎn)程接收的。
在一個實施方案中,該語音中繼服務(wù)器使用概率索引技術(shù)來索引來自用戶的口音。在語音服務(wù)器接收語音請求以及將這些請求轉(zhuǎn)換成被發(fā)送至語音中繼服務(wù)器的數(shù)據(jù)請求方面,該索引技術(shù)可以使其性能提高,效率更高。
語音呼叫器上產(chǎn)生某一語音請求的概率被用于評估在呼叫器請求信息時將加載什么關(guān)鍵字。例如,如果該用戶請求通過該服務(wù)器系統(tǒng)收聽一郵件,那么通過概率匹配,其最可能的響應(yīng)通常是(或以前)與郵件相關(guān)聯(lián)的命令,諸如“刪除、移動、下一條、回復(fù)、轉(zhuǎn)發(fā)、前一條、重復(fù)”。然而,該用戶可以說較低可能的命令,諸如“傳送、響應(yīng)、隨后、擦除、回放”?;谒f的語音命令,該服務(wù)器系統(tǒng)120建立語音命令的概要,根據(jù)使用頻率將它們排序以及在語音交互過程中將之關(guān)聯(lián)到一個特定事件上。
因而,該語音中繼服務(wù)器概率索引技術(shù)提供了動態(tài)創(chuàng)建的可能口音的模式匹配映射,作為對語音的輸入。當(dāng)用戶與遠(yuǎn)程訪問系統(tǒng)100交互時,用戶交互的映射被生成以及被維護(hù),這樣,一個可能交互的索引列表被動態(tài)生成。當(dāng)用戶隨后訪問該系統(tǒng)時,一個來自語音中繼服務(wù)器124的可能輸入的索引表被輸入到語音服務(wù)器122,以保證識別處理成功率提升到高于之前的失敗的概率標(biāo)準(zhǔn)。
為了執(zhí)行該概率索引,該語音中繼服務(wù)器包括一個交互分析器和索引列表生成器(兩者都未示出)。
交互分析器-對于每一次用戶與系統(tǒng)的交互,其中受到訪問的組件被分析,其交互被列為一可能的將來的語音交互。這些交互列表被設(shè)置為在以后的處理中是可獲取的。一口音的預(yù)測模型被生成并被存儲在硬盤或記憶存儲庫中,并且適合于被實時持續(xù)使用。根據(jù)使用服務(wù)的模式和概要,該列表被分類,并被連續(xù)修改。
索引列表生成器-基于特定的語音交互和一信息語音頁(VoiceXML頁)中的內(nèi)容。該組件訪問交互分析器創(chuàng)建的列表,并動態(tài)地生成可能口音的索引列表?;诰唧w的上下文內(nèi)容,后一列表被設(shè)為語音中繼服務(wù)器124可訪問的,并且是作為一組語法來生成,必要時會被加載到語音服務(wù)器122上。
可以通過規(guī)則引擎360將該智能代理180編程,以使其響應(yīng)臺式PC或服務(wù)器上最新的信息,或是信息變化。規(guī)則所捕獲的最新的或變化的信息以分組消息的形式引發(fā)一個外向的提醒給語音中繼服務(wù)器,該分組消息被語音中繼服務(wù)器轉(zhuǎn)換成語音分組或信號中,之后被轉(zhuǎn)發(fā)到電話(移動的或地面上)。該用戶在接收到該呼叫的基礎(chǔ)上接聽該自動生成的提醒消息。
該規(guī)則引擎允許為每個數(shù)據(jù)源創(chuàng)建離散的概要,以使該用戶能夠得到的僅僅是他們明確選定的信息的通知。下面簡要描述規(guī)則引擎360的組件。
規(guī)則生成器-該組件接受一組輸入來構(gòu)造規(guī)則。其預(yù)先定義了執(zhí)行特定動作應(yīng)該滿足的一組條件和約束。
推理模塊-該組件分析一組條件和輸入,并檢查是否滿足規(guī)則和策略標(biāo)準(zhǔn)。該模塊搜尋規(guī)則、確定規(guī)則方面的許可,以及檢查執(zhí)行次數(shù)和條件是否被遵循。
規(guī)則驗證機(jī)-該組件負(fù)責(zé)評估該規(guī)則的有效性。在一條規(guī)則被規(guī)則處理器認(rèn)為可有效用于處理之前,該組件先檢查規(guī)則的完全性、完整性及必要條件的存在性和必要條件的測量指示(mesurementindicators)。
規(guī)則處理器-該組件負(fù)責(zé)使用規(guī)則驗證機(jī)來驗證該規(guī)則。接著該組件使用推理模塊來檢查該規(guī)則是否必須得被執(zhí)行。然后負(fù)責(zé)執(zhí)行該規(guī)則動作。
功能處理-一個規(guī)則典型地由規(guī)則生成器生成的一組字符串組成,所述的規(guī)則生成器可以是一個程序界面或者可以是用于輸入這些字符串的用戶表格。通過該規(guī)則驗證機(jī)驗證每個輸入的字符串,所述的規(guī)則驗證機(jī)例如可以通知該規(guī)則生成器字符串結(jié)構(gòu)不一致(外部特征或不一致字符)或數(shù)據(jù)結(jié)構(gòu)不一致(例如,一個歐洲格式的日期25/12/04可能不被處理或接收,除非該日期被寫成美國格式12/25/2004)。然后存儲該規(guī)則并將其與特定用戶關(guān)聯(lián)。
該智能代理180應(yīng)用被設(shè)計為為一個或多個用戶管理一個或多個規(guī)則。一個置入智能代理處的調(diào)度程序被設(shè)計為詢問該輸入信息,并把字符串或用戶定義的規(guī)則同可能被構(gòu)造的信息匹配。因此,一個具有日期域的新聞項被用來同用戶選擇的日期項進(jìn)行比較,并且當(dāng)發(fā)生匹配時,一個通知事件被生成。該智能代理也支持由輸入數(shù)據(jù)所觸發(fā)的能力,并且也可以針對這些數(shù)據(jù)項執(zhí)行同樣的匹配處理。
該語音中繼服務(wù)器124可以具有多個到遠(yuǎn)程PC或服務(wù)器的連接。處理這兩個終端之間通信的主要部門是位于PC或服務(wù)器中的智能代理命令請求模塊和位于語音中繼服務(wù)器中的命令請求模塊。命令請求模塊中的命令處理器(未示出)負(fù)責(zé)構(gòu)造和解構(gòu)信息分組,所述的信息分組是發(fā)送給該遠(yuǎn)程服務(wù)的和從該遠(yuǎn)程服務(wù)發(fā)送的。該命令處理器模塊被設(shè)計為處理各種請求,這些請求可以是在網(wǎng)絡(luò)任一端發(fā)起的。
該命令處理器通過TCP/IP連接接聽輸入的請求。如果該用戶是第一次登錄到該服務(wù)器上的,則向該遠(yuǎn)程PC或服務(wù)器智能代理發(fā)送證書作為描述該用戶名和密碼的序列化字符串。這建立了該用戶的真實性,并允許繼續(xù)與該遠(yuǎn)程智能代理對話,或?qū)⒕芙^該請求。在成功的認(rèn)證的基礎(chǔ)上,在這兩個系統(tǒng)之間建立了TCP/IP連接對話,并且然后該命令處理器處理在任一端接收的信息。序列化字符串在該智能代理180和該語音中繼服務(wù)器124之間傳遞。一個通信協(xié)議被智能代理180和語音中繼服務(wù)器124實施,用來調(diào)用動作和服務(wù),所述的通信協(xié)議提供了這樣一種機(jī)制,它可允許系統(tǒng)處理廣泛的各種語音請求和有效載荷答復(fù),該協(xié)議的示例被示為<ServiceNameHeader><ServiceMethodName><ServiceMethodParameter1>...<ServiceMethodParameterN><EndOfServiceRequest>
在上面的示例中,Servicenameheader是需要被訪問或傳遞的數(shù)據(jù)服務(wù)類型的標(biāo)準(zhǔn)名稱,該方法名確定對該項執(zhí)行什么動作,并且該方法參數(shù)是動態(tài)變量,諸如項的列表或具體的數(shù)據(jù)元素。
一個請求的數(shù)據(jù)成分示例可以是<Email><Readback><Number1><Number2><Number3><end>
或<Calendar><create><type=appointment,date=March 17,time=6.30pm,duration=1hour>
該協(xié)議也可以用于調(diào)用語音中繼服務(wù)器和智能代理上的動作或服務(wù),該智能代理可位于PC機(jī)或服務(wù)器上。由于語音中繼服務(wù)器和智能代理的服務(wù)是不同的,因而語音中繼服務(wù)器和智能代理中每一個上的服務(wù)方法處理器是不同的。例如,該智能代理將向語音中繼服務(wù)器發(fā)送請求,以提示用戶輸入某個語音,比如請求從存儲在該P(yáng)C/服務(wù)器上的本地電話本中檢索一個人的名字。該語音中繼服務(wù)器124將進(jìn)而請求該智能代理打開電話本供其查詢。本協(xié)議提供了在終端的語音中繼服務(wù)器和智能代理之間的雙向通信的框架。
該智能代理管理一組用戶定義的規(guī)則,該組規(guī)則是關(guān)于對連接至PC或服務(wù)器的程序和信息進(jìn)行電子信息過濾及信息檢索。例如,該用戶可以創(chuàng)建從數(shù)據(jù)庫文件讀取一個特定域的項目的規(guī)則,并且當(dāng)一個對項目的改變符合該規(guī)則時,該智能代理將識別出該改變,并且將向該語音中繼服務(wù)器發(fā)出提醒(概述的或其它),該提醒的發(fā)送對象是該特定用戶的電話號碼,該提醒將以語音流的形式讀取給用戶。
在該規(guī)則應(yīng)用下的內(nèi)容改變將被智能代理軟件監(jiān)控和識別,所述的智能代理軟件控制PC的內(nèi)容獲取。下面描述內(nèi)容索引技術(shù)。
該智能代理也在緩沖模塊320中創(chuàng)建對滿足該規(guī)則的數(shù)據(jù)項的本地緩沖對象參考(local cached object reference),該參考被該智能代理維護(hù)和管理得方便有效。該對象參考中的每個緩沖對象被稱為個人助手內(nèi)容對象(PACO)。下面進(jìn)一步描述此類對象的處理。本地緩沖對象參考允許對連接至數(shù)據(jù)信息服務(wù)的界面的更改易于被加載和維護(hù)。
為了連接該P(yáng)C或服務(wù)器上的本地數(shù)據(jù),該智能代理優(yōu)選地使用連接至microsoft outlook的商業(yè)界面,諸如在www.dimastr.com可得到outlookredemption(從2004年5月21號起)。通過獲取模塊350獲得該P(yáng)C外的數(shù)據(jù)內(nèi)容。在計算機(jī)系統(tǒng)280是服務(wù)器系統(tǒng)的情況下,該智能代理可以利用諸如compoze交換界面(www.compoze.com從2004年5月起)等的商業(yè)界面,以能夠連接到Microsoft Exchange內(nèi)的郵件和日程服務(wù)。
該智能代理180具有軟件界面,該界面被設(shè)計為允許用戶對規(guī)則進(jìn)行個性化,這些規(guī)則是他們希望為其臺式PC或服務(wù)器信息所配置的。該智能代理也具有一組用于與任何結(jié)構(gòu)化數(shù)據(jù)源通信的軟件界面,所述的結(jié)構(gòu)化數(shù)據(jù)是諸如XML數(shù)據(jù)、SQL數(shù)據(jù)、HTML數(shù)據(jù)、郵件數(shù)據(jù)、RSS新聞數(shù)據(jù)、操作系統(tǒng)數(shù)據(jù)、文件數(shù)據(jù)、word處理的文檔數(shù)據(jù)。
該語音中繼服務(wù)器124執(zhí)行許多關(guān)鍵功能。這些服務(wù)或功能包括維護(hù)到遠(yuǎn)程PC或服務(wù)器的物理網(wǎng)絡(luò)連接;到遠(yuǎn)程PC或服務(wù)器的邏輯連接,通過該連接可以執(zhí)行分組數(shù)據(jù)交換;存在檢測;以及安全連接管理。下面更詳細(xì)地描述這些功能和服務(wù)。
在一個邏輯連接能夠被建立之前,必須在語音中繼服務(wù)器和該P(yáng)C或服務(wù)器上的智能代理之間建立一個或多個物理連接。在語音中繼服務(wù)器或臺式PC或服務(wù)器都不能被直接連接到的情況下(例如,因為系統(tǒng)可能在防火墻后或位于一個因特網(wǎng)上且沒有物理層因特網(wǎng)地址(physical internet addresses)),該語音中繼服務(wù)器上的物理連接管理器(PCM)(未示出)將使用安全端口創(chuàng)建到遠(yuǎn)程PC的連接。由PC或服務(wù)器智能代理使用安全端口創(chuàng)建的PCM連接,將其本身聲明到該語音中繼服務(wù)器,以及建立到該語音中繼服務(wù)器一個方向上的端口連接,然后使用TCP/IP的復(fù)背(piggy-back)能力使語音中繼服務(wù)器通過同樣的安全TCP/IP連接與該P(yáng)C或服務(wù)器通信。
由于只有該語音中繼服務(wù)器具有已知的IP地址以及可以被直接連接上,所以該P(yáng)CM依賴一起參與的智能代理PC或服務(wù)器,來開始它們各自到該P(yáng)CM的連接(將它們本身聲明到該語音中繼服務(wù)器)。該P(yáng)CM維護(hù)智能代理連接,將它們與其擁有者的身份關(guān)聯(lián),并在用戶指引下使用語音命令訪問該遠(yuǎn)程PC或服務(wù)器上可供其獲取的服務(wù),在協(xié)議標(biāo)準(zhǔn)下執(zhí)行實際的數(shù)據(jù)交換。
在可以交換消息之前,在語音中繼服務(wù)器和該P(yáng)C或服務(wù)器上的智能代理之間必須存在數(shù)據(jù)通道、或邏輯連接。該語音中繼服務(wù)器上的邏輯連接管理器(LCM)(未示出)負(fù)責(zé)定義這樣的通道,以及創(chuàng)建和維護(hù)它。邏輯連接可以由一個或多個物理連接組成。如果可以通過開放網(wǎng)絡(luò)到達(dá)從事消息交換會話的任一方的IP地址,則這些方之間的物理連接可以被直接建立,并作為邏輯連接提供服務(wù),無需涉及服務(wù)器LCM。如果邏輯連接由一個以上的物理連接組成,則LCM不得不跟蹤這些物理連接的身份和狀態(tài)。
在該語音中繼服務(wù)器和該遠(yuǎn)程智能代理PC之間可以交換消息之前,必須知道參與者的通信端點(即,IP地址)。運(yùn)行在該語音中繼服務(wù)器上的存在管理器(presence manager)(PM)(其是網(wǎng)絡(luò)ID注冊模塊250)負(fù)責(zé)跟蹤信息。這是相對被動的組件。它依靠智能代理將他們自己的IP地址通知給語音中繼服務(wù)器上的PM。PM客戶端(其是網(wǎng)絡(luò)ID通知模塊380)必須運(yùn)行在每個參與者客戶端設(shè)備中(即,作為智能代理功能的一部分),隨著時間的推移周期性地將設(shè)備的存在注冊到語音中繼服務(wù)器的PM上。
存在管理器持續(xù)地管理智能代理PC或服務(wù)器的表,從而總是保證輸入的用戶連接能夠連接到與該用戶的PC或服務(wù)器上的相應(yīng)的遠(yuǎn)程智能代理,假定PC或服務(wù)器是打開的并聲明其存在。
為了確定物理連接請求是來自被授權(quán)的參與者,需要驗證該請求者的身份。在語音中間服務(wù)器名稱空間中的唯一身份必須與每個參與用戶和終端設(shè)備關(guān)聯(lián)。每個這樣的設(shè)備屬于一個也必須具有唯一身份的擁有者。這些身份也作為控制訪問位于該語音中繼服務(wù)器和該遠(yuǎn)程智能代理PC或服務(wù)器上的服務(wù)和資源的基礎(chǔ)。用戶認(rèn)證模塊270。安全管理器(SM)負(fù)責(zé)管理、維護(hù)和加強(qiáng)對內(nèi)部表中的(典型地在數(shù)據(jù)庫中)用戶進(jìn)行認(rèn)證時的安全策略。該安全管理器也負(fù)責(zé)管理到該遠(yuǎn)程PC或服務(wù)器的安全連接,從而該語音中繼服務(wù)器和該遠(yuǎn)程智能代理PC之間的數(shù)據(jù)通道可以被加密。該安全可以在分組協(xié)議層面上或在連接層面上(諸如SSL類型的安全連接)。
該智能代理響應(yīng)來自用戶的命令,該用戶可能要求檢索、創(chuàng)建、更改該用戶PC上的個人數(shù)據(jù),諸如數(shù)據(jù)庫項、郵件項、新聞項、個人本地文件、日歷項、word處理文檔或其它結(jié)構(gòu)的數(shù)據(jù)。該用戶也可以發(fā)布命令,以開始個人PC上的處理,諸如開始程序或停止程序。有利的是,該用戶可以發(fā)布命令,以管理他們個人PC上的具體數(shù)據(jù)項,諸如寫郵件、刪除數(shù)據(jù)庫項、查看數(shù)據(jù)庫中的項或從他們的PC讀網(wǎng)頁。
該智能代理具有許多定義的“數(shù)據(jù)接口”,其可以與PC本地存儲的,或通過網(wǎng)絡(luò)連接可供其獲取的信息通信。其中一個這樣的數(shù)據(jù)接口是到SQL數(shù)據(jù)庫的,因此,該智能代理可以讀取、更新、刪除、增加或替換數(shù)據(jù)項,該數(shù)據(jù)項是PC上的或連接至PC的網(wǎng)絡(luò)上的一個標(biāo)準(zhǔn)SQL數(shù)據(jù)庫內(nèi)的數(shù)據(jù)項。
有利的是,一旦該P(yáng)C上的智能代理確定(使用規(guī)則引擎)將要發(fā)送提醒數(shù)據(jù),則將一個提醒或分組數(shù)據(jù)發(fā)送到該語音中繼服務(wù)器,以對合適的遠(yuǎn)程用戶電話進(jìn)行向外呼叫。該智能代理被構(gòu)造為以自動和定時方式訪問本地信息。該智能代理上的規(guī)則引擎已安裝調(diào)度程序,用戶可以用該調(diào)度程序周期性地訪問本地PC或與該P(yáng)C連接的網(wǎng)絡(luò)上的信息。該規(guī)則引擎也提供創(chuàng)建某些數(shù)據(jù)字符串的方法,該數(shù)據(jù)字符串與PC上或本地網(wǎng)絡(luò)上的本地數(shù)據(jù)相比較。
在檢測到匹配或滿足“數(shù)據(jù)參數(shù)”的情況下(根據(jù)用戶定義的規(guī)則),提醒機(jī)制觸發(fā)智能代理向語音中繼服務(wù)器發(fā)送一個命令,以對正確的用戶(即,注冊為該P(yáng)C的用戶)發(fā)出向外呼叫。該語音中繼服務(wù)器創(chuàng)建到該用戶的電話連接,并將該提醒轉(zhuǎn)換為用戶接聽的語音流。該用戶可以個性化發(fā)送給該語音中繼服務(wù)器的提醒,并且該用戶可以使用桌面管理軟件工具設(shè)置這些提醒的頻率,這是該P(yáng)C上的智能代理程序的一部分。
在索引模塊340中,在任一內(nèi)容源被訪問的任一時候,各個項的數(shù)學(xué)摘要被計算,并被存儲在源組件存儲庫中。在任何時間,如果內(nèi)容源模塊350檢索到一個項,其被計算的摘要與為該特定項類型存儲的任何一個摘要都不匹配,則出于過濾和處理目的,該項被認(rèn)為是非復(fù)制的和新穎的。
然而,如果被計算的摘要匹配該項類型存儲的摘要,則將該內(nèi)容源認(rèn)作一個復(fù)制品,并且出于過濾和處理目的將它忽略。這提供了數(shù)學(xué)式地描述數(shù)據(jù)對象的方法(諸如文本郵件),該描述是以一種可以明顯提高性能以及可以使智能代理作內(nèi)容過濾所需的數(shù)據(jù)存儲庫最小化的方式。因此,仍然在郵件服務(wù)器上并且之前沒有被查看過的郵件將作為一個新的數(shù)據(jù)內(nèi)容項出現(xiàn),供智能代理識別和匹配。
索引模塊340包括一個摘要生成器和被索引的摘要列表知識庫。
摘要生成器-該組件將接受內(nèi)容源對象以及創(chuàng)建輸入對象的數(shù)學(xué)計算摘要。所使用的算法可以是MD5或SHA,或這兩者的結(jié)合。該算法將具有一個用戶界面,用于接收諸如郵件或新聞項或股票報價等的內(nèi)容對象以及返回數(shù)學(xué)摘要。
被索引的摘要列表知識庫-該組件是不同內(nèi)容源類型的摘要的知識庫。其提供了存儲、匹配以及協(xié)調(diào)不同類型摘要的機(jī)制。
該遠(yuǎn)程訪問系統(tǒng)100可能被要求監(jiān)控、過濾和通過語音通知將不同類型的內(nèi)容傳遞給具有不同形式因素(variying form factors)的終端用戶。本內(nèi)容經(jīng)常隨不同需要而改變。該內(nèi)容源可能必須存儲在緩沖數(shù)據(jù)庫或永久數(shù)據(jù)庫中以用于處理。當(dāng)內(nèi)容源改變時,其下層數(shù)據(jù)存儲庫的結(jié)構(gòu)也將必須改變。例如,該內(nèi)容存儲庫當(dāng)前可能被要求存儲郵件和新聞,而將來可能用于存儲股票交易和天氣信息或交通提醒。
對大多數(shù)內(nèi)容源的分析明確了其屬性,該屬性在整個內(nèi)容源中,比如源、目的文件、標(biāo)題等中是一致的。該內(nèi)容數(shù)據(jù)隨著類型改變。因而,可以在數(shù)據(jù)存儲級別(data persistence level)標(biāo)準(zhǔn)化普通屬性,而在應(yīng)用級別標(biāo)準(zhǔn)化變化屬性。此外,串行化和解串行化機(jī)制保證變化的內(nèi)容對象可以保持在數(shù)據(jù)存儲庫中和從數(shù)據(jù)存儲庫重建。
下面描述PACO結(jié)構(gòu)的功能組件。
普通PACO-所有內(nèi)容源對象應(yīng)該能夠存儲為普通PACO對象。該組件具有允許從具體內(nèi)容對象到普通PACO對象轉(zhuǎn)換的機(jī)制。
PACO串行器-該組件能夠?qū)⑵胀≒ACO對象串行化為適于下一層數(shù)據(jù)存儲庫的格式。后者可能是關(guān)系數(shù)據(jù)庫、本地文件或甚至是記憶存儲庫。其也能夠分解所存儲的普通PACO對象。
PACO編碼器-PACO編碼器能夠?qū)⒋械钠胀≒ACO對象編碼到滿足系統(tǒng)安全要求的形式。其也能夠解碼串行的對象。
PACO訪問組件-本組件能夠存儲編碼的、串行化的普通PACO對象。該組件有一個PACOAccessObjectFactory,其可創(chuàng)建一個必需的PACOAccessObject。后者還必須存在以用來連接下一層數(shù)據(jù)存儲庫。
要求-該P(yáng)ACO和其數(shù)據(jù)層模塊用于將所有完全不同的內(nèi)容對象封裝到普通內(nèi)容對象中。后一對象被稱為PA內(nèi)容對象。該P(yáng)A內(nèi)容對象應(yīng)借助其在應(yīng)用層將完全不同的內(nèi)容對象映射為普通內(nèi)容對象的優(yōu)點,使其本身有助于快速數(shù)據(jù)訪問。在存儲層,普通內(nèi)容對象應(yīng)該總是映射到關(guān)系數(shù)據(jù)庫中的相同數(shù)據(jù)表。主搜索域即源、目的文件、標(biāo)題、標(biāo)識符和類型,應(yīng)該在數(shù)據(jù)庫級別被標(biāo)準(zhǔn)化,而應(yīng)用特定詳細(xì)域(application specific details field)的完整性應(yīng)在應(yīng)用級別被維護(hù)。這將使得內(nèi)容對象類型的多樣性在數(shù)據(jù)存儲級別下被存儲在一個單一表述中,同時也提供了使用的簡單化,以及使內(nèi)容類型的改變不會導(dǎo)致數(shù)據(jù)庫的改變。
這里以示例的方式描述了本發(fā)明的實施方案。對這些實施方案的某些修改或替換并不脫離本發(fā)明精神和范圍,這對本技術(shù)領(lǐng)域里的人員來說是顯而易見的。
權(quán)利要求
1.一種通過公共網(wǎng)絡(luò)提供遠(yuǎn)程訪問計算機(jī)系統(tǒng)的方法,該方法包括的步驟為在服務(wù)器系統(tǒng)上接收來自計算機(jī)系統(tǒng)用戶的語音呼叫;處理語音呼叫期間從該用戶處接收的信息來生成識別信息;基于該識別信息認(rèn)證該用戶;至少部分地基于該識別信息建立該服務(wù)器系統(tǒng)和該計算機(jī)系統(tǒng)之間的連接;在服務(wù)器系統(tǒng)上接收來自該用戶的語音命令;基于所述的語音命令生成第一分組數(shù)據(jù);通過公共網(wǎng)絡(luò)將該第一分組數(shù)據(jù)傳送給該計算機(jī)系統(tǒng)上的代理;從響應(yīng)該第一分組數(shù)據(jù)的代理處將第二分組數(shù)據(jù)接收到該服務(wù)器系統(tǒng);以及基于該第二分組數(shù)據(jù)生成到該用戶語音呼叫的語音信號。
2.權(quán)利要求1的方法,其特征在于該代理解釋第一分組數(shù)據(jù)、詢問安裝在個人計算機(jī)上的應(yīng)用軟件以及基于該詢問生成第二分組數(shù)據(jù)。
3.權(quán)利要求1的方法,其特征在于還包括在該服務(wù)器系統(tǒng)上接收來自位于該計算機(jī)系統(tǒng)上的代理的計算機(jī)系統(tǒng)IP地址,并且其中該創(chuàng)建步驟是基于該識別信息和IP地址的。
4.權(quán)利要求3的方法,其特征在于該計算機(jī)系統(tǒng)的IP地址是不固定的,并且該服務(wù)器系統(tǒng)周期性地從該代理處接收該計算機(jī)系統(tǒng)的IP地址。
5.權(quán)利要求1的方法,其特征在于第二分組數(shù)據(jù)與該計算機(jī)系統(tǒng)可訪問的對象相應(yīng)。
6.權(quán)利要求5的方法,其特征在于第二分組分組數(shù)據(jù)括該對象的概述形式,并且其中該概述形式是由該代理基于該對象生成的。
7.一種用于通過網(wǎng)絡(luò)提供遠(yuǎn)程訪問計算機(jī)系統(tǒng)的系統(tǒng),該系統(tǒng)包括連接到該網(wǎng)絡(luò)和電話網(wǎng)絡(luò)上的服務(wù)器系統(tǒng),該服務(wù)器系統(tǒng)具有其可訪問的計算機(jī)程序代碼,當(dāng)該代碼被服務(wù)器系統(tǒng)執(zhí)行時,可使該服務(wù)器系統(tǒng)通過電話網(wǎng)絡(luò)接收來自個人計算機(jī)的用戶的語音呼叫,以及在語音呼叫期間從該用戶接收信息和語音命令;至少部分地基于從該用戶接收的信息確定該個人計算機(jī)的IP地址;基于該語音命令生成第一分組數(shù)據(jù);通過該網(wǎng)絡(luò)將該第一分組數(shù)據(jù)傳送到運(yùn)行在該個人計算機(jī)上的代理;通過該個人計算機(jī)接收來自該代理的第二分組數(shù)據(jù);以及基于該第二分組數(shù)據(jù)通過該電話網(wǎng)絡(luò)向該用戶生成和傳送語音信號。
8.計算機(jī)可讀程序存儲庫,該存儲庫其上存儲有計算機(jī)程序指令,當(dāng)該計算機(jī)程序指令被計算機(jī)系統(tǒng)執(zhí)行時,可使該計算機(jī)系統(tǒng)執(zhí)行權(quán)利要求1至6之一的提供遠(yuǎn)程訪問的方法。
9.一種提供自動通知用戶的方法,該方法包括的步驟為在與該用戶相關(guān)聯(lián)的計算機(jī)上提供至少一條確定發(fā)生通知事件的規(guī)則;應(yīng)用該至少一條規(guī)則來確定通知事件的發(fā)生;生成描述該通知事件的通知數(shù)據(jù);通過網(wǎng)絡(luò)將該通知數(shù)據(jù)傳送到服務(wù)器系統(tǒng),該服務(wù)器系統(tǒng)基于該通知事件和該用戶電話進(jìn)行通知的通信;生成與該通知相應(yīng)的語音信號;建立到該用戶電話的電話連接;以及將該語音信號傳送給該用戶電話。
10.一種用于通過公共網(wǎng)絡(luò)遠(yuǎn)程訪問計算機(jī)系統(tǒng)的系統(tǒng),該系統(tǒng)包括服務(wù)器系統(tǒng),該服務(wù)器系統(tǒng)與公共電話網(wǎng)絡(luò)通信,用于從用戶操作的電話接收語音呼叫,以及用于自動地將生成的語音信號傳送到該電話;并且與公共網(wǎng)絡(luò)通信,以及位于在該計算機(jī)系統(tǒng)上的代理,該代理通過公共網(wǎng)絡(luò)與該服務(wù)器系統(tǒng)通信并被編程,以訪問計算機(jī)系統(tǒng)可訪問的信息,以及響應(yīng)預(yù)定事件通過公共網(wǎng)絡(luò)將描述該信息的分組數(shù)據(jù)傳送給該服務(wù)器系統(tǒng);其中,當(dāng)該服務(wù)器系統(tǒng)從該代理接收該信息時,該服務(wù)器被編程以基于該分組數(shù)據(jù)自動地生成語音信號,并將該語音信號傳送到與該用戶相關(guān)聯(lián)的電話上。
11.權(quán)利要求10的系統(tǒng),其特征在于該計算機(jī)系統(tǒng)通過防火墻與該服務(wù)器系統(tǒng)分開,并且該代理被編程以周期性地將該計算機(jī)系統(tǒng)的IP地址傳送到該服務(wù)器系統(tǒng)上。
12.權(quán)利要求10或11的系統(tǒng),其特征在于該計算機(jī)系統(tǒng)是個人計算機(jī)。
13.權(quán)利要求10或11的系統(tǒng),其特征在于該計算機(jī)系統(tǒng)包括一個遠(yuǎn)程服務(wù)器,并且該用戶在該遠(yuǎn)程服務(wù)器上具有用戶帳號。
14.權(quán)利要求10的系統(tǒng),其特征在于該預(yù)定事件是從該代理發(fā)起的通知事件,該通知事件是由該代理基于至少一條用戶定義的規(guī)則生成的。
15.權(quán)利要求10的系統(tǒng),其特征在于該服務(wù)器系統(tǒng)包括語音服務(wù)器,該語音服務(wù)器用于通過公共電話網(wǎng)絡(luò)與該用戶通信,對被接收的語音信號使用自動語音識別,對所傳送的語音信號使用自動的文本至語音轉(zhuǎn)換。
16.權(quán)利要求15的系統(tǒng),其特征在于該系統(tǒng)還包括語音中繼服務(wù)器,該語音中繼服務(wù)器與該語音服務(wù)器通信以及與該代理通信,以從該代理處接收信息,以及根據(jù)在語音服務(wù)器上接收的用戶語音命令,將命令請求數(shù)據(jù)傳送給代理。
17.權(quán)利要求16的系統(tǒng),其特征在于該服務(wù)器系統(tǒng)包括用戶信息數(shù)據(jù)存儲庫,并且該語音中繼服務(wù)器將語音服務(wù)器從用戶處接收的用戶認(rèn)證信息與該用戶信息數(shù)據(jù)存儲庫比較,以認(rèn)證用戶,使其對該計算機(jī)系統(tǒng)的訪問。
18.權(quán)利要求17的系統(tǒng),其特征在于該用戶認(rèn)證信息是由該語音服務(wù)器基于通過公共電話網(wǎng)絡(luò)從該用戶處接收的認(rèn)證口音來確定的。
19.權(quán)利要求10的系統(tǒng),其特征在于該預(yù)定事件是從該服務(wù)器系統(tǒng)接收命令數(shù)據(jù),并且該命令數(shù)據(jù)與該服務(wù)器系統(tǒng)通過公共電話網(wǎng)絡(luò)接收的語音命令相應(yīng)。
20.權(quán)利要求13的系統(tǒng),其特征在于該遠(yuǎn)程服務(wù)器可接納多個用戶帳號,并且該代理幫助通過該服務(wù)器系統(tǒng)遠(yuǎn)程訪問每個用戶帳號。
21.一種用于向用戶提供通知的方法,該方法包括服務(wù)器系統(tǒng)通過網(wǎng)絡(luò)從與該用戶相關(guān)聯(lián)的計算機(jī)上的代理接收連接請求;建立該代理和該服務(wù)器系統(tǒng)之間的連接;通過該網(wǎng)絡(luò)從該代理接收通知數(shù)據(jù);處理該通知數(shù)據(jù)來生成語音通知;基于該連接請求建立到該用戶電話的電話連接;以及通過該電話連接將該語音通知傳送給該用戶電話。
22.權(quán)利要求21的方法,其特征在于創(chuàng)建步驟包括從該連接指令確定用戶標(biāo)識符;訪問數(shù)據(jù)庫以基于該用戶的標(biāo)識符確定該用戶的電話號碼;以及呼叫該電話號碼。
23.權(quán)利要求21的方法,其特征在于該通知分組數(shù)據(jù)括分組數(shù)據(jù)。
24.權(quán)利要求21的方法,其特征在于該連接請求和通知數(shù)據(jù)是由該代理響應(yīng)確定通知事件而生成的,該通知事件是根據(jù)至少一條預(yù)定義的規(guī)則來確定的。
全文摘要
本發(fā)明涉及一種使用自動語音識別訪問計算機(jī)系統(tǒng)的遠(yuǎn)程訪問系統(tǒng)和方法。本發(fā)明也涉及位于該計算機(jī)系統(tǒng)上的智能代理,以幫助通過語音識別或文本至語音回讀來遠(yuǎn)程訪問和接收該計算機(jī)系統(tǒng)上的信息。該遠(yuǎn)程訪問系統(tǒng)和方法可以被該計算機(jī)系統(tǒng)的用戶在旅行時使用。該用戶可以撥號到被構(gòu)造為通過自動語音識別和文本至語音轉(zhuǎn)換與該用戶交互的服務(wù)器系統(tǒng)。該服務(wù)器系統(tǒng)通過公共網(wǎng)絡(luò)的分組通信創(chuàng)建到智能代理的連接,該智能代理運(yùn)行在用戶的遠(yuǎn)程計算機(jī)系統(tǒng)上。該智能代理獲取該用戶計算機(jī)系統(tǒng)上或該計算機(jī)系統(tǒng)可訪問的信息,處理該信息并通過公共網(wǎng)絡(luò)將其傳送到該服務(wù)器系統(tǒng)。該服務(wù)器系統(tǒng)將該信息轉(zhuǎn)換成語音信號,并將該語音信號傳送到該用戶操作的電話。
文檔編號G10L13/00GK1989733SQ200580024501
公開日2007年6月27日 申請日期2005年5月20日 優(yōu)先權(quán)日2004年5月21日
發(fā)明者S·G·阿尼森 申請人:電纜優(yōu)勢軟件有限公司