国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于多級(jí)分布式語音識(shí)別的方法和裝置的制作方法

      文檔序號(hào):2819947閱讀:289來源:國知局
      專利名稱:用于多級(jí)分布式語音識(shí)別的方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明通常涉及通信裝置和方法,更具體地涉及采用語音識(shí)別的通信設(shè)備和方法。
      背景技術(shù)
      一種涉及終端裝置的新興技術(shù)領(lǐng)域是以多種輸入和輸出格式的信息轉(zhuǎn)換的應(yīng)用,這些終端裝置例如是手持裝置,移動(dòng)電話,便攜式電腦,PDA,因特網(wǎng)設(shè)備,臺(tái)式電腦或合適的裝置。在終端裝置上典型地有一個(gè)輸入系統(tǒng),其允許用戶輸入信息,諸如特殊的信息請求。例如,一個(gè)用戶可以使用終端裝置訪問一個(gè)天氣數(shù)據(jù)庫以得到特定城市的天氣信息。典型地,用戶輸入一個(gè)請求特定位置的天氣信息的語音命令,諸如“芝加哥的天氣”。由于與終端裝置有關(guān)的處理限制,所述語音命令可能通過通信鏈路被轉(zhuǎn)發(fā)到一個(gè)網(wǎng)絡(luò)元件,其中所述網(wǎng)絡(luò)元件是一個(gè)網(wǎng)絡(luò)中的多個(gè)網(wǎng)絡(luò)元件之一。所述網(wǎng)絡(luò)元件包含一個(gè)語音識(shí)別引擎,其可以識(shí)別所述語音命令并且執(zhí)行并搜索用戶所請求的信息。此外,所述語音識(shí)別引擎可以位于所述網(wǎng)絡(luò)中并且可操作地耦合到所述網(wǎng)絡(luò)元件,而不是在所述網(wǎng)絡(luò)元件中,以便所述語音識(shí)別引擎可以被多個(gè)網(wǎng)絡(luò)元件訪問。
      隨著無線技術(shù)的進(jìn)步,用于無線裝置的用戶應(yīng)用程序已經(jīng)有了增加。這些裝置許多都變得更加容易交互,為用戶提供了輸入命令請求和訪問信息的能力。同時(shí),隨著無線技術(shù)的進(jìn)步,用戶可以提交特定信息請求的形式也有了增加。典型地,一個(gè)用戶可以通過鍵盤輸入一個(gè)命令請求,其中所述終端裝置對所述輸入編碼并且把它提供給網(wǎng)絡(luò)元件。所述系統(tǒng)的一個(gè)通用例子是電話銀行系統(tǒng),其中用戶輸入一個(gè)賬號(hào)和個(gè)人身份號(hào)碼(PIN)來訪問帳戶信息。終端裝置或網(wǎng)絡(luò)元件一旦通過鍵盤接收到輸入,就把所述輸入轉(zhuǎn)換為一個(gè)雙音多頻信號(hào)(DTMF)并且把所述DTMF信號(hào)提供給銀行服務(wù)器。
      此外,用戶可以使用語音輸入來輸入一個(gè)命令,諸如一個(gè)信息請求。即使隨著語音識(shí)別技術(shù)的發(fā)展,仍然有許多處理和存儲(chǔ)器存儲(chǔ)要求限制了終端裝置中的語音識(shí)別能力。典型地,一個(gè)語音識(shí)別引擎包括一個(gè)語音模型庫,通過它可以匹配輸入的語音命令。為了或的可靠的語音識(shí)別,時(shí)常需要一個(gè)大的庫,因此需要大量的存儲(chǔ)器。此外,隨著語音識(shí)別性能的提高,功率消耗需要也增加了,從而縮短了終端裝置的電池壽命。
      終端語音識(shí)別引擎可以是一個(gè)自適應(yīng)系統(tǒng)。語音識(shí)別引擎在具有一個(gè)較小的識(shí)別命令庫的同時(shí),更加適于并且能夠理解用戶的不同語音模型,例如語調(diào)(tone)、音調(diào)變化(inflection)、重音等等。因此,在終端中有限的語音識(shí)別庫可以通過較高程度的語音識(shí)別正確概率來彌補(bǔ)。所述系統(tǒng)典型地限制于最通用的語音命令,例如用戶叫一個(gè)名字且系統(tǒng)自動(dòng)撥相關(guān)的號(hào)碼這樣的編程語音激活撥號(hào)特點(diǎn),其預(yù)先被編程到終端中。
      另一種用于語音識(shí)別的方法是提供一個(gè)完全的語音命令給網(wǎng)絡(luò)元件。網(wǎng)絡(luò)語音識(shí)別引擎可以提高語音識(shí)別效率,因?yàn)榭捎么鎯?chǔ)器的數(shù)量大,并且可以降低關(guān)于功率消耗要求的影響。但是,在一個(gè)網(wǎng)絡(luò)元件上,語音識(shí)別引擎必須可以由訪問這多個(gè)網(wǎng)絡(luò)元件的多個(gè)用戶訪問,因此網(wǎng)絡(luò)語音識(shí)別引擎受到不能識(shí)別諸如重音等這樣的不同語音模型的限制。同樣,網(wǎng)絡(luò)語音識(shí)別引擎可以提供一個(gè)較大的語音識(shí)別命令詞匯表,但是因?yàn)樵趥€(gè)人用戶語音模型中固有的限制,正確識(shí)別的概率較低。
      還有,最近的發(fā)展提出了多級(jí)分布式語音識(shí)別,其中一個(gè)終端裝置嘗試識(shí)別一個(gè)語音命令,并且如果在所述終端中沒有識(shí)別出來,所述語音命令就被編碼并且送到網(wǎng)絡(luò)語音識(shí)別引擎用于第二次語音識(shí)別嘗試。授予Hedin等人的美國專利6,186,535B1公開了一種系統(tǒng)和方法,用于用戶接口對服務(wù)應(yīng)用程序的語音控制。所述系統(tǒng)提供了逐步的語音識(shí)別,其中只有在所述終端裝置不能識(shí)別所述語音命令時(shí),才利用至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎。美國專利6,186,535B1只提供了從終端語音識(shí)別引擎或從網(wǎng)絡(luò)語音識(shí)別引擎提供正確識(shí)別音頻命令的單級(jí)保證。
      同樣,需要一種采用語音識(shí)別引擎的改進(jìn)通信裝置。


      參照包含在此的下述附圖將更容易理解本發(fā)明。
      圖1說明一種現(xiàn)有技術(shù)的無線系統(tǒng)。
      圖2說明一種根據(jù)本發(fā)明的用于多級(jí)分布式語音識(shí)別的設(shè)備的框圖。
      圖3說明表示一種根據(jù)本發(fā)明的用于多級(jí)分布式語音識(shí)別的方法的流程圖。
      圖4說明一種根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于多級(jí)分布式語音識(shí)別的系統(tǒng)的框圖。
      圖5說明表示一種根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于多級(jí)分布式語音識(shí)別的方法的流程圖。
      具體實(shí)施例方式
      通常,通過一個(gè)終端識(shí)別引擎提供一種用于多級(jí)分布式語音識(shí)別的系統(tǒng)和方法,所述終端識(shí)別引擎可操作地耦合到終端裝置的一個(gè)音頻子系統(tǒng)內(nèi)的麥克風(fēng),接收一個(gè)音頻命令,諸如來自用戶的語音命令,例如“芝加哥的天氣”,并且產(chǎn)生至少一個(gè)終端識(shí)別的音頻命令,其中所述至少一個(gè)終端識(shí)別的音頻命令具有一個(gè)相應(yīng)的終端置信度值。
      所述系統(tǒng)和方法進(jìn)一步包括一個(gè)在網(wǎng)絡(luò)中的網(wǎng)絡(luò)元件,其具有可操作地耦合到終端內(nèi)的麥克風(fēng)的至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎,引擎接收音頻命令并且產(chǎn)生至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令,其中至少一個(gè)網(wǎng)絡(luò)元件識(shí)別的音頻命令具有一個(gè)相應(yīng)的網(wǎng)絡(luò)置信度值。
      此外,所述系統(tǒng)和方法包括一個(gè)比較器,它是一個(gè)以硬件或軟件實(shí)現(xiàn)的模塊,其比較多個(gè)識(shí)別的音頻命令和置信度值。比較器可操作地耦合到終端語音識(shí)別引擎,用于接收終端識(shí)別的音頻命令和終端語音識(shí)別置信度值,比較器進(jìn)一步耦合到網(wǎng)絡(luò)語音識(shí)別引擎,用于接收網(wǎng)絡(luò)識(shí)別的音頻命令和網(wǎng)絡(luò)語音識(shí)別置信度值。比較器比較終端語音識(shí)別置信度值和網(wǎng)絡(luò)語音識(shí)別置信度值,通過相應(yīng)的置信度值編譯并且分類所識(shí)別的語音命令。在一個(gè)實(shí)施例中,比較器基于特定的語音識(shí)別引擎為置信度提供權(quán)重因子,諸如一個(gè)特定語音識(shí)別引擎的置信度值比其他置信度值的權(quán)重大。
      一個(gè)會(huì)話管理器可操作地耦合到比較器上,其可以是一個(gè)語音瀏覽器,交互式語音響應(yīng)單元(IVR),圖形瀏覽器,基于JAVA的應(yīng)用程序,軟件程序應(yīng)用,或其他本領(lǐng)域技術(shù)人員公知的軟件/硬件應(yīng)用。會(huì)話管理器是以硬件或軟件實(shí)現(xiàn)的模塊,其在接收到所識(shí)別的音頻命令時(shí)接收、解釋或執(zhí)行一個(gè)命令。會(huì)話管理器可以為比較器提供一N個(gè)最佳(N-best)指示符,其指示要提供給會(huì)話管理器的具有最高置信度的識(shí)別命令數(shù)量。比較器為會(huì)話管理器提供所識(shí)別的音頻命令和他們的置信度值即N個(gè)最佳識(shí)別音頻命令和他們的置信度值的相關(guān)列表。此外,如果比較器不能為會(huì)話管理器提供任何識(shí)別的音頻命令,那么比較器就提供一個(gè)錯(cuò)誤通知給會(huì)話管理器。
      當(dāng)會(huì)話管理器接收一個(gè)或多個(gè)識(shí)別的音頻命令和相應(yīng)的置信度值時(shí),會(huì)話管理器可以利用另外的步驟進(jìn)一步限制該列表。例如,它可以執(zhí)行具有最高置信度值的音頻命令或把相關(guān)的列表呈現(xiàn)給用戶,以便用戶可以檢驗(yàn)音頻命令。還有,在會(huì)話管理器接收錯(cuò)誤通知或沒有一個(gè)識(shí)別的音頻命令具有高于預(yù)定最小閾值的置信度值的情況中,會(huì)話管理器提供一個(gè)錯(cuò)誤消息給用戶。
      如果音頻命令是對內(nèi)容服務(wù)器中的信息的請求,那么會(huì)話管理器訪問內(nèi)容服務(wù)器并且搜索編碼的信息。至少一個(gè)內(nèi)容服務(wù)器可操作地耦合到會(huì)話管理器,諸如通過因特網(wǎng)耦合的市場上可買到的服務(wù)器,通過局域網(wǎng)耦合的本地服務(wù)器,諸如銀行系統(tǒng)這樣的商業(yè)應(yīng)用服務(wù)器,或任何其他合適的內(nèi)容服務(wù)器。
      所搜索的編碼信息返回給會(huì)話管理器,典型地以會(huì)話管理器可解碼的標(biāo)記語言編碼,諸如超文本標(biāo)記語言(HTML),無線標(biāo)記語言(WML),擴(kuò)展標(biāo)記語言(XML),語音擴(kuò)展標(biāo)記語言(VoiceXML),擴(kuò)展超文本標(biāo)記語言(XHTML),或其他這樣的標(biāo)記語言。因此,編碼的信息通過會(huì)話管理器解碼并且提供給用戶。
      因此,音頻命令可以發(fā)送給布置在多級(jí)上的至少兩個(gè)語音識(shí)別引擎,例如第一語音識(shí)別引擎在終端裝置上,并且第二語音識(shí)別引擎在網(wǎng)絡(luò)上。
      圖1說明一種現(xiàn)有技術(shù)的無線通信系統(tǒng)100,其使得用戶102可以通過終端108和網(wǎng)絡(luò)元件110之間的通信連路訪問至少一個(gè)內(nèi)容服務(wù)器104。網(wǎng)絡(luò)元件110是網(wǎng)絡(luò)112中的多個(gè)網(wǎng)絡(luò)元件110之一。用戶102提供一個(gè)輸入命令114,諸如語音命令,例如“芝加哥的天氣”給終端108。終端108解釋所述命令并且通過諸如標(biāo)準(zhǔn)無線連接這樣的通信鏈路106把所述命令提供給網(wǎng)絡(luò)元件110。
      網(wǎng)絡(luò)元件110接收所述命令,處理所述命令,即利用一個(gè)語音識(shí)別器(未示出)來識(shí)別并解釋所述輸入命令114,然后訪問多個(gè)內(nèi)容服務(wù)器104的至少一個(gè)以搜索所請求的信息。一旦搜索所述信息,就把它返回給網(wǎng)絡(luò)元件110。隨即,所請求的信息通過通信鏈路106提供給終端108并且終端108提供一個(gè)輸出116給用戶,輸出例如是一個(gè)可聽消息。
      在圖1的現(xiàn)有技術(shù)中,輸入命令114可以是提供給終端108的一個(gè)語音命令。終端108編碼所述語音命令并且通過通信鏈路106把編碼的語音命令提供給網(wǎng)絡(luò)元件110。典型地,網(wǎng)絡(luò)元件110內(nèi)的語音識(shí)別引擎(未示出)將嘗試識(shí)別所述語應(yīng)命令并且搜索所請求的信息。如上所討論的,語音命令114也可以在終端108內(nèi)解釋,然后終端對網(wǎng)絡(luò)元件110請求,以得到所請求的信息。
      提供音頻命令114給終端108在本領(lǐng)域中也是已知的,隨即終端108嘗試解釋所述命令。如果終端108不能解釋所述命令114,那么就通過通信鏈路106把音頻命令114提供給網(wǎng)絡(luò)元件110,以便由至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎(未示出)來識(shí)別?,F(xiàn)有技術(shù)的系統(tǒng)提供逐步的語音識(shí)別系統(tǒng),只有在終端語音識(shí)別引擎不能識(shí)別所述語音命令時(shí),才訪問至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎。
      圖2說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于多級(jí)分布式語音識(shí)別的設(shè)備。音頻子系統(tǒng)120可操作地耦合到一個(gè)第一語音識(shí)別引擎122和至少一個(gè)第二語音識(shí)別引擎124,例如USA MA02111的波士頓695大街的Speech Works International公司所生產(chǎn)的OpenSpeech語音識(shí)別引擎1.0。如本領(lǐng)域技術(shù)人員所公知的,在此也可以利用任何其他合適的語音識(shí)別引擎。音頻字系統(tǒng)120通過連接126耦合到語音識(shí)別引擎122和124。第一語音識(shí)別引擎122通過連接130可操作地耦合到一個(gè)比較器128,而第二語音識(shí)別引擎124通過連接132可操作地耦合到比較器128。
      比較器128通過連接136耦合到一個(gè)會(huì)話管理器134。會(huì)話管理器通過連接140可操作地耦合到一個(gè)內(nèi)容服務(wù)器138并且通過連接144耦合到一個(gè)語音合成引擎142。此外,語音合成引擎進(jìn)一步通過連接146可操作地耦合到音頻子系統(tǒng)120。
      圖2的設(shè)備的操作參照圖3來描述,圖3說明了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于多級(jí)分布式語音識(shí)別的方法。所述方法在150開始,這時(shí)設(shè)備在步驟152接收一個(gè)音頻命令。典型地,音頻命令被提供給音頻子系統(tǒng)120。更具體,音頻命令可以通過位于音頻子系統(tǒng)內(nèi)的麥克風(fēng)(未示出)提供。如本領(lǐng)域技術(shù)人員所公知的,音頻命令可以從任何其他合適的裝置提供,例如從存儲(chǔ)單元讀取,從應(yīng)用程序提供,等等。
      一旦接收到音頻命令,在步驟154音頻子系統(tǒng)把音頻命令提供給第一語音識(shí)別引擎122和至少一個(gè)第二語音識(shí)別引擎124。通過連接126提供音頻命令。接下來,在步驟156第一語音識(shí)別引擎122識(shí)別所述音頻命令并且產(chǎn)生至少一個(gè)第一識(shí)別的音頻命令,其中,所述至少一個(gè)第一識(shí)別的音頻命令具有相應(yīng)的第一置信度值。在步驟158,第二語音識(shí)別引擎124還識(shí)別所述音頻命令并且產(chǎn)生至少一個(gè)第二識(shí)別的音頻命令,其中,所述至少一個(gè)第二識(shí)別的音頻命令具有相應(yīng)的第二置信度值。所述至少一個(gè)第二語音識(shí)別引擎與第一語音識(shí)別引擎識(shí)別相同的音頻命令,但是獨(dú)立于第一語音識(shí)別引擎來識(shí)別所述音頻命令。
      第一語音識(shí)別引擎122然后通過連接130把所述至少一個(gè)第一識(shí)別的音頻命令提供給比較器128,第二語音識(shí)別引擎124然后通過連接132把所述至少一個(gè)第二識(shí)別的音頻命令提供給比較器128。在本發(fā)明的一個(gè)實(shí)施例中,比較器用一個(gè)第一權(quán)重因子對所述至少一個(gè)第一置信度值加權(quán),用一個(gè)第二權(quán)重因子對所述至少一個(gè)第二置信度值加權(quán)。例如,在步驟160所述比較器可以遵從第一語音識(shí)別引擎的識(shí)別,第一置信度值可以乘以0.95的比例因子,而第二置信度值乘以0.90的比例因子。
      接下來,在步驟162比較器基于所述至少一個(gè)第一置信度值和所述至少一個(gè)第二置信度值從所述至少一個(gè)第一識(shí)別的音頻命令和所述至少一個(gè)第二識(shí)別的音頻命令選擇至少一個(gè)識(shí)別的音頻命令,其具有一個(gè)識(shí)別音頻命令置信度值。在本發(fā)明的一個(gè)實(shí)施例中,會(huì)話管理器為比較器提供一個(gè)N-best指示符,指示所需要的識(shí)別命令的數(shù)量,例如N-best指示符為5時(shí)是5個(gè)最佳識(shí)別命令。
      會(huì)話管理器134通過連接136從比較器128接收識(shí)別的音頻命令,如N個(gè)最好的識(shí)別命令。在步驟164會(huì)話管理器基于所述至少一個(gè)識(shí)別的音頻命令執(zhí)行至少一個(gè)操作。例如,在步驟166會(huì)話管理器通過把識(shí)別音頻命令的N-best識(shí)別列表提供給用戶由用戶檢驗(yàn),以期檢驗(yàn)所述至少一個(gè)識(shí)別的音頻命令。在本發(fā)明的一個(gè)實(shí)施例中,會(huì)話管理器134通過連接144把識(shí)別音頻命令的N-best識(shí)別列表提供給語音合成引擎142。語音合成引擎142對這N個(gè)最佳識(shí)別音頻命令進(jìn)行合成并且通過連接146把它們提供給音頻子系統(tǒng)120。音頻子系統(tǒng)把N-best識(shí)別列表提供給用戶。
      此外,會(huì)話管理器可以對所述N-best列表執(zhí)行進(jìn)一步的過濾操作,例如比較所述至少一個(gè)識(shí)別音頻命令置信度值和一個(gè)例如0.65這樣的最小置信度水平,然后簡單地指定具有最高置信度值的識(shí)別音頻命令為正確的識(shí)別音頻命令。其中,會(huì)話管理器執(zhí)行那個(gè)命令,如通過連接140訪問一個(gè)內(nèi)容服務(wù)器以搜索所請求的信息,如一個(gè)特定城市的天氣信息。
      此外,在步驟168,當(dāng)所述至少一個(gè)第一置信度值和所述至少一個(gè)第二置信度值都低于一個(gè)最小置信度值,那么比較器產(chǎn)生一個(gè)錯(cuò)誤通知。例如,參照圖2,所述比較器128可以有一個(gè)內(nèi)部最小置信度水平,例如0.55,第一置信度值和第二置信度值和它相比較。如果第一置信度值和第二置信度值沒有一個(gè)高于所述最小置信度水平,那么比較器就通過連接176發(fā)出一個(gè)錯(cuò)誤通知給會(huì)話管理器134。
      此外,例如在N個(gè)最佳識(shí)別音頻命令中的識(shí)別音頻命令沒有包含一個(gè)高于會(huì)話管理器置信度水平的識(shí)別置信度值的情況中,會(huì)話管理器可以發(fā)出一個(gè)錯(cuò)誤通知。當(dāng)?shù)谝徽Z音識(shí)別引擎和第二語音識(shí)別引擎不能識(shí)別任何音頻命令,或其中識(shí)別的音頻命令低于第一語音識(shí)別引擎、第二語音識(shí)別引擎或比較器所指定的最小置信度水平時(shí),比較器也可以產(chǎn)生錯(cuò)誤通知。
      當(dāng)通過比較器128或會(huì)話管理器134發(fā)出錯(cuò)誤通知時(shí),會(huì)話管理器執(zhí)行一個(gè)錯(cuò)誤命令,其中,錯(cuò)誤命令通過連接144提供給語音合成引擎142并且進(jìn)一步通過連接146提供給最終的用戶。如本領(lǐng)域技術(shù)人員所公知的,錯(cuò)誤命令可以通過任何其他的合適裝置,例如使用可視顯示器提供給用戶。
      圖2的設(shè)備提供了多級(jí)分布式語音識(shí)別。一旦會(huì)話管理器響應(yīng)所述至少一個(gè)識(shí)別的命令執(zhí)行一個(gè)操作,所述方法就在步驟170結(jié)束。
      圖4說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的多級(jí)分布式語音識(shí)別系統(tǒng)。系統(tǒng)200包括一個(gè)終端202和一個(gè)網(wǎng)絡(luò)元件204。如本領(lǐng)域普通技術(shù)人員所公知的,網(wǎng)絡(luò)元件202是網(wǎng)絡(luò)206中的多個(gè)網(wǎng)絡(luò)元件204之一。
      終端202有一個(gè)音頻子系統(tǒng)206,其中有一個(gè)揚(yáng)聲器208和一個(gè)麥克風(fēng)210。音頻子系統(tǒng)206可操作地耦合到一個(gè)終端語音傳送接口212。此外,在終端202內(nèi)有一個(gè)終端會(huì)話管理器214。
      終端202還有一個(gè)終端語音識(shí)別引擎216,例如60196 USA的伊利諾斯州的Scharumburg的1301East Algonquin Road的摩托羅拉公司生產(chǎn)的可以提供激活撥號(hào)的Motorola i90cTM,其可操作地通過連接218耦合到音頻子系統(tǒng)206。如本領(lǐng)域技術(shù)人員所公知的,在此可以利用其他合適的語音識(shí)別引擎。終端語音識(shí)別引擎216初始通過音頻子系統(tǒng)206內(nèi)的麥克風(fēng)216從用戶222接收一個(gè)音頻命令222。
      終端會(huì)話管理器214可操作地耦合到位于網(wǎng)絡(luò)元件204中的一個(gè)網(wǎng)絡(luò)元件會(huì)話管理器222。如本領(lǐng)域技術(shù)人員所公知的,終端會(huì)話管理器214和網(wǎng)絡(luò)元件會(huì)話管理器222在用于會(huì)話通信會(huì)話初始化時(shí)以及在通信會(huì)話終止時(shí)進(jìn)行通信。例如,在位于終端202和網(wǎng)絡(luò)元件204內(nèi)的各種元件初始化啟動(dòng)期間提供地址分配。
      終端語音傳送接口212可操作地耦合到位于網(wǎng)絡(luò)元件204內(nèi)的一個(gè)網(wǎng)絡(luò)元件語音傳送接口224。網(wǎng)絡(luò)元件語音傳送接口224進(jìn)一步可操作地耦合到至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎226,如例如USA MA02111的波士頓695大街的Speech Works International公司所生產(chǎn)的OpenSpeech語音識(shí)別引擎1.0。如本領(lǐng)域技術(shù)人員所公知的,在此可以利用任何其他合適的語音識(shí)別引擎。所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎226進(jìn)一步通過連接230耦合到一個(gè)比較器228,比較器可以以軟件或硬件實(shí)現(xiàn),其用于從終端語音識(shí)別引擎216和網(wǎng)絡(luò)語音識(shí)別引擎226接收的識(shí)別音頻命令中選擇至少一個(gè)識(shí)別的音頻命令。
      比較器228進(jìn)一步通過連接232耦合到位于終端202中的終端語音識(shí)別引擎216。比較器228還通過連接236耦合到一個(gè)會(huì)話管理器234。會(huì)話管理器234可操作地耦合到多個(gè)模塊,通過連接240耦合到一個(gè)語音合成引擎238,并且耦合到至少一個(gè)內(nèi)容服務(wù)器104。如本領(lǐng)域技術(shù)人員所公知的,會(huì)話管理器可以耦合到多個(gè)其他部件,為了清楚的目的,這些部件從圖4中省略了。
      圖5說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于多級(jí)分布式語音識(shí)別的方法。如參照圖4所說明的,圖5的方法在步驟300開始,此時(shí)在終端202內(nèi)接收音頻命令。典型地,音頻命令通過用戶102提供一個(gè)音頻輸入給音頻子系統(tǒng)206的麥克風(fēng)210提供給終端202。在步驟304,音頻輸入以標(biāo)準(zhǔn)編碼格式編碼并且提供給終端語音識(shí)別引擎216并且進(jìn)一步通過終端語音傳送接口212和至少一個(gè)網(wǎng)絡(luò)元件語音傳送接口224提供給至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎226。
      類似于圖2的設(shè)備,在步驟306,終端語音識(shí)別引擎識(shí)別音頻命令以產(chǎn)生至少一個(gè)終端識(shí)別的音頻命令,其中,該至少一個(gè)終端識(shí)別的音頻命令具有相應(yīng)的終端置信度值。在步驟308,所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎226識(shí)別音頻命令以產(chǎn)生至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令,其中,所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令具有相應(yīng)的網(wǎng)絡(luò)置信度值。所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎與終端語音識(shí)別引擎識(shí)別相同的音頻命令,但是獨(dú)立于終端語音識(shí)別引擎來識(shí)別音頻命令。
      一旦終端語音識(shí)別引擎216已經(jīng)識(shí)別音頻命令,那么通過連接232把所述至少一個(gè)終端識(shí)別的音頻命令提供給比較器228。同樣,一旦所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎226已經(jīng)識(shí)別所述音頻命令,那么通過連接230把所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令提供給比較器228。
      在本發(fā)明的一個(gè)實(shí)施例中,在步驟310比較器228用一個(gè)終端權(quán)重因子對至少一個(gè)終端置信度值加權(quán),用一個(gè)網(wǎng)絡(luò)權(quán)重因子對至少一個(gè)網(wǎng)絡(luò)置信度值加權(quán)。例如,所述比較器可以遵從所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎的識(shí)別,從而調(diào)整即把所述網(wǎng)絡(luò)置信度值乘以一個(gè)比例因子以增大網(wǎng)絡(luò)置信度值并且調(diào)整即把終端置信度值乘以一個(gè)比例因子以降低終端置信度值。
      此外,所述方法在步驟312從所述至少一個(gè)終端識(shí)別音頻命令和所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令選擇至少一個(gè)識(shí)別的音頻命令,其具有一個(gè)識(shí)別命令置信度值。特別是,比較器228基于所述識(shí)別音頻命令的置信度值選擇多個(gè)識(shí)別的音頻命令。在本發(fā)明的一個(gè)實(shí)施例中,會(huì)話管理器234向比較器提供一個(gè)N-best指示符,指示所需要的識(shí)別命令的數(shù)量N。比較器228通過所述至少一個(gè)終端識(shí)別的音頻命令和所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令的相應(yīng)置信度值對它們進(jìn)行分類并且從中提取N個(gè)最佳命令。
      在本發(fā)明的一個(gè)實(shí)施例中,比較器228可以基于所識(shí)別的音頻命令的相應(yīng)置信度值過濾所述至少一個(gè)終端識(shí)別的音頻命令和至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令。例如,比較器可以有一個(gè)最小置信度值,所識(shí)別的音頻命令置信度值與它相比較并且具有低于所述最小置信度值的置信度值的所有識(shí)別音頻命令被排除。從而,比較器向會(huì)話管理器提供N個(gè)最佳命令。
      此外,在置信度值高于最小度置信度水平的命令小于N個(gè)的情況中,比較器可以向會(huì)話管理器提供小于N個(gè)的命令。在比較器沒有接收到任何置信度值高于最小置信度水平的識(shí)別命令時(shí),比較器產(chǎn)生一個(gè)錯(cuò)誤通知并且通過連接236把所述錯(cuò)誤通知提供給會(huì)話管理器。此外,在步驟314,當(dāng)至少一個(gè)終端置信度值和至少一個(gè)網(wǎng)絡(luò)置信度值低于一個(gè)最小置信度值時(shí),例如低于0.5的置信度水平,產(chǎn)生一個(gè)錯(cuò)誤通知。
      在本發(fā)明的一個(gè)實(shí)施例中,在步驟316會(huì)話管理器可以檢驗(yàn)所述至少一個(gè)識(shí)別的音頻命令,以產(chǎn)生一個(gè)檢驗(yàn)過的識(shí)別音頻命令,并且基于所述檢驗(yàn)過的識(shí)別音頻命令執(zhí)行一個(gè)操作。例如,會(huì)話管理器可以經(jīng)語音傳送接口212和214和語音合成引擎238,通過揚(yáng)聲器208把識(shí)別音頻命令的N-best列表提供給用戶。用戶然后可以選擇N個(gè)最佳命令中的哪一個(gè)能精確反映原始的音頻命令,從而產(chǎn)生一個(gè)檢驗(yàn)過的識(shí)別音頻命令。
      然后以與提供原始音頻命令相同的方式把檢驗(yàn)過的識(shí)別音頻命令返回給會(huì)話管理器234。例如,N-best列表中的第四個(gè)識(shí)別的音頻命令是正確的命令,并且用戶檢驗(yàn)所述命令,產(chǎn)生一個(gè)檢驗(yàn)過的識(shí)別音頻命令,所述用戶然后可以向麥克風(fēng)206說出單詞4,其被提供給終端語音識(shí)別引擎216和所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎226并且進(jìn)一步提供給比較器228,在那里它被提供給會(huì)話管理器234。會(huì)話管理器234一接收到所述檢驗(yàn)過的識(shí)別音頻命令就基于所述檢驗(yàn)過的識(shí)別音頻命令執(zhí)行一個(gè)操作。
      會(huì)話管理器234可以基于所述至少一個(gè)識(shí)別的音頻命令或所述檢驗(yàn)過的音頻命令執(zhí)行多個(gè)操作。例如,會(huì)話管理器可以訪問一個(gè)內(nèi)容服務(wù)器104,例如一個(gè)商業(yè)數(shù)據(jù)庫,以搜索所請求的信息。此外,會(huì)話管理器可以執(zhí)行程序內(nèi)的一個(gè)操作,如繼續(xù)預(yù)編程的應(yīng)用程序的下一個(gè)步驟。還有,會(huì)話管理器可以把識(shí)別的音頻命令填充為一種形式并且隨即從用戶請求用于所述形式的下一條或輸入。如本領(lǐng)域技術(shù)人員所公知的,會(huì)話管理器可以針對或在接收到至少一個(gè)識(shí)別音頻命令時(shí)執(zhí)行任何合適的操作。
      在本發(fā)明的一個(gè)實(shí)施例中,在步驟318一旦接收到所述至少一個(gè)識(shí)別的音頻命令,會(huì)話管理器基于所述至少一個(gè)識(shí)別的音頻命令的置信度值過濾所述至少一個(gè)識(shí)別的命令,并且基于具有最高識(shí)別音頻命令置信度值的識(shí)別音頻命令執(zhí)行一個(gè)操作。例如,會(huì)話管理器可以除去所有置信度值低于一個(gè)預(yù)定設(shè)置,例如低于0.6的所有識(shí)別音頻命令,并且基于其余的識(shí)別音頻命令執(zhí)行一個(gè)操作。如上所述,會(huì)話管理器可以響應(yīng)所述至少一個(gè)識(shí)別的音頻命令執(zhí)行任何合適的可執(zhí)行操作。
      此外,類似于比較器236執(zhí)行的操作,會(huì)話管理器可以基于所述過濾設(shè)法除去任何置信度值低于預(yù)定置信度水平的任何識(shí)別音頻命令。例如,會(huì)話管理器設(shè)置的最小置信度值可以比比較器高,如所述最小置信度水平可以由會(huì)話管理器234獨(dú)立于系統(tǒng)200的其他部分來設(shè)置。在過濾后會(huì)話管理器不包含任何高于所述會(huì)話管理器最小置信度水平的識(shí)別音頻命令的情況中,類似于比較器228,會(huì)話管理器234產(chǎn)生一個(gè)錯(cuò)誤通知。
      一旦產(chǎn)生所述錯(cuò)誤通知,所述會(huì)話管理器執(zhí)行一個(gè)錯(cuò)誤命令234以通知用戶,沒有正確接收到音頻命令。如本領(lǐng)域技術(shù)人員所公知的,會(huì)話管理器可以簡單地執(zhí)行錯(cuò)誤命令,而不像比較器228執(zhí)行的那樣產(chǎn)生錯(cuò)誤通知。
      一旦會(huì)話管理器已經(jīng)完全執(zhí)行了所述操作,在步驟320完成用于多級(jí)分布式識(shí)別的方法。
      本發(fā)明通過一個(gè)第一語音識(shí)別引擎和至少一個(gè)第二語音識(shí)別引擎針對多級(jí)分布式語音識(shí)別。在本發(fā)明的一個(gè)實(shí)施例中,第一語音識(shí)別位于終端內(nèi)并且所述至少一個(gè)第二語音識(shí)別引擎位于網(wǎng)絡(luò)中。如本領(lǐng)域技術(shù)人員所公知的,語音識(shí)別引擎可以位于終端、網(wǎng)絡(luò)元件,位于可操作地耦合到所述網(wǎng)絡(luò)元件在所述網(wǎng)絡(luò)上的一個(gè)單獨(dú)的服務(wù)器等等,其中語音識(shí)別引擎接收音頻命令并且提供至少一個(gè)識(shí)別的音頻命令進(jìn)行比較并且提供給一個(gè)會(huì)話管理器。此外,本發(fā)明通過獨(dú)立于提供命令給第一語音識(shí)別引擎,提供相同的音頻命令給第二語音識(shí)別引擎來改進(jìn)現(xiàn)有技術(shù)。因此,與第一語音識(shí)別引擎的識(shí)別能力無關(guān),同樣的音頻命令進(jìn)一步提供給第二語音識(shí)別。同樣,本發(fā)明通過利用多個(gè)語音識(shí)別引擎和一個(gè)比較器和會(huì)話管理器來改上語音識(shí)別的可靠性,它們可以接收并且進(jìn)一步改進(jìn)系統(tǒng)和方法的語音識(shí)別能力的精確度。
      應(yīng)所述理解,本發(fā)明的其他變形和修改的實(shí)施和它的各方面對于本領(lǐng)域普通技術(shù)人員是顯而易見的,本發(fā)明并不受在此描述的具體實(shí)施例的限制。例如,圖4的比較器和會(huì)話管理器可以位于耦合到所述網(wǎng)絡(luò)元件的一個(gè)服務(wù)器上,而不位于所述網(wǎng)絡(luò)元件內(nèi)。因此可以想到,本發(fā)明覆蓋落在在此公開和描述的基礎(chǔ)原理的精神和范圍內(nèi)的任何和所有修改、變形或等效方式。
      權(quán)利要求
      1.一種用于多級(jí)分布式語音識(shí)別的方法,包括將音頻命令提供給一個(gè)第一語音識(shí)別引擎和至少一個(gè)第二語音識(shí)別引擎;在所述第一語音識(shí)別引擎中識(shí)別所述音頻命令以產(chǎn)生至少一個(gè)第一識(shí)別的音頻命令,其中所述至少一個(gè)第一識(shí)別的音頻命令具有一個(gè)相應(yīng)的第一置信度值;并且獨(dú)立于第一語音識(shí)別引擎識(shí)別所述音頻命令,在所述至少一個(gè)第二語音識(shí)別引擎中識(shí)別所述音頻命令以產(chǎn)生至少一個(gè)第二識(shí)別的音頻命令,其中所述至少一個(gè)第二識(shí)別的音頻命令具有一個(gè)相應(yīng)的第二置信度值。
      2.如權(quán)利要求1的方法,進(jìn)一步包括基于所述至少一個(gè)第一置信度值和所述至少一個(gè)第二置信度值從所述至少一個(gè)第一識(shí)別的音頻命令和所述至少一個(gè)第二識(shí)別的音頻命令中選擇至少具有一個(gè)識(shí)別音頻命令置信度值的一個(gè)識(shí)別的音頻命令。
      3.如權(quán)利要求1的方法,進(jìn)一步包括在選擇至少一個(gè)識(shí)別的音頻命令之前,用第一權(quán)重因子對所述至少一個(gè)第一置信度值進(jìn)行加權(quán),并且用第二權(quán)重因子對所述至少一個(gè)第二置信度值進(jìn)行加權(quán)。
      4.如權(quán)利要求2的方法,進(jìn)一步包括基于所述至少一個(gè)識(shí)別的音頻命令執(zhí)行至少一個(gè)操作。
      5.如權(quán)利要求2的方法,進(jìn)一步包括檢驗(yàn)所述至少一個(gè)識(shí)別的音頻命令。
      6.如權(quán)利要求1的方法,進(jìn)一步包括;當(dāng)所述至少一個(gè)第一置信度值和所述至少一個(gè)第二置信度值低于一個(gè)最小置信度水平時(shí),產(chǎn)生一個(gè)錯(cuò)誤通知。
      7.一種用于多級(jí)分布式語音識(shí)別的方法,該方法包括將音頻命令提供給一個(gè)終端語音識(shí)別引擎和至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎;在所述終端語音識(shí)別引擎中識(shí)別所述音頻命令以產(chǎn)生至少一個(gè)終端識(shí)別的音頻命令,其中所述至少一個(gè)終端識(shí)別的音頻命令具有一個(gè)相應(yīng)的終端置信度值;并且在所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎中識(shí)別所述音頻命令以產(chǎn)生至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令,其中所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令具有一個(gè)相應(yīng)的網(wǎng)絡(luò)置信度值;從所述至少一個(gè)終端識(shí)別的音頻命令和所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令中選擇具有一個(gè)識(shí)別音頻命令置信度值的至少一個(gè)識(shí)別的音頻命令。
      8.如權(quán)利要求7的方法,進(jìn)一步包括;當(dāng)所述至少一個(gè)終端置信度值和所述至少一個(gè)網(wǎng)絡(luò)置信度值低于一個(gè)最小置信度水平時(shí),產(chǎn)生一個(gè)錯(cuò)誤通知。
      9.如權(quán)利要求7的方法,進(jìn)一步包括在選擇所述至少一個(gè)識(shí)別的音頻命令之前,用終端權(quán)重因子對所述至少一個(gè)終端置信度值進(jìn)行加權(quán),并且用網(wǎng)絡(luò)權(quán)重因子對所述至少一個(gè)網(wǎng)絡(luò)置信度值進(jìn)行加權(quán)。
      10.如權(quán)利要求7的方法,進(jìn)一步包括基于所述至少一個(gè)識(shí)別的音頻命令的置信度值來過濾所述至少一個(gè)識(shí)別的音頻命令;并且基于具有最高識(shí)別的音頻命令的置信度值的所述識(shí)別音頻命令執(zhí)行一操作。
      11.如權(quán)利要求7的方法,進(jìn)一步包括檢驗(yàn)所述至少一個(gè)識(shí)別的音頻命令,以產(chǎn)生一個(gè)檢驗(yàn)的識(shí)別音頻命令;并且基于所述檢驗(yàn)的識(shí)別音頻命令執(zhí)行一操作。
      12.一種用于多級(jí)分布式音頻識(shí)別的設(shè)備,該設(shè)備包括可操作地耦合到音頻子系統(tǒng)的第一音頻識(shí)別裝置,用于接收一個(gè)音頻命令、并且產(chǎn)生一個(gè)第一識(shí)別的音頻命令,其中,所述至少一個(gè)第一識(shí)別的音頻命令具有相應(yīng)的第一置信度值;并且可操作地耦合到所述音頻子系統(tǒng)的第二語音識(shí)別裝置,其獨(dú)立于第一語音識(shí)別裝置,用于接收所述音頻命令、并且產(chǎn)生至少一個(gè)第二識(shí)別的音頻命令,其中,所述至少一個(gè)第二識(shí)別的音頻命令具有相應(yīng)的第二置信度值;以及可操作地耦合到所述第一和第二語音識(shí)別裝置的裝置,用于接收所述至少一個(gè)第一識(shí)別的音頻命令和所述至少一個(gè)第二識(shí)別的音頻命令。
      13.如權(quán)利要求12的設(shè)備,進(jìn)一步包括可操作地耦合到所述用于接收的裝置的會(huì)話管理器,其中,所述用于接收的裝置基于所述至少一個(gè)第一置信度值和所述至少一個(gè)第二置信度值、從所述至少一個(gè)第一識(shí)別的音頻命令和所述至少一個(gè)第二識(shí)別的音頻命令中選擇具有一個(gè)識(shí)別音頻命令置信度值的至少一個(gè)識(shí)別的音頻命令,其中,所選擇的至少一個(gè)音頻命令被提供給所述會(huì)話管理器。
      14.如權(quán)利要求12的設(shè)備,其中所述會(huì)話管理器基于所述至少一個(gè)識(shí)別的音頻命令置信度水平、從所述至少一個(gè)識(shí)別的音頻命令確定一個(gè)會(huì)話管理器音頻命令,其中,所述會(huì)話管理器響應(yīng)所述會(huì)話管理器音頻命令執(zhí)行一操作。
      15.如權(quán)利要求14的設(shè)備,其中所述會(huì)話管理器訪問一個(gè)內(nèi)容服務(wù)器,并且響應(yīng)所述會(huì)話管理器音頻命令,搜索編碼的信息。
      16.如權(quán)利要求15的設(shè)備,進(jìn)一步包括可操作地耦合到所述會(huì)話管理器的語音合成引擎,其中,所述語音合成引擎從所述會(huì)話管理器接收所述語音編碼的信息、并且產(chǎn)生語音格式化的信息。
      17.如權(quán)利要求16的設(shè)備,其中所述音頻子系統(tǒng)可操作地耦合到所述語音合成引擎,其中,所述音頻子系統(tǒng)接收所述語音格式化的信息并且提供一個(gè)輸出消息。
      18.如權(quán)利要求17的設(shè)備,其中當(dāng)比較器向所述會(huì)話管理器提供一個(gè)錯(cuò)誤通知時(shí),所述輸出消息是一個(gè)錯(cuò)誤狀態(tài)。
      19.一種用于多級(jí)分布式音頻識(shí)別的系統(tǒng),該系統(tǒng)包括可操作地耦合到一個(gè)麥克風(fēng)的終端音頻識(shí)別引擎,其被耦合以接收一個(gè)音頻命令并且產(chǎn)生至少一個(gè)終端識(shí)別的音頻命令,其中,所述至少一個(gè)終端識(shí)別的音頻命令具有一個(gè)相應(yīng)的終端置信度值;并且可操作地耦合到所述麥克風(fēng)的至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎,其被耦合以獨(dú)立于所述終端語音識(shí)別引擎,接收所述音頻命令、并且產(chǎn)生至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令,其中,所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令具有一個(gè)相應(yīng)的網(wǎng)絡(luò)置信度值;可操作地耦合到所述終端識(shí)別引擎的比較器,其被可操作地耦合以接收所述至少一個(gè)終端識(shí)別的音頻命令,并且進(jìn)一步被可操作地耦合到所述至少一個(gè)網(wǎng)絡(luò)語音識(shí)別引擎,可操作地耦合以接收所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令;以及可操作地耦合到所述比較器的會(huì)話管理器,其中,所述比較器基于所述至少一個(gè)終端置信度值和所述至少一個(gè)網(wǎng)絡(luò)置信度值從所述至少一個(gè)終端識(shí)別的音頻命令和所述至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令中選擇具有一個(gè)識(shí)別音頻命令置信度值的至少一個(gè)識(shí)別的音頻命令,其中,所選的至少一個(gè)識(shí)別的音頻命令被提供給所述會(huì)話管理器。
      20.如權(quán)利要求19的系統(tǒng),其中所述會(huì)話管理器基于所述至少一個(gè)識(shí)別的音頻命令置信度水平從所述至少一個(gè)識(shí)別的音頻命令確定一個(gè)會(huì)話管理器音頻命令,其中,所述會(huì)話管理器響應(yīng)所述會(huì)話管理器音頻命令執(zhí)行一操作。
      21.如權(quán)利要求20的系統(tǒng),其中所述會(huì)話管理器訪問一個(gè)內(nèi)容服務(wù)器,并且響應(yīng)所述會(huì)話管理器音頻命令搜索編碼的信息。
      22.如權(quán)利要求21的系統(tǒng),其中可操作地耦合到所述會(huì)話管理器的語音合成引擎,其中,所述語音合成引擎從所述會(huì)話管理器接收所述語音編碼的信息、并且產(chǎn)生語音格式化的信息,以及可操作地耦合到所述語音合成引擎的揚(yáng)聲器,其中,所述揚(yáng)聲器接收所述語音格式化的信息并且提供一個(gè)輸出消息。
      全文摘要
      本發(fā)明公開了一種用于多級(jí)分布式語音識(shí)別的系統(tǒng)和方法,包括一個(gè)終端,其具有一個(gè)可操作地耦合到麥克風(fēng)(130)的終端語音識(shí)別器(136)。所述終端語音識(shí)別器(136)接收一個(gè)音頻命令(37),產(chǎn)生至少一個(gè)終端識(shí)別的音頻命令,其具有一個(gè)終端置信度值。一個(gè)網(wǎng)絡(luò)元件(124)具有至少一個(gè)網(wǎng)絡(luò)語音識(shí)別器(150),網(wǎng)絡(luò)元件也接收音頻命令(149),產(chǎn)生至少一個(gè)網(wǎng)絡(luò)識(shí)別的音頻命令,其具有一個(gè)網(wǎng)絡(luò)置信度值。一個(gè)比較器(152)接收所述識(shí)別的音頻命令,比較語音識(shí)別置信度值。所述比較器(152)提供一個(gè)輸出(162)給所述至少一個(gè)識(shí)別的音頻命令的會(huì)話管理器(160),其中所述會(huì)話管理器基于所述至少一個(gè)識(shí)別的音頻命令執(zhí)行一個(gè)命令,例如把所述至少一個(gè)識(shí)別音頻命令呈送給用戶進(jìn)行檢驗(yàn)或訪問一個(gè)內(nèi)容服務(wù)器。
      文檔編號(hào)G10L15/28GK1633679SQ02826496
      公開日2005年6月29日 申請日期2002年12月20日 優(yōu)先權(quán)日2001年12月29日
      發(fā)明者塞納卡·巴拉蘇里亞 申請人:摩托羅拉公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1