国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于識別對話系統(tǒng)中的專有名稱的系統(tǒng)和方法

      文檔序號:2823287閱讀:205來源:國知局
      專利名稱:用于識別對話系統(tǒng)中的專有名稱的系統(tǒng)和方法
      技術領域
      本發(fā)明的實施例總體上涉及對話系統(tǒng),尤其涉及識別對話系統(tǒng)中的專有名稱。
      背景技術
      口語是人們最自然和最常規(guī)的通信工具。隨著數(shù)據(jù)存儲能力的快速增加,人們趨向于在數(shù)據(jù)庫中存儲更大數(shù)量的信息。采用口語界面來訪問該數(shù)據(jù)向人們提供了便利性和高效性,但是僅在口語界面是可靠的情況下才是如此。這在眼忙和手忙的情況中尤其重要, 例如在駕車的情況中。利用口語命令和語音識別的人機界面通常都基于對話系統(tǒng)。對話系統(tǒng)是被設計成在輸入和輸出通道上通過使用一致的結(jié)構(gòu)和文本、語音、圖形或者其他通信模式來與人類進行交談的計算機系統(tǒng)。采用語音的對話系統(tǒng)被稱為口語對話系統(tǒng),并且通常代表著最自然的人機界面類型。隨著對電子設備的依賴性日益增加,口語對話系統(tǒng)被日益增加地實施在許多不同的機器中。在許多口語界面應用程序中都非常廣泛地使用專有名稱(proper name),諸如人名、場所名、公司名、地名以及類似事物的名稱。實際上,在這些應用程序中使用的專有名稱的數(shù)量是相當大的,并且會涉及到外來名稱,諸如導航領域中的街道名稱或者餐館選擇領域中的餐館名稱。當處于高應力環(huán)境(諸如駕車、開飛機或者操作機器)中時,人們趨向于使用簡短的術語,諸如部分專有名稱以及它們的微小變異。在傳統(tǒng)的口語界面應用程序中,專有名稱識別的現(xiàn)有問題包括在語音識別器部件中針對這些名稱的語音識別精度不夠高;以及關于系統(tǒng)數(shù)據(jù)庫中出現(xiàn)的這些名稱,對這些名稱的識別精度不夠高。對大的名稱列表的現(xiàn)有名稱識別方法通常嚴格地聚焦于名稱的靜態(tài)方面。這種系統(tǒng)沒有對能夠明顯有助于專有名稱的識別過程的特定語境元素加以利用。這種語境元素可以包括名稱被使用時的時態(tài)效應、近因效應以及語境效應?,F(xiàn)有的識別系統(tǒng)還可以被配置為通過直接確認的方式來確認專有名稱。在該方法中,該系統(tǒng)通過重新敘述用戶的話語并直接提及該系統(tǒng)理解的名稱來對問題進行響應。一種類型的直接確認系統(tǒng)明確地向用戶詢問他或她是否提到了特定的名稱。例如,如果用戶正在預定機票,他或許會說“I want to fly from Boston to New York"0之后,該系統(tǒng)可以通過說“You said Boston to New York, is that correct ?”來進行響應。之后,該用戶必須回答這是正確還是錯誤的,并提供必要的糾正。為了使該系統(tǒng)看起來更像是在進行對話,可以以不太直接的方式來復述該確認。例如,如果用戶說“I want to fly from Boston to New York,,,貝Ij該系統(tǒng)可以通過說"0K,when would you like to fly from Boston to New ^rk ?”來進行響應。這種類型的確認(稱為隱含確認)是基于這樣的事實,即如果該系統(tǒng)理解不正確并錯誤地陳述了一個或多個名稱,則該用戶將提供糾正;但是如果該系統(tǒng)正確地重復了這些名稱,則該用戶將不必說與這些名稱相關的任何事情。通過在響應中包括專有名稱,該系統(tǒng)已經(jīng)直接地確認了該系統(tǒng)理解的名稱。直接確認系統(tǒng)通常是比較笨的,因為它們涉及對用戶說出的專有名稱進行復述,因此是過度重復的,從而增加了時間并有可能降低用戶體驗。這些系統(tǒng)的缺點還在于,它們會趨向于重復或者傳播在語音識別過程期間犯的錯誤。因此,需要一種利用語境信息并致力于為口語界面應用程序解決專有名稱識別任務中的問題的對話系統(tǒng),即改善針對這些名稱的語音識別精度以及這些名稱的識別精度。


      通過示例的方式示出了本發(fā)明的實施例,并且不受附圖中的圖形的限制,其中,類似的標號指代類似的元件,其中圖1是根據(jù)實施例的包括改善的專有名稱識別單元的口語對話系統(tǒng)的框圖;圖2是根據(jù)實施例的示出了用于生成間接確認語句的部件的框圖;圖3是根據(jù)實施例的示出了用于生成間接確認語句的方法的流程圖;圖4是根據(jù)實施例的對話策略部件的功能部件的框圖。
      具體實施例方式描述了利用語境信息來執(zhí)行專有名稱的識別的對話系統(tǒng)的實施例。不同于針對大的名稱列表的現(xiàn)有名稱識別方法(其通常嚴格地聚焦于這些名稱的靜態(tài)方面),本發(fā)明的實施例考慮了名稱使用時的時態(tài)效應、近因效應以及語境效應,并且形成新的問題以針對過去和當前話語的識別進一步限制搜索空間或者語法。在下面的描述中,引入了大量的具體細節(jié)來提供對一對話系統(tǒng)響應生成系統(tǒng)和方法的透徹理解,以及提供對一對話系統(tǒng)響應生成系統(tǒng)和方法的描述及其實施例。然而,本領域技術人員將意識到,可以在沒有一個或多個具體細節(jié)或者沒有其他部件、系統(tǒng)等的情況下來實踐這些實施例。在其他實例中,沒有示出或者沒有詳細描述公知的結(jié)構(gòu)或者操作,以避免模糊所公開實施例的各個方面。在典型的對話交互會話中,專有名稱識別的可信度通常不是非常高,至少對于某些名稱而言是如此。為了改善專有名稱識別,已經(jīng)開發(fā)了使用特定語境信息(諸如,使用特定領域的知識或者用戶模型)的系統(tǒng)。該專有名稱識別系統(tǒng)的實施例通過間接確認的形成來構(gòu)建并利用語境信息,其中可以以從之前的對話改變中用戶輸入推得的問題的形式來提供該間接確以。圖1是根據(jù)實施例的包括了利用語境信息的專有名稱識別單元的口語對話系統(tǒng)的框圖。出于本發(fā)明描述的目的,在處理設備上執(zhí)行的任何過程都可以稱為模塊或者部件, 并且可以是在各自的設備計算機上本地執(zhí)行的獨立的程序,或者它們可以是運行于一個或者多個設備上的分布式客戶端應用程序的部分。系統(tǒng)100的核心部件包括口語理解(SLU) 模塊104,其具有針對不完美輸入的多個理解策略;信息狀態(tài)更新或者其他類型的對話管理器(DM) 106,其對多個對話線程以及混合主動性(mixed initiative)進行處理;知識管理器(KM) 110,其控制對基于實體領域的知識的訪問;以及內(nèi)容優(yōu)化器112,其將對話管理器與知識管理器相連接,并用于解決來自用戶請求的歧義,管理呈現(xiàn)給用戶的信息量,以及向用戶提供建議。在一個實施例中,口語用戶輸入101產(chǎn)生由語音識別單元102接收的聲波。語音識別單元102可以包括用于提供諸如動態(tài)語法以及基于分類的n-gram之類的功能的部件。在用戶輸入101是基于文本而非基于語音的情況中,語音識別單元102被繞開, 并且模擬的用戶輸入被直接提供給口語理解單元104。響應生成器108提供該系統(tǒng)100的輸出。響應生成器108基于用戶輸入來生成音頻和/或文本輸出。這種輸出可以是對查詢的回答、請求澄清或請求其它信息、用戶輸入的重復或者任何其他適當?shù)捻憫m憫善?108在生成響應時利用領域信息。因此,向用戶說同一事情的不同措辭通常將產(chǎn)生非常不同的結(jié)果。圖1所示的系統(tǒng)100包括存儲大量名稱的大數(shù)據(jù)存儲器118。在整個說明書中,術語“名稱”用于表示任意類型的實體標記(諸如人名、地名或者事情的名稱)或者針對對象或者實體的任何其他描述符或者標記。通常,取決于領域或者對話系統(tǒng)應用程序,數(shù)據(jù)存儲器118中的名稱的數(shù)量可以非常大,例如幾十、幾百或幾千個名稱的量級。為了改善對用戶話語中的名稱的識別精度,可以基于近來會話的輸入語音中使用的名稱的語境,采用所附權重值將大的名稱列表減小成更小的名稱列表。向更小列表外部的名稱分配0權重值。數(shù)據(jù)存儲器118能夠保存被組織到一個或多個數(shù)據(jù)庫的名稱。一個數(shù)據(jù)庫可以是靜態(tài)數(shù)據(jù)庫,其包括所有可能的名稱,即常用名稱(諸如常用商標或者引用)或者由用戶頻繁使用的名稱(諸如從用戶簡檔或者模型中導出的名稱)。在靜態(tài)數(shù)據(jù)庫中,在開始會話之前預先計算權重值,并且該權重值通常基于使用頻率。第二數(shù)據(jù)庫可以是動態(tài)數(shù)據(jù)庫,其持續(xù)地從DM單元106中獲取話語語境中的名稱(諸如剛提到的名稱)??梢詷?gòu)建包括附加有適當權重值的全部以及部分名稱的名稱列表,所述適當權重值取決于名稱使用的語境以及名稱的其他特性。例如,可以將高權重給予近來已經(jīng)提到的名稱,將較低的權重給予常用名稱,以及將最低的權重給予尚未被使用的名稱。通常,取決于從其獲取名稱的數(shù)據(jù)庫來向名稱列表中的每個名稱分配權重。通常,來自動態(tài)數(shù)據(jù)庫的名稱的權重高于來自靜態(tài)數(shù)據(jù)庫的名稱的權重。可以基于任何適當?shù)臉硕?諸如0到100%,或者任何類似的標度)來分配權重,并且權重能夠用于幫助識別系統(tǒng)改善識別精度。系統(tǒng)100的實施例還包括對話策略部件114。當對話管理器106檢測識別了相對低可信度的名稱時,調(diào)用該對話策略部件。對于對話管理器檢測到足夠高的識別級別的名稱而言,通過該系統(tǒng)定義的標準響應過程來處理對話。對話策略部件114實現(xiàn)了包括間接確認方法的名稱識別系統(tǒng)。不同于用戶說出的名稱被系統(tǒng)直接復述的直接確認(例如,“^u said Boston to New York, correct ”), 間接確認系統(tǒng)為用戶生成基于名稱的新的問題,但是不是對名稱進行復述。這種類型的系統(tǒng)降低了直接確認的重復性,因此更像是進行會話,并且向用戶模型中添加了潛在的相關數(shù)據(jù)。例如,如果用戶說“I want to fly from Boston to New ^rk”,則該系統(tǒng)可以通過說“0K,when would you like to leave Massachusetts ?”來進行響應。這種類型的間接確認要求基于用戶話語中的被適當識別的專有名稱形成相關問題。如果例如該系統(tǒng)將“Boston”誤解成“Austin”,則間接確認可以被陳述為“0K,when would you like to leave Texas ”。在這種情況中,用戶將需要通過復述問題或者通過澄清被陳述的名稱來對該系統(tǒng)進行糾正。通過使用不同的名稱而不是嘗試重復用戶所說的名稱,該間接確認系統(tǒng)消除了與直接確認系統(tǒng)相關聯(lián)的、用戶沒有識別出被重復的名稱是不正確的的潛在問題。即,如果該系統(tǒng)陳述了 “Austin”而非“Boston”,則用戶或許會如他初始期望的那樣聽到“Boston”而非“Austin”,并且沒有意識到系統(tǒng)犯了錯誤。通過形成不同的語句,該系統(tǒng)更完全地吸引了用戶并且提供了不同的理解和澄清基礎。也可以基于該系統(tǒng)可用的不同類型的信息(例如,用戶位置、設備類型)以及該系統(tǒng)可用的任何其他的客觀信息形成相關問題。例如,如果用戶處于正在通過北加利福尼亞的車中,并且請求該系統(tǒng)發(fā)現(xiàn)“Mountain View”中的餐館,則該系統(tǒng)或許會將該地名與“Monterey”相混淆。在這種情況中,該系統(tǒng)可以向用戶回話“As you drive through Silicon Valley…”。由該系統(tǒng)生成的該間接確認利用了這樣的事實,即用戶的位置位于 "Silicon Valley”附近而非“Monterey”半島附近,并且該用戶在請求時正位于車輛內(nèi)。如果該系統(tǒng)的理解正確,則用戶可以繼續(xù)與該系統(tǒng)的對話,否則他或她可以提供糾正信息??梢曰趯ο到y(tǒng)輸出的用戶響應來提供附加的間接確認問題或語句。對語音識別階段要生成的系統(tǒng)可信度進行響應,直到達到足夠的識別精度。圖2是根據(jù)實施例的示出了用于生成間接確認語句的部件的框圖。如系統(tǒng)200所示,對話策略部件從用戶輸入202以及對象數(shù)據(jù)源204中獲取數(shù)據(jù),以生成間接確認語句或問題210??梢詮母鞣N源(諸如用戶簡檔數(shù)據(jù)庫、位置傳感器、設備描述符等)來提供對象數(shù)據(jù)204。在一個實施例中,對話策略部件114對用戶話語、從過去的用戶話語中獲得的語義內(nèi)容和數(shù)據(jù)進行跟蹤,以在交互期間識別當前的話語。利用可信度來度量識別精度??梢远x用于實現(xiàn)該過程的一個或多個閾值可信度。具體地,如果當前被識別的話語的可信分數(shù)高,則使用被識別的話語、從該話語中恢復的語義內(nèi)容和數(shù)據(jù)來繼續(xù)與該用戶進行交互。 如果被識別的話語或者語義內(nèi)容的可信分數(shù)低于某個定義閾值,則生成相關的間接確認問題或語句并由該系統(tǒng)將其作為對話過程的一部分提供給用戶。圖3是根據(jù)實施例的示出了用于生成間接確認語句的方法的流程圖。在框302中, 語音識別器部件接收用戶話語,并且該系統(tǒng)對話語中的專有名稱進行分析。該系統(tǒng)試圖識別專有名稱并確定針對該識別的初始可信分數(shù)。設置閾值可信度。在一個實施例中,基于語音識別器來根據(jù)經(jīng)驗設置閾值可信度??梢杂勺R別器單元102自動地提供可信度(諸如在商用單元的情況中),或者可以由系統(tǒng)管理員或者設計者來定義可信度。通常規(guī)定可信度位于0到100%的百分比范圍內(nèi),并且典型的閾值可以大約為75-85%。在這種情況中, 如果識別器返回了可信度高于閾值的假設,則該系統(tǒng)將系統(tǒng)響應接受作為被精確識別的名稱。低于閾值的任何值都將導致該假設被拒絕。取決于應用程序要求以及系統(tǒng)約束,不同的識別器可以具有不同的閾值水平。語音識別器單元102可以生成被識別名稱的一個或多個假設。例如,對于上面的機票預訂問題,語音識別器可以產(chǎn)生下面三種識別假設“BoSton”、“AUStin”以及 “Houston”。在這三種或者任意數(shù)量的假設中,根據(jù)可信分數(shù)或其他數(shù)據(jù),一種假設或許比其他假設好。例如,該系統(tǒng)或許知道在會話時該用戶正位于美國的東海岸上。在這種情況中,相比于“Austin”或者“Houston”,“Boston”是更好的選擇,即使“Austin”和“Houston” 這些城市名稱中的其中一個名稱具有更高的可信分數(shù)。在框305,該系統(tǒng)從可用假設中選擇最佳假設。可以基于可信分數(shù)和/或該系統(tǒng)可用的任何外部信息來做出該選擇,并且可以由該系統(tǒng)和/或用戶定義的規(guī)則來指定該選擇。之后,在框306,將被選擇的假設的可信分數(shù)與定義的可信閾值進行比較。如果被識別的話語或者語義內(nèi)容的可信分數(shù)低,則在框308,由該系統(tǒng)將基于語境信息形成的相關問題提示給用戶。之后,在框310,接收并處理針對該相關問題的用戶響應。之后,在框312, 該響應用于對在過去的交互中獲得的之前不確信的用戶話語以及信息的識別或者重新評分進行約束。該過程從執(zhí)行閾值比較的框306開始重復,直到從用戶獲得足夠高可信度的結(jié)果或者高可信度的組合結(jié)果。一旦從回答話語中獲得的被識別的結(jié)果和信息具有足夠高的可信度,即高于定義閾值的可信度,則將專有名稱接受為被識別的專有名稱,并且該對話系統(tǒng)繼續(xù)常規(guī)的系統(tǒng)響應。如圖3中的框308所示,如果被選擇的假設的可信度低于定義的可信度閾值,則形成相關問題。可以以各種方式形成該相關問題。在一個實施例中,可以基于系統(tǒng)為當前用戶話語產(chǎn)生的η-最佳列表或格狀物(lattice)、知識庫或該應用程序的數(shù)據(jù)庫中的關系, 形成問題。η-最佳列表可以從語音識別器(其采用輸入聲音信號來產(chǎn)生一個或多個識別假設)來生成,而格狀物是η-最佳列表的壓縮表示。當用戶對問題進行回答時,被識別的結(jié)果可以用于約束之前用戶話語的識別或者重新評分,如果其具有高的可信度的話。在識別期間,基于從用戶的回答中收集到的信息來修改名稱候選。如果可供選擇的假設不止一個,則提出相關間接確認問題并修改可信度評分的迭代過程將幫助該系統(tǒng)從各種可能的假設中進行選擇。例如,如果所述假設包括以下各項Boston、Austin和Houston,則對相關問題“So,you plan to fly out of Massachusetts”的肯定的用戶響應將導致該系統(tǒng)選擇 “Boston”作為被識別的名稱。然而,如果用戶通過說“No,I plan to fly out of Texas" 進行響應,則該系統(tǒng)必須之后詢問另一隨后的問題,因為雖然“Boston”已經(jīng)被排除了,但是 “Austin”或者“Houston”仍然是可能的候選者。在這種情況中,該系統(tǒng)可以接著提出另一問題,諸如“So,you will be flying out of the state capital…”。針對該附加相關問題的用戶響應之后將允許該系統(tǒng)在兩個剩余的選項中進行選擇。在一個實施例中,高可信度的回答還可以用于對通過用戶話語取得的之前識別結(jié)果以及數(shù)據(jù)進行重新評分。例如,如果在用戶話語之間或者從這些用戶話語中獲得的數(shù)據(jù)之間存在著重疊,則由預定義的模型或者函數(shù)(例如,特定權重的聚合函數(shù))來組合重疊部分的可信度。可以執(zhí)行多個步驟,直到從用戶獲得高可信度的結(jié)果或者高可信度的組合結(jié)果為止。在這種情況中,重疊可以包括系統(tǒng)響應與用戶話語之間的重復單詞。圖4是根據(jù)實施例的對話策略部件的功能部件的框圖。如圖4所示,對話策略部件包括形成相關問題的問題形成模塊404、判決形成部件406以及重新評分/識別部件408。 通常,相關問題影響著語音識別器的語言模型部分。語言模塊對搜索進行約束。該模型的改變將對隨后問題產(chǎn)生不同結(jié)果。這引入了該系統(tǒng)的動態(tài)自適應度。對話策略部件使用在對語音識別的名稱候選進行約束和修改中包括的語境信息。 用澄清對話來錨定話語的可信部分能夠使用數(shù)據(jù)內(nèi)部中的語義關系來縮小識別的名稱類型。在一個實施例中,對話系統(tǒng)中的計算機實現(xiàn)的方法包括接收包括專有名稱的用戶話語;識別用戶話語中的專有名稱;確定針對所識別的專有名稱的第一可信分數(shù);如果第一可信分數(shù)低于定義的閾值,則生成包括與專有名稱相關的間接確認問題的第一機器響應用戶話語,其中,該第一機器響應不對專有名稱進行重復;接收針對間接確認問題的用戶響應;以及基于用戶響應來修改第一可信分數(shù)以生成第二可信分數(shù)。在該方法中,專有名稱可以包括描述人、場所或者事情的任意詞性(part of speech) 0用戶話語可以包括輸入到對話系統(tǒng)的語音識別階段的查詢,其中該方法還包括從用戶話語分析專有名稱;生成一個或多個假設以識別多個候選名稱,其中,每個候選名稱潛在地對應于說出的專有名稱;以及從所述多個候選名稱中選擇最佳專有名稱。在一個實施例中,最佳候選名稱是具有最接近于所述定義的閾值的第一可信分數(shù)的名稱。該實施例的方法還可以包括定義與說出的專有名稱相關聯(lián)的一個或多個特征; 以及通過在第一機器響應中包括一個或多個特征中的至少一個特征,形成間接確認問題。 間接確認問題可以基于η-最佳列表形成。該方法還可以包括如果第二可信分數(shù)低于定義的閾值,則生成包括與專有名稱相關的附加間接確認問題的第二機器響應用戶話語,其中, 第二機器響應不對專有名稱進行重復。該方法還可以包括通過在第二機器響應中包括來自所述第一機器響應的所述一個或多個特征中的至少一個附加特征,形成附加間接確認問題。在一個實施例中,該方法還可以包括如果第一可信分數(shù)高于定義的閾值,則繼續(xù)常規(guī)的對話響應過程??商鎿Q地,該方法還可以包括如果第二可信分數(shù)高于定義的閾值, 則繼續(xù)常規(guī)的對話響應過程。本文的實施例包括對話系統(tǒng),該對話系統(tǒng)包括語音識別單元,用于接收包括專有名稱的用戶話語;識別器單元,用于識別用戶話語中的專有名稱;評分單元,用于確定針對所識別的專有名稱的第一可信分數(shù);以及問題形成單元,用于如果第一可信分數(shù)低于定義的閾值,則生成包括與專有名稱相關的間接確認問題的第一機器響應用戶話語,其中,該第一機器響應并不對專有名稱進行重復,其中,語音識別器單元接收對間接確認問題的用戶響應;以及評分單元,用于基于用戶響應來修改第一可信分數(shù)以生成第二可信分數(shù)。在該系統(tǒng)中,專有名稱可以包括描述人、場所或者事情的任意詞性。該系統(tǒng)還可以包括分析器,用于從用戶話語分析專有名稱;以及判決形成單元,用于生成一個或多個假設以識別多個候選名稱,其中,每個候選名稱潛在地對應于說出的專有名稱,并用于從所述多個候選名稱中選擇最佳專有名稱。最佳候選名稱可以是具有最接近于所述定義的閾值的第一可信分數(shù)的名稱。在該系統(tǒng)中,問題形成單元定義與說出的專有名稱相關聯(lián)的一個或多個特征;以及通過在第一機器響應中包括所述一個或多個特征中的至少一個特征,形成間接確認問題。間接確認問題可以基于η-最佳列表形成。在一個實施例中,如果第二可信分數(shù)低于定義的閾值,則該系統(tǒng)生成包括與專有名稱相關的附加間接確認問題的第二機器響應用戶話語,其中,第二機器響應不對專有名稱進行重復。問題形成單元還可以通過在第二機器響應中包括來自第一機器響應的所述一個或多個特征中的至少一個附加特征,形成附加間接確認問題。本文描述的名稱識別過程的各個方面可以被實施為被編程到各種電路中的任何電路中的功能,其中,各種電路包括可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、可編程邏輯陣列(PAL)器件、電可編程邏輯和存儲器器件和基于標準單元的器件以及專用集成電路。用于實施各個方面的一些其他可能的設備包括具有存儲器(諸如EEPR0M)的微控制器、嵌入式微處理器、固件、軟件等。此外,用于服務所述方法的內(nèi)容的各個方面可以在微處理器中得到體現(xiàn),該微處理器具有基于軟件的電路仿真、離散邏輯(時序和組合邏輯)、 定制器件、模糊(神經(jīng))邏輯、量子器件以及上述器件類型的任意混合。底層器件技術可以以各種部件類型來提供,例如,金屬-氧化物-半導體場效應晶體管(MOSFET)技術(類似于互補金屬-氧化物半導體(CMOQ)、雙極技術(類似于射極耦合邏輯(ECL))、聚合物技術 (例如,硅共軛聚合物以及金屬共軛聚合物-金屬結(jié)構(gòu))、模數(shù)混合等。
      應當指出的是,就其行為、寄存器傳送、邏輯部件和/或其他特征而言,本文公開的各種功能可以使用任意數(shù)量硬件、固件的組合來被描述、和/或被描述為各種機器可讀或計算機可讀介質(zhì)中實現(xiàn)的數(shù)據(jù)和/或指令。其中這種格式化的數(shù)據(jù)和/或指令可以被體現(xiàn)的計算機可讀介質(zhì)可以包括但不局限于各種形式的非易失性存儲器介質(zhì)(例如,光、磁或者半導體存儲器介質(zhì))以及可以用于通過無線、光或者有線信號介質(zhì)或其組合來傳送這種格式化的數(shù)據(jù)和/或指令的載波。通過載波來傳送這種格式化的數(shù)據(jù)和/或指令的示例包括但不局限于經(jīng)由一個或多個數(shù)據(jù)傳輸協(xié)議(例如,HTTP、FTP、SMTP等)通過因特網(wǎng)和 /或其他計算機網(wǎng)絡來進行傳送(上傳、下載、電郵等)。除非上下文中明確要求,否則在整個說明書和權利要求書中,措辭“包括 (comprise) ”、“包括(comprising) ”等被解釋為包括的意思,其與排它的意思和窮舉的意思不同;也就是說,“包括但不局限于”的意思。使用單數(shù)或者復數(shù)的措辭也分別包括復數(shù)或者單數(shù)。另外,措辭“這里”、“在下文”、“上述”、“下面”以及類似意義的措辭指的是作為整體的本申請,而非指代本申請的任何特定部分。當措辭“或”用于引用兩個或多個項目的列表時,那個措辭覆蓋該措辭的下述所有解釋該列表中的任意項目、該列表中的所有項目以及該列表中的項目的任意組合。上面對所示的響應生成過程的實施例的描述并不意欲是窮舉的或者意欲實施例受到公開的精確形式或者指令的限制。雖然本文出于說明的目的描述了針對計算設備中的過程的具體實施例以及示例,但是如本領域技術人員將意識到的,各種等價修改能夠位于所公開方法和結(jié)構(gòu)的范圍內(nèi)??梢詫⑸厦婷枋龅母鞣N實施例的元素和動作進行組合來提供進一步的實施例。根據(jù)上面的詳細描述,能夠做出針對響應生成過程的這些以及其他改變。通常,在下面的權利要求書中,使用的術語不應當被解釋為公開的方法受到該說明書中公開的具體實施例的限制,而是應當被解釋為包括根據(jù)所述權利要求進行操作的所有操作或者過程。因此,公開的結(jié)構(gòu)和方法不受本公開的限制,相反地,所引用方法的范圍完全由權利要求書來確定。雖然以下文某種權利要求形式呈現(xiàn)了所公開系統(tǒng)和方法的特定方面,但是發(fā)明人設想其能涵蓋以任意數(shù)量的權利要求形式的方法的各個方面。例如,雖然僅引用了一個方面來說明其可以體現(xiàn)在機器可讀介質(zhì)中,但是其他方面也可以體現(xiàn)在機器可讀介質(zhì)中。因此,發(fā)明人保留以下權利在提交本申請之后添加其他權利要求,以為其他方面實現(xiàn)這種附加權利要求的形式。
      權利要求
      1.一種對話系統(tǒng)中的計算機實現(xiàn)的方法,包括 接收包括專有名稱的用戶話語;識別所述用戶話語中的所述專有名稱; 確定針對所識別的專有名稱的第一可信分數(shù);如果所述第一可信分數(shù)低于定義的閾值,則生成第一機器響應用戶話語,其包括與所述專有名稱相關的間接確認問題,其中,所述第一機器響應不對所述專有名稱進行重復; 接收對所述間接確認問題的用戶響應;以及基于所述用戶響應來修改所述第一可信分數(shù)以生成第二可信分數(shù)。
      2.根據(jù)權利要求1所述的方法,其中,所述專有名稱包括描述人、場所或者事情的任意詞性。
      3.根據(jù)權利要求1所述的方法,其中,所述用戶話語包括輸入到所述對話系統(tǒng)的語音識別階段的查詢,該方法還包括從所述用戶話語分析所述專有名稱;生成一個或多個假設以識別多個候選名稱,其中,每個候選名稱潛在地對應于說出的專有名稱;以及從所述多個候選名稱中選擇最佳專有名稱。
      4.根據(jù)權利要求2所述的方法,其中,最佳候選名稱是具有最接近于所述定義的閾值的所述第一可信分數(shù)的名稱。
      5.根據(jù)權利要求1所述的方法,該方法還包括 定義與說出的專有名稱相關聯(lián)的一個或多個特征;以及通過在所述第一機器響應中包括所述一個或多個特征中的至少一個特征,形成所述間接確認問題。
      6.根據(jù)權利要求5所述的方法,其中,所述間接確認問題基于η-最佳列表形成。
      7.根據(jù)權利要求5所述的方法,還包括如果所述第二可信分數(shù)低于所述定義的閾值, 則生成第二機器響應用戶話語,其包括與所述專有名稱相關的附加間接確認問題,其中,所述第二機器響應不對所述專有名稱進行重復。
      8.根據(jù)權利要求7所述的方法,還包括通過在所述第二機器響應中包括來自所述第一機器響應的所述一個或多個特征中的至少一個附加特征,形成所述附加間接確認問題。
      9.根據(jù)權利要求1所述的方法,還包括如果所述第一可信分數(shù)高于所述定義的閾值, 則繼續(xù)常規(guī)的對話響應過程。
      10.根據(jù)權利要求1所述的方法,還包括如果所述第二可信分數(shù)高于所述定義的閾值,則繼續(xù)常規(guī)的對話響應過程。
      11.一種對話系統(tǒng),包括語音識別單元,用于接收包括專有名稱的用戶話語; 識別器單元,用于識別所述用戶話語中的所述專有名稱; 評分單元,用于確定針對所識別的專有名稱的第一可信分數(shù);以及問題形成單元,用于如果所述第一可信分數(shù)低于定義的閾值,則生成包括與所述專有名稱相關的間接確認問題的第一機器響應用戶話語,其中,所述第一機器響應不對所述專有名稱進行重復,其中,所述語音識別器單元接收對所述間接確認問題的用戶響應,并且所述評分單元基于所述用戶響應來修改所述第一可信分數(shù)以生成第二可信分數(shù)。
      12.根據(jù)權利要求11所述的系統(tǒng),其中,所述專有名稱包括描述人、場所或者事情的任意詞性。
      13.根據(jù)權利要求11所述的系統(tǒng),還包括分析器,用于從所述用戶話語分析所述專有名稱;以及判決形成單元,用于生成一個或多個假設以識別多個候選名稱,其中,每個候選名稱潛在地對應于說出的專有名稱,并且從所述多個候選名稱中選擇最佳專有名稱。
      14.根據(jù)權利要求12所述的系統(tǒng),其中,最佳候選名稱是具有最接近于所述定義的閾值的所述第一可信分數(shù)的名稱。
      15.根據(jù)權利要求11所述的系統(tǒng),其中,所述問題形成單元定義與說出的專有名稱相關聯(lián)的一個或多個特征;以及,通過在所述第一機器響應中包括所述一個或多個特征中的至少一個特征,形成所述間接確認問題。
      16.根據(jù)權利要求15所述的系統(tǒng),其中,所述間接確認問題基于η-最佳列表形成。
      17.根據(jù)權利要求15所述的系統(tǒng),其中,如果所述第二可信分數(shù)低于所述定義的閾值, 則該系統(tǒng)生成包括與所述專有名稱相關的附加間接確認問題的第二機器響應用戶話語,其中,所述第二機器響應不對所述專有名稱進行重復。
      18.根據(jù)權利要求17所述的系統(tǒng),其中,所述問題形成單元還通過在所述第二機器響應中包括來自所述第一機器響應的所述一個或多個特征中的至少一個附加特征,形成所述附加間接確認問題。
      全文摘要
      描述了利用語境信息來執(zhí)行專有名稱的識別的對話系統(tǒng)的實施例。不同于針對大的名稱列表的現(xiàn)有名稱識別方法(其通常嚴格地聚焦于這些名稱的靜態(tài)方面),本發(fā)明的實施例考慮了名稱使用時的時態(tài)效應、近因效應以及語境效應,并且形成新的問題以對過去和當前話語的識別進一步限制搜索空間或者語法。
      文檔編號G10L15/22GK102282609SQ200980154741
      公開日2011年12月14日 申請日期2009年11月13日 優(yōu)先權日2008年11月19日
      發(fā)明者Z·馮, 沈中南, 翁富良 申請人:羅伯特·博世有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1