查詢,該查詢響應可 聽地呈現(xiàn)給用戶。域特定話音接口 204可以基于信息完成查詢響應模板以生成查詢響應, 從而響應用戶的查詢,并且可以指示用戶終端102可聽地輸出查詢響應。例如,查詢響應模 板可以是"你今天有[插入會議數(shù)目]"。如果用戶詢問"我今天有多少會議"?,域特定話 音接口 204可以完成查詢響應模板以生成查詢響應,并且可以指示用戶終端102可聽地輸 出查詢響應以響應用戶的查詢。因此,分類器話音接口 202可以初始地處理初始用戶查詢 以從查詢獲得屬性,基于屬性識別適當?shù)挠蛱囟ㄔ捯艚涌?204,并且將查詢分派到該適當?shù)?域特定話音接口 204以便進一步處理。
[0030] 例如,用戶終端102可以包括兩個域特定話音接口:日歷域特定話音接口和方位 域特定話音接口。分類器話音接口 202可以處理從用戶接收到的可聽查詢(例如,"今天我 有什么會議"),并且可以確定查詢是請求找出用戶今天有什么會議。分類器話音接口 202可 以處理查詢以確定日歷域話音接口將最適于執(zhí)行與用戶的任何進一步對話以及處理查詢。 分類器話音接口 202接著將指令轉(zhuǎn)發(fā)到日歷域特定話音接口,以便基于其專用的知識來進 一步處理查詢。日歷域特定話音接口接著將產(chǎn)生查詢響應(例如,"你今天有兩個會議")。
[0031] 在另一個示例中,分類器話音接口 202可以將用戶的查詢引導到針對音樂的域特 定話音接口 204。用戶的初始查詢可以跟著是用戶和域特定話音接口 204之間的若干次對 話輪回,包括過濾和總結(jié)。例如,如果用戶要求憂傷的音樂,則域特定話音接口 204可以針 對憂傷流派內(nèi)的音軌來過濾用戶的音樂。即使用戶不太熟悉域數(shù)據(jù)的特征,域特定話音接 口 204可以按照小數(shù)目的特征為用戶總結(jié)特征,這些特征被選擇是因為或者它們在劃分數(shù) 據(jù)方面極為有用,或者它們指示了數(shù)據(jù)的有用的或不尋常的特性。例如,域特定話音接口 204可以處理和過濾用戶的音樂,并且可聽的輸出"這些憂傷音軌中的十個在你最近播放的 列表上"。域特定話音接口 204也可以負責處理域內(nèi)動作,例如但不限于,播放某些音樂、創(chuàng) 建新的播放列表等。下面提供在分類器話音接口 202處分類查詢以及由域特定話音接口 204處理查詢的進一步細節(jié)。
[0032] 域特定話音接口 204的每個可以與一組一個或多個域關(guān)聯(lián)。域可以表示一組特征 (例如,人、方位和用戶終端中的媒體子集)。域可以組織為具有分層結(jié)構(gòu)的知識庫。
[0033] 圖3圖示出根據(jù)本公開的示例性實施方式的知識庫。在示例性的實施方式中,知 識庫302可以具有帶有域的一個或多個層的層級結(jié)構(gòu)。例如,第一層304可以包括人域 308_1,方位域308_2,以及媒體域308_3。在第一層304上的每個域可以與不同的域特定話 音接口 204關(guān)聯(lián)。例如,人域308_1可以與人域特定話音接口 204關(guān)聯(lián),而方位域308_2可 以與方位域特定話音接口 204關(guān)聯(lián),并且媒體域308_3可以與媒體域特定話音接口 204關(guān) 聯(lián)。
[0034] 第一層304可以包括另外的子層域,例如發(fā)生在知識庫層級的第二層306處的域。 例如,人域308_1可以包括第二層306上的聯(lián)系人域308_4和電子郵件域308_5,以及短消 息服務(SMS)域、多媒體消息收發(fā)服務(MMS)域,日歷域(未示出)。方位域308_2可以包 括第二層306上的GPS定位域308_6和地圖域308_7,以及地圖域,感興趣域、商業(yè)路徑域以 及導航能力域(未示出)。媒體域308_3可以包括第二層306上的圖像域308_8和視頻域 308_9,以及音樂域和播客域(未示出)。
[0035] 人域特定話音接口 204可以處理對應于人域308_1,聯(lián)系人域308_4,電子郵件域 308_5,以及任何另外的低層域(未示出)的查詢。類似地,方位域特定話音接口可以處理 對應于方位域308_2、GPS域308_6、地圖域308_7,以及任何另外的低層域(未示出)的查 詢。知識庫302的層級是個例子,也可以使用具有比圖3中示出更多或更少層的分層、以及 具有更多、更少或其他的域的層。下面將進一步詳細描述域特定話音接口 204進行的處理。
[0036] 圖4圖示出根據(jù)本公開的示例性實施方式的域308。域308可以包括一個或多個 對象404。在所繪出的例子中,域308可以包括對象404_1和404_3。通常,對象404可以 是類類型的實例。例如,電子郵件域內(nèi)的每個對象可以代表特定的電子郵件消息。對象404 可以包括一個或多個屬性值對406、一個或多個域內(nèi)動作408,以及查詢響應模板412,以及 可選地可以包括一個或多個交叉域動作410。對象404的例子可以是聯(lián)系人項目、日歷條 目、地圖上標記的位置以及用戶拍攝的圖片。描述聯(lián)系人項目的對象404的屬性值對406 的例子可以是"名:約翰,姓:史密斯",其中"名"是屬性而"約翰"是值。描述日歷項目的 對象404的屬性值對406的例子可以是"審閱會議","日期:2008年6月29日","時 間:13 :00-14 :00,EST"。描述聯(lián)系人項目的對象404的域內(nèi)動作408的例子可以包括:動 作1)呼叫聯(lián)系人;動作2)向聯(lián)系人發(fā)送短消息服務(SMS)消息;動作3)向聯(lián)系人發(fā)送多 媒體消息收發(fā)服務(MMS)消息;動作4)從聯(lián)系人接收SMS,動作4)從聯(lián)系人接收麗S。也 可以定義與項目關(guān)聯(lián)的其他域內(nèi)動作。交叉域動作410的例子可以是:動作1)聯(lián)系人域: 導航至方位域中的地址;動作2)媒體域:經(jīng)由電子郵件向人域中的地址發(fā)送視頻剪輯;動 作3)顯示在方位域中拍攝圖片的地理位置。也可以使用其他的交叉域動作。查詢響應模 板412可以包括針對查詢響應的模板,響應于用戶的查詢,該查詢響應可聽地呈現(xiàn)給用戶。 分類器話音接口 202和域特定話音接口 204的每個可以與特定的詞匯關(guān)聯(lián),該特定的詞匯 提供它們各自的知識,以便識別域308中的特定對象404。
[0037] 圖5圖示出根據(jù)本公開的示例性實施方式的具有特定詞匯的分類器話音接口 202 和域特定話音接口 204。特定的詞匯可以是元數(shù)據(jù)、域索引以及查詢響應模板。分類器話音 接口 202可以包括指向元數(shù)據(jù)數(shù)據(jù)庫116中的其元數(shù)據(jù)的元數(shù)據(jù)指針502_1,以及指向存儲 器114中的其域索引的域索引指針504_1。域特定話音接口 204可以包括指向元數(shù)據(jù)數(shù)據(jù) 庫116中的其元數(shù)據(jù)的元數(shù)據(jù)指針502_2,以及指向存儲器114中的其域索引的域索引指針 504_2。域特定話音接口 204也可以包括指向存儲器114中的其查詢響應模板412的一個 或多個查詢響應模板指針506。
[0038] 例如,人域特定話音接口 204可以與用于處理對應于關(guān)于人的信息的用戶查詢的 元數(shù)據(jù)、域索引以及查詢響應模板關(guān)聯(lián),而方位域特定話音接口 204可以與用于處理對應 于關(guān)于方位的信息的用戶查詢的元數(shù)據(jù)、域索引以及查詢響應模板關(guān)聯(lián)。元數(shù)據(jù)可以表示 對象的描述性屬性。針對音樂軌道的元數(shù)據(jù)例如可以包括軌道的名稱、專輯名稱、藝術(shù)家、 作曲等。域索引可以是與特定的域相關(guān)的屬性。對于聯(lián)系人信息,姓名和電話號碼可以是 域索引。對于電子郵件,姓名、主題和時間戳是域索引的例子。上面指出的域索引并不是窮 舉性列表,并且每個域索引對于特定的域可能并不是唯一的。查詢響應模板412可以是針 對查詢響應的一組模板,其填充有信息以回答用戶的查詢,并且基于完成的查詢模板,用戶 終端102可以可聽地輸出查詢響應。
[0039] 分類器話音接口 202和域特定話音接口 204可以是數(shù)據(jù)可配置的。元數(shù)據(jù)、域索 引和查詢響應模板可以被更新以擴展或修訂它們的詞匯和語言模型之一或二者。詞匯可以 是分類器話音接口 202和域特定話音接口 204能夠處理的單詞和它們的各自發(fā)音的列表。 例如,如果新的條目"約翰史密斯"出現(xiàn)在聯(lián)系人列表中,則詞匯分類器話音接口 202和相 應的域特定話音接口 204的域特定話音接口 204可以通過"約翰"和"史密斯"擴展,如果這 些單詞還不是詞匯的一部分。語言模型可以描述在特定的語言中單詞如何彼此跟隨,并且 為分類器話音接口 202和域特定話音接口 204提供一種手段,以在可能和不可能的單詞序 列之間進行區(qū)分,從而提高單詞識別準確性。例如,單詞序列"在吃了我的"有可能由單詞 "午飯后"、"早餐后"或"三明治后"跟著,而"帽子"、"膝上型計算機"或"股市"是不太可能 跟著的。語言模型可以在統(tǒng)計模型中捕獲單詞序列可能性信息,該統(tǒng)計模型在大的文件集 上訓練。語言模型也可以適用于域特定話音接口 204期望在給定的域中接收的用戶的發(fā)音 風格和句子的類型。
[0040] 通過在知識庫302中使用基于結(jié)構(gòu)化對象的表示,域特定話音接口 204可以至少 以半自動的方式來構(gòu)建,以便執(zhí)行域內(nèi)動作408、交叉域動作410和可重用查詢響應模板 412,如稍后將詳細描述。分類器話音接口 202和域特定話音接口 204的各自詞匯可以被收 集和編索引以提供知識庫302,如下所討論。
[0041] 圖6圖示出根據(jù)本公開的示例性實施方式的用于對元數(shù)據(jù)進行收集和編索引以 生成知識庫的方法。
[0042] 在塊602中,用戶終端102可以在元數(shù)據(jù)數(shù)據(jù)庫116中存儲關(guān)于知識庫302的支 持的域308的元數(shù)據(jù)。元數(shù)據(jù)數(shù)據(jù)庫116可以存儲來自所有支持的域402的元數(shù)據(jù)。用戶 終端102可以收集、對搜索編索引以及在元數(shù)據(jù)數(shù)據(jù)庫116中存儲元數(shù)據(jù)。分類器話音接 口 202和域特定話音接口 204可以訪問元數(shù)據(jù)數(shù)據(jù)庫116。分類器話音接口 202和域特定 話音接口 204可以訪問元數(shù)據(jù)數(shù)據(jù)庫116以對每個進行定制,從而提供一致的可聽呈現(xiàn),而 無論使用了哪個話音接口。在每個域內(nèi),不同的元數(shù)據(jù)可能是相關(guān)的。用戶終端102可以 處理用戶偏好,該用戶偏好或