用于向語音操作功能分配關(guān)鍵字模型的方法和裝置的制造方法
【專利說明】用于向語音操作功能分配關(guān)鍵字模型的方法和裝置
[0001]相關(guān)串請案之交叉參考
[0002]本申請主張在2013年7月8日提交的共同擁有的美國臨時專利申請?zhí)?1/843,650和在2014年12月10日提交的美國非臨時專利申請?zhí)?4/101,869的優(yōu)先權(quán),上述專利申請中的每個的全部內(nèi)容通過引用明確并入本文。
技術(shù)領(lǐng)域
[0003]本公開大體涉及電子裝置中的語音識別,并且更具體地涉及為在電子裝置中執(zhí)行功能識別目標關(guān)鍵字。
【背景技術(shù)】
[0004]近年來,使用移動裝置諸如智能手機和平板計算機已變得普遍。這些裝置通常通過無線網(wǎng)絡提供語音和/或數(shù)據(jù)通信功能。另外,此些移動裝置通常包含提供經(jīng)設計提高用戶方便性的多種功能的其它特征。
[0005]越來越多地使用的移動裝置中的特征中的一個特征是語音識別功能。當識別出來自用戶的語音命令(例如,關(guān)鍵字)時,此功能允許移動裝置執(zhí)行各種功能。例如,移動裝置可響應于來自用戶的語音命令激活語音助手應用程序、播放音頻文件或拍攝圖片。
[0006]在常規(guī)的移動裝置中,制造商或運營商往往為裝置配備可用于檢測相關(guān)聯(lián)的關(guān)鍵字的聲音模型。然而,此些裝置一般包含數(shù)量有限的聲音模型和關(guān)鍵字。因此,用戶可能被限制僅使用裝置中初始設置的關(guān)鍵字和聲音模型。在一些裝置中,用戶可通過基于新關(guān)鍵字的許多說話方式訓練聲音模型來生成用于檢測關(guān)鍵詞的聲音模型。響應于用戶輸入所生成的此些聲音模型可能由于例如關(guān)鍵字的不充分采樣,而在檢測新關(guān)鍵字中不是很準確。
【發(fā)明內(nèi)容】
[0007]本公開提供用于向功能分配目標關(guān)鍵字,以便當基于和所述目標關(guān)鍵字相關(guān)聯(lián)的關(guān)鍵字模型檢測到所述目標關(guān)鍵字時執(zhí)行所述功能的方法和設備。
[0008]根據(jù)本公開的一個方面,揭示一種用于向功能分配目標關(guān)鍵字的方法。在該方法中,經(jīng)由通信網(wǎng)絡在電子裝置收到多個目標關(guān)鍵字的列表,并且所述目標關(guān)鍵字從收到的多個目標關(guān)鍵字的列表選擇。進一步地,所述方法可包含經(jīng)由通信網(wǎng)絡接收用于所選擇目標關(guān)鍵字的關(guān)鍵字模型,并向電子裝置的功能分配目標關(guān)鍵字,使得所述功能響應于基于所述關(guān)鍵字模型在所述電子裝置收到的輸入聲音中檢測出所述目標關(guān)鍵字而被執(zhí)行。本公開還描述涉及該方法的設備、裝置、系統(tǒng)、裝置的組合以及計算機可讀介質(zhì)。
[0009]根據(jù)本公開的另一方面,揭示一種用于向應用程序分配目標關(guān)鍵字的方法。在該方法中,經(jīng)由通信網(wǎng)絡收到多個應用程序的列表,并且,應用程序從收到的應用程序的列表選擇。進一步地,所述方法可包含經(jīng)由通信單元接收用于所選擇應用程序的應用程序文件,所述應用程序文件包含用于目標關(guān)鍵字的關(guān)鍵字模型,從所述應用程序文件提取關(guān)鍵字模型,并向所述應用程序分配目標關(guān)鍵字用于當基于所述關(guān)鍵字模型檢測出輸入聲音中的所述目標關(guān)鍵字時激活所述應用程序。本公開還描述涉及該方法的設備、裝置、系統(tǒng)、裝置的組合以及計算機可讀介質(zhì)。
[0010]根據(jù)本公開的另一方面,揭示了一種用于提供數(shù)據(jù)文件的方法。在該方法中,多個目標關(guān)鍵字的列表經(jīng)由通信網(wǎng)絡傳送至電子裝置,并且經(jīng)由通信網(wǎng)絡收到用于所選擇目標關(guān)鍵字的請求。進一步地,所述方法可包含經(jīng)由通信網(wǎng)絡向電子裝置傳送用于所選擇目標關(guān)鍵字的關(guān)鍵字模型。關(guān)鍵字模型適于在輸入聲音中檢測所選擇的目標關(guān)鍵字。本公開也描述涉及該方法的設備、裝置、系統(tǒng)、裝置的組合以及計算機可讀介質(zhì)。
[0011]根據(jù)本公開的另一方面,電子裝置包含下載管理單元和關(guān)鍵字設定單元。下載管理單元經(jīng)配置經(jīng)由通信網(wǎng)絡接收用于從多個目標關(guān)鍵字的列表選擇的特定目標關(guān)鍵字的關(guān)鍵字模型。關(guān)鍵字設定單元經(jīng)配置向電子裝置的功能分配所述特定目標關(guān)鍵字,使得所述功能響應于基于關(guān)鍵字模型在電子裝置收到的輸入聲音中檢測出特定目標關(guān)鍵字而被執(zhí)行。
[0012]根據(jù)本公開的另一方面,電子裝置包含下載管理單元、提取單元和關(guān)鍵字設定單元。下載管理單元經(jīng)配置經(jīng)由通信網(wǎng)絡接收從多個應用程序的列表選擇的用于應用程序的應用程序文件。應用程序文件包含用于目標關(guān)鍵字的關(guān)鍵字模型。提取單元經(jīng)配置從應用程序文件提取關(guān)鍵字模型。關(guān)鍵字設定單元經(jīng)配置向所選擇應用程序指定目標關(guān)鍵字用于當基于關(guān)鍵字模型在輸入聲音中檢測出所述目標關(guān)鍵字時執(zhí)行所述應用程序。
[0013]根據(jù)本公開的另一方面,服務器包含數(shù)據(jù)庫、通信單元和控制單元。數(shù)據(jù)庫經(jīng)配置存儲至少一個目標關(guān)鍵字和至少一個關(guān)鍵字模型。關(guān)鍵字模型適于在輸入聲音中檢測相關(guān)聯(lián)的目標關(guān)鍵字。通信單元經(jīng)配置向電子裝置傳送至少一個目標關(guān)鍵字的列表,并從所述電子裝置接收從所述至少一個目標關(guān)鍵字的列表選擇的用于目標關(guān)鍵字的請求??刂茊卧?jīng)配置響應于請求經(jīng)由通信單元訪問數(shù)據(jù)庫,并向電子裝置傳送與至少一個關(guān)鍵字模型中的所選擇目標關(guān)鍵字相關(guān)聯(lián)的關(guān)鍵字模型。
【附圖說明】
[0014]本公開的發(fā)明方面的實施例將在結(jié)合閱讀附圖時參考下面的【具體實施方式】來理解。
[0015]圖1示出根據(jù)本公開的一個實施例,用于在服務器中提供用于檢測目標關(guān)鍵字的多個關(guān)鍵字模型的系統(tǒng),所述多個關(guān)鍵字模型可由電子裝置經(jīng)由通信網(wǎng)絡下載。
[0016]圖2示出根據(jù)本公開的一個實施例的電子裝置的框圖,所述電子裝置經(jīng)配置訪問多個目標關(guān)鍵字并下載關(guān)鍵字模型用于從輸入聲音流檢測所選擇目標關(guān)鍵字。
[0017]圖3示出根據(jù)本公開的一個實施例的在電子裝置的顯示屏上的目標關(guān)鍵字的列表,該目標關(guān)鍵字的列表可經(jīng)選擇并下載至電子裝置用于檢測所選擇的目標關(guān)鍵字。
[0018]圖4示出根據(jù)本公開的一個實施例的示范性關(guān)鍵字數(shù)據(jù)文件,該關(guān)鍵字數(shù)據(jù)文件包含標頭、關(guān)鍵字模型、Ack聲音數(shù)據(jù)、語調(diào)模型和誤差校驗數(shù)據(jù)。
[0019]圖5示出根據(jù)本公開的一個實施例的電子裝置中的控制單元的更詳細框圖,所述控制單元經(jīng)配置向所選擇功能分配目標關(guān)鍵字并當檢測出目標關(guān)鍵字時執(zhí)行所選擇的功會泛。
[0020]圖6示出根據(jù)本公開的一個實施例的在電子裝置中執(zhí)行的用于從服務器接收用于檢測與關(guān)鍵字模型相關(guān)聯(lián)的目標關(guān)鍵字的所述關(guān)鍵字模型的示范性方法的流程圖。
[0021]圖7示出根據(jù)本公開的一個實施例的在電子裝置中執(zhí)行的用于從服務器接收應用程序文件并從所述應用程序文件提取關(guān)鍵字模型的示范性方法的流程圖。
[0022]圖8示出根據(jù)本公開的一個實施例的在電子裝置中的顯示屏,所述顯示屏示出用于向功能分配目標關(guān)鍵字的菜單。
[0023]圖9示出根據(jù)本公開的一個實施例的將多個目標關(guān)鍵字映射至多個功能的示范性關(guān)鍵字-功能數(shù)據(jù)庫。
[0024]圖10A示出根據(jù)本公開的一個實施例的在電子裝置中執(zhí)行的用于向功能分配目標關(guān)鍵字并更新關(guān)鍵字-功能數(shù)據(jù)庫的示范性方法的流程圖。
[0025]圖10B示出根據(jù)本公開的一個實施例的在電子裝置中執(zhí)行的用于向功能分配目標關(guān)鍵字并更新關(guān)鍵字檢測模型的示范性方法的流程圖。
[0026]圖11示出根據(jù)本公開的一個實施例的包含多個關(guān)鍵字模型的示范性關(guān)鍵字檢測模型。
[0027]圖12示出根據(jù)本公開的一個實施例的電子裝置,所述電子裝置經(jīng)配置響應于在輸入聲音中檢測出相關(guān)聯(lián)的目標關(guān)鍵字來執(zhí)行多個功能。
[0028]圖13示出根據(jù)本公開的一個實施例的電子裝置,所述電子裝置經(jīng)配置基于與目標關(guān)鍵字相關(guān)聯(lián)的語調(diào)模型從文本生成語音數(shù)據(jù)。
[0029]圖14示出根據(jù)本公開的一個實施例的在電子裝置中執(zhí)行的用于執(zhí)行與在輸入聲音中檢測出的目標關(guān)鍵字相關(guān)聯(lián)的功能的示范性方法的流程圖。
[0030]圖15示出根據(jù)本公開的一些實施例的無線通信系統(tǒng)中的移動裝置的框圖,其中,可在所述裝置中實施用于為了操作功能設定目標關(guān)鍵字的方法和設備。
[0031]圖16示出根據(jù)本公開的一些實施例的服務器系統(tǒng)的框圖,其中,可在所述服務器系統(tǒng)中實施用于為了檢測相關(guān)聯(lián)的目標關(guān)鍵字提供關(guān)鍵字模型的方法和設備。
【具體實施方式】
[0032]圖1示出根據(jù)本公開的一個實施例用于在服務器110中提供多個關(guān)鍵字模型的系統(tǒng)100。系統(tǒng)100包含服務器110、電子裝置140和關(guān)鍵字模型提供商130,它們經(jīng)由通信網(wǎng)絡150通信。服務器110包含控制單元112、數(shù)據(jù)庫114、支付管理單元116、數(shù)據(jù)庫更新單元118和通信單元120。
[0033]用于檢測目標關(guān)鍵字的關(guān)鍵字模型可以由電子裝置140經(jīng)由通信網(wǎng)絡150下載。如本文所使用的,術(shù)語“目標關(guān)鍵字”是指可以用作關(guān)鍵字以激活或執(zhí)行電子裝置140中的功能的一或多個詞語或聲音的任何數(shù)字或模擬表示?!瓣P(guān)鍵字模型”是指可以由電子裝置140用于檢測目標關(guān)鍵字的數(shù)據(jù)。在具體實施例中,關(guān)鍵字模型不是用戶指定的并且不包含全語言模型。例如,關(guān)鍵字模型可包含對少于目標關(guān)鍵字的語言的所有音位建模的數(shù)據(jù)。在該實例中,關(guān)鍵字模型包含檢測目標關(guān)鍵字的語言的音位的子集的數(shù)據(jù)。因此,關(guān)鍵字模型可明顯小于全語言模型。為了說明,關(guān)鍵字模型可使用存儲器的1和500千比特位(KB)之間,而存儲全語言模型可使用1或多個兆比特位(MB)。
[0034]在服務器110中,控制單元112控制服務器110的整體操作。服務器110中的數(shù)據(jù)庫114存儲由關(guān)鍵字模型提供商130上傳的多個關(guān)鍵字數(shù)據(jù)文件。關(guān)鍵字數(shù)據(jù)文件中的每個可包含用于檢測目標關(guān)鍵字的關(guān)鍵字模型、用于輸出表示檢測到目標關(guān)鍵字的確認聲音或響應聲音的Ack聲音數(shù)據(jù)(或響應聲音數(shù)據(jù))、適于更改從文本生成的語音的語調(diào)的語調(diào)模型,或它們的組合。由關(guān)鍵字模型提供商130上傳的關(guān)鍵字模型可基于大量的關(guān)鍵字錄音的訓練來生成,以便關(guān)鍵字模型可以經(jīng)優(yōu)化用于檢測相關(guān)聯(lián)的目標關(guān)鍵字。因此,電子裝置140的用戶可通過下載關(guān)鍵字模型使用基于大量關(guān)鍵字錄音的關(guān)鍵字模型。因此,通過用大量的關(guān)鍵字錄音訓練關(guān)鍵字模型而無需用戶記錄關(guān)鍵字錄音以訓練關(guān)鍵字模型,用戶獲得提高的準確度的好處。在具體實施例中,電子裝置140可包含關(guān)鍵字檢測引擎,其經(jīng)配置連續(xù)監(jiān)測用戶輸入的輸入聲音。在該實施例中,用戶希望電子裝置140具有高的檢測率(例如,在90%以上)和低誤檢率(例如,低于0.01% )。具有低誤檢率能改善用戶體驗并可降低功耗。例如,錯誤檢測可導致電子裝置140激活用戶不期望活躍的功能,這可以是煩心事并可以增加電子裝置140的功耗。實現(xiàn)此些高檢測率和低誤檢率可能需要關(guān)鍵字模型的大量訓練。例如,在一些情況下,實現(xiàn)小于0.01%誤檢率的90%檢測率的關(guān)