用識別算法等。
[0053]如圖4所示,關(guān)鍵字模型420包含目標(biāo)關(guān)鍵字422、關(guān)鍵字模型參數(shù)424和閾值426。目標(biāo)關(guān)鍵字422可以是文本字符串或一或多個字組。關(guān)鍵字模型參數(shù)424表示目標(biāo)關(guān)鍵字422的聲音特性并且可基于大量關(guān)鍵字錄音的訓(xùn)練來生成,以便關(guān)鍵字模型420可以經(jīng)優(yōu)化用于檢測目標(biāo)關(guān)鍵字422。例如,來自許多人的關(guān)鍵字錄音可用于訓(xùn)練。在具體實施例中,關(guān)鍵字模型420是非指定用戶的并且包含對少于目標(biāo)關(guān)鍵字422的語言的所有音位建模的信息(例如,關(guān)鍵字模型參數(shù)424)。
[0054]在一些實施例中,關(guān)鍵字模型參數(shù)424包含與目標(biāo)關(guān)鍵字的多個部分相關(guān)聯(lián)的多個狀態(tài)的狀態(tài)信息。在一個實施例中,目標(biāo)關(guān)鍵字422可劃分為聲音的多個基本單位,諸如音素、音位或它們的子單位,并且表示目標(biāo)關(guān)鍵字422的多個部分可基于聲音的基本單位生成。隨后在馬爾可夫連鎖模型下(諸如隱馬爾可夫模型(HMM)或半馬爾可夫模型(SMM)),目標(biāo)關(guān)鍵字的每個部分與狀態(tài)、遞歸神經(jīng)網(wǎng)絡(luò)的節(jié)點或它們的組合相關(guān)聯(lián)。狀態(tài)信息可包含從狀態(tài)中的每個至下一狀態(tài)(包含所述狀態(tài)自身)的變換信息。關(guān)鍵字模型參數(shù)424也包含用于確定輸入聲音的觀察得分的概率模型。例如,概率模型可以是任何合適的模型,諸如GMM、神經(jīng)網(wǎng)絡(luò)和SVM。閾值426是用于確保輸入聲音包含目標(biāo)關(guān)鍵字的最小置信度值。閾值426可確定為合適的值,使得不會從不包含目標(biāo)關(guān)鍵字的輸入聲音錯誤檢測出所述目標(biāo)關(guān)鍵字。
[0055]Ack聲音數(shù)據(jù)430可用于輸出表示檢測到目標(biāo)關(guān)鍵字的確認(rèn)聲音。如果Ack聲音數(shù)據(jù)430是音頻數(shù)據(jù),則電子裝置140可轉(zhuǎn)換所述音頻數(shù)據(jù)以生成確認(rèn)聲音并輸出所述確認(rèn)聲音。另一方面,如果Ack聲音數(shù)據(jù)430是文本字符串或一或多個字組而不是音頻數(shù)據(jù),則電子裝置140可基于與目標(biāo)關(guān)鍵字422相關(guān)聯(lián)的語調(diào)模型440,通過將文本字符串或字組轉(zhuǎn)換為語音來生成確認(rèn)聲音并輸出所述確認(rèn)聲音。
[0056]語調(diào)模型440適于更改從文本生成的語音的語調(diào)。誤差校驗數(shù)據(jù)450可用于檢查關(guān)鍵字?jǐn)?shù)據(jù)文件400的數(shù)據(jù)完整性和/或檢測偶然的變化。例如,誤差校驗數(shù)據(jù)450可以是循環(huán)冗余校驗(CRC)碼。
[0057]圖5示出根據(jù)本公開的一個實施例的電子裝置140中的控制單元250的更詳細(xì)框圖,所述控制單元經(jīng)配置向所選擇功能分配目標(biāo)關(guān)鍵字并當(dāng)檢測出所述目標(biāo)關(guān)鍵字時執(zhí)行所選擇的功能??刂茊卧?50包含下載管理單元510、驗證單元520、提取單元530、關(guān)鍵字設(shè)定單元540和功能管理單元550。下載管理單元510可經(jīng)配置下載任何類型的文件,諸如文本文件、音頻文件、視頻文件、關(guān)鍵字?jǐn)?shù)據(jù)文件、應(yīng)用程序文件等。
[0058]當(dāng)下載管理單元510下載包含用于檢測目標(biāo)關(guān)鍵字的關(guān)鍵字模型的關(guān)鍵字?jǐn)?shù)據(jù)文件時,驗證單元520接收所述關(guān)鍵字?jǐn)?shù)據(jù)文件,并基于所下載的關(guān)鍵字?jǐn)?shù)據(jù)文件的標(biāo)頭中的兼容性信息或版本信息來驗證所述關(guān)鍵字模型是否可以用在關(guān)鍵字檢測單元290中。驗證單元520也可通過解碼所下載的關(guān)鍵字?jǐn)?shù)據(jù)文件的誤差校驗數(shù)據(jù)來檢查所下載的關(guān)鍵字?jǐn)?shù)據(jù)文件的數(shù)據(jù)完整性。如果驗證單元520證實所下載的關(guān)鍵字模型與關(guān)鍵字檢測單元290兼容,則提取單元530從所下載的關(guān)鍵字?jǐn)?shù)據(jù)文件提取關(guān)鍵字模型并在存儲單元240中存儲所提取的關(guān)鍵字模型。在具體實施例中,如果驗證單元520確定關(guān)鍵字?jǐn)?shù)據(jù)文件不與關(guān)鍵字檢測單元290兼容,則控制單元250可嘗試將所述關(guān)鍵字模型轉(zhuǎn)換為與關(guān)鍵字檢測單元290兼容的版本。在另一具體實施例中,如果驗證單元520確定關(guān)鍵字?jǐn)?shù)據(jù)文件不與關(guān)鍵字檢測單元290兼容,則下載管理單元510可嘗試下載關(guān)鍵字模型的另一版本。例如,下載管理單元510可向圖1的服務(wù)器110發(fā)送關(guān)鍵字模型的第二版本的請求,其中所述關(guān)鍵字模型的第二版本與關(guān)鍵字檢測單元290兼容。在另一實例中,下載管理單元510可促使圖2的通信單元210向服務(wù)器110發(fā)送涉及電子裝置140的信息。涉及電子裝置140的信息可包含例如裝置類型標(biāo)識符、模型名稱標(biāo)識符、模型類型標(biāo)識符、關(guān)鍵字檢測單元版本標(biāo)識符、其它信息或它們的組合。服務(wù)器110可使用涉及電子裝置140的信息以選擇與關(guān)鍵字檢測單元290兼容的關(guān)鍵字模型并傳送所述關(guān)鍵字模型。提取單元530從第二次下載的關(guān)鍵字?jǐn)?shù)據(jù)文件提取關(guān)鍵字模型的第二版本并在存儲單元240中存儲所提取的關(guān)鍵字模型的第二版本。當(dāng)關(guān)鍵字?jǐn)?shù)據(jù)文件也包含Ack聲音數(shù)據(jù)和語調(diào)模型時,提取單元530從所下載的關(guān)鍵字?jǐn)?shù)據(jù)文件提取Ack聲音數(shù)據(jù)和語調(diào)模型并將它們存儲在存儲單元240中。
[0059]電子裝置140可在存儲單元240中存儲將多個目標(biāo)關(guān)鍵字映射至多個功能的關(guān)鍵字-功能數(shù)據(jù)庫。關(guān)鍵字-功能數(shù)據(jù)庫可由制造商或運營商設(shè)置在電子裝置140中或響應(yīng)于用戶輸入而創(chuàng)建。關(guān)鍵字設(shè)定單元540經(jīng)配置創(chuàng)建新的關(guān)鍵字-功能數(shù)據(jù)庫或更新現(xiàn)有的關(guān)鍵字-功能數(shù)據(jù)庫。
[0060]關(guān)鍵字設(shè)定單元540允許用戶在電子裝置140中選擇目標(biāo)關(guān)鍵字和功能用于在輸入聲首中檢測出所選擇目標(biāo)關(guān)鍵字時執(zhí)彳丁所選擇功能。在選擇目標(biāo)關(guān)鍵字和功能時,關(guān)鍵字設(shè)定單元540向所選擇功能分配所選擇的目標(biāo)關(guān)鍵字。如果未發(fā)現(xiàn)現(xiàn)有的關(guān)鍵字-功能數(shù)據(jù)庫,則關(guān)鍵字設(shè)定單元540生成將所選擇目標(biāo)關(guān)鍵字映射至所選擇功能的新關(guān)鍵字-功能數(shù)據(jù)庫。另一方面,如果關(guān)鍵字-功能數(shù)據(jù)庫已經(jīng)存在,則現(xiàn)有數(shù)據(jù)庫用所選擇目標(biāo)關(guān)鍵字和功能的映射更新。關(guān)鍵字設(shè)定單兀540可響應(yīng)于目標(biāo)關(guān)鍵字和功能的添加選擇或刪除在數(shù)據(jù)庫中的現(xiàn)有條目來更新關(guān)鍵字-功能數(shù)據(jù)庫。
[0061]電子裝置140也可在存儲單元240或關(guān)鍵字檢測單元290中存儲關(guān)鍵字檢測模型,其包含用于檢測與多個關(guān)鍵字模型相關(guān)聯(lián)的目標(biāo)關(guān)鍵字的多個關(guān)鍵字模型。在向所述功能分配所選擇目標(biāo)關(guān)鍵字時,關(guān)鍵字設(shè)定單元540可從存儲單元240檢索用于所選擇目標(biāo)關(guān)鍵字的關(guān)鍵字模型。如果未發(fā)現(xiàn)現(xiàn)有的關(guān)鍵字檢測模型,則關(guān)鍵字設(shè)定單元540可向存儲單元240或關(guān)鍵字檢測單元290發(fā)送檢索到的關(guān)鍵字模型作為關(guān)鍵字檢測模型。另一方面,如果關(guān)鍵字檢測模型已經(jīng)存在,則現(xiàn)有模型通過添加檢索到的關(guān)鍵字模型來更新。例如,當(dāng)存在用于第一目標(biāo)關(guān)鍵字的關(guān)鍵字檢測模型時,用戶可下載用于第二目標(biāo)關(guān)鍵字的關(guān)鍵字?jǐn)?shù)據(jù)文件。在該實例中,在關(guān)鍵字?jǐn)?shù)據(jù)文件由驗證單元520證實后,提取單元530從關(guān)鍵字?jǐn)?shù)據(jù)文件提取用于第二目標(biāo)關(guān)鍵字的關(guān)鍵字模型。關(guān)鍵字設(shè)定單元540合并或組合(例如,連接)所提取的用于第二目標(biāo)關(guān)鍵字的關(guān)鍵字模型和現(xiàn)有關(guān)鍵字檢測模型以形成更新的關(guān)鍵字檢測模型(例如,用于第一目標(biāo)關(guān)鍵字和第二目標(biāo)關(guān)鍵字的組合關(guān)鍵字檢測模型)。關(guān)鍵字設(shè)定單元540向存儲單元240或關(guān)鍵字檢測單元290提供用于檢測輸入聲音流中的目標(biāo)關(guān)鍵字的更新關(guān)鍵字檢測模型。關(guān)鍵字設(shè)定單元540也可響應(yīng)于目標(biāo)關(guān)鍵字和功能的添加選擇或刪除在關(guān)鍵字-功能數(shù)據(jù)庫中的現(xiàn)有條目來更新關(guān)鍵字檢測模型。
[0062]當(dāng)關(guān)鍵字檢測單元290基于關(guān)鍵字檢測模型檢測出目標(biāo)關(guān)鍵字時,關(guān)鍵字檢測單元290生成表示已檢測出目標(biāo)關(guān)鍵字的檢測信號。響應(yīng)于所述檢測信號,功能管理單元550訪問關(guān)鍵字-功能數(shù)據(jù)庫以識別與檢測到的目標(biāo)關(guān)鍵字相關(guān)聯(lián)的功能。接著功能管理單元550執(zhí)行所識別的功能。
[0063]另外,功能管理單元550可從存儲單元240檢索與檢測出的目標(biāo)關(guān)鍵字相關(guān)聯(lián)的Ack聲音數(shù)據(jù)和語調(diào)模型。在這種情況下,功能管理單元550可基于檢索到的Ack聲音數(shù)據(jù)生成確認(rèn)聲音并輸出所述確認(rèn)聲音以指示檢測到目標(biāo)關(guān)鍵字。功能管理單元550也可向TTS轉(zhuǎn)換單元220傳送用于更改由TTS轉(zhuǎn)換單元220生成的語音的語調(diào)的語調(diào)模型。
[0064]圖6示出根據(jù)本公開的一個實施例的在電子裝置140中執(zhí)行的用于從服務(wù)器110接收用于檢測與關(guān)鍵字模型相關(guān)聯(lián)的目標(biāo)關(guān)鍵字的所述關(guān)鍵字模型的示范性方法600的流程圖。在初始時,在610,電子裝置140訪問服務(wù)器110中的多個目標(biāo)關(guān)鍵字并且用戶在電子裝置140上從所述多個目標(biāo)關(guān)鍵字選擇目標(biāo)關(guān)鍵字。響應(yīng)于用戶的選擇,電子裝置140在620從服務(wù)器110接收用于所選擇目標(biāo)關(guān)鍵字的關(guān)鍵字?jǐn)?shù)據(jù)文件。關(guān)鍵字?jǐn)?shù)據(jù)文件包含用于檢測所選擇目標(biāo)關(guān)鍵字的關(guān)鍵字模型。關(guān)鍵字?jǐn)?shù)據(jù)文件也可包含Ack聲音數(shù)據(jù)和語調(diào)模型。
[0065]在630,電子裝置140驗證所收到的用于關(guān)鍵字檢測的關(guān)鍵字?jǐn)?shù)據(jù)文件。在一個實施例中,電子裝置140基于關(guān)鍵字?jǐn)?shù)據(jù)文件的標(biāo)頭中的兼容性信息或版本信息,驗證所收到的關(guān)鍵字?jǐn)?shù)據(jù)文件中的關(guān)鍵字模型是否可以用在關(guān)鍵字檢測單元290中。如果電子裝置140在640證實關(guān)鍵字模型兼容于關(guān)鍵字檢測單元290,則電子裝置140從所收到的關(guān)鍵字?jǐn)?shù)據(jù)文件提取關(guān)鍵字模型。如果電子裝置140確定關(guān)鍵字模型不兼容于關(guān)鍵字檢測單元290,則控制單元250可嘗試將關(guān)鍵字模型轉(zhuǎn)換為兼容版本,或電子裝置140可自動下載與關(guān)鍵字檢測單元290兼容的關(guān)鍵字模型的不同版本。當(dāng)關(guān)鍵字?jǐn)?shù)據(jù)文件也包含Ack聲音數(shù)據(jù)和語調(diào)模型時,電子裝置140也從所收到的關(guān)鍵字?jǐn)?shù)據(jù)文件提取Ack聲音數(shù)據(jù)和語調(diào)模型。
[0066]接著在650,電子裝置140在存儲單元240中存儲所提取的關(guān)鍵字模型。如果Ack聲音數(shù)據(jù)和語調(diào)模型也從所收到的關(guān)鍵字?jǐn)?shù)據(jù)文件提取,則電子裝置140在存儲單元240中存儲所提取的Ack聲音數(shù)據(jù)和語調(diào)模型。如果涉及另一目標(biāo)關(guān)鍵字的關(guān)鍵字檢測模型已經(jīng)由關(guān)鍵字檢測單元290使用,則電子裝置140可合并或組合(例如,連接)所提取的關(guān)鍵字模型和由關(guān)鍵字檢測單元290使用的所述關(guān)鍵字檢測模型,以形成更新的關(guān)鍵字檢測模型(例如,用于所選擇目標(biāo)關(guān)鍵字和其它目標(biāo)關(guān)鍵字的組合關(guān)鍵字檢測模型)。關(guān)鍵字設(shè)定單元540向存儲單元240或關(guān)鍵字檢測單元290提供用于檢測輸入聲音流中的一或多個目標(biāo)關(guān)鍵字的更新關(guān)鍵字檢測模型。在660,方法600確定另一目標(biāo)關(guān)鍵字是否要被選擇。例如,電子裝置140可等待接收來自用戶的輸入,其表示用戶是否選擇另一目標(biāo)關(guān)鍵字。如果確定要選擇另一目標(biāo)關(guān)鍵字,則方法600返回至610以選擇下一個目標(biāo)關(guān)鍵字。否則,方法600終止。
[0067]圖7示出根據(jù)本公開的一個實施例的在電子裝置140中執(zhí)行的用于從服務(wù)器110接收應(yīng)用程序文件并從該應(yīng)用程序文件提取關(guān)鍵字模型的示范性方法700的流程圖。在初始時,電子裝置140在710訪問服務(wù)器110中的多個應(yīng)用程序,以及用戶在電子裝置140上從多個應(yīng)用程序選擇應(yīng)用程序供下載和安裝。響應(yīng)于用戶選擇,電子裝置140在720接收用于安裝所選擇應(yīng)用程序的應(yīng)用程序文件。應(yīng)用程序文件可包含可用于檢測目標(biāo)關(guān)鍵字并在檢測到所述目標(biāo)關(guān)鍵字時激活應(yīng)用程