本申請(qǐng)涉及網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音的功能控制方法和裝置。
背景技術(shù):
語(yǔ)音助手是運(yùn)行在終端上的一種軟件,能夠和用戶(hù)進(jìn)行語(yǔ)音交流,以及協(xié)助用戶(hù)實(shí)現(xiàn)其指定的各項(xiàng)功能,如進(jìn)行信息搜索、終端操作等。自從蘋(píng)果推出其語(yǔ)音助手siri以后,用戶(hù)對(duì)語(yǔ)音助手類(lèi)的軟件的關(guān)注程度和使用率有了極大的提高,也給語(yǔ)音助手的發(fā)展帶來(lái)了動(dòng)力。
目前語(yǔ)音助手能夠與安裝在終端上的應(yīng)用程序相結(jié)合,用戶(hù)向語(yǔ)音助手發(fā)出執(zhí)行某項(xiàng)任務(wù)的指令,由語(yǔ)音助手調(diào)用相應(yīng)的應(yīng)用程序來(lái)完成該項(xiàng)任務(wù),從而極大的豐富了用戶(hù)能夠以語(yǔ)音助手為單一入口來(lái)完成的功能。
現(xiàn)有技術(shù)中,以siri為例,siri可以與六類(lèi)應(yīng)用程序(打車(chē)、通訊、照片搜索、支付、網(wǎng)絡(luò)電話(huà)、健身)協(xié)作,當(dāng)siri接收到用戶(hù)的語(yǔ)音輸入時(shí),判斷用戶(hù)的意圖,并決定是由自己處理還是調(diào)用應(yīng)用程序處理。如果決定調(diào)用應(yīng)用程序,siri從自己對(duì)用戶(hù)語(yǔ)音的識(shí)別結(jié)果中提取相關(guān)信息交給應(yīng)用程序。應(yīng)用程序按照siri提供的信息,執(zhí)行該信息指定的功能。
可見(jiàn),siri提供的信息是用戶(hù)指定的任務(wù)是否能被正確完成的基礎(chǔ)。當(dāng)siri識(shí)別出的輸入語(yǔ)音不夠準(zhǔn)確時(shí),用戶(hù)通過(guò)語(yǔ)音進(jìn)行的功能控制就難以達(dá)到令人滿(mǎn)意的水平。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本申請(qǐng)?zhí)峁┮环N語(yǔ)音的功能控制方法,應(yīng)用在終端的語(yǔ)音助手上,包括:
根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定關(guān)聯(lián)應(yīng)用程序;所述關(guān)聯(lián)應(yīng)用程序用來(lái)實(shí)現(xiàn)用戶(hù)要使用的功能;
將用戶(hù)的輸入語(yǔ)音傳遞給所述關(guān)聯(lián)應(yīng)用程序,供所述關(guān)聯(lián)應(yīng)用程序?qū)τ脩?hù)的輸入語(yǔ)音進(jìn)行識(shí)別,并根據(jù)識(shí)別結(jié)果進(jìn)行所述功能的實(shí)現(xiàn)。
本申請(qǐng)?zhí)峁┑囊环N語(yǔ)音的功能控制方法,應(yīng)用在用來(lái)實(shí)現(xiàn)除語(yǔ)音助手外其他功能的終端應(yīng)用程序上,包括:
接收來(lái)自語(yǔ)音助手的用戶(hù)的輸入語(yǔ)音;
識(shí)別用戶(hù)的輸入語(yǔ)音,根據(jù)識(shí)別結(jié)果進(jìn)行用戶(hù)要使用功能的實(shí)現(xiàn)。
本申請(qǐng)還提供了一種語(yǔ)音的功能控制裝置,應(yīng)用在終端的語(yǔ)音助手上,包括:
關(guān)聯(lián)應(yīng)用程序單元,用于根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定關(guān)聯(lián)應(yīng)用程序;所述關(guān)聯(lián)應(yīng)用程序用來(lái)實(shí)現(xiàn)用戶(hù)要使用的功能;
輸入語(yǔ)音傳遞單元,用于將用戶(hù)的輸入語(yǔ)音傳遞給所述關(guān)聯(lián)應(yīng)用程序,供所述關(guān)聯(lián)應(yīng)用程序?qū)τ脩?hù)的輸入語(yǔ)音進(jìn)行識(shí)別,并根據(jù)識(shí)別結(jié)果進(jìn)行所述功能的實(shí)現(xiàn)。
本申請(qǐng)?zhí)峁┑囊环N語(yǔ)音的功能控制裝置,應(yīng)用在用來(lái)實(shí)現(xiàn)除語(yǔ)音助手外其他功能的終端應(yīng)用程序上,包括:
輸入語(yǔ)音接收單元,用于接收來(lái)自語(yǔ)音助手的用戶(hù)的輸入語(yǔ)音;
功能實(shí)現(xiàn)單元,用于識(shí)別用戶(hù)的輸入語(yǔ)音,根據(jù)識(shí)別結(jié)果進(jìn)行用戶(hù)要使用功能的實(shí)現(xiàn)。
由以上技術(shù)方案可見(jiàn),本申請(qǐng)的實(shí)施例中,在語(yǔ)音助手根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果確定關(guān)聯(lián)應(yīng)用程序后,將用戶(hù)的輸入語(yǔ)音傳遞給關(guān)聯(lián)應(yīng)用程序,由關(guān)聯(lián)應(yīng)用程序自行識(shí)別輸入語(yǔ)音后執(zhí)行用戶(hù)的指令;由于關(guān)聯(lián)應(yīng)用程序都有其專(zhuān)屬的應(yīng)用領(lǐng)域,比如高德地圖是地圖及導(dǎo)航領(lǐng)域,因此在其所屬的功能類(lèi)型的語(yǔ)音識(shí)別準(zhǔn)確度在絕大多數(shù)情況下高于通用于所有功能類(lèi)型的語(yǔ)音助手的準(zhǔn)確度,從而能夠更為準(zhǔn)確和快速的完成用戶(hù)需要的功能,提高語(yǔ)音功能控制的效率。
附圖說(shuō)明
圖1是本申請(qǐng)實(shí)施例中一種應(yīng)用在終端的語(yǔ)音助手上、語(yǔ)音的功能控制方法的流程圖;
圖2是本申請(qǐng)實(shí)施例中一種應(yīng)用在終端的應(yīng)用程序上、語(yǔ)音的功能控制方法的流程圖;
圖3是本申請(qǐng)應(yīng)用示例的工作原理示意圖;
圖4是終端的一種硬件結(jié)構(gòu)圖;
圖5是本申請(qǐng)實(shí)施例中一種應(yīng)用在終端的語(yǔ)音助手上、語(yǔ)音的功能控制裝置的邏輯結(jié)構(gòu)圖;
圖6是本申請(qǐng)實(shí)施例中一種應(yīng)用在終端的應(yīng)用程序上、語(yǔ)音的功能控制裝置的邏輯結(jié)構(gòu)圖。
具體實(shí)施方式
現(xiàn)有技術(shù)中,終端上安裝的很多非語(yǔ)音助手類(lèi)的應(yīng)用程序本身也具有接收用戶(hù)語(yǔ)音輸入,識(shí)別出并執(zhí)行用戶(hù)的語(yǔ)音指令,實(shí)現(xiàn)用戶(hù)要使用功能的能力。簡(jiǎn)便起見(jiàn),以下將語(yǔ)音助手類(lèi)的應(yīng)用程序稱(chēng)為語(yǔ)音助手,將非語(yǔ)音助手類(lèi)、用來(lái)實(shí)現(xiàn)除語(yǔ)音助手外的其他功能的應(yīng)用程序稱(chēng)為應(yīng)用程序。
語(yǔ)音助手的設(shè)計(jì)初衷是作為與用戶(hù)進(jìn)行語(yǔ)音交互的統(tǒng)一入口,除了識(shí)別用戶(hù)可能涉及所有功能類(lèi)型的指令,還要陪用戶(hù)聊天,因此語(yǔ)音助手詞庫(kù)的詞匯范圍極其廣泛,并且其語(yǔ)音識(shí)別算法的優(yōu)化也必須兼顧所有類(lèi)型詞匯的識(shí)別率。而應(yīng)用程序往往專(zhuān)注于幾項(xiàng)主要功能的實(shí)現(xiàn),如地圖類(lèi)型應(yīng)用程序?qū)W⒂趯ぶ?、定位和?dǎo)航,購(gòu)物類(lèi)型的應(yīng)用程序?qū)W⒂谏唐泛徒灰椎鹊龋脩?hù)在采用這些應(yīng)用程序時(shí),意圖基本確定是要使用應(yīng)用程序?qū)W⒌墓δ?。因此?yīng)用程序中用于語(yǔ)音識(shí)別的詞庫(kù)的詞匯范圍同樣集中在其專(zhuān)注的功能領(lǐng)域,語(yǔ)音識(shí)別算法的優(yōu)化也是如此。
從發(fā)出語(yǔ)音指令后到等待終端給出響應(yīng)的等待時(shí)長(zhǎng)會(huì)極大的影響用戶(hù)體驗(yàn),因而可供進(jìn)行語(yǔ)音識(shí)別的時(shí)間非常有限。在有限的時(shí)間內(nèi),在任何一個(gè)特定的功能領(lǐng)域,語(yǔ)音助手對(duì)用戶(hù)意圖使用該領(lǐng)域某個(gè)功能的輸入語(yǔ)音的識(shí)別,在準(zhǔn)確度上很難趕上屬于該功能領(lǐng)域的應(yīng)用程序進(jìn)行的識(shí)別。
比如在地點(diǎn)名稱(chēng)上,高德地圖的詞庫(kù)比siri的詞庫(kù)更為全面準(zhǔn)確;同時(shí),由于有長(zhǎng)期的關(guān)于地點(diǎn)方面的搜索的積累,高德地圖的識(shí)別算法在識(shí)別地名上也比siri更為精準(zhǔn),siri在導(dǎo)航這個(gè)應(yīng)用場(chǎng)景中沒(méi)有更為可靠的地名、位置等數(shù)據(jù)作為參考,來(lái)優(yōu)化其識(shí)別算法。
可見(jiàn),現(xiàn)有技術(shù)中由語(yǔ)音助手將識(shí)別結(jié)果傳遞給應(yīng)用程序的做法,實(shí)際上是由不擅長(zhǎng)某個(gè)工作的一方來(lái)完成工作,將不準(zhǔn)確的工作結(jié)果交給擅長(zhǎng)該工作的另一方,另一方不得不以較差的工作結(jié)果為基礎(chǔ)來(lái)執(zhí)行任務(wù),自然難以達(dá)到好的結(jié)果。
基于上述思路,本申請(qǐng)的實(shí)施例提出一種新的語(yǔ)音功能控制方法,由語(yǔ)音助手通過(guò)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別,確定實(shí)現(xiàn)用戶(hù)意圖的關(guān)聯(lián)應(yīng)用程序,再將輸入語(yǔ)音傳遞給關(guān)聯(lián)應(yīng)用程序,由關(guān)聯(lián)應(yīng)用程序自行識(shí)別語(yǔ)音后實(shí)現(xiàn)用戶(hù)要使用的功能,使得應(yīng)用程序基于原始的輸入語(yǔ)音執(zhí)行用戶(hù)指令,可以以自行識(shí)別的結(jié)果而不必以語(yǔ)音助手不理想的識(shí)別結(jié)果為基礎(chǔ)來(lái)執(zhí)行,從而能夠更為準(zhǔn)確和快速的完成用戶(hù)需要的功能,以解決現(xiàn)有技術(shù)中存在的問(wèn)題。
本申請(qǐng)的實(shí)施例中,語(yǔ)音助手和應(yīng)用程序都運(yùn)行在用戶(hù)的終端上。語(yǔ)音助手可以運(yùn)行在終端的操作系統(tǒng)層面,也可以是作為操作系統(tǒng)上層的應(yīng)用來(lái)運(yùn)行,不做限定。用戶(hù)的終端可以是任何具有語(yǔ)音輸入、計(jì)算和存儲(chǔ)功能的設(shè)備,如手機(jī)、平板電腦、pc(personalcomputer,個(gè)人電腦)、筆記本、服務(wù)器等,同樣不做限定。
本申請(qǐng)實(shí)施例中,語(yǔ)音的功能控制方法應(yīng)用在語(yǔ)音助手中的流程如圖1所示,應(yīng)用在應(yīng)用程序中的流程如圖2所示。
在語(yǔ)音助手上,步驟110,根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定關(guān)聯(lián)應(yīng)用程序。關(guān)聯(lián)應(yīng)用程序用來(lái)實(shí)現(xiàn)用戶(hù)要使用的功能。
當(dāng)語(yǔ)音助手接收到用戶(hù)的語(yǔ)音輸入后,識(shí)別用戶(hù)的語(yǔ)音,如果用戶(hù)的指令不涉及對(duì)哪個(gè)功能的使用、或者用戶(hù)要使用的功能由語(yǔ)音助手來(lái)執(zhí)行,則語(yǔ)音助手依據(jù)識(shí)別結(jié)果回復(fù)用戶(hù)的輸入,或者執(zhí)行用戶(hù)的指令。如果語(yǔ)音助手的識(shí)別結(jié)果是用戶(hù)要使用某種由應(yīng)用程序來(lái)執(zhí)行的功能,則語(yǔ)音助手確定實(shí)現(xiàn)該功能的關(guān)聯(lián)應(yīng)用程序。
用戶(hù)可能在輸入語(yǔ)音中指定想使用的應(yīng)用程序。在這種情形下,語(yǔ)音助手可以從對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果中提取出應(yīng)用程序名稱(chēng),將該應(yīng)用程序(即用戶(hù)在輸入語(yǔ)音中指定的應(yīng)用程序)作為關(guān)聯(lián)應(yīng)用程序。例如,用戶(hù)對(duì)語(yǔ)音助手說(shuō),“用滴滴幫我叫車(chē)回家”,語(yǔ)音助手識(shí)別出應(yīng)用程序名稱(chēng)“滴滴”,則將應(yīng)用程序滴滴作為關(guān)聯(lián)應(yīng)用程序。
如果用戶(hù)沒(méi)有在輸入語(yǔ)音中指定想使用的應(yīng)用程序,語(yǔ)音助手可以根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定用戶(hù)要使用的功能,再按照用戶(hù)要使用的功能在終端上安裝的應(yīng)用程序中確定關(guān)聯(lián)應(yīng)用程序。語(yǔ)音助手從識(shí)別結(jié)果中確定用戶(hù)要使用的功能的方法可以參照各種現(xiàn)有技術(shù)實(shí)現(xiàn),例如,可以預(yù)置各個(gè)功能的若干個(gè)關(guān)鍵詞,如果對(duì)用戶(hù)語(yǔ)音的識(shí)別結(jié)果命中了某個(gè)功能關(guān)鍵詞,則可獲知用戶(hù)想要使用的功能是哪一個(gè)。
由用戶(hù)要使用的功能確定關(guān)聯(lián)應(yīng)用程序的方式可以根據(jù)實(shí)際應(yīng)用場(chǎng)景的需要來(lái)決定,以下以?xún)蓚€(gè)實(shí)現(xiàn)方式為例進(jìn)行說(shuō)明。
在第一個(gè)實(shí)現(xiàn)方式中,語(yǔ)音助手在識(shí)別出用戶(hù)要使用的功能后,可以將終端上安裝的應(yīng)用程序中,能夠?qū)崿F(xiàn)用戶(hù)要使用的功能、并且支持語(yǔ)音輸入的一個(gè)到多個(gè)應(yīng)用程序作為備選應(yīng)用程序,將備選應(yīng)用程序的名稱(chēng)顯示給用戶(hù),供用戶(hù)選擇。在收到用戶(hù)的選擇結(jié)果后,語(yǔ)音助手將用戶(hù)選定的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
在第二個(gè)實(shí)現(xiàn)方式中,可以在終端上維護(hù)要使用的功能與應(yīng)用程序的映射關(guān)系。在識(shí)別出用戶(hù)要使用的功能后,語(yǔ)音助手可以將與用戶(hù)要使用的功能具有映射關(guān)系的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。在前述以功能關(guān)鍵詞來(lái)反映用戶(hù)要使用的功能的例子中,可以在終端上保存一張功能關(guān)鍵詞與應(yīng)用程序的映射關(guān)系表,語(yǔ)音助手從對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果中提取出功能關(guān)鍵詞后,即可將與該功能關(guān)鍵詞具有映射關(guān)系的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
在第二個(gè)實(shí)現(xiàn)方式中,要使用的功能與應(yīng)用程序的映射關(guān)系可以由用戶(hù)設(shè)置和/或修改,也可以由語(yǔ)音助手或操作系統(tǒng)生成,還可以同時(shí)應(yīng)用這些方式,本申請(qǐng)的實(shí)施例不做限定。一個(gè)例子中,用戶(hù)可以在語(yǔ)音助手或操作系統(tǒng)提供的設(shè)置項(xiàng)中設(shè)置語(yǔ)音輸入時(shí),要使用的功能和關(guān)聯(lián)應(yīng)用程序的映射關(guān)系(一個(gè)到多個(gè)功能對(duì)應(yīng)于一個(gè)應(yīng)用程序)。另一個(gè)例子中,可以把要實(shí)現(xiàn)某個(gè)功能時(shí),用戶(hù)最頻繁采用的應(yīng)用程序作為與該功能有映射關(guān)系的應(yīng)用程序;具體而言,如果安裝在終端上的實(shí)現(xiàn)某功能的應(yīng)用程序只有一個(gè),則將該應(yīng)用程序作為與該功能有映射關(guān)系的應(yīng)用程序;如果超過(guò)一個(gè),則可以按照操作系統(tǒng)統(tǒng)計(jì)的用戶(hù)使用每個(gè)實(shí)現(xiàn)該功能的應(yīng)用程序的頻率,將頻率最高的一個(gè)作為與該功能有映射關(guān)系的應(yīng)用程序。第三個(gè)例子中,用戶(hù)還可以在實(shí)現(xiàn)某個(gè)功能的應(yīng)用程序中,將該應(yīng)用程序設(shè)置為語(yǔ)音輸入時(shí)、與該功能有映射關(guān)系的應(yīng)用程序,應(yīng)用程序在收到用戶(hù)的設(shè)置指令后,向語(yǔ)音助手提交本應(yīng)用程序與要使用功能的映射關(guān)系;如用戶(hù)在高德地圖中設(shè)置語(yǔ)音輸入時(shí)、與功能關(guān)鍵詞“導(dǎo)航”具有映射關(guān)系,高德地圖按照用戶(hù)的操作將該設(shè)置項(xiàng)提交給siri,siri將這一映射關(guān)系保存起來(lái),后續(xù)用戶(hù)語(yǔ)音輸入“導(dǎo)航去哪里”時(shí),siri將按照映射關(guān)系,以高德地圖作為關(guān)聯(lián)應(yīng)用程序。
需要說(shuō)明的是,上述兩個(gè)確定關(guān)聯(lián)應(yīng)用程序的方式也可以結(jié)合應(yīng)用。例如,當(dāng)語(yǔ)音助手確定用戶(hù)要使用的功能后,查詢(xún)保存的功能與應(yīng)用程序的映射關(guān)系,如果能查到與要使用的功能有映射關(guān)系的應(yīng)用程序,則按照映射關(guān)系來(lái)確定關(guān)聯(lián)應(yīng)用程序;如果查不到,則將終端上能夠?qū)崿F(xiàn)要使用的功能、并且支持語(yǔ)音輸入的應(yīng)用程序給用戶(hù)選擇,并且按照用戶(hù)選擇確定關(guān)聯(lián)應(yīng)用程序。在用戶(hù)選擇后可以請(qǐng)用戶(hù)設(shè)置該功能的默認(rèn)關(guān)聯(lián)應(yīng)用程序,如果用戶(hù)進(jìn)行設(shè)置,則保存該功能與用戶(hù)設(shè)置的應(yīng)用程序的映射關(guān)系;如果沒(méi)有進(jìn)行設(shè)置,語(yǔ)音助手也可以在用戶(hù)選擇一個(gè)應(yīng)用程序?qū)崿F(xiàn)某個(gè)功能的次數(shù)和頻率都超過(guò)設(shè)定閾值后,保存該應(yīng)用程序與該功能的映射關(guān)系。例如,siri維護(hù)的功能與應(yīng)用程序的映射關(guān)系表中不包括“導(dǎo)航”這一功能的映射關(guān)系,在5次用戶(hù)給出語(yǔ)音指令“導(dǎo)航去哪里”后,siri將終端上安裝的高德地圖、百度地圖和搜狗地圖的應(yīng)用程序名稱(chēng)顯示給用戶(hù),由用戶(hù)選擇要使用哪個(gè)應(yīng)用程序?qū)Ш?;如果用?hù)有4次選擇了高德地圖,則siri將“導(dǎo)航”這一功能與高德地圖的映射關(guān)系保存至該映射關(guān)系表中;之后用戶(hù)給出導(dǎo)航的語(yǔ)音指令時(shí),siri將直接以高德地圖作為關(guān)聯(lián)應(yīng)用程序。
在語(yǔ)音助手上,步驟120,將用戶(hù)的輸入語(yǔ)音傳遞給關(guān)聯(lián)應(yīng)用程序,供關(guān)聯(lián)應(yīng)用程序?qū)τ脩?hù)的輸入語(yǔ)音進(jìn)行識(shí)別,并根據(jù)識(shí)別結(jié)果進(jìn)行該功能的實(shí)現(xiàn)。
在關(guān)聯(lián)應(yīng)用程序上,步驟210,接收來(lái)自語(yǔ)音助手的用戶(hù)的輸入語(yǔ)音。
語(yǔ)音助手在確定執(zhí)行用戶(hù)要使用功能的關(guān)聯(lián)應(yīng)用程序后,打開(kāi)關(guān)聯(lián)應(yīng)用程序(包括啟動(dòng)該關(guān)聯(lián)應(yīng)用程序、將該關(guān)聯(lián)應(yīng)用程序置于前臺(tái)運(yùn)行等),將用戶(hù)的輸入語(yǔ)音傳遞給關(guān)聯(lián)應(yīng)用程序。
在關(guān)聯(lián)應(yīng)用程序上,步驟220,識(shí)別用戶(hù)的輸入語(yǔ)音,根據(jù)識(shí)別結(jié)果進(jìn)行用戶(hù)要使用功能的實(shí)現(xiàn)。
關(guān)聯(lián)應(yīng)用程序自行識(shí)別來(lái)自語(yǔ)音助手的用戶(hù)的輸入語(yǔ)音,按照識(shí)別結(jié)果,運(yùn)行關(guān)聯(lián)應(yīng)用程序的業(yè)務(wù)處理邏輯,來(lái)實(shí)現(xiàn)用戶(hù)要使用的功能。關(guān)聯(lián)應(yīng)用程序可以按照現(xiàn)有技術(shù)來(lái)進(jìn)行語(yǔ)音識(shí)別和功能實(shí)現(xiàn),不再贅述。
在一個(gè)例子中,語(yǔ)音助手可以將自己對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果和用戶(hù)的輸入語(yǔ)音一并傳遞給關(guān)聯(lián)應(yīng)用程序。關(guān)聯(lián)應(yīng)用程序自行識(shí)別用戶(hù)的輸入語(yǔ)音,根據(jù)關(guān)聯(lián)應(yīng)用程序自己的識(shí)別結(jié)果和來(lái)自語(yǔ)音助手的識(shí)別結(jié)果,來(lái)實(shí)現(xiàn)用戶(hù)要使用功能的實(shí)現(xiàn)。語(yǔ)音助手的識(shí)別結(jié)果可以作為供關(guān)聯(lián)應(yīng)用程序在語(yǔ)音識(shí)別時(shí)的參考,進(jìn)一步增加識(shí)別的準(zhǔn)確程度。
可見(jiàn),本申請(qǐng)的實(shí)施例中,語(yǔ)音助手通過(guò)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別,確定實(shí)現(xiàn)用戶(hù)要使用功能的關(guān)聯(lián)應(yīng)用程序,并將輸入語(yǔ)音傳遞給關(guān)聯(lián)應(yīng)用程序,由關(guān)聯(lián)應(yīng)用程序自行識(shí)別輸入語(yǔ)音后執(zhí)行用戶(hù)的指令,從而能夠利用應(yīng)用程序其在所屬功能類(lèi)型更為準(zhǔn)確的語(yǔ)音識(shí)別結(jié)果,更為準(zhǔn)確和快速的完成用戶(hù)需要的功能,提高語(yǔ)音功能控制的效率。
在本申請(qǐng)的一個(gè)應(yīng)用示例中,用戶(hù)的蘋(píng)果終端上安裝有語(yǔ)音助手siri和若干個(gè)能夠完成各種類(lèi)型功能的應(yīng)用程序。siri中保存有功能關(guān)鍵詞和應(yīng)用程序的映射關(guān)系表。一種映射關(guān)系表的示例如表1:
表1
本應(yīng)用示例的工作原理如圖3所示,在收到用戶(hù)的輸入語(yǔ)音后,siri對(duì)輸入語(yǔ)音進(jìn)行識(shí)別,假設(shè)用戶(hù)要使用的功能需要借助于其他應(yīng)用程序來(lái)實(shí)現(xiàn),siri從識(shí)別結(jié)果中提取描述用戶(hù)要使用功能的功能關(guān)鍵詞,用功能關(guān)鍵詞查找映射關(guān)系表。如果找到對(duì)應(yīng)于該功能關(guān)鍵詞的應(yīng)用程序,則以該應(yīng)用程序?yàn)殛P(guān)聯(lián)應(yīng)用程序。如果沒(méi)有在表中找到該功能關(guān)鍵詞,siri將終端上安裝的所有能夠?qū)崿F(xiàn)該功能、并且支持語(yǔ)音輸入的應(yīng)用程序名稱(chēng)顯示給用戶(hù),請(qǐng)用戶(hù)選擇想用哪個(gè)應(yīng)用程序。siri將用戶(hù)選定的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
siri將關(guān)聯(lián)應(yīng)用程序置于前臺(tái)運(yùn)行,并把用戶(hù)的輸入語(yǔ)音通過(guò)操作系統(tǒng)傳輸給關(guān)聯(lián)應(yīng)用程序。關(guān)聯(lián)應(yīng)用程序識(shí)別用戶(hù)的輸入語(yǔ)音,按照自己的識(shí)別結(jié)果和業(yè)務(wù)流程來(lái)完成用戶(hù)指令的任務(wù)。
例如,用戶(hù)對(duì)siri說(shuō),“轉(zhuǎn)賬2000給張三”。siri識(shí)別出功能關(guān)鍵詞“轉(zhuǎn)賬”,從表1查詢(xún)到關(guān)聯(lián)應(yīng)用程序?yàn)橹Ц秾殹iri打開(kāi)支付寶,將用戶(hù)的輸入語(yǔ)音傳遞給支付寶。支付寶識(shí)別輸入語(yǔ)音,啟動(dòng)轉(zhuǎn)賬業(yè)務(wù)流程,向用戶(hù)顯示“收款方:張三”、“轉(zhuǎn)賬金額:2000”等內(nèi)容,在用戶(hù)輸入密碼或驗(yàn)證指紋后即可完成轉(zhuǎn)賬。
與上述流程實(shí)現(xiàn)對(duì)應(yīng),本申請(qǐng)的實(shí)施例還提供了一種應(yīng)用在終端語(yǔ)音助手上的語(yǔ)音的功能控制裝置,和一種應(yīng)用在終端應(yīng)用程序上的語(yǔ)音的功能控制裝置。這兩種裝置均可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)硬件或者軟硬件結(jié)合的方式實(shí)現(xiàn)。以軟件實(shí)現(xiàn)為例,作為邏輯意義上的裝置,是通過(guò)終端的cpu(centralprocessunit,中央處理器)將對(duì)應(yīng)的計(jì)算機(jī)程序指令讀取到內(nèi)存中運(yùn)行形成的。從硬件層面而言,除了圖4所示的cpu、內(nèi)存以及非易失性存儲(chǔ)器之外,語(yǔ)音的功能控制裝置所在的終端通常還包括用于進(jìn)行無(wú)線(xiàn)信號(hào)收發(fā)的芯片等其他硬件,和/或用于實(shí)現(xiàn)網(wǎng)絡(luò)通信功能的板卡等其他硬件。
圖5所示為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音的功能控制裝置,應(yīng)用在終端的語(yǔ)音助手上,包括關(guān)聯(lián)應(yīng)用程序單元和輸入語(yǔ)音傳遞單元,其中:關(guān)聯(lián)應(yīng)用程序單元用于根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定關(guān)聯(lián)應(yīng)用程序;所述關(guān)聯(lián)應(yīng)用程序用來(lái)實(shí)現(xiàn)用戶(hù)要使用的功能;輸入語(yǔ)音傳遞單元用于將用戶(hù)的輸入語(yǔ)音傳遞給所述關(guān)聯(lián)應(yīng)用程序,供所述關(guān)聯(lián)應(yīng)用程序?qū)τ脩?hù)的輸入語(yǔ)音進(jìn)行識(shí)別,并根據(jù)識(shí)別結(jié)果進(jìn)行所述功能的實(shí)現(xiàn)。
一個(gè)例子中,所述終端上維護(hù)有要使用的功能與應(yīng)用程序的映射關(guān)系;所述關(guān)聯(lián)應(yīng)用程序單元具體用于:根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定用戶(hù)要使用的功能,將與用戶(hù)要使用的功能具有映射關(guān)系的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
上述例子中,所述要使用的功能與應(yīng)用程序的映射關(guān)系,包括:功能關(guān)鍵詞與應(yīng)用程序的映射關(guān)系;所述關(guān)聯(lián)應(yīng)用程序單元具體用于:提取對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果中的功能關(guān)鍵詞,將與所述功能關(guān)鍵詞具有映射關(guān)系的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
上述例子中,所述要使用的功能與應(yīng)用程序的映射關(guān)系,包括:由用戶(hù)設(shè)置的要使用的功能與應(yīng)用程序的映射關(guān)系;和/或,以實(shí)現(xiàn)所述要使用的功能時(shí),用戶(hù)最頻繁采用的應(yīng)用程序作為與所述要使用的功能具有映射關(guān)系的應(yīng)用程序;和/或,由某個(gè)應(yīng)用程序提交的、所述應(yīng)用程序與要使用功能的映射關(guān)系。
可選的,所述關(guān)聯(lián)應(yīng)用程序單元具體用于:根據(jù)對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果,確定用戶(hù)要使用的功能,將所述終端上能夠?qū)崿F(xiàn)所述功能、并且支持語(yǔ)音輸入的若干個(gè)應(yīng)用程序名稱(chēng)顯示給用戶(hù)供其選擇,將用戶(hù)選定的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
可選的,所述關(guān)聯(lián)應(yīng)用程序單元具體用于:提取對(duì)用戶(hù)輸入語(yǔ)音的識(shí)別結(jié)果中的應(yīng)用程序名稱(chēng),將輸入語(yǔ)音中指定的應(yīng)用程序作為關(guān)聯(lián)應(yīng)用程序。
可選的,所述輸入語(yǔ)音傳遞單元具體用于:將所述識(shí)別結(jié)果和用戶(hù)的輸入語(yǔ)音傳遞給所述關(guān)聯(lián)應(yīng)用程序,供所述關(guān)聯(lián)應(yīng)用程序?qū)τ脩?hù)的輸入語(yǔ)音進(jìn)行識(shí)別,并根據(jù)關(guān)聯(lián)應(yīng)用程序的識(shí)別結(jié)果和語(yǔ)音助手的識(shí)別結(jié)果進(jìn)行所述功能的實(shí)現(xiàn)。
圖6所示為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音的功能控制裝置,應(yīng)用在用來(lái)實(shí)現(xiàn)除語(yǔ)音助手外其他功能的終端應(yīng)用程序上,包括輸入語(yǔ)音接收單元和功能實(shí)現(xiàn)單元,其中:輸入語(yǔ)音接收單元用于接收來(lái)自語(yǔ)音助手的用戶(hù)的輸入語(yǔ)音;功能實(shí)現(xiàn)單元用于識(shí)別用戶(hù)的輸入語(yǔ)音,根據(jù)識(shí)別結(jié)果進(jìn)行用戶(hù)要使用功能的實(shí)現(xiàn)。
可選的,所述輸入語(yǔ)音接收單元具體用于:接收來(lái)自語(yǔ)音助手的用戶(hù)的輸入語(yǔ)音,以及語(yǔ)音助手對(duì)所述輸入語(yǔ)音的識(shí)別結(jié)果;所述功能實(shí)現(xiàn)單元具體用于:識(shí)別用戶(hù)的輸入語(yǔ)音,根據(jù)自己的識(shí)別結(jié)果和來(lái)自語(yǔ)音助手的識(shí)別結(jié)果,進(jìn)行用戶(hù)要使用功能的實(shí)現(xiàn)。
一個(gè)例子中,所述裝置還包括:映射關(guān)系提交單元,用于根據(jù)用戶(hù)的指令,向語(yǔ)音助手提交本應(yīng)用程序與要使用功能的映射關(guān)系。
上述例子中,所述本應(yīng)用程序與要使用功能的映射關(guān)系,包括:本應(yīng)用程序與功能關(guān)鍵詞的映射關(guān)系。
以上所述僅為本申請(qǐng)的較佳實(shí)施例而已,并不用以限制本申請(qǐng),凡在本申請(qǐng)的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)保護(hù)的范圍之內(nèi)。
在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、其他類(lèi)型的隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、電可擦除可編程只讀存儲(chǔ)器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤(pán)只讀存儲(chǔ)器(cd-rom)、數(shù)字多功能光盤(pán)(dvd)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤(pán)存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪(fǎng)問(wèn)的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
還需要說(shuō)明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、商品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、商品或者設(shè)備中還存在另外的相同要素。
本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。