語(yǔ)音識(shí)別方法和移動(dòng)終端的制作方法
【專利摘要】本申請(qǐng)?zhí)峁┝苏Z(yǔ)音識(shí)別方法和移動(dòng)終端。其中,該方法包括:建立語(yǔ)音特征模型庫(kù),所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為;移動(dòng)終端接收用戶提供的語(yǔ)音;移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù),并確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),如果是,識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
【專利說(shuō)明】語(yǔ)音識(shí)別方法和移動(dòng)終端
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及語(yǔ)音識(shí)別領(lǐng)域,特別涉及語(yǔ)音識(shí)別方法和移動(dòng)終端。
【背景技術(shù)】
[0002]目前的語(yǔ)音識(shí)別技術(shù)都是基于語(yǔ)義識(shí)別的,其中,語(yǔ)義識(shí)別需要移動(dòng)終端智能地理解用戶輸入語(yǔ)音的意圖并做出正確的響應(yīng),這種語(yǔ)義識(shí)別涉及到語(yǔ)音輸入的語(yǔ)言種類、不同聲音的特征提取、以及語(yǔ)法形態(tài)等方面的分析。
[0003]但是,世界上的語(yǔ)言種類非常之多,即便是世界上常用的語(yǔ)言,也有數(shù)十種之多,并且,人們的語(yǔ)言習(xí)慣不盡相同,生活化的語(yǔ)言習(xí)慣造成了語(yǔ)義識(shí)別在語(yǔ)法上的困擾,要想做到真正的智能語(yǔ)義識(shí)別非常困難。另外,語(yǔ)義識(shí)別也很難滿足一些特定場(chǎng)所的語(yǔ)音識(shí)別要求。
【發(fā)明內(nèi)容】
[0004]本申請(qǐng)?zhí)峁┝苏Z(yǔ)音識(shí)別方法和移動(dòng)終端,以避免采用語(yǔ)義解析進(jìn)行語(yǔ)音識(shí)別所帶來(lái)的諸多困難。
[0005]本申請(qǐng)?zhí)峁┑募夹g(shù)方案包括:
[0006]一種語(yǔ)音識(shí)別方法,包括:
[0007]建立語(yǔ)音特征模型庫(kù),所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為;
[0008]移動(dòng)終端接收用戶提供的語(yǔ)音;
[0009]移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù),并確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),如果是,識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
[0010]一種移動(dòng)終2而,包括:
[0011]存儲(chǔ)單元,用于建立并存儲(chǔ)建立語(yǔ)音特征模型庫(kù),所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為;
[0012]接收單元,用于接收用戶提供的語(yǔ)音;
[0013]提取單元,用于對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù);
[0014]匹配單元,用于確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù);
[0015]動(dòng)作執(zhí)行單元,用于在所述匹配單元的匹配結(jié)果為是時(shí),識(shí)別語(yǔ)音特征模型庫(kù)中與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
[0016]由以上技術(shù)方案可以看出,本發(fā)明中,在進(jìn)行語(yǔ)音識(shí)別時(shí),基于建立的語(yǔ)音特征模型庫(kù),而該語(yǔ)音特征模型庫(kù)中存在語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系,這樣,就保證移動(dòng)終端無(wú)需精確進(jìn)行語(yǔ)義解析語(yǔ)音,僅提取語(yǔ)音中的語(yǔ)音特征參數(shù)即可,避免了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題。并且,本發(fā)明中,語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系可由用戶自定義的,這種方式將主動(dòng)權(quán)交由給用戶自身,解放了移動(dòng)終端,節(jié)省資源。
【專利附圖】
【附圖說(shuō)明】
[0017]圖1為本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法流程圖;
[0018]圖2為本發(fā)明實(shí)施例提供的語(yǔ)音特征模型庫(kù)建立流程圖;
[0019]圖3為本發(fā)明實(shí)施例提供的步驟102實(shí)現(xiàn)流程圖;
[0020]圖4為本發(fā)明實(shí)施例提供的移動(dòng)終端結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0021]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述。
[0022]本發(fā)明提供的語(yǔ)音識(shí)別方法,可以幫助用戶使用語(yǔ)音實(shí)現(xiàn)與移動(dòng)終端的交互,并且,本發(fā)明中,在進(jìn)行語(yǔ)音識(shí)別時(shí)依賴于之前建立的語(yǔ)音特征模型庫(kù),不會(huì)涉及到語(yǔ)義解析,相應(yīng)地杜絕了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題比如語(yǔ)言之間的差別問(wèn)題、以及語(yǔ)義語(yǔ)法的問(wèn)題等。
[0023]下面對(duì)本發(fā)明提供的語(yǔ)音識(shí)別方法進(jìn)行描述:
[0024]參見(jiàn)圖1,圖1為本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法流程圖。如圖1所示,該流程可包括以下步驟:
[0025]步驟101,建立語(yǔ)音特征模型庫(kù)。
[0026]本步驟101中的語(yǔ)音特征模型庫(kù),其是移動(dòng)終端通過(guò)機(jī)器學(xué)習(xí)的方式建立,具體在后文進(jìn)行描述。
[0027]優(yōu)選地,本發(fā)明中,所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為。其中,每一語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為是用戶自定義設(shè)置。
[0028]步驟102,移動(dòng)終端接收用戶提供的語(yǔ)音,對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù),并在語(yǔ)音特征模型庫(kù)中識(shí)別出所述用戶的所有語(yǔ)音特征參數(shù),確定該識(shí)別出的所有語(yǔ)音特征參數(shù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),如果是,識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
[0029]至此,完成圖1所示流程。從圖1所示流程可以看出,本發(fā)明中,主要是用戶自定義語(yǔ)音的特征參數(shù)和動(dòng)作行為,不像現(xiàn)有技術(shù)那樣精確解析語(yǔ)音的語(yǔ)義,避免了由于進(jìn)行語(yǔ)義解析而帶來(lái)的諸多問(wèn)題。
[0030]其中,在用戶自定義語(yǔ)音特征參數(shù)和動(dòng)作行為時(shí),該動(dòng)作行為可為與語(yǔ)音不同甚至相反的行為,這便于實(shí)現(xiàn)語(yǔ)音暗號(hào)。這里,所謂語(yǔ)音暗號(hào),其是用于觸發(fā)移動(dòng)終端執(zhí)行某一特定動(dòng)作或者調(diào)用某一特定應(yīng)用程序的標(biāo)識(shí),比如,當(dāng)移動(dòng)終端接收到語(yǔ)音“親愛(ài)的”時(shí),通過(guò)解析該語(yǔ)音的特征參數(shù)識(shí)別出對(duì)應(yīng)的動(dòng)作行為為用于觸發(fā)給xxxxxxxx撥打電話,則給XXXXXXXX撥打電話。
[0031]下面對(duì)圖1所示流程中的語(yǔ)音特征模型庫(kù)進(jìn)行詳細(xì)描述:
[0032]參見(jiàn)圖2,圖2為本發(fā)明實(shí)施例提供的語(yǔ)音特征模型庫(kù)建立流程圖。本發(fā)明中,針對(duì)一個(gè)用戶可建立一個(gè)語(yǔ)音特征模型庫(kù),或者,多個(gè)用戶共享同一個(gè)語(yǔ)音特征模型庫(kù),節(jié)省資源。
[0033]如圖2所示,該流程可包括以下步驟:
[0034]步驟201,用戶向移動(dòng)終端輸入語(yǔ)音。
[0035]本發(fā)明中,在建立語(yǔ)音特征模型庫(kù)時(shí),為便于分析用戶的語(yǔ)音習(xí)慣和使用特征,可根據(jù)情況控制用戶輸入語(yǔ)音的次數(shù),比如,控制用戶至少輸入兩次以上語(yǔ)義相同的語(yǔ)音等。
[0036]優(yōu)選地,本發(fā)明中,均以控制用戶至少輸入兩次以上語(yǔ)義相同的語(yǔ)音為例。
[0037]步驟202,移動(dòng)終端針對(duì)接收的每一語(yǔ)音,對(duì)該語(yǔ)音進(jìn)行語(yǔ)音處理,以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征。
[0038]本發(fā)明中,語(yǔ)音處理,至少包括對(duì)原始語(yǔ)音的處理,消除語(yǔ)音的噪聲和消除不同說(shuō)話者對(duì)語(yǔ)音帶來(lái)的影響。最常用的處理方式有端點(diǎn)檢測(cè)和語(yǔ)音增強(qiáng)。所謂端點(diǎn)檢測(cè),其是指在語(yǔ)音中將語(yǔ)音信號(hào)和非語(yǔ)音信號(hào)時(shí)段區(qū)分開(kāi)來(lái),準(zhǔn)確地確定出語(yǔ)音信號(hào)的起始點(diǎn)。經(jīng)過(guò)端點(diǎn)檢測(cè)后,后續(xù)處理就可以只對(duì)語(yǔ)音信號(hào)進(jìn)行,這對(duì)提高語(yǔ)音特征模型庫(kù)的精確度和識(shí)別正確率有重要作用。至于語(yǔ)音增強(qiáng),其主要任務(wù)就是消除環(huán)境噪聲對(duì)語(yǔ)音的影響,通常的方法是采用維納濾波,該方法在噪聲較大的情況下效果好于其它濾波器,這部分涉及到移動(dòng)終端的硬件部分。
[0039]步驟203,提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征。
[0040]這里,聲學(xué)特征的提取是語(yǔ)音識(shí)別的一個(gè)重要環(huán)節(jié),聲學(xué)特征的提取既是一個(gè)信息大幅度壓縮的過(guò)程,也是一個(gè)信號(hào)解卷過(guò)程,其目的是提取語(yǔ)音中最能代表語(yǔ)音的特征信息,以減少后續(xù)進(jìn)行語(yǔ)音識(shí)別時(shí)所需要處理的數(shù)據(jù)量。由于語(yǔ)音的時(shí)變特性,語(yǔ)音特征的提取必須在一小段語(yǔ)音上進(jìn)行,也即進(jìn)行短時(shí)分析,這一段被認(rèn)為是平穩(wěn)的分析區(qū)間稱之為幀,幀與幀之間的偏移通常取幀長(zhǎng)的1/2或1/3。目前,特征提取的基礎(chǔ)性研究已經(jīng)比較豐富,現(xiàn)有的移動(dòng)終端已經(jīng)具有較為成熟的解決方案,因此,本發(fā)明可采用現(xiàn)有比較成熟的語(yǔ)音特征提取方式執(zhí)行。
[0041]步驟204,利用提取出到語(yǔ)音特征進(jìn)行計(jì)算得到一個(gè)數(shù)值作為所述語(yǔ)音的語(yǔ)音特征參數(shù)。
[0042]本步驟204中,可利用機(jī)器學(xué)習(xí)的方法計(jì)算語(yǔ)音特征參數(shù),其中,該語(yǔ)音特征參數(shù)代表用戶當(dāng)前輸入所述語(yǔ)音時(shí)的語(yǔ)音習(xí)慣和使用特征。
[0043]至此,通過(guò)上述步驟202至步驟204,移動(dòng)終端即可實(shí)現(xiàn)針對(duì)接收的一次語(yǔ)音得到對(duì)應(yīng)的語(yǔ)音特征參數(shù)。此時(shí),該得到的語(yǔ)音特征參數(shù)為一個(gè)數(shù)值。
[0044]步驟205,移動(dòng)終端利用具有同一語(yǔ)義的語(yǔ)音得到的語(yǔ)音特征參數(shù)確定一個(gè)數(shù)值區(qū)間作為語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù),并記錄至語(yǔ)音特征模型庫(kù)中。
[0045]基于上面描述的,本發(fā)明中,在建立語(yǔ)音特征模型庫(kù)時(shí),針對(duì)同一語(yǔ)義的語(yǔ)音,用戶會(huì)輸入多次,而當(dāng)移動(dòng)終端接收到用戶多次輸入的同一語(yǔ)義的語(yǔ)音時(shí),由于用戶輸入語(yǔ)音時(shí)的語(yǔ)氣語(yǔ)調(diào)等不同會(huì)導(dǎo)致最后得到的語(yǔ)音特征參數(shù)不同(這里針對(duì)語(yǔ)義相同的不同語(yǔ)音,在計(jì)算語(yǔ)音特征參數(shù)時(shí)可采用頻譜分析),基于此,移動(dòng)終端就會(huì)從這些針對(duì)同一語(yǔ)義的語(yǔ)音而得到的語(yǔ)音特征參數(shù)中選擇最小值和最大值,將從該最小值起至最大值結(jié)束的數(shù)值范圍作為上述數(shù)值區(qū)間,并作為語(yǔ)音特征參數(shù)記錄至所述語(yǔ)音特征模型庫(kù)。通過(guò)這種數(shù)值區(qū)間,能偶提升后續(xù)語(yǔ)音識(shí)別的精度,消除不用用戶間的語(yǔ)音差異。[0046]步驟206,根據(jù)實(shí)際應(yīng)用,針對(duì)語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)設(shè)置對(duì)應(yīng)的動(dòng)作行為。
[0047]比如,為語(yǔ)音特征模型庫(kù)中與用戶輸入的語(yǔ)音“親愛(ài)的”對(duì)應(yīng)的語(yǔ)音特征參數(shù)設(shè)置動(dòng)作行為:向xxxxxxxx撥打電話。
[0048]至此,完成圖2所示流程。
[0049]基于圖2所示流程建立的語(yǔ)音特征模型庫(kù),則步驟102的具體實(shí)現(xiàn)如圖3所示。下面進(jìn)行描述:
[0050]參見(jiàn)圖3,圖3為本發(fā)明實(shí)施例提供的步驟103實(shí)現(xiàn)流程圖。如圖3所示,該流程可包括以下步驟:
[0051]步驟301,移動(dòng)終端接收到一段語(yǔ)音。
[0052]本步驟301中,移動(dòng)終端可通過(guò)其上的麥克風(fēng)接收用戶輸入的一段語(yǔ)音,
[0053]步驟302,移動(dòng)終端確定當(dāng)前狀態(tài)是否為語(yǔ)音識(shí)別狀態(tài),如果是,執(zhí)行步驟303,否貝U,結(jié)束當(dāng)前流程。
[0054]本發(fā)明中,移動(dòng)終端可默認(rèn)實(shí)時(shí)處于語(yǔ)音識(shí)別狀態(tài),也可根據(jù)用戶設(shè)置進(jìn)入語(yǔ)音識(shí)別狀態(tài)。
[0055]步驟303,移動(dòng)終纟而確定本地是否存在語(yǔ)首特征I吳型庫(kù),如果是,執(zhí)彳了步驟305,否貝U,執(zhí)行步驟304。
[0056]步驟304,提醒用戶目前狀態(tài)有誤。結(jié)束當(dāng)前流程。
[0057]步驟305,確定所述語(yǔ)音特征模型庫(kù)中是否存在語(yǔ)音特征參數(shù),如果是,執(zhí)行步驟306,否則,返回執(zhí)行步驟304。
[0058]步驟306,移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理,以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征。
[0059]這里的語(yǔ)音處理如上所述,這里不再贅述。
[0060]步驟307,提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征,利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
[0061]這里的語(yǔ)音特征提取和語(yǔ)音特征參數(shù)計(jì)算如上所述,這里不再贅述。
[0062]步驟308,確定語(yǔ)音特征模型庫(kù)中是否存在與步驟307計(jì)算的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),如果是,執(zhí)行步驟309,否則,結(jié)束當(dāng)前流程。
[0063]基于上面描述,由于語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)為一數(shù)值區(qū)間,而步驟307計(jì)算的語(yǔ)音特征參數(shù)為一個(gè)數(shù)值,基于此,本步驟308中,當(dāng)步驟307計(jì)算的數(shù)值處于語(yǔ)音特征模型庫(kù)中的其中一個(gè)數(shù)值區(qū)間中時(shí),則確定步驟307計(jì)算的語(yǔ)音特征參數(shù)與語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)匹配,可繼續(xù)進(jìn)行語(yǔ)音識(shí)別,反之,當(dāng)步驟307計(jì)算的數(shù)值不處于語(yǔ)音特征模型庫(kù)中的任一個(gè)數(shù)值區(qū)間中時(shí),則確定步驟307計(jì)算的語(yǔ)音特征參數(shù)不與語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)匹配,當(dāng)前的語(yǔ)音識(shí)別有錯(cuò)誤,結(jié)束當(dāng)前流程。
[0064]步驟309,識(shí)別語(yǔ)音特征模型庫(kù)中與步驟307計(jì)算的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
[0065]至此,完成圖3所示的流程。
[0066]從圖3所示流程可以看出,本發(fā)明能夠?qū)崿F(xiàn)語(yǔ)音與移動(dòng)終端交互,比如當(dāng)用戶做其他事情的時(shí)候,可能由于手上要做事情,不方便拿起移動(dòng)終端給愛(ài)人撥打電話,這個(gè)時(shí)候,可以直接輸入語(yǔ)音,比如親愛(ài)的,這時(shí)移動(dòng)終端會(huì)自動(dòng)地給用戶的愛(ài)人撥打電話。其中,為了實(shí)現(xiàn)語(yǔ)音與移動(dòng)終端交互,需要預(yù)先建立語(yǔ)音特征模型庫(kù),該語(yǔ)音特征模型庫(kù)中存在語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系,這樣,就保證移動(dòng)終端無(wú)需精確進(jìn)行語(yǔ)義解析語(yǔ)音,僅提取語(yǔ)音中的語(yǔ)音特征參數(shù)即可,避免了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題。并且,本發(fā)明中,語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系由用戶自定義的,這種方式將主動(dòng)權(quán)交由給用戶自身,解放了移動(dòng)終端,節(jié)省資源。
[0067]優(yōu)選地,本發(fā)明中,步驟309中在執(zhí)行動(dòng)作行為時(shí),可進(jìn)一步識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音,當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí),結(jié)束所述動(dòng)作行為,否則,繼續(xù)執(zhí)行所述動(dòng)作行為。
[0068]以上對(duì)本發(fā)明提供的方法進(jìn)行的描述,下面對(duì)本發(fā)明提供的移動(dòng)終端進(jìn)行描述:
[0069]參見(jiàn)圖4,圖4為本發(fā)明實(shí)施例提供的移動(dòng)終端結(jié)構(gòu)圖。如圖4所示,所述移動(dòng)終端包括:
[0070]存儲(chǔ)單元,用于建立并存儲(chǔ)建立語(yǔ)音特征模型庫(kù),所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為;
[0071]接收單元,用于接收用戶提供的語(yǔ)音;
[0072]提取單元,用于對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù);
[0073]匹配單元,用于確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù);
[0074]動(dòng)作執(zhí)行單元,用于在所述匹配單元的匹配結(jié)果為是時(shí),識(shí)別語(yǔ)音特征模型庫(kù)中與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
[0075]本發(fā)明中,所述提取單元包括:
[0076]處理子單元,用于對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理,以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征;
[0077]提取子單元,用于提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征,利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
[0078]優(yōu)選地,本發(fā)明中,所述語(yǔ)音特征模型庫(kù)通過(guò)機(jī)器學(xué)習(xí)語(yǔ)音的方式建立,所述語(yǔ)音特征模型庫(kù)中存在的任一語(yǔ)音特征參數(shù)為一個(gè)數(shù)值區(qū)間,其用于學(xué)習(xí)用戶在兩次以上輸入的語(yǔ)義相同的語(yǔ)音而得到的。
[0079]本發(fā)明中,所述匹配單元確定語(yǔ)音特征模型庫(kù)中是否存在與提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)包括:
[0080]比較所述數(shù)值和語(yǔ)音特征模型庫(kù)中的所有數(shù)值區(qū)間,如果所述數(shù)值處于其中一個(gè)數(shù)值區(qū)間中,則確定語(yǔ)音特征模型庫(kù)中存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),否則,在所述數(shù)值均不處于任一數(shù)值區(qū)間時(shí),確定語(yǔ)音特征模型庫(kù)中不存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)。
[0081]本發(fā)明中,如圖4所示,所述移動(dòng)終端進(jìn)一步包括:
[0082]控制單元,用于在所述動(dòng)作執(zhí)行單元執(zhí)行動(dòng)作行為時(shí),識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音,當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí),結(jié)束所述動(dòng)作行為。
[0083]至此,完成圖4所示移動(dòng)終端的結(jié)構(gòu)描述。[0084]由以上技術(shù)方案可以看出,本發(fā)明中,在進(jìn)行語(yǔ)音識(shí)別時(shí),基于建立的語(yǔ)音特征模型庫(kù),而該語(yǔ)音特征模型庫(kù)中存在語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系,這樣,就保證移動(dòng)終端無(wú)需精確進(jìn)行語(yǔ)義解析語(yǔ)音,僅提取語(yǔ)音中的語(yǔ)音特征參數(shù)即可,避免了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題。并且,本發(fā)明中,語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系可由用戶自定義的,這種方式將主動(dòng)權(quán)交由給用戶自身,解放了移動(dòng)終端,節(jié)省資源。
[0085]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種語(yǔ)音識(shí)別方法,其特征在于,該方法包括: 建立語(yǔ)音特征模型庫(kù),所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為; 移動(dòng)終端接收用戶提供的語(yǔ)音; 移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù),并確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),如果是,識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取出語(yǔ)音中的語(yǔ)音特征參數(shù)包括: 對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理,以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征; 提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征,利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述語(yǔ)音特征模型庫(kù)通過(guò)機(jī)器學(xué)習(xí)語(yǔ)音的方式建立,所述語(yǔ)音特征模型庫(kù)中存在的任一語(yǔ)音特征參數(shù)為一個(gè)數(shù)值區(qū)間,其通過(guò)學(xué)習(xí)用戶在兩次以上輸入的語(yǔ)義相同的語(yǔ)音而得到的。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)包括: 比較所述數(shù)值和語(yǔ)音特征模型庫(kù)中的所有數(shù)值區(qū)間,如果所述數(shù)值處于其中一個(gè)數(shù)值區(qū)間中,則確定語(yǔ)音特征模型庫(kù)中存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),否則,在所述數(shù)值均不處于任一數(shù)值區(qū)間時(shí),確定語(yǔ)音特征模型庫(kù)中不存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)。
5.根據(jù)權(quán)利要求1至4任一所述的方法,其特征在于,在執(zhí)行動(dòng)作行為時(shí),該方法進(jìn)一步包括:` 識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音,當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí),結(jié)束所述動(dòng)作行為。
6.—種移動(dòng)終端,其特征在于,所述移動(dòng)終端包括: 存儲(chǔ)單元,用于建立并存儲(chǔ)建立語(yǔ)音特征模型庫(kù),所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù),并且,該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為; 接收單元,用于接收用戶提供的語(yǔ)音; 提取單元,用于對(duì)接收的語(yǔ)音進(jìn)行分析,提取出語(yǔ)音中的語(yǔ)音特征參數(shù); 匹配單元,用于確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù); 動(dòng)作執(zhí)行單元,用于在所述匹配單元的匹配結(jié)果為是時(shí),識(shí)別語(yǔ)音特征模型庫(kù)中與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為,執(zhí)行該識(shí)別出的動(dòng)作行為。
7.根據(jù)權(quán)利要求6所述的移動(dòng)終端,其特征在于,所述提取單元包括: 處理子單元,用于對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理,以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征; 提取子單元,用于提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征,利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
8.根據(jù)權(quán)利要求7所述的移動(dòng)終端,其特征在于,所述語(yǔ)音特征模型庫(kù)通過(guò)機(jī)器學(xué)習(xí)語(yǔ)音的方式建立,所述語(yǔ)音特征模型庫(kù)中存在的任一語(yǔ)音特征參數(shù)為一個(gè)數(shù)值區(qū)間,其通過(guò)學(xué)習(xí)用戶在兩次以上輸入的語(yǔ)義相同的語(yǔ)音而得到的。
9.根據(jù)權(quán)利要求8所述的移動(dòng)終端,其特征在于,所述匹配單元確定語(yǔ)音特征模型庫(kù)中是否存在與提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)包括: 比較所述數(shù)值和語(yǔ)音特征模型庫(kù)中的所有數(shù)值區(qū)間,如果所述數(shù)值處于其中一個(gè)數(shù)值區(qū)間中,則確定語(yǔ)音特征模型庫(kù)中存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù),否則,在所述數(shù)值均不處于任一數(shù)值區(qū)間時(shí),確定語(yǔ)音特征模型庫(kù)中不存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)。
10.根據(jù)權(quán)利要求6至9任一所述的移動(dòng)終端,其特征在于,所述移動(dòng)終端進(jìn)一步包括: 控制單元,用于在所述動(dòng)作執(zhí)行單元執(zhí)行動(dòng)作行為時(shí),識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音,當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí),結(jié)束所述動(dòng)作行為。
【文檔編號(hào)】G10L15/22GK103778915SQ201210394952
【公開(kāi)日】2014年5月7日 申請(qǐng)日期:2012年10月17日 優(yōu)先權(quán)日:2012年10月17日
【發(fā)明者】鄧平 申請(qǐng)人:三星電子(中國(guó))研發(fā)中心, 三星電子株式會(huì)社