語(yǔ)音識(shí)別方法和移動(dòng)終端的制作方法

文檔序號(hào)：2825486閱讀：213來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語(yǔ)音識(shí)別方法和移動(dòng)終端的制作方法
【專利摘要】本申請(qǐng)?zhí)峁┝苏Z(yǔ)音識(shí)別方法和移動(dòng)終端。其中，該方法包括：建立語(yǔ)音特征模型庫(kù)，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為；移動(dòng)終端接收用戶提供的語(yǔ)音；移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)，并確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，如果是，識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
【專利說(shuō)明】語(yǔ)音識(shí)別方法和移動(dòng)終端
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及語(yǔ)音識(shí)別領(lǐng)域，特別涉及語(yǔ)音識(shí)別方法和移動(dòng)終端。
【背景技術(shù)】
[0002]目前的語(yǔ)音識(shí)別技術(shù)都是基于語(yǔ)義識(shí)別的，其中，語(yǔ)義識(shí)別需要移動(dòng)終端智能地理解用戶輸入語(yǔ)音的意圖并做出正確的響應(yīng)，這種語(yǔ)義識(shí)別涉及到語(yǔ)音輸入的語(yǔ)言種類、不同聲音的特征提取、以及語(yǔ)法形態(tài)等方面的分析。
[0003]但是，世界上的語(yǔ)言種類非常之多，即便是世界上常用的語(yǔ)言，也有數(shù)十種之多，并且，人們的語(yǔ)言習(xí)慣不盡相同，生活化的語(yǔ)言習(xí)慣造成了語(yǔ)義識(shí)別在語(yǔ)法上的困擾，要想做到真正的智能語(yǔ)義識(shí)別非常困難。另外，語(yǔ)義識(shí)別也很難滿足一些特定場(chǎng)所的語(yǔ)音識(shí)別要求。

【發(fā)明內(nèi)容】

[0004]本申請(qǐng)?zhí)峁┝苏Z(yǔ)音識(shí)別方法和移動(dòng)終端，以避免采用語(yǔ)義解析進(jìn)行語(yǔ)音識(shí)別所帶來(lái)的諸多困難。
[0005]本申請(qǐng)?zhí)峁┑募夹g(shù)方案包括:
[0006]一種語(yǔ)音識(shí)別方法，包括:
[0007]建立語(yǔ)音特征模型庫(kù)，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為；
[0008]移動(dòng)終端接收用戶提供的語(yǔ)音；
[0009]移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)，并確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，如果是，識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
[0010]一種移動(dòng)終2而，包括:
[0011]存儲(chǔ)單元，用于建立并存儲(chǔ)建立語(yǔ)音特征模型庫(kù)，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為；
[0012]接收單元，用于接收用戶提供的語(yǔ)音；
[0013]提取單元，用于對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)；
[0014]匹配單元，用于確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)；
[0015]動(dòng)作執(zhí)行單元，用于在所述匹配單元的匹配結(jié)果為是時(shí)，識(shí)別語(yǔ)音特征模型庫(kù)中與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
[0016]由以上技術(shù)方案可以看出，本發(fā)明中，在進(jìn)行語(yǔ)音識(shí)別時(shí)，基于建立的語(yǔ)音特征模型庫(kù)，而該語(yǔ)音特征模型庫(kù)中存在語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系，這樣，就保證移動(dòng)終端無(wú)需精確進(jìn)行語(yǔ)義解析語(yǔ)音，僅提取語(yǔ)音中的語(yǔ)音特征參數(shù)即可，避免了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題。并且，本發(fā)明中，語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系可由用戶自定義的，這種方式將主動(dòng)權(quán)交由給用戶自身，解放了移動(dòng)終端，節(jié)省資源。
【專利附圖】

【附圖說(shuō)明】
[0017]圖1為本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法流程圖；
[0018]圖2為本發(fā)明實(shí)施例提供的語(yǔ)音特征模型庫(kù)建立流程圖；
[0019]圖3為本發(fā)明實(shí)施例提供的步驟102實(shí)現(xiàn)流程圖；
[0020]圖4為本發(fā)明實(shí)施例提供的移動(dòng)終端結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0021]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述。
[0022]本發(fā)明提供的語(yǔ)音識(shí)別方法，可以幫助用戶使用語(yǔ)音實(shí)現(xiàn)與移動(dòng)終端的交互，并且，本發(fā)明中，在進(jìn)行語(yǔ)音識(shí)別時(shí)依賴于之前建立的語(yǔ)音特征模型庫(kù)，不會(huì)涉及到語(yǔ)義解析，相應(yīng)地杜絕了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題比如語(yǔ)言之間的差別問(wèn)題、以及語(yǔ)義語(yǔ)法的問(wèn)題等。
[0023]下面對(duì)本發(fā)明提供的語(yǔ)音識(shí)別方法進(jìn)行描述:
[0024]參見(jiàn)圖1，圖1為本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法流程圖。如圖1所示，該流程可包括以下步驟:
[0025]步驟101，建立語(yǔ)音特征模型庫(kù)。
[0026]本步驟101中的語(yǔ)音特征模型庫(kù)，其是移動(dòng)終端通過(guò)機(jī)器學(xué)習(xí)的方式建立，具體在后文進(jìn)行描述。
[0027]優(yōu)選地，本發(fā)明中，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為。其中，每一語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為是用戶自定義設(shè)置。
[0028]步驟102，移動(dòng)終端接收用戶提供的語(yǔ)音，對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)，并在語(yǔ)音特征模型庫(kù)中識(shí)別出所述用戶的所有語(yǔ)音特征參數(shù)，確定該識(shí)別出的所有語(yǔ)音特征參數(shù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，如果是，識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
[0029]至此，完成圖1所示流程。從圖1所示流程可以看出，本發(fā)明中，主要是用戶自定義語(yǔ)音的特征參數(shù)和動(dòng)作行為，不像現(xiàn)有技術(shù)那樣精確解析語(yǔ)音的語(yǔ)義，避免了由于進(jìn)行語(yǔ)義解析而帶來(lái)的諸多問(wèn)題。
[0030]其中，在用戶自定義語(yǔ)音特征參數(shù)和動(dòng)作行為時(shí)，該動(dòng)作行為可為與語(yǔ)音不同甚至相反的行為，這便于實(shí)現(xiàn)語(yǔ)音暗號(hào)。這里，所謂語(yǔ)音暗號(hào)，其是用于觸發(fā)移動(dòng)終端執(zhí)行某一特定動(dòng)作或者調(diào)用某一特定應(yīng)用程序的標(biāo)識(shí)，比如，當(dāng)移動(dòng)終端接收到語(yǔ)音“親愛(ài)的”時(shí)，通過(guò)解析該語(yǔ)音的特征參數(shù)識(shí)別出對(duì)應(yīng)的動(dòng)作行為為用于觸發(fā)給xxxxxxxx撥打電話，則給XXXXXXXX撥打電話。
[0031]下面對(duì)圖1所示流程中的語(yǔ)音特征模型庫(kù)進(jìn)行詳細(xì)描述:
[0032]參見(jiàn)圖2，圖2為本發(fā)明實(shí)施例提供的語(yǔ)音特征模型庫(kù)建立流程圖。本發(fā)明中，針對(duì)一個(gè)用戶可建立一個(gè)語(yǔ)音特征模型庫(kù)，或者，多個(gè)用戶共享同一個(gè)語(yǔ)音特征模型庫(kù)，節(jié)省資源。
[0033]如圖2所示，該流程可包括以下步驟:
[0034]步驟201，用戶向移動(dòng)終端輸入語(yǔ)音。
[0035]本發(fā)明中，在建立語(yǔ)音特征模型庫(kù)時(shí)，為便于分析用戶的語(yǔ)音習(xí)慣和使用特征，可根據(jù)情況控制用戶輸入語(yǔ)音的次數(shù)，比如，控制用戶至少輸入兩次以上語(yǔ)義相同的語(yǔ)音等。
[0036]優(yōu)選地，本發(fā)明中，均以控制用戶至少輸入兩次以上語(yǔ)義相同的語(yǔ)音為例。
[0037]步驟202，移動(dòng)終端針對(duì)接收的每一語(yǔ)音，對(duì)該語(yǔ)音進(jìn)行語(yǔ)音處理，以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征。
[0038]本發(fā)明中，語(yǔ)音處理，至少包括對(duì)原始語(yǔ)音的處理，消除語(yǔ)音的噪聲和消除不同說(shuō)話者對(duì)語(yǔ)音帶來(lái)的影響。最常用的處理方式有端點(diǎn)檢測(cè)和語(yǔ)音增強(qiáng)。所謂端點(diǎn)檢測(cè)，其是指在語(yǔ)音中將語(yǔ)音信號(hào)和非語(yǔ)音信號(hào)時(shí)段區(qū)分開(kāi)來(lái)，準(zhǔn)確地確定出語(yǔ)音信號(hào)的起始點(diǎn)。經(jīng)過(guò)端點(diǎn)檢測(cè)后，后續(xù)處理就可以只對(duì)語(yǔ)音信號(hào)進(jìn)行，這對(duì)提高語(yǔ)音特征模型庫(kù)的精確度和識(shí)別正確率有重要作用。至于語(yǔ)音增強(qiáng)，其主要任務(wù)就是消除環(huán)境噪聲對(duì)語(yǔ)音的影響，通常的方法是采用維納濾波，該方法在噪聲較大的情況下效果好于其它濾波器，這部分涉及到移動(dòng)終端的硬件部分。
[0039]步驟203，提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征。
[0040]這里，聲學(xué)特征的提取是語(yǔ)音識(shí)別的一個(gè)重要環(huán)節(jié)，聲學(xué)特征的提取既是一個(gè)信息大幅度壓縮的過(guò)程，也是一個(gè)信號(hào)解卷過(guò)程，其目的是提取語(yǔ)音中最能代表語(yǔ)音的特征信息，以減少后續(xù)進(jìn)行語(yǔ)音識(shí)別時(shí)所需要處理的數(shù)據(jù)量。由于語(yǔ)音的時(shí)變特性，語(yǔ)音特征的提取必須在一小段語(yǔ)音上進(jìn)行，也即進(jìn)行短時(shí)分析，這一段被認(rèn)為是平穩(wěn)的分析區(qū)間稱之為幀，幀與幀之間的偏移通常取幀長(zhǎng)的1/2或1/3。目前，特征提取的基礎(chǔ)性研究已經(jīng)比較豐富，現(xiàn)有的移動(dòng)終端已經(jīng)具有較為成熟的解決方案，因此，本發(fā)明可采用現(xiàn)有比較成熟的語(yǔ)音特征提取方式執(zhí)行。
[0041]步驟204，利用提取出到語(yǔ)音特征進(jìn)行計(jì)算得到一個(gè)數(shù)值作為所述語(yǔ)音的語(yǔ)音特征參數(shù)。
[0042]本步驟204中，可利用機(jī)器學(xué)習(xí)的方法計(jì)算語(yǔ)音特征參數(shù)，其中，該語(yǔ)音特征參數(shù)代表用戶當(dāng)前輸入所述語(yǔ)音時(shí)的語(yǔ)音習(xí)慣和使用特征。
[0043]至此，通過(guò)上述步驟202至步驟204，移動(dòng)終端即可實(shí)現(xiàn)針對(duì)接收的一次語(yǔ)音得到對(duì)應(yīng)的語(yǔ)音特征參數(shù)。此時(shí)，該得到的語(yǔ)音特征參數(shù)為一個(gè)數(shù)值。
[0044]步驟205，移動(dòng)終端利用具有同一語(yǔ)義的語(yǔ)音得到的語(yǔ)音特征參數(shù)確定一個(gè)數(shù)值區(qū)間作為語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)，并記錄至語(yǔ)音特征模型庫(kù)中。
[0045]基于上面描述的，本發(fā)明中，在建立語(yǔ)音特征模型庫(kù)時(shí)，針對(duì)同一語(yǔ)義的語(yǔ)音，用戶會(huì)輸入多次，而當(dāng)移動(dòng)終端接收到用戶多次輸入的同一語(yǔ)義的語(yǔ)音時(shí)，由于用戶輸入語(yǔ)音時(shí)的語(yǔ)氣語(yǔ)調(diào)等不同會(huì)導(dǎo)致最后得到的語(yǔ)音特征參數(shù)不同(這里針對(duì)語(yǔ)義相同的不同語(yǔ)音，在計(jì)算語(yǔ)音特征參數(shù)時(shí)可采用頻譜分析)，基于此，移動(dòng)終端就會(huì)從這些針對(duì)同一語(yǔ)義的語(yǔ)音而得到的語(yǔ)音特征參數(shù)中選擇最小值和最大值，將從該最小值起至最大值結(jié)束的數(shù)值范圍作為上述數(shù)值區(qū)間，并作為語(yǔ)音特征參數(shù)記錄至所述語(yǔ)音特征模型庫(kù)。通過(guò)這種數(shù)值區(qū)間，能偶提升后續(xù)語(yǔ)音識(shí)別的精度，消除不用用戶間的語(yǔ)音差異。[0046]步驟206，根據(jù)實(shí)際應(yīng)用，針對(duì)語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)設(shè)置對(duì)應(yīng)的動(dòng)作行為。
[0047]比如，為語(yǔ)音特征模型庫(kù)中與用戶輸入的語(yǔ)音“親愛(ài)的”對(duì)應(yīng)的語(yǔ)音特征參數(shù)設(shè)置動(dòng)作行為:向xxxxxxxx撥打電話。
[0048]至此，完成圖2所示流程。
[0049]基于圖2所示流程建立的語(yǔ)音特征模型庫(kù)，則步驟102的具體實(shí)現(xiàn)如圖3所示。下面進(jìn)行描述:
[0050]參見(jiàn)圖3，圖3為本發(fā)明實(shí)施例提供的步驟103實(shí)現(xiàn)流程圖。如圖3所示，該流程可包括以下步驟:
[0051]步驟301，移動(dòng)終端接收到一段語(yǔ)音。
[0052]本步驟301中，移動(dòng)終端可通過(guò)其上的麥克風(fēng)接收用戶輸入的一段語(yǔ)音，
[0053]步驟302，移動(dòng)終端確定當(dāng)前狀態(tài)是否為語(yǔ)音識(shí)別狀態(tài)，如果是，執(zhí)行步驟303，否貝U，結(jié)束當(dāng)前流程。
[0054]本發(fā)明中，移動(dòng)終端可默認(rèn)實(shí)時(shí)處于語(yǔ)音識(shí)別狀態(tài)，也可根據(jù)用戶設(shè)置進(jìn)入語(yǔ)音識(shí)別狀態(tài)。
[0055]步驟303，移動(dòng)終纟而確定本地是否存在語(yǔ)首特征I吳型庫(kù)，如果是，執(zhí)彳了步驟305，否貝U，執(zhí)行步驟304。
[0056]步驟304，提醒用戶目前狀態(tài)有誤。結(jié)束當(dāng)前流程。
[0057]步驟305，確定所述語(yǔ)音特征模型庫(kù)中是否存在語(yǔ)音特征參數(shù)，如果是，執(zhí)行步驟306，否則，返回執(zhí)行步驟304。
[0058]步驟306，移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理，以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征。
[0059]這里的語(yǔ)音處理如上所述，這里不再贅述。
[0060]步驟307，提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征，利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
[0061]這里的語(yǔ)音特征提取和語(yǔ)音特征參數(shù)計(jì)算如上所述，這里不再贅述。
[0062]步驟308，確定語(yǔ)音特征模型庫(kù)中是否存在與步驟307計(jì)算的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，如果是，執(zhí)行步驟309，否則，結(jié)束當(dāng)前流程。
[0063]基于上面描述，由于語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)為一數(shù)值區(qū)間，而步驟307計(jì)算的語(yǔ)音特征參數(shù)為一個(gè)數(shù)值，基于此，本步驟308中，當(dāng)步驟307計(jì)算的數(shù)值處于語(yǔ)音特征模型庫(kù)中的其中一個(gè)數(shù)值區(qū)間中時(shí)，則確定步驟307計(jì)算的語(yǔ)音特征參數(shù)與語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)匹配，可繼續(xù)進(jìn)行語(yǔ)音識(shí)別，反之，當(dāng)步驟307計(jì)算的數(shù)值不處于語(yǔ)音特征模型庫(kù)中的任一個(gè)數(shù)值區(qū)間中時(shí)，則確定步驟307計(jì)算的語(yǔ)音特征參數(shù)不與語(yǔ)音特征模型庫(kù)中的語(yǔ)音特征參數(shù)匹配，當(dāng)前的語(yǔ)音識(shí)別有錯(cuò)誤，結(jié)束當(dāng)前流程。
[0064]步驟309，識(shí)別語(yǔ)音特征模型庫(kù)中與步驟307計(jì)算的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
[0065]至此，完成圖3所示的流程。
[0066]從圖3所示流程可以看出，本發(fā)明能夠?qū)崿F(xiàn)語(yǔ)音與移動(dòng)終端交互，比如當(dāng)用戶做其他事情的時(shí)候，可能由于手上要做事情，不方便拿起移動(dòng)終端給愛(ài)人撥打電話，這個(gè)時(shí)候，可以直接輸入語(yǔ)音，比如親愛(ài)的，這時(shí)移動(dòng)終端會(huì)自動(dòng)地給用戶的愛(ài)人撥打電話。其中，為了實(shí)現(xiàn)語(yǔ)音與移動(dòng)終端交互，需要預(yù)先建立語(yǔ)音特征模型庫(kù)，該語(yǔ)音特征模型庫(kù)中存在語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系，這樣，就保證移動(dòng)終端無(wú)需精確進(jìn)行語(yǔ)義解析語(yǔ)音，僅提取語(yǔ)音中的語(yǔ)音特征參數(shù)即可，避免了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題。并且，本發(fā)明中，語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系由用戶自定義的，這種方式將主動(dòng)權(quán)交由給用戶自身，解放了移動(dòng)終端，節(jié)省資源。
[0067]優(yōu)選地，本發(fā)明中，步驟309中在執(zhí)行動(dòng)作行為時(shí)，可進(jìn)一步識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音，當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí)，結(jié)束所述動(dòng)作行為，否則，繼續(xù)執(zhí)行所述動(dòng)作行為。
[0068]以上對(duì)本發(fā)明提供的方法進(jìn)行的描述，下面對(duì)本發(fā)明提供的移動(dòng)終端進(jìn)行描述:
[0069]參見(jiàn)圖4，圖4為本發(fā)明實(shí)施例提供的移動(dòng)終端結(jié)構(gòu)圖。如圖4所示，所述移動(dòng)終端包括:
[0070]存儲(chǔ)單元，用于建立并存儲(chǔ)建立語(yǔ)音特征模型庫(kù)，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為；
[0071]接收單元，用于接收用戶提供的語(yǔ)音；
[0072]提取單元，用于對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)；
[0073]匹配單元，用于確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)；
[0074]動(dòng)作執(zhí)行單元，用于在所述匹配單元的匹配結(jié)果為是時(shí)，識(shí)別語(yǔ)音特征模型庫(kù)中與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
[0075]本發(fā)明中，所述提取單元包括:
[0076]處理子單元，用于對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理，以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征；
[0077]提取子單元，用于提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征，利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
[0078]優(yōu)選地，本發(fā)明中，所述語(yǔ)音特征模型庫(kù)通過(guò)機(jī)器學(xué)習(xí)語(yǔ)音的方式建立，所述語(yǔ)音特征模型庫(kù)中存在的任一語(yǔ)音特征參數(shù)為一個(gè)數(shù)值區(qū)間，其用于學(xué)習(xí)用戶在兩次以上輸入的語(yǔ)義相同的語(yǔ)音而得到的。
[0079]本發(fā)明中，所述匹配單元確定語(yǔ)音特征模型庫(kù)中是否存在與提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)包括:
[0080]比較所述數(shù)值和語(yǔ)音特征模型庫(kù)中的所有數(shù)值區(qū)間，如果所述數(shù)值處于其中一個(gè)數(shù)值區(qū)間中，則確定語(yǔ)音特征模型庫(kù)中存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，否則，在所述數(shù)值均不處于任一數(shù)值區(qū)間時(shí)，確定語(yǔ)音特征模型庫(kù)中不存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)。
[0081]本發(fā)明中，如圖4所示，所述移動(dòng)終端進(jìn)一步包括:
[0082]控制單元，用于在所述動(dòng)作執(zhí)行單元執(zhí)行動(dòng)作行為時(shí)，識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音，當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí)，結(jié)束所述動(dòng)作行為。
[0083]至此，完成圖4所示移動(dòng)終端的結(jié)構(gòu)描述。[0084]由以上技術(shù)方案可以看出，本發(fā)明中，在進(jìn)行語(yǔ)音識(shí)別時(shí)，基于建立的語(yǔ)音特征模型庫(kù)，而該語(yǔ)音特征模型庫(kù)中存在語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系，這樣，就保證移動(dòng)終端無(wú)需精確進(jìn)行語(yǔ)義解析語(yǔ)音，僅提取語(yǔ)音中的語(yǔ)音特征參數(shù)即可，避免了由于語(yǔ)義解析帶來(lái)的諸多問(wèn)題。并且，本發(fā)明中，語(yǔ)音特征參數(shù)和動(dòng)作行為之間的對(duì)應(yīng)關(guān)系可由用戶自定義的，這種方式將主動(dòng)權(quán)交由給用戶自身，解放了移動(dòng)終端，節(jié)省資源。
[0085]以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種語(yǔ)音識(shí)別方法，其特征在于，該方法包括: 建立語(yǔ)音特征模型庫(kù)，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為；移動(dòng)終端接收用戶提供的語(yǔ)音；移動(dòng)終端對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)，并確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，如果是，識(shí)別該存在的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述提取出語(yǔ)音中的語(yǔ)音特征參數(shù)包括: 對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理，以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征；提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征，利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述語(yǔ)音特征模型庫(kù)通過(guò)機(jī)器學(xué)習(xí)語(yǔ)音的方式建立，所述語(yǔ)音特征模型庫(kù)中存在的任一語(yǔ)音特征參數(shù)為一個(gè)數(shù)值區(qū)間，其通過(guò)學(xué)習(xí)用戶在兩次以上輸入的語(yǔ)義相同的語(yǔ)音而得到的。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)包括: 比較所述數(shù)值和語(yǔ)音特征模型庫(kù)中的所有數(shù)值區(qū)間，如果所述數(shù)值處于其中一個(gè)數(shù)值區(qū)間中，則確定語(yǔ)音特征模型庫(kù)中存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，否則，在所述數(shù)值均不處于任一數(shù)值區(qū)間時(shí)，確定語(yǔ)音特征模型庫(kù)中不存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)。
5.根據(jù)權(quán)利要求1至4任一所述的方法,其特征在于,在執(zhí)行動(dòng)作行為時(shí),該方法進(jìn)一步包括:` 識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音，當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí)，結(jié)束所述動(dòng)作行為。
6.—種移動(dòng)終端，其特征在于，所述移動(dòng)終端包括: 存儲(chǔ)單元，用于建立并存儲(chǔ)建立語(yǔ)音特征模型庫(kù)，所述語(yǔ)音特征模型庫(kù)中存在至少一個(gè)用戶的語(yǔ)音特征參數(shù)，并且，該存在的每一語(yǔ)音特征參數(shù)都存在對(duì)應(yīng)的動(dòng)作行為；接收單元，用于接收用戶提供的語(yǔ)音；提取單元，用于對(duì)接收的語(yǔ)音進(jìn)行分析，提取出語(yǔ)音中的語(yǔ)音特征參數(shù)；匹配單元，用于確定語(yǔ)音特征模型庫(kù)中是否存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)；動(dòng)作執(zhí)行單元，用于在所述匹配單元的匹配結(jié)果為是時(shí)，識(shí)別語(yǔ)音特征模型庫(kù)中與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)對(duì)應(yīng)的動(dòng)作行為，執(zhí)行該識(shí)別出的動(dòng)作行為。
7.根據(jù)權(quán)利要求6所述的移動(dòng)終端，其特征在于，所述提取單元包括: 處理子單元，用于對(duì)接收的語(yǔ)音進(jìn)行語(yǔ)音處理，以使處理后的語(yǔ)音反映語(yǔ)音本質(zhì)特征；提取子單元，用于提取經(jīng)過(guò)語(yǔ)音處理后的語(yǔ)音中的語(yǔ)音特征，利用該提取出的語(yǔ)音特征計(jì)算得到一個(gè)數(shù)值作為用于表示所述語(yǔ)音的語(yǔ)音特征參數(shù)。
8.根據(jù)權(quán)利要求7所述的移動(dòng)終端，其特征在于，所述語(yǔ)音特征模型庫(kù)通過(guò)機(jī)器學(xué)習(xí)語(yǔ)音的方式建立，所述語(yǔ)音特征模型庫(kù)中存在的任一語(yǔ)音特征參數(shù)為一個(gè)數(shù)值區(qū)間，其通過(guò)學(xué)習(xí)用戶在兩次以上輸入的語(yǔ)義相同的語(yǔ)音而得到的。
9.根據(jù)權(quán)利要求8所述的移動(dòng)終端，其特征在于，所述匹配單元確定語(yǔ)音特征模型庫(kù)中是否存在與提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)包括: 比較所述數(shù)值和語(yǔ)音特征模型庫(kù)中的所有數(shù)值區(qū)間，如果所述數(shù)值處于其中一個(gè)數(shù)值區(qū)間中，則確定語(yǔ)音特征模型庫(kù)中存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)，否則，在所述數(shù)值均不處于任一數(shù)值區(qū)間時(shí)，確定語(yǔ)音特征模型庫(kù)中不存在與該提取出的語(yǔ)音特征參數(shù)相匹配的語(yǔ)音特征參數(shù)。
10.根據(jù)權(quán)利要求6至9任一所述的移動(dòng)終端，其特征在于，所述移動(dòng)終端進(jìn)一步包括: 控制單元，用于在所述動(dòng)作執(zhí)行單元執(zhí)行動(dòng)作行為時(shí)，識(shí)別針對(duì)所述用戶設(shè)置的結(jié)束控制語(yǔ)音，當(dāng)識(shí)別到所述結(jié)束控制語(yǔ)音時(shí)，結(jié)束所述動(dòng)作行為。
【文檔編號(hào)】G10L15/22GK103778915SQ201210394952
【公開(kāi)日】2014年5月7日申請(qǐng)日期:2012年10月17日優(yōu)先權(quán)日:2012年10月17日
【發(fā)明者】鄧平申請(qǐng)人:三星電子（中國(guó)）研發(fā)中心, 三星電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載