語音控制方法及裝置的制作方法

文檔序號：2834924閱讀：300來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音控制方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語音控制方法及裝置，尤其涉及一種移動設(shè)備的語音控制方法及
>J-U ρ α裝直。
背景技術(shù)：
現(xiàn)有技術(shù)中，移動設(shè)備均具有語音控制功能，用戶使用移動設(shè)備上的語音控制(如Apple的Siri, Android的Voice Actions)或語音輸入(如國內(nèi)科大訊飛的語音輸入)功能時，用戶都需要首先按一個按鈕，以通知系統(tǒng)準(zhǔn)備進(jìn)行語音處理。這是因?yàn)檎Z音處理功能一般都使用了較復(fù)雜的后臺技術(shù)(甚至云計(jì)算)，如果移動終端上語音功能一直處于激活狀態(tài)，會過多占用系統(tǒng)資源，從而導(dǎo)致系統(tǒng)變慢，功耗升高，或占用過多的網(wǎng)絡(luò)資源等。

發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)存在的不足，本發(fā)明的目的在于提供一種語音控制方法及裝置，對用戶語音進(jìn)行自動識別，啟動并控制移動設(shè)備的相應(yīng)功能。為實(shí)現(xiàn)上述目的，本發(fā)明提供的語音控制方法，該方法包括以下步驟
O設(shè)置激活語音信息及指令信息；
2)接收用戶語音信息，并激活語音控制模塊；
3)對語音信息進(jìn)行分析、處理，并控制移動設(shè)備相應(yīng)功能模塊的工作。為實(shí)現(xiàn)上述目的，本發(fā)明提供的語音控制裝置，包括語音輸入模塊、語音設(shè)置模塊、功能設(shè)置模塊、語音識別模塊、語音控制模塊、設(shè)備功能模塊，以及存儲器模塊，其中，
所述語音輸入模塊，接收用戶的語音輸入信息；
所述語音設(shè)置模塊，將接收的語音信息預(yù)設(shè)為激活語音信息，并將其存儲到所述存儲器模塊；
功能設(shè)置模塊，將接收的語音信息預(yù)設(shè)為相應(yīng)的移動設(shè)備指令信息，并將所述指令信息與語音控制信息的對應(yīng)列表存儲到所述存儲器模塊；
所述語音識別模塊，對用戶語音信息進(jìn)行識別和判斷，并激活所述語音控制模塊；所述語音控制模塊，從用戶的語音信息中提取并存儲用戶指令信息；對所述用戶指令信息進(jìn)行解析、處理，控制所述設(shè)備功能模塊的工作；
所述設(shè)備功能模塊，用于實(shí)現(xiàn)移動設(shè)備相應(yīng)的功能；
所述存儲器模塊，用于存儲用戶預(yù)設(shè)的激活語音信息、指令信息與語音控制信息的對應(yīng)列表，以及用戶指令信息。本發(fā)明的語音控制方法及裝置，只有在檢查到用戶發(fā)出預(yù)先設(shè)定的語音處理命令時，才能夠激活語音功能，降低了移動設(shè)備的系統(tǒng)功耗，同時提高用戶使用的方便性，而且用戶在使用語音功能時就不需要按過多的操作，從而獲得更好的用戶體驗(yàn)。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實(shí)施本發(fā)明而了解。

附圖用來提供對本發(fā)明的進(jìn)一步理解，并且構(gòu)成說明書的一部分，并與本發(fā)明的實(shí)施例一起，用于解釋本發(fā)明，并不構(gòu)成對本發(fā)明的限制。在附圖中
圖1為根據(jù)本發(fā)明的語音控制方法流程圖2為根據(jù)本發(fā)明的語音控制裝置原理框圖。
具體實(shí)施例方式以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明，應(yīng)當(dāng)理解，此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明，并不用于限定本發(fā)明。圖1為根據(jù)本發(fā)明的語音控制方法流程圖，下面將參考圖1，對本發(fā)明的語音控制方法進(jìn)行詳細(xì)描述
首先，在步驟101，移動設(shè)備用戶預(yù)先設(shè)定語音識別模塊能夠準(zhǔn)確識別的激活語音信息，以及控制指定的移動設(shè)備功能模塊的指令信息；例如如果用戶想休息一會兒，可以說“Siri…請?jiān)?0分鐘后叫醒我”，其中“Siri”為用戶預(yù)先設(shè)定的用于通知激活語音功能的簡單發(fā)音(激活語音信息)，“請?jiān)?0分鐘后叫醒我”為指令信息；
在步驟102，監(jiān)控并識別用戶的語音信息，在該步驟中，移動設(shè)備通過內(nèi)嵌的麥克風(fēng)等語音輸入模塊接收用戶的語音信息并對其進(jìn)行識別；上述語音信息包括激活語音信息(Siri)和用戶指令信息(請?jiān)?0分鐘后叫醒我)；
在步驟103，判斷用戶的語音信息是否包括用戶預(yù)先設(shè)定的激活語音信息，如果沒有則返回步驟102，如果有，則進(jìn)行下一步驟；
在步驟104，激活語音控制模塊；
在步驟105，從用戶的語音信息中提取并存儲用戶指令信息；
在步驟106，對用戶指令信息進(jìn)行解析、處理，生成語音控制信息；該步驟中，是根據(jù)用戶預(yù)先設(shè)定的指令信息與提取的用戶指令信息相比較，生成相應(yīng)的語音控制信息；
在步驟107，根據(jù)語音控制信息，控制移動設(shè)備相應(yīng)功能模塊的工作。圖2為根據(jù)本發(fā)明的語音控制裝置原理框圖，如圖2所示，本發(fā)明的語音控制裝置，包括語音輸入模塊201、語音設(shè)置模塊202、功能設(shè)置模塊203、語音識別模塊204、語音控制模塊205、設(shè)備功能模塊206，以及存儲器模塊207，其中，
語音輸入模塊201，用于接收用戶的語音信息，并分別發(fā)送給語音設(shè)置模塊202、功能設(shè)置模塊203和語音識別模塊204 ；
語音設(shè)置模塊202，根據(jù)用戶的要求，將接收的語音信息預(yù)設(shè)為激活語音信息，并通過語音控制模塊205存儲到存儲器模塊207 ；
功能設(shè)置模塊203，根據(jù)用戶的要求，將接收的語音信息預(yù)設(shè)為相應(yīng)的移動設(shè)備指令信息，并將指令信息與語音控制信息的對應(yīng)列表通過語音控制模塊205存儲到存儲器模塊207 ；
語音識別模塊204，對語音輸入模塊201接收的用戶語音信息進(jìn)行識別和判斷，并激活語音控制模塊205 ；
語音控制模塊205，接收語音識別模塊204的激活指令，從用戶的語音信息中提取并存儲用戶指令信息；對上述用戶指令信息進(jìn)行解析、處理，生成語音控制信息；根據(jù)語音控制信息，控制設(shè)備功能模塊206的工作；
設(shè)備功能模塊206，接收語音控制模塊205的控制，實(shí)現(xiàn)移動設(shè)備相應(yīng)的功能；
存儲器模塊207，用于存儲用戶預(yù)設(shè)的激活語音信息、指令信息與語音控制信息的對應(yīng)列表，以及用戶指令信息。本發(fā)明中，在移動設(shè)備中增加了一個簡單的語音識別模塊，此模塊只能識別用戶自己的幾個固定的(有限的)發(fā)音，并相應(yīng)的執(zhí)行用戶指定的幾個簡單功能。要識別的發(fā)音，可以在預(yù)先設(shè)定并讓此語音識別模塊能準(zhǔn)確識別，由于要識別的樣本非常有限，因此比Siri或訊飛等應(yīng)用大大簡單，從而只需要占用很小的系統(tǒng)資源。讓此模塊一直處于運(yùn)行狀態(tài)，并在預(yù)先設(shè)定的語音中，指定一個語音用于通知控制模塊準(zhǔn)備進(jìn)行后續(xù)的語音處理。這樣，當(dāng)語音識別模塊檢查到用戶發(fā)出預(yù)先設(shè)定的語音處理命令時，即可使激活語音功能，處理后續(xù)的用戶發(fā)出的語音。這樣，用戶在使用語音功能時就不需要按過多的操作，從而獲得更好的用戶體驗(yàn)。使用本發(fā)明的方法及裝置如果用戶想休息一會兒，可以說“Siri…請?jiān)?0分鐘后叫醒我”。在此”Siri”就是上文所說的用戶預(yù)先設(shè)定的用于通知系統(tǒng)激活語音信息。語音識別模塊出Siri后，即啟動語音控制模塊，語音控制模塊隨后處理用戶發(fā)出的”請?jiān)?0分鐘后叫醒我”，并做出相應(yīng)的動作(在移動設(shè)備上設(shè)置一個40分鐘后的鬧鐘)。本領(lǐng)域普通技術(shù)人員可以理解以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已，并不用于限制本發(fā)明，盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明，對于本領(lǐng)域的技術(shù)人員來說，其依然可以對前述各實(shí)施例記載的技術(shù)方案進(jìn)行修改，或者對其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種語音控制方法，該方法包括以下步驟 1)設(shè)置激活語音信息及指令信息； 2)接收用戶語音信息，并激活語音控制模塊； 3)對語音信息進(jìn)行分析、處理，并控制移動設(shè)備相應(yīng)功能模塊的工作。
2.根據(jù)權(quán)利要求1所述的語音控制方法，其特征在于，所述步驟2)接收用戶語音信息，并激活語音控制模塊，進(jìn)一步包括以下步驟對所述用戶語音信息進(jìn)行識別；判斷用戶語音信息中是否包含激活語音信息；激活語音控制模塊。
3.根據(jù)權(quán)利要求1所述的語音控制方法，其特征在于，所述步驟3)中對語音信息進(jìn)行分析、處理，是根據(jù)用戶預(yù)先設(shè)定的指令信息與提取的用戶指令信息相比較，生成相應(yīng)的語首控制目息。
4.一種語音控制裝置，包括語音輸入模塊、語音設(shè)置模塊、功能設(shè)置模塊、語音識別模塊、語音控制模塊、設(shè)備功能模塊，以及存儲器模塊，其特征在于，所述語音輸入模塊，接收用戶的語音輸入信息；所述語音設(shè)置模塊，將接收的語音信息預(yù)設(shè)為激活語音信息，并將其存儲到所述存儲器模塊；功能設(shè)置模塊，將接收的語音信息預(yù)設(shè)為相應(yīng)的移動設(shè)備指令信息，并將所述指令信息與語音控制信息的對應(yīng)列表存儲到所述存儲器模塊；所述語音識別模塊，對用戶語音信息進(jìn)行識別和判斷，并激活所述語音控制模塊；所述語音控制模塊，從用戶的語音信息中提取并存儲用戶指令信息；對所述用戶指令信息進(jìn)行解析、處理，控制所述設(shè)備功能模塊的工作；所述設(shè)備功能模塊，用于實(shí)現(xiàn)移動設(shè)備相應(yīng)的功能；所述存儲器模塊，用于存儲用戶預(yù)設(shè)的激活語音信息、指令信息與語音控制信息的對應(yīng)列表，以及用戶指令信息。
5.一種移動設(shè)備，其特征在于，所述移動設(shè)備采用權(quán)利要求1-3所述的任一項(xiàng)方法和權(quán)利要求4所述的裝置。
全文摘要
一種語音控制方法及裝置，所述方法包括以下步驟設(shè)置激活語音信息及指令信息；接收用戶語音信息，并激活語音控制模塊；對語音信息進(jìn)行分析、處理，并控制移動設(shè)備相應(yīng)功能模塊的工作。所述裝置包括，語音輸入模塊、語音設(shè)置模塊、功能設(shè)置模塊、語音識別模塊、語音控制模塊、設(shè)備功能模塊，以及存儲器模塊。本發(fā)明的語音控制方法及裝置，降低了移動設(shè)備的系統(tǒng)功耗，同時提高用戶使用的方便性，而且用戶在使用語音功能時就不需要按過多的操作，從而獲得更好的用戶體驗(yàn)。
文檔編號G10L15/26GK103021413SQ201310004430
公開日2013年4月3日申請日期2013年1月7日優(yōu)先權(quán)日2013年1月7日
發(fā)明者陳錫源, 鄧焰群申請人:北京播思軟件技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載