專利名稱:語音控制方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音控制方法及裝置,尤其涉及一種移動設(shè)備的語音控制方法及
>J-U ρ α裝直。
背景技術(shù):
現(xiàn)有技術(shù)中,移動設(shè)備均具有語音控制功能,用戶使用移動設(shè)備上的語音控制(如Apple的Siri, Android的Voice Actions)或語音輸入(如國內(nèi)科大訊飛的語音輸入)功能時,用戶都需要首先按一個按鈕,以通知系統(tǒng)準(zhǔn)備進(jìn)行語音處理。這是因?yàn)檎Z音處理功能 一般都使用了較復(fù)雜的后臺技術(shù)(甚至云計(jì)算),如果移動終端上語音功能一直處于激活狀態(tài),會過多占用系統(tǒng)資源,從而導(dǎo)致系統(tǒng)變慢,功耗升高,或占用過多的網(wǎng)絡(luò)資源等。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)存在的不足,本發(fā)明的目的在于提供一種語音控制方法及裝置,對用戶語音進(jìn)行自動識別,啟動并控制移動設(shè)備的相應(yīng)功能。為實(shí)現(xiàn)上述目的,本發(fā)明提供的語音控制方法,該方法包括以下步驟
O設(shè)置激活語音信息及指令信息;
2)接收用戶語音信息,并激活語音控制模塊;
3)對語音信息進(jìn)行分析、處理,并控制移動設(shè)備相應(yīng)功能模塊的工作。為實(shí)現(xiàn)上述目的,本發(fā)明提供的語音控制裝置,包括語音輸入模塊、語音設(shè)置模塊、功能設(shè)置模塊、語音識別模塊、語音控制模塊、設(shè)備功能模塊,以及存儲器模塊,其中,
所述語音輸入模塊,接收用戶的語音輸入信息;
所述語音設(shè)置模塊,將接收的語音信息預(yù)設(shè)為激活語音信息,并將其存儲到所述存儲器模塊;
功能設(shè)置模塊,將接收的語音信息預(yù)設(shè)為相應(yīng)的移動設(shè)備指令信息,并將所述指令信息與語音控制信息的對應(yīng)列表存儲到所述存儲器模塊;
所述語音識別模塊,對用戶語音信息進(jìn)行識別和判斷,并激活所述語音控制模塊;所述語音控制模塊,從用戶的語音信息中提取并存儲用戶指令信息;對所述用戶指令信息進(jìn)行解析、處理,控制所述設(shè)備功能模塊的工作;
所述設(shè)備功能模塊,用于實(shí)現(xiàn)移動設(shè)備相應(yīng)的功能;
所述存儲器模塊,用于存儲用戶預(yù)設(shè)的激活語音信息、指令信息與語音控制信息的對應(yīng)列表,以及用戶指令信息。本發(fā)明的語音控制方法及裝置,只有在檢查到用戶發(fā)出預(yù)先設(shè)定的語音處理命令時,才能夠激活語音功能,降低了移動設(shè)備的系統(tǒng)功耗,同時提高用戶使用的方便性,而且用戶在使用語音功能時就不需要按過多的操作,從而獲得更好的用戶體驗(yàn)。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,并與本發(fā)明的實(shí)施例一起,用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中
圖1為根據(jù)本發(fā)明的語音控制方法流程 圖2為根據(jù)本發(fā)明的語音控制裝置原理框圖。
具體實(shí)施例方式以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。圖1為根據(jù)本發(fā)明的語音控制方法流程圖,下面將參考圖1,對本發(fā)明的語音控制方法進(jìn)行詳細(xì)描述
首先,在步驟101,移動設(shè)備用戶預(yù)先設(shè)定語音識別模塊能夠準(zhǔn)確識別的激活語音信息,以及控制指定的移動設(shè)備功能模塊的指令信息;例如如果用戶想休息一會兒,可以說“Siri…請?jiān)?0分鐘后叫醒我”,其中“Siri”為用戶預(yù)先設(shè)定的用于通知激活語音功能的簡單發(fā)音(激活語音信息),“請?jiān)?0分鐘后叫醒我”為指令信息;
在步驟102,監(jiān)控并識別用戶的語音信息,在該步驟中,移動設(shè)備通過內(nèi)嵌的麥克風(fēng)等語音輸入模塊接收用戶的語音信息并對其進(jìn)行識別;上述語音信息包括激活語音信息(Siri)和用戶指令信息(請?jiān)?0分鐘后叫醒我);
在步驟103,判斷用戶的語音信息是否包括用戶預(yù)先設(shè)定的激活語音信息,如果沒有則返回步驟102,如果有,則進(jìn)行下一步驟;
在步驟104,激活語音控制模塊;
在步驟105,從用戶的語音信息中提取并存儲用戶指令信息;
在步驟106,對用戶指令信息進(jìn)行解析、處理,生成語音控制信息;該步驟中,是根據(jù)用戶預(yù)先設(shè)定的指令信息與提取的用戶指令信息相比較,生成相應(yīng)的語音控制信息;
在步驟107,根據(jù)語音控制信息,控制移動設(shè)備相應(yīng)功能模塊的工作。圖2為根據(jù)本發(fā)明的語音控制裝置原理框圖,如圖2所示,本發(fā)明的語音控制裝置,包括語音輸入模塊201、語音設(shè)置模塊202、功能設(shè)置模塊203、語音識別模塊204、語音控制模塊205、設(shè)備功能模塊206,以及存儲器模塊207,其中,
語音輸入模塊201,用于接收用戶的語音信息,并分別發(fā)送給語音設(shè)置模塊202、功能設(shè)置模塊203和語音識別模塊204 ;
語音設(shè)置模塊202,根據(jù)用戶的要求,將接收的語音信息預(yù)設(shè)為激活語音信息,并通過語音控制模塊205存儲到存儲器模塊207 ;
功能設(shè)置模塊203,根據(jù)用戶的要求,將接收的語音信息預(yù)設(shè)為相應(yīng)的移動設(shè)備指令信息,并將指令信息與語音控制信息的對應(yīng)列表通過語音控制模塊205存儲到存儲器模塊207 ;
語音識別模塊204,對語音輸入模塊201接收的用戶語音信息進(jìn)行識別和判斷,并激活語音控制模塊205 ;
語音控制模塊205,接收語音識別模塊204的激活指令,從用戶的語音信息中提取并存儲用戶指令信息;對上述用戶指令信息進(jìn)行解析、處理,生成語音控制信息;根據(jù)語音控制信息,控制設(shè)備功能模塊206的工作;
設(shè)備功能模塊206,接收語音控制模塊205的控制,實(shí)現(xiàn)移動設(shè)備相應(yīng)的功能;
存儲器模塊207,用于存儲用戶預(yù)設(shè)的激活語音信息、指令信息與語音控制信息的對應(yīng)列表,以及用戶指令信息。本發(fā)明中,在移動設(shè)備中增加了一個簡單的語音識別模塊,此模塊只能識別用戶自己的幾個固定的(有限的)發(fā)音,并相應(yīng)的執(zhí)行用戶指定的幾個簡單功能。要識別的發(fā)音,可以在預(yù)先設(shè)定并讓此語音識別模塊能準(zhǔn)確識別,由于要識別的樣本非常有限,因此比Siri或訊飛等應(yīng)用大大簡單,從而只需要占用很小的系統(tǒng)資源。讓此模塊一直處于運(yùn)行狀態(tài),并在預(yù)先設(shè)定的語音中,指定一個語音用于通知控制模塊準(zhǔn)備進(jìn)行后續(xù)的語音處理。這樣,當(dāng)語音識別模塊檢查到用戶發(fā)出預(yù)先設(shè)定的語音處理命令時,即可使激活語音功能,處理后續(xù)的用戶發(fā)出的語音。這樣,用戶在使用語音功能時就不需要按過多的操作,從而獲得 更好的用戶體驗(yàn)。使用本發(fā)明的方法及裝置如果用戶想休息一會兒,可以說“Siri…請?jiān)?0分鐘后叫醒我”。在此”Siri”就是上文所說的用戶預(yù)先設(shè)定的用于通知系統(tǒng)激活語音信息。語音識別模塊出Siri后,即啟動語音控制模塊,語音控制模塊隨后處理用戶發(fā)出的”請?jiān)?0分鐘后叫醒我”,并做出相應(yīng)的動作(在移動設(shè)備上設(shè)置一個40分鐘后的鬧鐘)。本領(lǐng)域普通技術(shù)人員可以理解以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實(shí)施例記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種語音控制方法,該方法包括以下步驟 1)設(shè)置激活語音信息及指令信息; 2)接收用戶語音信息,并激活語音控制模塊; 3)對語音信息進(jìn)行分析、處理,并控制移動設(shè)備相應(yīng)功能模塊的工作。
2.根據(jù)權(quán)利要求1所述的語音控制方法,其特征在于,所述步驟2)接收用戶語音信息,并激活語音控制模塊,進(jìn)一步包括以下步驟對所述用戶語音信息進(jìn)行識別;判斷用戶語音信息中是否包含激活語音信息;激活語音控制模塊。
3.根據(jù)權(quán)利要求1所述的語音控制方法,其特征在于,所述步驟3)中對語音信息進(jìn)行分析、處理,是根據(jù)用戶預(yù)先設(shè)定的指令信息與提取的用戶指令信息相比較,生成相應(yīng)的語首控制 目息。
4.一種語音控制裝置,包括語音輸入模塊、語音設(shè)置模塊、功能設(shè)置模塊、語音識別模塊、語音控制模塊、設(shè)備功能模塊,以及存儲器模塊,其特征在于, 所述語音輸入模塊,接收用戶的語音輸入信息; 所述語音設(shè)置模塊,將接收的語音信息預(yù)設(shè)為激活語音信息,并將其存儲到所述存儲器模塊; 功能設(shè)置模塊,將接收的語音信息預(yù)設(shè)為相應(yīng)的移動設(shè)備指令信息,并將所述指令信息與語音控制信息的對應(yīng)列表存儲到所述存儲器模塊; 所述語音識別模塊,對用戶語音信息進(jìn)行識別和判斷,并激活所述語音控制模塊; 所述語音控制模塊,從用戶的語音信息中提取并存儲用戶指令信息;對所述用戶指令信息進(jìn)行解析、處理,控制所述設(shè)備功能模塊的工作; 所述設(shè)備功能模塊,用于實(shí)現(xiàn)移動設(shè)備相應(yīng)的功能; 所述存儲器模塊,用于存儲用戶預(yù)設(shè)的激活語音信息、指令信息與語音控制信息的對應(yīng)列表,以及用戶指令信息。
5.一種移動設(shè)備,其特征在于,所述移動設(shè)備采用權(quán)利要求1-3所述的任一項(xiàng)方法和權(quán)利要求4所述的裝置。
全文摘要
一種語音控制方法及裝置,所述方法包括以下步驟設(shè)置激活語音信息及指令信息;接收用戶語音信息,并激活語音控制模塊;對語音信息進(jìn)行分析、處理,并控制移動設(shè)備相應(yīng)功能模塊的工作。所述裝置包括,語音輸入模塊、語音設(shè)置模塊、功能設(shè)置模塊、語音識別模塊、語音控制模塊、設(shè)備功能模塊,以及存儲器模塊。本發(fā)明的語音控制方法及裝置,降低了移動設(shè)備的系統(tǒng)功耗,同時提高用戶使用的方便性,而且用戶在使用語音功能時就不需要按過多的操作,從而獲得更好的用戶體驗(yàn)。
文檔編號G10L15/26GK103021413SQ201310004430
公開日2013年4月3日 申請日期2013年1月7日 優(yōu)先權(quán)日2013年1月7日
發(fā)明者陳錫源, 鄧焰群 申請人:北京播思軟件技術(shù)有限公司