機器人的語音控制動作系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種機器人的語音控制動作系統(tǒng)該系統(tǒng)包括語音模塊用于接收使用者發(fā)出的語音信息,將其轉化為文字信息并輸出,指令庫模用于接收所述文字信息,并根據(jù)接收到的文字信息選擇指令庫模中存儲的可執(zhí)行命令信息并輸出,控制模塊用于接收所述可執(zhí)行命令信息,并根據(jù)所述可執(zhí)行的命令信息控制執(zhí)行模塊作業(yè),所述可執(zhí)行的命令信息中還包括控制模塊的啟動指令,當所述控制模塊接收到所述控制模塊的啟動指令時,同時接收到麥克接收子模塊傳遞出的語言信息來源的方向信息,并控制執(zhí)行模塊中的移動部、轉動部和攝像部工作,通過分析攝像部捕捉到的畫面,判斷呼叫者的位置,進而再通過移動部控制機器人移動至呼叫者附近。
【專利說明】
機器人的語音控制動作系統(tǒng)
技術領域
[0001]本發(fā)明涉及一種機器人的控制系統(tǒng),具體涉及一種機器人的語音控制動作系統(tǒng)。
【背景技術】
[0002]隨著機器人行業(yè)的迅猛發(fā)展,通過語音來控制的機器人越來越多,也是人們目前主要的研發(fā)方向,目前的語音語音控制機器人對語音的質量及環(huán)境要求較高,當有多人發(fā)出不同的命令時,機器人會響應混亂,而且目前的機器人很少具有與使用者進行互動溝通的功能,其語音比較匱乏,掌握的命令比較單一,能夠執(zhí)行的動作也相應單一,機器人內受到生產(chǎn)成本及空間體積的限制,不能存儲足夠多的命令信息。
[0003]由于上述原因,本發(fā)明人對現(xiàn)有的機器人系統(tǒng)做了深入研究,以便設計出一種能夠解決上述問題的機器人的語音控制動作系統(tǒng)
【發(fā)明內容】
[0004]為了克服上述問題,本發(fā)明人進行了銳意研究,設計出一種機器人的語音控制動作系統(tǒng),該系統(tǒng)包括語音模塊、指令庫模、控制模塊和執(zhí)行模塊,其中,語音模塊用于接收使用者發(fā)出的語音信息,將其轉化為文字信息并輸出,指令庫模用于接收所述文字信息,并根據(jù)接收到的文字信息選擇指令庫模中存儲的可執(zhí)行命令信息并輸出,控制模塊用于接收所述可執(zhí)行命令信息,并根據(jù)所述可執(zhí)行的命令信息控制執(zhí)行模塊作業(yè),所述可執(zhí)行的命令信息中還包括控制模塊的啟動指令,當所述控制模塊接收到所述控制模塊的啟動指令時,同時接收到麥克接收子模塊傳遞出的語言信息來源的方向信息,并控制執(zhí)行模塊中的移動部、轉動部和攝像部工作,通過分析攝像部捕捉到的畫面,判斷呼叫者的位置,進而再通過移動部控制機器人移動至呼叫者附近,從而完成本發(fā)明。
[0005]具體來說,本發(fā)明的目的在于提供以下方面:
[0006](I)—種機器人的語音控制動作系統(tǒng),其特征在于,該系統(tǒng)包括:
[0007]語音模塊001,其用于接收使用者發(fā)出的語音信息,將其轉化為文字信息并輸出,
[0008]指令庫模塊002,其用于接收所述文字信息,并根據(jù)接收到的文字信息選擇指令庫模中存儲的可執(zhí)行命令信息并輸出,
[0009]和
[0010]控制模塊003,其用于接收所述可執(zhí)行命令信息,并根據(jù)所述可執(zhí)行命令信息控制執(zhí)行模塊004作業(yè)。
[0011](2)根據(jù)上述(I)所述的機器人的語音控制動作系統(tǒng),其特征在于,所述語音模塊001包括:
[0012]麥克接收子模塊011,其用于接收語音信息,并將接收到的語音信息轉換為音波信號,
[0013]音頻轉換子模塊012,其用于接收音波信號并將其轉換為音頻文件,和
[0014]文字轉換子模塊013,其用于接收音頻文件并將其轉換成文字信息。
[0015](3)根據(jù)上述(2)所述的機器人的語音控制動作系統(tǒng),其特征在于,所述麥克接收子模塊011在接收語音信息的同時還用于探測該語言信息來源的空間方向,并將該方向信息傳遞至控制模塊003。
[0016](4)根據(jù)上述(I)所述的機器人的語音控制動作系統(tǒng),其特征在于,所述指令庫模塊002中存儲有預存的命令信息,當所接收到的文字信息與命令信息一致時,將所述命令信息作為可執(zhí)行的命令信息,并將其傳遞至控制模塊。
[0017](5)根據(jù)上述(I)所述的機器人的語音控制動作系統(tǒng),其特征在于,所述執(zhí)行模塊004包括移動部041、轉動部042、發(fā)聲部043、攝像部044和測距部045;
[0018]優(yōu)選地,所述移動部041設置在機器人的底部,用于實現(xiàn)機器人的轉向和行走,
[0019]所述轉動部042用于實現(xiàn)機器人的頭部轉動,
[0020]所述發(fā)聲部043用于發(fā)聲,
[0021]所述攝像部044設置在機器人的頭部,捕捉畫面,并將捕捉到的畫面?zhèn)鬟f至控制模塊;
[0022]所述測距部045用于感應/測量機器人與其他障礙物或者物體之間的距離。
[0023](6)根據(jù)上述(I)所述的機器人的語音控制動作系統(tǒng),其特征在于,所述可執(zhí)行命令信息中還包括控制模塊003的啟動指令,用于啟動控制模塊003。
[0024](7)根據(jù)上述(I)所述的機器人的語音控制動作系統(tǒng),其特征在于,當所述控制模塊003接收到所述控制模塊的啟動指令時,同時接收到麥克接收子模塊011傳遞出的語言信息來源的方向信息,并控制執(zhí)行模塊中的移動部041、轉動部042和攝像部044工作,通過分析攝像部044捕捉到的畫面,判斷呼叫者的位置,進而再通過移動部041控制機器人移動至呼叫者附近。
[0025](8)根據(jù)上述(7)所述的機器人的語音控制動作系統(tǒng),其特征在于,在此過程中所述述控制模塊003還控制發(fā)聲部043播放預存的音頻文件。
[0026](9)根據(jù)上述(7)所述的機器人的語音控制動作系統(tǒng),其特征在于,當所述攝像部044捕捉到的畫面中具有多個人時,選定距離最近的人作為呼叫者。
[0027](10)根據(jù)上述(7)所述的機器人的語音控制動作系統(tǒng),其特征在于,所述控制模塊在選定呼叫者以后,繼續(xù)接收指令庫模塊傳遞出的可執(zhí)行命令信息,同時接收麥克接收子模塊011傳遞出的語言信息來源的方向信息,當所述聲音的來源方向與呼叫者的方向一致時執(zhí)行所述可執(zhí)行命令信息,當方向不一致時,忽略該可執(zhí)行命令信息。
[0028]本發(fā)明所具有的有益效果包括:
[0029](I)根據(jù)本發(fā)明提供的機器人的語音控制動作系統(tǒng),其能夠在有多人說話干擾時執(zhí)行特定的使用者的命令,而忽略其他人的呼叫命令;
[0030](2)根據(jù)本發(fā)明提供的機器人的語音控制動作系統(tǒng),其能夠通過簡單的語音溝通確認呼叫者,并對呼叫者的語言命令作出反應。
【附圖說明】
[0031]圖1示出根據(jù)本發(fā)明一種優(yōu)選實施方式的機器人的語音控制動作系統(tǒng)整體結構示意圖;
[0032]圖2示出根據(jù)本發(fā)明一種優(yōu)選實施方式的機器人的語音控制動作系統(tǒng)的轉動部結構示意圖。
[0033]附圖標號說明:
[0034]001-語音模塊
[0035]011-麥克接收子模塊
[0036]012-音頻轉換子模塊
[0037]013-文字轉換子模塊
[0038]002-指令庫模塊
[0039]003-控制模塊
[0040]004-執(zhí)行模塊[0041 ]041-移動部
[0042]042-轉動部
[0043]043-發(fā)聲部
[0044]044-攝像部
[0045]045-測距部
[0046]5-主軸
[0047]51-電機
[0048]6-頭部
[0049]71-第一軸承
[0050]72-第二軸承[0051 ]8-軀干
[0052]91-第一減速齒輪
[0053]92-第二減速齒輪
【具體實施方式】
[0054]下面通過附圖和實施例對本發(fā)明進一步詳細說明。通過這些說明,本發(fā)明的特點和優(yōu)點將變得更為清楚明確。
[0055]在這里專用的詞“示例性”意為“用作例子、實施例或說明性”。這里作為“示例性”所說明的任何實施例不必解釋為優(yōu)于或好于其它實施例。盡管在附圖中示出了實施例的各種方面,但是除非特別指出,不必按比例繪制附圖。
[0056]根據(jù)本發(fā)明提供的機器人的語音控制動作系統(tǒng),如圖1中所示,該系統(tǒng)包括語音模塊001、指令庫模塊002、控制模塊003和執(zhí)行模塊004,其中,所述語音模塊001包括麥克接收子模塊011、音頻轉換子模塊012和文字轉換子模塊013;所述指令庫模塊002中存儲有預存的命令信息,并根據(jù)接收到的信息調出相應的命令信息,傳給控制模塊003,所述控制模塊根據(jù)接收到的命令控制執(zhí)行模塊004作業(yè)。
[0057]在一個優(yōu)選的實施方式中,所述麥克接收子模塊011用于接收語音信息,并將接收到的語音信息轉換為音波信號,所述音頻轉換子模塊012用于接收音波信號并將其轉換為音頻文件,所述文字轉換子模塊013用于接收音頻文件并將其轉換成文字信息。
[0058]進一步優(yōu)選地,所述麥克接收子模塊011在接收語音信息的同時還用于探測該語言信息來源的空間方向,并將該空間方向信息傳遞至控制模塊003,本發(fā)明中所述的方向就是指所述空間方向,所述聲音來源的方向是以機器人所在位置為參考點的,即是對于該機器人來說的方向。
[0059]在一個優(yōu)選的實施方式中,所述指令庫模塊002中存儲有預存的命令信息,該信息是以文字的形式存儲的,并可據(jù)此對接收到的文字信息進行篩選,從中篩選出可執(zhí)行命令信息并將其傳遞至控制模塊,具體來說,通過比較輸入的文字信息和預存的命令信息的匹配/吻合程度,若吻合一致則提取出該預存的命令信息/文字信息,作為可執(zhí)行命令信息,并發(fā)出,若未發(fā)現(xiàn)與之一致的預存的命令信息,則忽略該接收到的文字信息。
[0060]在一個優(yōu)選的實施方式中,所述控制模塊用于接收命令信息,并根據(jù)所述命令信息控制執(zhí)行模塊004作業(yè),具體來說是根據(jù)接收到的不同的命令信息控制相應的執(zhí)行模塊執(zhí)行該命令。
[0061]在一個優(yōu)選的實施方式中,所述可執(zhí)行命令信息中還包括控制模塊的啟動指令,其用于啟動控制模塊003該啟動指令優(yōu)選地為機器人的名字,或者其他的預存信息,如將該機器人的名字命名為“多啦A夢”,當所述控指令庫模塊接收到內容為“多啦A夢”的文字信息時,向所述控制模塊發(fā)出所述控制模塊的啟動指令。
[0062]在一個優(yōu)選的實施方式中,執(zhí)行模塊004包括機器人底部的移動部041、機器人頭部的轉動部042、發(fā)聲部043、攝像部044和利用光學/聲波進行工作的測距部045,所述移動部041用于實現(xiàn)機器人整體轉動和移動,所述轉動部042用于實現(xiàn)機器人頭部轉動,所述發(fā)聲部043用于發(fā)出聲音與使用者交流,所述攝像部044設置在機器人的頭部,優(yōu)選的設置在其正前方,用于通過攝像頭捕捉畫面,并將捕捉到的畫面?zhèn)鬟f至控制模塊,所述測距部045用于感應/測量機器人與其他障礙物或者物體、人體等之間的距離,以便于控制機器人移動到適宜的位置并且避免在行進過程中碰撞到障礙物或者人體。
[0063]在一個優(yōu)選的實施方式中,當所述控制模塊003接收到所述控制模塊的啟動指令時,同時接收麥克接收子模塊011傳遞出的聲音來源的方向,并控制執(zhí)行模塊中的移動部041、轉動部042和攝像部044工作,直至所述機器人的頭部朝向聲音來源的方向,并且接收攝像部044捕捉到的畫面,并對該畫面進行分析,判斷呼叫者的位置,所述呼叫者為發(fā)出所述啟動指令(如呼叫機器人的名字)的人,進而再通過移動部041控制機器人移動至呼叫者附近的預定位置。本發(fā)明中所述的使用者與呼叫者含義相同,都是指代與機器人進行溝通的人。
[0064]其中,優(yōu)選地,在此過程中還可以控制發(fā)聲部043發(fā)出預存的音頻文件,所述預存的音頻文件包用于括確認呼叫者的音頻文件和進一步溝通的音頻文件,所述確認呼叫者的音頻文件中包括“是你叫我嗎”、“叫我做什么”等等,所述進一步溝通的音頻文件中包括“誰在叫我”等等。
[0065]進一步優(yōu)選地,當所述攝像部044捕捉到的畫面中具有多個人而無法確定呼叫者時,可以通過發(fā)聲部043播放進一步溝通的音頻文件來做進一步確認,也可以選定距離最近的人作為呼叫者。
[0066]在一個優(yōu)選的實施方式中,所述控制模塊接收到所述控制模塊的啟動指令后,首先通過轉動部旋轉機器人的頭部來使得攝像部捕獲到呼叫者,如果能夠捕獲到呼叫者則選定呼叫者,如果通過轉動部旋轉機器人的頭部未能使得攝像部捕獲到呼叫者,則通過移動部控制機器人轉身,即旋轉180度,再通過轉動部旋轉機器人的頭部來使得攝像部捕獲到呼叫者。
[0067]在另一個優(yōu)選的實施方式中,所述控制模塊003接收到所述控制模塊的啟動指令時,同時接收麥克接收子模塊傳遞出的聲音來源的方向,并根據(jù)所述方向信息和機器人當前的正面朝向,判斷計算通過轉動部旋轉機器人的頭部能否使得攝像部捕獲到呼叫者,如果可以,則只啟動轉動部,如果不能,則轉動部和移動部冋時啟動。
[0068]在一個優(yōu)選的實施方式中,所述機器人的語音控制動作系統(tǒng)中的控制模塊在選定呼叫者以后會繼續(xù)接收指令庫模塊傳遞出的命令信息,同時接收麥克接收子模塊判斷出的聲音的來源方向信息,當所述聲音的來源方向信息與呼叫者的方向一致時執(zhí)行該命令信息,如果所述方向不一致時,忽略該命令信息,所述執(zhí)行該命令信息是通過控制模塊控制所述執(zhí)行模塊來完成的,所述執(zhí)行模塊還可以包括顯示屏、投影儀、移動終端等。
[0069]在一個優(yōu)選的實施方式中,所述機器人的語音控制動作系統(tǒng)中大部分模塊都設置在機器人中,還有一部分設置在云端中,機器人中和云端中的部件通過網(wǎng)絡連通傳遞信息,優(yōu)選地,語音模塊中的麥克接收子模塊、音頻轉換子模塊和控制模塊、執(zhí)行模塊都設置在機器人中,所述指令庫模塊設置在云端中,所述文字轉換子模塊既可以設置在云端中,也可以設置在機器人中,可根據(jù)具體情況進行選擇。
[0070]在一個優(yōu)選的實施方式中,所述指令庫中的信息是可以實時更新的,可以將不同或類似的文字信息對應同一個命令信息,也可以向其中存儲新的命令信息,所述控制模塊通過網(wǎng)絡與控制終端連接,所述控制終端可以是使用者的手機、電腦等終端,也可以是維護方,通過控制終端向其中輸入與所述新的命令信息相對應的命令執(zhí)行過程。
[0071]在一個優(yōu)選的實施方式中,所述移動部安裝在機器人的底部,用于控制機器人的移動和轉動,其可以是肢體也可以是滾輪,還可以是多種移動方式的組合體,所述轉動部用于控制機器人頭部相對于軀干部旋轉,其可以控制機器人向兩側旋轉預定角度,所述發(fā)聲部包括音箱喇叭,也可以包括聲音編輯系統(tǒng),可以將文件信息轉換為聲音并發(fā)出,所述攝像部包括攝像頭,即可以錄像又能照相,還能夠處理捕獲到的圖像。
[0072]本發(fā)明中,所述控制模塊是計算芯片或者稱之為電路板,其可以是集合在一起的一塊電路板,也可以分為多塊電路板,以實現(xiàn)不同的功能。
[0073]在一個優(yōu)選的實施方式中,所述頭部設置在機器人的軀干上,如圖1中所示,所述轉動部042包括主軸5,所述機器人的頭部6固定安裝在所述主軸5的上部,所述主軸5從上至下依次穿過第一軸承71和第二軸承72,并通過所述第一軸承和第二軸承可旋轉地固定在機器人的軀干8上,從而使得其上的頭部可旋轉地安裝在機器人的軀干上,從而實現(xiàn)機器人的頭部轉動;所述主軸5的下部與電機51相連即在電機的帶動下,頭部隨著主軸的旋轉而相對于軀干轉動。
[0074]在一個優(yōu)選的實施方式中,如圖1中所不,在所述電機51的轉子上安裝有第一減速齒輪91,在主軸5的下部設置有第二減速齒輪92,所述第二減速齒輪與主軸固結,能夠帶動主軸旋轉,所述第一減速齒輪與所述第二減速齒輪互相嚙合,從而實現(xiàn)通過電機控制主軸的旋轉。
[0075]在一個優(yōu)選的實施方式中,所述電機為渦輪電機。
[0076]在一個優(yōu)選的實施方式中,所述電機可以往復旋轉,其向每一個方向都只能旋轉預定的轉數(shù)/圈數(shù),從而使得所述頭部只能向每個方向旋轉預定角度,使得機器人更為人性化,也能防止頭部及軀干部的結構零件或者導線因為頭部旋轉角度過大而損壞,提高機器人的使用壽命和安全性。
[0077]以上結合了優(yōu)選的實施方式對本發(fā)明進行了說明,不過這些實施方式僅是范例性的,僅起到說明性的作用。在此基礎上,可以對本發(fā)明進行多種替換和改進,這些均落入本發(fā)明的保護范圍內。
【主權項】
1.一種機器人的語音控制動作系統(tǒng),其特征在于,該系統(tǒng)包括: 語音模塊(001),其用于接收使用者發(fā)出的語音信息,將其轉化為文字信息并輸出, 指令庫模塊(002),其用于接收所述文字信息,并根據(jù)接收到的文字信息選擇指令庫模中存儲的可執(zhí)行命令信息并輸出, 和 控制模塊(003),其用于接收所述可執(zhí)行命令信息,并根據(jù)所述可執(zhí)行命令信息控制執(zhí)行模塊(004)作業(yè)。2.根據(jù)權利要求1所述的機器人的語音控制動作系統(tǒng),其特征在于,所述語音模塊(001)包括: 麥克接收子模塊(011),其用于接收語音信息,并將接收到的語音信息轉換為音波信號, 音頻轉換子模塊(012),其用于接收音波信號并將其轉換為音頻文件,和 文字轉換子模塊(013),其用于接收音頻文件并將其轉換成文字信息。3.根據(jù)權利要求2所述的機器人的語音控制動作系統(tǒng),其特征在于,所述麥克接收子模塊(011)在接收語音信息的同時還用于探測該語言信息來源的空間方向,并將該方向信息傳遞至控制模塊(003)。4.根據(jù)權利要求1所述的機器人的語音控制動作系統(tǒng),其特征在于,所述指令庫模塊(002)中存儲有預存的命令信息,當所接收到的文字信息與命令信息一致時,將所述命令信息作為可執(zhí)行的命令信息,并將其傳遞至控制模塊。5.根據(jù)權利要求1所述的機器人的語音控制動作系統(tǒng),其特征在于,所述執(zhí)行模塊(004)包括移動部(041)、轉動部(042)、發(fā)聲部(043)、攝像部(044)和測距部(045); 優(yōu)選地,所述移動部(041)設置在機器人的底部,用于實現(xiàn)機器人的轉向和行走, 所述轉動部(042)用于實現(xiàn)機器人的頭部轉動, 所述發(fā)聲部(043)用于發(fā)聲, 所述攝像部(044)設置在機器人的頭部,捕捉畫面,并將捕捉到的畫面?zhèn)鬟f至控制模塊; 所述測距部(045)用于感應/測量機器人與其他障礙物或者物體之間的距離。6.根據(jù)權利要求1所述的機器人的語音控制動作系統(tǒng),其特征在于,所述可執(zhí)行命令信息中還包括控制t旲塊(003)的啟動指令,用于啟動控制t旲塊(003)。7.根據(jù)權利要求1所述的機器人的語音控制動作系統(tǒng),其特征在于,當所述控制模塊(003)接收到所述控制模塊的啟動指令時,同時接收到麥克接收子模塊(011)傳遞出的語言信息來源的方向信息,并控制執(zhí)行模塊中的移動部(041 )、轉動部(042)和攝像部(044)工作,通過分析攝像部(044)捕捉到的畫面,判斷呼叫者的位置,進而再通過移動部(041)控制機器人移動至呼叫者附近。8.根據(jù)權利要求7所述的機器人的語音控制動作系統(tǒng),其特征在于,在此過程中所述述控制模塊(003)還控制發(fā)聲部(043)播放預存的音頻文件。9.根據(jù)權利要求7所述的機器人的語音控制動作系統(tǒng),其特征在于,當所述攝像部(044)捕捉到的畫面中具有多個人時,選定距離最近的人作為呼叫者。10.根據(jù)權利要求7所述的機器人的語音控制動作系統(tǒng),其特征在于,所述控制模塊在選定呼叫者以后,繼續(xù)接收指令庫模塊傳遞出的可執(zhí)行命令信息,同時接收麥克接收子模塊(Oll)傳遞出的語言信息來源的方向信息,當所述聲音的來源方向與呼叫者的方向一致時執(zhí)行所述可執(zhí)行命令信息,當方向不一致時,忽略該可執(zhí)行命令信息。
【文檔編號】B25J13/00GK105856261SQ201610362088
【公開日】2016年8月17日
【申請日】2016年5月26日
【發(fā)明人】王帥
【申請人】王帥