本發(fā)明涉及人工智能,尤其涉及一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人。
背景技術(shù):
1、隨著智能家居技術(shù)的快速發(fā)展,家庭環(huán)境中的自動(dòng)化和智能化設(shè)備日益增多。在眾多智能家居設(shè)備中,養(yǎng)老機(jī)器人,如掃地機(jī)器人,因其自動(dòng)化清潔功能而受到廣泛應(yīng)用。目前,養(yǎng)老機(jī)器人還增加了語(yǔ)音控制的功能,在養(yǎng)老機(jī)器人的機(jī)身上裝載麥克風(fēng)和語(yǔ)音模塊,用于接收使用者語(yǔ)音控制指令并轉(zhuǎn)化為對(duì)應(yīng)的機(jī)器指令,根據(jù)語(yǔ)音指令做出相應(yīng)的動(dòng)作,給用戶提供了不少便利。然而,由于養(yǎng)老機(jī)器人機(jī)身上的各種電機(jī)在工作時(shí)會(huì)產(chǎn)生較大的噪聲,用戶在對(duì)養(yǎng)老機(jī)器人發(fā)出語(yǔ)音指令時(shí)很容易受到這些噪聲的干擾,導(dǎo)致養(yǎng)老機(jī)器人不能很好的接收到指令并對(duì)指令做出相應(yīng)的響應(yīng)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人,用以解決現(xiàn)有技術(shù)中養(yǎng)老機(jī)器人機(jī)身上的電機(jī)在工作時(shí)產(chǎn)生較大的噪聲,影響?zhàn)B老機(jī)器人接收語(yǔ)音指令的問(wèn)題,即使在設(shè)備運(yùn)行時(shí)產(chǎn)生的噪聲環(huán)境中,用戶也能夠通過(guò)語(yǔ)音指令有效地與養(yǎng)老機(jī)器人進(jìn)行交互,增強(qiáng)了用戶體驗(yàn)。
2、第一方面,本發(fā)明提供一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,應(yīng)用于養(yǎng)老機(jī)器人,所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元,所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型,所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法包括:
3、獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào);
4、基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取所述第一聲音信號(hào)中的第一人聲信號(hào),其中,所述人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到,所述第二麥克風(fēng)安裝于所述養(yǎng)老機(jī)器人的基站或與所述養(yǎng)老機(jī)器人關(guān)聯(lián)的終端;所述第一人聲信號(hào)是基于人聲提取模型對(duì)所述第一聲音信號(hào)提取得到;
5、基于所述第一人聲信號(hào)確定語(yǔ)音控制指令,并根據(jù)所述語(yǔ)音控制指令控制所述養(yǎng)老機(jī)器人。
6、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,所述基于所述第一人聲信號(hào)確定語(yǔ)音控制指令,包括:
7、獲取與所述第一聲音信號(hào)同時(shí)采集的第三聲音信號(hào),所述第三聲音信號(hào)通過(guò)所述第二麥克風(fēng)采集;
8、提取所述第三聲音信號(hào)中的第三人聲信號(hào),并基于所述第一人聲信號(hào)與所述第三人聲信號(hào)的信號(hào)強(qiáng)度,確定待識(shí)別的人聲信號(hào);
9、對(duì)所述待識(shí)別的人聲信號(hào)進(jìn)行語(yǔ)音識(shí)別,得到語(yǔ)音識(shí)別結(jié)果;
10、根據(jù)所述語(yǔ)音識(shí)別結(jié)果確定語(yǔ)音控制指令。
11、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
12、根據(jù)所述第一聲音信號(hào)與所述第三聲音信號(hào)進(jìn)行聲源定位,得到聲源位置;
13、控制所述養(yǎng)老機(jī)器人前往所述聲源位置。
14、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,所述存儲(chǔ)單元中人聲特征的存儲(chǔ)步驟包括:
15、獲取通過(guò)所述第二麥克風(fēng)采集的第二聲音信號(hào);
16、將所述第二聲音信號(hào)輸入至預(yù)先訓(xùn)練的人聲特征提取模型,得到所述第二聲音信號(hào)中的人聲特征,所述人聲特征提取模型基于無(wú)監(jiān)督學(xué)習(xí)算法訓(xùn)練得到;
17、確定存儲(chǔ)單元中是否已存儲(chǔ)所述人聲特征;
18、若否,則存儲(chǔ)所述人聲特征至所述存儲(chǔ)單元。
19、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
20、響應(yīng)于通過(guò)養(yǎng)老機(jī)器人內(nèi)置的通信模塊接收到通話請(qǐng)求,發(fā)出語(yǔ)音提示,所述語(yǔ)音提示用于提醒用戶有待接聽(tīng)的通話;
21、獲取用戶針對(duì)所述語(yǔ)音提示做出的語(yǔ)音響應(yīng);
22、根據(jù)所述語(yǔ)音響應(yīng)確定用戶位置;
23、控制所述養(yǎng)老機(jī)器人移動(dòng)到所述用戶位置,等待用戶接聽(tīng)通話。
24、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
25、若在預(yù)設(shè)時(shí)間內(nèi)沒(méi)有獲取到用戶針對(duì)所述語(yǔ)音提示做出的語(yǔ)音響應(yīng),根據(jù)所述養(yǎng)老機(jī)器人中存儲(chǔ)的室內(nèi)地圖以及云端預(yù)先構(gòu)建的用戶習(xí)慣定位模型確定所述用戶位置,所述用戶習(xí)慣定位模型用于表征時(shí)間與用戶位置的對(duì)應(yīng)關(guān)系;
26、若在預(yù)定時(shí)間內(nèi)未獲取到用戶針對(duì)所述語(yǔ)音提示做出的語(yǔ)音響應(yīng),則通過(guò)所述養(yǎng)老機(jī)器人關(guān)聯(lián)的智能設(shè)備發(fā)送通知信息,所述通知信息包括未響應(yīng)的通話信息。
27、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
28、響應(yīng)于接受到用戶發(fā)出的指示需要撥打電話的語(yǔ)音指令,根據(jù)所述語(yǔ)音指令確定需要撥打電話的用戶的位置;
29、控制所述養(yǎng)老機(jī)器人移動(dòng)到所述需要撥打電話的用戶的位置;
30、獲取包含待撥打電話的信息的語(yǔ)音命令;
31、根據(jù)所述語(yǔ)音命令控制所述通信模塊撥打電話。
32、第二方面,本發(fā)明提供一種養(yǎng)老機(jī)器人,所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元,所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型,所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到,所述養(yǎng)老機(jī)器人包括獲取單元、提取單元和控制單元;
33、所述獲取單元,用于獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào);
34、所述提取單元,用于基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取所述第一聲音信號(hào)中的第一人聲信號(hào),其中,所述人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到,所述第二麥克風(fēng)安裝于所述養(yǎng)老機(jī)器人的基站或與所述養(yǎng)老機(jī)器人關(guān)聯(lián)的終端;所述第一人聲信號(hào)是基于人聲提取模型對(duì)所述第一聲音信號(hào)提取得到;
35、所述控制單元,用于基于所述第一人聲信號(hào)確定語(yǔ)音控制指令,并根據(jù)所述語(yǔ)音控制指令控制所述養(yǎng)老機(jī)器人。
36、第三方面,本發(fā)明還提供一種養(yǎng)老機(jī)器人,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如第一方面所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。
37、第四方面,本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。
38、第五方面,本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。
39、本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào);基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取第一聲音信號(hào)中的第一人聲信號(hào),其中,人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到,第二麥克風(fēng)安裝于養(yǎng)老機(jī)器人的基站或與養(yǎng)老機(jī)器人關(guān)聯(lián)的終端,第一人聲信號(hào)是基于人聲提取模型對(duì)第一聲音信號(hào)提取得到,人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到;基于第一人聲信號(hào)確定語(yǔ)音控制指令,并根據(jù)語(yǔ)音控制指令控制養(yǎng)老機(jī)器人,因此,實(shí)現(xiàn)了噪聲環(huán)境下基于養(yǎng)老機(jī)器人的語(yǔ)音控制,提高了用戶體驗(yàn)。
1.一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,應(yīng)用于養(yǎng)老機(jī)器人,所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元,所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型,所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法包括:
2.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,所述基于所述第一人聲信號(hào)確定語(yǔ)音控制指令,包括:
3.根據(jù)權(quán)利要求2所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
4.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,所述存儲(chǔ)單元中人聲特征的存儲(chǔ)步驟包括:
5.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
6.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
7.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法,其特征在于,所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括:
8.一種養(yǎng)老機(jī)器人,其特征在于,所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元,所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型,所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到,所述養(yǎng)老機(jī)器人包括獲取單元、提取單元和控制單元;
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。