一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人與流程

文檔序號(hào)：40237410發(fā)布日期：2024-12-06 17:00閱讀：39來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人與流程

本發(fā)明涉及人工智能，尤其涉及一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人。

背景技術(shù)：

1、隨著智能家居技術(shù)的快速發(fā)展，家庭環(huán)境中的自動(dòng)化和智能化設(shè)備日益增多。在眾多智能家居設(shè)備中，養(yǎng)老機(jī)器人，如掃地機(jī)器人，因其自動(dòng)化清潔功能而受到廣泛應(yīng)用。目前，養(yǎng)老機(jī)器人還增加了語(yǔ)音控制的功能，在養(yǎng)老機(jī)器人的機(jī)身上裝載麥克風(fēng)和語(yǔ)音模塊，用于接收使用者語(yǔ)音控制指令并轉(zhuǎn)化為對(duì)應(yīng)的機(jī)器指令，根據(jù)語(yǔ)音指令做出相應(yīng)的動(dòng)作，給用戶提供了不少便利。然而，由于養(yǎng)老機(jī)器人機(jī)身上的各種電機(jī)在工作時(shí)會(huì)產(chǎn)生較大的噪聲，用戶在對(duì)養(yǎng)老機(jī)器人發(fā)出語(yǔ)音指令時(shí)很容易受到這些噪聲的干擾，導(dǎo)致養(yǎng)老機(jī)器人不能很好的接收到指令并對(duì)指令做出相應(yīng)的響應(yīng)。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提供一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人，用以解決現(xiàn)有技術(shù)中養(yǎng)老機(jī)器人機(jī)身上的電機(jī)在工作時(shí)產(chǎn)生較大的噪聲，影響?zhàn)B老機(jī)器人接收語(yǔ)音指令的問(wèn)題，即使在設(shè)備運(yùn)行時(shí)產(chǎn)生的噪聲環(huán)境中，用戶也能夠通過(guò)語(yǔ)音指令有效地與養(yǎng)老機(jī)器人進(jìn)行交互，增強(qiáng)了用戶體驗(yàn)。

2、第一方面，本發(fā)明提供一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，應(yīng)用于養(yǎng)老機(jī)器人，所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元，所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型，所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法包括：

3、獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào)；

4、基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取所述第一聲音信號(hào)中的第一人聲信號(hào)，其中，所述人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到，所述第二麥克風(fēng)安裝于所述養(yǎng)老機(jī)器人的基站或與所述養(yǎng)老機(jī)器人關(guān)聯(lián)的終端；所述第一人聲信號(hào)是基于人聲提取模型對(duì)所述第一聲音信號(hào)提取得到；

5、基于所述第一人聲信號(hào)確定語(yǔ)音控制指令，并根據(jù)所述語(yǔ)音控制指令控制所述養(yǎng)老機(jī)器人。

6、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，所述基于所述第一人聲信號(hào)確定語(yǔ)音控制指令，包括：

7、獲取與所述第一聲音信號(hào)同時(shí)采集的第三聲音信號(hào)，所述第三聲音信號(hào)通過(guò)所述第二麥克風(fēng)采集；

8、提取所述第三聲音信號(hào)中的第三人聲信號(hào)，并基于所述第一人聲信號(hào)與所述第三人聲信號(hào)的信號(hào)強(qiáng)度，確定待識(shí)別的人聲信號(hào)；

9、對(duì)所述待識(shí)別的人聲信號(hào)進(jìn)行語(yǔ)音識(shí)別，得到語(yǔ)音識(shí)別結(jié)果；

10、根據(jù)所述語(yǔ)音識(shí)別結(jié)果確定語(yǔ)音控制指令。

11、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

12、根據(jù)所述第一聲音信號(hào)與所述第三聲音信號(hào)進(jìn)行聲源定位，得到聲源位置；

13、控制所述養(yǎng)老機(jī)器人前往所述聲源位置。

14、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，所述存儲(chǔ)單元中人聲特征的存儲(chǔ)步驟包括：

15、獲取通過(guò)所述第二麥克風(fēng)采集的第二聲音信號(hào)；

16、將所述第二聲音信號(hào)輸入至預(yù)先訓(xùn)練的人聲特征提取模型，得到所述第二聲音信號(hào)中的人聲特征，所述人聲特征提取模型基于無(wú)監(jiān)督學(xué)習(xí)算法訓(xùn)練得到；

17、確定存儲(chǔ)單元中是否已存儲(chǔ)所述人聲特征；

18、若否，則存儲(chǔ)所述人聲特征至所述存儲(chǔ)單元。

19、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

20、響應(yīng)于通過(guò)養(yǎng)老機(jī)器人內(nèi)置的通信模塊接收到通話請(qǐng)求，發(fā)出語(yǔ)音提示，所述語(yǔ)音提示用于提醒用戶有待接聽(tīng)的通話；

21、獲取用戶針對(duì)所述語(yǔ)音提示做出的語(yǔ)音響應(yīng)；

22、根據(jù)所述語(yǔ)音響應(yīng)確定用戶位置；

23、控制所述養(yǎng)老機(jī)器人移動(dòng)到所述用戶位置，等待用戶接聽(tīng)通話。

24、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

25、若在預(yù)設(shè)時(shí)間內(nèi)沒(méi)有獲取到用戶針對(duì)所述語(yǔ)音提示做出的語(yǔ)音響應(yīng)，根據(jù)所述養(yǎng)老機(jī)器人中存儲(chǔ)的室內(nèi)地圖以及云端預(yù)先構(gòu)建的用戶習(xí)慣定位模型確定所述用戶位置，所述用戶習(xí)慣定位模型用于表征時(shí)間與用戶位置的對(duì)應(yīng)關(guān)系；

26、若在預(yù)定時(shí)間內(nèi)未獲取到用戶針對(duì)所述語(yǔ)音提示做出的語(yǔ)音響應(yīng)，則通過(guò)所述養(yǎng)老機(jī)器人關(guān)聯(lián)的智能設(shè)備發(fā)送通知信息，所述通知信息包括未響應(yīng)的通話信息。

27、根據(jù)本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

28、響應(yīng)于接受到用戶發(fā)出的指示需要撥打電話的語(yǔ)音指令，根據(jù)所述語(yǔ)音指令確定需要撥打電話的用戶的位置；

29、控制所述養(yǎng)老機(jī)器人移動(dòng)到所述需要撥打電話的用戶的位置；

30、獲取包含待撥打電話的信息的語(yǔ)音命令；

31、根據(jù)所述語(yǔ)音命令控制所述通信模塊撥打電話。

32、第二方面，本發(fā)明提供一種養(yǎng)老機(jī)器人，所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元，所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型，所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到，所述養(yǎng)老機(jī)器人包括獲取單元、提取單元和控制單元；

33、所述獲取單元，用于獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào)；

34、所述提取單元，用于基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取所述第一聲音信號(hào)中的第一人聲信號(hào)，其中，所述人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到，所述第二麥克風(fēng)安裝于所述養(yǎng)老機(jī)器人的基站或與所述養(yǎng)老機(jī)器人關(guān)聯(lián)的終端；所述第一人聲信號(hào)是基于人聲提取模型對(duì)所述第一聲音信號(hào)提取得到；

35、所述控制單元，用于基于所述第一人聲信號(hào)確定語(yǔ)音控制指令，并根據(jù)所述語(yǔ)音控制指令控制所述養(yǎng)老機(jī)器人。

36、第三方面，本發(fā)明還提供一種養(yǎng)老機(jī)器人，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如第一方面所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。

37、第四方面，本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。

38、第五方面，本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。

39、本發(fā)明提供的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào)；基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取第一聲音信號(hào)中的第一人聲信號(hào)，其中，人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到，第二麥克風(fēng)安裝于養(yǎng)老機(jī)器人的基站或與養(yǎng)老機(jī)器人關(guān)聯(lián)的終端，第一人聲信號(hào)是基于人聲提取模型對(duì)第一聲音信號(hào)提取得到，人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到；基于第一人聲信號(hào)確定語(yǔ)音控制指令，并根據(jù)語(yǔ)音控制指令控制養(yǎng)老機(jī)器人，因此，實(shí)現(xiàn)了噪聲環(huán)境下基于養(yǎng)老機(jī)器人的語(yǔ)音控制，提高了用戶體驗(yàn)。

技術(shù)特征：

1.一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，應(yīng)用于養(yǎng)老機(jī)器人，所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元，所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型，所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法包括：

2.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，所述基于所述第一人聲信號(hào)確定語(yǔ)音控制指令，包括：

3.根據(jù)權(quán)利要求2所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

4.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，所述存儲(chǔ)單元中人聲特征的存儲(chǔ)步驟包括：

5.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

6.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

7.根據(jù)權(quán)利要求1所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法，其特征在于，所述基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法還包括：

8.一種養(yǎng)老機(jī)器人，其特征在于，所述養(yǎng)老機(jī)器人中安裝有麥克風(fēng)和存儲(chǔ)單元，所述存儲(chǔ)單元中內(nèi)嵌有人聲提取模型，所述人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到，所述養(yǎng)老機(jī)器人包括獲取單元、提取單元和控制單元；

9.一種電子設(shè)備，包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。

10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法。

技術(shù)總結(jié)
本發(fā)明涉及人工智能技術(shù)領(lǐng)域，公開(kāi)了一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人，包括：獲取通過(guò)養(yǎng)老機(jī)器人上安裝的第一麥克風(fēng)采集的第一聲音信號(hào)；基于存儲(chǔ)單元中存儲(chǔ)的人聲特征提取第一聲音信號(hào)中的第一人聲信號(hào)，其中，人聲特征基于第二麥克風(fēng)采集的第二聲音信號(hào)提取得到，第二麥克風(fēng)安裝于養(yǎng)老機(jī)器人的基站或與養(yǎng)老機(jī)器人關(guān)聯(lián)的終端，第一人聲信號(hào)是基于人聲提取模型對(duì)第一聲音信號(hào)提取得到，人聲提取模型通過(guò)標(biāo)注人聲信號(hào)的樣本聲音信號(hào)訓(xùn)練得到；基于第一人聲信號(hào)確定語(yǔ)音控制指令，并根據(jù)語(yǔ)音控制指令控制養(yǎng)老機(jī)器人。本發(fā)明實(shí)現(xiàn)了噪聲環(huán)境下基于養(yǎng)老機(jī)器人的語(yǔ)音控制，提高了用戶體驗(yàn)。

技術(shù)研發(fā)人員：彭孔濤,李文華,曹忠文
受保護(hù)的技術(shù)使用者：深圳市視壯科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/5

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：彭孔濤,李文華,曹忠文
技術(shù)所有人：深圳市視壯科技有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于養(yǎng)老機(jī)器人的語(yǔ)音控制方法及其養(yǎng)老機(jī)器人與流程