本發(fā)明涉及自主作業(yè),尤其涉及一種作業(yè)機(jī)械的控制方法、裝置、作業(yè)機(jī)械及設(shè)備。
背景技術(shù):
1、作業(yè)機(jī)械自動化以及智能化的發(fā)展是行業(yè)的必然趨勢,傳統(tǒng)的作業(yè)機(jī)械依靠操作員調(diào)節(jié)控制桿來協(xié)調(diào)工作,實現(xiàn)動臂、斗桿和鏟斗的精準(zhǔn)配合,完成作業(yè)機(jī)械的作業(yè)。傳統(tǒng)的作業(yè)方式,需要操作員具備高度的專業(yè)技能,另外,由于作業(yè)的重復(fù)性和勞動強(qiáng)度,極易造成操作員的作業(yè)疲勞。因此,實現(xiàn)作業(yè)機(jī)械的自動化控制,對于提升作業(yè)效率和操作員的作業(yè)安全是具有重要意義的。
2、為了實現(xiàn)上述目標(biāo),現(xiàn)有技術(shù)采用半自動控制的方式進(jìn)行作業(yè)機(jī)械的控制。例如,需要操作員在作業(yè)前進(jìn)行示范性作業(yè),以使作業(yè)機(jī)械記錄該作業(yè)過程,進(jìn)而基于記錄的作業(yè)過程進(jìn)行自動作業(yè)。
3、但是,作業(yè)機(jī)械的作業(yè)任務(wù)和作業(yè)環(huán)境是多樣的,同一作業(yè)任務(wù)隨著作業(yè)的執(zhí)行,作業(yè)面也會發(fā)生變化,因此,需要操作員多次進(jìn)行示范性作業(yè),導(dǎo)致整體的作業(yè)效率較低,作業(yè)效果也不理想。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供一種作業(yè)機(jī)械的控制方法、系統(tǒng)、作業(yè)機(jī)械及設(shè)備,用以解決現(xiàn)有技術(shù)中采用半自動化方式進(jìn)行作業(yè)機(jī)械的控制導(dǎo)致的作業(yè)效率低和作業(yè)效果差的問題,實現(xiàn)全自動的作業(yè)機(jī)械控制,提高作業(yè)效率和作業(yè)效果。
2、本發(fā)明實施例提供一種作業(yè)機(jī)械的控制方法,包括:
3、獲取作業(yè)機(jī)械的當(dāng)前作業(yè)數(shù)據(jù)以及所述作業(yè)機(jī)械對應(yīng)的當(dāng)前作業(yè)環(huán)境的點云數(shù)據(jù);
4、基于所述當(dāng)前作業(yè)數(shù)據(jù)、所述點云數(shù)據(jù)和預(yù)先訓(xùn)練的動作預(yù)測模型,得到所述動作預(yù)測模型輸出的所述作業(yè)機(jī)械需要執(zhí)行的動作的概率分布,其中,所述動作預(yù)測模型基于作業(yè)數(shù)據(jù)樣本、點云數(shù)據(jù)樣本和所述作業(yè)機(jī)械在所述作業(yè)數(shù)據(jù)樣本和所述點云數(shù)據(jù)樣本下所執(zhí)行動作的概率分布樣本訓(xùn)練得到;
5、基于所述概率分布確定目標(biāo)動作;
6、生成與所述目標(biāo)動作對應(yīng)的目標(biāo)控制信號,以基于所述目標(biāo)控制信號控制所述作業(yè)機(jī)械執(zhí)行所述目標(biāo)動作。
7、根據(jù)本發(fā)明實施例的作業(yè)機(jī)械的控制方法,所述基于所述當(dāng)前作業(yè)數(shù)據(jù)、所述點云數(shù)據(jù)和預(yù)先訓(xùn)練的動作預(yù)測模型,得到所述動作預(yù)測模型輸出的所述作業(yè)機(jī)械需要執(zhí)行的動作的概率分布,包括:
8、基于所述動作預(yù)測模型對應(yīng)的數(shù)據(jù)要求,對所述當(dāng)前作業(yè)數(shù)據(jù)和所述點云數(shù)據(jù)分別進(jìn)行處理操作,得到模型輸入數(shù)據(jù);
9、將所述模型輸入數(shù)據(jù)輸入所述動作預(yù)測模型,得到所述動作預(yù)測模型輸出的所述概率分布。
10、根據(jù)本發(fā)明實施例的作業(yè)機(jī)械的控制方法,所述當(dāng)前作業(yè)數(shù)據(jù)包括:當(dāng)前控制信號和所述作業(yè)機(jī)械的作業(yè)機(jī)構(gòu)對應(yīng)的當(dāng)前作業(yè)角度;
11、所述基于所述動作預(yù)測模型對應(yīng)的數(shù)據(jù)要求,對所述當(dāng)前作業(yè)數(shù)據(jù)和所述點云數(shù)據(jù)分別進(jìn)行處理操作,得到模型輸入數(shù)據(jù),包括:
12、基于預(yù)設(shè)的獎懲策略和所述當(dāng)前作業(yè)數(shù)據(jù),確定獎懲值;
13、轉(zhuǎn)化所述點云數(shù)據(jù)轉(zhuǎn)換為柵格數(shù)據(jù);
14、將所述獎懲值、所述柵格數(shù)據(jù)、所述當(dāng)前作業(yè)角度和所述當(dāng)前控制信號組成的序列確定為所述模型輸入數(shù)據(jù)。
15、根據(jù)本發(fā)明實施例的作業(yè)機(jī)械的控制方法,所述基于所述概率分布確定目標(biāo)動作,包括:
16、對所述概率分布對應(yīng)的動作進(jìn)行采樣,得到所述概率分布對應(yīng)的目標(biāo)點;
17、將所述目標(biāo)點在所述概率分布上對應(yīng)的動作確定為所述目標(biāo)動作。
18、根據(jù)本發(fā)明實施例的作業(yè)機(jī)械的控制方法,所述動作預(yù)測模型的訓(xùn)練過程包括:
19、獲取樣本數(shù)據(jù)集,其中,所述樣本數(shù)據(jù)集包括:所述作業(yè)數(shù)據(jù)樣本、所述點云數(shù)據(jù)樣本和所述概率分布樣本;
20、基于所述動作預(yù)測模型對應(yīng)的數(shù)據(jù)要求,對所述樣本數(shù)據(jù)集進(jìn)行處理操作,得到模型輸入數(shù)據(jù)樣本;
21、將所述模型輸入數(shù)據(jù)樣本中用于表征所述作業(yè)機(jī)械的動作的數(shù)據(jù)進(jìn)行掩碼處理,得到待輸入數(shù)據(jù)樣本;
22、將所述待輸入數(shù)據(jù)樣本輸入所述動作預(yù)測模型,得到所述動作預(yù)測模型輸出的預(yù)測概率分布;基于所述預(yù)測概率分布和所述概率分布樣本,優(yōu)化所述動作預(yù)測模型,直至所述動作預(yù)測模型收斂,得到最終的所述動作預(yù)測模型。
23、根據(jù)本發(fā)明實施例的作業(yè)機(jī)械的控制方法,所述基于所述預(yù)測概率分布和所述概率分布樣本,優(yōu)化所述動作預(yù)測模型,包括:
24、計算所述預(yù)測概率分布與所述概率分布樣本對應(yīng)的對數(shù)似然和熵;
25、基于所述對數(shù)似然和所述熵,計算迭代損失;
26、基于所述迭代損失,反向傳播以更新所述動作預(yù)測模型的模型參數(shù)。
27、根據(jù)本發(fā)明實施例的作業(yè)機(jī)械的控制方法,所述獲取樣本數(shù)據(jù)集,包括:
28、確定所述當(dāng)前作業(yè)環(huán)境對應(yīng)的任務(wù)難度;
29、采集與所述任務(wù)難度對應(yīng)的數(shù)據(jù)量的樣本數(shù)據(jù);
30、將采集的所述采樣數(shù)據(jù)組合得到所述樣本數(shù)據(jù)集。
31、本發(fā)明實施例提供一種作業(yè)機(jī)械的控制裝置,包括:
32、獲取模塊,用于獲取作業(yè)機(jī)械的當(dāng)前作業(yè)數(shù)據(jù)以及所述作業(yè)機(jī)械對應(yīng)的當(dāng)前作業(yè)環(huán)境的點云數(shù)據(jù);
33、預(yù)測模塊,用于基于所述當(dāng)前作業(yè)數(shù)據(jù)、所述點云數(shù)據(jù)和預(yù)先訓(xùn)練的動作預(yù)測模型,得到所述動作預(yù)測模型輸出的所述作業(yè)機(jī)械需要執(zhí)行的動作的概率分布,其中,所述動作預(yù)測模型基于作業(yè)數(shù)據(jù)樣本、點云數(shù)據(jù)樣本和所述作業(yè)機(jī)械在所述作業(yè)數(shù)據(jù)樣本和所述點云數(shù)據(jù)樣本下所執(zhí)行動作的概率分布樣本訓(xùn)練得到;
34、確定模塊,用于基于所述概率分布確定目標(biāo)動作;
35、控制模塊,用于生成與所述目標(biāo)動作對應(yīng)的目標(biāo)控制信號,以基于所述目標(biāo)控制信號控制所述作業(yè)機(jī)械執(zhí)行所述目標(biāo)動作。
36、本發(fā)明實施例還提供一種作業(yè)機(jī)械,用于實現(xiàn)所述作業(yè)機(jī)械的控制方法的步驟。
37、本發(fā)明實施例還提供一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機(jī)程序,所述處理器執(zhí)行所述程序時實現(xiàn)所述作業(yè)機(jī)械的控制方法的步驟。
38、本發(fā)明實施例還提供一種非暫態(tài)計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)所述作業(yè)機(jī)械的控制方法的步驟。
39、本發(fā)明實施例提供的作業(yè)機(jī)械的控制方法、裝置、作業(yè)機(jī)械及設(shè)備,通過當(dāng)前作業(yè)數(shù)據(jù)、點云數(shù)據(jù)和預(yù)先訓(xùn)練的動作預(yù)測模型,得到動作預(yù)測模型輸出的作業(yè)機(jī)械需要執(zhí)行的動作的概率分布;從得到的概率分布中確定目標(biāo)動作,可見,本發(fā)明無需操作員進(jìn)行示范性作業(yè),且無需關(guān)注作業(yè)環(huán)境的情況,便能夠自動且快速的得到作業(yè)機(jī)械需要執(zhí)行的目標(biāo)動作;進(jìn)而,生成與目標(biāo)動作對應(yīng)的目標(biāo)控制信號,以基于目標(biāo)控制信號控制作業(yè)機(jī)械執(zhí)行目標(biāo)動作,完成作業(yè)任務(wù),可見,整個控制過程無需人為參與,作業(yè)機(jī)械可自動完成,能夠有效的提高作業(yè)效率和作業(yè)效果,并且能夠有效的節(jié)省作業(yè)時長。
1.一種作業(yè)機(jī)械的控制方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的作業(yè)機(jī)械的控制方法,其特征在于,所述基于所述當(dāng)前作業(yè)數(shù)據(jù)、所述點云數(shù)據(jù)和預(yù)先訓(xùn)練的動作預(yù)測模型,得到所述動作預(yù)測模型輸出的所述作業(yè)機(jī)械需要執(zhí)行的動作的概率分布,包括:
3.根據(jù)權(quán)利要求2所述的作業(yè)機(jī)械的控制方法,其特征在于,所述當(dāng)前作業(yè)數(shù)據(jù)包括:當(dāng)前控制信號和所述作業(yè)機(jī)械的作業(yè)機(jī)構(gòu)對應(yīng)的當(dāng)前作業(yè)角度;
4.根據(jù)權(quán)利要求1-3任一項所述的作業(yè)機(jī)械的控制方法,其特征在于,所述基于所述概率分布確定目標(biāo)動作,包括:
5.根據(jù)權(quán)利要求1-3任一項所述的作業(yè)機(jī)械的控制方法,其特征在于,所述動作預(yù)測模型的訓(xùn)練過程包括:
6.根據(jù)權(quán)利要求5所述的作業(yè)機(jī)械的控制方法,其特征在于,所述基于所述預(yù)測概率分布和所述概率分布樣本,優(yōu)化所述動作預(yù)測模型,包括:
7.根據(jù)權(quán)利要5所述的作業(yè)機(jī)械的控制方法,其特征在于,所述獲取樣本數(shù)據(jù)集,包括:
8.一種作業(yè)機(jī)械的控制裝置,其特征在于,包括:
9.一種作業(yè)機(jī)械,其特征在于,用于實現(xiàn)如權(quán)利要求1至7任一項所述的作業(yè)機(jī)械的控制方法的步驟。
10.一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1至7任一項所述的作業(yè)機(jī)械的控制方法的步驟。