本發(fā)明涉及一種輸送車尋跡方法,尤其涉及一種使用滑??刂破鬟M(jìn)行輸送車尋跡的方法。
背景技術(shù):
輸送車(agv,自動(dòng)導(dǎo)引車)由于其無人操縱,柔性化和智能運(yùn)輸特性被廣泛的運(yùn)用于倉儲(chǔ)物流,自動(dòng)化制造等工業(yè)生產(chǎn)中,而agv的軌跡控制是整個(gè)agv行為的核心,目前的agv軌跡控制主要采用以下3種方法:其一基于反饋線性化方法,但是由于agv運(yùn)動(dòng)模型的非線性和周圍環(huán)境的復(fù)雜多變,導(dǎo)致其誤差較大,魯棒性不強(qiáng);基于自適應(yīng)pid控制器的方法,雖然能夠保證一定的魯棒性但是對(duì)不確定系統(tǒng)的適應(yīng)性有限;基于滑模變結(jié)構(gòu)控制的方法,傳統(tǒng)的滑模變結(jié)構(gòu)控制在系統(tǒng)中會(huì)產(chǎn)生較大抖振,使得跟蹤效果并不理想。
故急需一種可解決上述問題的輸送車控制方法以控制輸送車的運(yùn)行軌跡。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種基于滑模控制器的輸送車尋跡方法,在傳統(tǒng)的滑模變結(jié)構(gòu)控制器基礎(chǔ)上,對(duì)離散滑模趨近律的參數(shù)ε進(jìn)行動(dòng)態(tài)調(diào)整,來達(dá)到盡可能的在尋跡的開始快速逼近滑模面,當(dāng)接近穩(wěn)定時(shí)減少抖振逼近等效控制,從而壓縮滑??刂频亩墩裆踔料墩瘢沟酶櫺Ч⒉焕硐?。
為了實(shí)現(xiàn)上有目的,本發(fā)明公開了一種基于滑??刂破鞯妮斔蛙噷ほE方法,使用滑??刂破骺刂戚斔蛙嚨倪\(yùn)行軌跡,使得所述輸送車的運(yùn)行軌跡貼合磁道路徑,包括以下步驟:(1)使用檢測單元采集獲得所述輸送車的中心位置到所述磁道的距離誤差ed和輸送車相對(duì)于所述磁道路徑的偏離角度eθ;(2)依據(jù)所述距離誤差ed的大小調(diào)整所述滑??刂破髦袑?duì)應(yīng)的離散滑模趨近律的ε參數(shù)的大小,使得ε參數(shù)隨著所述距離誤差的降低而縮小,ε參數(shù)為離散滑模趨近律中控制逼近速率的參數(shù);(3)依據(jù)確定好的ε參數(shù)、距離誤差ed、偏離角度eθ和離散滑模趨近律計(jì)算并調(diào)整所述輸送車左輪和右輪的速度,從而以調(diào)整所述輸送車的運(yùn)行路徑。
對(duì)離散滑模趨近律中的ε參數(shù)討論可以發(fā)現(xiàn)當(dāng)ε參數(shù)很大時(shí),滑??刂浦邢到y(tǒng)趨近滑模面的速率變大,也就是說系統(tǒng)會(huì)更快的收斂到滑模面,響應(yīng)速度快,如果ε參數(shù)過大的話,雖然可以讓其快速逼近滑模面,但是容易引起極大的抖振,當(dāng)ε參數(shù)較小的時(shí)候系統(tǒng)逼近滑模面的速率變小,而當(dāng)ε參數(shù)極小時(shí),滑??刂埔仓饾u逼近等效控制。為此,本發(fā)明動(dòng)態(tài)改變?chǔ)艆?shù),使其當(dāng)輸送車的距離誤差很大時(shí),讓其快速逼近滑模面以更快的速率縮小距離誤差,從而使得輸送車能夠快速進(jìn)入穩(wěn)定跟蹤狀態(tài)。當(dāng)系統(tǒng)穩(wěn)定后,讓其接近等效控制來進(jìn)行軌跡跟蹤,壓縮滑??刂频亩墩裆踔料墩?。
較佳地,所述步驟(2)具體為:依據(jù)預(yù)設(shè)或者已有的ε參數(shù)的策略模型,計(jì)算所述距離誤差ed對(duì)應(yīng)的ε參數(shù)大小,ε參數(shù)的策略為滑模控制器每一次動(dòng)作對(duì)應(yīng)的ε參數(shù)或者參數(shù)變化的映射,ε參數(shù)的策略模型為ε參數(shù)的策略集合。該方案使得本發(fā)明系統(tǒng)響應(yīng)迅速,物理實(shí)現(xiàn)簡單。
更佳地,所述基于滑??刂破鞯妮斔蛙噷ほE方法還包括確定所述策略模型的方法,包括以下步驟:將輸送車離線運(yùn)行若干回,利用馬爾科夫決策過程計(jì)算策略π并求解最優(yōu)策略以獲取策略模型。該方案使得本發(fā)明在不同的復(fù)雜的地表環(huán)境下,能夠快速進(jìn)入穩(wěn)定跟蹤狀態(tài),穩(wěn)定狀態(tài)下跟蹤效果良好,跟蹤抖振很小,具有較強(qiáng)的適應(yīng)性和魯棒性。
具體地,確定所述策略模型的方法具體步驟包括:將所述距離誤差馬爾科夫過程化,依據(jù)預(yù)設(shè)好的規(guī)律建立每一個(gè)動(dòng)作對(duì)應(yīng)的ε參數(shù),使得每一次動(dòng)作時(shí)所述ε參數(shù)依據(jù)預(yù)設(shè)規(guī)律遞減;使用所述檢測單元檢測距離誤差ed,獲取每一次動(dòng)作ε參數(shù)與距離誤差ed之間的映射,將輸送車離線運(yùn)行若干回,依據(jù)策略迭代計(jì)算最優(yōu)策略以獲取策略模型。
更具體地,利用馬爾科夫決策過程獲取策略π的具體步驟包括:(11)使用檢測單元檢測所述輸送車的中心位置到所述磁道的距離誤差,將磁檢測單元的檢測最大偏差edmax數(shù)值分成m個(gè)等級(jí),從而對(duì)應(yīng)建立所述距離誤差的狀態(tài)集合s=edi,i=1、2…m,其中edi為量化過的誤差,從而將距離誤差ed馬爾科夫過程化;(12)建立行動(dòng)集合a,使用ε參數(shù)的變化程度代表一次行動(dòng)a,將每一次行動(dòng)a或者ε參數(shù)依據(jù)預(yù)設(shè)規(guī)律設(shè)置為不同速度的遞減,使得ε參數(shù)隨著距離誤差的減小而減小;(13)獲取狀態(tài)集合s到行動(dòng)集合a的映射。
更具體地,依據(jù)策略迭代計(jì)算最優(yōu)策略的方法具體步驟包括:(a)計(jì)算每一次行動(dòng)a對(duì)應(yīng)的回報(bào)值r;(b)依據(jù)最大化回報(bào)期望最優(yōu)原則,求取最優(yōu)回報(bào)值對(duì)應(yīng)的策略以獲得最優(yōu)策略。
更具體地,所述步驟(a)具體包括:設(shè)計(jì)回報(bào)函數(shù)r=c/(δedi+l),其中c、l為常數(shù),δedi為每一次行動(dòng)距離誤差的變化程度,依據(jù)回報(bào)函數(shù)計(jì)算每一次行動(dòng)對(duì)應(yīng)的回報(bào)值r。
更具體地,所述步驟(b)具體包括:確定最優(yōu)回報(bào)準(zhǔn)則
更具體地,所述步驟(b)之后還包括求取狀態(tài)轉(zhuǎn)移概率的步驟:當(dāng)狀態(tài)si時(shí)若采取行動(dòng)ak從狀態(tài)si到狀態(tài)sj,則這個(gè)轉(zhuǎn)移的概率為狀態(tài)轉(zhuǎn)移概率(psa)ijk,使得每一個(gè)行動(dòng)都一個(gè)狀態(tài)轉(zhuǎn)移概率矩陣[pak]對(duì)應(yīng)。
更具體地,依據(jù)策略迭代計(jì)算最優(yōu)策略獲取策略模型的具體步驟包括:
定義一值函數(shù)vπ:s→r采用策略π時(shí),在狀態(tài)s的期望回報(bào):
進(jìn)行從值函數(shù)vπ(s)到策略π的過程,定義行動(dòng)值函數(shù)qπ:s·a→r,為在狀態(tài)s采用行動(dòng)a,其他狀態(tài)采用策略π的期望回報(bào):
策略函數(shù)由最大化行動(dòng)值函數(shù)獲得:
重復(fù)以上步驟從而通過不斷迭代來獲取一個(gè)最優(yōu)策略,從而獲取策略模型。
較佳地,所述檢測單元包括磁傳感器和電位計(jì),所述步驟(1)中采用磁傳感器采集獲得所述距離誤差,使用電位計(jì)采集獲得所述偏離角度eθ。當(dāng)然,檢測單元還可以采用其他的檢測器件進(jìn)行數(shù)據(jù)采集。
較佳地,所述步驟(3)具體為:依據(jù)確定好的ε參數(shù)、距離誤差ed、偏離角度eθ和離散滑模趨近律計(jì)算所述輸送車左輪和右輪的控制速度,依據(jù)所述控制速度計(jì)算所述輸送車左輪驅(qū)動(dòng)電機(jī)和右輪驅(qū)動(dòng)電機(jī)的控制壓差,依據(jù)所述控制壓差對(duì)應(yīng)調(diào)節(jié)所述左輪、右輪的電壓從而控制所述輸送車左輪和右輪的速度,以調(diào)整所述輸送車的運(yùn)行路徑。
附圖說明
圖1是本發(fā)明第一實(shí)施例中所述輸送車尋跡方法的流程圖。
圖2是本發(fā)明第二實(shí)施例中所述輸送車尋跡方法的流程圖。
具體實(shí)施方式
為詳細(xì)說明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所實(shí)現(xiàn)目的及效果,以下結(jié)合實(shí)施方式并配合附圖詳予說明。
本發(fā)明公開了一種基于滑??刂破鞯妮斔蛙噷ほE方法,使用滑??刂破骺刂戚斔蛙嚨倪\(yùn)行軌跡,使得所述輸送車的運(yùn)行軌跡貼合磁道路徑。
參考圖1,所述輸送車尋跡方法包括以下步驟:(1)使用檢測單元采集獲得所述輸送車的中心位置到所述磁道的距離誤差ed和輸送車相對(duì)于所述磁道路徑的偏離角度eθ;(2)依據(jù)所述距離誤差ed的大小調(diào)整所述滑??刂破髦袑?duì)應(yīng)的離散滑模趨近律的ε參數(shù)的大小,使得ε參數(shù)隨著所述距離誤差的降低而縮小,ε參數(shù)為離散滑模趨近律中控制逼近速率的參數(shù);(3)依據(jù)確定好的ε參數(shù)、距離誤差ed、偏離角度eθ和離散滑模趨近律計(jì)算并調(diào)整所述輸送車左輪和右輪的速度,從而以調(diào)整所述輸送車的運(yùn)行路徑,即將確定好的ε參數(shù)、距離誤差ed、偏離角度eθ代入離散滑模趨近律中計(jì)算輸送車左輪和右輪的速度。本發(fā)明動(dòng)態(tài)改變?chǔ)艆?shù),使其當(dāng)輸送車的距離誤差很大時(shí),讓其快速逼近滑模面以更快的速率縮小距離誤差,從而使得輸送車能夠快速進(jìn)入穩(wěn)定跟蹤狀態(tài)。當(dāng)系統(tǒng)穩(wěn)定后,讓其接近等效控制來進(jìn)行軌跡跟蹤,壓縮滑??刂频亩墩裆踔料墩?。
其中,所述步驟(2)具體為:依據(jù)預(yù)設(shè)或者已有的ε參數(shù)的策略模型,計(jì)算所述距離誤差ed對(duì)應(yīng)的ε參數(shù)大小,即依據(jù)策略模型優(yōu)化滑模控制器的ε參數(shù)。其中,ε參數(shù)的策略為滑??刂破髅恳淮蝿?dòng)作對(duì)應(yīng)的ε參數(shù)或者參數(shù)變化的映射,ε參數(shù)的策略模型為ε參數(shù)的策略集合。該方案使得本發(fā)明系統(tǒng)響應(yīng)迅速,物理實(shí)現(xiàn)簡單。
其中,所述檢測單元包括磁傳感器和電位計(jì),所述步驟(1)中采用磁傳感器采集獲得所述距離誤差,使用電位計(jì)采集獲得所述偏離角度eθ。當(dāng)然,檢測單元還可以采用其他的檢測器件進(jìn)行數(shù)據(jù)采集。
其中,參考圖1,所述步驟(3)具體為:依據(jù)確定好的ε參數(shù)、距離誤差ed、偏離角度eθ和離散滑模趨近律計(jì)算所述輸送車左輪和右輪的控制速度,依據(jù)所述控制速度計(jì)算所述輸送車左輪驅(qū)動(dòng)電機(jī)和右輪驅(qū)動(dòng)電機(jī)的控制壓差,依據(jù)所述控制壓差對(duì)應(yīng)調(diào)節(jié)所述左輪、右輪的電壓從而控制所述輸送車左輪和右輪的速度,以調(diào)整所述輸送車的運(yùn)行路徑。
在本發(fā)明第二實(shí)施例中,所述輸送車尋跡方法還包括確定所述策略模型的方法,包括以下步驟:將輸送車離線運(yùn)行若干回,利用馬爾科夫決策過程計(jì)算策略π并求解最優(yōu)策略以獲取策略模型。參考圖2,確定所述策略模型的方法具體步驟包括:(21)將所述距離誤差馬爾科夫過程化,(22)依據(jù)預(yù)設(shè)好的規(guī)律建立每一個(gè)動(dòng)作對(duì)應(yīng)的ε參數(shù),使得每一次動(dòng)作時(shí)所述ε參數(shù)依據(jù)預(yù)設(shè)規(guī)律遞減,即設(shè)定馬爾科夫決策過程ε參數(shù)模型;(23)使用所述檢測單元檢測距離誤差ed,(24)獲取每一次動(dòng)作ε參數(shù)與距離誤差ed之間的映射,將輸送車離線運(yùn)行若干回,依據(jù)策略迭代計(jì)算最優(yōu)策略以獲取策略模型,即離線學(xué)習(xí)最優(yōu)策略以獲得策略模型。
其中,將所述距離誤差馬爾科夫過程化的步驟包括:使用檢測單元檢測所述輸送車的中心位置到所述磁道的距離誤差,將磁檢測單元的檢測最大偏差edmax數(shù)值分成m個(gè)等級(jí),從而對(duì)應(yīng)建立所述距離誤差的狀態(tài)集合s=edi,i=1、2…m,其中edi為量化過的誤差,從而將距離誤差ed馬爾科夫過程化。
其中,所述步驟(22)中,依據(jù)預(yù)設(shè)好的規(guī)律建立每一個(gè)動(dòng)作對(duì)應(yīng)的ε參數(shù)的步驟包括:建立行動(dòng)集合a,使用ε參數(shù)的變化程度代表一次行動(dòng)a,將每一次行動(dòng)a或者ε參數(shù)依據(jù)預(yù)設(shè)規(guī)律設(shè)置為不同速度的遞減,使得ε參數(shù)隨著距離誤差的減小而減。所述步驟(24)中,隨著輸送車的運(yùn)行獲取狀態(tài)集合s到行動(dòng)集合a的映射。
其中,所述步驟(24)中,依據(jù)策略迭代計(jì)算最優(yōu)策略的方法具體步驟包括:(a)計(jì)算每一次行動(dòng)a對(duì)應(yīng)的回報(bào)值r;(b)依據(jù)最大化回報(bào)期望最優(yōu)原則,求取最優(yōu)回報(bào)值對(duì)應(yīng)的策略以獲得最優(yōu)策略。具體地,所述步驟(a)具體包括:設(shè)計(jì)回報(bào)函數(shù)r=c/(δedi+l),其中c、l為常數(shù),δedi為每一次行動(dòng)距離誤差的變化程度,依據(jù)回報(bào)函數(shù)計(jì)算每一次行動(dòng)對(duì)應(yīng)的回報(bào)值r。具體地,所述步驟(b)具體包括:確定最優(yōu)回報(bào)準(zhǔn)則
較佳者,所述步驟(b)之后還包括求取狀態(tài)轉(zhuǎn)移概率的步驟:當(dāng)狀態(tài)si時(shí)若采取行動(dòng)ak從狀態(tài)si到狀態(tài)sj,則這個(gè)轉(zhuǎn)移的概率為狀態(tài)轉(zhuǎn)移概率(psa)ijk,使得每一個(gè)行動(dòng)都一個(gè)狀態(tài)轉(zhuǎn)移概率矩陣
描述本發(fā)明運(yùn)用馬爾可夫決策過程優(yōu)化滑模控制器的過程,即所述步驟(24)的具體步驟:定義一值函數(shù)vπ:s→r采用策略π時(shí),在狀態(tài)s的期望回報(bào):
重復(fù)以上步驟從而通過不斷迭代來獲取一個(gè)最優(yōu)策略,從而獲取策略模型。
在agv的軌跡跟蹤中,滑??刂破鞅粡V泛的應(yīng)用,但是對(duì)于復(fù)雜地面環(huán)境,目前常規(guī)的滑??刂破魍墩竦姆容^大,跟蹤精度往往達(dá)不到要求,基于此,本發(fā)明通過利用馬爾科夫決策過程合理的控制離散滑??刂破鞯氖諗克俾蕝?shù),通過讓agv在實(shí)際磁道上行駛?cè)舾蓚€(gè)周期離線學(xué)習(xí)馬爾科夫決策模型的策略函數(shù),使其能夠更加快速穩(wěn)定的逼近滑模面,實(shí)現(xiàn)軌跡良好跟蹤,不但對(duì)復(fù)雜地面的適應(yīng)性良好,而且跟蹤精度相比較高。
以下描述滑??刂破鞯墓ぷ髟恚?/p>
對(duì)于輸送車而言,設(shè)左右輪的電機(jī)電樞電壓為uc,ur,負(fù)載常數(shù)為tm,反向電動(dòng)勢常數(shù)為kd,車輪半徑為r,減速機(jī)構(gòu)傳動(dòng)比為γ,則令:
經(jīng)拉氏變換后可得:
在改變電機(jī)轉(zhuǎn)速時(shí),以一個(gè)△u來表示電壓的改變量,以u(píng)c表示基準(zhǔn)驅(qū)動(dòng)電壓,則ul和ur可表示為:
ul=uc+△u;
ur=uc-△u;
那么令agv左,右輪線速度為vl,vr則可得:
vl=vc+△v;
vr=vc-△v;
令agv幾何中心到磁道的誤差為ed,輸送車幾何正向與磁道切向的誤差為eθ假設(shè)在經(jīng)過△t時(shí)間,則滿足:
同理可得:
綜合上述公式可得:
其中f(t)為系統(tǒng)參數(shù)擾動(dòng)和外部變化的隨機(jī)干擾,但是這些干擾歸根揭底還是對(duì)△v的改變,所以定義一個(gè)△vf代表擾動(dòng)速度差,則不失一般性,上式可表達(dá)為:
它的模型為
將速度差的拉氏變換:
求逆變換后有:
將其離散化為:
至此,一個(gè)采樣間隔階段的差速可以用來表示兩輪壓差的變化,對(duì)于上述的△vf項(xiàng),由于后面提及的滑模變結(jié)構(gòu)控制可以消除這類擾動(dòng),故在實(shí)際處理時(shí)可忽略該項(xiàng)。
在滑模控制過程中,軌跡控制的目標(biāo)就是盡量使agv在運(yùn)行過程中的軌跡x(k)盡量貼合磁道路徑r(k),所以定義系統(tǒng)的滑模面方程(切換函數(shù))為:
s(k)=c(r(k)-x(k));
從而:
s(k+1)=c(r(k+1)-x(k+1))=cr(k+1)-cax(k)-cbv(k);
當(dāng)cb≠0時(shí),
v(k)=(cb)-1[cr(k+1)-cax(k)-s(k+1)];
取離散滑模趨近律為:
s(k+1)-s(k)=-δts(k)-εtsgn(s(k))其中δ>0,ε>0,1-εt>0;
則:
v(k)=(cb)-1[cr(k+1)-cax(k)-(1-δt)s(k)+εtsgn(s(k)];
其中,滑??刂破鞑捎秒x散滑模趨近律控制輸送車為本領(lǐng)域公知技術(shù),在此不進(jìn)行進(jìn)一步的詳述。
以上所揭露的僅為本發(fā)明的優(yōu)選實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明申請(qǐng)專利范圍所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。