基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法
【專利摘要】本發(fā)明公開(kāi)了一種基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,該方法針對(duì)柔性機(jī)械臂動(dòng)態(tài)模型的不確定性,設(shè)計(jì)跟蹤誤差,使之滿足約束條件限制,并構(gòu)成誤差控制器。本發(fā)明步驟包括:建立柔性機(jī)械臂動(dòng)態(tài)模型;建立系統(tǒng)狀態(tài)觀測(cè)器;設(shè)計(jì)跟蹤誤差性能約束條件;基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器;利用經(jīng)驗(yàn)知識(shí)修正控制器。本發(fā)明所設(shè)計(jì)的控制方法可以實(shí)現(xiàn)快速收斂、低超調(diào)量的動(dòng)態(tài)性能,滿足設(shè)定的約束條件限制,同時(shí)避免神經(jīng)網(wǎng)絡(luò)權(quán)值在線調(diào)節(jié),縮短控制時(shí)間。另外,該方法能夠利用已經(jīng)學(xué)習(xí)到的經(jīng)驗(yàn)知識(shí)對(duì)之后的相同控制任務(wù)直接實(shí)現(xiàn)快速控制。
【專利說(shuō)明】
基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于柔性機(jī)械臂的軌跡跟蹤控制領(lǐng)域,特別是針對(duì)柔性機(jī)械臂系統(tǒng)動(dòng)態(tài)模 型的不確定性,設(shè)計(jì)跟蹤誤差,使之滿足約束條件限制。給出一種基于確定學(xué)習(xí)理論的性能 受限柔性機(jī)械臂控制方法。
【背景技術(shù)】
[0002] 如今,隨著機(jī)器人向著高精度、快速的方向發(fā)展,機(jī)械部件越來(lái)越趨向輕型化。相 比于傳統(tǒng)的剛性機(jī)械臂,柔性機(jī)械臂具有結(jié)構(gòu)輕、工作空間大和效率高的特點(diǎn),所以柔性元 件在制造業(yè),航空航天等領(lǐng)域的應(yīng)用越來(lái)越廣,但是柔性臂桿帶來(lái)的柔性效應(yīng),會(huì)導(dǎo)致機(jī)械 振動(dòng),這會(huì)使得軌跡控制要求的平穩(wěn)性與準(zhǔn)確性更難達(dá)到,柔性機(jī)械臂末端的軌跡跟蹤控 制越發(fā)困難。而在實(shí)際工業(yè)應(yīng)用中,由于工業(yè)環(huán)境的約束限制,諸如電機(jī)最大輸出力矩的限 制、穩(wěn)態(tài)階段末端軌跡跟蹤誤差限制、初始動(dòng)態(tài)階段跟蹤誤差的最大超調(diào)量和收斂速度的 限制,往往還需要系統(tǒng)的控制性能滿足一定的約束條件,這使設(shè)計(jì)的控制方案不僅要保證 軌跡跟蹤誤差系統(tǒng)穩(wěn)定,而且跟蹤誤差的跟蹤性能還要滿足實(shí)際情形下的約束,這給控制 方案的設(shè)計(jì)帶來(lái)很大的挑戰(zhàn)。
[0003] 針對(duì)柔性機(jī)械臂系統(tǒng)的軌跡跟蹤控制,反演控制、滑??刂?、動(dòng)態(tài)面控制等智能控 制方法結(jié)合神經(jīng)網(wǎng)絡(luò)控制,能夠解決在系統(tǒng)模型動(dòng)態(tài)不確定情況下軌跡控制要求的平穩(wěn)性 和準(zhǔn)確性問(wèn)題。但是對(duì)于跟蹤性能有具體約束的情況下,這些控制方法無(wú)法控制跟蹤誤差 滿足特定性能受限的要求。一種性能誤差轉(zhuǎn)換自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法,通過(guò)引入性能受 限函數(shù),將實(shí)際環(huán)境中的跟蹤誤差性能受限條件具體為數(shù)學(xué)函數(shù)式表達(dá),進(jìn)一步通過(guò)性能 誤差轉(zhuǎn)換,將原來(lái)受約束的跟蹤誤差控制問(wèn)題轉(zhuǎn)換為非約束轉(zhuǎn)換誤差穩(wěn)定性控制問(wèn)題,針 對(duì)非約束轉(zhuǎn)換誤差設(shè)計(jì)自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制,并對(duì)于系統(tǒng)中不可測(cè)量的狀態(tài)設(shè)計(jì)狀態(tài)觀測(cè) 器,最終非約束轉(zhuǎn)化誤差的穩(wěn)定能夠使得末端軌跡跟蹤滿足性能受限條件限制。因此通過(guò) 引入性能約束函數(shù)的性能誤差轉(zhuǎn)換自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法,能夠根據(jù)具體實(shí)際性能約 束,設(shè)計(jì)相對(duì)應(yīng)的性能受限函數(shù),實(shí)現(xiàn)柔性機(jī)械臂性能受限條件下的軌跡跟蹤控制。
[0004] 已有的利用神經(jīng)網(wǎng)絡(luò)對(duì)柔性機(jī)械臂系統(tǒng)中未知模型動(dòng)態(tài)進(jìn)行逼近的過(guò)程中,需要 不斷的在線調(diào)整,每次開(kāi)機(jī)運(yùn)行系統(tǒng)時(shí),控制器需要重新調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值,在權(quán)值調(diào)整的 初始階段,神經(jīng)網(wǎng)絡(luò)對(duì)于未知模型動(dòng)態(tài)的逼近誤差比較大,而且調(diào)整的過(guò)程是非常耗時(shí)的, 這使整體的控制效果受到影響。對(duì)于相同的控制任務(wù),神經(jīng)網(wǎng)絡(luò)逼近的未知模型動(dòng)態(tài)是基 本一致的,所以重復(fù)的神經(jīng)網(wǎng)絡(luò)權(quán)值調(diào)整是冗余的操作。為了解決神經(jīng)網(wǎng)絡(luò)耗時(shí)冗余的在 線調(diào)整過(guò)程,需要神經(jīng)網(wǎng)絡(luò)的權(quán)值最終收斂,然而這是非常困難達(dá)到的。確定學(xué)習(xí)理論 (Wang C. and Hill D.J.. Learning From Neural Control[J]. IEEE Transactions onNeural Networks,2006,17(1): 130-145)已經(jīng)證明對(duì)于周期或者類周期的軌跡進(jìn)行神經(jīng) 網(wǎng)絡(luò)逼近時(shí),神經(jīng)網(wǎng)絡(luò)權(quán)值能夠最終收斂?;诖_定學(xué)習(xí)理論的性能受限柔性機(jī)械臂的軌 跡跟蹤控制方法,存儲(chǔ)收斂后的神經(jīng)網(wǎng)絡(luò)權(quán)值,在下一次相同的控制任務(wù)中,直接利用存儲(chǔ) 的神經(jīng)網(wǎng)絡(luò)權(quán)值,避免重復(fù)的神經(jīng)網(wǎng)絡(luò)的在線調(diào)整過(guò)程,實(shí)現(xiàn)基于經(jīng)驗(yàn)知識(shí)的常值神經(jīng)網(wǎng) 絡(luò)控制。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提出一種基于確定學(xué)習(xí)理論 的性能受限柔性機(jī)械臂的軌跡跟蹤控制方法,避免對(duì)于多次相同控制任務(wù),同時(shí)滿足實(shí)際 控制環(huán)境中具體跟蹤誤差性能約束情況下的軌跡跟蹤控制任務(wù)。
[0006] 為了達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案:
[0007] 本發(fā)明的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,包含如下步驟:
[0008] 步驟(1):建立柔性機(jī)械臂動(dòng)態(tài)模型:通過(guò)狀態(tài)變換,建立單連桿柔性機(jī)械臂解耦 合的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型;
[0009] 步驟(2):建立系統(tǒng)狀態(tài)觀測(cè)器:對(duì)模型中不可直接測(cè)量的系統(tǒng)狀態(tài)設(shè)計(jì)狀態(tài)觀測(cè) 器: Q = HQ+<9 ?!?p 0 0 八 A , , 1 0: 0 ρ 0
[0010] <Q = ?/?4] , Η= Α Λ , 0 0 Q ρ ι. γ f· γ> 、 _ 1 2 3 4 _
[0011]其中,ρ和ri為設(shè)計(jì)參數(shù),i = l,…,4,[例% p'iAj分別為系統(tǒng)中不可測(cè)量狀 態(tài)[υ2 υ3 υ4]的狀態(tài)觀測(cè)器;
[0012] 步驟(3):設(shè)計(jì)跟蹤誤差性能約束條件:對(duì)連桿輸出角度與周期參考軌跡輸出角度 之間的跟蹤誤差,設(shè)計(jì)性能函數(shù)對(duì)跟蹤誤差的暫態(tài)和穩(wěn)態(tài)性能進(jìn)行約束,具體為: A = -?
[0013] -嘆⑴ < e 丨(,)< 印(〇 ρ{? = {ρ〇~ p〇)^st +
[0014] 其中,P(t)為性能函數(shù),0〇4~、8、心5:為設(shè)計(jì)常數(shù),^為關(guān)節(jié)連桿角度參考周期性 軌跡,ei為軌跡跟蹤誤差;
[0015] 設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)ψ(ει),將受限跟蹤誤差的(〖)轉(zhuǎn)換為轉(zhuǎn)換誤差£1 (t):
[0017] 步驟(4):基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器:利用確定學(xué)習(xí)理論,設(shè)計(jì)自適 應(yīng)RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)控制器:
[0018] Μ = -Η,ε4-\ν' S{X)
[0019] 其中,幻為神經(jīng)網(wǎng)絡(luò)輸出,k4為設(shè)計(jì)的控制器增益常數(shù),ε4為通過(guò)以下設(shè)計(jì) 過(guò)程計(jì)算出的中間誤差量:
[0020]根據(jù)步驟(2)建立的狀態(tài)觀測(cè)器輸出//色]和步驟(3)中轉(zhuǎn)換后的非 受限轉(zhuǎn)換誤差ε i,設(shè)計(jì)虛擬控制器α!,α2,α3: €?^ ~ -^ ? = ~^2 ( ΡΦζ ~α\)~ 6'| + + i^\X ^ + ^)C\ ~ (^\? ~ ^)( ΡΨ2 ~ ) + (B-k]y -^{ρ-φ. ~ xrl) + [k:B ~m2 -A-,5-f \)/ + 2Β-kfy\(ρφ: -i;)
[0022] 其中1^(? = 1,2,3)為設(shè)計(jì)的虛擬控制器增益常數(shù),Xd為關(guān)節(jié)連桿角度參考周期性 軌跡,γ,B為虛擬控制中涉及的中間控制變量;
[0023] 控制器u中出現(xiàn)的中間誤差量& : s4 =/#4 -α3;
[0024] 步驟(5):利用經(jīng)驗(yàn)知識(shí)修正控制器:根據(jù)確定學(xué)習(xí)理論,將步驟(4)中神經(jīng)網(wǎng)絡(luò)權(quán) 值#的收斂值保存為F,實(shí)現(xiàn)利用表達(dá)經(jīng)驗(yàn)知識(shí)的常值RBF神經(jīng)網(wǎng)絡(luò)iFMX)修正控制器, 即控制器形式為:
[0025] U = -k^s^ - W iS () 〇
[0026] 作為優(yōu)選的技術(shù)方案,步驟(1)中,所述的柔性機(jī)械臂解耦合的四階規(guī)范系統(tǒng)形式 的動(dòng)態(tài)模型為:
[0028] 其中,xdPx2分別為關(guān)節(jié)連桿角度和電機(jī)轉(zhuǎn)動(dòng)角度,I和J分別為連桿和電機(jī)的慣 量,Μ為連桿的質(zhì)量,L為連桿的長(zhǎng)度,g為重力加速度,K為柔性部分彈簧的彈性系數(shù),u為控 制器,即電機(jī)的控制輸出。
[0029] 作為優(yōu)選的技術(shù)方案,步驟(3)中,所述的受限跟蹤誤差幻(〇通過(guò)設(shè)計(jì)一個(gè)嚴(yán)格 單調(diào)遞增光滑函數(shù)Ψ(ε〇轉(zhuǎn)換為轉(zhuǎn)換誤差^(0,通過(guò)控制 £1(〇的穩(wěn)定,使ei(t)滿足約束 條件-^ ? <6l⑷,從而實(shí)現(xiàn)約束條件下的軌跡跟蹤控制。
[0030] 作為優(yōu)選的技術(shù)方案,步驟(4)中,所述的虛擬控制器涉及的中間信號(hào)變量γ,B具 體為:產(chǎn)Ι/(^ + Μ + 1/(φ-^),B=p/p,神經(jīng)網(wǎng)絡(luò)輸出?(,)用于逼近機(jī)械臂系統(tǒng) 的未知的動(dòng)態(tài)信息,神經(jīng)網(wǎng)絡(luò)的輸入為為,?,毛;Γ,書為在線更新的神經(jīng)網(wǎng)絡(luò)權(quán)值 向量。
[0031] 作為優(yōu)選的技術(shù)方案,步驟(4)中,所述的神經(jīng)網(wǎng)絡(luò)權(quán)值是收斂的,基于確定學(xué)習(xí) 理論,跟蹤周期性軌跡輸入的神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)回歸向量S(X)滿足持續(xù)激勵(lì)條件,最終神 經(jīng)網(wǎng)絡(luò)權(quán)值#收斂到最優(yōu)值I? α
[0032] 作為優(yōu)選的技術(shù)方案,步驟(5)中,所述的修正的控制器包含了確定學(xué)習(xí)過(guò)程中的 經(jīng)驗(yàn)知識(shí)\ ;),使得控制器可以對(duì)于之后相同的控制任務(wù),實(shí)現(xiàn)快速收斂、低超調(diào)的動(dòng) 態(tài)性能。
[0033] 本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn)和有益效果:
[0034] 1、與目前存在的柔性機(jī)械臂軌跡跟蹤控制方法相比較,本發(fā)明提出的控制方法能 夠?qū)崿F(xiàn)軌跡跟蹤誤差滿足特定的性能約束條件,而不僅僅實(shí)現(xiàn)軌跡跟蹤誤差最終趨于零的 一個(gè)鄰域里面,還能實(shí)現(xiàn)對(duì)誤差的超調(diào)量和收斂速度進(jìn)行限制。
[0035] 2、本發(fā)明的方法通過(guò)設(shè)計(jì)性能函數(shù),調(diào)節(jié)性能函數(shù)的參數(shù),能夠?qū)⑿阅芗s束條件 通過(guò)數(shù)學(xué)函數(shù)的方式體現(xiàn)出來(lái),從而能夠進(jìn)一步的設(shè)計(jì)控制器。
[0036] 3、本發(fā)明的方法通過(guò)設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ε?),將受限的跟蹤誤差 eKt)轉(zhuǎn)換為轉(zhuǎn)換誤差 £1(〇,其本質(zhì)是將受限的跟蹤誤差控制問(wèn)題轉(zhuǎn)化為非受限誤差的穩(wěn) 定性問(wèn)題,便于控制器設(shè)計(jì)。
[0037] 4、本發(fā)明的方法能夠利用確定學(xué)習(xí)理論對(duì)系統(tǒng)的不確定模型動(dòng)態(tài)進(jìn)行學(xué)習(xí),并將 學(xué)習(xí)到的經(jīng)驗(yàn)知識(shí)以常值神經(jīng)網(wǎng)絡(luò)權(quán)值的形式進(jìn)行存儲(chǔ),使之以后進(jìn)行相同控制任務(wù)時(shí), 能夠直接利用存儲(chǔ)的知識(shí)進(jìn)行控制,避免冗余的在線調(diào)整過(guò)程,實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)離線控制,節(jié) 約時(shí)間的同時(shí)改善在初始階段的動(dòng)態(tài)跟蹤性能。
【附圖說(shuō)明】
[0038] 圖1是本發(fā)明柔性機(jī)械臂系統(tǒng)示意圖。
[0039] 圖2是本發(fā)明柔性機(jī)械臂的整體控制框圖。
[0040] 圖3是本發(fā)明神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段跟蹤誤差的收斂情況仿真圖。
[0041 ]圖4是本發(fā)明狀態(tài)觀測(cè)器與所觀測(cè)狀態(tài)間誤差仿真圖。
[0042]圖5是本發(fā)明神經(jīng)網(wǎng)絡(luò)權(quán)值收斂仿真圖。
[0043]圖6是本發(fā)明神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段的控制器輸出仿真圖。
[0044] 圖7是本發(fā)明使用常值神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)未知?jiǎng)討B(tài)的逼近仿真圖。
[0045] 圖8是本發(fā)明神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段和知識(shí)再利用控制階段跟蹤誤差收斂對(duì)比仿真 圖。
【具體實(shí)施方式】
[0046] 下面結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述,但本發(fā)明的實(shí)施方式不限 于此。
[0047] 實(shí)施例
[0048]本實(shí)施例主要研究柔性機(jī)械臂在跟蹤性能受限情況下的軌跡跟蹤控制,圖1為柔 性機(jī)械臂系統(tǒng)的示意圖。
[0049]基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法的整體控制框圖如圖2所示, 其詳細(xì)實(shí)施過(guò)程包括:
[0050]步驟(1):建立柔性機(jī)械臂動(dòng)態(tài)模型。
[0051 ]根據(jù)如下的柔性機(jī)械臂系統(tǒng)模型: ? /.V, i- MtfLsin v. + /C ( v, - = Ο
[0052] ' x I Jx, - K( v, - r, J = u
[0053] 轉(zhuǎn)化為解耦后的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型形式如下:
[0055] 其中,xdPx2分別為關(guān)節(jié)連桿角度和電機(jī)轉(zhuǎn)動(dòng)角度,I和J分別為連桿和電機(jī)的慣 量,Μ為連桿的質(zhì)量,L為連桿的長(zhǎng)度,g為重力加速度,K為柔性部分彈簧的彈性系數(shù),u為電 機(jī)的控制輸出;
[0056] 在本實(shí)例中,選取柔性機(jī)械臂的系統(tǒng)參數(shù)分別為:
[0057] M = 0.2kg,L=lm,I = 2.3kg · m2,K=15N · m/rad,J = 0.5kg · m2,g = 9.8m/s2
[0058] 步驟(2):建立系統(tǒng)狀態(tài)觀測(cè)器。
[0059] 由于系統(tǒng)中的可以測(cè)量的狀態(tài)為XI,而υ2,u3,u4在系統(tǒng)是不可測(cè)的,設(shè)計(jì)狀態(tài)觀測(cè) 器如下: Q = HQ+.9 0 p 0 0 Γ 0 0 ρ 0
[0060] 巧:他肩爲(wèi)戰(zhàn)],好=η η Λ 0 0 0 ρ I W h r3 r4_
[0061] 其中 p = 1250,ri = r3 = -2p,r2 = -3p,r4 = -p,[/^>:. ρφ, /)V」1 分別為系統(tǒng)中不可 測(cè)量狀態(tài)[u2 u3 υ4]的狀態(tài)觀測(cè)器。
[0062] 步驟(3):設(shè)計(jì)跟蹤誤差性能約束條件。
[0063] 詵檉加下的固期的參考軌協(xié):
[0065] 其中,Xd為關(guān)節(jié)連桿末端角度的參考角度軌跡,并且存在連續(xù)的導(dǎo)數(shù)44?,ei = Xl-Xd為連桿末端的軌跡跟蹤誤差。
[0066] 本實(shí)例中要求跟蹤誤差滿足如下的受限性能約束條件:針的最大超調(diào)量上限和下 限分別為1.44和-1.2,ei的收斂速度不能低于e 4,ei的穩(wěn)態(tài)誤差約束在-0.05和0.05之間, 根據(jù)上述約束條件設(shè)計(jì)性能受限函數(shù)如下:
[_/:,⑴丨(0 < l_2p⑴
[0067] j ,、, 、,
[p(/J-(1.2-0.05)^ 1 +0.05
[0068] 根據(jù)性能受限函數(shù),設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ει),將受限的軌跡跟蹤 誤差ex轉(zhuǎn)換為非受限的轉(zhuǎn)換誤差ε1:
[0070] 步驟(4):基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器。
[0071]通過(guò)設(shè)計(jì)控制器保證轉(zhuǎn)換誤差£1的穩(wěn)定,從而實(shí)現(xiàn)受限誤差ei滿足約束條件的要 求,具體為:
[0072] 首先設(shè)計(jì)本的虛擬控制器,并與狀態(tài)觀測(cè)器構(gòu)成誤差變量ε2: | A = 十十.δ??,
[0073] '
[εζ = ρφ2 - α{
[0074] 其中,ki = 1,i? = />//)。
[0075] 進(jìn)一步設(shè)計(jì)氧的虛擬控制器α2,并與狀態(tài)觀測(cè)器/奐構(gòu)成誤差變量ε3:
[ ] j 6?].二一人:'.6\ _ ?、| + A':'. +. + - ? A、', 一 A?)( ''私一.'?") 1? = P2(h - ?2
[0077] 其中,k2 = 4, γ =l/(p+ei)+l/(1.2p_ei)。
[0078] 進(jìn)一步設(shè)計(jì)筆的虛擬控制器α3,并與狀態(tài)觀測(cè)器構(gòu)成誤差變量ε4: + .? + i
[0079] - {&4 = />φΛ-α3
[0080] 其中,k3=l〇, L = k2B + (k.k^, + \)Bv + B + k, (By + By) et + (B - k,y -kz){ η φ, - x,.)
[0081 ] L - - : + ^k2B- [k^-, -k{B + \)γ + 2B-kj \{ρφζ -?)
[0082] 本實(shí)例中,柔性機(jī)械臂的系統(tǒng)模型動(dòng)態(tài)完全未知,利用神經(jīng)網(wǎng)絡(luò)逼近未知 的動(dòng)態(tài):尸(^〇 = /(~.(,,心4)研尤,其中神經(jīng)網(wǎng)絡(luò)的輸入1二[、夫士丈『,自適應(yīng)神經(jīng) 網(wǎng)絡(luò)學(xué)習(xí)控制器設(shè)計(jì)如下形式:
[0083] u = ~k4s4-WrS{X)
[0084] 其中,選擇控制器增益k4=20。
[0085] 選擇神經(jīng)網(wǎng)絡(luò)權(quán)值#在線更新調(diào)整率為:
[0086] 汝-
[0087] 系統(tǒng)初始狀態(tài)和神經(jīng)網(wǎng)絡(luò)參數(shù)的選擇如下:
[0088] 系統(tǒng)的初始條件:= [0.5,0.3.0.3.().3f
[0089] 神經(jīng)網(wǎng)絡(luò)參數(shù)選擇:神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)N = 9 X 9 X 11 X 11,權(quán)值初始值妒(0) = 0, 中心點(diǎn)均勻分布在[-0.9,0.9] X[-0.9,0.9] X [-1.5,1.5] X [-1.5,1.5],神經(jīng)網(wǎng)絡(luò)更新率 參數(shù) Γ =12,〇 = 0.0001。
[0090] 根據(jù)神經(jīng)網(wǎng)絡(luò)控制器》= -Α4£·4 - Α控制轉(zhuǎn)換誤差ε:穩(wěn)定,£1的穩(wěn)定使得受限 的跟蹤誤差ei滿足約束條件_0(〇<61(〇<1.20(〇,從而實(shí)現(xiàn)性能約束下的軌跡跟蹤控 制。
[0091] 圖3顯示學(xué)習(xí)階段跟蹤誤差的收斂的仿真圖,最終的跟蹤誤差ei在約束條件-p(t) <ei(t)<1.2p(t)內(nèi)波動(dòng),且在有限的時(shí)間內(nèi)收斂到零的一個(gè)小鄰域里面,從而滿足設(shè)定 的約束條件要求,實(shí)現(xiàn)在性能約束條件下的軌跡跟蹤控制。圖4為設(shè)計(jì)的狀態(tài)觀測(cè)器與系統(tǒng) 中所觀測(cè)狀態(tài)間的觀測(cè)誤差變化仿真圖。圖5為神經(jīng)網(wǎng)絡(luò)對(duì)未知系統(tǒng)動(dòng)態(tài)F(X)的學(xué)習(xí)權(quán)值 收斂仿真圖。圖6為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段控制器輸出u的波形仿真圖。根據(jù)圖5,在神經(jīng)網(wǎng)絡(luò)學(xué) 習(xí)階段,神經(jīng)網(wǎng)絡(luò)的權(quán)值最終收斂到常數(shù)值,存儲(chǔ)這些神經(jīng)網(wǎng)絡(luò)的權(quán)值常數(shù)值,作為系統(tǒng)未 知?jiǎng)討B(tài)?目息的表達(dá)。
[0092]步驟(5):利用經(jīng)驗(yàn)知識(shí)修正控制器。
[0093]在本實(shí)例中,通過(guò)對(duì)時(shí)間段[400s,500s]內(nèi)收斂的權(quán)值求平均值計(jì)算出常值神經(jīng) 網(wǎng)絡(luò)權(quán)值: -- λ . r 〇π〇4? W - wean i#r(t) L 」 ,<40山.50叫
[0095] 設(shè)計(jì)基于經(jīng)驗(yàn)知識(shí)的神經(jīng)網(wǎng)絡(luò)控制器:
[0096] U:: = - W' S ^)
[0097]其中,控制器中的控制參數(shù)選取與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段一致。
[0098] 圖7為常值神經(jīng)網(wǎng)絡(luò)爐4(Χ;)與未知系統(tǒng)動(dòng)態(tài)F(X)之間的逼近效果仿真圖,存儲(chǔ)的 常值神經(jīng)網(wǎng)絡(luò)能夠逼近未知的系統(tǒng),從而實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)對(duì)未知系統(tǒng)動(dòng)態(tài)的學(xué)習(xí)再利用過(guò) 程,避免冗余的在線重新調(diào)整過(guò)程。圖8為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段和經(jīng)驗(yàn)再利用控制階段跟蹤誤 差收斂對(duì)比效果仿真圖,對(duì)于相同的控制任務(wù),基于經(jīng)驗(yàn)知識(shí)的神經(jīng)網(wǎng)絡(luò)控制器具有更小 的超調(diào)量,在初始階段的動(dòng)態(tài)特性優(yōu)于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段,縮短調(diào)節(jié)時(shí)間。
[0099] 上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的 限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化, 均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,其特征在于,包含如下步驟: 步驟(1):建立柔性機(jī)械臂動(dòng)態(tài)模型:通過(guò)狀態(tài)變換,建立單連桿柔性機(jī)械臂解禪合的 四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型; 步驟(2):建立系統(tǒng)狀態(tài)觀測(cè)器:對(duì)模型中不可直接測(cè)量的系統(tǒng)狀態(tài)設(shè)計(jì)狀態(tài)觀測(cè)器:其中,P和ri為設(shè)計(jì)參數(shù),? = 1,···,4,[/冷:而//耗]分別為系統(tǒng)中不可測(cè)量狀態(tài)[U2 化U4]的狀態(tài)觀測(cè)器; 步驟(3):設(shè)計(jì)跟蹤誤差性能約束條件:對(duì)連桿輸出角度與周期參考軌跡輸出角度之間 的跟蹤誤差,設(shè)計(jì)性能函數(shù)對(duì)跟蹤誤差的暫態(tài)和穩(wěn)態(tài)性能進(jìn)行約束,具體為:其中,P(t)為性能函數(shù),口〇、口》、3、^^為設(shè)計(jì)常數(shù),義<1為關(guān)節(jié)連桿角度參考周期性軌跡, ei為軌跡跟蹤誤差; 設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ει),將受限跟蹤誤差ei(t)轉(zhuǎn)換為轉(zhuǎn)換誤差ei(t):步驟(4):基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器:利用確定學(xué)習(xí)理論,設(shè)計(jì)自適應(yīng)RBF 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)控制器:其中,砍苗(義)為神經(jīng)網(wǎng)絡(luò)輸出,k4為設(shè)計(jì)的控制器增益常數(shù),64為通過(guò)W下設(shè)計(jì)過(guò)程計(jì) 算出的中間誤差量: 根據(jù)步驟(2)建立的狀態(tài)觀測(cè)器輸出[好喪片市;有J巧步驟(3)中轉(zhuǎn)換后的非受限轉(zhuǎn) 換誤差ε 1,設(shè)計(jì)虛擬控制器曰1,曰2,口3 :其中ki(i = l,2,3)為設(shè)計(jì)的虛擬控制器增益常數(shù),xd為關(guān)節(jié)連桿角度參考周期性軌跡, 丫,B為虛擬控制中設(shè)及的中間控制變量; 控制器U中出現(xiàn)的中間誤差量E4: 扛-; 步驟(5):利用經(jīng)驗(yàn)知識(shí)修正控制器:根據(jù)確定學(xué)習(xí)理論,將步驟(4)中神經(jīng)網(wǎng)絡(luò)權(quán)值# 的收斂值保存為巧,實(shí)現(xiàn)利用表達(dá)經(jīng)驗(yàn)知識(shí)的常值RB巧巾經(jīng)網(wǎng)絡(luò)灰、修正控制器,即控 制器形式為:2. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,其特征 在于,步驟(1)中,所述的柔性機(jī)械臂解禪合的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型為:其中,XI和X2分別為關(guān)節(jié)連桿角度和電機(jī)轉(zhuǎn)動(dòng)角度,I和J分別為連桿和電機(jī)的慣量,Μ為 連桿的質(zhì)量,L為連桿的長(zhǎng)度,g為重力加速度,Κ為柔性部分彈黃的彈性系數(shù),U為控制器,即 電機(jī)的控制輸出。3. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,其特征 在于,步驟(3)中,所述的受限跟蹤誤差ei(t)通過(guò)設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ει)轉(zhuǎn) 換為轉(zhuǎn)換誤差ei(t),通過(guò)控制ei(t)的穩(wěn)定,使ei(t)滿足約束條件 從而實(shí)現(xiàn)約束條件下的軌跡跟蹤控制。4. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,其特征在于, 步驟(4)中,所述的虛擬控制器設(shè)及的中間信號(hào)變量丫,B具體為:r = 1 / (W+?·, K1 '楊-6,),B=片/.口,. 神經(jīng)網(wǎng)絡(luò)輸出砍、(義)用于逼近機(jī)械臂系統(tǒng)的未知的動(dòng)態(tài)信息,神經(jīng)網(wǎng)絡(luò)的輸入為 jr=b,中,,W為在線更新的神經(jīng)網(wǎng)絡(luò)權(quán)值向量。5. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,其特征 在于,步驟(4)中,所述的神經(jīng)網(wǎng)絡(luò)權(quán)值是收斂的,基于確定學(xué)習(xí)理論,跟蹤周期性軌跡輸入 的神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)回歸向量S(X)滿足持續(xù)激勵(lì)條件,最終神經(jīng)網(wǎng)絡(luò)權(quán)值#收斂到最優(yōu) 值巧。6. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法,其特征 在于,步驟(5)中,所述的修正的控制器包含了確定學(xué)習(xí)過(guò)程中的經(jīng)驗(yàn)知識(shí)使得 控制器可W對(duì)于之后相同的控制任務(wù),實(shí)現(xiàn)快速收斂、低超調(diào)的動(dòng)態(tài)性能。
【文檔編號(hào)】B25J9/16GK106078741SQ201610457032
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月21日
【發(fā)明人】王敏, 楊安樂(lè), 方?jīng)_
【申請(qǐng)人】華南理工大學(xué)