基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法

文檔序號(hào)：10708451閱讀：448來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>五金工具產(chǎn)品及配附件制造技術(shù)

基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法
【專利摘要】本發(fā)明公開(kāi)了一種基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，該方法針對(duì)柔性機(jī)械臂動(dòng)態(tài)模型的不確定性，設(shè)計(jì)跟蹤誤差，使之滿足約束條件限制，并構(gòu)成誤差控制器。本發(fā)明步驟包括：建立柔性機(jī)械臂動(dòng)態(tài)模型；建立系統(tǒng)狀態(tài)觀測(cè)器；設(shè)計(jì)跟蹤誤差性能約束條件；基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器；利用經(jīng)驗(yàn)知識(shí)修正控制器。本發(fā)明所設(shè)計(jì)的控制方法可以實(shí)現(xiàn)快速收斂、低超調(diào)量的動(dòng)態(tài)性能，滿足設(shè)定的約束條件限制，同時(shí)避免神經(jīng)網(wǎng)絡(luò)權(quán)值在線調(diào)節(jié)，縮短控制時(shí)間。另外，該方法能夠利用已經(jīng)學(xué)習(xí)到的經(jīng)驗(yàn)知識(shí)對(duì)之后的相同控制任務(wù)直接實(shí)現(xiàn)快速控制。
【專利說(shuō)明】
基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于柔性機(jī)械臂的軌跡跟蹤控制領(lǐng)域，特別是針對(duì)柔性機(jī)械臂系統(tǒng)動(dòng)態(tài)模型的不確定性，設(shè)計(jì)跟蹤誤差，使之滿足約束條件限制。給出一種基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法。
【背景技術(shù)】
[0002] 如今，隨著機(jī)器人向著高精度、快速的方向發(fā)展，機(jī)械部件越來(lái)越趨向輕型化。相比于傳統(tǒng)的剛性機(jī)械臂，柔性機(jī)械臂具有結(jié)構(gòu)輕、工作空間大和效率高的特點(diǎn)，所以柔性元件在制造業(yè)，航空航天等領(lǐng)域的應(yīng)用越來(lái)越廣，但是柔性臂桿帶來(lái)的柔性效應(yīng)，會(huì)導(dǎo)致機(jī)械振動(dòng)，這會(huì)使得軌跡控制要求的平穩(wěn)性與準(zhǔn)確性更難達(dá)到，柔性機(jī)械臂末端的軌跡跟蹤控制越發(fā)困難。而在實(shí)際工業(yè)應(yīng)用中，由于工業(yè)環(huán)境的約束限制，諸如電機(jī)最大輸出力矩的限制、穩(wěn)態(tài)階段末端軌跡跟蹤誤差限制、初始動(dòng)態(tài)階段跟蹤誤差的最大超調(diào)量和收斂速度的限制，往往還需要系統(tǒng)的控制性能滿足一定的約束條件，這使設(shè)計(jì)的控制方案不僅要保證軌跡跟蹤誤差系統(tǒng)穩(wěn)定，而且跟蹤誤差的跟蹤性能還要滿足實(shí)際情形下的約束，這給控制方案的設(shè)計(jì)帶來(lái)很大的挑戰(zhàn)。
[0003] 針對(duì)柔性機(jī)械臂系統(tǒng)的軌跡跟蹤控制，反演控制、滑?？刂?、動(dòng)態(tài)面控制等智能控制方法結(jié)合神經(jīng)網(wǎng)絡(luò)控制，能夠解決在系統(tǒng)模型動(dòng)態(tài)不確定情況下軌跡控制要求的平穩(wěn)性和準(zhǔn)確性問(wèn)題。但是對(duì)于跟蹤性能有具體約束的情況下，這些控制方法無(wú)法控制跟蹤誤差滿足特定性能受限的要求。一種性能誤差轉(zhuǎn)換自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法，通過(guò)引入性能受限函數(shù)，將實(shí)際環(huán)境中的跟蹤誤差性能受限條件具體為數(shù)學(xué)函數(shù)式表達(dá)，進(jìn)一步通過(guò)性能誤差轉(zhuǎn)換，將原來(lái)受約束的跟蹤誤差控制問(wèn)題轉(zhuǎn)換為非約束轉(zhuǎn)換誤差穩(wěn)定性控制問(wèn)題，針對(duì)非約束轉(zhuǎn)換誤差設(shè)計(jì)自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制，并對(duì)于系統(tǒng)中不可測(cè)量的狀態(tài)設(shè)計(jì)狀態(tài)觀測(cè) 器，最終非約束轉(zhuǎn)化誤差的穩(wěn)定能夠使得末端軌跡跟蹤滿足性能受限條件限制。因此通過(guò) 引入性能約束函數(shù)的性能誤差轉(zhuǎn)換自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法，能夠根據(jù)具體實(shí)際性能約束，設(shè)計(jì)相對(duì)應(yīng)的性能受限函數(shù)，實(shí)現(xiàn)柔性機(jī)械臂性能受限條件下的軌跡跟蹤控制。
[0004] 已有的利用神經(jīng)網(wǎng)絡(luò)對(duì)柔性機(jī)械臂系統(tǒng)中未知模型動(dòng)態(tài)進(jìn)行逼近的過(guò)程中，需要不斷的在線調(diào)整，每次開(kāi)機(jī)運(yùn)行系統(tǒng)時(shí)，控制器需要重新調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值，在權(quán)值調(diào)整的初始階段，神經(jīng)網(wǎng)絡(luò)對(duì)于未知模型動(dòng)態(tài)的逼近誤差比較大，而且調(diào)整的過(guò)程是非常耗時(shí)的，這使整體的控制效果受到影響。對(duì)于相同的控制任務(wù)，神經(jīng)網(wǎng)絡(luò)逼近的未知模型動(dòng)態(tài)是基本一致的，所以重復(fù)的神經(jīng)網(wǎng)絡(luò)權(quán)值調(diào)整是冗余的操作。為了解決神經(jīng)網(wǎng)絡(luò)耗時(shí)冗余的在線調(diào)整過(guò)程，需要神經(jīng)網(wǎng)絡(luò)的權(quán)值最終收斂，然而這是非常困難達(dá)到的。確定學(xué)習(xí)理論 (Wang C. and Hill D.J.. Learning From Neural Control[J]. IEEE Transactions onNeural Networks,2006，17(1): 130-145)已經(jīng)證明對(duì)于周期或者類周期的軌跡進(jìn)行神經(jīng) 網(wǎng)絡(luò)逼近時(shí)，神經(jīng)網(wǎng)絡(luò)權(quán)值能夠最終收斂?；诖_定學(xué)習(xí)理論的性能受限柔性機(jī)械臂的軌跡跟蹤控制方法，存儲(chǔ)收斂后的神經(jīng)網(wǎng)絡(luò)權(quán)值，在下一次相同的控制任務(wù)中，直接利用存儲(chǔ) 的神經(jīng)網(wǎng)絡(luò)權(quán)值，避免重復(fù)的神經(jīng)網(wǎng)絡(luò)的在線調(diào)整過(guò)程，實(shí)現(xiàn)基于經(jīng)驗(yàn)知識(shí)的常值神經(jīng)網(wǎng) 絡(luò)控制。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足，提出一種基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂的軌跡跟蹤控制方法，避免對(duì)于多次相同控制任務(wù)，同時(shí)滿足實(shí)際控制環(huán)境中具體跟蹤誤差性能約束情況下的軌跡跟蹤控制任務(wù)。
[0006] 為了達(dá)到上述目的，本發(fā)明采用以下技術(shù)方案：
[0007] 本發(fā)明的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，包含如下步驟：
[0008] 步驟（1):建立柔性機(jī)械臂動(dòng)態(tài)模型：通過(guò)狀態(tài)變換，建立單連桿柔性機(jī)械臂解耦合的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型；
[0009] 步驟(2):建立系統(tǒng)狀態(tài)觀測(cè)器:對(duì)模型中不可直接測(cè)量的系統(tǒng)狀態(tài)設(shè)計(jì)狀態(tài)觀測(cè) 器： Q = HQ+<9 ?！?p 0 0 八 A ，， 1 0: 0 ρ 0
[0010] <Q = ?/?4] , Η= Α Λ , 0 0 Q ρ ι. γ f· γ> 、 _ 1 2 3 4 _
[0011]其中，ρ和ri為設(shè)計(jì)參數(shù)，i = l,…，4,[例％ p'iAj分別為系統(tǒng)中不可測(cè)量狀態(tài)[υ2 υ3 υ4]的狀態(tài)觀測(cè)器；
[0012] 步驟(3):設(shè)計(jì)跟蹤誤差性能約束條件:對(duì)連桿輸出角度與周期參考軌跡輸出角度之間的跟蹤誤差，設(shè)計(jì)性能函數(shù)對(duì)跟蹤誤差的暫態(tài)和穩(wěn)態(tài)性能進(jìn)行約束，具體為： A = -?
[0013] -嘆⑴ < e 丨（，）< 印(〇 ρ{? = {ρ〇~ p〇)^st +
[0014] 其中，P(t)為性能函數(shù)，0〇4~、8、心5：為設(shè)計(jì)常數(shù)，^為關(guān)節(jié)連桿角度參考周期性軌跡，ei為軌跡跟蹤誤差；
[0015] 設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)ψ(ει)，將受限跟蹤誤差的(〖)轉(zhuǎn)換為轉(zhuǎn)換誤差￡1 (t):
[0017] 步驟(4):基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器:利用確定學(xué)習(xí)理論，設(shè)計(jì)自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)控制器：
[0018] Μ = -Η,ε4-\ν' S{X)
[0019] 其中，幻為神經(jīng)網(wǎng)絡(luò)輸出，k4為設(shè)計(jì)的控制器增益常數(shù)，ε4為通過(guò)以下設(shè)計(jì) 過(guò)程計(jì)算出的中間誤差量：
[0020]根據(jù)步驟（2)建立的狀態(tài)觀測(cè)器輸出//色]和步驟（3)中轉(zhuǎn)換后的非受限轉(zhuǎn)換誤差ε i，設(shè)計(jì)虛擬控制器α!，α2，α3: €?^ ~ -^ ? = ~^2 ( ΡΦζ ~α\)~ 6'| + + i^\X ^ + ^)C\ ~ (^\? ~ ^)( ΡΨ2 ~ ) + (B-k]y -^{ρ-φ. ~ xrl) + [k:B ~m2 -A-,5-f \)/ + 2Β-kfy\(ρφ: -i;)
[0022] 其中1^(? = 1，2,3)為設(shè)計(jì)的虛擬控制器增益常數(shù)，Xd為關(guān)節(jié)連桿角度參考周期性軌跡，γ，B為虛擬控制中涉及的中間控制變量；
[0023] 控制器u中出現(xiàn)的中間誤差量& : s4 =/#4 -α3;
[0024] 步驟(5):利用經(jīng)驗(yàn)知識(shí)修正控制器:根據(jù)確定學(xué)習(xí)理論，將步驟(4)中神經(jīng)網(wǎng)絡(luò)權(quán) 值#的收斂值保存為F，實(shí)現(xiàn)利用表達(dá)經(jīng)驗(yàn)知識(shí)的常值RBF神經(jīng)網(wǎng)絡(luò)iFMX)修正控制器，即控制器形式為：
[0025] U = -k^s^ - W iS () 〇
[0026] 作為優(yōu)選的技術(shù)方案，步驟（1)中，所述的柔性機(jī)械臂解耦合的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型為：
[0028] 其中，xdPx2分別為關(guān)節(jié)連桿角度和電機(jī)轉(zhuǎn)動(dòng)角度，I和J分別為連桿和電機(jī)的慣量，Μ為連桿的質(zhì)量，L為連桿的長(zhǎng)度，g為重力加速度，K為柔性部分彈簧的彈性系數(shù)，u為控制器，即電機(jī)的控制輸出。
[0029] 作為優(yōu)選的技術(shù)方案，步驟(3)中，所述的受限跟蹤誤差幻(〇通過(guò)設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ε〇轉(zhuǎn)換為轉(zhuǎn)換誤差^(0,通過(guò)控制￡1(〇的穩(wěn)定，使ei(t)滿足約束條件-^ ? <6l⑷，從而實(shí)現(xiàn)約束條件下的軌跡跟蹤控制。
[0030] 作為優(yōu)選的技術(shù)方案，步驟(4)中，所述的虛擬控制器涉及的中間信號(hào)變量γ，B具體為：產(chǎn)Ι/(^ + Μ + 1/(φ-^)，B=p/p，神經(jīng)網(wǎng)絡(luò)輸出?(，）用于逼近機(jī)械臂系統(tǒng) 的未知的動(dòng)態(tài)信息，神經(jīng)網(wǎng)絡(luò)的輸入為為,?，毛；Γ，書為在線更新的神經(jīng)網(wǎng)絡(luò)權(quán)值向量。
[0031] 作為優(yōu)選的技術(shù)方案，步驟(4)中，所述的神經(jīng)網(wǎng)絡(luò)權(quán)值是收斂的，基于確定學(xué)習(xí) 理論，跟蹤周期性軌跡輸入的神經(jīng)網(wǎng)絡(luò)，神經(jīng)網(wǎng)絡(luò)回歸向量S(X)滿足持續(xù)激勵(lì)條件，最終神經(jīng)網(wǎng)絡(luò)權(quán)值#收斂到最優(yōu)值I? α
[0032] 作為優(yōu)選的技術(shù)方案，步驟(5)中，所述的修正的控制器包含了確定學(xué)習(xí)過(guò)程中的經(jīng)驗(yàn)知識(shí)\ ；)，使得控制器可以對(duì)于之后相同的控制任務(wù)，實(shí)現(xiàn)快速收斂、低超調(diào)的動(dòng) 態(tài)性能。
[0033] 本發(fā)明與現(xiàn)有技術(shù)相比，具有如下優(yōu)點(diǎn)和有益效果：
[0034] 1、與目前存在的柔性機(jī)械臂軌跡跟蹤控制方法相比較，本發(fā)明提出的控制方法能夠?qū)崿F(xiàn)軌跡跟蹤誤差滿足特定的性能約束條件，而不僅僅實(shí)現(xiàn)軌跡跟蹤誤差最終趨于零的一個(gè)鄰域里面，還能實(shí)現(xiàn)對(duì)誤差的超調(diào)量和收斂速度進(jìn)行限制。
[0035] 2、本發(fā)明的方法通過(guò)設(shè)計(jì)性能函數(shù)，調(diào)節(jié)性能函數(shù)的參數(shù)，能夠?qū)⑿阅芗s束條件通過(guò)數(shù)學(xué)函數(shù)的方式體現(xiàn)出來(lái)，從而能夠進(jìn)一步的設(shè)計(jì)控制器。
[0036] 3、本發(fā)明的方法通過(guò)設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ε?)，將受限的跟蹤誤差 eKt)轉(zhuǎn)換為轉(zhuǎn)換誤差￡1(〇,其本質(zhì)是將受限的跟蹤誤差控制問(wèn)題轉(zhuǎn)化為非受限誤差的穩(wěn) 定性問(wèn)題，便于控制器設(shè)計(jì)。
[0037] 4、本發(fā)明的方法能夠利用確定學(xué)習(xí)理論對(duì)系統(tǒng)的不確定模型動(dòng)態(tài)進(jìn)行學(xué)習(xí)，并將學(xué)習(xí)到的經(jīng)驗(yàn)知識(shí)以常值神經(jīng)網(wǎng)絡(luò)權(quán)值的形式進(jìn)行存儲(chǔ)，使之以后進(jìn)行相同控制任務(wù)時(shí)，能夠直接利用存儲(chǔ)的知識(shí)進(jìn)行控制，避免冗余的在線調(diào)整過(guò)程，實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)離線控制，節(jié) 約時(shí)間的同時(shí)改善在初始階段的動(dòng)態(tài)跟蹤性能。
【附圖說(shuō)明】
[0038] 圖1是本發(fā)明柔性機(jī)械臂系統(tǒng)示意圖。
[0039] 圖2是本發(fā)明柔性機(jī)械臂的整體控制框圖。
[0040] 圖3是本發(fā)明神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段跟蹤誤差的收斂情況仿真圖。
[0041 ]圖4是本發(fā)明狀態(tài)觀測(cè)器與所觀測(cè)狀態(tài)間誤差仿真圖。
[0042]圖5是本發(fā)明神經(jīng)網(wǎng)絡(luò)權(quán)值收斂仿真圖。
[0043]圖6是本發(fā)明神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段的控制器輸出仿真圖。
[0044] 圖7是本發(fā)明使用常值神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)未知?jiǎng)討B(tài)的逼近仿真圖。
[0045] 圖8是本發(fā)明神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段和知識(shí)再利用控制階段跟蹤誤差收斂對(duì)比仿真圖。
【具體實(shí)施方式】
[0046] 下面結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述，但本發(fā)明的實(shí)施方式不限于此。
[0047] 實(shí)施例
[0048]本實(shí)施例主要研究柔性機(jī)械臂在跟蹤性能受限情況下的軌跡跟蹤控制，圖1為柔性機(jī)械臂系統(tǒng)的示意圖。
[0049]基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法的整體控制框圖如圖2所示，其詳細(xì)實(shí)施過(guò)程包括：
[0050]步驟(1):建立柔性機(jī)械臂動(dòng)態(tài)模型。
[0051 ]根據(jù)如下的柔性機(jī)械臂系統(tǒng)模型： ? /.V, i- MtfLsin v. + /C ( v, - = Ο
[0052] ' x I Jx, - K( v, - r, J = u
[0053] 轉(zhuǎn)化為解耦后的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型形式如下：
[0055] 其中，xdPx2分別為關(guān)節(jié)連桿角度和電機(jī)轉(zhuǎn)動(dòng)角度，I和J分別為連桿和電機(jī)的慣量，Μ為連桿的質(zhì)量，L為連桿的長(zhǎng)度，g為重力加速度，K為柔性部分彈簧的彈性系數(shù)，u為電機(jī)的控制輸出；
[0056] 在本實(shí)例中，選取柔性機(jī)械臂的系統(tǒng)參數(shù)分別為：
[0057] M = 0.2kg，L=lm，I = 2.3kg · m2，K=15N · m/rad，J = 0.5kg · m2，g = 9.8m/s2
[0058] 步驟(2):建立系統(tǒng)狀態(tài)觀測(cè)器。
[0059] 由于系統(tǒng)中的可以測(cè)量的狀態(tài)為XI，而υ2，u3，u4在系統(tǒng)是不可測(cè)的，設(shè)計(jì)狀態(tài)觀測(cè) 器如下： Q = HQ+.9 0 p 0 0 Γ 0 0 ρ 0
[0060] 巧：他肩爲(wèi)戰(zhàn)]，好=η η Λ 0 0 0 ρ I W h r3 r4_
[0061] 其中 p = 1250，ri = r3 = -2p，r2 = -3p，r4 = -p，[/^>:. ρφ, /)V」1 分別為系統(tǒng)中不可測(cè)量狀態(tài)[u2 u3 υ4]的狀態(tài)觀測(cè)器。
[0062] 步驟(3):設(shè)計(jì)跟蹤誤差性能約束條件。
[0063] 詵檉加下的固期的參考軌協(xié)：
[0065] 其中，Xd為關(guān)節(jié)連桿末端角度的參考角度軌跡，并且存在連續(xù)的導(dǎo)數(shù)44?，ei = Xl-Xd為連桿末端的軌跡跟蹤誤差。
[0066] 本實(shí)例中要求跟蹤誤差滿足如下的受限性能約束條件:針的最大超調(diào)量上限和下限分別為1.44和-1.2，ei的收斂速度不能低于e 4，ei的穩(wěn)態(tài)誤差約束在-0.05和0.05之間，根據(jù)上述約束條件設(shè)計(jì)性能受限函數(shù)如下：
[_/:，⑴丨（0 < l_2p⑴
[0067] j ,、，、，
[p(/J-(1.2-0.05)^ 1 +0.05
[0068] 根據(jù)性能受限函數(shù)，設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ει)，將受限的軌跡跟蹤誤差ex轉(zhuǎn)換為非受限的轉(zhuǎn)換誤差ε1:
[0070] 步驟(4):基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器。
[0071]通過(guò)設(shè)計(jì)控制器保證轉(zhuǎn)換誤差￡1的穩(wěn)定，從而實(shí)現(xiàn)受限誤差ei滿足約束條件的要求，具體為：
[0072] 首先設(shè)計(jì)本的虛擬控制器，并與狀態(tài)觀測(cè)器構(gòu)成誤差變量ε2: | A = 十十.δ??,
[0073] '
[εζ = ρφ2 - α{
[0074] 其中，ki = 1，i? = />//)。
[0075] 進(jìn)一步設(shè)計(jì)氧的虛擬控制器α2，并與狀態(tài)觀測(cè)器/奐構(gòu)成誤差變量ε3:
[ ] j 6?].二一人:'.6\ _ ?、| + A':'. +. + - ? A、', 一 A?)( ''私一.'?") 1? = P2(h - ?2
[0077] 其中，k2 = 4, γ =l/(p+ei)+l/(1.2p_ei)。
[0078] 進(jìn)一步設(shè)計(jì)筆的虛擬控制器α3,并與狀態(tài)觀測(cè)器構(gòu)成誤差變量ε4: + .? + i
[0079] - {&4 = />φΛ-α3
[0080] 其中，k3=l〇， L = k2B + (k.k^, + \)Bv + B + k, (By + By) et + (B - k,y -kz){ η φ, - x,.)
[0081 ] L - - : + ^k2B- [k^-, -k{B + \)γ + 2B-kj \{ρφζ -?)
[0082] 本實(shí)例中，柔性機(jī)械臂的系統(tǒng)模型動(dòng)態(tài)完全未知，利用神經(jīng)網(wǎng)絡(luò)逼近未知的動(dòng)態(tài)：尸(^〇 = /(~.(,，心4)研尤，其中神經(jīng)網(wǎng)絡(luò)的輸入1二[、夫士丈『，自適應(yīng)神經(jīng) 網(wǎng)絡(luò)學(xué)習(xí)控制器設(shè)計(jì)如下形式：
[0083] u = ~k4s4-WrS{X)
[0084] 其中，選擇控制器增益k4=20。
[0085] 選擇神經(jīng)網(wǎng)絡(luò)權(quán)值#在線更新調(diào)整率為：
[0086] 汝-
[0087] 系統(tǒng)初始狀態(tài)和神經(jīng)網(wǎng)絡(luò)參數(shù)的選擇如下：
[0088] 系統(tǒng)的初始條件:= [0.5,0.3.0.3.().3f
[0089] 神經(jīng)網(wǎng)絡(luò)參數(shù)選擇:神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)N = 9 X 9 X 11 X 11，權(quán)值初始值妒(0) = 0，中心點(diǎn)均勻分布在[-0.9,0.9] X[-0.9,0.9] X [-1.5,1.5] X [-1.5,1.5]，神經(jīng)網(wǎng)絡(luò)更新率參數(shù) Γ =12,〇 = 0.0001。
[0090] 根據(jù)神經(jīng)網(wǎng)絡(luò)控制器》= -Α4￡·4 - Α控制轉(zhuǎn)換誤差ε:穩(wěn)定，￡1的穩(wěn)定使得受限的跟蹤誤差ei滿足約束條件_0(〇<61(〇<1.20(〇，從而實(shí)現(xiàn)性能約束下的軌跡跟蹤控制。
[0091] 圖3顯示學(xué)習(xí)階段跟蹤誤差的收斂的仿真圖，最終的跟蹤誤差ei在約束條件-p(t) <ei(t)<1.2p(t)內(nèi)波動(dòng)，且在有限的時(shí)間內(nèi)收斂到零的一個(gè)小鄰域里面，從而滿足設(shè)定的約束條件要求，實(shí)現(xiàn)在性能約束條件下的軌跡跟蹤控制。圖4為設(shè)計(jì)的狀態(tài)觀測(cè)器與系統(tǒng) 中所觀測(cè)狀態(tài)間的觀測(cè)誤差變化仿真圖。圖5為神經(jīng)網(wǎng)絡(luò)對(duì)未知系統(tǒng)動(dòng)態(tài)F(X)的學(xué)習(xí)權(quán)值收斂仿真圖。圖6為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段控制器輸出u的波形仿真圖。根據(jù)圖5,在神經(jīng)網(wǎng)絡(luò)學(xué) 習(xí)階段，神經(jīng)網(wǎng)絡(luò)的權(quán)值最終收斂到常數(shù)值，存儲(chǔ)這些神經(jīng)網(wǎng)絡(luò)的權(quán)值常數(shù)值，作為系統(tǒng)未知?jiǎng)討B(tài)?目息的表達(dá)。
[0092]步驟(5):利用經(jīng)驗(yàn)知識(shí)修正控制器。
[0093]在本實(shí)例中，通過(guò)對(duì)時(shí)間段[400s，500s]內(nèi)收斂的權(quán)值求平均值計(jì)算出常值神經(jīng) 網(wǎng)絡(luò)權(quán)值： -- λ . r 〇π〇4? W - wean i#r(t) L 」，<40山.50叫
[0095] 設(shè)計(jì)基于經(jīng)驗(yàn)知識(shí)的神經(jīng)網(wǎng)絡(luò)控制器：
[0096] U:： = - W' S ^)
[0097]其中，控制器中的控制參數(shù)選取與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段一致。
[0098] 圖7為常值神經(jīng)網(wǎng)絡(luò)爐4(Χ；)與未知系統(tǒng)動(dòng)態(tài)F(X)之間的逼近效果仿真圖，存儲(chǔ)的常值神經(jīng)網(wǎng)絡(luò)能夠逼近未知的系統(tǒng)，從而實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)對(duì)未知系統(tǒng)動(dòng)態(tài)的學(xué)習(xí)再利用過(guò) 程，避免冗余的在線重新調(diào)整過(guò)程。圖8為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段和經(jīng)驗(yàn)再利用控制階段跟蹤誤差收斂對(duì)比效果仿真圖，對(duì)于相同的控制任務(wù)，基于經(jīng)驗(yàn)知識(shí)的神經(jīng)網(wǎng)絡(luò)控制器具有更小的超調(diào)量，在初始階段的動(dòng)態(tài)特性優(yōu)于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段，縮短調(diào)節(jié)時(shí)間。
[0099] 上述實(shí)施例為本發(fā)明較佳的實(shí)施方式，但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制，其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化，均應(yīng)為等效的置換方式，都包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，其特征在于，包含如下步驟：步驟（1):建立柔性機(jī)械臂動(dòng)態(tài)模型：通過(guò)狀態(tài)變換，建立單連桿柔性機(jī)械臂解禪合的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型；步驟(2):建立系統(tǒng)狀態(tài)觀測(cè)器:對(duì)模型中不可直接測(cè)量的系統(tǒng)狀態(tài)設(shè)計(jì)狀態(tài)觀測(cè)器：其中，P和ri為設(shè)計(jì)參數(shù)，? = 1，···，4，[/冷：而//耗]分別為系統(tǒng)中不可測(cè)量狀態(tài)[U2 化U4]的狀態(tài)觀測(cè)器；步驟(3):設(shè)計(jì)跟蹤誤差性能約束條件:對(duì)連桿輸出角度與周期參考軌跡輸出角度之間的跟蹤誤差，設(shè)計(jì)性能函數(shù)對(duì)跟蹤誤差的暫態(tài)和穩(wěn)態(tài)性能進(jìn)行約束，具體為：其中，P(t)為性能函數(shù)，口〇、口》、3、^^為設(shè)計(jì)常數(shù)，義<1為關(guān)節(jié)連桿角度參考周期性軌跡， ei為軌跡跟蹤誤差；設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ει)，將受限跟蹤誤差ei(t)轉(zhuǎn)換為轉(zhuǎn)換誤差ei(t):步驟(4):基于確定學(xué)習(xí)理論設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器:利用確定學(xué)習(xí)理論，設(shè)計(jì)自適應(yīng)RBF 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)控制器：其中，砍苗(義)為神經(jīng)網(wǎng)絡(luò)輸出，k4為設(shè)計(jì)的控制器增益常數(shù)，64為通過(guò)W下設(shè)計(jì)過(guò)程計(jì) 算出的中間誤差量：根據(jù)步驟(2)建立的狀態(tài)觀測(cè)器輸出[好喪片市；有J巧步驟(3)中轉(zhuǎn)換后的非受限轉(zhuǎn) 換誤差ε 1，設(shè)計(jì)虛擬控制器曰1，曰2，口3 :其中ki(i = l，2,3)為設(shè)計(jì)的虛擬控制器增益常數(shù)，xd為關(guān)節(jié)連桿角度參考周期性軌跡，丫，B為虛擬控制中設(shè)及的中間控制變量；控制器U中出現(xiàn)的中間誤差量E4: 扛-; 步驟(5):利用經(jīng)驗(yàn)知識(shí)修正控制器:根據(jù)確定學(xué)習(xí)理論，將步驟(4)中神經(jīng)網(wǎng)絡(luò)權(quán)值# 的收斂值保存為巧，實(shí)現(xiàn)利用表達(dá)經(jīng)驗(yàn)知識(shí)的常值RB巧巾經(jīng)網(wǎng)絡(luò)灰、修正控制器，即控制器形式為：2. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，其特征在于，步驟(1)中，所述的柔性機(jī)械臂解禪合的四階規(guī)范系統(tǒng)形式的動(dòng)態(tài)模型為：其中，XI和X2分別為關(guān)節(jié)連桿角度和電機(jī)轉(zhuǎn)動(dòng)角度，I和J分別為連桿和電機(jī)的慣量，Μ為連桿的質(zhì)量，L為連桿的長(zhǎng)度，g為重力加速度，Κ為柔性部分彈黃的彈性系數(shù)，U為控制器，即電機(jī)的控制輸出。3. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，其特征在于，步驟(3)中，所述的受限跟蹤誤差ei(t)通過(guò)設(shè)計(jì)一個(gè)嚴(yán)格單調(diào)遞增光滑函數(shù)Ψ(ει)轉(zhuǎn) 換為轉(zhuǎn)換誤差ei(t)，通過(guò)控制ei(t)的穩(wěn)定，使ei(t)滿足約束條件從而實(shí)現(xiàn)約束條件下的軌跡跟蹤控制。4. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，其特征在于，步驟(4)中，所述的虛擬控制器設(shè)及的中間信號(hào)變量丫，B具體為:r = 1 / (W+?·, K1 '楊-6,)，B=片/.口，. 神經(jīng)網(wǎng)絡(luò)輸出砍、(義）用于逼近機(jī)械臂系統(tǒng)的未知的動(dòng)態(tài)信息，神經(jīng)網(wǎng)絡(luò)的輸入為 jr=b，中，，W為在線更新的神經(jīng)網(wǎng)絡(luò)權(quán)值向量。5. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，其特征在于，步驟(4)中，所述的神經(jīng)網(wǎng)絡(luò)權(quán)值是收斂的，基于確定學(xué)習(xí)理論，跟蹤周期性軌跡輸入的神經(jīng)網(wǎng)絡(luò)，神經(jīng)網(wǎng)絡(luò)回歸向量S(X)滿足持續(xù)激勵(lì)條件，最終神經(jīng)網(wǎng)絡(luò)權(quán)值#收斂到最優(yōu) 值巧。6. 根據(jù)權(quán)利要求1所述的基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法，其特征在于，步驟(5)中，所述的修正的控制器包含了確定學(xué)習(xí)過(guò)程中的經(jīng)驗(yàn)知識(shí)使得控制器可W對(duì)于之后相同的控制任務(wù)，實(shí)現(xiàn)快速收斂、低超調(diào)的動(dòng)態(tài)性能。
【文檔編號(hào)】B25J9/16GK106078741SQ201610457032
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月21日
【發(fā)明人】王敏, 楊安樂(lè), 方?jīng)_
【申請(qǐng)人】華南理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王敏;楊安樂(lè);方?jīng)_;
技術(shù)所有人：華南理工大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、平老師：1.功能涂層設(shè)計(jì)與應(yīng)用 2.柔性電子器件設(shè)計(jì)與應(yīng)用 3.結(jié)構(gòu)動(dòng)態(tài)參數(shù)測(cè)試與裝置研發(fā) 4.智能機(jī)電一體化產(chǎn)品研發(fā) 5.3D打印工藝與設(shè)備
2、潘老師：1.機(jī)電一體化裝備及其控制技術(shù) 2.多傳感器信息融合與質(zhì)量評(píng)定
3、王老師：機(jī)械制造
4、袁老師：1.薄膜氣敏傳感器 2.薄膜太陽(yáng)能電池
5、李老師：新型電力電子技術(shù)在微網(wǎng)中的應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于確定學(xué)習(xí)理論的性能受限柔性機(jī)械臂控制方法