本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)技術(shù)、PI控制、非線性系統(tǒng)控制領(lǐng)域,特別涉及一種基于神經(jīng)網(wǎng)絡(luò)理論的非線性系統(tǒng)自適應(yīng)比例積分控制方法。
背景技術(shù):
隨著科技的飛速發(fā)展,人們對(duì)控制系統(tǒng)的動(dòng)態(tài)性和穩(wěn)定性提出越來(lái)越高的要求,因此非線性系統(tǒng)的控制問(wèn)題一直是控制理論領(lǐng)域的研究熱點(diǎn)。針對(duì)不確定非線性動(dòng)態(tài)系統(tǒng),傳統(tǒng)控制理論不能提供有效的分析與設(shè)計(jì)工具,即不能滿(mǎn)足解決環(huán)境和系統(tǒng)動(dòng)態(tài)特性不完備條件下的控制問(wèn)題。若不確定因素(未知參數(shù)、建模時(shí)忽略的因素、測(cè)量誤差、外界擾動(dòng)、動(dòng)態(tài)建模等)未考慮到控制器設(shè)計(jì)中,可能造成實(shí)際系統(tǒng)不可估量的損失。為此人們提出了各種不確定非線性系統(tǒng)的控制方法,包括滑??刂?、模糊控制、后推技術(shù)等。在近二十年各種智能控制層出不窮的同時(shí),人們對(duì)PI/PID的關(guān)注熱度一直未減。PI/PID控制器的應(yīng)用于研究一直是一種典型的控制方案,并且這種控制方案廣泛地應(yīng)用在實(shí)際生產(chǎn)工業(yè)系統(tǒng)中。在PI/PID控制器的設(shè)計(jì)中,最重要的就是其增益的調(diào)節(jié)。
傳統(tǒng)的PI控制器增益都是常數(shù),而其增益常數(shù)的設(shè)置需要經(jīng)過(guò)反復(fù)調(diào)整和試錯(cuò)過(guò)程。大多數(shù)只能適用于線性系統(tǒng)或者單輸入單輸出系統(tǒng),其增益的調(diào)節(jié)要么是手動(dòng)完成,要么是在線調(diào)試,過(guò)程繁瑣復(fù)雜,耗時(shí),也不適合非線性系統(tǒng)。
另外在實(shí)際的控制系統(tǒng)中,飽和、死區(qū)、間隙和繼電等都是最常見(jiàn)的執(zhí)行器非線性特性。飽和是控制系統(tǒng)執(zhí)行器潛在的問(wèn)題之一,如果執(zhí)行器的輸入達(dá)到一定限制,整個(gè)系統(tǒng)就會(huì)進(jìn)入飽和,進(jìn)一步增加輸入對(duì)執(zhí)行器的輸出不能產(chǎn)生任何影響。執(zhí)行器飽和將使系統(tǒng)的動(dòng)態(tài)性能降低,甚至導(dǎo)致閉環(huán)系統(tǒng)不穩(wěn)定。所以說(shuō),在被控對(duì)象含有某種不確定性的前提下,需要重新設(shè)計(jì)一套比例積分增益能夠自動(dòng)調(diào)節(jié)的控制器,使系統(tǒng)能夠更快更好的達(dá)到預(yù)期目標(biāo)和穩(wěn)定效果。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的目的一種基于神經(jīng)網(wǎng)絡(luò)理論的非線性系統(tǒng)自適應(yīng)比例積分控制方法,以使具有輸入飽和的非線性系統(tǒng)能夠達(dá)到預(yù)期目標(biāo)并使所有閉環(huán)信號(hào)具有穩(wěn)定效果。
本發(fā)明基于神經(jīng)網(wǎng)絡(luò)理論的非線性系統(tǒng)自適應(yīng)比例積分控制方法,包括以下步驟:
步驟一、建立含有執(zhí)行器飽和的非線性系統(tǒng)的數(shù)學(xué)模型;
所述含有執(zhí)行器飽和的非線性系統(tǒng)具有如下形式:
y=x1
u=H(v)
式中:xi=[xi1,…,xim]T∈Rm,i=1,...,n,x∈Rmn是系統(tǒng)的狀態(tài)向量;y∈Rm表示的是系統(tǒng)的輸出向量;u∈Rm代表系統(tǒng)的輸入向量;F(x)∈Rm表示系統(tǒng)的非線性函數(shù);B(x,t)∈Rm×m表示的是系統(tǒng)的控制增益矩陣;Fd(x,t)∈Rm代表的是系統(tǒng)模型的不確定性部分和外部干擾部分;H(v)∈Rn表示的是未知執(zhí)行器飽和的控制向量;v∈Rn是系統(tǒng)的實(shí)際輸入設(shè)計(jì)向量;
執(zhí)行器飽和的實(shí)際控制輸入與理想控制輸入滿(mǎn)足以下關(guān)系:
式中σ1>0,σ2>0是飽和函數(shù)的界限值,ρ(vj)是飽和函數(shù)的非線性部分;
步驟二、利用光滑的函數(shù)逼近非光滑的執(zhí)行器飽和函數(shù);
具體為:
ui=hi(vi)=Γi(vi)+ζi(vi)
式中:l>0是設(shè)計(jì)參數(shù),ζi(vi)是逼近誤差函數(shù),并且滿(mǎn)足|ζi|≤Di,Di是未知正常數(shù),Γi(vi)是光滑函數(shù),對(duì)多組光滑函數(shù)組成的函數(shù)向量Γ(v),利用中值定理進(jìn)行展開(kāi),得到
Γ(v)=Γ(0)+G(ξ)v
上式中Γ(0)表示函數(shù)初始時(shí)刻的函數(shù)值;gij,i=1,...,m,j=1,...,m代表在區(qū)間(0,vj)之間的某一點(diǎn)值,在設(shè)計(jì)控制器當(dāng)中不需要其確定值,ξ∈Rm×m是由這組點(diǎn)值ξij組成的矩陣;i=1,...,m,j=1,...,m是函數(shù)Γ(v)的偏導(dǎo)數(shù),而G(ξ)是由多個(gè)偏導(dǎo)數(shù)組成的矩陣;
步驟三、設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)自適應(yīng)PI控制器進(jìn)行控制;
1,利用目標(biāo)軌跡與系統(tǒng)輸出得到跟蹤誤差e=y(tǒng)-yd,其中yd是理想軌跡;引入濾波誤差將高階系統(tǒng)模型轉(zhuǎn)換為低階系統(tǒng)模型ε=λn-1e+…+λ1e(n-2)+e(n-1),式中λ1,…λn-1是正常數(shù),e(n-2),e(n-1),…是跟蹤誤差的高階導(dǎo)數(shù);同時(shí)引入廣義誤差這里δ是設(shè)計(jì)參數(shù);
2,對(duì)廣義誤差求導(dǎo)數(shù)并結(jié)合系統(tǒng)模型及中值定理表達(dá)式,會(huì)生成不確定非線性項(xiàng):
非線性函數(shù)Ψ(x,ξ,t)滿(mǎn)足:
再引入RBF神經(jīng)網(wǎng)絡(luò)函數(shù)進(jìn)行非線性處理,即
Q(·)=W*TS(Z)+η(Z);
其中W*代表的是神經(jīng)網(wǎng)絡(luò)最佳常數(shù)權(quán)值向量,η(Z)指的是逼近誤差,S(Z)=[s1(Z),…,sP(Z)]T表示神經(jīng)網(wǎng)絡(luò)的一組基函數(shù);
3,神經(jīng)網(wǎng)絡(luò)函數(shù)的權(quán)值的范數(shù)||W*||與神經(jīng)網(wǎng)絡(luò)逼近誤差上限值ηN兩者的最大值組成未知的參數(shù)a,核心函數(shù)是由神經(jīng)網(wǎng)絡(luò)函數(shù)基函數(shù)的范數(shù)||S(Z)||加1組成,這里的基函數(shù)選用高斯函數(shù);
4,引入BLF技術(shù),即選取的李雅普諾夫函數(shù)為Vb,具有以下形式
5,在自適應(yīng)PI控制器中,比例積分增益分別由兩部分組成,其中常數(shù)部分包括:比例增益Kp和積分增益Ki,時(shí)變部分包括:比例增益ΔKp及積分增益ΔKi;未知參數(shù)a的自適應(yīng)率、以及比例積分增益的時(shí)變部分分別為:
ΔKi=δΔKp;
6,利用濾波誤差與比例增益的乘積與跟蹤誤差的積分之和得到控制器v,具體表達(dá)式為:
7,控制器v將計(jì)算出的控制指令發(fā)送給非線性系統(tǒng)的執(zhí)行器,實(shí)現(xiàn)系統(tǒng)輸出跟蹤理想的目標(biāo)軌跡。
本發(fā)明的有益效果:
1、本發(fā)明基于神經(jīng)網(wǎng)絡(luò)理論的非線性系統(tǒng)自適應(yīng)比例積分控制方法,針對(duì)具有輸入飽和的非線性系統(tǒng),利用光滑函數(shù)逼近執(zhí)行器飽和函數(shù);引用BLF,可保證神經(jīng)網(wǎng)絡(luò)的輸入保持在有界緊集范圍內(nèi),保證了神經(jīng)網(wǎng)絡(luò)的正常運(yùn)行。
2、本發(fā)明基于神經(jīng)網(wǎng)絡(luò)理論的非線性系統(tǒng)自適應(yīng)比例積分控制方法,與傳統(tǒng)的PI增益調(diào)節(jié)相比,本發(fā)明提出的調(diào)節(jié)方法還具有:1)PI控制器的比例積分增益不是固定的常數(shù)而是時(shí)變的,即通過(guò)相應(yīng)的更新率自動(dòng)調(diào)節(jié)的;2)比例增益和積分增益不是單獨(dú)設(shè)計(jì)的,而是通過(guò)一定系數(shù)聯(lián)系起來(lái),有利于系統(tǒng)的分析;3)針對(duì)系統(tǒng)存在的不確定性及輸入飽和都有一定的魯棒性;4)獨(dú)立于系統(tǒng)模型中的非線性部分和不確定部分,也就是說(shuō)不需要重新設(shè)定PI增益。
附圖說(shuō)明
圖1是本發(fā)明中自適應(yīng)PI控制器設(shè)計(jì)步驟示意圖;
圖2是本發(fā)明中含有執(zhí)行器飽和的非線性系統(tǒng)的自適應(yīng)PI控制原理圖;
圖3是本發(fā)明中自適應(yīng)PI控制算法設(shè)計(jì)圖;
圖4是本發(fā)明中光滑函數(shù)逼近執(zhí)行器飽和函數(shù)的示意圖;
圖5是控制器作用下期望跟蹤位置隨時(shí)間變化曲線圖;
圖6是控制器作用下期望跟蹤位置誤差曲線圖;
圖7是控制器作用下的控制輸入隨時(shí)間變化曲線圖;
圖8是控制器作用下的PI增益隨時(shí)間變化曲線圖;
圖9是控制器作用下的系統(tǒng)參數(shù)估計(jì)隨時(shí)間變化曲線圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述。
本實(shí)施例基于神經(jīng)網(wǎng)絡(luò)理論的非線性系統(tǒng)自適應(yīng)比例積分控制方法,包括以下步驟:
步驟一、建立含有執(zhí)行器飽和的非線性系統(tǒng)的數(shù)學(xué)模型;
所述含有執(zhí)行器飽和的非線性系統(tǒng)具有如下形式:
y=x1
u=H(v)
式中:xi=[xi1,…,xim]T∈Rm,i=1,...,n,x∈Rmn是系統(tǒng)的狀態(tài)向量;y∈Rm表示的是系統(tǒng)的輸出向量;u∈Rm代表系統(tǒng)的輸入向量;F(x)∈Rm表示系統(tǒng)的非線性函數(shù);B(x,t)∈Rm×m表示的是系統(tǒng)的控制增益矩陣;Fd(x,t)∈Rm代表的是系統(tǒng)模型的不確定性部分和外部干擾部分;H(v)∈Rn表示的是未知執(zhí)行器飽和的控制向量;v∈Rn是系統(tǒng)的實(shí)際輸入設(shè)計(jì)向量;
執(zhí)行器飽和的實(shí)際控制輸入與理想控制輸入滿(mǎn)足以下關(guān)系:
式中σ1>0,σ2>0是飽和函數(shù)的界限值,ρ(vj)是飽和函數(shù)的非線性部分。
步驟二、利用光滑的函數(shù)逼近非光滑的執(zhí)行器飽和函數(shù);
具體為:
ui=hi(vi)=Γi(vi)+ζi(vi)
式中:l>0是設(shè)計(jì)參數(shù),ζi(vi)是逼近誤差函數(shù),并且滿(mǎn)足|ζi|≤Di,Di是未知正常數(shù),Γi(vi)是光滑函數(shù),對(duì)多組光滑函數(shù)組成的函數(shù)向量Γ(v),利用中值定理進(jìn)行展開(kāi),得到
Γ(v)=Γ(0)+G(ξ)v
上式中Γ(0)表示函數(shù)初始時(shí)刻的函數(shù)值;gij,i=1,...,m,j=1,...,m代表在區(qū)間(0,vj)之間的某一點(diǎn)值,在設(shè)計(jì)控制器當(dāng)中不需要其確定值,ξ∈Rm×m是由這組點(diǎn)值ξij組成的矩陣;i=1,...,m,j=1,...,m是函數(shù)Γ(v)的偏導(dǎo)數(shù),而G(ξ)是由多個(gè)偏導(dǎo)數(shù)組成的矩陣。
步驟三、設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)自適應(yīng)PI控制器進(jìn)行控制;
1,利用目標(biāo)軌跡與系統(tǒng)輸出得到跟蹤誤差e=y(tǒng)-yd,其中yd是理想軌跡;引入濾波誤差將高階系統(tǒng)模型轉(zhuǎn)換為低階系統(tǒng)模型ε=λn-1e+...+λ1e(n-2)+e(n-1),式中λ1,…λn-1是正常數(shù),e(n-2),e(n-1),…是跟蹤誤差的高階導(dǎo)數(shù);同時(shí)引入廣義誤差這里δ是設(shè)計(jì)參數(shù);
2,對(duì)廣義誤差求導(dǎo)數(shù)并結(jié)合系統(tǒng)模型及中值定理表達(dá)式,會(huì)生成不確定非線性項(xiàng):
非線性函數(shù)Ψ(x,ξ,t)滿(mǎn)足:
再引入RBF神經(jīng)網(wǎng)絡(luò)函數(shù)進(jìn)行非線性處理,即
Q(·)=W*TS(Z)+η(Z);
其中W*代表的是神經(jīng)網(wǎng)絡(luò)最佳常數(shù)權(quán)值向量,η(Z)指的是逼近誤差,S(Z)=[s1(Z),…,sP(Z)]T表示神經(jīng)網(wǎng)絡(luò)的一組基函數(shù);
3,神經(jīng)網(wǎng)絡(luò)函數(shù)的權(quán)值的范數(shù)||W*||與神經(jīng)網(wǎng)絡(luò)逼近誤差上限值ηN兩者的最大值組成未知的參數(shù)a,核心函數(shù)是由神經(jīng)網(wǎng)絡(luò)函數(shù)基函數(shù)的范數(shù)||S(Z)||加1組成,這里的基函數(shù)選用高斯函數(shù);
4,引入BLF技術(shù),即選取的李雅普諾夫函數(shù)為Vb,具有以下形式
5,在自適應(yīng)PI控制器中,比例積分增益分別由兩部分組成,其中常數(shù)部分包括:比例增益Kp和積分增益Ki,時(shí)變部分包括:比例增益ΔKp及積分增益ΔKi;未知參數(shù)a的自適應(yīng)率、以及比例積分增益的時(shí)變部分分別為:
ΔKi=δΔKp;
6,利用濾波誤差與比例增益的乘積與跟蹤誤差的積分之和得到控制器v,具體表達(dá)式為:
7,控制器v將計(jì)算出的控制指令發(fā)送給非線性系統(tǒng)的執(zhí)行器,實(shí)現(xiàn)系統(tǒng)輸出跟蹤理想的目標(biāo)軌跡。
為了驗(yàn)證本實(shí)施例中神經(jīng)網(wǎng)絡(luò)自適應(yīng)PI控制器的可靠和有效性,給出以下仿真實(shí)例。
考慮如下二自由度機(jī)械臂非線性系統(tǒng):
上式中q∈R2表示關(guān)節(jié)位置;τd表示外部擾動(dòng);M(q)∈R2×2是慣性張量矩陣;哥氏加速度和向心加速度相關(guān)矩陣;G(q)∈R2表示慣性負(fù)載矢量;u是轉(zhuǎn)矩輸入向量。這里
在本實(shí)例仿真中,令期望軌跡為qd1=sin(t),qd2=0.85cos(t)??紤]執(zhí)行器的飽和情況,給出執(zhí)行器飽和的上下限,結(jié)合所設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)PI控制器,選取適當(dāng)?shù)纳窠?jīng)元個(gè)數(shù)和設(shè)計(jì)參數(shù),可以得到良好的仿真效果,如圖5所示,在設(shè)計(jì)的PI控制器下,實(shí)際的輸出軌跡能夠很好的跟蹤到理想軌跡,并達(dá)到穩(wěn)定的跟蹤過(guò)程;圖6是本實(shí)施例中的跟蹤誤差,可以看到,在很短的時(shí)間內(nèi)系統(tǒng)跟蹤誤差收斂到有界范圍內(nèi),說(shuō)明本實(shí)施例中的控制器具有良好的動(dòng)態(tài)性能;圖7是控制器的輸入效果圖;圖8是比例積分增益的變化曲線,可以看出是隨時(shí)間自動(dòng)調(diào)整的。
最后說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的宗旨和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。