專利名稱:電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法
技術(shù)領(lǐng)域:
本發(fā)明屬于汽車發(fā)動機電子節(jié)氣門的控制技術(shù)領(lǐng)域,特指一種電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法。
背景技術(shù):
在汽車發(fā)動機中,節(jié)氣門的作用是通過一定角度的開關(guān)來控制發(fā)動機的進氣流量,直接影響到發(fā)動機的燃燒過程,決定發(fā)動機的運行工況。在實際操作中,駕駛員往往操作加速踏板來控制節(jié)氣門開度。然而,加速踏板和節(jié)氣門的連接方式有兩種剛性連接和柔性連接。傳統(tǒng)油門采用剛性連接,即通過拉桿或拉索傳動連接加速踏板和節(jié)氣門的機械連接方式,因此節(jié)氣門開度完全取決于加速踏板的位置,即駕駛員的操作意圖,但從動力性和經(jīng)濟性角度來看,此時發(fā)動機難以處于最佳運行工況,而且駕駛員的誤操作也給安全穩(wěn)定性帶來一定的隱患。因此,剛性連接逐漸被柔性連接方式所取代。柔性連接方式取消了傳統(tǒng)的機械連接,通過電控單元控制節(jié)氣門快速精確的定位,因此又稱為電子節(jié)氣門。電子節(jié)氣門具有以下主要優(yōu)點精確控制節(jié)氣門開度、集成多種控制功能、節(jié)約成本、車輛行駛可靠性優(yōu)良、提高操縱穩(wěn)定性和乘坐舒適性。
因而,研究電子節(jié)氣門的控制成為汽車電子控制技術(shù)中提高燃油經(jīng)濟性、降低排放、提高穩(wěn)定性、改善操控性能的一種重要方式。隨著高效節(jié)能環(huán)保汽車運行控制與車輛主動控制理論和技術(shù)的發(fā)展,電子節(jié)氣門取代傳統(tǒng)節(jié)氣門已是必然趨勢,將給汽車工業(yè)的發(fā)展帶來重要影響。
電子節(jié)氣門結(jié)構(gòu)由電機、變速箱、回位彈簧、位置傳感器、閥盤、驅(qū)動電路等組成,如附圖1所示。電子節(jié)氣門是一個非線性控制對象,在節(jié)氣門傳動機構(gòu)中存在著固有的一些非線性問題,如閥片運動過程中的粘性摩擦和滑動摩擦、復(fù)位彈簧的非線性特性、減速齒輪裝置中的輪齒間隙。同時,電子節(jié)氣門還存在時變情況,使得控制器的設(shè)計更加復(fù)雜。因此,需要有優(yōu)良的控制方法對其實施控制,以獲得良好的控制效果。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法,以對電子節(jié)氣門這一復(fù)雜的被控對象獲得良好的控制效果。
為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案為 一種電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法,其特征在于,采用第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)作為辨識器對電子節(jié)氣門進行模型辨識;采用第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)作為逆模型器對電子節(jié)氣門進行控制; 第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)為一個具有輸入層、隱含層、輸出層的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸入層包括5個節(jié)點,分別是y(k-1)、y(k-2)、y(k-3)、u(k)、u(k-1),所述的y(k)表示電子節(jié)氣門的狀態(tài)量,即氣門開度角θ,u(k)表示電子節(jié)氣門的輸入控制量,k表示采樣的時刻;第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸出層為一個節(jié)點,即辨識的狀態(tài)量
第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸出直接作為電子節(jié)氣門的輸入控制量,第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)為一個具有輸入層、隱含層、輸出層的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸入層包括5個節(jié)點,分別是yd(k)、y(k-1)、y(k-2)、y(k-3)、u(k-1),所述的yd(k)為期望的狀態(tài)量,即期望的電子節(jié)氣門開度角;第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸出層為一個節(jié)點,即u(k); 第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)均先經(jīng)過離線學(xué)習(xí),再進行在線學(xué)習(xí);所述的在線學(xué)習(xí)為采用梯度算法調(diào)整第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)權(quán)值;第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的權(quán)值在線調(diào)整表示為 yu(k)估計為 其中k表示時刻,WC(k+1)表示k+1時刻的第二徑向基神經(jīng)網(wǎng)絡(luò)權(quán)值;η為學(xué)習(xí)率;EC(k)表示設(shè)定的誤差函數(shù),eC(k)表示控制誤差,yu(k)為輸出狀態(tài)量對于控制輸入的敏感度、bC(k)表示第二徑向基神經(jīng)網(wǎng)絡(luò)參數(shù);WIT表示第一徑向基神經(jīng)網(wǎng)絡(luò)權(quán)值,bI(k)表示第一徑向基神經(jīng)網(wǎng)絡(luò)參數(shù),σ為寬度參數(shù)。
所述的離線學(xué)習(xí)為根據(jù)現(xiàn)場樣本數(shù)據(jù),采用模糊K均值聚類算法來確定第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的中心及寬度參數(shù),采用梯度下降法調(diào)整網(wǎng)絡(luò)權(quán)值。
本發(fā)明具有的有益效果 與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點就在于 1、由于采用了一種基于RBF神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)逆模型控制方法,能夠較好地克服電子節(jié)氣門控制中的非線性、時變難題,達(dá)到較好的控制效果; 2、由于采用了一種自學(xué)習(xí)方式來調(diào)整優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)參數(shù),從而可以較快地學(xué)習(xí)訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),而且控制性能也較好。
具體控制效果參見實施例1和附圖。
圖1是電子節(jié)氣門結(jié)構(gòu)示意圖; 圖2是本發(fā)明的作為辨識器的第一RBF神經(jīng)網(wǎng)絡(luò)的離線學(xué)習(xí); 圖3是本發(fā)明的作為逆模型控制器的第二RBF神經(jīng)網(wǎng)絡(luò)的離線學(xué)習(xí); 圖4是本發(fā)明中控制器的在線學(xué)習(xí); 圖5是本發(fā)明的實施流程; 圖6是本發(fā)明中控制器的控制效果仿真。其中a,b,c和d圖分別為階躍響應(yīng)曲線、階躍響應(yīng)誤差、坡度響應(yīng)曲線和坡度響應(yīng)誤差
圖中標(biāo)號說明1-汽車電池,2-電子節(jié)氣門,3-變速箱,4-閥盤,5-回位彈簧,6-流入的空氣,7-位置傳感器,8-電機,9-驅(qū)動電路。
具體實施例方式 實施例1 以下將結(jié)合附圖和具體實施例對本發(fā)明做進一步詳細(xì)說明。
1、確定控制器的結(jié)構(gòu)。
RBF神經(jīng)網(wǎng)絡(luò)是在借鑒生物局部調(diào)節(jié)和交疊接受區(qū)域知識的基礎(chǔ)上提出的一種采用局部接受域來執(zhí)行函數(shù)映射的人工神經(jīng)網(wǎng)絡(luò)模型,具有最優(yōu)逼近和全局逼近的特性,是非線性建模與控制中的一種有效工具。RBF神經(jīng)網(wǎng)絡(luò)通常定義為空間中任意一點x到某一中心ci之間的歐幾里得距離的單調(diào)函數(shù)。這里常用的徑向基函數(shù)為Gaussian函數(shù),其形式為 其中為ci核函數(shù)中心;σ為核函數(shù)的寬度參數(shù),表示基函數(shù)的徑向作用范圍;||·||表示歐幾里得距離。
在本發(fā)明中采用一個徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)作為辨識器,用于建立電子節(jié)氣門的非線性模型,由附圖2所示。這里用作辨識器的第一RBF神經(jīng)網(wǎng)絡(luò)(即RBF神經(jīng)網(wǎng)絡(luò)1)為一個三層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即輸入層、隱含層、輸出層。用作辨識器的第一RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)具體為根據(jù)電子節(jié)氣門的特性,RBF神經(jīng)網(wǎng)絡(luò)的輸入層包括5個節(jié)點,分別是y(k-1)、y(k-2)、y(k-3)、u(k)、u(k-1),這里的y(k)表示電子節(jié)氣門的狀態(tài)量,即氣門開度角θ,u(k)表示電子節(jié)氣門的輸入控制量,k表示采樣的時刻;RBF神經(jīng)網(wǎng)絡(luò)的隱含層設(shè)定為8個節(jié)點;第一RBF神經(jīng)網(wǎng)絡(luò)的輸出層為一個節(jié)點,即辨識的狀態(tài)量y(k)。
在該控制器中采用另外一個徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)作為逆模型器,其輸出直接作為電子節(jié)氣門的輸入控制量,由附圖3所示。這里用作逆模型控制器的第二RBF神經(jīng)網(wǎng)絡(luò)(即RBF神經(jīng)網(wǎng)絡(luò)2)為一個三層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即輸入層、隱含層、輸出層,其結(jié)構(gòu)具體為第二RBF神經(jīng)網(wǎng)絡(luò)的輸入層包括5個節(jié)點,分別是yd(k)、y(k-1)、y(k-2)、y(k-3)、u(k-1),這里的yd(k)為期望的狀態(tài)量,即期望的電子節(jié)氣門開度角;第二RBF神經(jīng)網(wǎng)絡(luò)的隱含層設(shè)定為7個節(jié)點;第二RBF神經(jīng)網(wǎng)絡(luò)的輸出層為一個節(jié)點,即逆模型控制量u(k)。
2、離線學(xué)習(xí) 離線學(xué)習(xí)中,首先采集的電子節(jié)氣門輸入輸出變量的樣本數(shù)據(jù),隨后調(diào)整這兩個RBF神經(jīng)網(wǎng)絡(luò)的權(quán)值和參數(shù)。
RBF網(wǎng)絡(luò)有3組可調(diào)參數(shù)隱含層基函數(shù)中心ci、核函數(shù)寬度σ、隱含層與輸出層的連接權(quán)值wi。這里將采用模糊K均值聚類算法來確定RBF網(wǎng)絡(luò)基函數(shù)的中心ci及相應(yīng)的寬度參數(shù)σ,而網(wǎng)絡(luò)權(quán)值wi的學(xué)習(xí)采用梯度下降法來修正,具體描述如下 2.1利用模糊K均值聚類算法確定基函數(shù)中心ci 步驟1隨機選擇h個樣本值作為ci(i=1,2,…,h)的初值,其它樣本按該樣本與中心ci的歐幾里得距離遠(yuǎn)近歸入某一類,從而形成h個子類ai,i=1,2,…,h; 步驟2重新計算各子類中心ci的值 其中xk∈ai,si為子集ai的樣本數(shù)。同時計算每個樣本屬于每個中心的隸屬度為 其中xj,xk∈ai(3) U={uij∈
|i=1,2,…,h;j=1,2,…,S}(4) 步驟3確定ci是否在容許的誤差范圍內(nèi),若是,則結(jié)束;若不是,則根據(jù)樣本的隸屬度調(diào)整子類個數(shù),轉(zhuǎn)到步驟2繼續(xù)。
2.2確定寬度參數(shù)σ 這里采用式(5)來估計寬度參數(shù)σ 基函數(shù)中心ci和寬度參數(shù)σ確定之后,隱含層執(zhí)行的是一種固定不變的非線性變換,第i個隱節(jié)點輸出定義為(m為隱含層節(jié)點個數(shù)) 2.3調(diào)節(jié)RBF網(wǎng)絡(luò)的連接權(quán)值 在確定基函數(shù)中心ci和寬度參數(shù)σ之后,下面將調(diào)節(jié)隱含層與輸出層的網(wǎng)絡(luò)連接權(quán)值wi。首先,定義RBF網(wǎng)絡(luò)權(quán)值調(diào)整的目標(biāo)函數(shù)為 其中
是相對于輸入xk的實際輸出,y(xk)是相對于輸入xk的期望輸出,N為總樣本數(shù)。對于RBF網(wǎng)絡(luò),參數(shù)的調(diào)整應(yīng)能使網(wǎng)絡(luò)在最小二乘意義下逼近所對應(yīng)的映射關(guān)系,也就是使目標(biāo)函數(shù)E達(dá)到最小。這里利用梯度下降法調(diào)整RBF網(wǎng)絡(luò)隱含層與輸出層的連接權(quán)值w,使目標(biāo)函數(shù)E達(dá)到最小,而網(wǎng)絡(luò)權(quán)值的調(diào)整量可表示為 其中η為學(xué)習(xí)率,為0到1間的正數(shù)。這樣可以確定網(wǎng)絡(luò)權(quán)值w的每步調(diào)整量為 其中bi(xk)的定義如式(6)所示。
而網(wǎng)絡(luò)權(quán)值w的迭代修正公式可以表示為 wi←wi+Δwi,i=1,2,…,m(10) 這樣一來,整個RBF網(wǎng)絡(luò)的輸出表示為 這樣,我們可以將第一RBF神經(jīng)網(wǎng)絡(luò)的輸出表示為而第二RBF神經(jīng)網(wǎng)絡(luò)輸出表示為其中OI(k)、OC(k)分別表示第一RBF神經(jīng)網(wǎng)絡(luò)、第二RBF神經(jīng)網(wǎng)絡(luò)的輸出值,而bI(k)、bC(k)分別表示第一RBF神經(jīng)網(wǎng)絡(luò)、第二RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)值,其定義如式(6)所示。
3、在線學(xué)習(xí) 離線學(xué)習(xí)完成后,就可以將該控制器應(yīng)用于電子節(jié)氣門的控制中,并根據(jù)實際的控制效果采用梯度學(xué)習(xí)算法在線調(diào)整這兩個RBF神經(jīng)網(wǎng)絡(luò)權(quán)值,以達(dá)到滿意的控制要求。附圖4描述了控制器的在線學(xué)習(xí)示意圖。
定義第一RBF神經(jīng)網(wǎng)絡(luò)的誤差目標(biāo)函數(shù)為 在第一RBF神經(jīng)網(wǎng)絡(luò)中,梯度可以表示為 這樣,我們可以將第一RBF神經(jīng)網(wǎng)絡(luò)的權(quán)值在線調(diào)整表示為 其中η學(xué)習(xí)率。
同樣地,定義第二RBF神經(jīng)網(wǎng)絡(luò)的誤差目標(biāo)函數(shù)為 在第二RBF神經(jīng)網(wǎng)絡(luò)中,梯度可以表示為 其中用于描述輸出狀態(tài)量對于控制輸入的敏感度。
此時,我們可以將第二RBF神經(jīng)網(wǎng)絡(luò)的權(quán)值在線調(diào)整表示為 而考慮到第一RBF神經(jīng)網(wǎng)絡(luò)已經(jīng)經(jīng)過了離線學(xué)習(xí),非常接近于電子節(jié)氣門的非線性模型,因而yu(k)就可以估計為 圖5描述了本發(fā)明的實施流程,而圖6則是本發(fā)明中控制器的控制效果仿真,結(jié)果表明該控制器具有較好的性能,能夠滿足電子節(jié)氣門控制的要求。
權(quán)利要求
1.一種電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法,其特征在于,采用第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)作為辨識器對電子節(jié)氣門進行模型辨識;采用第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)作為逆模型器對電子節(jié)氣門進行控制;
第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)為一個具有輸入層、隱含層、輸出層的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸入層包括5個節(jié)點,分別是y(k-1)、y(k-2)、y(k-3)、u(k)、u(k-1),所述的y(k)表示電子節(jié)氣門的狀態(tài)量,即氣門開度角θ,u(k)表示電子節(jié)氣門的輸入控制量,k表示采樣的時刻;第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸出層為一個節(jié)點,即辨識的狀態(tài)量
第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸出直接作為電子節(jié)氣門的輸入控制量,第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)為一個具有輸入層、隱含層、輸出層的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸入層包括5個節(jié)點,分別是yd(k)、y(k-1)、y(k-2)、y(k-3)、u(k-1),所述的yd(k)為期望的狀態(tài)量,即期望的電子節(jié)氣門開度角;第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的輸出層為一個節(jié)點,即u(k);
第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)均先經(jīng)過離線學(xué)習(xí),再進行在線學(xué)習(xí);所述的在線學(xué)習(xí)為采用梯度算法調(diào)整第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)權(quán)值;第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的權(quán)值在線調(diào)整表示為
yu(k)估計為
其中k表示時刻,WC(k+1)表示k+1時刻的第二徑向基神經(jīng)網(wǎng)絡(luò)權(quán)值;η為學(xué)習(xí)率;EC(k)表示設(shè)定的誤差函數(shù),eC(k)表示控制誤差,yu(k)為輸出狀態(tài)量對于控制輸入的敏感度、bC(k)表示第二徑向基神經(jīng)網(wǎng)絡(luò)參數(shù);WIT表示第一徑向基神經(jīng)網(wǎng)絡(luò)權(quán)值,bI(k)表示第一徑向基神經(jīng)網(wǎng)絡(luò)參數(shù),σ為寬度參數(shù)。
2.根據(jù)權(quán)利要求1所述的電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法,其特征在于,所述的離線學(xué)習(xí)為根據(jù)現(xiàn)場樣本數(shù)據(jù),采用模糊K均值聚類算法來確定第一徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和第二徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的中心及寬度參數(shù),采用梯度下降法調(diào)整網(wǎng)絡(luò)權(quán)值。
全文摘要
本發(fā)明公開了一種電子節(jié)氣門的自學(xué)習(xí)逆模型控制方法,該控制器的組成結(jié)構(gòu)包括2個部分1)采用一個徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)作為辨識器,建立電子節(jié)氣門的非線性模型;2)采用另外一個RBF神經(jīng)網(wǎng)絡(luò)作為逆模型控制器,得到合適的控制量。這里的2個RBF神經(jīng)網(wǎng)絡(luò)采取了一種自學(xué)習(xí)策略,包括離線學(xué)習(xí)和在線學(xué)習(xí)兩個環(huán)節(jié)離線學(xué)習(xí)中,2個RBF神經(jīng)網(wǎng)絡(luò)根據(jù)現(xiàn)場樣本數(shù)據(jù),調(diào)整優(yōu)化網(wǎng)絡(luò)權(quán)值參數(shù);離線學(xué)習(xí)完成后,再采用一種在線學(xué)習(xí)算法調(diào)整優(yōu)化這兩個RBF神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù),控制性能達(dá)到要求。本發(fā)明能克服電子節(jié)氣門控制中的非線性、時變等難題,提高控制的效果和性能。
文檔編號G05B13/02GK101630144SQ200910044150
公開日2010年1月20日 申請日期2009年8月18日 優(yōu)先權(quán)日2009年8月18日
發(fā)明者王耀南, 袁小芳, 輝 張, 吳亮紅 申請人:湖南大學(xué)