專利名稱:位置伺服系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種應(yīng)用于伺服系統(tǒng)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方法,用于伺服系統(tǒng)的高精度控制。
背景技術(shù):
伺服系統(tǒng)是復(fù)雜的機(jī)電控制系統(tǒng),其本質(zhì)可以視為一個(gè)由電動(dòng)機(jī)拖動(dòng)的的位置閉環(huán)控制系統(tǒng),其在國(guó)民生產(chǎn)和國(guó)防建設(shè)中起著重要的作用。由于其在各領(lǐng)域中占有十分重要的地位,所以對(duì)其性能的要求也不斷提高,尤其在國(guó)防軍事和航空航天等尖端領(lǐng)域。從當(dāng)前國(guó)內(nèi)外伺服系統(tǒng)總的發(fā)展趨勢(shì)可以看出,“高頻響、超低速、高精度”是其主要發(fā)展方向。其中,“高頻響”是反映伺服系統(tǒng)跟蹤高頻信號(hào)的能力,即在位置指令信號(hào)不斷變化時(shí)系統(tǒng)的跟蹤能力?!俺退佟?,是反映系統(tǒng)的低速平穩(wěn)性,影響低速特性的主要因素是機(jī)械摩擦,必須采用一定的控制方法對(duì)摩擦進(jìn)行補(bǔ)償?!案呔取笔侵赶到y(tǒng)跟蹤指令信號(hào)的準(zhǔn)確程度。
存在于伺服系統(tǒng)中的機(jī)械摩擦、電路參數(shù)的飄移、軸系間的力矩耦合、環(huán)境干擾、以及軸系間的不垂直度或不交度而引起的系統(tǒng)負(fù)載力矩的不平衡、機(jī)械裝置剛度不足而引起的機(jī)械變形、負(fù)載的波動(dòng)以及電機(jī)本身的齒槽效應(yīng)等許多非線性的、不確定性等因素,給伺服系統(tǒng)的控制造成了很多困難,對(duì)系統(tǒng)的精度影響很大。因此,消除這些干擾源引起的擾動(dòng)并克服各種非線性因素對(duì)系統(tǒng)帶來(lái)的影響是實(shí)現(xiàn)伺服系統(tǒng)高精度控制的關(guān)鍵。
經(jīng)典的伺服系統(tǒng)設(shè)計(jì)一般采用傳統(tǒng)的“三環(huán)”結(jié)構(gòu)的PID控制方法(參見(jiàn)圖3),由內(nèi)到外是電流環(huán)、速度環(huán)和位置環(huán)。電流環(huán)和速度環(huán)的作用是提高系統(tǒng)的剛度來(lái)抑制系統(tǒng)的非線性及外部擾動(dòng),控制系統(tǒng)的精度由位置環(huán)來(lái)保證。但這種傳統(tǒng)控制方法的適應(yīng)性差,在系統(tǒng)受擾的情況下控制精度低,不適合高精度控制的場(chǎng)合。而本發(fā)明能夠很好的抑制系統(tǒng)的參數(shù)攝動(dòng)、摩擦干擾和負(fù)載變化帶來(lái)的擾動(dòng);在對(duì)象的非線性和不確定性較強(qiáng)的情況下也可以正常運(yùn)行,極大的提高了伺服系統(tǒng)的控制精度。
發(fā)明內(nèi)容
為了提高伺服系統(tǒng)的控制精度,特別是提高伺服系統(tǒng)在存在非線性和不確定性以及系統(tǒng)的參數(shù)攝動(dòng)、摩擦干擾和負(fù)載變化等干擾情況下的控制精度,提出一種應(yīng)用于伺服系統(tǒng)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方法。本發(fā)明實(shí)現(xiàn)了對(duì)伺服系統(tǒng)的非線性補(bǔ)償和干擾抑制,提高了伺服系統(tǒng)的跟蹤精度。本發(fā)明是在傳統(tǒng)的控制方法的基礎(chǔ)上加入了神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制的方法,極大的提高了系統(tǒng)的魯棒性,使系統(tǒng)對(duì)各種干擾都能夠進(jìn)行快速有效的抑制,達(dá)到極高的控制精度。并且基于Lyapunov穩(wěn)定性理論的自適應(yīng)控制算法確保了該方法的穩(wěn)定性。另外,在速度環(huán)精確參考模型的基礎(chǔ)上,位置環(huán)控制器的設(shè)計(jì)也變得非常的簡(jiǎn)單,使整個(gè)系統(tǒng)的設(shè)計(jì)工作變得相當(dāng)方便,易于在工程實(shí)際中實(shí)施。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種位置伺服系統(tǒng),包括一個(gè)位置環(huán)控制器,用于接收一個(gè)位置誤差,并產(chǎn)生一個(gè)速度指令;一個(gè)自適應(yīng)控制器,用于接收所述速度指令、一個(gè)模型誤差和一個(gè)伺服對(duì)象速度信號(hào),并產(chǎn)生一個(gè)自適應(yīng)控制器輸出;一個(gè)神經(jīng)網(wǎng)絡(luò)控制器,用于接收所述伺服對(duì)象速度信號(hào)、一個(gè)控制信號(hào)和所述模型誤差,并輸出一個(gè)神經(jīng)網(wǎng)絡(luò)控制器輸出;一個(gè)參考模型,用于接收所述速度指令并產(chǎn)生一個(gè)參考模型輸出;一個(gè)第一加法器,用于把所述自適應(yīng)控制器輸出和所述神經(jīng)網(wǎng)絡(luò)控制器的輸出相加,從而產(chǎn)生所述控制信號(hào);一個(gè)伺服執(zhí)行裝置,用于在所述控制信號(hào)的控制下,進(jìn)行伺服操作;一個(gè)速度檢測(cè)裝置,用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的速度,從而生成所述伺服對(duì)象速度信號(hào);一個(gè)位置測(cè)量裝置,用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的位置,并生成一個(gè)控制對(duì)象位置輸出;一個(gè)第二加法器,用于把所述所述伺服對(duì)象速度與所述參考模型輸出相減,從而生成所述模型誤差;一個(gè)第三加法器,用于把所述控制對(duì)象位置輸出和所述位置伺服系統(tǒng)所接收到的一個(gè)位置指令相減,從而生成所述位置誤差。
根據(jù)本發(fā)明的一個(gè)進(jìn)一步的方面,上述自適應(yīng)控制器進(jìn)一步包括一個(gè)第一乘法器,用于接收所述速度指令和所述模型誤差信號(hào),并將二者相乘;一個(gè)第一積分-放大裝置,用于把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù);一個(gè)第三乘法器,用于把所述第一自適應(yīng)參數(shù)與所述速度指令相乘;一個(gè)第二乘法器,用于接收所述伺服對(duì)象速度和所述模型誤差信號(hào),并將二者相乘;一個(gè)第二積分-放大器,用于把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率,從而生成一個(gè)第二自適應(yīng)參數(shù);一個(gè)第四乘法器,用于把所述的第二自適應(yīng)參數(shù)與所述伺服對(duì)象速度相乘;一個(gè)加法器,用于接收所述的第三和第四乘法器的輸出,并把兩者相減,作為所述自適應(yīng)控制器輸出。
根據(jù)本發(fā)明的一個(gè)進(jìn)一步的方面,上述神經(jīng)網(wǎng)絡(luò)控制器進(jìn)一步包括歸一化部分,用于對(duì)所述控制信號(hào)和所述伺服對(duì)象速度的當(dāng)前采樣時(shí)刻的值和前一采樣時(shí)刻的值進(jìn)行歸一化,得到相應(yīng)的歸一化結(jié)果;加權(quán)求和部分,用于將各所述歸一化結(jié)果乘以對(duì)應(yīng)的權(quán)值并求和,從而得到加權(quán)求和結(jié)果;輸出部分,用于將所述求和結(jié)果通過(guò)輸出函數(shù)進(jìn)行處理,而獲得并輸出所述神經(jīng)網(wǎng)絡(luò)控制器輸出,其中,所述權(quán)值的更新算法為其中xi為該權(quán)值的對(duì)應(yīng)輸入,γ2為一個(gè)預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率。
根據(jù)本發(fā)明的另一個(gè)方面,提供了用于一種位置伺服系統(tǒng)的一種自適應(yīng)控制器,所述位置伺服系統(tǒng)包括一個(gè)位置環(huán)控制器,用于接收一個(gè)位置誤差,并產(chǎn)生一個(gè)速度指令;所述自適應(yīng)控制器,用于接收所述速度指令、一個(gè)模型誤差和一個(gè)伺服對(duì)象速度信號(hào),并產(chǎn)生一個(gè)自適應(yīng)控制器輸出;一個(gè)神經(jīng)網(wǎng)絡(luò)控制器,用于接收所述伺服對(duì)象速度信號(hào)、一個(gè)控制信號(hào)和所述模型誤差,并輸出一個(gè)神經(jīng)網(wǎng)絡(luò)控制器輸出;一個(gè)參考模型,用于接收所述速度指令并產(chǎn)生一個(gè)參考模型輸出;一個(gè)第一加法器,用于把所述自適應(yīng)控制器輸出和所述神經(jīng)網(wǎng)絡(luò)控制器的輸出相加,從而產(chǎn)生所述控制信號(hào);一個(gè)伺服執(zhí)行裝置,用于在所述控制信號(hào)的控制下,進(jìn)行伺服操作;一個(gè)速度檢測(cè)裝置,用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的速度,從而生成所述伺服對(duì)象速度信號(hào);一個(gè)位置測(cè)量裝置,用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的位置,并生成一個(gè)控制對(duì)象位置輸出;一個(gè)第二加法器,用于把所述所述伺服對(duì)象速度與所述參考模型輸出相減,從而生成所述模型誤差;一個(gè)第三加法器,用于把所述控制對(duì)象位置輸出和所述位置伺服系統(tǒng)所接收到的一個(gè)位置指令相減,從而生成所述位置誤差,其特征在于所述自適應(yīng)控制器進(jìn)一步包括一個(gè)第一乘法器,用于接收所述速度指令和所述模型誤差信號(hào),并將二者相乘;一個(gè)第一積分-放大裝置,用于把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù);一個(gè)第三乘法器,用于把所述第一自適應(yīng)參數(shù)與所述速度指令相乘;一個(gè)第二乘法器,用于接收所述伺服對(duì)象速度和所述模型誤差信號(hào),并將二者相乘;一個(gè)第二積分-放大器,用于把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率,從而生成一個(gè)第二自適應(yīng)參數(shù);一個(gè)第四乘法器,用于把所述的第二自適應(yīng)參數(shù)與所述伺服對(duì)象速度相乘;一個(gè)加法器,用于接收所述的第三和第四乘法器的輸出,并把兩者相減,作為所述自適應(yīng)控制器輸出。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種位置伺服方法,包括用一個(gè)位置環(huán)控制器接收一個(gè)位置誤差并產(chǎn)生一個(gè)速度指令;用一個(gè)自適應(yīng)控制器接收所述速度指令、一個(gè)模型誤差和一個(gè)伺服對(duì)象速度信號(hào),并產(chǎn)生一個(gè)自適應(yīng)控制器輸出;用一個(gè)神經(jīng)網(wǎng)絡(luò)控制器,用于接收所述伺服對(duì)象速度信號(hào)、一個(gè)控制信號(hào)和所述模型誤差,并輸出一個(gè)神經(jīng)網(wǎng)絡(luò)控制器輸出;用一個(gè)參考模型接收所述速度指令并產(chǎn)生一個(gè)參考模型輸出;用一個(gè)第一加法器,把所述自適應(yīng)控制器輸出和所述神經(jīng)網(wǎng)絡(luò)控制器的輸出相加,從而產(chǎn)生所述控制信號(hào);借助一個(gè)伺服執(zhí)行裝置,在所述控制信號(hào)的控制下,進(jìn)行伺服操作;借助一個(gè)速度檢測(cè)裝置,測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的速度,從而生成所述伺服對(duì)象速度信號(hào);借助一個(gè)位置測(cè)量裝置,測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的位置,并生成一個(gè)控制對(duì)象位置輸出;在一個(gè)第二加法器,把所述所述伺服對(duì)象速度與所述參考模型輸出相減,從而生成所述模型誤差;在一個(gè)第三加法器,把所述控制對(duì)象位置輸出和所述位置伺服系統(tǒng)所接收到的一個(gè)位置指令相減,從而生成所述位置誤差。
根據(jù)本發(fā)明的一個(gè)進(jìn)一步的方面,上述用所述自適應(yīng)控制器產(chǎn)生一個(gè)自適應(yīng)控制器輸出的所述步驟進(jìn)一步包括在一個(gè)第一乘法器,把所述速度指令和所述模型誤差信號(hào)相乘;在一個(gè)第一積分-放大裝置,把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù);在一個(gè)第三乘法器,把所述第一自適應(yīng)參數(shù)與所述速度指令相乘;在一個(gè)第二乘法器,把所述伺服對(duì)象速度和所述模型誤差信號(hào)相乘;在一個(gè)第二積分-放大器,把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率,從而生成一個(gè)第二自適應(yīng)參數(shù);在一個(gè)第四乘法器,把所述的第二自適應(yīng)參數(shù)與所述伺服對(duì)象速度相乘;在一個(gè)加法器,把所述的第三和第四乘法器的輸出相減,并將相減的結(jié)果作為所述自適應(yīng)控制器輸出。
圖1是本發(fā)明的自適應(yīng)控制器的詳細(xì)結(jié)構(gòu)示意圖; 圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的位置伺服系統(tǒng)的示意圖; 圖3是傳統(tǒng)的“三環(huán)”結(jié)構(gòu)的經(jīng)典伺服系統(tǒng)的示意圖; 圖4是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的位置伺服系統(tǒng)的示意圖; 圖5是圖4所示的實(shí)施例的系統(tǒng)框圖; 圖6用于說(shuō)明圖2、4、5中的神經(jīng)網(wǎng)絡(luò)控制器的內(nèi)部結(jié)構(gòu); 圖7和8用于比較本發(fā)明和現(xiàn)有技術(shù)的應(yīng)用實(shí)例的效果對(duì)比。
具體實(shí)施例方式 根據(jù)本發(fā)明的一個(gè)實(shí)施例的伺服系統(tǒng)控制器的理論結(jié)構(gòu)如圖4所示。系統(tǒng)由位置閉環(huán)和位置閉環(huán)內(nèi)部的模型參考自適應(yīng)控制結(jié)構(gòu)組成,圖5是系統(tǒng)框圖。圖4、圖5中編號(hào)部分是對(duì)應(yīng)的?,F(xiàn)分別介紹組成系統(tǒng)的幾個(gè)模塊 1)位置環(huán)控制器 圖4、圖5中編號(hào)1的模塊為位置環(huán)控制器。位置環(huán)控制器的輸入為位置指令和位置輸出的差值,其輸出為速度環(huán)指令。多種類型的控制器可以作為位置環(huán)控制器在此處使用,例如PID控制器(比例、積分、微分控制器)和P控制器(比例控制器),但不僅限于這兩種控制器。在本方案中推薦選用簡(jiǎn)單的P控制器,其輸入輸出關(guān)系可以寫為r=Kp(θd-θ),Kp為人為選定的常數(shù)。該控制器可以由計(jì)算機(jī)軟件實(shí)現(xiàn),也可以用硬件電路實(shí)現(xiàn)。
2)被控對(duì)象模塊 圖4、圖5中編號(hào)為2的模塊為系統(tǒng)的被控對(duì)象,即整個(gè)控制系統(tǒng)的控制對(duì)象。伺服系統(tǒng)的被控對(duì)象通常為電機(jī),以及用于驅(qū)動(dòng)電機(jī)的功率放大器裝置,同時(shí)還可以包含有通過(guò)某種形式構(gòu)成的電流環(huán)。圖4中所示為該模塊的一種可能的結(jié)構(gòu),但不僅限于這種結(jié)構(gòu)。該模塊輸入為控制器輸出u,輸出為電機(jī)轉(zhuǎn)速ω。其輸入輸出關(guān)系可由下列微分方程描述 其中J、B表示電機(jī)的轉(zhuǎn)動(dòng)慣量和粘性摩擦系數(shù)。Td表示等效干擾轉(zhuǎn)矩,例如摩擦力矩、由于機(jī)械形變?cè)诙鴤鲃?dòng)軸上產(chǎn)生的彈性力矩等。ia,ua,La分別表示電樞電流,電樞電壓和電樞電感。K表示力矩系數(shù)。Km為功率放大裝置的放大系數(shù)。
3)輸出模塊 圖4、圖5中編號(hào)為3的模塊為系統(tǒng)的輸出模塊,這是一個(gè)機(jī)械傳動(dòng)機(jī)構(gòu)。其作用為將電機(jī)的旋轉(zhuǎn)運(yùn)動(dòng)轉(zhuǎn)化為其他種類的運(yùn)動(dòng)形式,實(shí)現(xiàn)伺服運(yùn)動(dòng)。通常情況下,這個(gè)模塊的輸入為被控對(duì)象模塊的輸出,輸出為伺服運(yùn)動(dòng)的線位移或角位移。
4)參考模型模塊 圖4、圖5中編號(hào)為4的部分是系統(tǒng)的參考模型模塊,可以通過(guò)計(jì)算機(jī)軟件實(shí)現(xiàn),也可以利用硬件電路實(shí)現(xiàn)。該模塊的輸入為位置環(huán)控制器的輸出,其輸出為參考模型輸出。這個(gè)模塊的輸入輸出關(guān)系為這個(gè)關(guān)系是按照理想的直流電機(jī)模型擬定的。其目的在于提供一個(gè)參考的對(duì)象給控制器,自適應(yīng)控制器和神經(jīng)網(wǎng)絡(luò)控制器將以此為標(biāo)準(zhǔn),有目的的調(diào)整系統(tǒng),使速度輸出信號(hào)與參考模型輸出一致。式中ωm是參考模型的輸出。am和bm是模型參數(shù),可以利用常用的系統(tǒng)辨識(shí)的方法測(cè)得。本發(fā)明的特點(diǎn)在于不需要被控對(duì)象的精確模型,常用的簡(jiǎn)單的辨識(shí)方法測(cè)得的對(duì)象模型就可以在系統(tǒng)中使用,這是本方法與其他模型參考方法的重要區(qū)別。
5)神經(jīng)網(wǎng)絡(luò)控制器模塊 圖4、圖5中編號(hào)為5的部分是神經(jīng)網(wǎng)絡(luò)控制器模塊,其具體結(jié)構(gòu)參見(jiàn)圖6,在系統(tǒng)中用計(jì)算機(jī)軟件實(shí)現(xiàn),也可以用硬件電路實(shí)現(xiàn)。該模塊的輸入為控制信號(hào)u,速度輸出ω和模型誤差eω,輸出為神經(jīng)網(wǎng)絡(luò)控制器輸出un。
如圖6所示,在本發(fā)明的神經(jīng)網(wǎng)絡(luò)控制器中,首先對(duì)u,ω的當(dāng)前采樣時(shí)刻的值(uk,ωk)和前一采樣時(shí)刻的值(uk-1,ωk-1)進(jìn)行歸一化,得到
歸一化方法可以使用常用的各種歸一化方法,這里推薦使用的歸一化方法是用某輸入的當(dāng)前值除以該輸入歷史峰值的絕對(duì)值。例如,其中 umax=max{u1,u2,…,uk}。然后將歸一化后的各輸入乘以對(duì)應(yīng)的權(quán)值并求和,為得到
后再通過(guò)輸出函數(shù)輸出,這里推薦的輸出函數(shù)為其他類型的輸出函數(shù)也是可以使用。f(S)是該模塊的最終輸出值。其中,神經(jīng)網(wǎng)絡(luò)權(quán)值w1,w2,w3,w4的更新算法為 其中γ2為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率,這個(gè)數(shù)值可以根據(jù)系統(tǒng)的不同做人為的調(diào)整。
以上描述的只是多種適合于本發(fā)明的幾種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的一種,常用的小腦模型人工神經(jīng)網(wǎng)絡(luò),徑向基函數(shù)人工神經(jīng)網(wǎng)絡(luò)等幾種網(wǎng)絡(luò)也可以用做本發(fā)明中的神經(jīng)網(wǎng)絡(luò)。
6)自適應(yīng)控制器模塊 圖4、圖5中編號(hào)為6的部分為自適應(yīng)控制器模塊,可以由計(jì)算機(jī)軟件實(shí)現(xiàn)也可用硬件實(shí)現(xiàn)。該模塊的輸入為速度指令r,速度輸出ω和模型誤差eω,輸出為自適應(yīng)控制器輸出u1。為了保證系統(tǒng)穩(wěn)定,根據(jù)理論推導(dǎo)(詳見(jiàn)下文),本模塊的輸入輸出之間有如下關(guān)系其中,γ11和γ12為人為選取的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率。
圖2顯示了本發(fā)明的另一種實(shí)施方式。與圖4和5所示的實(shí)施方式相比,圖2所示的實(shí)施方式?jīng)]有閉合的電流環(huán)(即沒(méi)有“電流反饋”部分),而且圖2中顯示了速度檢測(cè)裝置208和位置檢測(cè)裝置209。圖2與圖4中相對(duì)應(yīng)的部分均相同,因而不再對(duì)它們做重復(fù)說(shuō)明。
圖1顯示了圖2、4、5中的自適應(yīng)控制器的結(jié)構(gòu)。如圖1所示,該自適應(yīng)控制器進(jìn)一步包括第一乘法器101,用于接收所述速度指令r和模型誤差信號(hào)eω,并將二者相乘;第一積分-放大裝置102,用于把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率γ11的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù)θ1;第三乘法器103,用于把第一自適應(yīng)參數(shù)θ1與速度指令r相乘;第二乘法器104,用于接收伺服對(duì)象速度ω和模型誤差信號(hào)eω,并將二者相乘;第二積分-放大器105,用于把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率γ12,從而生成一個(gè)第二自適應(yīng)參數(shù)θ2;第四乘法器106,用于把第二自適應(yīng)參數(shù)θ2與伺服對(duì)象速度ω相乘;加法器107,用于接收第三和第四乘法器的輸出,并把兩者相減,作為自適應(yīng)控制器輸出。
神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器設(shè)計(jì)的理論依據(jù) 控制系統(tǒng)除了精度要求之外,另外一個(gè)很重要的要求是系統(tǒng)的穩(wěn)定性要求。要實(shí)現(xiàn)一個(gè)系統(tǒng)的自動(dòng)控制,就必須保證系統(tǒng)的穩(wěn)定。反之,一個(gè)不穩(wěn)定的系統(tǒng)在實(shí)際生產(chǎn)中可能發(fā)生的失控情況將是不可接受的。實(shí)際生產(chǎn)中一旦發(fā)生系統(tǒng)失控,通常會(huì)造成財(cái)產(chǎn)損失,有時(shí)甚至是人員傷亡。因而,系統(tǒng)穩(wěn)定性的分析或證明是一個(gè)完善的控制系統(tǒng)設(shè)計(jì)的不可缺的組成部分。
本發(fā)明有著堅(jiān)實(shí)的理論基礎(chǔ)和嚴(yán)格的穩(wěn)定性證明,這可以確保本發(fā)明能夠很好很安全的應(yīng)用于實(shí)際生產(chǎn)。以下是本發(fā)明的理論依據(jù) 伺服系統(tǒng)的動(dòng)態(tài)特性可以由以下方程描述 θ=∫ωdt (3) 其中J、B表示電機(jī)的轉(zhuǎn)動(dòng)慣量和粘性摩擦系數(shù)。ω表示電機(jī)的角速。Td表示等效干擾轉(zhuǎn)矩,例如摩擦力矩、由于機(jī)械形變?cè)诙鴤鲃?dòng)軸上產(chǎn)生的彈性力矩等。ia,ua,La分別表示電樞電流,電樞電壓和電樞電感。K表示力矩系數(shù)。θ是電機(jī)轉(zhuǎn)角的角位置。由于電樞電感很小,即La≈0,在實(shí)際中通常將其忽略。從等式(1)到(3)可以得到以下動(dòng)態(tài)方程, 令 那么等式(1)可以重新寫成 進(jìn)一步,令 可以得到 根據(jù)上式可以選擇速度環(huán)參考模型如下 其中,am,bm是根據(jù)最小二乘算法測(cè)得的電機(jī)模型估計(jì)參數(shù)。
定義模型誤差eω=ω-ωm. 定義控制器結(jié)構(gòu)如下, u=u1+un(9) 其中u1=θ1r-θ2ω為自適應(yīng)控制器的輸出,un是神經(jīng)網(wǎng)絡(luò)控制器的輸出。
定義,un=WTX,un*=W*TX,W是神經(jīng)網(wǎng)絡(luò)的權(quán)值向量,X是神經(jīng)網(wǎng)絡(luò)的輸入,un*是神經(jīng)網(wǎng)絡(luò)的優(yōu)化輸出,W*是優(yōu)化權(quán)值向量。那么根據(jù)神經(jīng)網(wǎng)絡(luò)的逼近定理有max|un*-udr|<ε,其中ε是一個(gè)給定的任意小的正常數(shù),定義 那么模型誤差對(duì)時(shí)間的導(dǎo)數(shù)為, 從上式可以得到,當(dāng)a+bθ2-am,bθ1-bm,
bun**-udr為零時(shí),模型誤差eω按指數(shù)收斂到零 定義Lyapunov函數(shù)如下, 當(dāng)趨近于零時(shí),V趨近于零。V對(duì)時(shí)間t的導(dǎo)數(shù)為 從等式(2)和(3),可以得到 根據(jù)Lyapunov穩(wěn)定性理論,當(dāng)
bun*-udr為零時(shí),有系統(tǒng)可以保證穩(wěn)定。
因此可以選取MRAC更新算法,如下 選取神經(jīng)網(wǎng)絡(luò)控制器權(quán)值更新算法, 其中,γ11,γ12,γ2是人工選定的學(xué)習(xí)速率,將(5),(6)帶入(4)有, 當(dāng)時(shí),保證了速度環(huán)的穩(wěn)定性。
由以上分析推導(dǎo),速度環(huán)的實(shí)際動(dòng)態(tài)特性將跟蹤參考模型的動(dòng)態(tài)特性。位置環(huán)控制器可以按照速度環(huán)參考模型來(lái)設(shè)計(jì)。這樣,很容易保證整個(gè)位置閉環(huán)系統(tǒng)的穩(wěn)定性。
本發(fā)明利用自適應(yīng)算法可以在線、實(shí)時(shí)調(diào)節(jié)參數(shù)的特點(diǎn),通過(guò)對(duì)參數(shù)數(shù)值的改變達(dá)到對(duì)系統(tǒng)穩(wěn)定控制的目的。同時(shí)神經(jīng)網(wǎng)絡(luò)算法具有較快的收斂速度、能夠逼近復(fù)雜的非線性函數(shù)和自學(xué)習(xí)能力等特點(diǎn),分布并行處理,非線性映射,魯棒容錯(cuò)和泛化能力強(qiáng)等特性,使得它在學(xué)習(xí)過(guò)程中實(shí)現(xiàn)了對(duì)伺服系統(tǒng)的噪聲抑制作用及非線性補(bǔ)償。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于 采用自適應(yīng)和神經(jīng)網(wǎng)絡(luò)相結(jié)合的控制方法,有效地克服了非線性誤差對(duì)伺服系統(tǒng)控制精度的影響。
本發(fā)明采用自適應(yīng)算法,可在線調(diào)節(jié)參數(shù)控制系統(tǒng),具有操作簡(jiǎn)單,成本低廉的特點(diǎn)。
本發(fā)明對(duì)伺服系統(tǒng)的控制不需要建立在對(duì)象精確建模的基礎(chǔ)上,節(jié)省了建模的費(fèi)用。
本發(fā)明說(shuō)明書中未作詳細(xì)描述的內(nèi)容屬于本領(lǐng)域?qū)I(yè)技術(shù)人員公知的現(xiàn)有技術(shù)。
實(shí)施實(shí)例 本實(shí)施例中各模塊中的參數(shù)分別為am=150,bm=1000,γ11=5,γ12=5,γ2=1,Kp=1。位置指令θd為幅值為0.5°,頻率為3Hz的正弦信號(hào)。
圖7、圖8給出了采用本發(fā)明前后在位置誤差的實(shí)驗(yàn)曲線圖。
圖7為未采用本發(fā)明的位置跟蹤誤差曲線,橫坐標(biāo)為時(shí)間t(單位s),縱坐標(biāo)為位置誤差eθ(單位度)。
圖8為采用本發(fā)明的位置跟蹤誤差曲線,橫坐標(biāo)為時(shí)間t(單位s),縱坐標(biāo)為位置誤差eθ(單位度)。
通過(guò)對(duì)比圖7、圖8可以看出,采用本發(fā)明后系統(tǒng)的位置誤差小于未采用本發(fā)明時(shí)系統(tǒng)位置誤差的一半。本發(fā)明在抑制噪聲干擾、非線性方面也有著很好的效果, 從圖7、圖8可以看出,伺服系統(tǒng)受到的摩擦等擾動(dòng)以及上文提及的其他非線性,不確定性因素都可以被本發(fā)明有效的抑制,從而得到很高的控制精度。
權(quán)利要求
1、一種位置伺服系統(tǒng),包括
一個(gè)位置環(huán)控制器(1,201),用于接收一個(gè)位置誤差,并產(chǎn)生一個(gè)速度指令(r);
一個(gè)自適應(yīng)控制器(6,202),用于接收所述速度指令(r)、一個(gè)模型誤差(eω)和一個(gè)伺服對(duì)象速度信號(hào)(ω),并產(chǎn)生一個(gè)自適應(yīng)控制器輸出;
一個(gè)神經(jīng)網(wǎng)絡(luò)控制器(5,203),用于接收所述伺服對(duì)象速度信號(hào)(ω)、一個(gè)控制信號(hào)(u)和所述模型誤差(eω),并輸出一個(gè)神經(jīng)網(wǎng)絡(luò)控制器輸出(un);
一個(gè)參考模型(4,204),用于接收所述速度指令(r)并產(chǎn)生一個(gè)參考模型輸出(ωm);
一個(gè)第一加法器(205),用于把所述自適應(yīng)控制器輸出和所述神經(jīng)網(wǎng)絡(luò)控制器的輸出相加,從而產(chǎn)生所述控制信號(hào)(u);
一個(gè)伺服執(zhí)行裝置(207),用于在所述控制信號(hào)(u)的控制下,進(jìn)行伺服操作;
一個(gè)速度檢測(cè)裝置(208),用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的速度,從而生成所述伺服對(duì)象速度信號(hào)(ω);
一個(gè)位置測(cè)量裝置(209),用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的位置,并生成一個(gè)控制對(duì)象位置輸出;
一個(gè)第二加法器(210),用于把所述伺服對(duì)象速度(ω)與所述參考模型輸出(ωm)相減,從而生成所述模型誤差(eω);
一個(gè)第三加法器(211),用于把所述控制對(duì)象位置輸出和所述位置伺服系統(tǒng)所接收到的一個(gè)位置指令相減,從而生成所述位置誤差。
2.根據(jù)權(quán)利要求1所述的位置伺服系統(tǒng),其特征在于所述自適應(yīng)控制器進(jìn)一步包括
一個(gè)第一乘法器(101),用于接收所述速度指令(r)和所述模型誤差信號(hào)(eω),并將二者相乘;
一個(gè)第一積分-放大裝置(102),用于把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率(γ11)的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù)(θ1);
一個(gè)第三乘法器(103),用于把所述第一自適應(yīng)參數(shù)(θ1)與所述速度指令(r)相乘;
一個(gè)第二乘法器(104),用于接收所述伺服對(duì)象速度(ω)和所述模型誤差信號(hào)(eω),并將二者相乘;
一個(gè)第二積分-放大器(105),用于把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率(γ12),從而生成一個(gè)第二自適應(yīng)參數(shù)(θ2);
一個(gè)第四乘法器(106),用于把所述的第二自適應(yīng)參數(shù)(θ2)與所述伺服對(duì)象速度(ω)相乘;
一個(gè)加法器(107),用于接收所述的第三和第四乘法器的輸出,并把兩者相減,作為所述自適應(yīng)控制器輸出。
3、根據(jù)權(quán)利要求1所述的位置伺服系統(tǒng),其特征在于所述神經(jīng)網(wǎng)絡(luò)控制器進(jìn)一步包括
歸一化部分,用于對(duì)所述控制信號(hào)(u)和所述伺服對(duì)象速度(ω)的當(dāng)前采樣時(shí)刻的值(uk,ωk)和前一采樣時(shí)刻的值(uk-1,ωk-1)進(jìn)行歸一化,得到相應(yīng)的歸一化結(jié)果
加權(quán)求和部分,用于將各所述歸一化結(jié)果乘以對(duì)應(yīng)的權(quán)值(w1,w2,w3,w4)并求和,從而得到加權(quán)求和結(jié)果
輸出部分,用于將所述求和結(jié)果(S)通過(guò)輸出函數(shù)進(jìn)行處理,而獲得并輸出所述神經(jīng)網(wǎng)絡(luò)控制器輸出(f(S)),
其中,所述權(quán)值(w1,w2,w3,w4)的更新算法為其中
xi為該權(quán)值的對(duì)應(yīng)輸入,
γ2為一個(gè)預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率。
4、用于一種位置伺服系統(tǒng)的一種自適應(yīng)控制器(6,202),所述位置伺服系統(tǒng)包括
一個(gè)位置環(huán)控制器(1,201),用于接收一個(gè)位置誤差,并產(chǎn)生一個(gè)速度指令(r);
所述自適應(yīng)控制器(6,202),用于接收所述速度指令(r)、一個(gè)模型誤差(eω)和一個(gè)伺服對(duì)象速度信號(hào)(ω),并產(chǎn)生一個(gè)自適應(yīng)控制器輸出;
一個(gè)神經(jīng)網(wǎng)絡(luò)控制器(5,203),用于接收所述伺服對(duì)象速度信號(hào)(ω)、一個(gè)控制信號(hào)(u)和所述模型誤差(eω),并輸出一個(gè)神經(jīng)網(wǎng)絡(luò)控制器輸出;
一個(gè)參考模型(4,204),用于接收所述速度指令(r)并產(chǎn)生一個(gè)參考模型輸出(ωm);
一個(gè)第一加法器(205),用于把所述自適應(yīng)控制器輸出和所述神經(jīng)網(wǎng)絡(luò)控制器的輸出相加,從而產(chǎn)生所述控制信號(hào)(u);
一個(gè)伺服執(zhí)行裝置(207),用于在所述控制信號(hào)(u)的控制下,進(jìn)行伺服操作;
一個(gè)速度檢測(cè)裝置,用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的速度,從而生成所述伺服對(duì)象速度信號(hào)(ω);
一個(gè)位置測(cè)量裝置,用于測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的位置,并生成一個(gè)控制對(duì)象位置輸出;
一個(gè)第二加法器(210),用于把所述所述伺服對(duì)象速度(ω)與所述參考模型輸出(ωm)相減,從而生成所述模型誤差(eω);
一個(gè)第三加法器(211),用于把所述控制對(duì)象位置輸出和所述位置伺服系統(tǒng)所接收到的一個(gè)位置指令相減,從而生成所述位置誤差,
其特征在于所述自適應(yīng)控制器進(jìn)一步包括
一個(gè)第一乘法器(101),用于接收所述速度指令(r)和所述模型誤差信號(hào)(eω),并將二者相乘;
一個(gè)第一積分-放大裝置(102),用于把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率(γ11)的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù)(θ1);
一個(gè)第三乘法器(103),用于把所述第一自適應(yīng)參數(shù)(θ1)與所述速度指令(r)相乘;
一個(gè)第二乘法器(104),用于接收所述伺服對(duì)象速度(ω)和所述模型誤差信號(hào)(eω),并將二者相乘;
一個(gè)第二積分-放大器(105),用于把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率(γ12),從而生成一個(gè)第二自適應(yīng)參數(shù)(θ2);
一個(gè)第四乘法器(106),用于把所述的第二自適應(yīng)參數(shù)(θ2)與所述伺服對(duì)象速度(ω)相乘;
一個(gè)加法器(107),用于接收所述的第三和第四乘法器的輸出,并把兩者相減,作為所述自適應(yīng)控制器輸出。
5、根據(jù)權(quán)利要求4所述的自適應(yīng)控制器,其中所述神經(jīng)網(wǎng)絡(luò)控制器進(jìn)一步包括
歸一化部分,用于對(duì)所述控制信號(hào)(u)和所述伺服對(duì)象速度(ω)的當(dāng)前采樣時(shí)刻的值(uk,ωk)和前一采樣時(shí)刻的值(uk-1,ωk-1)進(jìn)行歸一化,得到相應(yīng)的歸一化結(jié)果
加權(quán)求和部分,用于將各所述歸一化結(jié)果乘以對(duì)應(yīng)的權(quán)值(w1,w2,w3,w4)并求和,從而得到加權(quán)求和結(jié)果
輸出部分,用于將所述求和結(jié)果(S)通過(guò)輸出函數(shù)進(jìn)行處理,而獲得并輸出所述神經(jīng)網(wǎng)絡(luò)控制器輸出(f(S)),
其中,所述權(quán)值(w1,w2,w3,w4)的更新算法為其中
xi為該權(quán)值的對(duì)應(yīng)輸入,
γ2為一個(gè)預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率。
6、一種位置伺服方法,包括
用一個(gè)位置環(huán)控制器(1,201)接收一個(gè)位置誤差并產(chǎn)生一個(gè)速度指令(r);
用一個(gè)自適應(yīng)控制器(6,202)接收所述速度指令(r)、一個(gè)模型誤差(eω)和一個(gè)伺服對(duì)象速度信號(hào)(ω),并產(chǎn)生一個(gè)自適應(yīng)控制器輸出;
用一個(gè)神經(jīng)網(wǎng)絡(luò)控制器(5,203),用于接收所述伺服對(duì)象速度信號(hào)(ω)、一個(gè)控制信號(hào)(u)和所述模型誤差(eω),并輸出一個(gè)神經(jīng)網(wǎng)絡(luò)控制器輸出;
用一個(gè)參考模型(4,204)接收所述速度指令(r)并產(chǎn)生一個(gè)參考模型輸出(ωm);
用一個(gè)第一加法器(205),把所述自適應(yīng)控制器輸出和所述神經(jīng)網(wǎng)絡(luò)控制器的輸出相加,從而產(chǎn)生所述控制信號(hào)(u);
借助一個(gè)伺服執(zhí)行裝置(207),在所述控制信號(hào)(u)的控制下,進(jìn)行伺服操作;
借助一個(gè)速度檢測(cè)裝置(208),測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的速度,從而生成所述伺服對(duì)象速度信號(hào)(ω);
借助一個(gè)位置測(cè)量裝置(209),測(cè)量所述位置伺服系統(tǒng)的伺服對(duì)象的位置,并生成一個(gè)控制對(duì)象位置輸出;
在一個(gè)第二加法器(210),把所述所述伺服對(duì)象速度(ω)與所述參考模型輸出(ωm)相減,從而生成所述模型誤差(eω);
在一個(gè)第三加法器(211),把所述控制對(duì)象位置輸出和所述位置伺服系統(tǒng)所接收到的一個(gè)位置指令相減,從而生成所述位置誤差。
7、根據(jù)權(quán)利要求6所述的位置伺服方法,其特征在于用所述自適應(yīng)控制器(6,202)產(chǎn)生一個(gè)自適應(yīng)控制器輸出的所述步驟進(jìn)一步包括
在一個(gè)第一乘法器(101),把所述速度指令(r)和所述模型誤差信號(hào)(eω)相乘;
在一個(gè)第一積分-放大裝置(102),把第一乘法器的輸出積分并乘以一個(gè)第一學(xué)習(xí)速率(γ11)的負(fù)值,從而生成一個(gè)第一自適應(yīng)參數(shù)(θ1);
在一個(gè)第三乘法器(103),把所述第一自適應(yīng)參數(shù)(θ1)與所述速度指令(r)相乘;
在一個(gè)第二乘法器(104),把所述伺服對(duì)象速度(ω)和所述模型誤差信號(hào)(eω)相乘;
在一個(gè)第二積分-放大器(105),把第二乘法器的輸出積分并乘以一個(gè)第二學(xué)習(xí)速率(γ12),從而生成一個(gè)第二自適應(yīng)參數(shù)(θ2);
在一個(gè)第四乘法器(106),把所述的第二自適應(yīng)參數(shù)(θ2)與所述伺服對(duì)象速度(ω)相乘;
在一個(gè)加法器(107),把所述的第三和第四乘法器的輸出相減,并將相減的結(jié)果作為所述自適應(yīng)控制器輸出。
8、根據(jù)權(quán)利要求6所述的位置伺服系統(tǒng),其特征在于用所述神經(jīng)網(wǎng)絡(luò)控制器接收所述伺服對(duì)象速度信號(hào)(ω)、控制信號(hào)(u)和模型誤差(eω)并輸出所述神經(jīng)網(wǎng)絡(luò)控制器輸出的所述步驟進(jìn)一步包括
歸一化部分步驟,其對(duì)所述控制信號(hào)(u)和所述伺服對(duì)象速度(ω)的當(dāng)前采樣時(shí)刻的值(uk,ωk)和前一采樣時(shí)刻的值(uk-1,ωk-1)進(jìn)行歸一化,得到相應(yīng)的歸一化結(jié)果
加權(quán)求和步驟,其將各所述歸一化結(jié)果乘以對(duì)應(yīng)的權(quán)值(w1,w2,w3,w4)并求和,從而得到加權(quán)求和結(jié)果
輸出步驟,用于將所述求和結(jié)果(S)通過(guò)輸出函數(shù)進(jìn)行處理,而獲得并輸出所述神經(jīng)網(wǎng)絡(luò)控制器輸出(f(S)),
其中,所述權(quán)值(w1,w2,w3,w4)的更新算法為其中
xi為該權(quán)值的對(duì)應(yīng)輸入,
γ2為一個(gè)預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率。
全文摘要
本發(fā)明是為了提高伺服系統(tǒng)的控制精度提出一種應(yīng)用于伺服系統(tǒng)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方法,實(shí)現(xiàn)了對(duì)伺服系統(tǒng)的非線性補(bǔ)償和干擾抑制,提高了伺服系統(tǒng)的跟蹤精度。本發(fā)明主要包括參考模型,自適應(yīng)控制器和神經(jīng)網(wǎng)絡(luò)控制器三個(gè)部分。另外,在速度環(huán)精確參考模型的基礎(chǔ)上,位置環(huán)控制器的設(shè)計(jì)也變得非常簡(jiǎn)單,使整個(gè)系統(tǒng)的設(shè)計(jì)工作變得相當(dāng)方便,易于在工程中實(shí)施。
文檔編號(hào)G05D3/12GK101571705SQ20081010542
公開日2009年11月4日 申請(qǐng)日期2008年4月29日 優(yōu)先權(quán)日2008年4月29日
發(fā)明者扈宏杰, 博 趙, 李德地 申請(qǐng)人:北京航空航天大學(xué)