基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機的自適應(yīng)逆控制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于無人機技術(shù)領(lǐng)域,設(shè)及一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機的自適應(yīng)逆控 制方法。
【背景技術(shù)】
[0002] 旋翼無人機是一種能夠垂直起降、W若干個旋翼作為動力裝置、不載操作人員的 一種飛行器。它W能夠垂直起降,任意懸停等靈活的控制方式W及結(jié)構(gòu)簡單噪聲小等特點, 近年來逐步成為了一個研究熱點。由于旋翼無人機動力學(xué)模型具有強禪合、欠驅(qū)動W及強 非線性等特點,設(shè)計出一個有效的旋翼無人機控制器是非常不易的,尤其是在對象模型參 數(shù)變化W及外界有干擾的情況下。在現(xiàn)有的技術(shù)中,一般的做法是將旋翼無人機動力學(xué)模 型進行簡化,W降低其控制器設(shè)計的復(fù)雜程度,進而利用傳統(tǒng)或現(xiàn)代控制方法對該簡化模 型進行控制器設(shè)計。
[0003] 在現(xiàn)有技術(shù)對旋翼無人機控制器設(shè)計方法中,一般的做法是將旋翼無人機動力學(xué) 模型進行簡化處理,來減低其控制器設(shè)計難度。但是,簡化動力學(xué)模型進行控制器設(shè)計也必 將導(dǎo)致系統(tǒng)模型不匹配的問題,進而使得在實際控制中,所設(shè)計的控制器達不到理想的控 制效果。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是提供一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機的自適應(yīng)逆控制方法,解決 了現(xiàn)有技術(shù)中存在的問題,利用兩個神經(jīng)網(wǎng)絡(luò)分別建立旋翼無人機系統(tǒng)模型的正向模型 和逆向模型,從而實現(xiàn)對完整旋翼無人機的控制和辨識。
[0005] 本發(fā)明所采用的技術(shù)方案是,一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機的自適應(yīng)逆控制方 法,按照下式進行控制:
[000引其中;n是學(xué)習(xí)率,巧:+|和町;分別是隱含層中第P個神經(jīng)元與輸出層中第t個神 經(jīng)元第n+l次和第n次訓(xùn)練后的值,C1和C分別是輸入層中第m個神經(jīng)元與隱含層中第 P個神經(jīng)元第n+1次和第n次訓(xùn)練后的值,?
分別表示能力函數(shù)Ec對變量 Wtp和Vpm的負梯度方向。
[0009] 本發(fā)明的有益效果是,利用神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力,對旋翼無人機 完整模型進行控制器設(shè)計。利用兩個神經(jīng)網(wǎng)絡(luò)分別建立旋翼無人機系統(tǒng)模型的正向模型和 逆向模型,從而實現(xiàn)對完整旋翼無人機的控制和辨識。系統(tǒng)辨識器(正向模型)的作用是 為系統(tǒng)逆控制器提供學(xué)習(xí)信號,進而實現(xiàn)逆控制器對外界干擾和旋翼無人機自身參數(shù)變化 具有良好的魯椿性。沒有對旋翼無人機系統(tǒng)模型進行任何簡化處理,而直接對完整的旋翼 無人機模型進行控制器設(shè)計。由于完整旋翼無人機系統(tǒng)模型與真實旋翼無人機系統(tǒng)具有更 好的一致性,因此本發(fā)明設(shè)計的控制器在實際旋翼無人機飛行中,具有更好的控制效果。
【附圖說明】
[0010] 圖1是本發(fā)明中控制系統(tǒng)框架圖。
[0011] 圖2是處理后的樣本集對系統(tǒng)辨識器的訓(xùn)練方法圖。
[0012] 圖3是處理后的樣本集對逆系統(tǒng)控制器的訓(xùn)練方法圖。
【具體實施方式】
[0013] 下面結(jié)合附圖和【具體實施方式】對本發(fā)明進行詳細說明。
[0014] 建立旋翼無人機理想系統(tǒng)模型情況下的系統(tǒng)辨識器和逆系統(tǒng)控制器,W達到系統(tǒng) 辨識器反映理想系統(tǒng)模型的輸入輸出關(guān)系,逆系統(tǒng)控制器反映理想逆系統(tǒng)模型的輸入輸出 關(guān)系。當(dāng)目標(biāo)信號值輸入到如圖1所示的控制系統(tǒng)時,由于外界干擾、載重變化等原因使得 系統(tǒng)模型輸出與目標(biāo)輸出產(chǎn)生誤差,通過自適應(yīng)算法對系統(tǒng)辨識器和逆系統(tǒng)控制器做反饋 校正已使得控制系統(tǒng)對外界干擾和載重變化具有良好的魯椿性。在本發(fā)明中,系統(tǒng)辨識器 的作用是建立一個等效于系統(tǒng)對象輸入輸出之間的映射關(guān)系,為逆系統(tǒng)控制器提供學(xué)習(xí)信 息。
[0015] 本發(fā)明一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機的自適應(yīng)逆控制方法,具體按照W下步驟 進行:
[0016] 1.訓(xùn)練樣本集采集
[0017] 白噪聲信號可W激勵出系統(tǒng)的全部特征。因此用幅值一定的白噪聲信號作為樣本 采集時的系統(tǒng)激勵信號,并用該激勵信號激勵旋翼無人機對象,得到該激勵下對象的對應(yīng) 輸出。循環(huán)該操作,得到一個合適大小的訓(xùn)練樣本集。
[001引 2.樣本處理
[0019] 對樣本集進行篩選處理。由于旋翼無人機在正常飛行過程中姿態(tài)角變化不大,因 此在本發(fā)明中總是限定姿態(tài)角大小在-10°~10°,并W此為標(biāo)準(zhǔn)對輸出超過該范圍的樣 本進行篩選處理。雖然經(jīng)過處理的樣本弱化了所映射的非線性強度,但是該種處理大大簡 化了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練時間,并且符合旋翼無人機的實際飛行情況。
[0020] 3.確定系統(tǒng)辨識器和逆系統(tǒng)控制器的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
[0021] 神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層的神經(jīng)元數(shù)目是由所需擬合的非線性函數(shù)決定的,而 隱含層的神經(jīng)元數(shù)目是由經(jīng)驗得到的。根據(jù)圖2和圖3所示的基于BP原理的訓(xùn)練方法,可 W確定系統(tǒng)控制器網(wǎng)絡(luò)和系統(tǒng)辨識器網(wǎng)絡(luò)的輸入層神經(jīng)元和輸出層神經(jīng)元數(shù)目都為9個 和3個。根據(jù)確定隱含層的經(jīng)驗公式:^ = ^*^ + 〇,其中,111表示隱含層神經(jīng)元數(shù)目,11 表示輸入層神經(jīng)元數(shù)目,1表示輸出層神經(jīng)元數(shù)目,a為1-10之間的常數(shù)。因此,可W把隱 含層神經(jīng)元的數(shù)目確定為10個。在本方案中,可W確定系統(tǒng)控制器和系統(tǒng)辨識器采用相同 結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò);神經(jīng)網(wǎng)絡(luò)各層神經(jīng)元數(shù)采用9X10X3的結(jié)構(gòu)且隱含層激活函數(shù)采用S型對數(shù)函數(shù),即/W=>(其中,X表示隱含層中各神經(jīng)元的輸入,f(x)表示隱含層 中各神經(jīng)元的輸出)。
[0022] 4.系統(tǒng)辨識器和逆系統(tǒng)控制器訓(xùn)練
[002引根據(jù)已確定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用處理后的樣本集對系統(tǒng)辨識器和逆系統(tǒng)控制器 進行訓(xùn)練,訓(xùn)練方法如圖2、圖3所示。系統(tǒng)辨識器是利用樣本集中白噪聲信號作為輸入信 號,對應(yīng)對象輸出信號作為系統(tǒng)辨識器的訓(xùn)練目標(biāo)信號進行訓(xùn)練。逆系統(tǒng)控制器是利用樣 本集中對象輸出信號作為輸入信號,對應(yīng)的白噪聲信號作為系統(tǒng)控制器的訓(xùn)練目標(biāo)信號 進行訓(xùn)練。
[0024] 5.自適應(yīng)算法設(shè)計
[0025] 根據(jù)BP算法原理,設(shè)計系統(tǒng)辨識器和逆系統(tǒng)控制器的自適應(yīng)算法。自適應(yīng)算法的 具體設(shè)計過程在下文給出。
[0026] 6.在線調(diào)整
[0027] 當(dāng)對象實際輸出與目標(biāo)輸出有誤差時,將該誤差作為反饋信號,利用自適應(yīng)算法 對系統(tǒng)辨識器和逆系統(tǒng)控制器的網(wǎng)絡(luò)權(quán)值做反饋調(diào)整。
[002引其中,控制系統(tǒng)的自適應(yīng)算法設(shè)計是本發(fā)明中的核屯、內(nèi)容。W下給出基于BP原理 自適應(yīng)算法設(shè)計過程。為了方便后續(xù)工作的闡述,給出W下定義和說明:
[0029] 系統(tǒng)辨識器和逆系統(tǒng)控制器的網(wǎng)絡(luò)結(jié)構(gòu)都為MXPXT,即輸入層神經(jīng)元數(shù)目為M 個,隱含層神經(jīng)元數(shù)目為P個,輸出層神經(jīng)元數(shù)目為T個。
[0030] 對于逆系統(tǒng)控制器,V= (Vpm)pxM,W= (Wtp)TxP分別表示輸入層與隱含層之間、隱含 層與輸出層之間的連接權(quán)值矩陣(Vpm和Wtp分別表式輸入層第m個神經(jīng)元到隱含層第P個 神經(jīng)元的連接權(quán)值和隱含層第P個神經(jīng)元到輸出層第t個神經(jīng)元的連接權(quán)值)。并且,為方 便敘述,定義Vp: = (Vpi,Vp2,…,VpM),P= 1,2,…P;Wt: = (Wti,V口,…,Vtp),t= 1,2,…T, 分別表示第一層權(quán)值矩陣中與隱含層第P個神經(jīng)元相關(guān)聯(lián)的的權(quán)值向量和第二層權(quán)值矩 陣中與輸出層第t個神經(jīng)元相關(guān)聯(lián)的的權(quán)值向量。
[0031] 與上述逆控制器對應(yīng),在系統(tǒng)辨識器中,Q=(Qpm)pxM,U=扣tp)TXP分別表示輸入 層與隱含層之間、隱含層與輸出層之間的連接權(quán)值矩陣(Qpm和Utp分別表式輸入層第m個 神經(jīng)元到隱含層第P個神經(jīng)元的連接權(quán)值和隱含層第P個神經(jīng)元到輸出層第t個神經(jīng)元的 連接權(quán)值)。用HI=化Ip)pxi,冊二化〇p)p>a分別表示系統(tǒng)控制器中隱含層的輸入、輸出向 量化Ip和冊P分別表示隱含層中第P個神經(jīng)元的輸入、輸出),XI,而分別表示系統(tǒng)辨識器 和逆系統(tǒng)控制器的輸入向量。
[003引ya=(4d,白d,ih),y= (4,日,110,少二從例分別為系統(tǒng)目標(biāo)輸出,系統(tǒng)對 象實際