本技術涉及控制理論,尤其涉及非線性電機伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法及裝置。
背景技術:
1、軌跡跟蹤控制旨在設計控制策略,使受控系統(tǒng)能夠跟蹤預定義的軌跡。傳統(tǒng)的控制方法,如pid控制器等,依賴于對系統(tǒng)的精確建模和參數(shù)設定。然而,實際系統(tǒng)通常具有復雜的動態(tài)特性,例如非線性等,這使得傳統(tǒng)方法往往難以達到理想的跟蹤性能。最優(yōu)跟蹤控制作為現(xiàn)代控制理論的一個重要分支,通過在給定約束條件下最小化指定的代價函數(shù)來實現(xiàn)對系統(tǒng)軌跡的跟蹤。代價函數(shù)通常包括跟蹤誤差和控制輸入,控制策略的生成不僅要保證跟蹤誤差最小化,還要兼顧控制輸入的合理性,避免過度的資源消耗,在控制領域具有重要意義。
2、求解最優(yōu)跟蹤控制問題的方法主要有變分法和動態(tài)規(guī)劃法,然而,由于實際中的電機系統(tǒng)非線性強、精確模型難以準確獲得,這兩種方法的求解往往極其困難。
技術實現(xiàn)思路
1、本技術旨在至少在一定程度上解決相關技術中的技術問題之一。
2、為此,本技術的第一個目的在于提出一種非線性電機伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法,不依賴于系統(tǒng)的精確模型,能夠處理任意非線性系統(tǒng)狀態(tài)受不等式約束的最優(yōu)跟蹤控制問題。
3、本技術的第二個目的在于提出一種非線性電機伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制裝置。
4、為達上述目的,本技術第一方面實施例提出了一種非線性電機伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法,包括:
5、建立電機系統(tǒng)跟蹤控制的誤差動態(tài)模型,引入新的狀態(tài)變量將誤差動態(tài)模型轉化為增廣系統(tǒng)模型,并確定狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式;
6、基于增廣系統(tǒng)模型,利用函數(shù)近似方法建立未知動態(tài)系統(tǒng)的辨識模型;
7、通過并行學習方法,利用在線數(shù)據(jù)和歷史數(shù)據(jù)預估辨識模型中的未知參數(shù);
8、基于辨識模型,通過迭代算法更新控制輸入,對狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題進行求解,得到最優(yōu)跟蹤控制策略。
9、本技術實施例的非線性電機伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制方法,通過建立電機系統(tǒng)跟蹤控制的誤差動態(tài)模型,并引入新的狀態(tài)變量將時變誤差系統(tǒng)轉化為非時變增廣系統(tǒng),進一步得到狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式;基于增廣系統(tǒng)模型,利用函數(shù)近似方法強大的非線性映射能力來建立未知動態(tài)系統(tǒng)的參數(shù)辨識模型;通過并行學習方法,同時利用在線數(shù)據(jù)和已有的歷史數(shù)據(jù)來估計辨識模型中的未知參數(shù);基于辨識模型,通過迭代算法來更新控制輸入,得到不等式約束下的最優(yōu)跟蹤控制策略。本技術不依賴電機系統(tǒng)精確模型,實現(xiàn)了在保證電機系統(tǒng)狀態(tài)滿足已有的約束的同時,最小化有限時域內的跟蹤誤差和控制能耗,符合工程實際需求;本技術所考慮系統(tǒng)為非線性系統(tǒng),具有現(xiàn)實意義。
10、可選地,在本技術的一個實施例中,建立電機系統(tǒng)跟蹤控制的誤差動態(tài)模型,包括:
11、定義電機非線性系統(tǒng)為:
12、
13、其中,是系統(tǒng)狀態(tài),為系統(tǒng)初始時刻,為系統(tǒng)初始狀態(tài),是系統(tǒng)控制輸入,為u輸入系統(tǒng)后的系統(tǒng)狀態(tài),為系統(tǒng)的動態(tài)函數(shù),
14、定義電機非線性系統(tǒng)狀態(tài)約束為:
15、
16、其中,為維列向量函數(shù),代表存在個不等式約束;
17、定義系統(tǒng)跟蹤信號為,跟蹤誤差為,對于最優(yōu)跟蹤控制問題,采用二次型性能指標表示代價函數(shù),代價函數(shù)表示為:
18、
19、其中,代表一段預先確定的時間間隔,,為實對稱正定矩陣,
20、誤差動態(tài)模型的動態(tài)函數(shù)以及不等式約束表示為:
21、
22、引入新的狀態(tài)變量將誤差動態(tài)模型轉化為增廣系統(tǒng)模型,包括:
23、假設跟蹤信號由未知動態(tài)函數(shù)生成,未知動態(tài)函數(shù)表示為:
24、
25、定義新的狀態(tài)變量,增廣系統(tǒng)表示為:
26、
27、新的狀態(tài)變量所滿足的不等式約束為:
28、
29、代價函數(shù)表示為:
30、
31、其中,矩陣定義為:
32、
33、確定狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式,包括:
34、對于不等式約束,構造kelley-bryson罰函數(shù)作為代價函數(shù),并將最優(yōu)跟蹤控制問題的求解轉化無約束問題的求解,構造的代價函數(shù)表示為:
35、
36、其中,為一個單調遞增的序列,且滿足,罰函數(shù)中項為階躍函數(shù),公式化為:
37、
38、當增廣系統(tǒng)狀態(tài)滿足所給定的不等式約束時,,無約束問題的解滿足的條件為:
39、
40、最優(yōu)性條件的簡化形式為:
41、
42、其中,為協(xié)態(tài)量,為哈密頓函數(shù),,。
43、可選地,在本技術的一個實施例中,基于增廣系統(tǒng)模型,利用函數(shù)近似方法建立未知動態(tài)系統(tǒng)的辨識模型,包括:
44、令代表增廣系統(tǒng)未知動態(tài)函數(shù)的第項,利用函數(shù)近似方法將其近似為:
45、
46、其中,為權重系數(shù),為隱藏層個神經(jīng)元的激活函數(shù),為對應的近似誤差;
47、定義權重系數(shù)的估計值為,令矩陣,,令激活函數(shù)向量為,未知動態(tài)系統(tǒng)的參數(shù)辨識模型表示為:。
48、可選地,在本技術的一個實施例中,通過并行學習方法,利用在線數(shù)據(jù)和歷史數(shù)據(jù)預估辨識模型中的未知參數(shù),包括:
49、采集在任意時刻下增廣系統(tǒng)的歷史數(shù)據(jù)點,歷史數(shù)據(jù)點為,歷史數(shù)據(jù)點包括增廣系統(tǒng)的狀態(tài)、控制輸入以及狀態(tài)的導數(shù),定義矩陣,所采集的歷史數(shù)據(jù)集合滿足;
50、利用歷史數(shù)據(jù)集合以及在線數(shù)據(jù)更新辨識模型中的未知參數(shù),更新時的自適應更新律表示為:
51、
52、其中,和分別代表第次迭代過程中增廣系統(tǒng)狀態(tài)值和系數(shù)矩陣的估計值,、為學習率,和分別是第次迭代過程中增廣系統(tǒng)狀態(tài)和系數(shù)矩陣的估計誤差。
53、可選地,在本技術的一個實施例中,最優(yōu)跟蹤控制策略的生成過程包括:
54、步驟s1:初始化系數(shù)、、,設定精度誤差、、,選取初始控制輸入以及初始系數(shù)矩陣估計值,測量在初始控制輸入下的原系統(tǒng)狀態(tài),計算對應的增廣系統(tǒng)的軌線以及代價函數(shù),令,,其中,;
55、步驟s2:通過求解第一方程組更新控制輸入,其中,第一方程組表示為:
56、
57、其中,,代表系數(shù)矩陣的前n列;
58、步驟s3:通過求解第二方程組更新系數(shù)矩陣,其中,第二方程組表示為:
59、
60、步驟s4:通過更新后的控制輸入計算增廣系統(tǒng)的軌線以及對應的代價函數(shù);
61、步驟s5:重復進行步驟s2-s4,在每次重復后,令,,、為迭代步長,直至,
62、步驟s6:重復進行步驟s2-s5,在每次重復后,令,,,直至控制輸入以及辨識模型收斂于給定的精度誤差,其中,控制輸入收斂于給定的精度誤差,表示為:,辨識模型收斂于給定的精度誤差,表示為:;
63、步驟s7:重復步驟s2-s6,在每次重復后,令,,,,,為迭代步長,直至增廣系統(tǒng)的狀態(tài)在給定的精度誤差下滿足不等式約束,得到辨識模型參數(shù)以及最優(yōu)跟蹤控制策略,其中,增廣系統(tǒng)的狀態(tài)在給定的精度誤差下滿足不等式約束,表示為:。
64、為達上述目的,本技術第二方面實施例提出了一種非線性電機伺服系統(tǒng)的最優(yōu)軌跡跟蹤控制裝置,包括:
65、系統(tǒng)建立模塊,用于建立電機系統(tǒng)跟蹤控制的誤差動態(tài)模型,引入新的狀態(tài)變量將誤差動態(tài)模型轉化為增廣系統(tǒng)模型,并確定狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題的描述形式;
66、系統(tǒng)建立模塊,還用于基于增廣系統(tǒng)模型,利用函數(shù)近似方法建立未知動態(tài)系統(tǒng)的辨識模型;
67、系統(tǒng)辨識模塊,用于通過并行學習方法,利用在線數(shù)據(jù)和歷史數(shù)據(jù)預估辨識模型中的未知參數(shù);
68、計算求解模塊,用于基于辨識模型,通過迭代算法更新控制輸入,對狀態(tài)不等式約束下的最優(yōu)跟蹤控制問題進行求解,得到最優(yōu)跟蹤控制策略。
69、本技術附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術的實踐了解到。