本發(fā)明屬于智能客車,尤其涉及一種智能客車跟蹤預(yù)定軌跡的控制方法。
背景技術(shù):
1、智能客車能夠提高交通安全和運輸效率,同時智能客車的發(fā)展推動了人工智能、傳感器、通信技術(shù)等相關(guān)領(lǐng)域的技術(shù)創(chuàng)新。路徑跟蹤控制作為實現(xiàn)智能客車的關(guān)鍵性技術(shù)之一,如何提高智能客車的復(fù)雜路況適應(yīng)性是當(dāng)前的研究熱點之一。
2、傳統(tǒng)的智能客車跟蹤預(yù)定軌跡的控制方法如純追蹤、stanley和pid等,雖然能夠?qū)崿F(xiàn)跟蹤預(yù)定軌跡的功能,但是在速度較高和復(fù)雜路徑情況下,跟蹤精度較低。一些學(xué)者基于客車的數(shù)學(xué)模型提出了滑??刂坪湍P皖A(yù)測等優(yōu)化控制方法,雖然提高了跟蹤精度,但是對模型的精確性要求比較高,而且計算復(fù)雜性度高,尤其是復(fù)雜路況下需要重新調(diào)整控制參數(shù)。
3、為了提高智能客車對于復(fù)雜路況的適應(yīng)性,一些學(xué)者結(jié)合傳統(tǒng)控制理論與先進的人工智能技術(shù)提出了智能路徑跟蹤控制方法,例如神經(jīng)網(wǎng)絡(luò)和模糊控制等方法?;谏窠?jīng)網(wǎng)絡(luò)的控制方法訓(xùn)練時間長而且需要大量的訓(xùn)練數(shù)據(jù),最終訓(xùn)練出的網(wǎng)絡(luò)模型受數(shù)據(jù)影響大,解釋性較差?;谀:壿嫷目刂品椒ㄒ蕾噷<医?jīng)驗設(shè)計模糊規(guī)則,難以自適應(yīng)地進行調(diào)整。
技術(shù)實現(xiàn)思路
1、為解決上述背景技術(shù)中提出的至少一個問題本發(fā)明提供了一種智能客車跟蹤預(yù)定軌跡的控制方法,以期在不需要反復(fù)調(diào)教控制參數(shù)的情況下,實現(xiàn)在不同的形狀軌跡及速度下獲得較高的控制精度,從而提高智能客車在復(fù)雜路況下的自主優(yōu)化能力和適應(yīng)性。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種智能客車跟蹤預(yù)定軌跡的控制方法,包括如下步驟:
3、s1:以智能客車安裝的gps傳感器主天線處為坐標原點,建立局部坐標系;以大地質(zhì)心為原點,建立大地全局坐標系;
4、s2:駕駛智能客車行駛一段軌跡后,記錄n行經(jīng)度、緯度、航向角和速度信息作為跟蹤的預(yù)定軌跡;
5、s3:對采集的智能客車狀態(tài)樣本基于近似線性相關(guān)分析方法得到核詞典;
6、s4:確定當(dāng)前時刻下智能客車的位姿信息和預(yù)瞄點處的位姿信息,并且計算從而建立局部坐標系下的軌跡跟蹤誤差狀態(tài)方程,i為正整數(shù);
7、s5:計算當(dāng)前時刻下的道路曲率;
8、s6:建立智能客車路徑跟蹤控制問題的mdp模型;
9、s7:基于mkdhp算法設(shè)計跟蹤預(yù)定軌跡的控制器,控制器包括執(zhí)行器模塊和評價器模塊,其中執(zhí)行器模塊輸出當(dāng)前時刻下的控制動作,評價器模塊包括第一評價器模塊、第二評價器模塊;分別輸出當(dāng)前時刻下和下一時刻下狀態(tài)值函數(shù)對狀態(tài)的導(dǎo)數(shù)和;
10、s8:建立mkdhp算法中執(zhí)行器模塊和評價器模塊的在線更新規(guī)則;
11、s9:判斷當(dāng)前時刻下距離智能客車最近的預(yù)定軌跡中的目標點是否為終點,若是,智能客車停止行駛;否則,將i+1賦值給i,并返回s4順序執(zhí)行。
12、s3中核詞典的構(gòu)建方法如下,
13、步驟3.1、選擇式(1)作為核函數(shù):
14、??(1);
15、式(1)中,和為樣本中的狀態(tài)向量,為高斯核函數(shù)的核寬度,和為多項式核函數(shù)的參數(shù);
16、步驟3.2、對智能客車狀態(tài)樣本集基于近似線性相關(guān)分析方法已獲得個特征向量,為已獲得的核詞典,判斷是否將新特征向量加入到核詞典中,首先利用式(2)和式(3)計算:
17、;
18、式(2)中,為核詞典中的元素,則為:
19、;
20、然后將計算的與預(yù)定義閾值進行比較來更新核詞典,若,將添加到核詞典中,即;否則核詞典沒有變化。
21、s4中局部坐標系下的軌跡跟蹤誤差狀態(tài)方程構(gòu)建方法如下,
22、步驟4.1、定義當(dāng)前時刻下智能客車后軸中心在全局坐標系中的位置坐標為,速度為,航向角為,記為;
23、步驟4.2、設(shè)定為預(yù)瞄距離,在預(yù)定軌跡中搜索大于預(yù)瞄距離l且距離智能客車最近的目標點,則該目標點定義為預(yù)瞄點,記為;
24、步驟4.3、定義智能客車在當(dāng)前時刻下相對于預(yù)瞄點的誤差狀態(tài)方程為:
25、;
26、式(4)中,分別為當(dāng)前時刻下縱向偏差、橫向偏差和航向角偏差;
27、步驟4.4、根據(jù)式(5)得到局部坐標系中智能客車與預(yù)瞄距離處的預(yù)瞄點的橫向偏差與航向角偏差的變化率為:
28、;
29、式(5)中,和分別為在當(dāng)前時刻下智能客車后軸中心點的縱向和側(cè)向速度,為智能客車軸距,為當(dāng)前時刻智能客車的前輪轉(zhuǎn)角,為預(yù)瞄點處的道路曲率。
30、s5中道路曲率的計算方法如下,
31、步驟5.1、在當(dāng)前時刻下從預(yù)定軌跡中選擇距離智能客車最近的目標點,使用式(6)計算到預(yù)瞄點的距離,若,則使用二次多項式擬合至之間的軌跡;否則在預(yù)定軌跡中搜索大于距離且距離智能客車最近的目標點,使用二次多項式擬合至之間的軌跡;
32、;
33、式(6)中為所擬合軌跡的目標點個數(shù);
34、步驟5.2、使用的二次多項式對上述軌跡進行擬和,擬合的二次多項式方程如式(7)所示:
35、;
36、式(7)中為常數(shù)項系數(shù),為一次項系數(shù),為二次項系數(shù);
37、則道路曲率。
38、s6中mdp模型的建立方法如下,
39、步驟6.1、定義智能客車在當(dāng)前時刻下的狀態(tài)向量為,定義智能客車在當(dāng)前時刻下的控制動作為智能客車期望行駛曲率的補償量;
40、步驟6.2、利用式(8)計算當(dāng)前時刻下狀態(tài)向量的回報:
41、?;
42、式(8)中,其中為與狀態(tài)維數(shù)相關(guān)的半正定對角矩陣,為一正常數(shù);
43、步驟6.3、定義當(dāng)前時刻下狀態(tài)值函數(shù)值,計算式如下:
44、?;
45、式(9)中,為當(dāng)前時刻下的智能客車狀態(tài)向量,為當(dāng)前時刻下控制動作,為當(dāng)前時刻下的立即回報值,為折扣因子,為下一時刻下的目標函數(shù)值,為下一時刻下的智能客車狀態(tài)向量,由式(10)計算:
46、;
47、式(10)中,為控制周期,;
48、步驟6.4、利用式(11)計算當(dāng)前時刻下最優(yōu)的控制動作:
49、???(11)?。
50、s7中跟蹤預(yù)定軌跡的控制器設(shè)計方法如下,
51、利用式(12)計算mkdhp算法中執(zhí)行器輸出并作為智能客車當(dāng)前時刻下的控制動作:
52、;
53、式(12)中,為最大側(cè)向加速度,;分別為輸入層到隱含層的第一權(quán)值和偏置,;分別為隱含層到輸出層的第二權(quán)值和偏置,;
54、利用式(13)計算mkdhp算法中評價器輸出并作為智能客車當(dāng)前時刻下的目標:
55、;
56、式(13)中,為當(dāng)前時刻下評價器權(quán)值矩陣,為核詞典中樣本構(gòu)成的基函數(shù),,為核詞典中樣本個數(shù)。
57、s8中執(zhí)行器模塊和評價器模塊的在線更新規(guī)則如下,
58、步驟8.1、執(zhí)行器模塊的在線更新規(guī)則:
59、將極小化利用式(14)建立的誤差函數(shù)作為執(zhí)行器模塊的學(xué)習(xí)目標:
60、;
61、利用式(15)-式(18)更新當(dāng)前時刻下執(zhí)行器模塊的權(quán)值和偏置,從而獲得下一時刻下的權(quán)值和偏置:
62、;
63、;
64、;
65、;
66、式(15)-式(18)中為評價器模塊的學(xué)習(xí)步長,;
67、步驟8.2、評價器模塊的在線更新規(guī)則:
68、利用式(19)定義誤差函數(shù)為:
69、?;
70、式(19)中表示為向量中第個元素,表示為向量中第個元素,可由式(20)得到:
71、;
72、對于狀態(tài),假設(shè)為其維數(shù),則,利用式(21)定義中間變量:
73、;
74、式(21)中為對角矩陣中第個對角元素值,表示狀態(tài)中第個元素,表示權(quán)值矩陣中第行權(quán)值向量,則利用式(22)得到誤差函數(shù)的第行向量為:
75、???(22);
76、定義中間變量,利用式(23)-式(25)更新當(dāng)前時刻下評價器模塊的權(quán)值,從而獲得下一時刻下的權(quán)值:
77、;
78、????????(24);
79、;
80、式(23)-式(25)中,為評價器模塊的學(xué)習(xí)步長,為遺忘因子,。
81、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:1、本發(fā)明首先建立了智能客車跟蹤預(yù)定軌跡控制問題的mdp模型,選取了橫向偏差、航向角偏差、道路曲率和當(dāng)前車速v作為狀態(tài)向量,綜合誤差性能指標、安全性和穩(wěn)定性設(shè)計了回報函數(shù),然后提出了一種基于mkdhp算法的跟蹤預(yù)定軌跡的控制方法,其中執(zhí)行器采用三層前饋神經(jīng)網(wǎng)絡(luò)構(gòu)建,評價器采用了基于稀疏核方法獲得的基函數(shù)進行構(gòu)建,并推導(dǎo)了執(zhí)行器和評價器的權(quán)值更新規(guī)則,解決了智能客車傳統(tǒng)控制方法在復(fù)雜路況下需要反復(fù)調(diào)教控制參數(shù)缺乏適應(yīng)性的問題,實現(xiàn)了在不同的形狀軌跡及速度下獲得較高的控制精度,提高了智能客車在復(fù)雜路況下的自主優(yōu)化能力和適應(yīng)性;
82、2、本發(fā)明采用了高斯核函數(shù)和多項式核函數(shù)結(jié)合的混合核函數(shù)構(gòu)建基函數(shù),解決了傳統(tǒng)近似動態(tài)規(guī)劃算法特征選擇困難和學(xué)習(xí)效率低的問題,提高了基于mkdhp算法的路徑跟蹤控制器的泛化能力和實時優(yōu)化能力;
83、3、本發(fā)明在跟蹤預(yù)定軌跡過程中僅需要目標點相對智能客車的坐標,因此不局限gps一種傳感器,可以使用其他定位手段如光學(xué)、雷達等傳感器獲取目標點相對智能客車的坐標,因此本發(fā)明方法具有較好通用性和普適性,適用于不同定位手段的智能客車;
84、4、本發(fā)明智能客車跟蹤預(yù)定軌跡的控制方法,綜合考慮了誤差性能指標、安全性和穩(wěn)定性,能夠?qū)崿F(xiàn)智能客車較高精度跟蹤預(yù)定軌跡的同時,提高行駛的安全性和乘員的舒適性;
85、5、由于本發(fā)明采用三層前饋神經(jīng)網(wǎng)絡(luò)構(gòu)建mkdhp算法中的執(zhí)行器,且基于ald分析方法獲得的基函數(shù)構(gòu)建評價器,從而構(gòu)建基于mkdhp算法的路徑跟蹤控制器框架,不僅可靠性和魯棒性較高,而且實現(xiàn)簡單。