基于ihdr自主學習框架的輪式移動機器人導航方法
【技術領域】
[0001] 本發(fā)明屬于輪式移動機器人的導航技術領域,涉及一種基于kinect的圖像信息 獲取,并通過人為訓練使得機器人具有自主導航的方法。
【背景技術】
[0002] 隨著傳感器技術的發(fā)展,機器人上攜帶的傳感器越來越豐富。例如,通過sick激 光測距儀測得機器人距離前方障礙物有多遠;通過kinect傳感器獲取圖像信息,并利用 SLAM (Simultaneous Localization and Mapping,實時同步定位與地圖構建)算法進行三 維構圖;通過數(shù)字羅盤得知機器人所在相對坐標,轉過的方位角等。這些傳感器技術的發(fā)展 使得機器人越來越智能,可實現(xiàn)的功能越來越多。但機器人的導航依然是重點和難點問題 之一,因為它是機器人完成避障、未知環(huán)境探測等任務的先決條件。
[0003] 傳統(tǒng)的機器人導航方法有遺傳算法、人工勢場法、基于橢圓約束的機器人導航等 算法對機器人進行局部或者全局的路徑規(guī)劃。這種基于數(shù)學模型的導航方法要求機器人在 新環(huán)境中重新規(guī)劃,體現(xiàn)在:①無法適應復雜、多變和未知的環(huán)境;②任務是特定的,僅僅 針對某一任務有很好性能,而不會發(fā)展出新的能力;因此適應能力差。
【發(fā)明內容】
[0004] 為了實現(xiàn)機器人的自主導航問題,本發(fā)明提供一種基于IHDR(增量式分層判別回 歸)自主學習框架的輪式移動機器人導航方法,計算效率高且適應新環(huán)境的能力更優(yōu)越。
[0005] 為解決上述技術問題,本發(fā)明采用如下技術方案:
[0006] 一種基于IHDR自主學習框架的輪式移動機器人導航方法,其特征在于:首先人工 訓練機器人移動,在此過程中機器人通過kinect傳感器和手柄控制量實時采集當前時刻 的圖像信息和速度值;然后利用IHDR算法建立圖像輸入、速度值輸出之間的映射關系,并 將采集到的圖像信息和速度值數(shù)據(jù)以"知識"樹狀結構的形式存放在機器人中;最后在無人 干預的條件下,機器人根據(jù)當前的圖像信息,去檢索知識庫,使機器人自主導航和移動。
[0007] 上述技術方案主要包括如下步驟:
[0008] 步驟1 :初始化:完成串口通信、運動參數(shù)的配置,并將kincet傳感器置于機器人 正上方;
[0009] 步驟2 :樣本訓練:預設一條路徑,用手柄遙控機器人前后左右移動走完這段路 徑,并重復多次該路徑,以增加訓練樣本提高訓練效果;
[0010] 步驟3 :在進行步驟2的操作時,將手柄控制機器人移動的運動控制數(shù)據(jù)和kinect 傳感器采集到的數(shù)據(jù)以相同的采樣頻率保存下來,作為訓練樣本;其中,運動控制數(shù)據(jù)為二 通道信息,包括同一個二維平面內水平方向前進速度和后退速度、垂直方向左轉速度和右 轉速度,kinect傳感器輸出RGB圖片和深度信息;
[0011] 步驟4 :對RGB圖片進行邊緣化處理:對每張圖片進行Canny邊緣化處理,即只提 取邊緣信息,并將圖片所對應的數(shù)字矩陣保存下來;
[0012] 步驟5 :對樣本數(shù)據(jù)進行歸一化處理;
[0013] 步驟6 :利用IHDR算法對步驟5獲取的歸一化數(shù)據(jù)進行處理,建立IHDR樹狀結構, 并將所得到的知識庫存儲下來;
[0014] 步驟7 :在無人干預的條件下,根據(jù)kinect傳感器采集到的圖像信息,提取RGB圖 片邊緣信息后,機器人開始檢索步驟6中生成的IHDR樹狀結構,得出相應的速度量,并反饋 給機器人,使機器人自主移動。
[0015] 上述技術方案中,在機器人自主導航和移動過程中,當前方障礙物或圖像中特定 點與攝像頭之間距離小于設定閾值時,停止直線運動并規(guī)劃橢圓約束條件,沿橢圓邊緣避 開障礙物,然后繼續(xù)按照步驟7的方法運動;該距離由kinect傳感器的3D深度攝像頭獲 取。
[0016] 上述技術方案中,步驟6中建立數(shù)據(jù)IHDR樹狀結構的步驟如下:
[0017] 步驟6. 1 :首先建立映射關系,具體描述如下:
[0018] f:X -Y
[0019] 其中X為輸入空間,表示機器人當前狀態(tài),即圖片的邊緣信息;Y為輸出空間,代 表機器人運動速度;由此訓練樣本被分成X、Y兩組數(shù)據(jù),S = {(Xi, yj |xiG X,y iG Y, i = 1,2,…,n},S表示訓練樣本集合,Xi為輸入空間的向量,y i為輸出空間的向量,n為訓練樣 本的個數(shù);
[0020] 步驟6. 2 :然后利用IHDR算法對X、Y這兩組數(shù)據(jù)進行雙重聚類,生成IHDR樹狀結 構;
[0021] 步驟6. 3 :樹的更新:在步驟6. 2中生成的IHDR樹狀結構,當遇到一個新樣本S = (X,Y)時,先從樹的根節(jié)點開始,逐層在該節(jié)點中搜索與新樣本X最接近的中心;找到后則 以該節(jié)點為根節(jié)點繼續(xù)搜索,直到找到相似的葉子節(jié)點;最后通過遺忘處理更新樣本X、Y, 生成新的節(jié)點,插入到IHDR樹狀結構的末端。
[0022] 上述技術方案中,所述步驟1中的輪式移動機器人配置有上位機、運動控制卡、以 及kincet傳感器;機器人采用的輪式移動機器人具有5個行駛輪,包括兩個左右驅動輪和 3個萬向隨動輪;運動控制卡由DSP和復雜可編程邏輯器件CPLD組成,并通過RS232接口 與上位機或工控板相連;整個運動流程為,上位機發(fā)送運動指令給運動控制卡,通過PWM控 制驅動輪的轉速,實現(xiàn)機器人的前后左右移動。
[0023] 上述技術方案中,所述步驟3中通過設置相同的定時器實現(xiàn)實時和同頻率采集手 柄控制器數(shù)據(jù)和kinect傳感器數(shù)據(jù)。
[0024] 上述技術方案中,步驟3中,優(yōu)選實施例中,運動控制數(shù)據(jù)前進速度為0. 2m/s,后 退速度為2m/s,左轉速度為-5° /s,右轉速度為5° /s。
[0025] 本發(fā)明主要采用微軟推出的kinect傳感器,它的RGB攝像頭能夠幫助機器人獲取 更多的環(huán)境信息,同時kinect的深度傳感器能夠測得機器人所在場景的3維特征信息。與 激光測距儀這種掃描測距的方式相比,激光測距儀受大氣光傳輸效應的影響大,敏感信息 低;與微慣性測量單元(MMU)相比,這種通過航位遞推解算的方法,會使得誤差不斷地積 累。因此,相比之下,這種基于kinect視覺傳感器捕獲周圍信息的方法能夠更好幫助機器 人實現(xiàn)自主導航。
[0026] 相對于目前已有的自學習導航方法,本發(fā)明旨在實現(xiàn)機器人的認知能力,即通過 IHDR算法構建自主學習框架。這種自主學習框架是通過人為指導或者訓練機器人構建的, 機器人將采集到的大量數(shù)據(jù)以"知識"有效地存儲起來。在無人干預的情況下,機器人能 自主檢索知識庫,實現(xiàn)自主導航。本發(fā)明沒有使用傳統(tǒng)的控制方法,避免的控制模型的構 建,而是模仿人類學習的過程,使得機器人的智能化程度更高。主要優(yōu)勢主要體現(xiàn)在以下方 面:
[0027] 1)使機器人模擬了人類的學習過程,將學習到的"知識"存儲下來,而非通過傳統(tǒng) 的傳感器采集數(shù)據(jù),建立閉環(huán)反饋模型,控制機器人移動。
[0028] 2)這種學習是一種增量式的學習過程,學習的越多,存儲的知識就越多,自主運動 的效果就越好。
[0029] 3)相比其他的生成樹算法如k-D樹方法,IHDR算法在檢索方面的效率和成功率都 有很大的提尚。
【附圖說明】
[0030] 圖1為輪式移動機器人系統(tǒng)結構框圖。
[0031] 圖2為本發(fā)明基于IHDR自主學習框架的輪式移動機器人導航方法的流程圖。
[0032] 圖3為IHDR樹型數(shù)據(jù)結構圖。
[0033] 圖4為機器人檢索IHDR樹誤差圖。
[0034] 圖5為機器人檢索得到的速度值和訓練過程中的速度值的對比圖。
【具體實施方式】
[0035] 移動機器人通過人工訓練機器人的"走路"行為,儲存相應的學習機制,再在同樣 的環(huán)境中自主運動,不需要人為控制。下面結合附圖1-5對本發(fā)明加以詳細說明:
[0036] 本發(fā)明通過手柄控制器與上位機進行通訊從而通過運動控制卡控制機器人前后 左右移動,并通過kincet傳感器采集機器人"看"到的一些圖像信息和深度信息,然后采用 IHDR算法建立IHDR樹狀結構的自主學習框架,將學習到的"知識"存儲知識庫,最后在無人 工干預的情況下,讓機器人實時檢索IHDR樹狀結構得出相應的運動數(shù)據(jù)并反饋給機器人, 實現(xiàn)機器人的自主運動;包括如下主要步驟:
[0037] 步驟1 :編寫上位機程序,完成串口通信、運動參數(shù)的配置,并將kincet傳感器置 于機器人正上方;
[0038] 步驟2 :樣本訓練過程:預設一條路徑,用手柄遙控機器人前后左右移動指導機器 人完成這段路徑,并重復多次,以增加訓練樣本;
[0039] 步驟3 :在進行步驟2的操作時,將手柄控制機器人移動的運動控制數(shù)據(jù)和kinect 傳感器采集到的圖像以相同的采樣頻率保存下來,作為訓練樣本,采樣頻率為10Hz;其 中,運動控制信息二通道量,包含同一個二維平面中水平方向的速度和垂直方向的速度; kinect傳感器采集RGB圖像,圖像分辨率為480X640 (ppi);
[0040] 步驟4 :對RGB圖像進行邊緣化處理:考慮到每一張RGB圖片所包含的數(shù)據(jù)量太大 (480X640X3),需進行降維處理。本發(fā)明對每張圖片進行Canny邊緣化處理,即只提取邊 緣信息,并將圖片所對應的數(shù)字矩陣保存下來:
[0041] 步驟5 :對樣本數(shù)據(jù)進行歸一化處理;
[0042] 步驟6 :利用IHDR算法對步驟5獲取的歸一化