本發(fā)明涉及人工智能、機器視覺等技術(shù)概念,特別是機器人在感知周圍的環(huán)境或物體后,所獲取的視覺信息是怎么表示及存儲、被檢索的,本發(fā)明可以應(yīng)用于家庭或工業(yè)機器人、機械手分揀夾持等領(lǐng)域。
背景技術(shù):
隨著近些年工業(yè)機器人的發(fā)展,帶動了服務(wù)機器人行業(yè)的逐漸掘起,同時從2014年開始的智能硬件領(lǐng)域也開始突起,根據(jù)國際機器人聯(lián)盟的統(tǒng)計,2015年服務(wù)機器人銷售額將達85億美元,并且保持較高的20%~30%增長率,在智能硬件領(lǐng)域,據(jù)艾瑞研究,2014年全球智能硬件裝機量達到60億臺,預(yù)計2017年將超過140億臺。
在市場高速發(fā)展的背后,問題同樣明顯,一方面市場的潛力還遠未挖掘出來,另一方面,機器人及智能硬件進入服務(wù)行業(yè)也存在著一些技術(shù)難點。
物體的視覺識別方面,雖是一大難點,但也有些技術(shù)性嘗試往這方面攻關(guān),例如專利《一種基于三維柵格地圖的物體整體識別方法》與《一種基于顏色特征的物體輔助識別方法》中,提到一類方法“如何從形狀的角度”、“顏色”、“材質(zhì)”等方面來對物體進行識別。這里我們要解決的是:視覺感知之后,所獲取的信息是如何表示、存儲與檢索的。
發(fā)明目的
本發(fā)明的主要目的就是解決視覺感知信息的表示、存儲與檢索。
技術(shù)方案
本發(fā)明的目的是這樣實現(xiàn)的:通過相關(guān)設(shè)備及算法,例如激光雷達、ccd、cmos、點云配準(zhǔn)算法、點云降噪算法等,獲取實際環(huán)境或物體的點云信息,后續(xù)處理步驟如下:
(1)通過環(huán)境或物體的點云數(shù)據(jù),計算出環(huán)境或物體相應(yīng)的全局與局部性特征張量及特征譜值。
(2)結(jié)合其他相關(guān)信息,組織成結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),我們可以選取xml格式來承載這樣的數(shù)據(jù)格式;
(3)存儲環(huán)境或物體的結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù);
(4)編輯或?qū)徍嘶驒z索環(huán)境與物體。
本發(fā)明所使用的系統(tǒng)組成如下:采集系統(tǒng)、視覺感知系統(tǒng)、存儲系統(tǒng)、審編系統(tǒng)、檢索系統(tǒng)。這五個系統(tǒng)是按照功能設(shè)置的軟件系統(tǒng),各子系統(tǒng)具體功能如下:
*采集系統(tǒng):通過相關(guān)設(shè)備傳感器采集環(huán)境或物體點云信息,可以實時或離線輸出點云數(shù)據(jù),
*視覺感知系統(tǒng):接收點云數(shù)據(jù)并計算全局與局部性特征張量及特征譜值,輸出結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),
*存儲系統(tǒng):存儲結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),
*編審系統(tǒng):后臺人員或機器可以對環(huán)境或物體的數(shù)據(jù)進行編輯、審核及更新存儲,
*檢索系統(tǒng):人或機器可以對存儲的環(huán)境或物體進行檢索。
附圖說明:
圖1是本發(fā)明方法所用系統(tǒng)組成圖
圖2是實際物體“門”
圖3是門的特征張量
圖4是門的特征譜
圖5是門的數(shù)字化表示形式
圖6是檢索頁面
具體實施方式
下面結(jié)合附圖,說明本發(fā)明的實施方式。
本發(fā)明方法所用的系統(tǒng)整體結(jié)構(gòu)可參考附圖1,它有五個子系統(tǒng)組成,具體包含如下步驟:
第一步
在采集系統(tǒng)中,通過相關(guān)設(shè)備傳感器采集周圍環(huán)境或物體的信息,通過降噪、濾波等方法優(yōu)化數(shù)據(jù),對外輸出環(huán)境或物體的點云數(shù)據(jù),可以實時或離線輸出。
第二步
在視覺感知系統(tǒng)中,接收采集系統(tǒng)傳遞過來的點云數(shù)據(jù),做視覺感知計算,獲取環(huán)境或物體的全局性與局部性特征張量及特征譜值,這里不局限于某一個視覺感知算法,這里我們可以使用專利《一種基于三維柵格地圖的環(huán)境特征表示與識別的方法》中所述的算法來加以計算處理點云數(shù)據(jù),如圖2所示,實際當(dāng)中的一扇門,其對應(yīng)的局部性特征張量如圖3所示,圖4是其特征譜。
第三步
根據(jù)視覺感知系統(tǒng)中輸出的特征張量與特征譜,連帶其他信息如位置、分辨率、描述信息等,組織成xml形式,如圖5所示,每一個xml信息我們稱之為doc(文檔),需要說明的是,每一個doc都有全局唯一的id與其對應(yīng),方便后續(xù)對其doc的增刪改查操作,標(biāo)簽tag為“tensor”的內(nèi)容是存儲圖3所示的特征張量信息,標(biāo)簽tag為“spectrum”的內(nèi)容是存儲圖4所示的特征譜信息,這些標(biāo)簽tag可以是但不限于圖5所示的那么多。
第四步
根據(jù)上一步輸出的信息組織形式,將其存儲起來,可以單機存儲,也可以分布式機群存儲,可以用數(shù)據(jù)庫、文件系統(tǒng)或其他形式,這里僅為說明清楚原理及簡單起見,以單機的形式并且全文索引存儲到搜索引擎solr里。
第五步
編審人員或相關(guān)用戶都可以在后臺根據(jù)關(guān)鍵詞或點云數(shù)據(jù)查找doc,如圖6所示的檢索頁面,可以由點云信息檢索——圖6中的“按圖索驥”就是根據(jù)點云信息檢索,也可以由關(guān)鍵詞檢索——圖6中輸入框中的“墻壁”就是關(guān)鍵詞,必要的情況下可以手動更新相關(guān)doc信息并存儲。
第六步
檢索的操作可以由系統(tǒng)運營人員或相關(guān)用戶來執(zhí)行,也可由機器直接執(zhí)行,例如機器在室內(nèi)外執(zhí)行任務(wù)時,用到系統(tǒng)存儲的視覺感知數(shù)據(jù),另外,機器采集到的當(dāng)前環(huán)境或物體信息與系統(tǒng)存儲的不一致時,機器可以直接更新系統(tǒng)存儲。
綜上,我們可以看到,通過本發(fā)明方法,成功地解決了視覺感知信息的表示、存儲與檢索,可以為相關(guān)人員或機器人提供高精三維地圖服務(wù),為視覺感知應(yīng)用的新方向開拓打下堅實基礎(chǔ)。