本發(fā)明涉及人工智能、機(jī)器視覺、模式識(shí)別、物體識(shí)別等技術(shù)概念,特別是機(jī)器人在陌生環(huán)境里對物體或環(huán)境信息的識(shí)別,可以應(yīng)用于家庭或工業(yè)機(jī)器人的視覺、無人機(jī)玩具的視覺及無人駕駛車的視覺。
背景技術(shù):
隨著近些年工業(yè)機(jī)器人的發(fā)展,帶動(dòng)了服務(wù)機(jī)器人行業(yè)的逐漸掘起,同時(shí)從2014年開始的智能硬件領(lǐng)域也開始突起,根據(jù)國際機(jī)器人聯(lián)盟的統(tǒng)計(jì),2015年服務(wù)機(jī)器人銷售額將達(dá)85億美元,并且保持較高的20%~30%增長率,在智能硬件領(lǐng)域,據(jù)艾瑞研究,2014年全球智能硬件裝機(jī)量達(dá)到60億臺(tái),預(yù)計(jì)2017年將超過140億臺(tái)。
在市場高速發(fā)展的背后,問題同樣明顯,一方面市場的潛力還遠(yuǎn)未挖掘出來,另一方面,機(jī)器人及智能硬件進(jìn)入服務(wù)行業(yè)也存在著一些技術(shù)難點(diǎn),例如機(jī)器人或無人機(jī)或無人駕駛車的視覺識(shí)別等,目前來看都還有一定的技術(shù)難點(diǎn)。
物體的視覺識(shí)別方面,雖是一大難點(diǎn),但也有些技術(shù)往這方面攻關(guān),例如專利《一種基于三維柵格地圖的物體整體識(shí)別方法》中,提到一種方法“如何從形狀的角度”來對物體進(jìn)行識(shí)別。這里我們要解決的是:如何用顏色的屬性信息來對物體進(jìn)行詳細(xì)刻畫與識(shí)別。
發(fā)明目的
本發(fā)明的主要目的就是解決機(jī)器視覺對物體的識(shí)別問題,它提供一種方法,除形狀信息外,另外的物體顏色等屬性信息是如何輔助我們以深化物體視覺識(shí)別的??梢缘幌抻趹?yīng)用在面向家庭的機(jī)器人游戲、機(jī)器人清潔及無人機(jī)玩具飛行、無人駕駛汽車等方面。
技術(shù)方案
本發(fā)明的目的是這樣實(shí)現(xiàn)的:通過相關(guān)設(shè)備及算法,例如激光雷達(dá)、CCD、CMOS、SLAM算法等,已經(jīng)獲取了實(shí)際物體的柵格地圖信息及顏色信息,并進(jìn)行顏色特征分析,其包括以下步驟:
(1)通過物體的柵格信息,單從形狀的信息出發(fā),先行變換到膜空間上,這里的變換可以是共形變換,但不限于此,可以是雙射變換等等。
(2)在膜空間上,每點(diǎn)的信息如下表達(dá):
(3)針對物體的顏色信息在離散化后得f(x,y)=[ρ色彩表達(dá)空間],我們可以視之為一張圖片,
(4)針對顏色信息的圖片,由邊緣檢測及提取算法,我們可以得到顏色信息的覆蓋集合{Ui},有了這些覆蓋集,就可以借助其做物體細(xì)節(jié)識(shí)別。
本發(fā)明所使用的系統(tǒng)組成如下:膜空間變換系統(tǒng)、顏色信息離散化系統(tǒng)、顏色信息的覆蓋提取系統(tǒng)。這三個(gè)系統(tǒng)是按照功能設(shè)置的軟件系統(tǒng),各子系統(tǒng)具體功能如下:
*膜空間變換系統(tǒng):在已建模后的柵格地圖上,把物體變換到膜空間上,
*顏色信息離散化系統(tǒng):在膜空間上經(jīng)過變換或離散后,形成顏色信息圖片,
*顏色信息的覆蓋提取系統(tǒng):在顏色信息圖片上,應(yīng)用邊緣檢測及提取,得出顏色信息的覆蓋集。
附圖說明:
圖1是本發(fā)明方法所用系統(tǒng)組成圖
圖2是真實(shí)物體之熊貓的示例圖
圖3是真實(shí)物體之熊貓?jiān)谀た臻g上的映射圖
圖4是真實(shí)物體之熊貓的顏色信息圖片
圖5是真實(shí)物體之熊貓的顏色信息覆蓋之檢測與提取
圖6是真實(shí)物體之熊貓的顏色信息覆蓋集
具體實(shí)施方式
下面結(jié)合附圖,說明本發(fā)明的實(shí)施方式。
本發(fā)明方法所用的系統(tǒng)整體結(jié)構(gòu)可參考圖1,它有三個(gè)子系統(tǒng)組成,具體包含如下步驟:
第一步
首先,膜空間變換系統(tǒng),單從物體的形狀出發(fā),把物體變換到膜空間上,這里的變換可以用共形變換,也可以在條件允許下,簡化成用雙射變換。這里我們可以把圖2所示的熊貓共形變換到膜空間之Riemann球面上,如下所示:
其中表示物體上每一點(diǎn)在Riemann球面上的映射點(diǎn)之坐標(biāo),由共形幾何的理論,可以實(shí)現(xiàn)這樣的共映射。映射后的情況如圖3所示。
第二步
我們拋開形狀信息只針對顏色信息處理,在顏色信息離散化系統(tǒng),把圖3所示的膜空間之Riemann球面上顏色信息,離散到一張512x512像素的圖片上,這里計(jì)算時(shí)像素的大小不局限于512,可以根據(jù)精度要求具體處理,對于離散化方法,也不局限于某一種,這里根據(jù)Riemann球面上的天頂角及極角θ處理離散化,得到圖片如圖4所示,表達(dá)如下:
f(x,y)=[ρ色彩表達(dá)空間]
第三步
得到顏色信息的圖片后,在顏色信息的覆蓋提取系統(tǒng)里,利用邊緣檢測算法,如Haar小波、Gabor小波等,這里不局限于某一個(gè)或某一些算法,以達(dá)到顏色信息的覆蓋集提取為最終目標(biāo),如圖5所示。最終我們得到覆蓋集合{Ui}如圖6所示,
{U0=白色身體,U11=鼻子,
U1=右耳,U2=左耳,
U3=右眼珠,U4=左眼珠,
U5=右眼圈,U6=左眼圈,
U7=右前腿,U8=左前腿,
U9=右后腿,U10=左后腿,}
綜上,我們可以看到在給定的物體或環(huán)境上,通過其上的顏色等屬性信息——覆蓋集合{Ui},可以在形狀特征的基礎(chǔ)上,輔助顏色屬性信息,對物體或環(huán)境做了更加細(xì)膩的刻畫與視覺識(shí)別。