本發(fā)明屬于反求圖像控制技術領域,涉及一種單機分束雙目被動立體視覺精確重構與細分擬合方法。
背景技術:
隨著產(chǎn)品競爭的全球化,產(chǎn)品快速與創(chuàng)新設計愈來愈顯示出重要性。反求工程是實現(xiàn)產(chǎn)品再創(chuàng)新開發(fā)及快速設計的重要技術之一,反求工程的首要任務是獲得對象表面的三維信息,在被動雙目立體視覺中,為精確獲得密集三維重構點云信息,通常首先需要搭建短基線的平行光軸系統(tǒng)來進行立體圖像對采集,以滿足共軛點周圍小鄰域可視為相互平移的假設。繼而通過頻域中的圖像平移不變性等理論實現(xiàn)共軛點精確配準。然而,在實踐中運用雙機構建的平行雙目系統(tǒng)會遇到以下三個問題:1)由于視差等因素,不能充分有效地利用像素資源;2)由于拍攝不精確同步所引起抖動或環(huán)境改變等因素導致的匹配困難;3)雙機系統(tǒng)組裝后的魯棒性不高,又由于雙機存在物理特性差異,因此需要進行自適應校正,從而導致系統(tǒng)結構和匹配等算法變得更為復雜。因此,通過一般的雙目被動系統(tǒng)獲得物體表面的密集三維點云信息變得十分困難,通常情況,只能重建出物體少數(shù)的三維特征點,然后用差值、變分等技術結合先驗知識修改模型,因此難以達到自動建模的效果。
而單機分束系統(tǒng),仿照立體電影攝影系統(tǒng),通過在單機物鏡前加裝分光偏轉裝置,將有視差的“立體圖對”同時記錄在相機CCD靶面上。然而,目前的系統(tǒng)均存在以下一種或幾種不足:1)光線相互干擾造成像質下降;2)為獲得較大的重疊視場而使模擬雙目光軸形成一定角度,在基于圖像對平移性假設的密集點云重構中,算法的魯棒性得不到保證;3)由于大都運用單一的棱鏡組進行分光,使得像差難以控制而造成像質下降。
技術實現(xiàn)要素:
本發(fā)明提供了一種單機分束雙目被動立體視覺精確重構與細分擬合方法,解決了現(xiàn)有技術中存在像質下降、算法的魯棒性差、計算量大的問題。
本發(fā)明的技術方案是,一種單機分束雙目被動立體視覺精確重構與細分擬合方法,按照以下步驟實施:
步驟1、建立相機的模型
1.1)建立相機的線性針孔模型;
1.2)建立相機的非線性模型;
步驟2、建立相機動態(tài)對焦內部參數(shù)模型
2.1)建立聚焦狀態(tài)下的內部參數(shù)模型;
2.2)建立離焦狀態(tài)下的內部參數(shù)模型;
2.3)設置標定靶;
2.4)實施標定;
步驟3、自適應面具的快速稠密立體匹配;
步驟4、基于立體視覺的密集點云三維反求
4.1)對應點精確匹配與點云反求;
4.2)重建三維曲面;
4.2.1)重建基于神經(jīng)網(wǎng)絡的曲面;
4.2.2)重建細分曲面;
4.2.2.1)重建細分曲面;
4.2.2.2)誤差分析與加細。
本發(fā)明的有益效果是,從構建一種虛擬光軸嚴格平行并且基線長度可調的單機分束雙目系統(tǒng)出發(fā),涉及到虛擬基線長度的自適應驅動、雙目系統(tǒng)基線與焦距可變的標定與校正、雙目視覺基于特征與頻域融合的自適應模板層次亞像素非特征密集點云配準,并將自適應平行雙目被動立體視覺精確重構與擬合原型系統(tǒng)進行了應用驗證。創(chuàng)新性主要包括以下幾點:
1)提出改進的POC算法對圖像對實施密集匹配。考慮順序匹配約束、連續(xù)性約束和相關性約束條件,通過函數(shù)波峰擬和與亞像素位移因子迭代,對圖像進行多分辨區(qū)域匹配,獲得對應點的亞像素級實時配準效果。
2)構建一種自適應的雙目被動立體視覺系統(tǒng),可根據(jù)被測物體的采樣距離與所需精度等參數(shù)通過單片機自適應地驅動基線長度。另外,為解決傳統(tǒng)雙相機精確同步采樣困難的問題,構建了一種基于單相機的雙目被動立體視覺系統(tǒng)。
附圖說明
圖1是本發(fā)明方法采集的腳型上下圖對原圖;
圖2是本發(fā)明方法腳型重建三維點云的示意圖;
圖3是本發(fā)明方法對內套一及其反求結果示意圖;
圖4是本發(fā)明方法對內套二及其反求結果示意圖;
圖5是本發(fā)明方法對精密螺桿與反求結果示意圖;
圖6是本發(fā)明方法對內套一曲面簡化后的重建結果示意圖;
圖7是本發(fā)明方法對內套二曲面簡化后的重建結果示意圖;
圖8是本發(fā)明方法對精密螺桿曲面簡化后的重建結果示意圖。
具體實施方式
本發(fā)明方法,基于立體視覺方法進行三維重構,是指由兩幅或多幅圖像恢復物體的三維幾何形狀,對于空間物體表面任意一點P,如果用C1相機觀察,看到它在C1相機的圖像點為P1,但無法由P1得知P的三維位置。但是,如果用C1相機和C2相機同時觀察P點,并且如果能確定,在C1相機圖像上的點P1與在C2相機圖像上的點P2是空間同一點P的圖像點(即P1與P2為對應點),那么空間點P即是O1P1與O2P2兩條直線的交點,即它的三維位置是唯一確定的,此即為立體視覺的基本原理。
本發(fā)明的單機分束雙目被動立體視覺精確重構與細分擬合方法,具體按照以下步驟實施:
步驟1、建立相機的模型
1.1)建立相機的線性針孔模型
針孔模型作為相機成像的理想簡化,能夠近似表示空間任何一點P在圖像上的成像位置,即假設物體表面的反射光都經(jīng)過一個小孔而投影到像平面上,即滿足光的直線傳播條件,此時物點、光心以及像點共線。
針孔模型中三維點與其像的關系又稱為中心射影或透視投影,由相似性可得:
其中,(x,y)為投影點p的圖像坐標,Xc,Yc,Zc分別為空間點P在相機坐標系下的坐標,f為成像平面到小孔的距離,用齊次坐標與矩陣表示上述透視投影關系是:
相機坐標系與世界坐標系之間的關系可以用旋轉矩陣R與平移向量t來描述,通過坐標變換,將相機坐標統(tǒng)一到世界坐標系中,則P點坐標與其投影點p的坐標(u,v)的關系是:
其中,αx=f/dx,稱為x方向的像素焦距;αy=f/dy,稱為y方向的像素焦距;dx,dy則是一個像素在x軸與y軸方向上的物理尺寸;M為3×4矩陣,稱為投影矩陣;M1完全由線性模型參數(shù)αx,αy,u0,v0決定,(u0,v0)稱為主點;由于線性模型參數(shù)αx,αy,u0,v0只與相機內部結構有關,稱這些參數(shù)為相機內部參數(shù);M2完全由相機相對于世界坐標系的方位決定,稱為相機外部參數(shù),確定某一相機的內外參數(shù),稱為相機標定。
在許多情況下,為便于計算,需要對投影關系進行歸一化,使得相機焦距等于1,代入公式(2.1)與(2.2),則歸一化后的坐標應為:
而透視投影值應為:
公式(2.2)另外變換成以下形式:
(Xc,Yc,Zc)為空間點P在相機坐標系下的坐標,對(x,y)進行坐標變換:
代入公式(2.6),得:
將公式(2.8)與公式(2.5)進行比較,得到歸一化圖像齊次坐標(xn,yn,1):
根據(jù)公式(2.9),當已知相機內部參數(shù)時,可將歸一化坐標轉換成實際的圖像坐標。
1.2)建立相機的非線性模型
在實際成像系統(tǒng)中,存在各種幾何畸變,如徑向畸變、離心畸變、薄棱鏡畸變等,因此,線性模型不能準確地描述成像的幾何關系;為獲得更高的重建精度,最早由Brown于1966年引入所謂"Plumb Bob"的畸變模型,其定義如下:
根據(jù)針孔成像模型,記其歸一化圖像坐標為令r2=x2+y2,由于考慮鏡頭幾何畸變,新的歸一化坐標xd被定義為:
其中,dx為離心畸變,kc(1),kc(2),kc(3),kc(4),kc(5)均為非線性畸變參數(shù),則有:
根據(jù)公式(2.9),計算考慮鏡頭畸變后的實際像素點坐標為:
此時線性模型參數(shù)αx,αy,u0,v0與非線性畸變參數(shù)kc(1),kc(2),kc(3),kc(4),kc(5)一起構成了非線性模型完整的相機內部參數(shù);
一般情況下,只考慮徑向畸變就已能足夠描述非線性畸變,Tsai曾指出,由于在考慮非線性畸變時對相機標定需要使用非線性優(yōu)化算法,引入過多的非線性參數(shù)往往不僅不能提高精度,反而引起解的不穩(wěn)定。但當實用廣角鏡時,引入離心畸變和薄棱鏡畸變能提高模型的精度。
步驟2、建立相機動態(tài)對焦內部參數(shù)模型
2.1)建立聚焦狀態(tài)下的內部參數(shù)模型
對于單相機情況,雖然不易直接獲取采樣物距,但通過測量對焦環(huán)旋轉角度的方式間接獲取聚焦距離,本方法首先在對焦環(huán)上安裝角度傳感器,通過角度傳感器來獲取相機自動聚焦后對焦環(huán)所轉過的角度θ,然后以該角度作為變量來驅動整個內部參數(shù)模型,
本方法通過整體平移鏡頭方式實現(xiàn)外對焦,因此理論上像距與角度θ應滿足線性關系:
fx=A1+B1θ (3.1)
fy=A2+B2θ (3.2)
當對焦至無窮遠時,成像平面位于焦平面上,此時不妨記對焦環(huán)的旋轉角度為0°,那么,根據(jù)薄透鏡公式則有:
式中s為對焦距離即物距,Δx、Δy分別為x、y方向的單位像素尺寸,f為焦距,β為常數(shù);根據(jù)Magill模型,對焦于物距s時的徑向畸變系數(shù)為:
其中,
分別為對焦于物距s1、s2時的徑向畸變系數(shù),
將公式(3.3)帶入公式(3.5)得:
由于公式(3.4)與(3.6)是線性的,因此kis與θ也是線性的,記作:
kis=Ei+Fiθ;i=1,2,3; (3.7)
2.2)建立離焦狀態(tài)下的內部參數(shù)模型
離焦與對焦狀態(tài)下物體的畸變系數(shù)是會發(fā)生改變的,處于不同物距的物體,相機只能對焦于某一距離,位于其他物距的像點將處于離焦狀態(tài);
設物距為sp處的光線經(jīng)過鏡頭發(fā)生徑向畸變,最終成像到物距為s的對焦平面上時,由三角形相似和薄透鏡公式得到離焦時的畸變系數(shù)為:
其中因此,其徑向畸變?yōu)椋?/p>
根據(jù)公式(3.8)可知,當對焦點的畸變系數(shù)為已知時,只需獲得對焦點和其余像點的深度信息s與sp,再根據(jù)公式(3.3)、(3.7)計算每一點所對應的與kis,從而得到相應的畸變系數(shù)因此獲取每一像點的深度信息成為精確校正的關鍵;
2.3)設置標定靶
標定的過程即為對公式(3.1)、(3.2)、(3.3)、(3.7)、(3.8)中系數(shù)A1,B1,A2,B2,u0,v0,f,β,p1,p2,Ei,Fi;i=1,2,3的估計過程,由于一張平面標定板照片能夠獲得關于內部參數(shù)的兩個約束條件:
和
假設H=[h1 h2 h3]為其相應的單應性矩陣,因此對于有固定內部參數(shù)的傳統(tǒng)相機模型,至少需要三張非線性相關平面標定板采樣的單應性矩陣來求解內部參數(shù)矩陣A,進而通過迭代來擬合畸變系數(shù);但是當對本發(fā)明設想的離焦狀態(tài)下的內部參數(shù)模型進行標定時,每次拍攝都進行自動對焦,因此需要引入新的變量θ驅動的內部參數(shù)矩陣A(θ),這在很大程度上增加了標定過程的復雜度與求解的不穩(wěn)定性。
為解決該問題以獲得單次對焦狀態(tài)下的標定結果,設計互成角度的三平面立體標定靶:即把3張平面標定板拼接組合在一起,兩兩各成108°;之所以選擇大于90°的拼合方式,是希望通過減少標定靶物距景深的方式,使所有標定板都盡可能落在相機焦點附近,從而獲得更多清晰準確的角點信息,此時,能夠通過對立體標定靶進行一次拍攝而獲得關于相應對焦環(huán)旋轉角度θ的全部內部參數(shù)解析解;
考慮到畸變等因素,只通過一次拍攝所獲得的標定結果是十分粗糙且不穩(wěn)定的,為提高內部參數(shù)求解的魯棒性,需為其提供較為準確的初值信息。對不同距離采樣的幾組標定圖統(tǒng)一進行傳統(tǒng)固定內部參數(shù)標定,獲得的標定結果作為該初值,從而有望避免后繼病態(tài)迭代解的產(chǎn)生。另外還需注意,圖像中的畸變量隨著遠離主點而增大,在接近主點區(qū)域,畸變量是很小的,因此當只采用少量標定圖進行畸變系數(shù)估計時,為避免得到病態(tài)解,在標定靶的采樣時,需盡量使其遠離光心以獲得較大的畸變量。
最后,通過計算立體標定靶圖像每一角點的重投影值到實際點的距離平方和來估計標定誤差,在標定過程中,采用L-M(Levenberg-Marquardt)算法來最小化該誤差。
2.4)實施標定
具體標定過程按照以下步驟實施:
步驟1)對不同距離的立體標定靶進行自動對焦,確保對焦在標定靶上后進行拍攝采樣,獲取n張照片并記錄相應的對焦環(huán)旋轉角度θii=1,2,...,n;
總共含有3n張平面標定板圖,運用張正友的方法對該3n張平面標定板圖進行固定參數(shù)的標定求解,獲得標定結果
步驟2)利用步驟1)的標定結果作為初值,分別求解這n張照片的內部參數(shù)值i=1,2,...,n;
步驟3)對步驟2)得到的內部參數(shù)值根據(jù)公式(3.1)、(3.2)、(3.7)運用最小二乘法求解,獲得系數(shù)A1,B1,A2,B2,u0,v0,E1,F1,E2,F2,E3,F3,重新代入公式解得新的內部參數(shù)值i=1,2,...,n;
步驟4)將結果更新為步驟2)的初值,重復步驟2)、步驟3),至內部參數(shù)值A1,B1,A2,B2,u0,v0,E1,F1,E2,F2,E3,F3收斂或超出迭代次數(shù);
步驟5)根據(jù)步驟4)所獲得的內部參數(shù)值重投影每個角點到三維空間,求出每組立體標定靶中角點的平均深度作為該次采樣的對焦距離;
步驟6)將步驟5)所得對焦距離作為初值,結合相應θi,i=1,2,...,n,代入公式(3.3),運用最小二乘法求解,獲得系數(shù)f,β,將各θi代入公式獲得相應的對焦距離si;
步驟7)將各角點的真實深度信息及由步驟6)計算獲得的對焦距離代入公式(3.8),計算每個角點的離焦徑向畸變系數(shù);
步驟8)估計標定誤差,并固定各張照片所對應的內部參數(shù)矩陣A(θi),用L-M算法優(yōu)化對焦距離si;
步驟9)以步驟8)優(yōu)化后的對焦距離作為初值,代入步驟6),重復步驟6)、步驟7)、步驟8),直到步驟8)中誤差估計小于給定精度要求或超出迭代步數(shù);
步驟10)將所得離焦徑向畸變系數(shù)對每個角點進行校正,通過解析法分別求解這n張照片的內部參數(shù)矩陣A(θi),根據(jù)公式(3.1)、(3.2)運用最小二乘法求解,獲得系數(shù)代入公式(3.1)、(3.2),解得新的更新A(θi);
步驟11)固定內部參數(shù)矩陣A(θi)及f,β,估計標定誤差,用L-M算法優(yōu)化對焦時的畸變量
步驟12)根據(jù)公式(3.7)運用最小二乘法求解,獲得系數(shù)E1,F1,E2,F2,E3,F3,代入公式解得新的
步驟13)估計標定誤差,以這些新的畸變量為初值對每幅標定靶圖分別進行L-M全局優(yōu)化
步驟14)將步驟13)優(yōu)化結果作為初值,重復步驟10)、步驟11)、步驟12)、步驟13),直到步驟13)中誤差估計小于給定精度要求或超出迭代步數(shù),最終完成標定。
步驟3、自適應面具的快速稠密立體匹配
在對應點匹配中,POC算法在提供較高魯棒性及精確度的同時,所付出的計算代價也是高昂的,每一立體點的視差計算,都對所在窗口區(qū)域進行至少2次2D傅里葉變換及1次2D傅里葉反變換。在實際操作中,為獲得更佳的魯棒性,通常采用金字塔式由粗到細的匹配策略,而多層匹配使計算代價變得更高。為確保匹配的精確度與魯棒性,在對應點的匹配過程中,需要考慮更多的相鄰像素區(qū)域,即更大的表面區(qū)域進行匹配;然而物體表面并不具有相同的深度,不可將對應點附近較大的物理鄰域近似視為一個相互平移,因此,過分擴大物理區(qū)域將無法保證匹配算法的可信度。相反地,為了滿足對應點鄰近區(qū)域為相互平移的假設,而只考慮點周圍很小的區(qū)域,匹配精度又將迅速下降。在以往的工作中,試圖通過提高圖像采集器的分辨率來解決這對矛盾,這樣待匹配點周圍較大的像素區(qū)域仍可視為相互的一個平移;但是,這種通過增大匹配窗口區(qū)域來獲得更多有效紋理的思想受到了昂貴計算代價的挑戰(zhàn),整個匹配過程變得遠離實時性。事實上,POC算法的速度瓶頸主要來自傅里葉變換,由于需要計算的是稠密點云信息,對于1600×1600像素的立體圖對,如果采用4層金字塔來進行逐層逐點計算,至少需要進行1千萬次2DFFT的運算,即使選取31×31像素的小窗口,花費的整個計算量也是驚人的。但是,這些FFT運算中充滿著重復的計算信息,其中絕大部分是重疊的,這也就意味著,如果需要獲取其傅里葉變換,無需分別計算兩次。
在立體匹配中,為獲得正確的匹配結果,希望匹配區(qū)域整體具有相同的視差,但是考慮到實際物體表面并非足夠平坦,在物體表面深度變化明顯的區(qū)域,要么出現(xiàn)黑色的失配情況,要么得到很大的誤差,最終導致匹配的可信度低下。從傳統(tǒng)的思想來看,一方面,為獲得更魯棒的匹配結果,需要考慮更大的區(qū)域窗口;而另一方面,考慮到物體表面一般并不具有相同的深度,因此為增加匹配精度,需要考慮盡可能小的物體表面區(qū)域來近似擬合同一深度。為解決以上矛盾,如上文所述,可通過采用更高像素的圖像采集器來解決,但更大的匹配窗口區(qū)域將大幅增加匹配算法的時間開銷。
為此,有學者提出為匹配區(qū)域增加圓型面具來提高匹配精度的思想,并取得了一定的成效,該面具的使用基于以下假設條件:中心區(qū)域附近近似認為具有相似視差,從而整體減弱遠離中心區(qū)域的匹配權重。但在上述假設條件不成立的情況下,就等效地降低了整體匹配魯棒性。事實上,對于普遍的情況,該方法只對減弱傅里葉變換周期性引起的邊界跳躍現(xiàn)象起到一定的作用,真正期望獲得的效果是:在匹配窗口大小不變的情況下,盡可能多地保留與中心匹配點具有相似視差區(qū)域的匹配權重,從而相應地大幅減弱或者抵消視差變化較大區(qū)域的匹配權重。
假設待匹配物體表面為一張光滑的無遮擋曲面,即可顯示地表示為高程曲面z=Z(x,y)的形式,這一點通過前期的圖像分割預處理做到,其梯度方向grad Z(x0,y0)=Zx(x0,y0)i+Zy(x0,y0)j為Z(x,y)增加最快的方向;當(x,y)沿梯度正交方向變化時,函數(shù)的變化率為零。因此能夠認為,在鄰近區(qū)域內,沿著該方向上的點具有很相似的視差,于是為使這些具有相近視差的點獲得更大的匹配權重,定義如下的面具與匹配區(qū)域相乘:
其中,匹配窗口區(qū)域為(2M+1)×(2M+1)的正方形,(-k,1)為中心梯度方向,
在由視差決定的高程圖中,箭頭所標的方向即為相應點的梯度方向,理論上,這樣的梯度方向是任意的,但考慮到前述的快速POC算法,將所有的向量離散為上下左右及45度斜角總共八個方向。在實際算法中,在梯度模較大的情況下,采用4個離散化面具模板(即45°面具、-45°面具、水平面具、垂直面具)進行計算;在未知梯度的情況下,如金字塔頂層的匹配過程,由于計算量不大,采用圓形面具進行常規(guī)的POC算法。
除最頂層外,對于每一個待匹配點,需要對其梯度方向進行估計,由于采用由粗到細的逐層匹配策略,因此對于當前匹配層,將對上一層的視差圖進行分析,假設對于第一層和第三層的匹配視差圖,對其進行等高線提取,得到取樣等高線。值得注意的是,這一提取過程中,將設定較大的等高線差值,以消除一些由于誤匹配情況所引起的擾動,然后再進行等高線插值,獲得每點的梯度,以此作為下一層匹配面具的選取依據(jù),以獲得自適應選取面具的效果。
步驟4、基于立體視覺的密集點云三維反求
4.1)對應點精確匹配與點云反求
基于上述的論述,對物體圖像進行5層復小波分解,在像素匹配階段采用簡化的算法:從最底層開始,運用前述的相位相關算法,只比對中心附近的點,找出最大值,而由該最大值作為σ的近似,其位置即為相應的視差估計,放大后代入上一層作為新的初始估計,進行新的計算,直到最頂層為止,因此,在進行亞像素匹配時,視差估計的誤差應該小于1個像素;然后通過幾次非線性最小二乘擬合迭代過程,獲得最終的亞像素級視差估計,這樣的迭代過程進行兩次就可趨于收斂。
根據(jù)上述的匹配方式,對于大部分點都可自動獲得正確的視差估計,然而由于遮擋、噪聲以及缺少紋理等因素的影響,在由粗到細的匹配過程中,對于某些點對將出現(xiàn)錯誤估計,進而導致亞像素匹配無法收斂等情況,不僅降低了自動配準的魯棒性,而且減弱了三維重建的可靠性和精準度。為克服這些因素的干擾,引入順序匹配、連續(xù)性、相關性以及外極線約束條件,作為對匹配關系的可信度評估;其中順序匹配約束是指,對于上圖中的兩點,其下圖中的匹配點應保持原來的順序;連續(xù)性是指,對于上圖中接近的兩點,其下圖中的相應視差也應該相似;相關性約束可用σ值來表示,當σ值越大,說明這兩點的匹配相關性越大;外極線約束是指匹配點將擁有基本相似的橫坐標。
據(jù)此,整個匹配過程按照以下步驟實施:
步驟一)對于每一層,匹配并估計每一未標記點的σ值,如果σ小于某一閾值,則對該點進行標記并轉入步驟二);否則,考慮其順序約束,取與其同列并已匹配的最近未標記點;如果順序匹配錯誤,則進行標記并轉入步驟二);否則,考慮其連續(xù)約束情況,取其附近5×5以內所有已匹配而未標記點,取其視差平均,比較與該點差的絕對值,如大于某一閾值,則對該點標記轉入步驟二);最后,如果匹配點偏離外極線過大,則標記該點并轉入步驟二);
步驟二)對于標記的點,考慮其附近5×5以內所有未標記點,取其關于σ值的相對加權平均作為該點的初始估計,然后進行亞像素匹配,對其結果進行相應的約束檢測;如仍被標記,則將初始估計作為其相應視差。
運用以上約束條件,能夠自動獲得精確而魯棒性強的匹配點對,重建出密集的三維點云,圖1為照相機拍攝的上下圖對,圖2為對應的三維重建點云。
4.2)重建三維曲面
4.2.1)重建基于神經(jīng)網(wǎng)絡的曲面
將上述獲取的三維點云信息的x,y方向坐標作為神經(jīng)網(wǎng)絡的輸入,而將z方向坐標作為輸出,構成二輸入、一輸出的網(wǎng)絡系統(tǒng),網(wǎng)絡的輸入與輸出形成映射關系,設這樣的映射關系為一有限支單值連續(xù)函數(shù)X=[x,y],
事實上,對于2層單輸出MLFN(multilayer feedforward neural network),無論隱層取Sigmoid函數(shù)、小波函數(shù)還是RBF,輸出層皆取線性函數(shù),只要隱層神經(jīng)元足夠多,就能以任意精度逼近任何有限支單值連續(xù)函數(shù);但是,由于函數(shù)不是非常平滑,如采用局部接收場的RBF或小波網(wǎng)絡,網(wǎng)絡規(guī)模(即隱層神經(jīng)元數(shù))隨輸入向量維數(shù)的增加而指數(shù)增加,為控制規(guī)模,采用全局接收場的Sigmoid函數(shù),
假設2層單輸出且隱層取Sigmoid函數(shù)、輸出取線性函數(shù)的MLFN,其映射函數(shù)表示為:
其中,fs[I]=[1+e-I]-1為Sigmoid函數(shù);的下標N1表示隱層神經(jīng)元數(shù),ξ表示所有權和閾值參數(shù)構成的向量;Barron指出,網(wǎng)絡所實現(xiàn)的函數(shù)與被逼近函數(shù)之間的最小均方逼近誤差隨N1的增加按1/N1的速率下降,則有:
其中,S≥1,在為S階可導時為有限值,并假設X的定義域包含原點,且處于一個半徑為r的超球Br之內,因此,N1只需隨N線性增加;但比起小波網(wǎng)絡,網(wǎng)絡學習過程需要更多的訓練樣本。
由于不需要太多的隱含層神經(jīng)元即可獲得好的人臉逼近效果,但考慮到每一點對的匹配估計值σ決定對應重建三維點的位置可信度,因此,為獲得更精確的網(wǎng)絡逼近結果,設置可信度越高的點參加越多次數(shù)的訓練過程。
具體情況是,對每一點對所反求的三維訓練樣本,令其參加前N次訓練循環(huán)過程:
其中,ε為匹配拒判閾值,C為與最大循環(huán)次數(shù)有關的常數(shù),優(yōu)選取值為ε=0.5,C=100;
4.2.2)重建細分曲面
細分法是一種產(chǎn)生具有內置多分辨結構的光滑曲面的迭代方法,被廣泛應用到計算機輔助幾何設計的曲面造型領域,細分法還與小波基以及相關的快速岸壁算法關聯(lián)。細分法由可被視為給定多面體曲面頂點的離散數(shù)據(jù)構成的初始集合開始,按照某種線性規(guī)則,初始集合遞歸地產(chǎn)生新的數(shù)據(jù)集,這個規(guī)則被定義為面具;如果規(guī)則選取合適,新的數(shù)據(jù)集將收斂到連續(xù)的曲面,因此,對于由固定有限支集的實序列面具{a(α):α∈Zs}定義的細分法,應用下面的規(guī)則會遞歸地得到序列vk:
適當?shù)剡x擇面具,由定義的多面體將趨于光滑的曲面,表示為φ是細分函數(shù),是膨脹方程有緊支集的唯一解;
將前述過程獲得的密集點云信息作為起點,尋找這樣的多邊形頂點作為起始網(wǎng)格,在給定面具作用下,使得其細分極限曲面能夠擬合所有這些點云;
4.2.2.1)重建細分曲面
按照以下步驟實施:
步驟A:對雙目系統(tǒng)從不同角度拍攝并獲取的三維重建密集點云進行拼合、去噪、補洞,形成被測體完整的密集點云信息,設這樣的點云為Q;
步驟B:對被測體的點云信息進行簡化與點云均勻化操作,依據(jù)選用面具的大小、被測物體的復雜程度以及最終細分曲面重建擬合精度等因素,對點云進行一定比例的簡化處理;
對于較為簡單的面具,如Loop,Catmull-Clark等,簡化后的點云數(shù)目為原始數(shù)目的1%左右將獲得較好的擬合效果;而對于更為復雜的面具,所需的簡化后點云數(shù)將更少;
步驟C:將簡化并均勻化的點云作為細分法的起始控制網(wǎng)格,對其進行一次細分操作,考慮新的控制網(wǎng)格上每一個頂點,計算其在極限曲面上的位置,通過誤差估計E,調整細分原始控制網(wǎng)格使E<ε,其中ε為預先設定的誤差容許閾值;
對于簡單的面具,如Loop等,其細分函數(shù)φ是已知的,因此能夠直接獲得其極限位置:
其中,
然而對于更為一般的面具,通常其細分函數(shù)是未知的,其極限位置需通過多次細分迭代的方式來獲得;因此,作為更普遍的方法,需對控制網(wǎng)格進行多次細分操作,而近似認為此時的細分網(wǎng)格已經(jīng)在極限曲面上;
步驟D:對調整后的網(wǎng)格進行再一次的細分操作,對新的控制網(wǎng)格上每一個頂點計算其極限位置,并通過誤差估計調整上一層的控制網(wǎng)格,直到誤差小于給定閾值為止;
對于調整后的控制網(wǎng)格,需進一步優(yōu)化其上一層的網(wǎng)格直到起始網(wǎng)格為止,當優(yōu)化多次后仍然不能收斂時,需進行局部加細處理,通過對起始控制網(wǎng)格的局部加細,來獲得理想的擬合效果;
步驟E:重復以上細分與優(yōu)化過程,直到細分頂點數(shù)目大于某一預先設定的值為止,通常這個值就是原始點云的數(shù)目;
4.2.2.2)誤差分析與加細
細分操作后,對于所有的網(wǎng)格頂點,記為M,對于i∈M,其極限位置為在點云Q中尋找與其距離最小的點qi∈Q,定義誤差函數(shù)E為:
其中,
事實上,細分曲面具有局部可控性,對每一個采樣頂點i,只有周圍的一些控制頂點能夠影響其最終的極限位置,這些頂點的多少與影響方式取決于面具的選擇,因此,通過每一點的誤差來迭代地優(yōu)化對其具有影響的控制頂點位置,但并非所有的情況都能收斂;當經(jīng)過多次迭代曲面仍不能收斂于點云Q時,需進行局部加細操作,對于局部難以擬合的復雜區(qū)域,對其原始控制網(wǎng)格進行局部加細;加細的方法有很多,所需擬合的曲面越復雜,加細的程度越大。
單機分束立體視覺三維反求模型的應用
專用螺桿以及成型內外套件是高密度成型設備中的重要部件,為能壓制出符合要求的高密度棒料,在選用高硬度高耐磨性合金鋼材的同時,需對精密螺桿進行包括螺旋尺寸、螺距、螺旋角度、加料段與壓縮段比例等方面的優(yōu)化設計,而此過程需在已有實物機型的基礎上進行改進與提高,因此,進行實物螺桿及內外套重建是優(yōu)化設計的基礎。根據(jù)本發(fā)明提出的理論和方法,開發(fā)了單機分束立體視覺三維反求系統(tǒng),包括復雜產(chǎn)品的立體圖像采集、點云重建、點云拼合、曲面擬合與曲面簡化等功能模塊。
螺桿及內套點云重建
由于被重建復雜產(chǎn)品能夠保持靜止狀態(tài),因此在使用用三腳架固定雙目系統(tǒng)的前提下,可采用雙相機對實物螺桿內外套進行立體采樣。
由于外套模型屬于規(guī)則造型,通過簡單測量既可精確建模,因此,本系統(tǒng)只針對結構更為復雜的內套與螺桿進行雙目立體視覺反求??紤]到內套的對稱性,因此只需對部分區(qū)域進行反求,那些遮擋部分可用鏡像的方法獲取。
從不同角度對物體進行立體拍攝,獲取相應的反求點云,運用ICP(Iterative Colsest Point)算法對齊點云后,刪除冗余點,獲得完整點云信息,整個過程基本可自動完成。如圖3、圖4、圖5所示,分別為內套一、內套二、精密螺桿的點云反求結果,其中,圖3中左上圖為內套一的原始照片,右圖為點云反求俯視圖,左下圖為點云反求立體圖;圖4中上排中圖為內套二的原始照片,左上圖為點云反求立體圖一,右上圖為點云反求立體圖二,中下圖為點云反求俯視圖;圖5中左上圖為精密螺桿的原始照片,右上圖為點云反求立體圖;右下圖為點云反求主視圖;
螺桿及內套的曲面重建與簡化,對圖3、圖4、圖5中所重建的點云進行簡化并適當人機交互,得到最終的精密重建結果圖,如圖6、圖7、圖8所示,即成。