專利名稱:基于一幅標準圖像生成各視角下樣本圖像的方法
技術領域:
本發(fā)明涉及模式識別技術領域,特別是涉及一種基于一幅標準圖像生成各 視角下樣本圖像的方法。
背景技術:
樣本圖像生成是一種圖像變換方法,它是模式識別、機器學習領域中的有 監(jiān)督學習方法的重要組成部分。樣本圖像生成的目的是對一幅或幾幅在真實情 況下對目標物體拍攝得到的標準圖像(通常是從目標物體的正面拍攝的圖像) 進行一系列的圖像變換,進而生成各種不同的樣本圖像,這些樣本圖像與攝像 機在各種不同視角下針對目標物體進行拍攝所得到的真實圖像具有一定的相似 度,因此可以用它們來模擬這些拍攝的真實圖像。有效的樣本圖像生成方法可 以生成與真實圖像相似度很高的樣本圖像,基于此進行的有監(jiān)督學習過程可以 為模式識別、機器學習提供更準確的與目標物體相關的先驗知識儲備,最終獲 得更高的物體識別成功率。例如,在空間戰(zhàn)場中,為了實現(xiàn)通過衛(wèi)星對地面的 某一 目標物體進行識別,首先需要獲取大量的與該目標物體相關的圖像數(shù)據(jù), 以此作為基礎來形成與該目標物體相關的先驗知識數(shù)據(jù)庫,進而基于這一數(shù)據(jù) 庫來實現(xiàn)衛(wèi)星對該目標物體的識別。然而,衛(wèi)星較快的運動速度以及有限的視 野造成了在一個運動周期內通常只能對目標拍攝有限的幾幅甚至一幅圖像,并 且衛(wèi)星運動的長周期性導致了需要經過非常漫長的時間才能采集到足夠多的圖 像數(shù)據(jù)。由此延長了從準備先驗知識數(shù)據(jù)庫到最終實現(xiàn)對目標物體的成功識別 的時間,失去了快速識別目標物體的先機。為了在短時間內獲得關于目標物體 的大量的圖像數(shù)據(jù),因此需要在僅有的一幅或幾幅圖像的基礎上利用樣本圖像 生成方法來生成各種視角下的關于目標物體的圖像,由此僅經過幾個甚至一個 運動周期后便可以形成充分的先驗知識數(shù)據(jù)庫,實現(xiàn)了在短時間內完成數(shù)據(jù)儲 備并成功識別目標物體目的。
由于樣本圖像生成的重要性,人們已經開始對其展開研究,并提出了-些方法(具體樣本圖像生成方法參見L印etit, V., Lagger, R, Fua, P.: Randomized trees for real-time keypoint recognition. In: Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition, Vol. 2. IEEE Computer Society Washington, DC, USA (2005) 775-781)。
已有的樣本圖像生成方法主要通過以下方式實現(xiàn) 設A表示一個3X3的矩陣,并且該矩陣是以下四個參數(shù)的函數(shù) 義2)。 A的具體表示形式如下
cosz'一sirn'0_、00—
sin/cos/0,/0),s =00
001001
對于一幅大小為AO<M的標準圖像,利用它生成樣本圖像所需的圖像變換可以 用矩陣A來表示。在A中,e和p是兩個角度變量,其取值范圍是(-180。 ,180 ° ); A和^是兩個實數(shù)變量,取值范圍通常是(0.2, 1.8)。 110和~稱為旋轉矩陣, 用來表示在樣本生成過程中對標準圖像所做的各個方向上的旋轉變換,S稱為圖 像大小縮放矩陣,用來表示在樣本生成過程中對標準圖像所做的縮放變換。
將以上由矩陣A的一個具體值表示的圖像變換作用于標準圖像,便可以得 到一幅新生成的樣本圖像。這樣一幅樣本圖像是在對標準圖像進行了某些方向 上的旋轉以及大小縮放之后得到的,這其中由標準圖像變換到樣本圖像的旋轉 方向、旋轉角度大小、縮放程度大小均由矩陣A中的四個參數(shù)(《p, /17, A)的取 值來決定。這四個參數(shù)的不同取值,決定了在生成樣本圖像過程中使用不同的 旋轉方向、不同的旋轉角度以及不同的大小縮放程度,進而決定了將會生成不 同的樣本圖像。
當兩個旋轉角度參數(shù)(《^)的取值的絕對值較小的時候,通過以上變換方式 生成的樣本圖像與攝像機在對應角度拍攝得到的真實圖像具有較高的相似度, 因此這些樣本圖像可以較好的模擬真實圖像。但是隨著這兩個參數(shù)的取值的絕 對值的逐漸增大,所生成的樣本圖像與攝像機在對應角度拍攝得到的真實圖像 的相似程度卻大為下降,以至于無法很好的模擬真實圖像。造成以上問題的主 要原因是雖然從不同視角拍攝的兩幅圖像之間的變換關系確實可以通過一個3 X3的矩陣來表示,但是這一矩陣是一個普通矩陣,它具有一個最一般的表示形式,其中的9個元素的取值是隨機的,并無一定的規(guī)律。而如公式(1)所示的 矩陣A中的一些元素的取值是存在規(guī)律的,即無論四個參數(shù)(《& 4 ^)的取值
如何變化,矩陣A的第三行始終是(O,O,l)。這一特點導致了矩陣A與標準圖像 和從一定視角拍攝的另外一幅真實圖像之間的變換關系不完全等價,也就使得 基于這一變換所生成的樣本圖像無法完全模擬從對應視角拍攝得到的真實圖 像。
從以下角度也可以對已有方法在生成圖像樣本方面的缺陷由于人眼成像
和攝像機成像都符合透視投影關系,因此對于兩條平行的直線,當從一個較偏 的視角對其進行拍攝時,這兩條直線在所拍攝得到的真實圖像上的像已經不再 平行,而是存在一個交點。然而,采用已有方法處理兩條平行直線的標準圖像 時,二者在所生成的樣本圖像上的像仍然是平行的。以上現(xiàn)象也說明了已有方 法所生成的圖像樣本無法完全模擬真實圖像的缺陷。
發(fā)明內容
有鑒于此,本發(fā)明的主要目的在于為模式識別、機器學習領域中的有監(jiān)督 學習過程提供一種樣本圖像生成方法,采用此方法生成的樣本圖像能夠完全模 擬從相應視角拍攝的真實圖像,可以為模式識別、機器學習提供更準確的先驗 知識儲備,進而獲得更高的物體識別成功率,由此可以解決諸如在戰(zhàn)場中短時 間內實現(xiàn)從目標物體先驗知識儲備到成功識別目標物體的問題,從而提供一種 基于一幅標準圖像生成各視角下樣本圖像的方法,這一方法克服了已有方法在 生成樣本圖像的過程中所用的變換矩陣不能完全表示兩幅圖像之間變換關系的 缺陷,提高了所生成的樣本圖像與真實圖像的相似程度。
本發(fā)明的技術方案是
通過分析在兩個不同視角下所拍攝得到的兩幅真實圖像之間的變換與一些 參數(shù)的關系,進而用這些參數(shù)來表示這兩幅真實圖像之間的變換關系,由此便 可以通過將由這些參數(shù)表示的變換關系作用于第一幅圖像的方式,來生成一幅 樣本圖像,而這幅樣本圖像就可以被用來完全模擬在第二個視角下拍攝的真實 圖像。具體由以下幾部分組成
第一步,采用四個參數(shù)(《^, ^r)來表征攝像機在對目標物體進行拍攝時所處的空間三維位置,四個參數(shù)的所有取值組合能夠覆蓋攝像機在三維空間中所 處的所有位置,并且每一組取值都與空間的某一個位置唯一對應。
第二步,在步驟一的基礎上,假設針對目標物體拍攝一幅標準圖像時攝像 機的空間位置(記為位置0)所對應的四個參數(shù)的一組取值為(&, K, &),則目
標物體所在的空間坐標系與標準圖像坐標系之間的變換關系可以由W(), 0。,
ro)來表示。同理,設攝像機在另外的某一個視角進行拍攝時的空間位置(記為
位置t)所對應的四個參數(shù)的一組取值為(A 0t, K,6),則目標物體所在的空間坐 標系與在該視角下拍攝的圖像坐標系之間的變換關系可以由(《,0t, K, w來表 示。由于兩幅圖像是針對同一空間下的同一目標物體進行拍攝,因此以上兩個 由目標物體空間坐標系到圖像坐標系的變換關系中的物體空間坐標系為同一 個,因此,由標準圖像坐標系到另外一幅圖像的坐標系之間的變換關系就可以
由((9。, 0Q, K, r。)和(《,0t, & n)兩組參數(shù)值來表示。
第三步,在已知一幅標準圖像和一組參數(shù)值(化,00, K,")的情況下,給四個 參數(shù)(6>, 0, R r)賦予不同于(&, 0Q, K, r。)的另外的一組值,例如(《,0t, K, rt),則 根據(jù)第二步就可以由(&, K, ro)和的,0t, & "計算出一個由標準圖像到另外 一幅圖像的變換關系。將這一變換關系作用到標準圖像上之后,可以生成一幅 樣本圖像。該樣本圖像就可以被用來完全模擬攝像機在位置t時對目標物體所拍 攝得到的真實圖像。
第四步,給四個參數(shù)(《^, R。賦予任意組不同的值,記為(《,^i, ",n),可 以得到各種由090, 0。, K, w)和仇& & n)表示的由標準圖像到多個樣本圖像的 變換關系,將這些變換作用到標準圖像上,就可以生成各種不同的樣本圖像, 這些樣本圖像可以被用來模擬攝像機在與不同的參數(shù)值(A, A, K, r)所對應的各 個空間位置拍攝的真實圖像。
本發(fā)明的基于一幅標準圖像生成各視角下樣本圖像的方法具有以下優(yōu)點
(1)在本發(fā)明的技術方案中,由于是首先通過反向推導的方法即分析兩幅 從不同視角拍攝得到的真實圖像之間的變換關系以及如何利用參數(shù)來表示這一 變換關系,并將這一變換關系應用到標準圖像來生成樣本圖像,因此采用本發(fā) 明所述方法生成的樣本圖像與標準圖像的相似程度遠高于采用已有方法生成的
樣本圖像與標準圖像的相似程度,具體對比結果可以參見附圖6、附圖7和附圖果。因此,可以為模式識別、機器學習提供
更準確的先驗知識儲備,進而獲得更高的物體識別成功率。
(2)如技術方案中的第一步所述,四個參數(shù)的所有取值能夠覆蓋攝像機可 能在三維空間中所處的所有位置,并且每一組取值都與空間的某一個位置唯一 對應,即每一組值對應一幅從特定視角拍攝的圖像。因此,生成某種視角下的 樣本圖像是可控的,即可以通過控制四個參數(shù)(《0, P,r)的取值來生成所需的特 定視角下的圖像。例如,根據(jù)要求生成從左側某一角度下觀察目標時候的圖像, 或者從某一特定距離下觀察目標時候的圖像。
圖1為本發(fā)明中的三維空間坐標系、攝像機在這一坐標系下的位置以及用 來表示這一位置的四個參數(shù)(《^, KO之間的關系示意圖。
圖2為本發(fā)明中攝像機在兩個不同的空間位置對目標進行拍攝時攝像機坐 標系、世界坐標系之間的空間位置關系示意圖。
圖3-a為一幅從物體正面拍攝的真實圖像,即標準圖像。圖3-b為針對同一 物體在另外一個視角下拍攝的真實圖像。
圖4為基于圖3-a這幅標準圖像并采用已有的方法所生成的樣本圖像。
圖5為基于圖3-a這幅標準圖像并采用本發(fā)明所述的方法所生成的樣本圖像。
圖6-a為采用兩對直線(直線L,和L2,直線L3和L》標識出標準圖像中的 矩形"福字畫"的兩對平行邊的示意圖。圖6-b為采用兩對直線(直線I^和L2, 直線L3和L4)標識出圖3-b所示圖像中的矩形"福字畫"的兩對邊的示意圖。
圖7為采用兩對直線(直線"和L2,直線"和L4)標識出如圖4所示圖 像中的矩形"福字畫"的兩對邊的示意圖。
圖8為采用兩對直線(直線"和L2,直線L3和L4)標識出如圖5所示圖 像中的矩形"福字畫"的兩對邊的示意圖。
圖9-a為采用SIFT特征點的匹配數(shù)量來衡量通過已有方法所生成的樣本圖 像與從相應視角拍攝的真實圖像的相似程度的示意圖。圖9-b為采用SIFT特征點的匹配數(shù)量來衡量通過本發(fā)明所述方法所生成的樣本圖像與從相應視角拍攝 的真實圖像的相似程度的示意圖。
具體實施例方式
下面結合附圖和實施例對本發(fā)明做詳細說明。
這里以一個平面物體作為目標物體進行優(yōu)選方案的實施。并作以下假設 物體平面與世界坐標系的XOY平面重合,并且為了確保在生成樣本圖像時原標 準圖像的最大部分可以被包括進視野中,目標物體平面的中心與視野的中心重 合。
下面參照附圖對本發(fā)明作進一步詳細的說明。
圖1為本發(fā)明中的三維空間坐標系、攝像機在這一坐標系下的位置以及用 來表示這一位置的四個參數(shù)^,^, K"之間的關系示意圖。圖中各符號具體含義 如下:
0、v為世界坐標系的原點。
Xw,Yw和Zw分別是世界坐標系的三個坐標軸。 A點表示攝像機在對目標進行拍攝時所處的某一空間位置。 Zct為攝像機坐標系的Z軸(即攝像機的光軸)。
《0, y,r是如本發(fā)明技術方案中所述的用來確定攝像機在三維空間巾位置 的四個參數(shù),其中
6>為包含Zw軸和Zet軸的平面與Z^OwXw平面的夾角;
0為Z"軸與XwOwYw平面的夾角;
^為攝像機繞Zet軸做旋轉運動時的角度;
r為A點與Ow點之間的距離。
如圖1所示,四個參數(shù)(e,0,y,r)的不同取值決定/攝像機在空間中的不同 位置,且取值與空間位置一一對應。
圖2為本發(fā)明中攝像機在兩個不同的空間位置對目標進行拍攝時攝像機坐 標系、世界坐標系之間的空間位置關系示意圖。圖中各符號具體含義如下 Mw表示在拍攝標準圖像時的攝像機坐標系。Oc0,XeQ, Yw和Ze。分別是MeQ坐標系的原點和三個坐標軸。 Mct表示在另外的某一個視角進行拍攝時的攝像機坐標系。 Oct,Xet,Yet和Zet分別是Md坐標系的原點和三個坐標軸。 Mw表示世界坐標系。Ow, Xw, Yw和Zw分別是Mw坐標系的原點和三個坐標軸。右上角帶有一個圓點的方框表示的是在拍攝時的圖像平面。H表示標準圖像與另外一幅圖像之間的變換關系矩陣。 U表示目標物體的平面,且該平面與Xw(^Yw平面重合。假設對應于目標物體上的一個三維點坐標(記為P),它在標準圖像上所成 的像點坐標為pQ,設矩陣K是表不攝像機自身內部參數(shù)(包括焦距,成像的CCD 參數(shù)等)的矩陣,K矩陣的取值固定,不隨攝像機的空間位置改變而變化。矩 陣Ro, T。表示拍攝標準圖像時攝像機坐標系Meo與世界坐標系Mw之間的變換 關系,々為一個實數(shù),表示比例關系,根據(jù)投影兒何關系,有如下式子成立A0Po=K[R。Tq]P (2)同理,設三維點P在另外一幅圖像上的像點坐標為pt,矩陣Rt, Tt表示拍 攝第二幅圖像時攝像機坐標系Met與世界坐標系Mw之間的變換關系,A為一個 實數(shù),表示比例關系,根據(jù)投影幾何關系,有如下式子成立/ltpt=K[RtTt]P (3)則合并公式(2)和(3),即可得出標準圖像上的像點pn和另外一幅圖像上 的像點Pt之間的變換關系,表示如下AtPt =;i0K[Rt Tt] 口(K[Rq T0])-、 (4) 其中,(K[RoTd)"表示對括號中的矩陣取逆運算。公式(4)表示的是當攝像機從標準位置和另外一個視角對同一個目標物體 進行拍攝時,目標上的一個三維點在標準圖像上的像點與它在另外一幅圖像上 的像點之間的變換關系,把公式(4)表示的關系從一個像點推廣到整幅圖像, 就可以得到從標準圖像變換到另外一幅圖像的變換關系。下面將推導如何用四參數(shù)(《^, Rr)來表示公式(4)中的R, T矩陣。 如圖(1)所示,A點在世界坐標系下的坐標可以用四參數(shù)(《0, fr)來表示如下A = (r cos ^ cos r cos ^ sin 6, r sin # 其中,0e( 0,90° ), 0, ^e( 0,360° ), r>0。設攝像機坐標系Mtt的三個坐標軸Xct,Zet的單位向量分別表示為^ ,j;和i^;,世界坐標系Mw的三個坐標軸Xw,Yw和Zw的單位向量分別表示為[;,'—O,A O.A一AB _ Jet — i , ni,AB = (一rcos-cosP,—rcos0sinP,-■^sin0)7"(6)(7)|AB| sin-其中,B點是由A點向Zw軸作垂線時,該垂線與Zw軸的交點,且B點坐標為B = (0,0,~^-)r sin-(9)由此,根據(jù)兩坐標系之間的變換與二者的各坐標軸單位向量之間的關系并結合 公式(6) - (8),可以將攝像機坐標系Met與世界坐標系Mw之間的變換關系表 示如下!0、('oJ"=RV|/JoJoJ"Jo*Ck0i k0 個3X3的矩陣,是用來表示攝像機繞攝像機坐標 系的Z軸進行旋轉的旋轉矩陣,并且具有以下形式cos^/siny 0 一si輝 cosy 0 0 0 1(11)由此,結合公式(4) - (10),即可以得到用四個參數(shù)(《0, R"來表示的從標準圖像到另外一幅圖像的變換關系AoPt = HPo其中,^=義/義。,如圖2中所示,H為兩幅圖像之間的變換關系矩陣,且有(12)<formula>formula see original document page 13</formula>(13)<formula>formula see original document page 13</formula>(15)且G, £和1^分別是在拍攝標準圖像時對應的攝像機坐標系M"的三個坐標 軸Xco,Yco和Zco的單位向量,這三個單位向量可以通過參數(shù)值(00=90° A=0° , K=0° , r=r。)來唯一表示;。表示的是拍攝標準圖像時攝像機距離目標物體平 面的距離,該距離需要預先進行測量并記錄。根據(jù)圖1所示,對應于拍攝標準 圖像時攝像機的空間位置的四個參數(shù)的值分別為0=^0=卯° , ^=^)=0° ,對四個參數(shù)W,^, R。賦予不同的數(shù)值,則對應于攝像機從不同的空間位置 對目標物體進行拍攝,則公式(12)屮的矩陣H的取值就會不同,將這些不同 的變換矩陣H作用于標準圖像后可以生成各種不同的樣本圖像,所生成的這些 樣本圖像就可以被用來完全模擬在相應的視角下拍攝的真實圖像。下面,以圖3-a所示的圖像作為標準圖像來實施本發(fā)明所述的樣本圖像生成 方法,并對其與己有方法生成的樣本圖像的對比結果進行說明。對四個參數(shù)(0, 0, Rr)賦予一組數(shù)值,并根據(jù)公式(13)計算出相應的變換 矩陣H,將變換矩陣H作用于圖3-a所示的標準圖像,可以生成一幅如圖5所 示的樣本圖像。圖3-b為針對與圖3-a中的同一物體在另外一個視角下拍攝的真實圖像。為了說明所生成的樣本圖像與圖3-b所示的真實圖像具有更高的相似程度,下面分 別采用兩種方法進行說明。方法一圖6-a為采用兩對直線(直線L,和L2,直線L3和")標識出標準 圖像中的矩形"福字畫"的兩對平行邊的示意圖,如圖6-a所示,直線L,與L2 平行,直線L3與U平行。圖6-b為采用兩對直線(直線L,和L2,直線L3和L》 標識出圖3-b所示圖像中的矩形"福字畫"的兩對邊的示意圖,由于圖3-b是從 另外一個角度對物體進行拍攝并且符合透視投影原理,因此如圖6-b所示,直線 L,與L2不平行,直線L3與L4不平行。圖7為采用兩對直線(直線L,和L2,直線L3和L4)標識出如圖4所示的 采用已有方法生成的樣本圖像中的矩形"福字畫"的兩對邊的示意圖。如圖7 所示,直線L,與L2平行,直線L3與L4平行。由此說明采用已有方法所生成的 樣本圖像不符合透視投影原理。圖8為采用兩對直線(直線"和L2,直線L3和L4)標識出如圖5所示的 采用本發(fā)明所述方法生成的樣本圖像中的矩形"福字畫"的兩對邊的示意圖。 如圖8所示,直線L,與L2不平行,直線L3與U不平行,這一現(xiàn)象與圖6七中 真實圖像中的現(xiàn)象一致。由此說明釆用本發(fā)明所述方法所生成的樣本圖像符合 透視投影原理的性質,與圖6-b所示的從一定視角拍攝的真實圖像具有很高的相 似度。方法二 SIFT特征點提取方法可以從圖像屮提取出最能夠表征圖像信息的 有代表性的像素點,在兩幅圖像中提取出SIFT特征點,并把同時出現(xiàn)在兩幅圖 像中的同一個特征點用紅色線相連接,連接正確的紅色線越多說明了兩幅圖像 的相似程度越高。如圖9-a所示,連接正確的紅色線的數(shù)量為32條,即上下兩 幅圖像中相同的SIFT特征點有32個;如圖9-b所示,連接正確的紅色線的數(shù)量 為268條,即上下兩幅圖像中相同的SIFT特征點有268個,達到了圖9-a中相 應數(shù)量的8倍多。以上對比結果說明采用本發(fā)明所述方法生成的樣本圖像與標 準圖像的相似程度遠高于采用己有方法生成的樣本圖像與標準圖像的相似程 度。以上對本發(fā)明所提供的基于一幅標準圖像生成各視角下樣本圖像的方法進 行了詳細介紹,文中對本發(fā)明的原理及實施方式進行了閘述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技
術人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發(fā)明的限制。
權利要求
1.一種基于一幅標準圖像生成各視角下樣本圖像的方法,其特征在于,包括以下步驟第一步,采用四個參數(shù)(θ,Φ,Ψ,r)來表征攝像機在對目標物體進行拍攝時所處的空間三維位置,四個參數(shù)的所有取值組合能夠覆蓋攝像機在三維空間中所處的所有位置,并且每一組取值都與空間的某一個位置唯一對應;第二步,在步驟一的基礎上,假設針對目標物體拍攝一幅標準圖像時攝像機的空間位置所對應的四個參數(shù)的一組取值為(θ0,Φ0,Ψ0,r0),該空間位置記為位置0,則目標物體所在的空間坐標系與標準圖像坐標系之間的變換關系可以由(θ0,Φ0,Ψ0,r0)來表示;同理,設攝像機在另外的某一個視角進行拍攝時的空間位置所對應的四個參數(shù)的一組取值為(θt,Φt,Ψt,rt),該空間位置記為位置t,則目標物體所在的空間坐標系與在該視角下拍攝的圖像坐標系之間的變換關系可以由(θt,Φt,Ψt,rt)來表示;由于兩幅圖像是針對同一空間下的同一目標物體進行拍攝,因此以上兩個由目標物體空間坐標系到圖像坐標系的變換關系中的物體空間坐標系為同一個,因此,由標準圖像坐標系到另外一幅圖像的坐標系之間的變換關系就可以由(θ0,Φ0,Ψ0,r0)和(θt,Φt,Ψt,rt)這兩組參數(shù)值來表示;第三步,在已知一幅標準圖像和一組參數(shù)值(θ0,Φ0,Ψ0,r0)的情況下,給四個參數(shù)(θ,Φ,Ψ,r)賦予不同于(θ0,Φ0,Ψ0,r0)的另外的一組值,例如(θt,Φt,Ψt,rt),則根據(jù)第二步就可以由(θ0,Φ0,Ψ0,r0)和(θt,Φt,Ψt,rt)計算出一個由標準圖像到另外一幅圖像的變換關系;將這一變換關系作用到標準圖像上之后,可以生成一幅樣本圖像;該樣本圖像就可以被用來完全模擬攝像機在位置t時對目標物體所拍攝的真實圖像;第四步,給四個參數(shù)(θ,Φ,Ψ,r)賦予任意組不同的值,記為(θi,Φi,Ψi,ri),可以得到各種由(θ0,Φ0,Ψ0,r0)和(θi,Φi,Ψi,ri)表示的由標準圖像到多個樣本圖像的變換關系,將這些變換作用到標準圖像上,就可以生成各種不同的樣本圖像,這些樣本圖像可以被用來模擬攝像機在與不同的參數(shù)值(θi,Φi,Ψi,ri)所對應的各個空間位置拍攝的真實圖像。
2. 如權利要求1所述的基于一幅標準圖像生成各視角下樣本圖像的方法, 其特征在于在步驟一中,使用的四個用來完全確定攝像機在對目標物體進行 拍攝時所處的空間三維位置的參數(shù)分別具有以下含義6為包含世界坐標系的Z軸以及攝像機坐標系的Z軸的平面與世界坐標系 的ZOX平面的夾角;0為攝像機坐標系的Z軸與世界坐標系的XOY平面的夾角;^為攝像機繞攝像機坐標系的Z軸做旋轉運動時的角度;r為攝像機與世界坐標系的原點之間的距離。
3. 如權利要求1所述的基于一幅標準圖像生成各視角下樣本圖像的方法, 其特征在于在步驟一中,使用的四個用來完全確定攝像機在對目標物體進行 拍攝時所處的空間三維位置的參數(shù)的取值范圍分別如下^E( 0,90° ),《(0,360° ), r〉0。
4. 如權利要求1所述的基于一幅標準圖像生成各視角下樣本圖像的方法,其特征在于在歩驟二中,由標準圖像坐標系到另外一幅圖像的坐標系之間的 變換關系可以通過以下公式表示<formula>formula see original document page 3</formula> (1)其中K是表示攝像機自身內部參數(shù)的矩陣,K矩陣的取值固定,不隨攝像機的 空間位置改變而變化;Rt, Tt表示拍攝第二幅圖像時攝像機坐標系與世界坐標 系的變換關系;R , Tc分別表示拍攝標準圖像時攝像機坐標系與世界坐標系的 變換關系,并且滿足<formula>formula see original document page 3</formula>且U ,"和keo分別表示在拍攝標準圖像時對應的攝像機坐標系的X軸,Y軸和 Z軸的單位向量,這三個單位向量可以通過參數(shù)值(00=90°烏=0° , K=0° , n》來唯一表示;"表示的是拍攝標準圖像時攝像機距離目標物體平面的距離, 該距離需要預先進行測量并記錄;G,乙和iC分別表示在拍攝第二幅圖像時對應的攝像機坐標系的x軸,Y軸和z軸的單位向量;g, j;和k分別表示世界坐標系的x軸,Y軸和z軸的單位向:
全文摘要
本發(fā)明涉及模式識別技術領域,特別是涉及一種基于一幅標準圖像生成各視角下樣本圖像的方法。本發(fā)明首先采用幾個參數(shù)來確定攝像機在對目標進行拍攝時所處的空間三維位置,這些參數(shù)的所有取值組合能夠覆蓋攝像機可能在三維空間中所處的所有位置,并且每一組取值都與空間的某一個位置唯一對應;接著用對應于兩個不同的攝像機空間位置的兩組不同參數(shù)來表示攝像機在這兩個位置下所拍攝的真實圖像之間的變換關系;然后將這一變換關系作用于在第一個攝像機位置所拍攝得到的真實圖像,就可以生成一幅樣本圖像。本發(fā)明所使用的圖像變換關系使得生成的樣本圖像可以完全模擬從對應視角拍攝得到的真實圖像,并且可以通過控制參數(shù)的取值,來生成所需的特定視角下的圖像。
文檔編號G06T11/00GK101661625SQ20091009383
公開日2010年3月3日 申請日期2009年9月22日 優(yōu)先權日2009年9月22日
發(fā)明者偉 劉, 越 劉, 林精敦, 王涌天, 郭俊偉, 靖 陳 申請人:北京理工大學