專利名稱:一種目標圖像搜索方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像分析和識別技術(shù)領(lǐng)域,特別是涉及一種基于上下文的目標圖像搜 索方法和系統(tǒng)。
背景技術(shù):
目前,在基于上下文的目標圖像搜索或位置的預(yù)測領(lǐng)域,Torralba使用全局上下 文特征對目標圖像的位置進行條件轉(zhuǎn)移概率建模,通過求取最大概率密度確定目標圖像的 位置。由于其采用全局特征而忽略了局部特征,因而對目標圖像的位置只能作出一個大概 的區(qū)域范圍判斷,不能做出精確的預(yù)測。針對這種問題,Ehinger和Paletta等人在上述粗 糙的預(yù)測范圍內(nèi)采用一個目標模板進行遍歷匹配和搜索。Kruppa和Bergboer等人采用一 個擴大了面積的包含局部上下文的目標模板在圖片表面進行遍歷匹配和搜索,通過局部上 下文確定目標圖像的位置。但以上幾種方法存在的問題主要有兩個方面(1)只使用全局上下文不足以精確 估計目標圖像的位置;(2)僅使用局部上下文也無法避免遍歷匹配這一機械耗時的搜索方 式。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種目標圖像搜索方法和系統(tǒng)。采用先全局上下文估計粗 略目標圖像位置、后局部上下文精確估計目標圖像位置的順序和策略,節(jié)省了上下文知識 表示和存儲數(shù)量,避免了機械耗時的遍歷式搜索,提高了目標圖像搜索速度和精度。為實現(xiàn)本發(fā)明的目的而提供的一種目標圖像搜索方法,所述方法,包括下列步 驟步驟100.在不同圖像的不同尺度下針對不同初始視點位置和預(yù)測待搜索目標圖 像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位置的距離進行比較,保存 其中相差較多的情況所對應(yīng)的上下文知識,以獲得目標圖像搜索模型;步驟200.輸入一個圖像,利用所述目標圖像搜索模型,在所述圖像的不同尺度下 預(yù)測待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像 上的位置。所述步驟100,包括下列步驟步驟110.輸入一個訓(xùn)練圖像Xi,i G [1,I];步驟120.以真實目標圖像中心在所述訓(xùn)練圖像Xi上的位置(x,y)為中心采樣尺 度s(s G [S,l])下的目標圖像,形成在所述訓(xùn)練圖像Xi上尺度為S的視野圖像VFis;步驟130.在所述視野圖像VFis上選擇一個初始視點{(xisp,yisp) p =廣P}, 并基于所述初始視點位置提取一個特征矢量Fis ;步驟140.計算所述真實目標圖像中心位置(x,y)距離所述初始視點(xisp,yisp) 的相對距離(Axisp, A yisp) = (x-xisp, y-yisp);并預(yù)測待搜索目標圖像中心距離所述初始視點(xisp, yisp)的相對距離(Axisp,,Ayisp,);步驟150.判斷所述相對距離(Axisp', Ayisp’ )與(Axisp, Ayisp)是否相差 較大,若是,則追加存儲當前新的上下文知識{Fis, (Axisp, Ayisp)},并返回步驟130 ;否 則,返回步驟130 ;步驟160.判斷S是否達到預(yù)設(shè)值,若是,則執(zhí)行步驟170 ;否則,返回步驟120。步驟170.判斷I值是否達到預(yù)設(shè)值,若是,則結(jié)束模型訓(xùn)練;否則返回步驟110。所述步驟140,包括下列步驟步驟141.根據(jù)存儲的上下文知識{Fis,(Axisp,Ayisp)},通過內(nèi)積運算計算當前 特征矢量Fis與存儲的Fis的相似性系數(shù){ck = <Fis,存儲的Fis>|k= 11},選出K個最相近 的上下文{Fk,(Axk, Ayk) |k= 11};步驟142.將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一個都除 以ck’之和得到權(quán)重{wk|k= 11};步驟143.預(yù)測待搜索目標圖像中心位置(xisp’,yisp')距離當前初始視點 (xisp, yisp)的相對距離是(Axisp,, Ayisp,) = ( E wkAxk, E wk A yk) k = 1 K}。所述步驟200,包括下列步驟步驟210.輸入一個圖像并任意選定所述圖像上的一點作為待搜索的目標圖像中 心的位置(x,,y,);步驟220.以(x’,y’)為中心,采樣尺度s(s G [S,1])下的視野圖像VFis ;步驟230.在當前視野圖像VFs上提取一個特征矢量Fis’ ;步驟240.根據(jù)預(yù)先存儲的上下文知識{Fis,(Axisp,Ayisp) |i =廣I,s = S 1, P = 1>},通過內(nèi)積運算計算提取的特征矢量Fis’與Fis的相似性系數(shù){ck = <Fis’,F(xiàn)is>|k =11},選出K個最相近的上下文{Fk,(Axk, Ayk) k = 1 K};步驟250.將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一個都除 以ck’之和得到權(quán)重{wk|k= 11}步驟260.計算預(yù)測待搜索目標圖像中心(x’,y’ )的相對位置是(Ax,Ay)= (E wkAxk,E wkAyk) |k= 11},并存儲;步驟270.判斷所述預(yù)測值(AX,Ay)和上一次的預(yù)測值相比變化是否小于一閾 值,若是,則執(zhí)行步驟280 ;否則,返回步驟230 ;步驟280.更新目標圖像中心的相對位置預(yù)測為(x,y) = (X,+AX,y’ + A y);步驟290.判斷S是否達到一預(yù)設(shè)值,若是,則所述待搜索目標圖像中心的相對位 置為(X,y) = (X’ +AX,y’ +Ay);否則,返回步驟 220。為實現(xiàn)本發(fā)明的目的,還提供一種目標圖像搜索系統(tǒng),所述系統(tǒng),包括目標圖像搜索模型訓(xùn)練模塊,用于在不同圖像的不同尺度下針對不同初始視點位 置和預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位置 的距離進行比較,保存其中相差較多的情況所對應(yīng)的上下文知識;目標圖像搜索模塊,用于利用所述目標圖像搜索模型,在所述圖像的不同尺度下 預(yù)測待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像 上的位置。所述目標圖像搜索模型訓(xùn)練模塊,包括
圖像采集模塊,用于采集多個具有顯著特征的訓(xùn)練圖像Xi,i G [1,I];視野圖像采集模塊,以真實目標圖像中心在所述訓(xùn)練圖像&上的位置(x,y)為中 心采樣尺度s(s G [S,l])下的目標圖像,形成在所述訓(xùn)練圖像&上尺度為S的視野圖像 VFis;特征矢量提取模塊,在所述視野圖像VFis上選擇一個初始視點{(xisp,yisp) |p =,并基于所述初始視點位置提取一個特征矢量Fis ;距離計算模塊,用于計算所述真實目標圖像中心位置(x,y)距離所述初始視點 (xisp, yisp)的相對距離(Axisp, A yisp) = (x-xisp, y-yisp);并預(yù)測待搜索目標圖像 中心距離所述初始視點(xiSp,yiSp)的相對距離(Axisp’,A yisp');判斷模塊,用于判斷所述相對距離(Axisp,, A yisp’ )與(Axisp, A yisp)是否 相差較大,若是,則追加存儲當前新的上下文知識{Fis,(Axisp, A yisp)},并觸發(fā)特征矢 量提取模塊;否則,觸發(fā)特征矢量提取模塊;閾值判斷子模塊,用于判斷S是否達到預(yù)設(shè)值,若是,則進一步判斷判斷I值是否 達到預(yù)設(shè)值,若是,則結(jié)束模型訓(xùn)練;否則觸發(fā)圖像采集模塊;若S沒有達到預(yù)設(shè)值則觸發(fā) 視野圖像采集模塊。所述距離計算模塊,包括上下文選擇模塊.根據(jù)存儲的上下文知識{Fis( Axisp,Ayisp)},通過內(nèi)積運算計算 當前特征矢量Fis與存儲的Fis的相似性系數(shù){ck = <Fis,存儲的Fis>|k= 11},選出K個最 相近的上下文{Fk,(Axk, Ayk) |k = 11};權(quán)重值計算模塊,用于將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的 每一個都除以ck,之和得到權(quán)重{wk|k= 11};位置預(yù)測模塊,用于預(yù)測待搜索目標圖像中心位置(xisp’,yisp’ )距離當前初 始視點(xisp, yisp)的相對距離是(Axisp,, Ayisp,) = ( E wkAxk, E wk A yk) k = 1 K}。所述目標圖像搜索模塊,包括圖像輸入模塊,用于輸入一個圖像并任意選定所述圖像上的一點作為待搜索的目 標圖像中心的位置(x,,y,);視野圖像采樣模塊,用于以(x’,y’ )為中心,采樣尺度s(s G [S,l])下的視野圖 像 VFis ;特征矢量提取子模塊,用于在當前視野圖像VFS上提取一個特征矢量Fis’ ;距離計算子模塊,用于根據(jù)所述目標圖像搜索模型訓(xùn)練模塊中存儲的上下文知識 {Fis,(Axisp,Ayisp)|i = n,s = S l,p =廣P},通過內(nèi)積運算計算提取的特征矢量Fis,與 Fis的相似性系數(shù){ck = <Fis,,F(xiàn)is>|k = 11},選出K個最相近的上下文{Fk,(Axk, A yk) k =1 K};權(quán)重值計算子模塊,用于將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中 的每一個都除以ck,之和得到權(quán)重{wk|k= 11}目標圖像位置計算模塊,用于計算預(yù)測待搜索目標圖像中心(x’,y’ )的相對位置 是(AX,Ay) = ( E wkAxk, E wkAyk) |k= 1 K},并存儲;閾值判斷模塊,用于判斷所述預(yù)測值(AX,Ay)和上一次的預(yù)測值相比變化是否小于一閾值,若是,則觸發(fā)更新模塊;否則,觸發(fā)特征矢量提取子模塊;更新模塊,用于更新目標圖像中心的相對位置預(yù)測為(x,y) = (x’ + Ax,y’ + Ay);預(yù)設(shè)值判斷子模塊,用于判斷S是否達到一預(yù)設(shè)值,若是,則所述待搜索目標圖像 中心的相對位置為(x,y) = (x,+AX,y,+Ay);否則,觸發(fā)視野圖像采樣模塊。本發(fā)明的有益效果是本發(fā)明采用全局上下文和局部上下文知識的順序結(jié)合策略 和啟發(fā)式預(yù)測機制,節(jié)省了上下文知識表示和存儲數(shù)量,避免了機械耗時的遍歷式搜索,提 高了目標搜索速度和精度。
圖1是本發(fā)明的目標圖像搜索方法的步驟流程圖;圖2是本發(fā)明中訓(xùn)練目標圖像搜索模型的步驟流程圖;圖3是本發(fā)明中預(yù)測待搜索目標圖像中心距離初始視點的相對距離的步驟流程 圖;圖4是本發(fā)明中利用所述目標圖像搜索模型搜索目標圖像位置的步驟流程圖;圖5是本發(fā)明的目標圖像搜索系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對 本發(fā)明的一種目標圖像搜索方法和系統(tǒng)進行進一步詳細說明。應(yīng)當理解,此處所描述的具 體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。本發(fā)明的一種目標圖像搜索方法和系統(tǒng),采用先全局上下文估計粗略目標圖像位 置、后局部上下文精確估計目標圖像位置的順序和策略,以及啟發(fā)式預(yù)測機制,節(jié)省了上下 文知識表示和存儲數(shù)量,避免了機械耗時的遍歷式搜索,提高了目標圖像搜索速度和精度。下面結(jié)合上述目標詳細介紹本發(fā)明的一種目標圖像搜索方法,圖1是本發(fā)明的目 標圖像搜索方法的步驟流程圖,如圖1所示,所述方法,包括下列步驟步驟100.訓(xùn)練目標圖像搜索模型;在不同圖像的不同尺度下針對不同初始視點 位置和預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位 置的距離進行比較,保存其中相差較多的情況所對應(yīng)的上下文知識,以獲得目標圖像搜索 模型;圖2是本發(fā)明中訓(xùn)練目標圖像搜索模型的步驟流程圖,如圖2所示,所述步驟100, 包括下列步驟步驟110.輸入一個訓(xùn)練圖像Xp i G [1,I];步驟120.以真實目標圖像中心在所述訓(xùn)練圖像&上的位置(x,y)為中心采樣尺 度s(s G [S,l])下的目標圖像,形成在所述訓(xùn)練圖像&上尺度為S的視野圖像VFis;步驟130.在所述視野圖像VFis上選擇一個初始視點{(xisp, yisp) | p =廣P},并基 于所述初始視點位置提取一個特征矢量Fis ;步驟140.計算所述真實目標圖像中心位置(x,y)距離所述初始視點(xisp,yisp) 的相對距離(Axisp,Ayisp) = (x-xisp,y-yisp);并采用以下三個步驟預(yù)測待搜索目標圖像中 心距離所述初始視點(xisp,yisp)的相對距離(Axisp ’,Ayisp ’),即預(yù)測出的待搜索目標圖像中心位置為(xisp,,yisp,) = (xisp+Axisp,,yisp+Ayisp,);圖3是本發(fā)明中預(yù)測待搜索目標圖像中心距離初始視點的相對距離的步驟流程 圖,如圖3所示,所述步驟140,包括下列步驟步驟141.根據(jù)存儲的上下文知識{Fis,(Axisp,Ayisp)},通過內(nèi)積運算計算當前 特征矢量Fis與存儲的Fis的相似性系數(shù){ck = <Fis,存儲的Fis>|k= 11},選出K個最相近 的上下文{Fk,(Axk, Ayk) |k= 11};步驟142.將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一個都除 以ck’之和得到權(quán)重{wk|k= 11};步驟143.預(yù)測待搜索目標圖像中心位置(xisp’,yisp’ )距離當前初始視點(xisp, Yisp)的相對距離是(Axisp,,Ayisp,) = ( E wkAxk,E wkAyk) k= 1 K};步驟150.判斷所述相對距離(Axisp,,Ayisp,)與(Axisp, A yisp)是否相差較大, 若是,則追加存儲當前新的上下文知識{Fis,( A xisp, A yisp)},并返回步驟130 ;否則,返回步 驟 130 ;步驟160.判斷S是否達到預(yù)設(shè)值,若是,則執(zhí)行步驟170 ;否則,返回步驟120。步驟170.判斷I值是否達到預(yù)設(shè)值,若是,則結(jié)束模型訓(xùn)練;否則返回步驟110。上述訓(xùn)練目標圖像搜索模型的方法,是在不同圖像的不同尺度下針對不同初始視 點位置與預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置與真實目標圖像中心 位置的距離進行比較,選擇相差較多的情況所對應(yīng)的上下文知識存入模型中,補充未知的 上下文知識,以獲得更優(yōu)的目標圖像搜索模型。步驟200.輸入一個圖像,利用所述目標圖像搜索模型,在所述圖像的不同尺度下 預(yù)測待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像 上的位置。圖4是本發(fā)明中利用所述目標圖像搜索模型搜索目標圖像位置的步驟流程圖,如 圖4所示,所述步驟200,包括下列步驟步驟210.輸入一個圖像并任意選定所述圖像上的一點作為待搜索的目標圖像中 心的位置(x,,y,);步驟220.以(x’,y’)為中心,采樣尺度s(s e [S,1])下的視野圖像VFis ;步驟230.在當前視野圖像VFS上提取一個特征矢量Fis’ ;步驟240.根據(jù)預(yù)先存儲的上下文知識{Fis,( Axisp,A yisp) | i =廣I,s = S 1,p =廣P},通過內(nèi)積運算計算提取的特征矢量Fis’與Fis的相似性系數(shù){Ck = <Fis,,F(xiàn)is>|k = 11},選出K個最相近的上下文{Fk,(Axk, Ayk) |k= 1 K};步驟250.將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一個都除 以ck’之和得到權(quán)重{wk|k= 11}步驟260.預(yù)測待搜索目標圖像中心(x’,y’)的相對位置是(Ax,Ay)= (E wkAxk,E wkAyk) |k= 11},并存儲;步驟270.判斷所述預(yù)測值(AX,Ay)和上一次的預(yù)測值相比變化是否小于一閾 值,若是,則執(zhí)行步驟280 ;否則,返回步驟230 ;本步驟中所述預(yù)測值(AX,Ay)和上一次的預(yù)測值相比變化小于一閾值,說明根 據(jù)在當前尺度S下提取的特征矢量計算得到的待搜索目標圖像中心的位置相對準確,可以結(jié)束當前尺度S下待搜索目標圖像中心的位置的搜索。步驟280.更新目標圖像中心的相對位置預(yù)測為(x,y) = (χ,+Δχ,γ' +Δγ);步驟290.判斷S是否達到一預(yù)設(shè)值,若是,則所述待搜索目標圖像中心的相對位 置為(X,y) = (χ' +Δχ,γ' +ΔΥ);否則,返回步驟 230。相應(yīng)于本發(fā)明的一種目標圖像搜索方法,還提供一種目標圖像搜索系統(tǒng),圖5是 本發(fā)明的目標圖像搜索系統(tǒng)的結(jié)構(gòu)示意圖,如圖5所示,所述系統(tǒng)10,包括目標圖像搜索模型訓(xùn)練模塊1,用于在不同圖像的不同尺度下針對不同初始視點 位置和預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位 置的距離進行比較,保存其中相差較多的情況所對應(yīng)的上下文知識;目標圖像搜索模塊2,用于利用所述目標圖像搜索模型,在所述圖像的不同尺度下 預(yù)測待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像 上的位置。其中,所述目標圖像搜索模型訓(xùn)練模塊1,包括圖像采集模塊11,用于采集多個具有顯著特征的訓(xùn)練圖像Xi, i e [1,I];視野圖像采集模塊12,以真實目標圖像中心在所述訓(xùn)練圖像&上的位置(x,y)為 中心采樣尺度s(s e [S,l])下的目標圖像,形成在所述訓(xùn)練圖像Xi上尺度為S的視野圖 像 VFis ;特征矢量提取模塊13,在所述視野圖像VFis上選擇一個初始視點{(xisp, yisp) |p = 1 P},并基于所述初始視點位置提取一個特征矢量Fis ;距離計算模塊14,用于計算所述真實目標圖像中心位置(x,y)距離所述初始視點 (xisp, yisp)的相對距離(Δ xisp, Δ yisp) = (x-xisp, y-yisp);并預(yù)測待搜索目標圖像 中心距離所述初始視點(xisp,yisp)的相對距離(Axisp’,Ayisp');作為一種可實施方式,所述距離計算模塊14,包括上下文選擇模塊141.根據(jù)存儲的上下文知識{Fis,(Axisp, Δ yisp)},通過內(nèi)積 運算計算當前特征矢量Fis與存儲的Fis的相似性系數(shù){ck = <Fis,存儲的Fis> I k = 1 K},選出K個最相近的上下文{Fk,( Δ xk,Δ yk) k = 1 K};權(quán)重值計算模塊142,用于將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中 的每一個都除以ck’之和得到權(quán)重Iwk Ik = 1 K};位置預(yù)測模塊143,用于預(yù)測待搜索目標圖像中心位置(xisp’,yisp’ )距離當前 初始視點(xisp,yisp)的相對距離是(Δ xisp,,Δ yisp,)= ( Σ wkAxk, Σ wk Δ yk) |k =
1 K}。判斷模塊15,用于判斷所述相對距離(Axisp', Δ yisp’)與(Δ xisp, Δ yisp)是 否相差較大,若是,則追加存儲當前新的上下文知識{Fis,(Axisp, Ayisp)},并觸發(fā)特征 矢量提取模塊13 ;否則,觸發(fā)特征矢量提取模塊13 ;閾值判斷子模塊16,用于判斷S是否達到預(yù)設(shè)值,若是,則進一步判斷判斷I值是 否達到預(yù)設(shè)值,若是,則結(jié)束模型訓(xùn)練;否則觸發(fā)圖像采集模塊11 ;若S沒有達到預(yù)設(shè)值則 觸發(fā)視野圖像采集模塊12。其中,所述目標圖像搜索模塊2,包括圖像輸入模塊21,用于輸入一個圖像并任意選定所述圖像上的一點作為待搜索的目標圖像中心的位置(x,,y,);視野圖像采樣模塊22,用于以(x’,y’)為中心,采樣尺度s(s e [S,l])下的視野 圖像VFis ;特征矢量提取子模塊23,用于在當前視野圖像VFs上提取一個特征矢量Fis’ ;距離計算子模塊24,用于根據(jù)所述目標圖像搜索模型訓(xùn)練模塊1中存儲的上下文 知識{Fis,(Axisp,Ayisp) |i = Γ ,8 = S l,p =廣P},通過內(nèi)積運算計算提取的特征矢量 Fis,與Fis的相似性系數(shù)Ick = <Fis,,F(xiàn)is>|k= 11},選出K個最相近的上下文{Fk,(Axk, Ayk) Ik=TKj ;權(quán)重值計算子模塊25,用于將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’ 中的每一個都除以Ck’之和得到權(quán)重IwkIk = ΓΚ}目標圖像位置計算模塊26,用于計算預(yù)測待搜索目標圖像中心(x’,y’)的相對位 置是(ΔΧ,Δγ) = ( Σ WkAxk, Σ WkAyk) |k= 1 Κ},并存儲;閾值判斷模塊27,用于判斷所述預(yù)測值(ΔΧ,Ay)和上一次的預(yù)測值相比變化是 否小于一閾值,若是,則觸發(fā)更新模塊28 ;否則,觸發(fā)特征矢量提取子模塊23 ;更新模塊28,用于更新目標圖像中心的相對位置預(yù)測為(x,y) = (χ’+Δχ, y,+ Ay);預(yù)設(shè)值判斷子模塊29,用于判斷S是否達到一預(yù)設(shè)值,若是,則所述待搜索目標圖 像中心的相對位置為(x,y) = (X’ +Ax,y’ +Ay);否則,觸發(fā)視野圖像采樣模塊22。較佳地,在實際操作時,對于目標圖像搜索模型訓(xùn)練模塊和目標圖像搜索模塊中 一些實現(xiàn)相同功能的模塊,可以僅由一個模塊完成。本發(fā)明的有益效果在于本發(fā)明采用全局上下文和局部上下文知識的順序結(jié)合策略和啟發(fā)式預(yù)測機制,節(jié) 省了上下文知識表示和存儲數(shù)量,避免了機械耗時的遍歷式搜索,提高了目標搜索速度和 精度。通過結(jié)合附圖對本發(fā)明具體實施例的描述,本發(fā)明的其它方面及特征對本領(lǐng)域的 技術(shù)人員而言是顯而易見的。以上對本發(fā)明的具體實施例進行了描述和說明,這些實施例應(yīng)被認為其只是示例 性的,并不用于對本發(fā)明進行限制,本發(fā)明應(yīng)根據(jù)所附的權(quán)利要求進行解釋。
權(quán)利要求
一種目標圖像搜索方法,其特征在于,所述方法,包括下列步驟步驟100.在不同圖像的不同尺度下針對不同初始視點位置和預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位置的距離進行比較,保存其中相差較多的情況所對應(yīng)的上下文知識,以獲得目標圖像搜索模型;步驟200.輸入一個圖像,利用所述目標圖像搜索模型,在所述圖像的不同尺度下預(yù)測待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像上的位置。
2.根據(jù)權(quán)利要求1所述的目標圖像搜索方法,其特征在于,所述步驟100,包括下列步驟步驟110.輸入一個訓(xùn)練圖像Xi,i G [1,I];步驟120.以真實目標圖像中心在所述訓(xùn)練圖像Xii的位置(X,y)為中心采樣尺度 s(s G [s,l])下的目標圖像,形成在所述訓(xùn)練圖像&上尺度為S的視野圖像VFis;步驟130.在所述視野圖像VFis上選擇一個初始視點{(xisp,yisp) |p =廣P},并基于所 述初始視點位置提取一個特征矢量Fis ;步驟140.計算所述真實目標圖像中心位置(x,y)距離所述初始視點(xisp,yisp)的 相對距離(Axisp, A yisp) = (x-xisp, y-yisp);并預(yù)測待搜索目標圖像中心距離所述初 始視點(xisp, yisp)的相對距離(Axisp', A yisp,);步驟150.判斷所述相對距離(Axisp', A yisp’)與(Axisp, A yisp)是否相差較大, 若是,則追加存儲當前新的上下文知識{Fis,(Axisp, A yisp)},并返回步驟130;否則,返回 步驟130 ;步驟160.判斷S是否達到預(yù)設(shè)值,若是,則執(zhí)行步驟170 ;否則,返回步驟120。 步驟170.判斷I值是否達到預(yù)設(shè)值,若是,則結(jié)束模型訓(xùn)練;否則返回步驟110。
3.根據(jù)權(quán)利要求2所述的目標圖像搜索方法,其特征在于,所述步驟140,包括下列步驟步驟141.根據(jù)存儲的上下文知識{Fis,(Axisp, A yisp)},通過內(nèi)積運算計算當前特征 矢量Fis與存儲的Fis的相似性系數(shù){ck = <Fis,存儲的Fis>|k= 11},選出K個最相近的上 下文{Fk,(Axk, A yk) | k = 1 K};步驟142.將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一個都除以ck’ 之和得到權(quán)重{wk|k = 11};步驟143.預(yù)測待搜索目標圖像中心位置(xisp’,yisp’ )距離當前初始視點(xisp, yisp)的相對距離是(Axisp,, A yisp,) = ( E wkAxk, E wk A yk) k = 1 K}。
4.根據(jù)權(quán)利要求1所述的目標圖像搜索方法,其特征在于,所述步驟200,包括下列步驟步驟210.輸入一個圖像并任意選定所述圖像上的一點作為待搜索的目標圖像中心的 位置(x,,y,);步驟220.以(x’,y’)為中心,采樣尺度s(s e [S,1])下的視野圖像VFis ; 步驟230.在當前視野圖像VFS上提取一個特征矢量Fis’ ;步驟240.根據(jù)預(yù)先存儲的上下文知識{Fis,(Axisp, Ayisp) |i =廣I,s = S 1,p = 廣P},通過內(nèi)積運算計算提取的特征矢量Fis’與Fis的相似性系數(shù){ck = <Fis,,F(xiàn)is>|k =11},選出K個最相近的上下文{Fk,(Axk, Ayk) |k= 1 K};步驟250.將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一個都除以ck’ 之和得到權(quán)重{wk|k = 11};步驟260.計算預(yù)測待搜索目標圖像中心(x’,y’)的相對位置是(Ax,Ay)= (E wkAxk,E wkAyk) |k= 11},并存儲;步驟270.判斷所述預(yù)測值(AX,Ay)和上一次的預(yù)測值相比變化是否小于一閾值,若 是,則執(zhí)行步驟280 ;否則,返回步驟230 ;步驟280.更新目標圖像中心的相對位置預(yù)測為(X,y) = (X’ +AX,y’ +Ay); 步驟290.判斷S是否達到一預(yù)設(shè)值,若是,則所述待搜索目標圖像中心的相對位置為 (x,y) = (x’ +Ax,y' +Ay);否則,返回步驟 220。
5.一種目標圖像搜索系統(tǒng),其特征在于,所述系統(tǒng),包括目標圖像搜索模型訓(xùn)練模塊,用于在不同圖像的不同尺度下針對不同初始視點位置和 預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位置的距 離進行比較,保存其中相差較多的情況所對應(yīng)的上下文知識;目標圖像搜索模塊,用于利用所述目標圖像搜索模型,在所述圖像的不同尺度下預(yù)測 待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像上的 位置。
6.根據(jù)權(quán)利要求5所述的目標圖像搜索系統(tǒng),其特征在于,所述目標圖像搜索模型訓(xùn) 練模塊,包括圖像采集模塊,用于采集多個具有顯著特征的訓(xùn)練圖像X” i G [1,I]; 視野圖像采集模塊,以真實目標圖像中心在所述訓(xùn)練圖像&上的位置(x,y)為中心采 樣尺度s(s G [S,l])下的目標圖像,形成在所述訓(xùn)練圖像&上尺度為S的視野圖像VFis;特征矢量提取模塊,在所述視野圖像VFis上選擇一個初始視點{(xisp,yisp) |p = , 并基于所述初始視點位置提取一個特征矢量Fis ;距離計算模塊,用于計算所述真實目標圖像中心位置(x,y)距離所述初始視點(xisp, yisp)的相對距離(Axisp, A yisp) = (x-xisp, y-yisp);并預(yù)測待搜索目標圖像中心距 離所述初始視點(xisp, yisp)的相對距離(Axisp', A yisp,);判斷模塊,用于判斷所述相對距離(Axisp', A yisp’ )與(Axisp, A yisp)是否相差 較大,若是,則追加存儲當前新的上下文知識{Fis,(Axisp, A yisp)},并觸發(fā)特征矢量提 取模塊;否則,觸發(fā)特征矢量提取模塊;閾值判斷子模塊,用于判斷S是否達到預(yù)設(shè)值,若是,則進一步判斷判斷I值是否達到 預(yù)設(shè)值,若是,則結(jié)束模型訓(xùn)練;否則觸發(fā)圖像采集模塊;若S沒有達到預(yù)設(shè)值則觸發(fā)視野 圖像采集模塊。
7.根據(jù)權(quán)利要求6所述的目標圖像搜索系統(tǒng),其特征在于,所述距離計算模塊,包括 上下文選擇模塊.根據(jù)存儲的上下文知識{Fis,(Axisp, Ayisp)},通過內(nèi)積運算計算當前特征矢量Fis與存儲的Fis的相似性系數(shù){ck = <Fis,存儲的Fis>|k= 11},選出K個最相 近的上下文{Fk,(Axk, Ayk) |k = 11};權(quán)重值計算模塊,用于將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每一 個都除以ck,之和得到權(quán)重{wk|k= 11};位置預(yù)測模塊,用于預(yù)測待搜索目標圖像中心位置(Xisp’,yisp’ )距離當前初始視點 (xisp, yisp)的相對距離是(Axisp,,Ayisp,) = ( E wkAxk, E wk A yk) k = 1 K}。 8.根據(jù)權(quán)利要求6所述的目標圖像搜索系統(tǒng),其特征在于,所述目標圖像搜索模塊,包括圖像輸入模塊,用于輸入一個圖像并任意選定所述圖像上的一點作為待搜索的目標圖 像中心的位置(x,,y,);視野圖像采樣模塊,用于以(x’,r)為中心,采樣尺度s(s G [S,l])下的視野圖像 VFis;特征矢量提取子模塊,用于在當前視野圖像VFS上提取一個特征矢量Fis’ ; 距離計算子模塊,用于根據(jù)所述目標圖像搜索模型訓(xùn)練模塊中存儲的上下文知識{Fis, (AXisp,Ayisp) |i = n,s = S l,p =廣P},通過內(nèi)積運算計算提取的特征矢量Fis,與Fis 的相似性系數(shù){ck = <Fis,,F(xiàn)is> | k = 1 K},選出K個最相近的上下文{Fk,(Axk, A yk) | k = 1 K};權(quán)重值計算子模塊,用于將選出的K個最相近的上下文對應(yīng)的相似性系數(shù)ck’中的每 一個都除以ck,之和得到權(quán)重{wk|k= 11}目標圖像位置計算模塊,用于計算預(yù)測待搜索目標圖像中心(x’,r)的相對位置是 (Ax, A y) = ( E wkAxk, E wkAyk) k = 1 K},并存儲;閾值判斷模塊,用于判斷所述預(yù)測值(Ax,Ay)和上一次的預(yù)測值相比變化是否小于 一閾值,若是,則觸發(fā)更新模塊;否則,觸發(fā)特征矢量提取子模塊;更新模塊,用于更新目標圖像中心的相對位置預(yù)測為(x,y) = (x’ +Ax,y’ +Ay); 預(yù)設(shè)值判斷子模塊,用于判斷S是否達到一預(yù)設(shè)值,若是,則所述待搜索目標圖像中心 的相對位置為(x,y) = (X,+AX,y,+ A y);否則,觸發(fā)視野圖像采樣模塊。
全文摘要
本發(fā)明公開了一種目標圖像搜索方法和系統(tǒng)。所述方法,包括下列步驟在不同圖像的不同尺度下針對不同初始視點位置和預(yù)測待搜索目標圖像中心位置的距離,與相應(yīng)初始視點位置和真實目標圖像中心位置的距離進行比較,保存其中相差較多的情況所對應(yīng)的上下文知識,以獲得目標圖像搜索模型;輸入一個圖像,利用所述目標圖像搜索模型,在所述圖像的不同尺度下預(yù)測待搜索目標圖像中心的相對位置并保存,以獲得準確的待搜索的目標圖像在所述圖像上的位置。
文檔編號G06F17/30GK101923575SQ201010269299
公開日2010年12月22日 申請日期2010年8月31日 優(yōu)先權(quán)日2010年8月31日
發(fā)明者卿來云, 苗軍, 陳熙霖, 高文 申請人:中國科學(xué)院計算技術(shù)研究所