專利名稱:識別圖像中特定對象的方法以及使用該方法的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理和對象檢測領(lǐng)域,涉及一種識別圖像中特定對象的方法和系統(tǒng)。更具體地說,本發(fā)明提供了一種基于視覺采用兩階段來識別圖像中特定對象的方法以及使用該方法的系統(tǒng)。
背景技術(shù):
基于視覺的兩階段對象檢測和識別的方法大體遵循如下步驟輸入圖像- >生成假設(shè)的包含所要檢測對象的結(jié)果(以下稱為假設(shè)結(jié)果)_ >驗證假設(shè)結(jié)果- >生成檢測結(jié)果。生成假設(shè)結(jié)果的過程是在圖像中找到可能的待識別特定對象(例如,人、車或其他動物等)所在區(qū)域,而驗證假設(shè)結(jié)果則是對每個假設(shè)結(jié)果進(jìn)行檢驗以確認(rèn)其正確性,因此稱之為“兩階段”的方法。通常在假設(shè)結(jié)果生成和假設(shè)結(jié)果驗證階段都有不同的方法可以應(yīng)用,這在圖像識別領(lǐng)域為公知技術(shù),因此不在此贅述。在現(xiàn)有技術(shù)“Paper-UsingSegmentation to Verify Object Hypotheses (ToyotaTechnological Institute at Chicago, CVPR 2007) ” 中就應(yīng)用了假設(shè)生成 + 假設(shè)驗證的方法進(jìn)行對象檢測。在假設(shè)生成階段,使用了滑動窗口模板分類器得到候選假設(shè)及分割,以便在假設(shè)驗證階段進(jìn)行驗證。在每個檢測到的假設(shè)結(jié)果所在的窗口,生成放大的窗口以檢查相關(guān)的圖像信息,但并沒有其他的調(diào)整窗口區(qū)域的操作。專利US20060050933A1描述了一個人臉識別的方法用來判斷一幅圖像是否為人臉圖像。它集成了人臉,膚色及虹膜的檢測。其中提到了在皮膚特征提取時,有皮膚區(qū)域的調(diào)整操作,但并沒有具體的操作步驟。這種區(qū)域調(diào)整針對的是人臉檢測結(jié)果窗口。專利US7853072B2同樣遵循了假設(shè)結(jié)果生成+假設(shè)結(jié)果驗證的模式在圖像中檢測靜態(tài)物體。該方法利用“注意力焦點”機(jī)制識別圖像區(qū)域,生成假設(shè)。然后通過擴(kuò)展基于HOG的SVM分類器進(jìn)行假設(shè)驗證,得到最終檢測結(jié)果。在該專利中并沒有提及窗口調(diào)整問題。通常來講,許多對象檢測方法都采用上述兩階段的方法在圖像中檢測對象。在假設(shè)驗證的階段,驗證通常僅在第一階段得到的窗口內(nèi)進(jìn)行,或者簡單地對窗口區(qū)域進(jìn)行擴(kuò)大,判定檢測到的對象是否正確。然而,現(xiàn)有的各種識別方法誤檢率比較高。
發(fā)明內(nèi)容
為了解決上面所提到的現(xiàn)有技術(shù)中的這些問題,本發(fā)明對現(xiàn)有技術(shù)的各種兩階段識別方法進(jìn)行研究,對于各種兩階段識別方法的假設(shè)結(jié)果,發(fā)明人采用了廣泛采取的評估方法 PASCAL Challenge Evaluation Criteria 方法(The 2005 PASCAL VisualObject Classes Challenge,網(wǎng)址 http: //pascal I in. ecs. soton. ac. uk/challenges/VOC/voc2005/chapter. pdf)來評判其正確性。所述 PASCAL Challenge Evaluation Criteria方法具體描述如下利用如下公式計算預(yù)測窗口(即假設(shè)窗口)Wp與相應(yīng)的最近ground truth窗口Wgt之間的重合度R。
權(quán)利要求
1.一種識別圖像中特定對象的方法,包括 接收圖像輸入; 基于預(yù)先設(shè)定的特定對象的特定特征,通過檢測階段的視覺方法,檢測所接收圖像中的假設(shè)特定對象,并生成包含假設(shè)特定對象的包圍盒窗口 ; 針對每個所獲得的包圍盒窗口,通過對所述窗口進(jìn)行縮放處理以及對經(jīng)過縮放處理后的窗口進(jìn)行移動處理,從而獲得與所獲得的包圍盒窗口相關(guān)聯(lián)的相關(guān)窗口 ;以及 通過驗證階段的視覺方法,計算每個與所獲得的包圍盒窗口相關(guān)聯(lián)的相關(guān)窗口的置信度,并將具有最大置信度的相關(guān)窗口作為被驗證的包含特定對象的結(jié)果輸出。
2.如權(quán)利要求I所述識別圖像中特定對象的方法,其中,所述驗證階段的視覺方法是一種不同于所述檢測階段的視覺方法的視覺方法。
3.如權(quán)利要求I所述識別圖像中特定對象的方法,其中所述通過對所述包圍盒窗口進(jìn)行縮放處理包括放大所述包圍盒窗口、縮小所述包圍盒窗口以及保持所述包圍盒窗口不變。
4.如權(quán)利要求3所述識別圖像中特定對象的方法,其中,所述對經(jīng)過縮放處理后的窗口進(jìn)行移動處理包括將經(jīng)過縮放處理后的窗口沿著預(yù)定的方向移動預(yù)定的距離從而獲得相關(guān)窗口。
5.如權(quán)利要求4所述識別圖像中特定對象的方法,其中 在對所述包圍盒窗口進(jìn)行縮放處理過程中,保持所述包圍盒窗口的中心位置和形狀不變;以及 在對經(jīng)過縮放處理后的窗口進(jìn)行移動處理過程中,保持縮放處理后的窗口的尺寸和形狀不變。
6.如權(quán)利要求5所述識別圖像中特定對象的方法,其中在對所述包圍盒窗口進(jìn)行縮放處理過程中,放大因子大于1,縮小因子小于1,并且所述縮放處理至少執(zhí)行一次。
7.如權(quán)利要求5所述識別圖像中特定對象的方法,所述將經(jīng)過縮放處理后的窗口沿著預(yù)定的方向移動預(yù)定的距離從而獲得相關(guān)窗口包括沿著上、下、左、右、左上、左下、右上以及右下移動各自預(yù)定的距離,所述各自預(yù)定距離大于零。
8.如權(quán)利要求7所述識別圖像中特定對象的方法,其中所述沿上、下、左、右方向移動的距離為所述經(jīng)過縮放處理后的窗口在該移動方向上的長度的一半,而沿左上、左下、右上以及右下方向移動的距離為所述經(jīng)過縮放處理后的窗口對角線長度的一半。
9.如權(quán)利要求5所述識別圖像中特定對象的方法,所述相關(guān)窗口包括經(jīng)過縮放獲得的 窗口和移動獲得的窗口。
10.一種識別圖像中特定對象的系統(tǒng),包括 接收裝置,用于接收圖像輸入; 檢測裝置,基于預(yù)先設(shè)定的特定對象的特定特征,通過檢測階段的視覺方法,檢測所接收圖像中的假設(shè)特定對象,并生成包含假設(shè)特定對象的包圍盒窗口 ; 相關(guān)窗口生成裝置,針對每個所獲得的包圍盒窗口,通過對所述窗口進(jìn)行縮放處理以及對經(jīng)過縮放處理后的窗口進(jìn)行移動處理,從而獲得與所獲得的包圍盒窗口相關(guān)聯(lián)的相關(guān)窗口 ;以及 驗證裝置,通過驗證階段的視覺方法,計算每個與所獲得的包圍盒窗口相關(guān)聯(lián)的相關(guān)窗口的置信度,并將具有最大置信度的相關(guān)窗口作為被驗證的包含特定對象的結(jié)果輸出?!?br>
全文摘要
本發(fā)明提供了一種識別圖像中特定對象的方法,包括接收圖像輸入;基于預(yù)先設(shè)定的特定對象的特定特征,通過檢測階段的視覺方法,檢測所接收圖像中的假設(shè)特定對象,并生成包含假設(shè)特定對象的包圍盒窗口;針對每個所獲得的包圍盒窗口,通過對所述窗口進(jìn)行縮放處理以及對經(jīng)過縮放處理后的窗口進(jìn)行移動處理,從而獲得與所獲得的包圍盒窗口相關(guān)聯(lián)的相關(guān)窗口;以及通過驗證階段的視覺方法,計算每個與所獲得的包圍盒窗口相關(guān)聯(lián)的相關(guān)窗口的置信度,并將具有最大置信度的相關(guān)窗口作為被驗證的包含特定對象的結(jié)果輸出。
文檔編號G06K9/46GK102955931SQ20111024044
公開日2013年3月6日 申請日期2011年8月19日 優(yōu)先權(quán)日2011年8月19日
發(fā)明者潘蘋萍, 劉麗艷, 王曉萌 申請人:株式會社理光