專利名稱:用于對象跟蹤的圖像處理系統(tǒng)和方法
技術領域:
本發(fā)明的實施例與圖像處理相關,在特定示例中,與目標表示和定位中的基于 mean shift視覺跟蹤的視覺跟蹤相關。
背景技術:
已經(jīng)開發(fā)了系統(tǒng)和方法中,用于定義視頻中的對象以及在視頻幀中跟蹤該對象。 在各應用程序中,人可能即是要跟蹤的“對象”。例如,使用監(jiān)控相機的運動圖像和應用程序?qū)Ω櫲说膭幼鞲信d趣。以前,相關工作絕大多數(shù)應用背景信息來實現(xiàn)差異測量。例如,一些相關工作通過 “高斯差分濾波器”或耗費時間的級別設置功能,搜索比例空間中的最佳比例。一個簡單的方法是,通過在位置估計中基于相同度量進行搜索來查找比例,但是會導致收縮問題。一些其他相關工作使用多個內(nèi)核來設計目標外觀與其運動特征之間的關系(該關系導致了復雜性和噪聲敏感的算法)。一些相關工作僅解決了模板更新的問題,并使用Kalman過濾或適應性的alpha-blending (α混合)技術來更新直方圖,但是仍然導致累加錯誤。
發(fā)明內(nèi)容
在第一個實施例中,在包括一個初始幀和多個后續(xù)幀的視頻圖像上執(zhí)行了圖像處理方法。一個對象位于視頻圖像的初始幀內(nèi)部,并生成了一個與該對象有關的直方圖。還生成了一個包括對象的前景圖。對于每個后續(xù)幀,都執(zhí)行了均值平移(mean shift)迭代, 以調(diào)節(jié)對象在當前幀中的位置。然后,可以更新與對象有關的直方圖和前景圖。在某些實施例中,均值平移迭代包括執(zhí)行當前幀內(nèi)的對象的第一次、第二次和第三次搜索。第一次搜索是使用對象的原始比例執(zhí)行的,第二次搜索是使用對象的放大比例執(zhí)行的,第三次搜索是使用對象的縮小比例執(zhí)行的。然后,可以選擇三個搜索的最佳匹配項。本文中還描述了其他實施例和功能。附圖簡述為了更完整地了解本發(fā)明及其優(yōu)勢,可以參考以下附圖和說明,其中
圖1顯示了根據(jù)本發(fā)明的實施例推薦的跟蹤幀;圖2為根據(jù)本發(fā)明的實施例,基于運動場模式的運動員/裁判員位置的流程圖;圖3為根據(jù)本發(fā)明的一個實施例進行比例和位置估計的mean shift迭代的流程權(quán)利要求
1.一種圖像處理方法,其特征在于,包括于圖像處理器中接收的視頻圖像,所述視頻圖像包含一個初始幀和多個后續(xù)幀;在所述視頻圖像的初始幀中定位對象;生成與所述初始幀中的對象相關的直方圖;生成包含所述對象的前景圖;對于所述視頻圖像中的各后續(xù)幀執(zhí)行均值平移,mean shift,迭代以調(diào)節(jié)所述對象在當前幀中的位置; 更新與對象有關的直方圖;并更新所述的前景圖。
2.如權(quán)利要求1所述的方法,其特征在于,所述執(zhí)行均值平移迭代包括以多個比例執(zhí)行均值平移迭代。
3.如權(quán)利要求2所述的方法,其特征在于,所述更新與對象相關的直方圖包括更新比例。
4.如權(quán)利要求2所述的方法,其特征在于,所述執(zhí)行均值平移迭代包括 在當前幀中執(zhí)行對象的第一次搜索,第一次搜索使用對象的原始比例執(zhí)行; 在當前幀中執(zhí)行對象的第二次搜索,第二次搜索使用對象的放大比例執(zhí)行; 在當前幀中執(zhí)行對象的第三次搜索,第三次搜索使用對象的縮小比例執(zhí)行;并且確定第一、二、三中的哪一次搜索找到了對象的最佳匹配。
5.如權(quán)利要求1所述的方法,其特征在于,所述執(zhí)行均值平移迭代包括 計算候選的歸一化直方圖;使用均值平移矢量處理所述候選的歸一化直方圖;并確定處理結(jié)果是否小于所選值。
6.如權(quán)利要求1所述的方法,其特征在于,所述更新與對象相關的直方圖并更新前景圖包括確定所述對象是否丟失; 重新定位對象; 生成與該對象相關的直方圖; 生成包括該對象的已更新的前景圖。
7.如權(quán)利要求1所述的方法,其特征在于,所述定位對象包括接收與用戶在視頻圖像中單擊的位置相關的信息。
8.如權(quán)利要求1所述的方法,其特征在于,所述定位對象包括執(zhí)行對象位置算法。
9.如權(quán)利要求1所述的方法,其特征在于,所述定位對象包括定位運動視頻中的運動員O
10.一種圖像處理方法,其包括 接收視頻幀;通過在視頻幀中搜索對象的表示方式,在視頻幀中執(zhí)行對象的第一次搜索,,所述的第一次搜索使用對象的表示方式的原始比例來執(zhí)行;通過在視頻幀中搜索對象的表示方式,在視頻幀中執(zhí)行對象的第二次搜索,所述的第二次搜索使用對象的表示方式的放大比例來執(zhí)行;通過在視頻幀中搜索對象的表示方式,在視頻幀中執(zhí)行對象的第三次搜索,所述的第三次搜索使用對象的表示方式的放大比例來執(zhí)行;確定第一、二、三中的哪一次搜索找到了對象的最佳匹配。
11.如權(quán)利要求10所述的方法,進一步包括基于所確定的最佳匹配更新對象的表示方式。
12.如權(quán)利要求11所述的方法,其特征在于,所述的表示方式包括尺寸和位置。
13.如權(quán)利要求10所述的方法,其特征在于,所述的對象的表示方式包括直方圖。
14.如權(quán)利要求10所示的方法,其特征在于,所述的放大比例比原始比例大5%至 15%,縮小比例比原始比例小5%至15%。
15.如權(quán)利要求10所述的方法,其特征在于,所述搜索對象的表示方式包括窮舉搜索。
16.如權(quán)利要求10所述的方法,其特征在于,所述搜索對象的表示方式包括基于相似度測量的梯度下降搜索。
17.一種圖像處理器,其包括一個輸入以接收視頻圖像,所述視頻圖像包含一個初始幀和多個后續(xù)幀;以及一個處理視頻圖像的處理系統(tǒng),處理系統(tǒng)包括編程為執(zhí)行下列步驟的處理器在所述視頻圖像的初始幀中定位對象;在所述的初始幀中生成與所述對象有關的直方圖;生成包括所述對象的前景圖;對于視頻圖像中的各個后續(xù)幀執(zhí)行均值平移,mean shift,迭代以調(diào)節(jié)對象在當前幀中的位置; 生成與所述對象相關的直方圖;并且更新所述的前景圖。
18.如權(quán)利要求17所述的圖像處理器,其特征在于,所述執(zhí)行均值平移迭代包括 計算候選的歸一化直方圖;使用均值平移矢量處理候選的歸一化直方圖;并確定處理結(jié)果是否小于所選值。
19.如權(quán)利要求17所述的圖像處理器,其特征在于,所述更新與所述對象相關的直方圖并更新所述前景圖包括確定所述對象是否丟失; 重新定位對象; 生成與該對象相關的直方圖; 生成包括該對象的已更新的前景圖。
20.如權(quán)利要求17所述的圖像處理器,其特征在于,執(zhí)行均值平移迭代包括 在當前幀中執(zhí)行對象的第一次搜索,第一次搜索使用對象的原始比例執(zhí)行; 在當前幀中執(zhí)行對象的第二次搜索,第二次搜索使用對象的方法比例執(zhí)行;在當前幀中執(zhí)行對象的第三次搜索,第三次搜索使用對象的縮小比例執(zhí)行;并且確定第一、二、三中的哪一次搜索找到了對象的最佳匹配
全文摘要
在包括一個初始幀和多個后續(xù)幀的視頻圖像上執(zhí)行了圖像處理方法。一個對象位于視頻圖像的初始幀內(nèi)部,并生成了一個與該對象有關的直方圖。還生成了一個包括對象的前景圖。對于每個后續(xù)幀,都執(zhí)行了均值平移(mean shift)迭代,以調(diào)節(jié)對象在當前幀中的位置。然后,可以更新與對象有關的直方圖和前景圖。
文檔編號G06K9/00GK102369540SQ201080003873
公開日2012年3月7日 申請日期2010年1月13日 優(yōu)先權(quán)日2009年1月13日
發(fā)明者李紅兵, 田軍, 虹.希瑟.郁, 黃浴 申請人:華為技術有限公司