本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,更進(jìn)一步涉及一種獲取運(yùn)動目標(biāo)初始輪廓的方法,可用于對運(yùn)動目標(biāo)的定位及檢測。
背景技術(shù):
運(yùn)動目標(biāo)初始輪廓的獲取是進(jìn)行目標(biāo)檢測的必要及重要的步驟,準(zhǔn)確的獲取運(yùn)動目標(biāo)的初始輪廓是非常必要的,同時也為后續(xù)提高圖像處理效率奠定了基礎(chǔ)。水平集是由Osher和Sethian提出的一種目標(biāo)輪廓描述模型,主要應(yīng)用于基于形狀的目標(biāo)分割,在最近十多年中,它已經(jīng)被越來越多的研究者成功的應(yīng)用于計(jì)算機(jī)視覺的許多領(lǐng)域,如邊緣提取,目標(biāo)跟蹤,三維重建等。但是該模型需要初始輪廓,現(xiàn)有的初始輪廓的獲取方法一般都是采用交互的方式,將初始輪廓設(shè)定為包括圖像目標(biāo)的固定圓形或者矩形框,方法簡單,但是不能準(zhǔn)確定位目標(biāo)的位置以及大小,在進(jìn)行模型迭代的過程中需進(jìn)一步搜尋目標(biāo),不僅增加了算法的復(fù)雜度,而且降低了算法的實(shí)用性。所以需要一種能夠快速定位到運(yùn)動目標(biāo)位置,并且能夠遵從人為意愿選擇運(yùn)動目標(biāo)初始輪廓的方法。國內(nèi)外學(xué)者對獲取運(yùn)動目標(biāo)的初始輪廓方法進(jìn)行了研究,并提出了多種不同的方法,但這些方法均存在利弊。
武漢大學(xué)的張東等人在其申請的專利“基于主動輪廓模型的超聲圖像分割中獲取初始輪廓的方法”(專利申請?zhí)枺?01410141568.5公開號:103914845A)中提出了一種獲取圖像中目標(biāo)的初始輪廓的方法。該方法首先對輸入圖像采用灰度共生矩陣提取24個紋理特征,組成標(biāo)準(zhǔn)向量。對輸入圖像預(yù)處理后進(jìn)行動態(tài)閾值分割,提取出閉合輪廓,使得每一個閉合輪廓為一個子圖像。然后,采用灰度共生矩陣提取各子圖像的24個紋理特征,計(jì)算橢圓擬合結(jié)果參數(shù)以及子圖像閉合輪廓內(nèi)部像素個數(shù),用這26個數(shù)據(jù)組成一個新的向量。最后,計(jì)算新的向量與標(biāo)準(zhǔn)向量之間的距離,使得距離最小的新的向量的值所對應(yīng)的閉合輪廓為初始輪廓。該方法由于主要針對的是醫(yī)學(xué)圖像檢測腫瘤,其形狀假設(shè)為圓或者橢圓,在獲取初始輪廓時,采用橢圓擬合參數(shù)等,使得該方法存在有一定的局限性。當(dāng)用該方法對非醫(yī)學(xué)圖像或者自然圖像中的非規(guī)則形狀目標(biāo)進(jìn)行初始輪廓的獲取時,并不能得到很好的結(jié)果。
白雪飛等人在論文“自適應(yīng)初始輪廓的Chan-Vese模型圖像分割方法”(《計(jì)算機(jī)科學(xué)與探索》2013年7卷12期第1115~1124頁)中提出了一種基于視覺認(rèn)知的初始輪廓獲取方法。該方法借助顯著性檢測,以確定圖像中的感興趣位置,從而獲取圖像目標(biāo)的先驗(yàn)形狀信息,以此獲得目標(biāo)的初始化曲線。該方法的不足之處是,在采用顯著性檢測來獲取圖像中的感興趣位置時復(fù)雜度較大,當(dāng)對背景復(fù)雜且目標(biāo)與背景具有同質(zhì)區(qū)域時,獲得的初始輪廓的精確度不高,當(dāng)存在有一個以上的目標(biāo)時,該方法所獲得的初始輪廓不能夠準(zhǔn)確定位到每個目標(biāo)的位置和大小,并且不能自主選擇目標(biāo)區(qū)域進(jìn)行初始輪廓的獲取。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于針對上述現(xiàn)有技術(shù)存在的不足,提出一種基于水平集運(yùn)動目標(biāo)檢測中獲取初始輪廓的方法,以降低獲取初始輪廓的復(fù)雜度,提高對復(fù)雜背景且背景與目標(biāo)具有同質(zhì)區(qū)域時初始輪廓的獲取準(zhǔn)確度,實(shí)現(xiàn)對一個以上的目標(biāo)進(jìn)行自主選擇獲取一個選擇目標(biāo)區(qū)域的初始輪廓。
為實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)現(xiàn)步驟包括如下:
(1)輸入影像格式的視頻圖像;
(2)從輸入的視頻圖像中選取運(yùn)動目標(biāo)明顯的連續(xù)三幀視頻圖像,將其依次定義為第一幀視頻圖像I1,第二幀視頻圖像I2,第三幀視頻圖像I3;
(3)采用幀間差分法,對所選取的連續(xù)三幀視頻圖像進(jìn)行幀間差分,獲得二值圖像B;
(4)采用形態(tài)學(xué)函數(shù),對二值圖像B中除了目標(biāo)之外存在的其他干擾噪聲進(jìn)行除噪,得到去除噪聲后的二值圖像I;
(5)對去除噪聲后的二值圖像I進(jìn)行形態(tài)學(xué)的閉運(yùn)算操作,使得去除噪聲后的二值圖像I中所檢測到的運(yùn)動目標(biāo)的輪廓邊緣變得光滑,且實(shí)現(xiàn)對運(yùn)動目標(biāo)區(qū)域內(nèi)部小孔洞的填充;
(6)對于進(jìn)行(5)操作后使兩個或者兩個以上靠的很近的運(yùn)動目標(biāo)連接在一起的狀況,采用形態(tài)學(xué)中的開運(yùn)算操作,將連接在一起的多個運(yùn)動目標(biāo)分離開;
(7)采用區(qū)域生長法選取需要獲得初始輪廓的運(yùn)動目標(biāo)區(qū)域,計(jì)算選取的運(yùn)動目標(biāo)區(qū)域的最大內(nèi)切圓;
(8)以最大內(nèi)切圓的圓心為圓心,以最大內(nèi)切圓半徑的倍數(shù)為半徑作圓,得到圓形閉合曲線,該曲線即為所選運(yùn)動目標(biāo)區(qū)域的初始輪廓。
本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn):
第一,本發(fā)明充分考慮了復(fù)雜背景且背景與目標(biāo)具有同質(zhì)區(qū)域的情況,采用幀間差分法和形態(tài)學(xué)結(jié)合的方法來獲得運(yùn)動區(qū)域的位置和初始輪廓,提高了初始輪廓獲取的準(zhǔn)確度;
第二,本發(fā)明充分考慮了當(dāng)存在多個目標(biāo)時不能選擇性獲取初始輪廓的問題,采用區(qū)域生長法實(shí)現(xiàn)對一個以上的目標(biāo)進(jìn)行自主選擇來獲取一個選擇目標(biāo)區(qū)域的初始輪廓,為后續(xù)的處理過程提高了效率。
第三,本發(fā)明通過運(yùn)動目標(biāo)區(qū)域的最大內(nèi)切圓求得運(yùn)動目標(biāo)的初始輪廓,復(fù)雜度低,容易實(shí)現(xiàn)。
附圖說明
圖1為本發(fā)明的實(shí)現(xiàn)流程圖。
圖2為用本發(fā)明提取的初始輪廓結(jié)果圖。
圖3為本發(fā)明采用圖2獲得的初始輪廓作為水平集的初始輪廓,經(jīng)過收斂后得到最終目標(biāo)邊界的結(jié)果圖。
具體實(shí)施方式
下面結(jié)合附圖1對本發(fā)明做進(jìn)一步的詳細(xì)描述。
步驟1:輸入影像格式的視頻圖像。
視頻的文件格式分為適合本地播放的本地影像格式視頻和適合在網(wǎng)絡(luò)中播放的網(wǎng)絡(luò)流媒體影像視頻兩大類,只要包含有運(yùn)動目標(biāo)的視頻圖像,均可作為本發(fā)明的輸入。在本發(fā)明的實(shí)例中,采用Computer Vision and Robotics Research中的highwayⅡ測試視頻圖像作為輸入,視頻圖像尺寸為320×240像素。
步驟2:選取三幀視頻圖像。
從輸入的highwayⅡ測試視頻圖像中選取運(yùn)動目標(biāo)明顯的第469幀、第470幀和第471幀視頻圖像做為本實(shí)例的原始三幀視頻圖像進(jìn)行運(yùn)動目標(biāo)初始輪廓提取。
步驟3:采用幀間差分法,獲得二值圖像。
3a)用所選取的第469幀視頻圖像減去第470幀視頻圖像,得到差分后的圖像B1;
3b)用所選取的第470幀視頻圖像減去第471幀視頻圖像,得到差分后的圖像B2;
3c)將兩個差分后的圖像B1和B2進(jìn)行相“與”操作,得到二值圖像B。
步驟4:采用形態(tài)學(xué),去除干擾噪聲。
在形態(tài)學(xué)中,結(jié)構(gòu)元素一般有圓盤形、正方形、菱形、六邊形、線段形等多種形狀,在本發(fā)明實(shí)例中形態(tài)學(xué)的閉操作采用邊長為6的正方形結(jié)構(gòu)元素,形態(tài)學(xué)的開操作采用半徑為6的圓盤形結(jié)構(gòu)元素,但在其他實(shí)例中不限定采用哪種形態(tài)學(xué)結(jié)構(gòu)元素。本步驟的具體實(shí)現(xiàn)如下:
4a)用結(jié)構(gòu)元素掃描二值圖像B中的每一個像素;
4b)對結(jié)構(gòu)元素與其覆蓋的二值圖像B進(jìn)行“與”操作,如果結(jié)構(gòu)元素與其覆蓋的二值圖像B的像素均為1,則覆蓋區(qū)域的像素為1,否則為0,得到腐蝕后的二值圖像B1;
4c)用結(jié)構(gòu)元素掃描腐蝕后的二值圖像B1中的每一個像素;
4d)對結(jié)構(gòu)元素與其覆蓋的腐蝕后的二值圖像B1進(jìn)行“或”操作,如果結(jié)構(gòu)元素與其覆蓋的腐蝕后的二值圖像B1的像素不相同或者均為1,則覆蓋區(qū)域的像素為1,否則為0,即為去除噪聲后的二值圖像I,如圖2(a)所示。
步驟5:對去除噪聲后的二值圖像I進(jìn)行形態(tài)學(xué)的閉運(yùn)算操作,進(jìn)行小孔洞的填充:
5a)用結(jié)構(gòu)元素掃描圖2(a)中的每一個像素;
5b)對結(jié)構(gòu)元素與其覆蓋的圖2(a)的區(qū)域進(jìn)行“或”操作,如果結(jié)構(gòu)元素與其覆蓋的圖2(a)區(qū)域的像素不相同或者均為1,則覆蓋區(qū)域的像素為1,否則為0,得到膨脹后的二值圖像B2;
5c)用結(jié)構(gòu)元素掃描膨脹后的二值圖像B2的每一個像素;
5d)對結(jié)構(gòu)元素與其覆蓋的膨脹后的二值圖像B2進(jìn)行“與”操作,如果結(jié)構(gòu)元素與其覆蓋的膨脹后的二值圖像B2的像素均為1,則覆蓋區(qū)域的像素為1,否則為0,得到目標(biāo)區(qū)域內(nèi)部的小孔洞被填充后的二值圖像,如圖2(b)所示。
步驟6:采用形態(tài)學(xué)開操作,分開狹窄的連接。
由于在兩個或者兩個以上的運(yùn)動目標(biāo)靠的很近時,進(jìn)行閉運(yùn)算操作后會使得距離接近的運(yùn)動目標(biāo)連接在一起,故需要采用形態(tài)學(xué)中的開運(yùn)算操作,將連接起來的多個運(yùn)動目標(biāo)分離開。其具體步驟如下:
6a)用結(jié)構(gòu)元素掃描圖2(b)中的每一個像素;
6b)對結(jié)構(gòu)元素與圖2(b)的區(qū)域進(jìn)行“與”操作,如果結(jié)構(gòu)元素與其覆蓋的圖2(b)區(qū)域的像素均為1,則覆蓋區(qū)域的像素為1,否則為0,得到二次腐蝕后的二值圖像B3;
6c)用結(jié)構(gòu)元素掃描二次腐蝕后的二值圖像B3的每一個像素;
6d)對結(jié)構(gòu)元素與其覆蓋的二次腐蝕后的二值圖像B3進(jìn)行“或”操作,如果結(jié)構(gòu)元素與其覆蓋的二次腐蝕后的二值圖像B3的像素不相同或者均為1,則覆蓋區(qū)域的像素為1,否則為0,即得到將連接在一起的多個運(yùn)動目標(biāo)分離開的二值圖像,如圖2(c)所示。
步驟7:采用區(qū)域生長法獲取需要獲得初始化輪廓的運(yùn)動目標(biāo)區(qū)域,計(jì)算選取的運(yùn)動目標(biāo)區(qū)域的最大內(nèi)切圓。
7a)在圖2(c)中選擇最左側(cè)的目標(biāo)區(qū)域內(nèi)部的一點(diǎn)作為生長點(diǎn);
7b)以生長點(diǎn)為中心,檢查其相鄰的像素,將鄰域中的像素逐個與中心比較,如果中心的像素與鄰域的像素差值為0,則將中心與相鄰的像素合并,否則不合并;
7c)以新合并的像素為中心,再進(jìn)行(7b)檢測,直到區(qū)域不能進(jìn)一步擴(kuò)張,得到最左側(cè)需要獲得初始輪廓的運(yùn)動目標(biāo)區(qū)域,如圖2(d)所示。
步驟8:得到運(yùn)動目標(biāo)區(qū)域的初始化輪廓:
以最大內(nèi)切圓的圓心為圓心,以最大內(nèi)切圓半徑的倍數(shù)為半徑作圓,得到的圓形閉合曲線即為所選運(yùn)動目標(biāo)區(qū)域的初始輪廓,實(shí)例的結(jié)果示意圖如圖2(e)所示。
從圖2(e)的結(jié)果可以看出,本發(fā)明降低獲取初始輪廓的復(fù)雜度,提高對復(fù)雜背景且背景與目標(biāo)具有同質(zhì)區(qū)域時初始輪廓的獲取準(zhǔn)確度,實(shí)現(xiàn)對一個以上的目標(biāo)進(jìn)行自主選擇獲取一個選擇目標(biāo)區(qū)域的初始輪廓。