專利名稱:一種圖像樣本標定方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像樣本標定方法,被標定的樣本通常被稱為經(jīng)驗樣本。
背景技術(shù):
對于目前機器學(xué)習(xí)方法,訓(xùn)練和預(yù)測的樣本往往都是圖像內(nèi)部的特征,這些特征往往都是通過手工標定獲取特征編碼,然后再存儲到其他輔助記錄文件中,在需要的時候再從這些記錄文件中讀取出來。由于采用了輔助文件,致使產(chǎn)生這些特征編碼的原始樣本和特征編碼數(shù)據(jù)分離,在日后的抽樣、亂序、重排序中對文件的名稱、順序、以及規(guī)則都可能有一定的要求,增加了工作的復(fù)雜度。發(fā)明內(nèi)容
因此,本發(fā)明提供一種圖像樣本標定方法,將獲取的樣本特征編碼存儲到原始圖像中,從而減少在抽樣、亂序、重排序中的工作復(fù)雜度。
本發(fā)明所采用的技術(shù)方案為一種圖像樣本標定方法,包括從原始圖像中獲取樣本特征編碼的步驟,還包括把所獲得的所述特征編碼按照預(yù)定的嵌入方法嵌入到所述原始圖像中的步驟,以生成經(jīng)驗樣本; 以及在調(diào)用所述經(jīng)驗樣本進行抽樣、亂序或重排序時匹配所述嵌入方法讀取所述特征編碼的步驟。
依據(jù)本發(fā)明的上述圖像樣本標定方法,把獲取的樣本特征編碼存儲到原始圖像中,在需要的時候直接從原始圖像中讀取特征編碼,從而,在以后的抽樣、亂序、重排序時, 由于將圖像樣本、特征編碼捆綁在一起,減少了工作的復(fù)雜度。
上述圖像樣本標定方法,在一些實施例中,把所獲得的所述特征編碼按照預(yù)定的嵌入方法嵌入到所述原始圖像中步驟的目標區(qū)域為原始圖像的非感興趣區(qū)域,在不影響原始圖像質(zhì)量的情況下,能夠存放有效的存放所述特征編碼。
進一步地,上述圖像樣本標定方法,所述嵌入方法為在所述非感興趣區(qū)域選定能夠容納所述特征編碼的行列組,一個特征編碼對應(yīng)的特征點的列行值使用固定的特征值表示在一對行列中,相應(yīng)地,讀取所述特征編碼的步驟則檢索所述特征值,進而得到所述特征編碼,主要用來存放信息量比較小的特征編碼,對原始圖像的質(zhì)量影響也比較小。
優(yōu)選地,當特征點少于兩個時,優(yōu)選原始圖像的左右第一列和上下第一行作為非感興趣區(qū)域,對原始圖像的質(zhì)量影響非常小,且用于的一半關(guān)注點也不在邊框附近。
在一些實施例中,所述嵌入方法為在原始圖像中加入數(shù)字水印的方式嵌入所述特征編碼,在不影響載體使用價值的情況下可以存放足夠多的信息。
進一步地,在一些實施例中加入所述數(shù)字水印的方法是采用最低有效位算法把所述特征編碼編入所述原始圖像的方法,通過二進制字符串控制,計算量比較小。
在一些實施例中,加入所述數(shù)字水印的方法為對原始圖像進行壓縮,在原有的圖像尺寸上偏移被壓縮的所述原始圖像,留出的空白空間用于存放所述特征編碼,由于特征編碼的信息量比較小,所需要的空白空間也比較小,原始圖像的壓縮不會因此而太大,圖像質(zhì)量幾乎不受影響。
在另一些實施例中,加入所述數(shù)字水印的方法是采用拼湊算法把所述特征編碼編入所述原始圖像,其中拼湊算法用于統(tǒng)計特性的數(shù)字水印嵌入方法,利用統(tǒng)計學(xué)方法可以比較容易的檢出原始圖像中的附加信號。
在一些實施例中,若原始圖像為jpeg格式的圖片,則把所述特征編碼存儲到其文件頭的EXIF中,充分利用jpeg格式圖片的空間,并且不會對圖像質(zhì)量產(chǎn)生任何影響。
優(yōu)選地,把所述特征編碼存儲到原始圖像文件頭的EXIF中的MakerNote字段中, 檢索相對比較容易。
具體實施方式
本文側(cè)重于樣本特征編碼(本文都簡稱為特征編碼)存放于原始圖像的方式,可以根據(jù)特征編碼的信息量,選擇存放方式。
為了更清楚地進行說明,在下文中,采用樹形結(jié)構(gòu)的形式詳細展示所采用的技術(shù)方案,可以更清晰地理解本文所采用的方案依據(jù)本文的核心目的,即在原始圖像中存儲特征編碼的教導(dǎo),應(yīng)關(guān)注于特征編碼的信息量和編碼方式,這些內(nèi)容在現(xiàn)有技術(shù)中已普遍存在,在下文中會有所展示,本領(lǐng)域的技術(shù)人員可以根據(jù)這些內(nèi)容選擇合適的把特征編碼存儲到原始圖像中的方式。應(yīng)當理解,讀取樣本特征編碼的方式與存儲方式相對應(yīng)。
據(jù)此,一種圖像樣本標定方法,其包括以下步驟I.獲取樣本特征編碼。
I. I、常用的樣本特征編碼I.I. I、根據(jù)I. 1,樣本特征編碼可以是I個點坐標,以區(qū)分具有特定坐標點的圖像,形成具有該坐標點的經(jīng)驗樣本,信息量較??;I.I. 2、根據(jù)I. 1,樣本特征編碼可以是多邊形的多個端點坐標,具有區(qū)分度大于所述單坐標點的能力,信息量稍大;I.I. 3、根據(jù)I. 1,樣本特征編碼可以是曲線上的關(guān)鍵點坐標或關(guān)鍵參數(shù),信息量相對也不大,特征編碼的選擇取決于經(jīng)驗樣本使用目的,本領(lǐng)域的技術(shù)人員應(yīng)當清楚的理解,在下文中,對此不再贅述;I.I. 4、根據(jù)I. 1,樣本特征編碼可以是不連續(xù)點集坐標,信息量稍大;I.I. 5、根據(jù)I. 1,如果訓(xùn)練樣本為人臉照片時,樣本特征編碼可以是性別,可以是民族, 可以是年齡,如性別可以使用0、1進行區(qū)分,信息量不大;I.I. 6、根據(jù)I. 1,如果訓(xùn)練樣本為車輛照片時,樣本特征編碼可以是車顏色,可以是車牌號,可以是車型號,在這樣的應(yīng)用中,信息量相對較大,如車顏色,常用的車的顏色并不太多,但若加上其他特征,會加大信息量。
I. 2、樣本特征編碼獲取方式。
I. 2. I、根據(jù)I. 2,獲取方式可以是通過圖像處理軟件標記;I.2. 2、根據(jù)I. 2,獲取方式可以是通過自定義標記程序標記;I.2. 3、根據(jù)I. 2,獲取方式可以是通過肉眼觀察方式標記。4
2.存儲樣本特征編碼將樣本特征編碼存儲到原始圖片中。
2. I、根據(jù)2,樣本特征編碼存儲可以是將樣本特征編碼存儲到圖像的非感興趣區(qū)域;注非感興趣區(qū)域是感興趣區(qū)域(ROI, Region Of Interest )的一個相對概念,在圖像壓縮技術(shù)領(lǐng)域較長使用。如在jpeg圖片中,感興趣區(qū)域壓縮就是指用戶可以任意指定圖片上感興趣的區(qū)域,然后在壓縮時對這些區(qū)域指定壓縮質(zhì)量,或在恢復(fù)時指定某些區(qū)域的解壓縮要求。這是因為子波在空間和頻率域上具有局域性,要完全恢復(fù)圖像中的某個局部, 并不需要所有編碼都被精確保留,只要對應(yīng)他的一部分編碼沒有誤差就可以了。在實際應(yīng)用中,我們就可以對一幅圖像中感興趣的部分采用低壓縮比以獲取較好的圖像效果,而對其他部分采用高壓縮比以節(jié)省存儲空間。這樣就能在保證不丟失重要信息的同時又有效地壓縮了數(shù)據(jù)量,實現(xiàn)了真正的“交互式”壓縮。在經(jīng)驗樣本中,感興趣區(qū)域和非感興趣區(qū)域都是確定的,使用者往往對感興趣區(qū)域有更多的關(guān)注,非感興趣區(qū)域?qū)Ω郊有畔⒌奶砀讲粫绊憟D像的整體質(zhì)量。當然,在圖像壓縮中,首當其沖的是非感興區(qū)域,這里不涉及壓縮, 因此不考慮壓縮對所添加信息的影響。
2. I. I、根據(jù)2. 1,可以將圖像的上下第I行每個像素的3個通道值都設(shè)置成原值加 1,同時將圖像的左右第I列每個像素的3個通道值都設(shè)置成原值加1,對于超出255的值, 將其賦值成255。對于需要標記的點P (i,j)(第i行j列的點),將第I列第i個像素的 3個通道值都設(shè)置成0,將第I行第j個像素的3個通道值都設(shè)置成O即可。
2. 2、根據(jù)2,樣本特征編碼存儲可以是借助數(shù)字水印技術(shù)將樣本特征編碼存儲到當前圖像中;注數(shù)字水印技術(shù)將一些標識信息(即數(shù)字水印)直接嵌入數(shù)字載體當中(包括多媒體、 文檔、軟件等)或是間接表示(修改特定區(qū)域的結(jié)構(gòu)),且不影響原載體的使用價值,也不容易被探知和再次修改。但可以被生產(chǎn)方識別和辨認,因此,在本文中,可以被生產(chǎn)方式別和辨認,而不必考慮具體的數(shù)字水印方式,只要匹配該方式,就可以對所存儲的特征編碼進行識別,或者說讀取。
2. 2. I、根據(jù)2. 2,數(shù)字水印技術(shù)可以是采用最低有效位算法把附加信號編入原始信號中的方式。該算法把附加信號看作二進制數(shù)據(jù)串,用此二進制數(shù)據(jù)替換原始信號的最低I位或多位數(shù)據(jù)位;2.2. 2、根據(jù)2. 2,數(shù)字水印技術(shù)可以是對于視頻信號采用文檔結(jié)構(gòu)微調(diào)的方法把附加信號寫入原始信號中的方式。通過圖像的水平微量平移、豎直微量平移、圖像微量壓縮操作,壓縮原始圖像的空間尺度,留出空白空間存放附加信號;這里的微量取決于數(shù)字編碼的大小,顯然,大多數(shù)情況下,數(shù)字編碼的信息量非常小,因此,所需要的空白空間也不大,對原始圖像的質(zhì)量不會產(chǎn)生太大的影響。
2. 2. 3、根據(jù)2. 2,數(shù)字水印技術(shù)可以是采用拼湊法把附加信號編入原始信號的方式。該方法是一種基于統(tǒng)計特性的數(shù)字水印嵌入方案。它選擇任意多對信號點,在增加一點信號強的同時,降低配對的另一點的信號強度。利用統(tǒng)計學(xué)方法可以從接收的復(fù)合圖像中檢出附加信號;2.2. 4、根據(jù)2. 2,數(shù)字水印技術(shù)可以是采用DCT變換與方法把附加信號編入原始信號的方式;2.2. 5、根據(jù)2. 2,數(shù)字水印技術(shù)可以是采用壓縮域方法把附加信號編入原始信號的方式;2.3、根據(jù)2,如果原始圖像文件為Jpeg格式,可以將樣本特征編碼存儲在文件頭中的 EXIF部分信息中;2.3. I、根據(jù)2. 3,如果圖像文件為Jpeg格式,可以將樣本特征編碼存儲在文件頭中的 EXIF的MakerNote字段中。Exif文件實際是JPEG文件的一種,遵從JPEG標準,只是在文件頭信息中增加了有關(guān)拍攝信息的內(nèi)容和索引圖,其包括Image DescriptioruArtist等字段。
3.讀取樣本特征編碼。
3. I、根據(jù)3,讀取存儲于圖像中的樣本特征編碼;3.I. I、根據(jù)3. 1,2. 1,采用逆過程,讀取存儲在圖像的非感興趣區(qū)域中的特征編碼;3.1.1.I、根據(jù)3. 1,2. 1,2. I. 1,讀取圖像第I列中3個通道值為O的行i,讀取圖像第 I行中3個通道值為O的列j,則圖像中第i行j列對應(yīng)的像素即為標記的圖像特征點;3. I. 2、根據(jù)3. 1,2. 2,2. 2. 1,采用逆過程,讀取采用最低有效位算法把附加信號編入原始信號中的數(shù)字水印方式存儲在圖像中的特征編碼;3. I. 3、根據(jù)3. 1,2. 2,2. 2. 2,采用逆過程,讀取對于視頻信號采用文檔結(jié)構(gòu)微調(diào)的方法把附加信號寫入原始信號中的數(shù)字水印方式存儲在圖像中的特征編碼;3. I. 4、根據(jù)3. 1,2. 2,2. 2. 3,采用逆過程,讀取采用拼湊法把附加信號編入原始信號的數(shù)字水印方式存儲在圖像中的特征編碼;3.I. 5、根據(jù)3. 1,2. 2,2. 2. 4,采用逆過程,讀取采用DCT變換與方法把附加信號編入原始信號的數(shù)字水印方式存儲在圖像中的特征編碼;3.I. 5、根據(jù)3. 1,2. 2,2. 2. 5,采用逆過程,讀取采用壓縮域方法把附加信號編入原始信號的數(shù)字水印方式存儲在圖像中的特征編碼;3.I. 6、根據(jù)3. 1、2. 3,如果圖像文件為Jpeg,讀取存儲在文件頭中的EXIF的MakerNote 字段部分的特征編碼。
下面以兩個更具體的實例說明本文所提出的方案實施例一標記人臉圖像中下巴的下邊緣的縱坐標I.樣本手工標記1.1、通過編寫的標記程序標記下巴縱坐標,步驟如下I.I. I、標記程序加載尺寸為240x320人臉圖像,其人眼中心坐標為(120,160),眼寬為 64像素;I.I. 2、在圖像區(qū)域的(115,200)處生成I個長度為10像素的線段;1.I. 3、通過鍵盤光標上下移動線段,直到線段位置在下巴的下方邊緣處j ;2.樣本特征編碼存儲2.I處理非感興趣區(qū)域?qū)D像的左邊第I列每個像素的3個通道數(shù)值修改成原數(shù)值加1,對于超出255的通道數(shù)值將其賦值成255 ;2.2存儲標記點根據(jù)2、I. I. 3,將圖像左邊第I列第j個像素的3個通道數(shù)值修改成0,保存圖像。
3.提取樣本標記信息根據(jù)2,遍歷圖像第I列中像素,找到3個通道數(shù)值都為O的像素點,該點的位置即為下巴的縱坐標。
實施例二 標記人臉圖像中鼻子區(qū)域I.樣本手工標記1.1、通過編寫的標記程序標記鼻子區(qū)域,步驟如下I.I. I、標記程序加載尺寸為240x320人臉圖像,其人眼中心坐標為(120,160),眼寬為 64像素;I.I. 2、在圖像區(qū)域生成以(100,160)、(135、160)、(100,200)、(135,200)為端點的矩形;1.1.3、通過鼠標移動,拖拽使矩形正好包圍住鼻子,得到矩形坐標為?(10,」0)、?(10, jl)、P (il,jO)、P (il,jl);2.樣本特征編碼存儲2.I處理非感興趣區(qū)域?qū)D像的左邊第I列每個像素的3個通道數(shù)值修改成原數(shù)值加1,圖像上邊第I行每個像素的3個通道數(shù)值修改成原數(shù)值加1,對于超出255的通道數(shù)值將其賦值成255 ;2.2存儲標記點根據(jù)2、1. I. 3,將圖像左邊第I列第j0、jl個像素的3個通道數(shù)值修改成0,將圖像左邊第I列第i0、il個像素的3個通道數(shù)值修改成0,保存圖像。
3.提取樣本標記信息根據(jù)2,遍歷圖像第I列中像素,找到3個通道數(shù)值都為O的像素點i0、il,遍歷圖像第 I行中像素,找到3個通道數(shù)值都為O的像素點j0、jl,由他們構(gòu)成的P (i0, j0)、P (i0, jl)、P (il,j0)、P (il,jl)即為矩形的4個端點。
權(quán)利要求
1.一種圖像樣本標定方法,包括從原始圖像中獲取樣本特征編碼的步驟,其特征在于,還包括把所獲得的所述特征編碼按照預(yù)定的嵌入方法嵌入到所述原始圖像中的步驟,以生成經(jīng)驗樣本; 以及在調(diào)用所述經(jīng)驗樣本進行抽樣、亂序或重排序時匹配所述嵌入方法讀取所述特征編碼的步驟。
2.根據(jù)權(quán)利要求I所述的圖像樣本標定方法,其特征在于,把所獲得的所述特征編碼按照預(yù)定的嵌入方法嵌入到所述原始圖像中步驟的目標區(qū)域為原始圖像的非感興趣區(qū)域。
3.根據(jù)權(quán)利要求2所述的圖像樣本標定方法,其特征在于,所述嵌入方法為在所述非感興趣區(qū)域選定能夠容納所述特征編碼的行列組,一個特征編碼對應(yīng)的特征點的列行值使用固定的特征值表示在一對行列中,相應(yīng)地,讀取所述特征編碼的步驟則檢索所述特征值,進而得到所述特征編碼。
4.根據(jù)權(quán)利要求3所述的圖像樣本標定方法,其特征在于,當特征點少于兩個時,優(yōu)選原始圖像的左右第一列和上下第一行作為非感興趣區(qū)域。
5.根據(jù)權(quán)利要求I所述的圖像樣本標定方法,其特征在于,所述嵌入方法為在原始圖像中加入數(shù)字水印的方式嵌入所述特征編碼。
6.根據(jù)權(quán)利要求5所述的圖像樣本標定方法,其特征在于,加入所述數(shù)字水印的方法是采用最低有效位算法把所述特征編碼編入所述原始圖像的方法。
7.根據(jù)權(quán)利要求5所述的圖像樣本標定方法,其特征在于,加入所述數(shù)字水印的方法為對原始圖像進行壓縮,在原有的圖像尺寸上偏移被壓縮的所述原始圖像,留出的空白空間用于存放所述特征編碼。
8.根據(jù)權(quán)利要求5所述的圖像樣本標定方法,其特征在于,加入所述數(shù)字水印的方法是采用拼湊算法把所述特征編碼編入所述原始圖像,其中拼湊算法用于統(tǒng)計特性的數(shù)字水印嵌入方法。
9.根據(jù)權(quán)利要求I所述的圖像樣本標定方法,其特征在于,若原始圖像為jpeg格式的圖片,則把所述特征編碼存儲到其文件頭的EXIF中。
10.根據(jù)權(quán)利要求9所述的圖像樣本標定方法,其特征在于,把所述特征編碼存儲到原始圖像文件頭的EXIF中的MakerNote字段中。
全文摘要
本發(fā)明公開了一種圖像樣本標定方法,包括從原始圖像中獲取樣本特征編碼的步驟,還包括把所獲得的所述特征編碼按照預(yù)定的嵌入方法嵌入到所述原始圖像中的步驟,以生成經(jīng)驗樣本;以及在調(diào)用所述經(jīng)驗樣本進行抽樣、亂序或重排序時匹配所述嵌入方法讀取所述特征編碼的步驟。依據(jù)本發(fā)明的的圖像樣本標定方法能夠減少在抽樣、亂序、重排序中的工作復(fù)雜度。
文檔編號G06T1/00GK102982501SQ20121046439
公開日2013年3月20日 申請日期2012年11月19日 優(yōu)先權(quán)日2012年11月19日
發(fā)明者方亮, 許野平, 張傳鋒, 曹杰, 劉辰飛 申請人:山東神思電子技術(shù)股份有限公司