專利名稱:在圖像中探測對象的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及圖像處理的方法及裝置,特別涉及在圖像中探測對象的快速方法。
背景技術(shù):
很多圖像處理應(yīng)用涉及探測某個或某些對象是否存在于給定的圖像中,如是,那末在圖像中的什么位置。對待探測的對象給出一個“字典”。不過,圖像中的對象的外觀可能不同于字典中的外觀。對象外觀改變的原因包括轉(zhuǎn)動、縮放、噪聲、非線性畸變、對象內(nèi)及對象與背景之間對比度改變以及微小的拓?fù)涓淖?。實際的圖像處理方法必須能夠迅速地在大圖像中發(fā)現(xiàn)指定的對象,即使是存在這種改變。
公知的在圖像中探測對象的技術(shù)的大多數(shù)方法,或是涉及模式匹配,或是涉及拓?fù)渌阉骷夹g(shù)。通常,這些方法要求首先對圖像進(jìn)行預(yù)處理,或濾波,來強化所要的特征,如梯度或邊緣。模式匹配對上述的變化類型敏感,特別是對非線性變化敏感。拓?fù)渌阉鞣椒ㄉ婕芭蛎浖鞍l(fā)現(xiàn)輪廓和骨架之類的運算,而這些運算對于快速處理大的圖像來說耗時過多而計算效率低。
在搜索對象之前將圖像二值化可減少計算時間,特別是如果圖像也是分樣圖像(decimated)的話。然而,基于二值化的方法對于對比度的變化特別敏感。取決于二值化方法和閾值的選擇,圖像中對象的重要特征或?qū)ο蠛捅尘爸g的區(qū)別可能在二值化時消失。由于圖像中的亮度和對比度的變化,經(jīng)常要求在圖像的不同部分取不同的閾值。
一個特別有挑戰(zhàn)性的對象探測應(yīng)用是郵包的自動分揀。包裹分揀設(shè)備必須能夠識別和定位各種標(biāo)記和粘貼在包裹上的標(biāo)簽。通常,用于掃描一個很大的總圖像區(qū)的只有很有限的處理時間。因為圖像是由包裹傳送帶上方的攝象機捕捉,由于包裹的高度不同,縮放比例的變化會很大。包裹本身的物理變形也引起粘貼在包裹上的標(biāo)簽的非線性變形。另外,同一標(biāo)簽的不同印版可能具有不同的灰度對比、筆劃寬度、字體和特征布局。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種在圖像中快速探測對象的方法和設(shè)備。
本發(fā)明的某些方面的另一目的是提供一種即使是在很大的圖像中也可以快速工作的在圖像中探測對象的方法。
本發(fā)明的某些方面的再一個目的是提供一種即使是在對象的外觀存在變化時也可在圖像中探測對象的牢靠準(zhǔn)確的方法。
本發(fā)明的某些方面的再一個目的是提供一種適用于包裹自動分揀應(yīng)用的在圖像中探測對象的方法。
在本發(fā)明的優(yōu)選實施方式中,要在圖像中探測的有關(guān)對象是根據(jù)組成該對象的線段確定的,尤其是根據(jù)線段的筆畫寬度進(jìn)行確定的。(在本申請的說明書的上下文和權(quán)利要求中,名詞“線段”應(yīng)該理解為任何細(xì)長的特征,不論是直線的還是曲線的)。當(dāng)這些線段出現(xiàn)在圖像中時,其寬度預(yù)期在預(yù)定范圍內(nèi)。此范圍包含屬于此對象的線段的已知的筆畫寬度,但進(jìn)行了擴展,以考慮到圖像中的實際線段可能由于畸變、縮放、對比度變化或其他原因而引起的寬度的偏差。為了發(fā)現(xiàn)此對象,針對具有此范圍內(nèi)的寬度的所有的特征對圖像進(jìn)行快速搜索。此方法一般允許在只對圖像中的像素的一個小子集進(jìn)行掃描的基礎(chǔ)上迅速地定位有關(guān)的小的區(qū)域組,在這些區(qū)域中的某個中發(fā)現(xiàn)該對象的幾率很高。
在本發(fā)明的一些優(yōu)選實施方式中,在一系列的連續(xù)階段中,在灰度級圖像中搜索有關(guān)對象。每個階段相對上一個階段縮小搜索區(qū)域,同時逐漸逼近搜索的特定對象。在第一階段,通過探測看起來像是存在于具有在預(yù)定范圍內(nèi)的寬度的特征中的像素群(cluster of pixels)而定位有關(guān)區(qū)域。之后,對有關(guān)區(qū)域進(jìn)行掃描以求發(fā)現(xiàn)對比度峰值,即沿著選取的穿過這些區(qū)域的掃描線出現(xiàn)的灰度級的突變。當(dāng)此種峰的幅度超過給定的閾值,并且其寬度在所述范圍內(nèi)時,則它就是組成有關(guān)對象的線段之一的一部分的候選。在區(qū)域增長過程中,候選峰的形態(tài)膨脹成“斑點(stain)”,即具有大致同一灰度值的連通像素組。之后,將現(xiàn)有技術(shù)中公知的高級圖像識別過程應(yīng)用于每個斑點,以便確定哪一個斑點或哪些個斑點對應(yīng)于有關(guān)對象。此最后階段是唯一取決于對象本身的階段,并且這一階段的執(zhí)行只針對包含于斑點中的所有像素的很小的子集。
此處所描述的方法特別適合于識別標(biāo)記、符號和粘貼于包裹上的標(biāo)簽,應(yīng)用于快速掃描和分揀應(yīng)用中。不過,本發(fā)明的原理也可應(yīng)用于多種需要在大的圖像中快速定位有關(guān)對象而又要避免由于圖像中的變化和畸變引起的識別錯誤的其他情況中。
因此,根據(jù)本發(fā)明的優(yōu)選實施方式,提供了一種在圖像中探測預(yù)定對象的方法,包括選擇屬于此對象的線段,此線段具有已知的筆畫寬度;確定最大寬度和最小寬度,兩者一起可確定包含筆畫寬度的寬度范圍;在圖像中查找具有在該范圍內(nèi)的特征寬度的特征;以及對該特征進(jìn)行處理以便判斷其是否是所述對象的一部分。
最好,確定最大和最小寬度的步驟包括確定當(dāng)對象出現(xiàn)于圖象中時對象中的線段寬度可能出現(xiàn)的變化。
在優(yōu)選實施方式中,在圖像查找特征的步驟包括在圖像中搜索屬于其寬度小于最大寬度的一個或多個圖像元素的像素的第一軌跡(locus);在圖像中搜索屬于其寬度小于最小寬度的一個或多個圖像元素的像素的第二軌跡;取第一和第二軌跡的邏輯和。
最好,搜索第一軌跡的步驟包括搜索一個像素,其灰度值與其他與其相距所述最大寬度的像素的灰度值相差至少一個預(yù)定的對比度閾值。另外一種方式或增加的一種方式為,搜索圖像中的特征的步驟包括在搜索軌跡之前對圖像進(jìn)行子采樣,于是只有圖像中的所有像素的一個子集被考慮包括到軌跡中。還有另外一種方式或增加的一種方式為,在圖像中搜索特征的步驟包括將在第一和第二軌跡的邏輯和中的像素的群確定為圖像中的有關(guān)區(qū)域,該區(qū)域是包含對象的候選區(qū)域。
在另一個優(yōu)選實施方式中,搜索圖像中的特征的步驟包括在圖像中確定一個有關(guān)區(qū)域,該區(qū)域是包含對象的候選區(qū)域;選擇穿過該有關(guān)區(qū)域的掃描線;評估位于此掃描線上的像素的灰度值,查找互相分開的距離在所述范圍內(nèi)的對比度躍變對;最好,選擇掃描線的步驟包括選擇多個掃描線其間的間隔相應(yīng)于對象的尺寸而確定。另外一種方式或增加的一種方式為,評估灰度值的步驟包括搜索下面這樣的對比度躍變,即在掃描線上選取的像素對(任何給定躍變兩側(cè)各一個像素)各自的灰度值之間的差別超過預(yù)定閾值。最好的是,像素對互相之間的距離選擇為筆畫寬度的函數(shù)。
最好,特征的處理步驟包括搜索至少一個屬于該特征的初始像素的軌跡;以及擴張該軌跡來重構(gòu)對象中的線段,這最好是通過在軌跡上添加一個與至少一個初始像素鄰接并具有超出閾值的灰度值的附加像素來實現(xiàn),上述閾值是相應(yīng)于至少一個初始像素的灰度值設(shè)定的。
最好,向此軌跡上添加附加像素的步驟包括添加第一附加像素,并且擴展軌跡的步驟還包括繼續(xù)進(jìn)一步添加與軌跡中的像素鄰接并具有各自的超出相應(yīng)的閾值的灰度值的附加像素;以及當(dāng)軌跡達(dá)到根據(jù)對象的尺寸決定的最大尺寸時停止進(jìn)一步添加附加像素。
另外,對特征的處理步驟最好包括對擴展的軌跡進(jìn)行處理,以便使軌跡與對象匹配。
在優(yōu)選實施方式中,對象包括物件上的一個或多個標(biāo)記,根據(jù)這些標(biāo)記,由分揀系統(tǒng)對所述構(gòu)件進(jìn)行分揀,并且其中對特征的處理步驟包括識別所述標(biāo)記,并且還包括根據(jù)識別的標(biāo)記對物件進(jìn)行分揀。
根據(jù)本發(fā)明的優(yōu)選實施方式,還提供一種在圖像中探測預(yù)定對象的設(shè)備,其構(gòu)成包括一個用來在圖像中搜索其寬度在預(yù)定最大寬度和最小寬度之間的范圍內(nèi)的特征的圖像處理器,此范圍這樣確定,使得屬于此對象的線段的已知的筆畫寬度處于此范圍之內(nèi),所述圖像處理器還用來對所述特征進(jìn)行處理,判斷其是否是對象的一部分。
最好,此設(shè)備包括圖像捕捉裝置,配置成為可捕捉包括對象的圖像,并將此圖像的電子表達(dá)傳送到圖像處理器。在優(yōu)選實施方式中,對象包括物件上的一個或多個標(biāo)記,由分揀系統(tǒng)根據(jù)這些標(biāo)記對物件進(jìn)行分揀,并且此設(shè)備可讀出這些標(biāo)記并根據(jù)這些標(biāo)記對物件進(jìn)行分揀。
根據(jù)本發(fā)明的優(yōu)選實施方式,還提供一種在圖像中搜索預(yù)定對象的計算機軟件產(chǎn)品,其構(gòu)成包括計算機可讀媒體,其中存放有程序指令,這些指令,在由計算機讀出時,使計算機在圖像中搜索其特征寬度在預(yù)定最大寬度和最小寬度之間的范圍內(nèi)的特征,此范圍這樣確定,使得屬于此對象的線段的已知的筆畫寬度處于此范圍之內(nèi),所述程序指令還使計算機對所述特征進(jìn)行進(jìn)一步處理,以便判斷其是否是對象的一部分。
通過藉助下面附圖的對本發(fā)明的詳細(xì)描述可以對本發(fā)明獲得更全面的了解。
圖1為本發(fā)明的優(yōu)選實施方式的包裹分揀系統(tǒng)的示意圖。
圖2為根據(jù)本發(fā)明的優(yōu)選實施方式的用來識別圖像中的對象的方法的示意流程圖。
圖3為根據(jù)本發(fā)明的優(yōu)選實施方式,特別適用于圖2的目標(biāo)識別方法的,用來在圖像中探測有關(guān)區(qū)域的方法的示意流程圖。
圖4為在圖1的系統(tǒng)中捕捉的圖像的再現(xiàn),其中,有關(guān)區(qū)域已利用圖2和圖3的方法加以識別。
圖5示出的是作為沿著穿過圖4中有關(guān)區(qū)域之一的一條線段的像素位置的函數(shù)的灰度值曲線。
圖6是根據(jù)本發(fā)明的優(yōu)選實施方式,由圖5的灰度值導(dǎo)出的微分函數(shù)曲線。
圖7為根據(jù)本發(fā)明的優(yōu)選實施方式,特別適用于圖2的目標(biāo)識別方法的區(qū)域增長方法的示意流程圖。
圖8示出的是根據(jù)本發(fā)明的優(yōu)選實施方式,通過將圖2和7的方法應(yīng)用于圖4的圖像而生成的斑點的圖像的再現(xiàn)。
具體實施例方式
圖1為根據(jù)本發(fā)明的優(yōu)選實施方式的包裹分揀系統(tǒng)20的示意圖。其上具有標(biāo)簽24的包裹22由傳送帶26傳送。包裹的灰度級的圖像由攝象機28捕捉,最好是線性攝象機(line camera),或是電視攝像機或照相機。由攝象機捕捉的圖像數(shù)字化并傳送到處理器30,而處理器30應(yīng)用下述的方法來識別標(biāo)簽24和/或包裹22上的其他特征。或者是,處理器可接收來自其他源的圖像,或可從存儲器(圖中未示出)中提取圖像。被識別的標(biāo)簽然后由分揀器32自動讀出并由其為包裹分配相應(yīng)的路線。
處理器30的構(gòu)成最好是包括一個利用適當(dāng)?shù)能浖幊桃员銏?zhí)行本發(fā)明的方法的通用計算機。此軟件可通過網(wǎng)絡(luò)下載到處理器中,或者是可通過有形的媒體,如CD-ROM,提供并安裝于處理器中。此種軟件可以以類似的方式應(yīng)用于其他圖像處理應(yīng)用中,并且可以以類似的方式提供并安裝于其他計算機中?;蛘撸颂幩枋龅姆椒ㄒ部梢岳脤S玫挠布蚩删幊痰臄?shù)字信號處理器,或是利用專用的和/或可編程元件和/或軟件的組合實現(xiàn)。此處所描述的在包裹分揀系統(tǒng)20中使用處理器30只是示例而不是限制。
圖2為根據(jù)本發(fā)明的優(yōu)選實施方式的用來探測圖像中的對象的方法的示意流程圖。此方法特別可用來發(fā)現(xiàn)像包裹22上的標(biāo)簽24這樣的對象。盡管為了簡明起見,下面對此方法的描述是針對在圖像中探測單個對象的,但此方法可以很簡單地擴展到同時或順序地探測多個對象。
在核探測步驟40,在整個圖像中掃描像素的一個小子集,以探測寬度在預(yù)定范圍內(nèi)的圖像特征上的像素。為此目的所選擇的范圍取決于要探測的對象中的實際線段的寬度。這些像素稱為核。在聚合步驟42,利用現(xiàn)有技術(shù)中公知的任何合適的聚類算法將核聚為群。比如,圖像可分割為塊(tile)。計數(shù)每個塊中的核數(shù),核數(shù)超過給定閾值的塊被確定為屬于有關(guān)區(qū)域(ROI)。
圖3為根據(jù)本發(fā)明的優(yōu)選實施方式的核探測步驟40的細(xì)節(jié)的示意流程圖。在分揀步驟54,原始圖像利用因子D在水平和垂直方向上分揀,從而生成一個只包含具有由(nD,mD)給出的(x,y)坐標(biāo)的像素的子采樣圖像,其中n和m是整數(shù)。在此階段待掃描的像素數(shù)相對于原始圖像縮減為其D2分之一。
對于要在此圖像中搜索的對象,筆畫寬度的范圍是這樣確定的,即,使得組成圖像中的對象的線段極其可能具有范圍內(nèi)的筆畫寬度。此范圍由最大寬度w1和w2限定。在最大寬度測試步驟56中,對分樣圖像中的像素的灰度值P(x,y)進(jìn)行評估,以判斷它們是否滿足下面的復(fù)合條件P(x,y)<TAND{[P(x-w1,y)-P(x,y)]>t AND[P(x+w1,y)-P(x,y)]>tOR[P(x,y-w1)-P(x,y)]>t AND[P(x,y+w1)-P(x,y)]>tOR[P(x+d1,y+d1)-P(x,y)]>t AND[P(x-d1,y-d1)-P(x,y)]>tOR[P(x+d1,y-d1)-P(x,y)]>t AND[P(x-d1,y+d1)-P(x,y)]>t
}在這些式子中,T是灰度級閾值,而t是對比度閾值,兩者都根據(jù)有關(guān)圖像和對象的特點確定。參數(shù)d1等于w1/21/2。不等式P(x,y)<T測試像素的灰度值是否比閾值T暗。其余的不等式測試像素(x,y)和以此像素為中心的直徑為w1的圓的相對兩側(cè)的上的兩點之間的灰度級對比度是否大于t。雖然(x,y)取自分樣圖像,但圓上的點可取自原始的非分樣圖像。
滿足上述條件的像素在步驟56中標(biāo)記為“ON”,指示它們可能位于寬度小于最大筆畫寬度w1的線段上。在最小寬度測試步驟58中,在步驟56中對標(biāo)記為“ON”的像素重復(fù)同一過程,這一次使用最小筆畫寬度w2(和相應(yīng)的參數(shù)d2)。這樣,在此步驟中,將可能位于寬度小于最小筆畫寬度的線段上的像素標(biāo)記為“ON”。在XOR步驟60中,取在步驟56和58中標(biāo)記為“ON”的像素的邏輯和(“異或”)。邏輯和返回一個可能位于其寬度在最大和最小筆畫寬度之間的線段上的像素的列表。此列表輸入到步驟42以發(fā)現(xiàn)ROI。
此處援引作為參考文獻(xiàn)的美國專利申請09/310287(已轉(zhuǎn)讓給本專利申請的受讓人)描述了一種類似于在圖3的步驟56中執(zhí)行的算法。在該申請中,在圖像中識別寬度小于預(yù)定最大值的線段,來發(fā)現(xiàn)文本像素,以便在執(zhí)行光學(xué)字符識別的準(zhǔn)備中進(jìn)行最優(yōu)二值化。不過在該申請中未提及排除寬度小于更小的最小寬度的線段。
圖4為在系統(tǒng)20中捕捉的包裹22的圖像的再現(xiàn),其中示出了根據(jù)本發(fā)明的優(yōu)選實施方式,在步驟42中發(fā)現(xiàn)的ROI66和68。在此示例中,在圖像中搜索的對象是一個三角形的郵政標(biāo)簽64,該郵政標(biāo)簽64包含在ROI66中。在步驟40中使用的最大和最小寬度是根據(jù)形成三角形各邊的暗色邊界線確定的。在此階段發(fā)現(xiàn)的另外的ROI68也包含寬度大約為標(biāo)簽的邊界線64的寬度的線段。
返回圖2。在對比度峰值提取步驟44中,對每個ROI中的灰度值沿著一組所選擇的穿過ROI的掃描線進(jìn)行掃描。掃描線可以是水平的、垂直的或?qū)堑?。盡管每個ROI有一個單個掃描線就可能足夠,但最好是每個ROI使用兩個或三個掃描線以保證搜索更為可靠。最好,掃描線之間的相對取向和間隔根據(jù)所搜索的對象的大小和形狀來選擇。無論如何,掃描線只包含ROI中的所有像素的一小部分。
圖5示出的是沿著穿過ROI66的掃描線之一的灰度級像素值f(x)的曲線。在此圖和下述的描述中,灰度值是顛倒的,所以255表示黑色,而0表示白色。曲線中的峰相應(yīng)于強烈的對比度變化,這種變化,除其他因素之外,可以在掃描線穿過三角形標(biāo)簽64的暗色邊界線之一的區(qū)域中遇到。為了評估這些峰的寬度和幅度,定義一個微分函數(shù)d(x)d(x)=f(x)-f(x-L)其中的L是所搜索的對象中的線段的預(yù)期筆畫寬度的一半。
圖6示出的是由圖5的像素值f(x)導(dǎo)出的微分函數(shù)d(x)的曲線。圖像中的對比度峰(CP)由d(x)中的一對正負(fù)峰,如峰74和76,的出現(xiàn)確定。為了確定一個CP,正負(fù)峰的幅值必須超過各自的預(yù)定閾值,并且峰間的間隔必須處于對象線段的預(yù)定最大和最小寬度限度之內(nèi)?;诖碎g隔標(biāo)準(zhǔn),峰74和76可代表一個CP,而峰78和80可代表另一個,但是峰82和84相距過遠(yuǎn),不能代表CP,因此被廢棄。
對于幅值閾值,可以觀察到,峰76和78比峰74和80相對較弱。峰76和78代表標(biāo)簽64中的三角形的邊界線和三角形內(nèi)的暗灰色區(qū)域之間的躍變。這些躍變的特點在于比對比度比峰74和80代表的邊界線和三角形外部的亮灰色區(qū)域之間的躍變的對比度更低。為了處理這一差別,應(yīng)用于內(nèi)峰76和78的閾值最好是比應(yīng)用于外峰74和80的低一些。以這些閾值(根據(jù)對所搜索的對象的已知知識確定)表示的對比度特性不論圖像中的對象取向如何,也不論對掃描線的分析是從左到右還是從右到左,均是適用的。任何滿足對比度和峰間隔標(biāo)準(zhǔn)的CP都在步驟44中標(biāo)記為候選CP。CP的位置標(biāo)記為相應(yīng)的正負(fù)峰對的中心處的像素。
在半徑測試步驟46中,對于在步驟44中發(fā)現(xiàn)的每個CP計算半徑。此半徑定義為從CP到最近的“白”像素的距離。用于此目的的白像素定義為其灰度值較CP中心處像素更明亮,差值大于預(yù)定閾值的像素。在步驟44中,對比度是只沿著掃描線測量,而在步驟46中,對比度是在圍繞CP中心像素的所有方向上測量。如果從中心像素到最近的白像素的距離小于或大于寬度范圍的預(yù)定極限,則相應(yīng)的CP就廢棄。只有滿足半徑標(biāo)準(zhǔn)的CP進(jìn)入斑點形成步驟48,在此步驟中這些CP經(jīng)過擴張操作以重構(gòu)ROI中的對象。
圖7為根據(jù)本發(fā)明的優(yōu)選實施方式的斑點形成步驟48的細(xì)節(jié)的示意流程圖。在種子選擇步驟90中,對于每個ROI,將在ROI中發(fā)現(xiàn)的CP之一選作擴張為斑點的種子。在此時也選擇一個對比度閾值,應(yīng)用此閾值來判斷ROI中的哪些其他像素應(yīng)該添加到屬于該斑點的像素列表中,見下述。最好,此閾值根據(jù)種子的灰度值來選擇,比如,為種子灰度值(其中黑色=255)的預(yù)定比例或是圖像中種子和附近的背景像素之間的對比度的函數(shù)。這樣,針對可能出現(xiàn)于圖像的不同部分的對比度和/或亮度的變化,調(diào)整后續(xù)的斑點擴張步驟。最好是,如果在ROI之中存在多個CP,將亮度最大的CP初始選擇為種子。對此明亮的CP選擇的相對低的閾值也會將屬于同一斑點的ROI中的較暗的CP吸收進(jìn)來。
為開始擴張斑點,將一個指針初始化,指向斑點中的像素列表中的第一個像素,即指向種子本身(此時為列表上唯一的像素)。在鄰像素檢查步驟92中,當(dāng)前由指針指示的此像素的所有的相鄰像素都經(jīng)受檢查。對于每一個相鄰像素,在像素檢查步驟94中,首先判斷此相鄰像素是否已經(jīng)被考慮過是否包括到此斑點中。如果不是,就在灰度檢查步驟96中檢查該相鄰像素的灰度值,以便判斷它是否比在步驟90中確定的閾值暗。如果是,就在像素添加步驟98中將此像素添加到斑點的像素列表中。在鄰域完成步驟100中,判斷此種子是否還有任何其他的相鄰像素有待檢查,如果是,就在下一個相鄰像素步驟101中選擇下一個相鄰像素。重復(fù)步驟94至101一直到指針當(dāng)前指示的像素的所有的相鄰像素全部檢查完畢為止。
在當(dāng)前像素的所有的相鄰像素都已經(jīng)檢查完畢時,在列表檢查步驟102中對斑點中的像素的當(dāng)前列表進(jìn)行檢查以便判斷在列表中是否還存在其相鄰點尚未經(jīng)檢查的像素。如果在列表中還存在這樣的像素,就在尺寸監(jiān)測步驟104檢查斑點的當(dāng)前尺寸,以便確信斑點還未超出預(yù)定尺寸限度。此限度由在圖像中要搜索的對象的大小給出。如斑點的大小超過尺寸限度,則終止斑點擴張,以便避免在與對象不相對應(yīng)的斑點上浪費處理時間。不過,只要未超過尺寸限度,就在下一個像素步驟106中將此指針增加1指向列表中的下一個像素,并重復(fù)前面的步驟。
當(dāng)在步驟102中發(fā)現(xiàn)此過程到達(dá)列表底部時,就在CP檢查步驟108中,檢查當(dāng)前ROI中的剩余CP,以便判斷是否有CP未包括在現(xiàn)有列表中。如有,就在步驟90中將這些CP之一選作新種子,并且重復(fù)整個過程。如果同時在圖像中搜索多個不同的對象,最好是首先將可能與最大的對象相對應(yīng)的CP進(jìn)行擴張。這些CP在步驟104中將具有較大的尺寸限度,得到的大斑點可能吸收掉被認(rèn)為與較小的對象相對應(yīng)的CP擴張時會生成的較小的斑點,從而可縮減完成ROI所要求的總的處理時間。
圖8示出的是通過將步驟44、46和48(圖2)應(yīng)用于在圖4的圖像中確定的ROI66和68而生成的斑點的二值圖像的再現(xiàn)。為生成這些斑點,首先利用間隔為三角形64的高度的一半的掃描線在步驟44中在ROI中發(fā)現(xiàn)對比度峰。三角形的暗色邊界線在相對應(yīng)的斑點中可清楚地識別。也生成了恰巧包含寬度與三角形的邊界線類似的線段其他斑點110和112。
最后,在示于圖2的對象識別步驟50中,分析斑點圖像,以識別有關(guān)對象及其在整個圖像中的位置。在此步驟中可以應(yīng)用現(xiàn)有技術(shù)中公知的各種圖像識別算法,或是利用單獨的二值斑點圖像,或是利用原始圖像中相對應(yīng)的灰度級信息。在此階段中最佳算法的選擇取決于對象的具體特點,超出了本發(fā)明的范圍。不過,很明顯,相對于現(xiàn)有技術(shù)中公知的對象識別算法必須應(yīng)用于整個圖像的圖像處理方法,執(zhí)行此算法所要求的時間將可以大大縮減,并且對象識別的可靠性可以大大提高。
雖然上述優(yōu)選實施方式涉及到一定類型的灰度級圖像的處理,但可以理解,本發(fā)明的原理可以很簡單地用來處理任何類型的圖像,包括彩色圖像。可以理解,上面描述的優(yōu)選實施方式只是示例,本發(fā)明不局限于上面具體示出和描述的內(nèi)容。正相反,本發(fā)明的范圍既包括上述各種特征的組合和子組合,也包括本專業(yè)人士在閱讀上述說明會想到的在現(xiàn)有的技術(shù)中未公開的變化和變型。
權(quán)利要求
1.一種在圖像中探測預(yù)定對象的方法,包括選擇屬于此對象的線段,此線段具有已知的筆畫寬度;確定最大寬度和最小寬度,兩者一起確定一個包含所述筆畫寬度的寬度范圍;在所述圖像中搜索特征寬度在該范圍內(nèi)的特征;以及對該特征進(jìn)行處理以便判斷其是否是對象的一部分。
2.如權(quán)利要求1的方法,其中,確定最大和最小寬度的步驟包括確定當(dāng)對象出現(xiàn)于圖象中時對象中的線段寬度可能出現(xiàn)的變化。
3.如權(quán)利要求1的方法,其中,在圖像中搜索特征的步驟包括在圖像中搜索屬于其寬度小于所述最大寬度的一個或多個圖像元素的像素的第一軌跡;在圖像中搜索屬于其寬度小于所述最小寬度的一個或多個圖像元素的像素的第二軌跡;取第一和第二軌跡的邏輯和。
4.如權(quán)利要求3的方法,其中,搜索第一軌跡的步驟包括搜索一個像素,其灰度值與其他與其相距所述最大寬度的像素的灰度值相差至少一個預(yù)定對比度閾值。
5.如權(quán)利要求3的方法,其中搜索圖像中的特征的步驟包括在搜索軌跡之前對圖像進(jìn)行子采樣,于是只有圖像中的所有像素的一個子集被考慮包括到軌跡中。
6.如權(quán)利要求3的方法,其中在圖像中搜索特征的步驟包括將在第一和第二軌跡的邏輯和中的像素的群確定為圖像中的有關(guān)區(qū)域,該區(qū)域是包含對象的候選區(qū)域。
7.如權(quán)利要求1的方法,其中,搜索圖像中的特征的步驟包括在圖像中確定一個有關(guān)區(qū)域,該區(qū)域是包含對象的候選區(qū)域;選擇穿過該有關(guān)區(qū)域的掃描線;評估位于此掃描線上的像素的灰度值,查找互相分開的距離在所述范圍內(nèi)的對比度躍變對。
8.如權(quán)利要求7的方法,其中,選擇掃描線的步驟包括選擇多個掃描線,其間的間隔相應(yīng)于對象的尺寸而確定。
9.如權(quán)利要求7的方法,其中,評估灰度值的步驟包括搜索下面這樣的對比度躍變,即,在掃描線上選取的像素對各自的灰度值之間的差別超過預(yù)定閾值,所述像素對為在給定的一個躍變兩側(cè)各一個像素。
10.如權(quán)利要求9的方法,其中,像素對互相之間的距離選擇為筆畫寬度的函數(shù)。
11.如權(quán)利要求1的方法,其中,特征的處理步驟包括搜索至少一個屬于該特征的初始像素的軌跡;以及擴張該軌跡來重構(gòu)對象中的線段。
12.如權(quán)利要求11的方法,其中擴張該軌跡的步驟包括通過在軌跡上添加一個與至少一個初始像素鄰接并具有超出閾值的灰度值的附加像素。
13.如權(quán)利要求12的方法,其中,向該軌跡上添加附加像素的步驟包括添加第一附加像素,其中,所述擴展軌跡的步驟還包括繼續(xù)進(jìn)一步添加與軌跡中的像素鄰接并具有各自的超出相應(yīng)的閾值的灰度值的附加像素;以及當(dāng)軌跡達(dá)到根據(jù)對象的尺寸決定的最大尺寸時停止進(jìn)一步添加附加像素。
14.如權(quán)利要求11的方法,其中,對特征的處理步驟包括對擴展的軌跡進(jìn)行處理,以便使軌跡與對象匹配。
15.如權(quán)利要求1的方法,其中,對象包括物件上的一個或多個標(biāo)記,根據(jù)這些標(biāo)記由分揀系統(tǒng)對所述物件進(jìn)行分揀,其中,對特征的處理步驟包括識別所述標(biāo)記,根據(jù)識別的標(biāo)記對物件進(jìn)行分揀。
16.一種在圖像中探測預(yù)定對象的設(shè)備,其構(gòu)成包括一個用來在圖像中搜索其寬度在預(yù)定最大寬度和最小寬度之間的范圍內(nèi)的特征的圖像處理器,此范圍這樣確定使得屬于此對象的線段的已知的筆畫寬度處于此范圍之內(nèi),所述圖像處理器還用來對所述特征進(jìn)行處理,判斷其是否是對象的一部分。
17.如權(quán)利要求16的設(shè)備,還包括圖像捕捉裝置,配置成為可捕捉包括對象的圖像,并將此圖像的電子表達(dá)傳送到圖像處理器。
18.如權(quán)利要求17的設(shè)備,其中,對象包括物件上的一個或多個標(biāo)記,由分揀系統(tǒng)根據(jù)這些標(biāo)記對物件進(jìn)行分揀,并且此設(shè)備可讀出這些標(biāo)記并根據(jù)這些標(biāo)記對物件進(jìn)行分揀。
19.一種在圖像中搜索預(yù)定對象的計算機軟件產(chǎn)品,其構(gòu)成包括計算機可讀媒體,其中存放有程序指令,這些指令,在由計算機讀出時,使計算機在圖像中搜索其特征寬度在預(yù)定最大寬度和最小寬度之間的范圍內(nèi)的特征,此范圍這樣確定,使得屬于此對象的線段的已知的筆畫寬度處于此范圍之內(nèi),所述程序指令還使計算機對所述特征進(jìn)行進(jìn)一步處理,以便判斷其是否是對象的一部分。
全文摘要
一種在圖像中探測預(yù)定對象的方法,包括選擇屬于此對象的線段,此線段具有已知的筆畫寬度;確定最大寬度(56)和最小寬度(58),兩者一起確定包含筆畫寬度的寬度范圍(60);在圖像中搜索具有在該范圍內(nèi)的特征寬度的特征;并對該特征進(jìn)行處理以便判斷其是否是對象的一部分。
文檔編號G06T7/00GK1430764SQ01809761
公開日2003年7月16日 申請日期2001年3月26日 優(yōu)先權(quán)日2000年5月22日
發(fā)明者埃亞爾·亞艾爾, 亞科夫·納豐, 埃拉·巴坎 申請人:國際商業(yè)機器公司