專利名稱:借助hough變換分割郵政物品的數(shù)字圖像的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種處理郵政物品的數(shù)字圖像,以通過將自動識別地址的算法應(yīng)用于所述圖像自動地讀取在所述物品上郵政地址的方法。
背景技術(shù):
這個方法尤其要在自動分選郵政包裹的過程中自動地讀取郵政包裹的郵政地址。信件類郵政物品的地址通常通過沿其邊緣輸送每封信件以使得信件經(jīng)過采集信件數(shù)字圖像的攝像機(jī)的前面來自動讀取,其圖像隨后可以被二進(jìn)制化和過濾。一般來說,在信件上構(gòu)成要自動讀取的郵政地址的字符行平行于信的底部或與其垂直,即平行于圖像的某一條邊,這樣使得自動識別地址的算法可以通過在圖像的一邊所給出的方向上使圖像中的字符解碼直接應(yīng)用于數(shù)字圖像的矩形部分。
包裹類郵政物品通常是體積龐大的物品并被平放在輸送帶上輸送。對于這種類型的輸送機(jī)和這種類型的郵政物品,依靠由圖像中預(yù)定坐標(biāo)所提供的地址行的優(yōu)先方向不再可能自動讀取在包裹數(shù)字圖像中的郵政地址。
發(fā)明內(nèi)容
本發(fā)明的目的是要提供一種處理郵政包裹的數(shù)字圖像以便能自動讀取每個包裹上郵政地址問題的解決方案。
為此目的,本發(fā)明提供一種處理郵政物品的數(shù)字圖像以便通過將自動地址識別算法應(yīng)用于所述圖像來自動讀取在所述物品上郵政地址的方法,該方法特征在于將圖像細(xì)分成同一尺寸的圖像塊;將依據(jù)Hough變換的處理應(yīng)用于每個圖像塊以便在上述圖像塊中識別在所考慮的圖像塊上像點(diǎn)分布的優(yōu)先方向;將具有共同優(yōu)先方向的圖像的相鄰圖像塊分組到一起,以便規(guī)定包含具有共同優(yōu)先方向的所述相鄰像塊組的矩形所考慮區(qū)域,使得所述矩形所考慮區(qū)域具有一條平行于所述共同優(yōu)先方向的縱向邊;以及將自動地址識別算法應(yīng)用于所述圖像的所考慮區(qū)域以自動讀取郵政地址。
用這種方法,獲得平行于郵政地址中的字符行縱向延伸的矩形所考慮區(qū)域,因此既使郵政地址的行未沿數(shù)字圖像的一邊排列,如信件類郵政物品的情況,也可能沿所述所考慮區(qū)域的縱向邊將自動地址識別算法應(yīng)用于對應(yīng)所述所考慮區(qū)域的數(shù)字圖像部分。
本發(fā)明方法的執(zhí)行將被更詳細(xì)地說明并在附圖中展示。
圖1是表示在本發(fā)明的方法中各步驟的簡要流程圖。
圖2是包裹的數(shù)字圖像圖,該圖包括一個郵政地址。
圖3是表示分割成構(gòu)成瓦片(tile)的圖像塊的圖2中包裹圖像的一個圖。
圖4是在圖2的包裹上的一組包含郵政地址信息的瓦片圖。
圖5是表示由圖4所示的那組瓦片所形成的在圖2圖像中的所考慮區(qū)域圖。
圖6表示Hough變換如何被用于一個瓦片。
具體實(shí)施例方式
圖1是表示一部分分選郵政包裹流程的非常概略的流程圖,該流程包括處理包裹的數(shù)字圖像以便從用于分選流程的每個郵政包裹自動讀取郵政地址的步驟,所述分選流程在于將上述包裹自動引向?qū)?yīng)的分選出口。
在步驟10,平放在輸送帶上被運(yùn)載的包裹在采集包裹數(shù)字圖像的攝像機(jī)下面經(jīng)過。根據(jù)圖2能看見一個包裹的數(shù)字圖像IP圖,該圖像包括郵政地址AP,并且能看見在這個圖像中郵政地址AP的行未轉(zhuǎn)向平行于圖像的一條邊。一般來說,這個數(shù)字圖像要經(jīng)歷如二進(jìn)制化、消除單獨(dú)的黑象素......這樣的操作,這些操作是為了縮小相對應(yīng)的計(jì)算機(jī)文件大小及為了消除在原始圖像中出現(xiàn)而且無用的干擾數(shù)據(jù)。因此,由代表灰度的象素初始定義的圖像被簡化為黑點(diǎn)或白點(diǎn),其中每個點(diǎn)可以根據(jù)處理的類型代表一個象素,或者一組象素,或者實(shí)際上在原始圖像中象素的任何其它簡化組合。用這種方式,原始圖像可以被簡化為,例如,一系列坐標(biāo),每對坐標(biāo)定義圖像中的一個黑點(diǎn)。
在本發(fā)明的方法中,在步驟20,數(shù)字圖像IP(在二進(jìn)制化和過濾之后)被細(xì)分或分割成下文稱作“瓦片”的相同圖像塊。根據(jù)圖3,能看見圖2的圖像被分割成72塊瓦片IT,每塊瓦片都是方形。
這個分割步驟的目的是要在后續(xù)步驟30中使識別每塊瓦片中黑點(diǎn)分布的優(yōu)先方向成為可能。尤其,一個瓦片的優(yōu)先方向?qū)?yīng)于寫在瓦片上一行或多行字符的方向,所述的優(yōu)先方向通過將一個算法應(yīng)用于每塊瓦片而被識別。為確保應(yīng)用這種算法的結(jié)果是恰當(dāng)?shù)?,重要的是瓦片的大小要大致對?yīng)于詞的大小或者對應(yīng)于多個字符的大小。實(shí)際上,瓦片比如可以是包裹上具有2cm×2cm尺寸的方形。一個用于識別在一塊瓦片上優(yōu)先方向的算法在下文更詳細(xì)敘述。因此,在步驟30結(jié)束時,對于每個瓦片優(yōu)先方向是已知的,其方向一般對應(yīng)于瓦片中字符行的方向,或者對應(yīng)于與其垂直的方向。
在步驟40中,通過利用在任何一組中瓦片的優(yōu)先方向大體上是平行或垂直的,以及瓦片是相鄰的準(zhǔn)則形成一組或多組瓦片。圖4表示在圖像IP中利用本發(fā)明的方法識別的一組瓦片GI。如能看到的,這組瓦片包含地址AP,但它還不是矩形形式。
在步驟50中,與在步驟40中所提供的每組瓦片相關(guān)的所考慮區(qū)域被建立。對于一組瓦片,計(jì)算最普通的或者在該組瓦片中使用最廣泛的優(yōu)先方向而這個優(yōu)先方向與該組瓦片有關(guān),其后,包含該組瓦片中所有瓦片且具有平行于該組瓦片優(yōu)先方向的一個邊的最小矩形被計(jì)算以確定對應(yīng)于研究中的該組瓦片的所考慮區(qū)域。根據(jù)圖4和5,可以看見由圖像IP所建立的所考慮區(qū)域ZI,該區(qū)域包含有平行于由所考慮區(qū)域ZI所構(gòu)成的矩形一個底邊的成行書寫的目的地址。圖5表示在步驟50中利用本發(fā)明的方法從數(shù)字圖像IP提取的所考慮區(qū)域ZI。
在步驟50中所識別的一個或多個所考慮區(qū)域隨后在步驟60中利用與每個所考慮區(qū)域有關(guān)的優(yōu)先方向由一個自動字符識別算法所檢驗(yàn),以提取查看的包裹郵政地址。
如在步驟30所使用的檢測一個瓦片優(yōu)先方向的算法可以借助于將一個極性Hough變換應(yīng)用于一個瓦片來開始。Hough變換在《(圖形識別)》第29卷第10期第1609頁由B.Yu和A.K.Jain所著的著作“Robuston fast squew detection algorithm for generic documents”中被詳細(xì)描述,它使極坐標(biāo)表格能從一個瓦片畫出,所述極坐標(biāo)表格利用包含于該瓦片中一定數(shù)量的直線中每條線上的黑點(diǎn)數(shù)量。在具有兩個輸入量(r、θ)的極坐標(biāo)表格中,每對(r、θ)對應(yīng)一條直線D(r、θ),在極坐標(biāo)表格中一個特定對(r、θ)的值對應(yīng)于由直線D(r、θ)所包含的黑點(diǎn)數(shù)。圖6表示一個邊為C的方形瓦片IT,其中可以看到包含黑點(diǎn)N(x,y)的直線D(r、θ)是一條經(jīng)過點(diǎn)P(r、θ)且垂直于向量OP(r、θ)的直線,在這里O代表與瓦片有關(guān)的坐標(biāo)系的原點(diǎn)。尤其,向量OP(r、θ)是一個其模為Y及其極角為0的向量。對于具有以圖像左下角為中心的坐標(biāo)系的邊為C的方形瓦片,橫貫所述方形瓦片的這組直線包含于滿足C<r≤C· 及0°≤θ<180°條件的那組直線D(r、θ)。
因此,在如圖6所示的2cm×2cm瓦片中,決定使數(shù)據(jù)以半徑2mm間隔,角度10。間隔離散,有可能構(gòu)成具有24列和18行的極坐標(biāo)表格,每列對應(yīng)一個具體的半徑值,每行對應(yīng)一個具體的角度值。這個表格被初始化,以便使所有的對(r、θ)為0并利用關(guān)系式(※)r=X·cos(θ)+Y·sin(θ)從瓦片中每個黑點(diǎn)N(x,y)開始逐步填充該表格。
對于一個黑點(diǎn)N(x,y),利用選擇的間距以及在2mm內(nèi)四舍五入,在θ=0°時的r值利用等式(※)被計(jì)算,以形成一對(r(0°),0°)。然后在瓦片的極坐標(biāo)表格中向坐標(biāo)(r(0°),0°)單元加1。這個操作隨后對θ=10°、20°、30°......170°執(zhí)行。
應(yīng)該對瓦片中的每個黑點(diǎn)執(zhí)行這個次序的操作以建立該瓦片的極坐標(biāo)表格。以這種方式所獲得的極坐標(biāo)表格隨后為每對(r、θ)列出在直線D(r、θ)上的黑點(diǎn)數(shù),所述直線特別是具有為使數(shù)據(jù)離散由選定間距給出的2mm寬的窄帶形式。
為了從該極坐標(biāo)表格提取對應(yīng)于瓦片的優(yōu)先方向,對于每個角θ計(jì)算和S2(θ),即在極坐標(biāo)表格中一整行各項(xiàng)的平方和,并且隨后選擇具有S2(θ)最大值的角度θ。
則對應(yīng)于瓦片優(yōu)先方向的角α為α=θ+90°。例如,一個這種瓦塊是由在120°方向的直線上排列的二個黑點(diǎn)構(gòu)成,得出S2(30°)=22=4及對于θ≠30°S2(θ)=12+12=2,接著通過把這個算法應(yīng)用于所述瓦塊所得到的優(yōu)先方向是α=120°。
如能見到的,基于Hough變換的算法在檢測圖像中點(diǎn)的分布的優(yōu)先方向方面是有效的,但是它不能提供圖像中點(diǎn)的位置數(shù)據(jù),所以它不足以識別郵政包裹圖像中的所考慮區(qū)域。通過在將這樣的算法應(yīng)用于每個瓦片之前利用本發(fā)明的方法把圖像分割成瓦片,分析圖像以提供足夠信息以便能夠確定能迅速利用一個自動地址識別算法的所考慮區(qū)域。
權(quán)利要求
1.一種處理郵政物品的數(shù)字圖像(IP)通過將一種自動地址識別算法應(yīng)用于所述圖像來自動地讀取在所述物品上郵政地址(AP)的方法,該方法的特征在于將圖像細(xì)分(20)成同樣大小的圖像塊;將基于Hough變換的處理應(yīng)用(30)于每個圖像塊,以便在上述圖像塊中識別在所考慮的該像塊中的像點(diǎn)分布的優(yōu)先方向;將具有共同優(yōu)先方向的相鄰圖像塊分組(40)到一起,以便定義(50)一個包含具有共同優(yōu)先方向的所述相鄰圖像塊的組的矩形所考慮區(qū)域(ZI),所述矩形所考慮區(qū)域(ZI)具有一條平行于所述共同優(yōu)先方向的縱向邊;以及將自動地址識別算法應(yīng)用于圖像中的所述所考慮區(qū)域以便于自動讀取郵政地址。
全文摘要
本發(fā)明涉及借助HOUGH變換分割郵政物品的數(shù)字圖像。為分割郵政包裹的數(shù)字圖像以便自動地讀取在所述包裹上的郵政地址(AP),該方法在于:將圖像細(xì)分(20)成同樣大小的圖像塊;將基于Hough變換的處理應(yīng)用(30)于每個圖像塊,以便在上述圖像塊中識別在所考慮的該像塊中的像點(diǎn)分布的優(yōu)先方向;將具有共同優(yōu)先方向的圖像中的相鄰圖像塊分組(40)到一起,以便定義(50)一個包含具有共同優(yōu)先方向的所述相鄰圖像塊的組的矩形所考慮區(qū)域(ZI),所述矩形所考慮區(qū)域具有一條平行于所述共同優(yōu)先方向的縱向邊;以及將自動地址識別算法應(yīng)用于圖像中的所述所考慮區(qū)域以便于自動讀取郵政地址。
文檔編號G06K9/32GK1423794SQ0180818
公開日2003年6月11日 申請日期2001年6月19日 優(yōu)先權(quán)日2000年6月27日
發(fā)明者吉爾斯·阿爾卡斯-魯克, 奧里維爾·皮特里 申請人:索利斯蒂克有限公司