一種基于多特征融合的車牌漢字識別方法
【技術領域】
[0001] 本發(fā)明涉及圖像處理技術領域,具體是一種基于多特征融合的車牌漢字識別方 法。
【背景技術】
[0002] 車牌字符識別是車牌識別系統(tǒng)的最后一步,也是至關重要的一步,它直接影響著 整個系統(tǒng)的識別準確率和效率。對于車牌字母數(shù)字部分的識別,國內(nèi)外已有很多成熟的方 法,可以達到很高的準確率。而對于車牌的漢字部分,由于實際環(huán)境中采集的車牌圖像,漢 字部分往往具有結(jié)構(gòu)復雜、筆劃繁多、分辨率較低、筆劃斷裂、部分變淺或缺失、邊緣模糊、 字符傾斜等特點,使得漢字識別變得很困難,基于現(xiàn)有的字母數(shù)字識別方法,無法達到滿意 的準確率。因此,準確識別車牌漢字字符,成為國內(nèi)車牌識別系統(tǒng)的難點。
[0003] 車牌漢字識別通常采用三種識別方法,分別是基于模板匹配的方法、基于神經(jīng)網(wǎng) 絡的方法、基于支持向量機(SVM)的方法。依據(jù)模式識別理論可知,影響識別準確率的最大 因素,不是選擇的哪種分類方法,而是選擇的目標特征,只要漢字字符特征選擇的合適,上 述三種方法均能達到不錯的分類效果。因此,如何選擇漢字字符特征,成為決定車牌漢字識 別成敗的關鍵。
[0004] 目前,常用的車牌漢字特征主要有以下幾類:
[0005] (1)全局特征,該類特征采用全局變換來獲取字符的整體特征,使用有序的整體特 征或者子集特征來構(gòu)成特征向量,常見的特征有GABOR變換特征、矩特征、投影特征、筆劃 密度特征、HARR特征、HOG特征等。這些特征的優(yōu)點是對局部變化不敏感,抗干擾能力強; 其缺點是容易忽略某些重要的局部特征,無法區(qū)分相似的字符。
[0006] (2)局部特征,該類特征采用在字符的多個局部區(qū)域內(nèi),計算相應的特征,使用串 聯(lián)的有序局部特征構(gòu)成最終的特征向量,主要包括局部灰度特征、LBP特征、穿線特征、SIFT 特征等。該類特征的優(yōu)點是區(qū)分字符的能力強;其缺點是抗干擾能力弱,運算相對較慢。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的在于針對使用全局特征或局部特征識別漢字的缺點,提供一種基于 多特征融合的車牌漢字識別方法,通過融合多種特征,可以更加精確地識別漢字,同時對于 字符的圖像質(zhì)量要求更低。
[0008] 本發(fā)明的技術方案為:
[0009] 一種基于多特征融合的車牌漢字識別方法,包括以下步驟:
[0010] (1)對收集的若干訓練圖像進行預處理,得到若干訓練樣本;
[0011] ⑵分別獲取訓練樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向 量;
[0012] (3)串聯(lián)訓練樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向量, 形成訓練樣本的漢字融合特征向量;
[0013] (4)將所有訓練樣本的漢字融合特征向量輸入SVM分類器,完成對SVM分類器的訓 練;
[0014] (5)對待測車牌漢字圖像進行預處理,得到測試樣本;
[0015] (6)分別獲取測試樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向 量;
[0016] (7)串聯(lián)測試樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向量, 形成測試樣本的漢字融合特征向量;
[0017] (8)將測試樣本的漢字融合特征向量輸入訓練完成的SVM分類器,識別得到待測 車牌漢字圖像中的漢字。
[0018] 所述的基于多特征融合的車牌漢字識別方法,步驟(2)中,獲取訓練樣本的漢字 邊緣特征向量,具體包括以下步驟:
[0019] (21)利用以下公式,計算訓練樣本全圖每一個像素的梯度幅值和方向角度:
【主權項】
1. 一種基于多特征融合的車牌漢字識別方法,其特征在于,包括以下步驟: (1) 對收集的若干訓練圖像進行預處理,得到若干訓練樣本; (2) 分別獲取訓練樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向量; (3) 串聯(lián)訓練樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向量,形成 訓練樣本的漢字融合特征向量; (4) 將所有訓練樣本的漢字融合特征向量輸入SVM分類器,完成對SVM分類器的訓練; (5) 對待測車牌漢字圖像進行預處理,得到測試樣本; (6) 分別獲取測試樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向量; (7) 串聯(lián)測試樣本的漢字邊緣特征向量、漢字灰度特征向量、漢字紋理特征向量,形成 測試樣本的漢字融合特征向量; (8) 將測試樣本的漢字融合特征向量輸入訓練完成的SVM分類器,識別得到待測車牌 漢字圖像中的漢字。
2. 根據(jù)權利要求1所述的基于多特征融合的車牌漢字識別方法,其特征在于,步驟(2) 中,獲取訓練樣本的漢字邊緣特征向量,具體包括以下步驟: (21) 利用以下公式,計算訓練樣本全圖每一個像素的梯度幅值和方向角度:
其中,M(x,y)表示像素(x,y)的梯度幅值,a(x,y)表示像素(x,y)的方向角度,g(x,y)表示像素(x,y)的灰度值; (22) 利用以下公式,對步驟(21)計算出的方向角度進行校正:
其中,a' (x,y)表示校正后的方向角度; (23) 基于像素的方向角度,統(tǒng)計每個晶胞的4維梯度方向直方圖,每個晶胞由若干像 素構(gòu)成; (24) 將4個晶胞的梯度方向直方圖串聯(lián)起來,構(gòu)成一個區(qū)塊的梯度方向直方圖; (25) 將所有區(qū)塊的梯度方向直方圖歸一化后串聯(lián)起來,形成訓練樣本的漢字邊緣特征 向量。
3. 根據(jù)權利要求1所述的基于多特征融合的車牌漢字識別方法,其特征在于,步驟(2) 中,獲取訓練樣本的漢字灰度特征向量,具體包括以下步驟: (31)借助HARR特征模板,分別將訓練樣本按照五種方式進行劃分,即分別將訓練樣 本劃分為左右兩個局部區(qū)域、上下兩個局部區(qū)域、左中右三個局部區(qū)域、上中下三個局部區(qū) 域、左上、左下、右上、右下四個局部區(qū)域,得到14個局部區(qū)域子圖; (32) 利用最大類間距算法,獲取訓練樣本的二值圖像; (33) 基于訓練樣本的二值圖像,統(tǒng)計得到全圖前景目標點所占的比例; (34) 基于訓練樣本的二值圖像,分別統(tǒng)計得到14個局部區(qū)域子圖前景目標點所占的 比例; (35) 將得到的各個比例值串聯(lián)起來,形成訓練樣本的漢字灰度特征向量。
4.根據(jù)權利要求1所述的基于多特征融合的車牌漢字識別方法,其特征在于,步驟(2) 中,獲取訓練樣本的漢字紋理特征向量,具體包括以下步驟: (41) 借助HARR特征模板,分別將訓練樣本按照五種方式進行劃分,即分別將訓練樣 本劃分為左右兩個局部區(qū)域、上下兩個局部區(qū)域、左中右三個局部區(qū)域、上中下三個局部區(qū) 域、左上、左下、右上、右下四個局部區(qū)域,得到14個局部區(qū)域子圖; (42) 利用以下公式,對訓練樣本進行LBP特征變換,得到訓練樣本的LBP特征圖:
其中,LBPp,,(x。,y。)表示當前像素(x。,y。)的LBP變換特征,g(x。,y。)表示當前像素 (x。,y。)的灰度值,g(xn,yn)表示鄰域像素(xn,yn)的灰度值,p表示鄰域像素的數(shù)目,r表 示鄰域半徑; (43) 基于訓練樣本的LBP特征圖,統(tǒng)計得到全圖的9維灰度直方圖; (44) 基于訓練樣本的LBP特征圖,分別統(tǒng)計得到14個局部區(qū)域子圖的9維灰度直方 圖; (45) 將得到的各個9維灰度直方圖串聯(lián)起來,形成訓練樣本的漢字紋理特征向量。
【專利摘要】本發(fā)明提供一種基于多特征融合的車牌漢字識別方法,包括以下步驟:待測圖像歸一化;改進HOG特征,獲取待測圖像的漢字邊緣特征;獲取待測圖像的漢字灰度特征;基于LBP特征理論,獲取待測圖像的漢字紋理特征;融合待測圖像的漢字邊緣特征、灰度特征、紋理特征,獲取待測圖像的融合特征向量;基于SVM分類器,預測分類結(jié)果。本發(fā)明綜合利用了漢字的全局特征和局部特征,識別更加準確,對于低質(zhì)量圖像和強干擾圖像,具有較強的魯棒性。
【IPC分類】G06K9-62, G08G1-017
【公開號】CN104573707
【申請?zhí)枴緾N201410788657
【發(fā)明人】張卡, 何佳, 聶勇, 鄭浩
【申請人】安徽清新互聯(lián)信息科技有限公司
【公開日】2015年4月29日
【申請日】2014年12月17日