述的身份證漢字識別方法,步驟(41)中,所述精確分割漢字字符,具體包括:
[0054] (a)采用以下公式,對灰度漢字區(qū)域進行局部二值化:
【主權項】
1. 一種身份證漢字識別方法,其特征在于,包括以下步驟: (1) 獲取分類器訓練文件; (2) 將待識別彩色圖像變換成灰度圖像; (3) 對身份證的漢字區(qū)域進行精確定位; (4) 對每個漢字區(qū)域進行字符識別; (5) 判斷當前漢字區(qū)域是否是最后一個漢字區(qū)域,若是,則輸出識別結果,若否,則返回 步驟(4)。
2. 根據(jù)權利要求1所述的身份證漢字識別方法,其特征在于,步驟(1)中,所述獲取分 類器訓練文件,具體包括: (11) 加載已有的人臉檢測分類器文件; (12) 加載tessract漢字識別庫; (13) 基于harr特征和adaboost算法,訓練關于身份證國徽的分類器文件; (14) 訓練身份證漢字區(qū)域含有的數(shù)字的模板。
3. 根據(jù)權利要求1所述的身份證漢字識別方法,其特征在于,步驟(3)中,所述對身份 證的漢字區(qū)域進行精確定位,具體包括: (31) 基于adaboost分類器,檢測身份證正面的人臉位置和身份證背面的國徽位置; (32) 根據(jù)眼睛位置對身份證正面圖像進行傾斜校正,根據(jù)國徽內(nèi)五星位置對身份證背 面圖像進行傾斜校正; (33) 基于人臉位置和國徽位置,分別選擇身份證正面和背面的漢字檢測有效區(qū)域,同 時進行反色處理; (34) 對圖像進行模糊處理,去除背景圖案干擾; (35) 獲取模糊處理后的灰度圖像的二值垂直邊緣特征圖; (36) 對二值垂直邊緣特征圖進行形態(tài)學運算,獲取連通區(qū)域; (37) 根據(jù)面積和位置特征,選擇相應的連通區(qū)域作為候選區(qū)域; (38) 基于候選區(qū)域內(nèi)字符間距特征,對身份證正面和背面的各漢字區(qū)域進行精確定 位; (39) 判斷當前人臉位置或國徽位置是否是最后一個人臉位置或國徽位置,若是,則輸 出相應的漢字區(qū)域定位結果,若否,則繼續(xù)執(zhí)行步驟(32)至步驟(39)。
4. 根據(jù)權利要求1所述的身份證漢字識別方法,其特征在于,步驟(4)中,所述對每個 漢字區(qū)域進行字符識別,具體包括: (41) 精確分割漢字字符; (42) 通過字符的寬度判斷單個字符是漢字還是數(shù)字,若是漢字,則執(zhí)行步驟(43),若 是數(shù)字,則執(zhí)行步驟(45); (43) 增強漢字字形結構; (44) 基于tessract庫進行漢字識別; (45) 基于最近鄰算法進行數(shù)字識別; (46) 判斷當前字符是否是當前漢字區(qū)域的最后一個字符,若是,則輸出漢字識別結果, 若否,則進入下一個字符,繼續(xù)執(zhí)行步驟(42)至步驟(46)。
5. 根據(jù)權利要求3所述的身份證漢字識別方法,其特征在于,步驟(32)中,所述根據(jù)眼 睛位置對身份證正面圖像進行傾斜校正,具體包括: (al)基于三庭五眼布局規(guī)律,對左、右兩眼進行粗定位; (a2)精確定位出眼睛的中心點; (a3)根據(jù)兩眼的中心位置計算傾斜角度; (a4)對身份證正面圖像進行傾斜旋轉(zhuǎn)校正; 所述根據(jù)國徽內(nèi)五星位置對身份證背面圖像進行傾斜校正,具體包括: (bl)精確定位出國徽內(nèi)五顆星的中心點; (b2)以最大的一顆星為基礎,分別定位出四顆小星的相對位置; (b3)根據(jù)外側(cè)兩顆星的中心位置計算傾斜角度; (b4)對身份證背面圖像進行傾斜旋轉(zhuǎn)校正。
6. 根據(jù)權利要求3所述的身份證漢字識別方法,其特征在于,步驟(36)中,所述對二值 垂直邊緣特征圖進行形態(tài)學運算,獲取連通區(qū)域,具體包括: (a) 對二值垂直邊緣特征圖中所有垂直連通邊緣的高度值數(shù)據(jù)進行統(tǒng)計; (b) 將統(tǒng)計出的高度值數(shù)據(jù)從大到小排序,并求出排在前面三分之一位置之內(nèi)的高度 數(shù)據(jù)的平均值,作為二值垂直邊緣特征圖中垂直連通邊緣的平均高度只; (c) 利用結構元素模板,對二值垂直邊緣特征圖進行次形態(tài)學膨脹運算,其中, 表示不大于Sl的最大整數(shù); (d) 利用結構元素模板,對經(jīng)過[Ei]次形態(tài)學膨脹運算的二值垂直邊緣特征圖進行2次 形態(tài)學閉運算; (e) 利用結構元素模板,對經(jīng)過2次形態(tài)學閉運算的二值垂直邊緣特征圖進行次形 態(tài)學腐蝕運算。
7. 根據(jù)權利要求4所述的身份證漢字識別方法,其特征在于, 步驟(41)中,所述精確分割漢字字符,具體包括: (a) 采用以下公式,對灰度漢字區(qū)域進行局部二值化:
其中,g(x,y)表示二值化后對應的像素(X,y)處的灰度值,f(x,y)表示二值化前像素 (x,y)處的灰度值,f (X1^yn)表示二值化前以像素(x,y)為中心的M*N鄰域內(nèi)像素(X1^y n) 處的灰度值,M、N分別表示鄰域的寬度和高度,offset表示偏移量; (b) 按照面積大小,對干擾連通區(qū)域進行過濾; (c) 進行垂直投影,獲取每一列的前景目標高度; (d) 通過波峰和波谷的位置關系,進行字符分割; (e) 對粘連字符進行二次分割; (f) 對斷裂字符進行合并處理。
8. 根據(jù)權利要求4所述的身份證漢字識別方法,其特征在于,步驟(43)中,所述增強漢 字字形結構,具體包括: (a) 統(tǒng)計單個字符的連通區(qū)域個數(shù),判斷是否大于1,若是,則執(zhí)行步驟(b),若否,則直 接執(zhí)行步驟(44); (b) 連接各個部分連通區(qū)域,具體包括: (bl)任意選擇兩個連通區(qū)域,計算二者之間的最小距離; (b2)在最小距離處,畫一條直線,連接兩個連通區(qū)域,形成新的總連通區(qū)域; (b3)依次連接剩下的連通區(qū)域和總連通區(qū)域,形成最終的連通區(qū)域。
9. 根據(jù)權利要求4所述的身份證漢字識別方法,其特征在于,步驟(45)中,所述基于最 近鄰算法進行數(shù)字識別,具體包括: (a) 采用以下公式,計算待識別字符與所有模板字符之間的特征距離:
其中,diSi表示待識別字符與第i個模板字符之間的特征距離,f(x,y)表示待識別字 符的像素(X,y)處的灰度值,m(x,y)表示模板字符的像素(X,y)處的灰度值; (b) 選擇最小特征距離對應的模板字符作為識別結果。
【專利摘要】本發(fā)明提供一種身份證漢字識別方法,包括以下步驟:獲取分類器訓練文件;將待識別彩色圖像變換成灰度圖像;對身份證的漢字區(qū)域進行精確定位;對每個漢字區(qū)域進行字符識別;判斷當前漢字區(qū)域是否是最后一個漢字區(qū)域。本發(fā)明采用圖像處理技術,進行身份證漢字的定位、分割,基于tessract庫和字形結構質(zhì)量增強的漢字圖像進行字符識別,識別準確度更高,不需要特定的設備,成本低,可以進行多身份證信息同時讀取。
【IPC分類】G06K9-00, G06K9-66
【公開號】CN104680130
【申請?zhí)枴緾N201510013041
【發(fā)明人】張卡, 何佳, 尼秀明, 陳舜
【申請人】安徽清新互聯(lián)信息科技有限公司
【公開日】2015年6月3日
【申請日】2015年1月9日