一種基于Hadoop的分布式車(chē)牌識(shí)別方法
【專(zhuān)利摘要】本發(fā)明涉及一種基于Hadoop的分布式車(chē)牌識(shí)別方法,屬于云計(jì)算、數(shù)字圖像處理、模式識(shí)別與計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,特別涉及到車(chē)牌定位、車(chē)牌傾斜校正、車(chē)牌字符分割和車(chē)牌字符識(shí)別等車(chē)牌識(shí)別關(guān)鍵技術(shù)。本發(fā)明的綜合面積、長(zhǎng)寬比以及垂直投影特征值3個(gè)因素進(jìn)行綜合評(píng)價(jià)分析來(lái)定位車(chē)牌區(qū)域,可以消除僅用某一個(gè)參數(shù)進(jìn)行評(píng)價(jià)所帶來(lái)的誤差。本發(fā)明基于模板匹配和關(guān)鍵域的車(chē)牌字符分割方法能夠有效應(yīng)對(duì)字符間粘滯的問(wèn)題。本發(fā)明對(duì)不同的字符進(jìn)行四個(gè)側(cè)面掃描提取出字符骨骼累積統(tǒng)計(jì)特征,有效的解決了相近字符難以區(qū)分問(wèn)題。本發(fā)明系統(tǒng)基于Hadoop平臺(tái)開(kāi)發(fā),使用MapReduce編程模型,車(chē)牌識(shí)別系統(tǒng)的執(zhí)行效率獲得了大幅度提升。
【專(zhuān)利說(shuō)明】
-種基于Hadoop的分布式車(chē)牌識(shí)別方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種基于化doop的分布式車(chē)牌識(shí)別方法,屬于云計(jì)算、數(shù)字圖像處理、 模式識(shí)別與計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,特別設(shè)及到車(chē)牌定位、車(chē)牌傾斜校正、車(chē)牌字符分割和車(chē) 牌字符識(shí)別等車(chē)牌識(shí)別關(guān)鍵技術(shù)。
【背景技術(shù)】
[0002] 當(dāng)前,隨著經(jīng)濟(jì)的發(fā)展,人們的生活水平不斷提高,各種機(jī)動(dòng)車(chē)的數(shù)量快速增長(zhǎng), 機(jī)動(dòng)車(chē)大規(guī)模普及已經(jīng)成為一種必然的趨勢(shì)。智能交通系統(tǒng)能夠更加安全、高效的管理車(chē) 輛信息,在各種小區(qū),廠區(qū)出入口車(chē)輛管理系統(tǒng),收費(fèi)站系統(tǒng),道路治安卡口系統(tǒng),超速、違 停、闖紅燈電子警察系統(tǒng)中,展現(xiàn)出強(qiáng)大的作用。
[0003] 車(chē)牌識(shí)別是現(xiàn)代智能交通系統(tǒng)中的重要組成部分之一,應(yīng)用十分廣泛。它W數(shù)字 圖像處理、模式識(shí)別、計(jì)算機(jī)視覺(jué)等技術(shù)為基礎(chǔ),對(duì)攝像機(jī)所拍攝的車(chē)輛圖像或者視頻序列 進(jìn)行分析,得到每一輛汽車(chē)唯一的車(chē)牌號(hào)碼,從而完成識(shí)別過(guò)程。通過(guò)一些后續(xù)處理手段可 W實(shí)現(xiàn)停車(chē)場(chǎng)收費(fèi)管理、交通流量控制指標(biāo)測(cè)量、車(chē)輛定位、治安卡口、汽車(chē)防盜、高速公路 超速自動(dòng)化監(jiān)管、闖紅燈電子警察、公路收費(fèi)站等功能。對(duì)于維護(hù)交通安全和城市治安,防 止交通堵塞,實(shí)現(xiàn)交通自動(dòng)化管理有著現(xiàn)實(shí)的意義。
[0004] 然而,隨著車(chē)牌識(shí)別技術(shù)的日益成熟,針對(duì)車(chē)牌識(shí)別的應(yīng)用也越來(lái)越多,規(guī)模越 來(lái)越大,車(chē)牌識(shí)別要處理的數(shù)據(jù)及任務(wù)可能達(dá)到海量級(jí)別,傳統(tǒng)的單機(jī)存儲(chǔ)與計(jì)算的識(shí)別 方法已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足我們的需求。傳統(tǒng)的各種車(chē)牌識(shí)別的研究都是基于小批量模型進(jìn)行 識(shí)別研究,所產(chǎn)生的各種車(chē)牌識(shí)別系統(tǒng)針對(duì)一些特定應(yīng)用場(chǎng)景的有限的識(shí)別任務(wù)進(jìn)行開(kāi) 發(fā)。而針對(duì)海量識(shí)別任務(wù)、大批量分類(lèi)模式的識(shí)別,運(yùn)些系統(tǒng)的識(shí)別效率就差強(qiáng)人意了。存 在的問(wèn)題有:
[0005] (1)單節(jié)點(diǎn)的計(jì)算能力有限,不滿足海量數(shù)據(jù)下實(shí)時(shí)識(shí)別任務(wù)的需求;
[0006] (2)如果采用分布式實(shí)現(xiàn),怎么樣才能充分的使整個(gè)車(chē)牌識(shí)別過(guò)程并行,從而能夠 快速的返回結(jié)果。
[0007] 化doop是目前應(yīng)用最為廣泛的分布式計(jì)算平臺(tái),利用它能夠高速的處理海量數(shù) 據(jù)。本發(fā)明提供了一種在化doop平臺(tái)下,結(jié)合HDFS與MapReduce編程模型的車(chē)牌識(shí)別方法, 能夠分布式的處理車(chē)牌識(shí)別任務(wù),并有效地提升車(chē)牌識(shí)別系統(tǒng)的執(zhí)行效率。
【發(fā)明內(nèi)容】
[000引本發(fā)明為了克服上述缺陷,本發(fā)明的目的在于提供基于化doop的分布式車(chē)牌識(shí)別 方法,解決現(xiàn)有技術(shù)無(wú)法快速識(shí)別出車(chē)牌號(hào)碼并返回識(shí)別結(jié)果的問(wèn)題。
[0009] 本發(fā)明為了實(shí)現(xiàn)上述目的,采用如下技術(shù)方案:
[0010] 一種基于化doop的分布式車(chē)牌識(shí)別方法,該方法的步驟:
[0011] 1)客戶(hù)端向網(wǎng)關(guān)發(fā)送車(chē)牌識(shí)別請(qǐng)求,請(qǐng)求中包含待識(shí)別的車(chē)牌圖像;
[0012] 2)網(wǎng)關(guān)收到請(qǐng)求后形成識(shí)別任務(wù)下發(fā)到主節(jié)點(diǎn)上;
[0013] 3)主節(jié)點(diǎn)收到識(shí)別任務(wù)后,根據(jù)當(dāng)前作業(yè)節(jié)點(diǎn)的狀態(tài)將包含待識(shí)別車(chē)牌圖像的識(shí) 別子任務(wù)發(fā)送給作業(yè)節(jié)點(diǎn);作業(yè)節(jié)點(diǎn)開(kāi)始車(chē)牌識(shí)別任務(wù),其主要步驟為:
[0014] ①車(chē)牌圖像預(yù)處理:對(duì)抓拍到的車(chē)牌圖像進(jìn)行高斯濾波處理,減小噪聲的影響,然 后作灰度化處理得到灰度圖像;
[0015] ②車(chē)牌定位:首先利用Sobel算子對(duì)包含車(chē)牌的圖像進(jìn)行邊緣檢測(cè),然后進(jìn)行二值 化處理,再對(duì)二值圖像進(jìn)行形態(tài)學(xué)濾波,使車(chē)牌區(qū)域形成一個(gè)連通區(qū)域,然后根據(jù)車(chē)牌的先 驗(yàn)知識(shí):長(zhǎng)寬比相對(duì)固定,在二值圖像上字符呈現(xiàn)明暗交替變化,分別采用面積、長(zhǎng)寬比、一 級(jí)垂直投影特征進(jìn)行加權(quán)綜合來(lái)對(duì)所得到的連通區(qū)域進(jìn)行篩選,選定一個(gè)最佳的區(qū)域作為 牌照區(qū)域,并將其從圖像中分隔出來(lái);
[0016] ③車(chē)牌校正:由于車(chē)牌的上下沿是兩條明顯的平行線,所W結(jié)合化U曲變換和特征 投影法來(lái)檢測(cè)車(chē)牌的傾斜角,然后對(duì)車(chē)牌圖像進(jìn)行傾斜校正;
[0017] ④車(chē)牌字符分割:采用模板匹配,關(guān)鍵域和垂直投影法相結(jié)合的方式進(jìn)行車(chē)牌字 符分割;充分利用車(chē)牌自身的特征并結(jié)合模板匹配法對(duì)車(chē)牌進(jìn)行分割,該方法分割速度快 且能夠有效應(yīng)對(duì)字符粘連、模糊等情況;
[0018] ⑤字符特征提取和歸一化:對(duì)不同的字符進(jìn)行四個(gè)側(cè)面掃描提取出字符骨骼累積 統(tǒng)計(jì)特征,包括筆畫(huà)斜率累積特征、拐點(diǎn)幅度累積特征、輪廓深度累積特征;最后通過(guò)固定 粗網(wǎng)格提取字符內(nèi)部像素特征;
[0019] ⑥字符識(shí)別:字符識(shí)別的基本思想是匹配分類(lèi),首先對(duì)待識(shí)別字符樣本進(jìn)行特征 提取,將運(yùn)些特征和預(yù)先存儲(chǔ)在字符庫(kù)中的一支字符模式集合逐一進(jìn)行比對(duì),將最接近輸 入字符模式的已知字符作為識(shí)別結(jié)果,本方案采用概率神經(jīng)網(wǎng)絡(luò)的識(shí)別方法;
[0020] 作業(yè)節(jié)點(diǎn)完成任務(wù)后向主節(jié)點(diǎn)返回成功消息,消息中包含車(chē)牌字符串;
[0021] 4)主節(jié)點(diǎn)將識(shí)別出來(lái)的車(chē)牌字符串返回給客戶(hù)端。
[0022] 本發(fā)明的有益效果
[0023] a)本發(fā)明的綜合面積、長(zhǎng)寬比W及垂直投影特征值3個(gè)因素進(jìn)行綜合評(píng)價(jià)分析來(lái) 定位車(chē)牌區(qū)域,可W消除僅用某一個(gè)參數(shù)進(jìn)行評(píng)價(jià)所帶來(lái)的誤差。
[0024] b)本發(fā)明基于模板匹配和關(guān)鍵域的車(chē)牌字符分割方法能夠有效應(yīng)對(duì)字符間粘滯 的問(wèn)題。
[0025] C)本發(fā)明對(duì)不同的字符進(jìn)行四個(gè)側(cè)面掃描提取出字符骨骼累積統(tǒng)計(jì)特征,有效的 解決了相近字符難W區(qū)分問(wèn)題。
[00%] d)本發(fā)明系統(tǒng)基于化doop平臺(tái)開(kāi)發(fā),使用MapReduce編程模型,車(chē)牌識(shí)別系統(tǒng)的執(zhí) 行效率獲得了大幅度提升。
【附圖說(shuō)明】
[0027] 圖1為本發(fā)明的基于化doop的分布式車(chē)牌識(shí)別方法架構(gòu)圖;
[0028] 圖2為本發(fā)明的車(chē)牌識(shí)別算法的主要流程;
[0029] 圖3為本發(fā)明的字符筆畫(huà)斜率統(tǒng)計(jì)點(diǎn);
[0030] 圖4為本發(fā)明的字符拐點(diǎn)定義;
[0031] 圖5為本發(fā)明的字符輪廓深度特征提取;
[0032] 圖6為本發(fā)明的字符內(nèi)部像素特征提取。
【具體實(shí)施方式】
[0033] 下面通過(guò)附圖和具體實(shí)施方案對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明:
[0034] 參見(jiàn)圖1,W下為具體步驟:
[0035] (1)客戶(hù)端向網(wǎng)關(guān)發(fā)送車(chē)牌識(shí)別請(qǐng)求(請(qǐng)求中包含待識(shí)別的車(chē)牌圖像);
[0036] (2)網(wǎng)關(guān)收到請(qǐng)求后形成識(shí)別任務(wù)下發(fā)到主節(jié)點(diǎn)上;
[0037] (3)主節(jié)點(diǎn)收到識(shí)別任務(wù)后,根據(jù)當(dāng)前作業(yè)節(jié)點(diǎn)的狀態(tài)將包含待識(shí)別車(chē)牌圖像的 識(shí)別子任務(wù)發(fā)送給作業(yè)節(jié)點(diǎn);
[0038] (4)作業(yè)節(jié)點(diǎn)開(kāi)始車(chē)牌識(shí)別任務(wù),其主要步驟為:
[0039] ①車(chē)牌圖像預(yù)處理
[0040] 對(duì)抓拍到的車(chē)牌圖像利用高斯核進(jìn)行高斯濾波處理,減小噪聲的影響,然后作灰 度化處理得到灰度圖像。
[0041 ]②車(chē)牌定位
[0042] 首先采用Sobel算子進(jìn)行垂直邊緣的提取,然后利用0STU大律法對(duì)經(jīng)過(guò)Sobel算子 濾波后的圖像進(jìn)行二值化處理,再對(duì)車(chē)牌二值圖像進(jìn)行形態(tài)學(xué)濾波,具體步驟為:1)腐蝕, 選取小模板,濾除點(diǎn)噪聲;2)膨脹融合,通過(guò)膨脹使車(chē)牌融合會(huì)一個(gè)整體,使車(chē)牌區(qū)域形成 一個(gè)連通區(qū)域,再根據(jù)車(chē)牌的先驗(yàn)知識(shí)(長(zhǎng)寬比相對(duì)固定,在二值圖像上字符呈現(xiàn)明暗交替 變化),分別采用面積、長(zhǎng)寬比、一級(jí)垂直投影特征進(jìn)行加權(quán)綜合來(lái)對(duì)所得到的連通區(qū)域進(jìn) 行篩選。給每個(gè)特征值乘W-個(gè)影響權(quán)值,進(jìn)行加權(quán)得出總的置信度值。
[0043]
(1)
[0044] 式中:λι表示各自不同的權(quán)值,。表示幾種特征置信度,包括面積S、長(zhǎng)寬比PW及垂 直投影特征值Η。
[0045] 面積S是指各矩形區(qū)域內(nèi)非0像素的數(shù)目,在二值圖像上面積越大,為車(chē)牌的可能 性越大,因此面積越大,賦予的特征置信度Cl就越大。
[0046] 長(zhǎng)寬比P是車(chē)牌的一個(gè)明顯特征,雖然車(chē)牌反映在圖像中的大小不同,由于我國(guó)車(chē) 牌長(zhǎng)寬比相對(duì)固定,一般在0.3~0.4之間,因此在圖像中車(chē)牌區(qū)域的長(zhǎng)寬比也相對(duì)固定,所 W越接近真實(shí)車(chē)牌長(zhǎng)寬比的區(qū)域的置信度Cl就越大。
[0047] 垂直投影特征值Η是根據(jù)在二值圖像上車(chē)牌字符呈明顯交替變化來(lái)確定的。特征 值的計(jì)算方法如下:
[004引 (2j
[0049]其中特征值越大就越接近真實(shí)車(chē)牌,因此賦予的置信度Cl就越大。式中,Lu為垂直 投影直方圖中所有從波谷到波峰的路徑總長(zhǎng)度;Ld為直方圖中所有從波峰到波谷的路徑總 長(zhǎng)度;bw為圖像的寬度,可消除圖像寬度不同對(duì)特征值的影響;1000為規(guī)范化因子。在實(shí)際 處理時(shí),設(shè)定了一個(gè)闊值,用于區(qū)分波峰和波谷,過(guò)濾掉一些過(guò)低的波峰。
[(K)加]③車(chē)牌校正
[0051]由于車(chē)牌的上下沿是兩條明顯的平行線,所W結(jié)合化U曲變換和特征投影法來(lái)檢 測(cè)車(chē)牌的傾斜角,然后采用圖像旋轉(zhuǎn)來(lái)對(duì)車(chē)牌圖像進(jìn)行水平校正,圖像旋轉(zhuǎn)所采用的空間 坐標(biāo)變換表達(dá)式如式(3)所示,設(shè)水平傾斜角為α:
[00對(duì)
巧)
[0053] 其中,(a,b)為原圖像像素點(diǎn)在新圖像中的坐標(biāo)。
[0054] ④車(chē)牌字符分割
[0055] 對(duì)內(nèi)地車(chē)牌本身的特征進(jìn)行分析,可W發(fā)現(xiàn)車(chē)牌第二個(gè)字符與第Ξ個(gè)字符之間的 間距為34cm,而其他字符之間的間距為12cm,僅為前者的1/3。也就是說(shuō),第二個(gè)與第Ξ個(gè)字 符之間的間隔明顯大于其他間隔,所W可W對(duì)此間距加 W利用,本文將該間隔稱(chēng)為關(guān)鍵域。 通過(guò)關(guān)鍵域來(lái)分割車(chē)牌字符可W分為3步:
[0056] 第一步:通過(guò)垂直投影法確定關(guān)鍵域所在位置。
[0057] 在垂直投影曲線圖上畫(huà)直線y = t虹(其中thr為闊值,按照車(chē)牌圖像高度的百分比 給出,本發(fā)明中設(shè)為10%),直線與投影曲線相交,得到一組交點(diǎn)。對(duì)交點(diǎn)進(jìn)行配對(duì):若兩個(gè) 交點(diǎn)的相鄰,且兩個(gè)交點(diǎn)之間是"波谷"(Gap),則將運(yùn)兩個(gè)交點(diǎn)分為一組,設(shè)配對(duì)結(jié)果為 [曰1,bl],[a2,b2],[曰3,b3],···,[an,bn],配對(duì)完成后刪除孤立的交點(diǎn)。比較bi-ai的大小, 在取最大值時(shí)記錄下標(biāo)i的值k,運(yùn)樣相應(yīng)的分組為[ak,化],從坐標(biāo)ak,bk分別向右和向左 捜索%底"得到[Ak,Bk]即為關(guān)鍵域。最后,對(duì)其他Gap捜索%底"得到[A1,B1],[A2, B2],...,[Αη,Βη]。
[005引第二步:定位關(guān)鍵域之前兩個(gè)字符。
[0059]根據(jù)各Gap的值,先估算出字符的寬度W和Gap的寬度G。由于圖像已經(jīng)去除上下邊 框已經(jīng)馴釘,所WW,G可W根據(jù)圖像的高度Η來(lái)估算,估算表達(dá)式如式(4)、(5):
[0062] 其中,45為標(biāo)準(zhǔn)車(chē)牌中字符寬度,90為高度,12為字符間距(除關(guān)鍵域外)。
[0063] 關(guān)鍵域前面存在兩個(gè)字符即第一位的漢字字符和第二位的字母字符,理想情況下 兩個(gè)字符的位置容易確定,根據(jù)垂直投影的結(jié)果分別為[84-2,44-1],[84-1,44]。如果碰到 漢字"川"或者字符相粘的情況那么上述的方法就行不通了。本發(fā)明在垂直投影法的基礎(chǔ)上 結(jié)合模板匹配,有效的解決了上述的問(wèn)題。
[0064] 如果關(guān)鍵域在所有Gap中排在第一個(gè),則采用模板匹配法對(duì)前兩個(gè)字符進(jìn)行分割, 第二個(gè)字符(字母位)區(qū)間為[Ak-W,Ak],第一個(gè)字符(漢字位)區(qū)間為[Ak-2 X W-G,Ak-W-G]。
[0065] 如果關(guān)鍵域之前僅存在一個(gè)字符,判斷該字符(即字母位)是否已通過(guò)垂直投影法 正確分割,如果字符寬度Wc滿足式(6),則字母位分割正確區(qū)間為[Bk-l,Ak]。接著采用模板 匹配法分割漢字位,漢字位區(qū)間為[Bk-1-W-G,趾-1-G]。
[0066] 如果關(guān)鍵域存在多個(gè)(2個(gè)或2個(gè)W上)字符,僅有字母位字符滿足式(6),則上述 相同的方法進(jìn)行分割。
[0067] 如果關(guān)鍵域存在兩個(gè)字符,且兩個(gè)字符都滿足式(6),則表示理想情況,采用垂直 投影法的分割結(jié)果。字符區(qū)間分別為[Bk-2,Ak-1 ],[Bk-1,Ak]。
[0068] 如果上述情況均不符合則直接采用模板匹配法進(jìn)行分割,兩個(gè)字符區(qū)間分別為 [Ak-2 X W-G,Ak-W-G],[Ak-W,Ak]。
[0069] Wce[0.8XW,1.2XW] (6)
[0070] 第Ξ步:定位關(guān)鍵域之后的五個(gè)字符。
[0071] 因?yàn)樾枰O(shè)及到多個(gè)字符粘連的情況,后5個(gè)字符的分割相對(duì)復(fù)雜。運(yùn)5個(gè)字符從 左至右考慮,先分割出第Ξ位、接著第四位,…,直到第屯位。先設(shè)定字符計(jì)數(shù)器c = 0,每分 割出一個(gè)C加1,直到c = 5停止分割。垂直投影法分割出的字符由于粘連可能會(huì)出現(xiàn)一個(gè)字 符中實(shí)際包含了兩個(gè)或多個(gè)字符。
[0072] 從左至右依次對(duì)通過(guò)垂直投影法分割出的字符依次考慮其寬度Wc
[007;3]
賄
[0074] 上式用來(lái)估計(jì)是否存在字符粘連的情況,其中η是通過(guò)Wc,W,G估計(jì)出的當(dāng)前字符 中包含的字符的個(gè)數(shù)。如果η含2,則根據(jù)當(dāng)前η的值基于模板匹配法可W對(duì)當(dāng)前字符進(jìn)行分 害d,原理同Step2,否則,采用垂直投影法的分割結(jié)果。本次分割完成,字符計(jì)數(shù)器c = c+n。直 至ljc = 5,整個(gè)分割過(guò)程結(jié)束。
[0075] 當(dāng)分割完成字符計(jì)數(shù)器C的值仍小于5,說(shuō)明最后5-C個(gè)字符還未分割出來(lái)。那么剩 下的5-C個(gè)字符采用模板匹配法進(jìn)行分割,原理同St巧2。
[0076] ⑤字符特征提取和歸一化
[0077] 對(duì)不同的字符進(jìn)行四個(gè)側(cè)面掃描提取出字符骨骼累積統(tǒng)計(jì)特征,包括筆畫(huà)斜率累 積特征、拐點(diǎn)幅度累積特征、輪廓深度累積特征;最后通過(guò)固定粗網(wǎng)格提取字符內(nèi)部像素特 征。
[0078] 筆畫(huà)斜率累積特征提取字符筆畫(huà)是字符的一個(gè)非常具有代表性的特征,不同字符 在筆畫(huà)數(shù)量,筆畫(huà)長(zhǎng)短,筆畫(huà)形態(tài)是不同的。因此,我們對(duì)字符筆畫(huà)的斜率累積特征進(jìn)行了 提取。首先,將筆畫(huà)斜率定義為正斜率kpDsitive,負(fù)斜率kpDsitive和零斜率kzer。,分別統(tǒng)計(jì)正斜 率和負(fù)斜率的斜率累積值和零斜率點(diǎn)的累積數(shù)量。運(yùn)種方法的好處,可W較好地表征字符 的骨架筆畫(huà)形態(tài)和筆畫(huà)長(zhǎng)短的特性。
[0079] 首先定義筆畫(huà)斜率特征統(tǒng)計(jì)點(diǎn),當(dāng)且僅當(dāng)當(dāng)前掃描點(diǎn)為像素點(diǎn)并且前一掃描行 檢測(cè)到像素點(diǎn),則當(dāng)前掃描點(diǎn)為斜率特征統(tǒng)計(jì)點(diǎn),如圖3所示。假設(shè)當(dāng)前掃描點(diǎn)Pi(xi,yi)為 斜率統(tǒng)計(jì)點(diǎn),前一掃描行檢測(cè)到的像素點(diǎn)是Pi-l(Xi-l,yi-l),那么點(diǎn)Pi的斜率k計(jì)算由式(8) 得到。正負(fù)斜率累積值或零斜率點(diǎn)累積數(shù)量滿足式(9)。
[0080] 分別提取了字符4個(gè)偵曬的筆畫(huà)斜率累積特征。運(yùn)里共獲得了 12個(gè)特征向量,分別是筆 畫(huà)正斜率累積值增,,,,、、A說(shuō);。,筆畫(huà)負(fù)斜率累積值唉U.、增心、輝。<品, 和筆畫(huà)零斜率累積數(shù)量嫂1、K款'、構(gòu)I、域Γ。
[0083] 拐點(diǎn)幅度累積特征提?。?br>[0084] 在字符識(shí)別中,字符拐點(diǎn)含義非常豐富的特征信息,在多數(shù)情況下拐點(diǎn)的數(shù)量和 位置直接關(guān)系到字符結(jié)構(gòu)形狀。為了彌補(bǔ)上述筆畫(huà)斜率累積特征無(wú)法全面地表征字符骨骼 的結(jié)構(gòu)信息,我們引入了拐點(diǎn)幅度累積特征提取。運(yùn)里給出拐點(diǎn)的定義:假設(shè)當(dāng)前斜率統(tǒng)計(jì) 點(diǎn)Pi(xi,yi)和前一斜率統(tǒng)計(jì)點(diǎn)Pi-1對(duì)應(yīng)的斜率ki和ki-1數(shù)值符號(hào)不同時(shí),則Pi為一個(gè)拐點(diǎn),并 且該拐點(diǎn)的幅度ω 1,可由式(10)計(jì)算得到:
[0085] c〇i=|krki-i| (10)
[0086] 拐點(diǎn)幅度累積δ可由式(11)計(jì)算得到,其中T表示所檢測(cè)到的拐點(diǎn)的集合。運(yùn)里共 獲得字符圖片4個(gè)側(cè)面的拐點(diǎn)幅度累積值,共4個(gè)特征向量,分別為Sieft,St°P,S"ght,sd?n。
[0087]
(山
[0088] 側(cè)面輪廓深度特征提取
[0089] 不同字符在其輪廓上存在明顯的差異,如字符"S"和"U",字符"S"在左右側(cè)面具有 明顯的凹特征,頂部和底部都比較平緩;而字符"U"的頂部有明顯的凹特征,其它3個(gè)側(cè)面輪 廓均比較平緩,只從輪廓特征可W很容易地區(qū)分字符"S"和"U"。因此字符輪廓的凹凸信息 可W作為字符識(shí)別的一種有效信息。運(yùn)里用側(cè)面輪廓深度累積值D表示字符輪廓凹凸程度 信息。W字符右側(cè)面為例,在第i行,從右邊界向左邊界掃描,當(dāng)遇到第一個(gè)像素點(diǎn)時(shí),計(jì)算 右邊界到像素點(diǎn)之間的空點(diǎn)數(shù)量di。通過(guò)對(duì)字符4個(gè)側(cè)面的掃描。可W提取字符4個(gè)側(cè)面的 輪廓深度累積值,共獲得4個(gè)特征向量,分別為Dlef t,護(hù)ight,,DbDttDn。
[0090] 字符內(nèi)部像素統(tǒng)計(jì)特征提取
[0091] 只對(duì)字符外圍和骨架或輪廓的特征掃描提取,往往無(wú)法很好地區(qū)分一些外圍特征 類(lèi)似而內(nèi)部特征差異較大的字符。如字符"B"和"護(hù),運(yùn)兩個(gè)字符的外圍輪廓累積特征是非 常接近的,但是其字符內(nèi)部特征有明顯的差異。運(yùn)里引入字符內(nèi)部像素統(tǒng)計(jì)特征提取。如圖 6所示,在字符圖片中劃分兩個(gè)粗網(wǎng)格;并計(jì)算兩個(gè)網(wǎng)格分別包含的像素?cái)?shù)量,共獲得2個(gè)特 征向量,分別為Pl,P2。
[0092] ⑥字符識(shí)別
[0093] 首先對(duì)待識(shí)別字符樣本進(jìn)行特征提取,將運(yùn)些特征和預(yù)先存儲(chǔ)在字符庫(kù)中的一支 字符模式集合逐一進(jìn)行比對(duì),采用概率神經(jīng)網(wǎng)絡(luò)的方法將最接近輸入字符模式的已知字符 作為識(shí)別結(jié)果。
[0094] 概率神經(jīng)網(wǎng)絡(luò)是1990年由Specht提出的一種徑向基函數(shù)(RBF:Radial Basic 化nction)網(wǎng)絡(luò)的重要變形。它采用多變量化rzen窗估計(jì)不同類(lèi)的概率密度函數(shù),W貝葉斯 后驗(yàn)概率作為輸出,與傳統(tǒng)多層前向網(wǎng)絡(luò)相比,無(wú)需用BP算法進(jìn)行反向誤差計(jì)算,是完全前 向的計(jì)算過(guò)程。因此其訓(xùn)練時(shí)間短、結(jié)構(gòu)穩(wěn)定,具有強(qiáng)大的非線性識(shí)別能力,且不易收斂到 局部最小點(diǎn),特別適合求解模式識(shí)別問(wèn)題。
[00巧]P順的學(xué)習(xí)算法及步驟:
[0096] 1)確定隱含層神經(jīng)元徑向基函數(shù)中屯、
[0097] 不失一般性,設(shè)訓(xùn)練集樣本輸入矩陣P和輸出矩陣T分別為:
[009引
(12)
[0099] 其中,Pi徒示第j個(gè)訓(xùn)練樣本的第i個(gè)輸入變量;ti康示第j個(gè)訓(xùn)練樣本的第i個(gè)輸 出變量;R為輸入變量的維數(shù);K為輸出變量的維數(shù),對(duì)應(yīng)K個(gè)類(lèi)別;Q為訓(xùn)練集樣本數(shù)。
[0100] 與GRr^N相同,隱含層的每個(gè)神經(jīng)元對(duì)應(yīng)一個(gè)訓(xùn)練樣本,即Q個(gè)隱含層神經(jīng)元對(duì)應(yīng)的 徑向基函數(shù)中屯、為:
[0101] C = pT (13)
[0102] 2)確定隱含層神經(jīng)元闊值
[0103] 為了簡(jiǎn)便起見(jiàn),Q個(gè)隱含層神經(jīng)元對(duì)應(yīng)的闊值為:
[0104] bi=[bii,bi2,...,biQ]T (14)
[0105] 其中,
spread為徑向基函數(shù)的擴(kuò)展速度。
[0106] 3)確定隱含層與輸出層間的權(quán)值
[0107] 當(dāng)隱含層神經(jīng)元的徑向基函數(shù)中屯、及闊值確定后,隱含層神經(jīng)元的輸出層便可由 下式計(jì)算:
[010引日1 = 6邱(-| |c-pi| |2bi),i = l,2,...,Q (15)
[0109]其中,口1=帕1瓜2,。'瓜[?]'''為第:[個(gè)訓(xùn)練樣本向量。
[0110] 與RB巧申經(jīng)網(wǎng)絡(luò)不同的是,P順中隱含層與輸出層之間的連接權(quán)值W取為訓(xùn)練集輸 出矩陣,即:
[0111] W=t (16)
[0112] 4)輸出層神經(jīng)元輸出計(jì)算
[0113] 當(dāng)隱含層與輸出層神經(jīng)元間的連接權(quán)值確定后,根據(jù)P順的結(jié)構(gòu)圖便可W計(jì)算出 輸出層神經(jīng)元的輸出,即:
[0114] = LW2,ia\ i = 1,2, ···,Q (17)
[011 引 yi = compet(ni),i = l,2,...,0 (18)
[0116] 作業(yè)節(jié)點(diǎn)完成任務(wù)后向主節(jié)點(diǎn)(名稱(chēng)節(jié)點(diǎn))返回成功消息(消息中包含車(chē)牌字符 串);
[0117] (5)主節(jié)點(diǎn)將識(shí)別出來(lái)的車(chē)牌字符串返回給客戶(hù)端。
【主權(quán)項(xiàng)】
1. 一種基于Hadoop的分布式車(chē)牌識(shí)別方法,其特征在于該方法的步驟: 1) 客戶(hù)端向網(wǎng)關(guān)發(fā)送車(chē)牌識(shí)別請(qǐng)求,請(qǐng)求中包含待識(shí)別的車(chē)牌圖像; 2) 網(wǎng)關(guān)收到請(qǐng)求后形成識(shí)別任務(wù)下發(fā)到主節(jié)點(diǎn)上; 3) 主節(jié)點(diǎn)收到識(shí)別任務(wù)后,根據(jù)當(dāng)前作業(yè)節(jié)點(diǎn)的狀態(tài)將包含待識(shí)別車(chē)牌圖像的識(shí)別子 任務(wù)發(fā)送給作業(yè)節(jié)點(diǎn);作業(yè)節(jié)點(diǎn)開(kāi)始車(chē)牌識(shí)別任務(wù),其主要步驟為: ① 車(chē)牌圖像預(yù)處理:對(duì)抓拍到的車(chē)牌圖像進(jìn)行高斯濾波處理,減小噪聲的影響,然后 作灰度化處理得到灰度圖像; ② 車(chē)牌定位:首先利用Sobel算子對(duì)包含車(chē)牌的圖像進(jìn)行邊緣檢測(cè),然后進(jìn)行二值化 處理,再對(duì)二值圖像進(jìn)行形態(tài)學(xué)濾波,使車(chē)牌區(qū)域形成一個(gè)連通區(qū)域,然后根據(jù)車(chē)牌的先驗(yàn) 知識(shí):長(zhǎng)寬比相對(duì)固定,在二值圖像上字符呈現(xiàn)明暗交替變化,分別采用面積、長(zhǎng)寬比、一級(jí) 垂直投影特征進(jìn)行加權(quán)綜合來(lái)對(duì)所得到的連通區(qū)域進(jìn)行篩選,選定一個(gè)最佳的區(qū)域作為牌 照區(qū)域,并將其從圖像中分隔出來(lái); ③ 車(chē)牌校正:由于車(chē)牌的上下沿是兩條明顯的平行線,所以結(jié)合Hough變換和特征投 影法來(lái)檢測(cè)車(chē)牌的傾斜角,然后對(duì)車(chē)牌圖像進(jìn)行傾斜校正; ④ 車(chē)牌字符分割:采用模板匹配,關(guān)鍵域和垂直投影法相結(jié)合的方式進(jìn)行車(chē)牌字符分 害J;充分利用車(chē)牌自身的特征并結(jié)合模板匹配法對(duì)車(chē)牌進(jìn)行分割,該方法分割速度快且能 夠有效應(yīng)對(duì)字符粘連、模糊等情況; ⑤ 字符特征提取和歸一化:對(duì)不同的字符進(jìn)行四個(gè)側(cè)面掃描提取出字符骨骼累積統(tǒng) 計(jì)特征,包括筆畫(huà)斜率累積特征、拐點(diǎn)幅度累積特征、輪廓深度累積特征;最后通過(guò)固定粗 網(wǎng)格提取字符內(nèi)部像素特征; ⑥ 字符識(shí)別:字符識(shí)別的基本思想是匹配分類(lèi),首先對(duì)待識(shí)別字符樣本進(jìn)行特征提 取,將這些特征和預(yù)先存儲(chǔ)在字符庫(kù)中的一支字符模式集合逐一進(jìn)行比對(duì),將最接近輸入 字符模式的已知字符作為識(shí)別結(jié)果,本方案采用概率神經(jīng)網(wǎng)絡(luò)的識(shí)別方法; 作業(yè)節(jié)點(diǎn)完成任務(wù)后向主節(jié)點(diǎn)返回成功消息,消息中包含車(chē)牌字符串; 4 )主節(jié)點(diǎn)將識(shí)別出來(lái)的車(chē)牌字符串返回給客戶(hù)端。
【文檔編號(hào)】G06K9/34GK105825212SQ201610091465
【公開(kāi)日】2016年8月3日
【申請(qǐng)日】2016年2月18日
【發(fā)明人】王麗峰, 贠周會(huì), 王欣欣, 葉超, 王旭, 黃江林, 吳斌, 黃亮
【申請(qǐng)人】江西洪都航空工業(yè)集團(tuán)有限責(zé)任公司