來,具有易于實現(xiàn),速度快,泛化能力強 的特點。極限學習機的速度非常快,訓練過程只需要求出輸出權(quán)重。相比傳統(tǒng)算法計算單 隱藏層神經(jīng)網(wǎng)絡,極大地減少了運算復雜度,節(jié)省了運算時間。傳統(tǒng)的基于梯度的算法需要 面對諸如局部最小,合適的學習率、過擬合等問題,而極限學習機一步到位直接構(gòu)建起單隱 藏層反饋神經(jīng)網(wǎng)絡,避免了這些難以處理的棘手問題。
[0040] 如圖2所示,本發(fā)明實施例基于極限學習機的掃描證書圖像分類方法包括如下步 驟:
[0041] A :輸入掃描證書圖像數(shù)據(jù)樣本庫,進行預處理;
[0042] B :對經(jīng)過預處理的證書圖像利用Hough變換進行圓章定位,得到圓章外接矩形區(qū) 域,提取圓章區(qū)域的HSV顏色特征向量及圖像的長寬比向量作為特征數(shù)據(jù);
[0043] C :利用掃描證書圖像樣本庫特征數(shù)據(jù)訓練極限學習機;
[0044] D :輸入待分類圖像經(jīng)過A,B步驟處理,利用經(jīng)過訓練的極限學習機完成圖像分 類。
[0045] 根據(jù)極限學習機的理論,當隱藏神經(jīng)元個數(shù)L與訓練樣本的個數(shù)N -致時,求出T =HMl. 9)就能完成整個神經(jīng)網(wǎng)絡的構(gòu)建。
[0046] 大多數(shù)情況下,隱藏神經(jīng)元個數(shù)L遠小于訓練樣本的個數(shù)N,這時不存在使式 (1.9)成立的解。轉(zhuǎn)而求使損失函數(shù)C最小的解,/? = argmin||T-H//|i,,. C1.10)。
[0047] 根據(jù)極小范數(shù)解準則(同時滿足minllM-TlI和π?η||β ||),則式(LlO) 存在如下極小范數(shù)選最小二乘解:/J = H+T (1.1.D。其中,H+是隱藏層響應矩陣H的 Moore-Penrose增廣逆。根據(jù)嶺回歸原理,我們通常在計算H+時,在H tH或HHt的對角線上 添加一個小的正數(shù)λ使得整個系統(tǒng)更加穩(wěn)定,嶺回歸版的??可用如下等式表示:
[0048] H+= (ΗΤΗ+λ I) 1Ht, L > N (1. 12)或者 H+= H t (HHt+λ I) \ L 彡 N (1. 13)
[0049] 當>4十算完畢時,一個單隱藏層反饋神經(jīng)網(wǎng)絡就完成了。對于一個標簽未知的測 試樣本X,我們可以通過單隱藏層反饋神經(jīng)網(wǎng)絡推測它的標簽,它的標簽可以用下式推測:
[0050] = (丨.丨4) 7. h(x) = [G^1, t^x)-"G^, bL,x)]是神經(jīng)網(wǎng)絡隱藏層關(guān)于 X的響應。
[0051] 本分類方法的目標是將待分類圖像的圓章 HSV特征向量作為輸入值,得到證書圖 像最可能的類別。根據(jù)圖像分類經(jīng)驗及實踐證明,極限學習機具有速度快,泛化能力強,分 類準確率高的特點。本方法選用極限學習機進行掃描證書圖像分類。
[0052] 本實施例中,步驟A中預處理是利用現(xiàn)有噪聲濾除和傾斜校正方法進行預處理;
[0053] 本實施例中,在所述步驟B中對經(jīng)過預處理的證書圖像利用現(xiàn)有圓章定位的方 法,對定位得到的圓章所在的外接矩形進行分割提取,得到圓章區(qū)域,提取圓章區(qū)域的HSV 顏色特征向量;其具體操作步驟如下:
[0054] 1)利用現(xiàn)有圓章定位的方法,對定位得到的圓章所在的外接矩形進行分割提取, 得到圓章區(qū)域;
[0055] 2)將色度H、飽和度S及亮度V三個分量分別非均勻量化為8份、4份和4份:
[0057] 這樣圓章區(qū)域的HSV空間被分成XH+Xs+Xvf區(qū)間,X H、Xs、Xv分別是H、S及V的量 化級數(shù),于是我們得到一個十六維的顏色特征向量,加上掃描圖像圖片長寬比,最終提取一 個十七維特征向量;
[0058] 3)為了便于計算,經(jīng)過反復試驗,對所有特征值提取一位數(shù)的整數(shù)能得到最好的 效果。本方法選取的十七維特征用XM,Xkl...Xkl6表示,取值范圍為[0,9]之間的整數(shù)。
[0059] 本實施例中,步驟C中訓練極限學習機,一步到位構(gòu)建神經(jīng)網(wǎng)絡。極限學習機的速 度非???,訓練過程只需要求出輸出權(quán)重。其具體操作步驟如下:
[0060] 1)根據(jù)神經(jīng)網(wǎng)絡基本模型及極限學習機的特點,隨機生成輸入權(quán)重W1與偏置b y i = 1··· L ;
[0061] 2)根據(jù)公式
汁算訓練樣本的特征在隱藏層的響應H ;
[0062] 3)根據(jù)公式 ^ = 計算 β,其中 H+= (ΗτΗ+λΙ) 1HU >N (I. 12)或者
[0063] H+= Ht (ΗΗΤ+λ I) L ^ N (1.13)。
[0064] 當//汁算完畢時,一個單隱藏層反饋神經(jīng)網(wǎng)絡就完成了。
[0065] 本實施例中,步驟D中輸入待分類圖像經(jīng)過A,B步驟處理,利用經(jīng)過訓練的極限學 習機完成圖像分類,
[0066] 1)待分類圖像經(jīng)過A,B步驟處理;
[0067] 2)待分類圖像的特征數(shù)據(jù)作為測試數(shù)據(jù)輸入極限學習機,極限學習機輸出分類結(jié) 果,對于一個類型未知的測試樣本X,我們可以通過單隱藏層反饋神經(jīng)網(wǎng)絡推測它的類型, 它的類型可以用下式推測:./; = ( 1.14),h(x) = [Gh1, Id1iX)…G(wL, bL,x)]是 神經(jīng)網(wǎng)絡隱藏層關(guān)于X的響應。
[0068] 通過試驗得到的結(jié)果如下表:
[0070] 本發(fā)明實施例為基于極限學習機的掃描證書圖像分類方法,通過對經(jīng)過預處理的 證書圖像利用Hough變換進行圓章定位、分割、大小調(diào)整,提取圓章區(qū)域的HSV空間的顏色 特征向量及圖像長寬比;根據(jù)證書圖像樣本數(shù)據(jù)庫,建立極限學習機;輸入待分類圖像,判 斷圖片的分類;通過本分類方法,能簡單快速地對證書圖像進行分類,有效提高證書圖像檢 索的效率。
【主權(quán)項】
1. 一種基于極限學習機的掃描證書圖像分類方法,其特征在于,包括如下步驟: A:輸入掃描證書圖像數(shù)據(jù)樣本庫,進行預處理; B:對經(jīng)過預處理的證書圖像利用Hough變換進行圓章定位,得到圓章外接矩形區(qū)域, 提取圓章區(qū)域的HSV顏色特征向量及圖像的長寬比向量作為特征數(shù)據(jù); C:利用掃描證書圖像樣本庫特征數(shù)據(jù)訓練極限學習機; D:輸入待分類圖像經(jīng)過A,B步驟處理,利用經(jīng)過訓練的極限學習機完成圖像分類。2. 根據(jù)權(quán)利要求1所述的基于極限學習機的掃描證書圖像分類方法,其特征在于,所 述步驟A中預處理是利用現(xiàn)有噪聲濾除和傾斜校正方法進行預處理。3. 根據(jù)權(quán)利要求1所述的基于極限學習機的掃描證書圖像分類方法,其特征在于,所 述步驟B具體操作步驟如下: B1利用現(xiàn)有圓章定位的方法,對定位得到的圓章所在的外接矩形進行分割提取,得到 圓章區(qū)域; R9您伍齒褕知齒S75宮齒V二+公醫(yī)公卻丨並構(gòu)勺醫(yī)仆.先8沿_ 4沿知4沿.這樣圓章區(qū)域的HSV空間被分成XH+Xs+Xvf區(qū)間,XH、Xs、Xv分別是H、S及V的量化級 數(shù),于是得到一個十六維的顏色特征向量,加上掃描圖像圖片長寬比,最終提取一個十七維 特征向量; B3對所有特征值提取一位數(shù)的整數(shù),選取的十七維特征用Xk。,Xkl. . .Xkl6表示,取值范 圍為[〇,9]之間的整數(shù)。4. 根據(jù)權(quán)利要求1所述的基于極限學習機的掃描證書圖像分類方法,其特征在于,所 述步驟C具體操作步驟如下: C1根據(jù)神經(jīng)網(wǎng)絡基本模型及極限學習機的特點,隨機生成輸入權(quán)重Wl與偏置byi= ]_"?L; C2根據(jù)公式:十算訓練樣本的特征在隱藏層的響應H,其中h(x)= [gW?x+bDg(w2 ?x+b2). . .g(wL ?x+bj)],g為神經(jīng)元的激勵函數(shù); C3根據(jù)公式/hHl,計算輸出權(quán)重矩陣0,其中H+= (HTH+M)iHT,L>N或者H+ =HT(HHT+AI) \L彡N,H+是隱藏層響應矩陣H的Moore-Penrose增廣逆,在HTH或HHT的對 角線上添加一個小的正數(shù)A以使得整個系統(tǒng)更加穩(wěn)定; 當計算完畢時,一個單隱藏層反饋神經(jīng)網(wǎng)絡就完成了。5.根據(jù)權(quán)利要求4所述的基于極限學習機的掃描證書圖像分類方法,其特征在于,所 述步驟D具體操作步驟如下: D1待分類圖像經(jīng)過A,B步驟處理; D2待分類圖像的特征數(shù)據(jù)作為測試數(shù)據(jù)輸入極限學習機,極限學習機輸出分類結(jié)果, 對于一個類型未知的測試樣本x,通過單隱藏層反饋神經(jīng)網(wǎng)絡推測它的類型,它的類型可以 用下式推測是神經(jīng)網(wǎng)絡隱藏層關(guān)于x 的響應。
【專利摘要】本發(fā)明公開了一種基于極限學習機的掃描證書圖像分類方法,包括如下步驟:輸入掃描證書圖像數(shù)據(jù)樣本庫,進行預處理;對經(jīng)過預處理的證書圖像利用Hough變換進行圓章定位,得到圓章外接矩形區(qū)域,提取圓章區(qū)域的HSV顏色特征向量及圖像的長寬比向量作為特征數(shù)據(jù);利用掃描證書圖像樣本庫特征數(shù)據(jù)訓練極限學習機;輸入待分類圖像經(jīng)過A,B步驟處理,利用經(jīng)過訓練的極限學習機完成圖像分類。本發(fā)明將待分類圖像的圓章HSV特征向量作為輸入值,得到證書圖像最可能的類別。根據(jù)圖像分類經(jīng)驗及實踐證明,極限學習機具有速度快,泛化能力強,分類準確率高的特點。
【IPC分類】G06K9/66, G06K9/62
【公開號】CN105117732
【申請?zhí)枴緾N201510442275
【發(fā)明人】劉獻如, 張昊, 龍軍
【申請人】中南大學
【公開日】2015年12月2日
【申請日】2015年7月24日