證件圖像檢測方法及設(shè)備的制造方法
【專利摘要】本申請?zhí)峁┮环N證件圖像檢測方法及設(shè)備,本申請通過訓(xùn)練好的證件檢測器檢測出證件圖像在待檢測圖像中的位置,與傳統(tǒng)的基于邊緣的身份證檢測算法相比,本申請基于機(jī)器學(xué)習(xí)的算法更加魯棒,且能夠處理證件圖像的背景復(fù)雜的問題。另外,本申請通過對所述待檢測圖像校正角度,從而實(shí)現(xiàn)對旋轉(zhuǎn)的待檢測圖像進(jìn)行證件圖像所在位置的更精確的檢測。
【專利說明】
證件圖像檢測方法及設(shè)備
技術(shù)領(lǐng)域
[0001] 本申請涉及通信及計(jì)算機(jī)領(lǐng)域,尤其涉及一種證件圖像檢測方法及設(shè)備。
【背景技術(shù)】
[0002] 目前在一些網(wǎng)站身份認(rèn)證程序中,需要獲取用戶手持其證件的照片,后續(xù)需要從 照片中自動檢測證件在照片中的位置,W為后續(xù)的證件信息的識別提供技術(shù)基礎(chǔ)。例如,在 某一購物網(wǎng)站,賣家進(jìn)行開店實(shí)名認(rèn)證的時候需要上傳自己的手持身份證的照片,然后需 要在賣家的手持身份證的照片中自動檢測身份證的位置,W在認(rèn)證的時候展示身份證特寫 給賣家,讓賣家自行檢測身份證是否模糊,從而提高審核的一次性通過率,另外,檢測出身 份證的區(qū)域也為后續(xù)的身份證信息的識別提供技術(shù)基礎(chǔ)。
[0003] 但是傳統(tǒng)的基于邊緣的證件檢測算法只適用于背景比較簡單的圖像。對于背景比 較復(fù)雜,送種現(xiàn)有的方法往往會有許多誤檢的區(qū)域。另外,當(dāng)原始的圖像有旋轉(zhuǎn)時,傳統(tǒng)的 方法往往無法檢測到身份證。
【發(fā)明內(nèi)容】
[0004] 本申請的目的是提供一種證件檢測方法及系統(tǒng),解決目前存在的無法檢測到證件 或證件所在區(qū)域誤檢的問題。
[0005] 有鑒于此,本申請?zhí)峁┮环N證件圖像檢測方法,包括:
[0006] 基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器;
[0007] 通過所述證件檢測器檢測待檢測圖像中的證件圖像。
[0008] 進(jìn)一步的,基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器包括:
[0009] 獲取多個證件圖像和非證件圖像分別作為正樣本和負(fù)樣本;
[0010] 從正樣本和負(fù)樣本中隨機(jī)選擇不同的區(qū)域,分別提取不同的區(qū)域的MB-LBP特征;
[0011] 基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器。
[0012] 進(jìn)一步的,基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢 測器包括:
[0013] 基于不同的區(qū)域的MB-LBP特征并使用gentle Ad油oost策略進(jìn)行特征選擇,根據(jù) 選擇的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類器;
[0014] 使用cascade Ad油oost策略將多個強(qiáng)分類器級聯(lián)成的證件檢測器。
[0015] 進(jìn)一步的,分別提取不同的區(qū)域的MB-LBP特征包括:
[0016] 分別將每個區(qū)域劃分為若干個子區(qū)域,計(jì)算每個子區(qū)域的像素均值;
[0017] 通過比較每個區(qū)域內(nèi)的中必子區(qū)域的像素均值與周圍子區(qū)域的像素均值獲得每 個區(qū)域的二進(jìn)制編碼的MB-LBP特征;
[0018] 將每個區(qū)域的二進(jìn)制編碼MB-LBP特征轉(zhuǎn)化成十進(jìn)制的MB-LBP特征。
[0019] 進(jìn)一步的,基于不同的區(qū)域的MB-LBP特征并使用gentle Ad油oost策略進(jìn)行特征 選擇,根據(jù)選擇的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類器包括:
[0020] 重復(fù)下述步驟直至當(dāng)前強(qiáng)分類器中的多分支回歸樹弱分類器的個數(shù)是否達(dá)到預(yù) 設(shè)的個數(shù),并輸出生成的強(qiáng)分類器:
[0021] 根據(jù)正樣本和負(fù)樣本的數(shù)量設(shè)置每個正樣本或負(fù)樣本的權(quán)重,初始化強(qiáng)分類器;
[0022] 基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重訓(xùn)練得到對應(yīng) 的多分支回歸樹弱分類器;
[0023] 從多分支回歸樹弱分類器中選擇具有最小損失的多分支回歸樹弱分類器加入強(qiáng) 分類器;
[0024] 根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本和負(fù)樣本的權(quán)重。
[00巧]進(jìn)一步的,基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重訓(xùn) 練得到對應(yīng)的多分支回歸樹弱分類器包括:
[0026] 基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重得到第一損失 函數(shù);
[0027] 通過第一損失函數(shù)最小化后訓(xùn)練得到對應(yīng)于不同的區(qū)域的十進(jìn)制的MB-LBP特征 的每個多分支回歸樹弱分類器。
[0028] 進(jìn)一步的,所述第一損失函數(shù)表示如下:
[002引
其中,表示第m個弱分類器, N表示正樣本和負(fù)樣本的數(shù)量,表示第i個正樣本或負(fù)樣本的區(qū)域的十進(jìn)制的MB-LBP 特征,表示樣本的類型,為正樣本時y 1= 1,為負(fù)樣本時y 1= -l,w 1表示當(dāng)前第i個正樣 本或負(fù)樣本的權(quán)重,賣,采用多分支樹,定義如下:
[0030]
[0031] 進(jìn)一步的,通過第一損失函數(shù)最小化后訓(xùn)練得到對應(yīng)于不同的區(qū)域的十進(jìn)制的 MB-LBP特征的每個多分支回歸樹弱分類器中,
[0032] 通過最小化fm片BP))求得
。
[0033] 進(jìn)一步的,根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本和負(fù)樣本的權(quán)重 中,所述權(quán)重根據(jù)下式更正:
[0034]
[0035] 進(jìn)一步的,通過所述證件檢測器檢測待檢測圖像中的證件圖像之前還包括:
[0036] 對所述待檢測圖像校正角度。
[0037] 進(jìn)一步的,對所述待檢測圖像校正角度包括:
[0038] 訓(xùn)練 ImageNet 模型;
[0039] 獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本,使用所述ImageNet模型提取每個證件 圖像訓(xùn)練樣本的高層語義特征;
[0040] 使用線性支撐向量機(jī)對證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行訓(xùn)練得到確定圖 像旋轉(zhuǎn)角度的分類器;
[0041] 通過所述分類器確定一待檢測圖像的旋轉(zhuǎn)角度,根據(jù)待檢測圖像的旋轉(zhuǎn)角度調(diào)整 該待檢測圖像的角度。
[0042] 進(jìn)一步的,訓(xùn)練ImageNet模型包括:
[0043] 將ImageNet數(shù)據(jù)庫中的樣本圖像縮放到相同的分辨率;
[0044] 將所述樣本圖像進(jìn)行減均值操作;
[0045] 對減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切到統(tǒng)一尺寸;
[0046] 設(shè)置ImageNet模型的神經(jīng)網(wǎng)絡(luò)為依次連接的卷積層和全連接層;
[0047] 隨機(jī)裁切后的樣本圖像在神經(jīng)網(wǎng)絡(luò)前向傳播,計(jì)算出ImageNet模型的待優(yōu)化的 參數(shù)的損失值;
[0048] 根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過鏈?zhǔn)角髮?dǎo)法反向逐層求 待優(yōu)化的參數(shù)的梯度,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對所述待優(yōu)化的參數(shù)進(jìn)行 優(yōu)化W得到優(yōu)化參數(shù)后的ImageNet模型。
[0049] 進(jìn)一步的,計(jì)算出ImageNet模型的待優(yōu)化的參數(shù)的損失值中,所述待優(yōu)化的參數(shù) 的損失值J( Θ )根據(jù)如下第二損失函數(shù)獲取,
[0050]
,其中,Θ表示待優(yōu)化的參數(shù),η表示樣本 圖像的數(shù)量,k表示輸出類別的個數(shù),表示第i個樣本最后一個全連接層第j個類別的輸 出值。
[0051] 進(jìn)一步的,根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過鏈?zhǔn)角髮?dǎo)法反 向逐層求待優(yōu)化的參數(shù)的梯度中,根據(jù)如下公式求得待優(yōu)化的參數(shù)的梯度:
[0052] ,'-
[0053] 其中,gt表示第t次迭代的待優(yōu)化的參數(shù)的梯度,g W表示第t+1次迭代的所述 待優(yōu)化的參數(shù)的梯度,Θ t表示第t次迭代的待優(yōu)化的參數(shù),
表示第二損失函數(shù) J( Θ )對當(dāng)前待優(yōu)化的參數(shù)Θ = Θ t時的梯度,0. 9,g t表示慣性動量,0. 0005 · Θ t是對Θ 的正則化約束,η表示學(xué)習(xí)率。
[0054] 進(jìn)一步的,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對所述待優(yōu)化的參數(shù)進(jìn)行優(yōu) 化W得到優(yōu)化參數(shù)后的ImageNet模型中,通過如下公式對所述待優(yōu)化的參數(shù)進(jìn)行優(yōu)化: [005引 Θ w= Θ t+gw,其中,Θ W表示第t+1次迭代的待優(yōu)化的參數(shù)。
[0056] 進(jìn)一步的,使用所述ImageNet模型提取每個證件圖像訓(xùn)練樣本的高層語義特征 包括:
[0057] 將證件圖像訓(xùn)練樣本縮放到與ImageNet模型中隨機(jī)裁切后的樣本圖像相同的尺 寸;
[0058] 將縮放后的證件圖像訓(xùn)練樣本進(jìn)行減均值操作;
[0059] 使用所述優(yōu)化參數(shù)后的ImageNet模型提取減均值操作后的每個證件圖像訓(xùn)練樣 本的所述全連接層高層語義特征;
[0060] 將每個證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行稀疏化操作,并采用二范數(shù)將經(jīng)過 稀疏化操作的高層語義特征進(jìn)行歸一化操作。
[0061] 根據(jù)本申請的另一方面還提供一種用于證件圖像檢測的設(shè)備,包括:
[0062] 第一裝置,用于基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器;
[0063] 第二裝置,用于通過所述證件檢測器檢測待檢測圖像中的證件圖像。
[0064] 進(jìn)一步的,所述第一裝置包括:
[0065] 第一一模塊,用于獲取多個證件圖像和非證件圖像分別作為正樣本和負(fù)樣本;
[0066] 第一二模塊,用于從正樣本和負(fù)樣本中隨機(jī)選擇不同的區(qū)域,分別提取不同的區(qū) 域的MB-LBP特征;
[0067] 第一Η模塊,用于基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的 證件檢測器。
[0068] 進(jìn)一步的,所述第一 Η模塊包括:
[0069] 第一Η-單元,用于基于不同的區(qū)域的MB-LBP特征并使用gentle Ad油oost策略 進(jìn)行特征選擇,根據(jù)選擇的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類器;
[0070] 第一Η二單元,用于使用cascade Ad油oost策略將多個強(qiáng)分類器級聯(lián)成的證件檢 測器。
[0071] 進(jìn)一步的,第一二模塊包括:
[0072] 第一二一單元,用于分別將每個區(qū)域劃分為若干個子區(qū)域,計(jì)算每個子區(qū)域的像 素均值;
[0073] 第一二二單元,用于通過比較每個區(qū)域內(nèi)的中必子區(qū)域的像素均值與周圍子區(qū)域 的像素均值獲得每個區(qū)域的二進(jìn)制編碼的MB-LBP特征;
[0074] 第一二Η單元,用于將每個區(qū)域的二進(jìn)制編碼MB-LBP特征轉(zhuǎn)化成十進(jìn)制的 MB-LBP 特征。
[00巧]進(jìn)一步的,第一 Η-單元包括:
[0076] 第一 Η-一子單元,用于根據(jù)正樣本和負(fù)樣本的數(shù)量設(shè)置每個正樣本或負(fù)樣本的 權(quán)重,初始化強(qiáng)分類器;
[0077] 第一Η-二子單元,用于基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù) 樣本的權(quán)重訓(xùn)練得到對應(yīng)的多分支回歸樹弱分類器;
[0078] 第一Η-Η子單元,用于從多分支回歸樹弱分類器中選擇具有最小損失的多分支 回歸樹弱分類器加入強(qiáng)分類器;
[0079] 第一 Η-四子單元,用于根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本和負(fù) 樣本的權(quán)重,判斷當(dāng)前強(qiáng)分類器中的多分支回歸樹弱分類器的個數(shù)是否達(dá)到預(yù)設(shè)的個數(shù), 若是,則轉(zhuǎn)到第一 Η-五子單元執(zhí)行,若否,則轉(zhuǎn)到第一 Η-二子單元執(zhí)行;
[0080] 第一三一五子單兀,用于輸出生成的強(qiáng)分類器。
[0081] 進(jìn)一步的,所述第一Η-二子單元,用于基于不同的區(qū)域的十進(jìn)制的MB-LBP特征 和正樣本或負(fù)樣本的權(quán)重得到第一損失函數(shù),通過第一損失函數(shù)最小化后訓(xùn)練得到對應(yīng)于 不同的區(qū)域的十進(jìn)制的MB-LBP特征的每個多分支回歸樹弱分類器。
[0082] 進(jìn)一步的,所述第一 Η-二子單元得到的所述第一損失函數(shù)中,表示如下:
[0083]
,其中,fm (χ\βρ)表示第m個弱分類器, N表示正樣本和負(fù)樣本的數(shù)量,表示第i個正樣本或負(fù)樣本的區(qū)域的十進(jìn)制的MB-LBP 特征,表示樣本的類型,為正樣本時y 1= 1,為負(fù)樣本時y 1= -l,w 1表示當(dāng)前第i個正樣 本或負(fù)樣本的權(quán)重,'鳴^索,?·"ι(χ\βρ)采用多分支樹,?·"ι(χ\βρ)定義如下:
[0084]
[00財進(jìn)一步的,所述第一 S -二子單元通過最小化JiMsOw,fm(x\BP))求得
[0086] 進(jìn)一步的,第一 Η-四子單元根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本 和負(fù)樣本的權(quán)重中,所述權(quán)重根據(jù)下式更正:
[0087]
[0088] 進(jìn)一步的,所述設(shè)備還包括第Η裝置,用于對所述待檢測圖像校正角度。
[0089] 進(jìn)一步的,所述第Η裝置包括:
[0090] 第Η-模塊,訓(xùn)練ImageNet模型;
[0091] 第Η二模塊,獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本,使用所述ImageNet模型提 取每個證件圖像訓(xùn)練樣本的高層語義特征;
[0092] 第HH模塊,使用線性支撐向量機(jī)對證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行訓(xùn)練 得到確定圖像旋轉(zhuǎn)角度的分類器;
[0093] 第Η四模塊,通過所述分類器確定一待檢測圖像的旋轉(zhuǎn)角度,根據(jù)待檢測圖像的 旋轉(zhuǎn)角度調(diào)整該待檢測圖像的角度。
[0094] 進(jìn)一步的,所述第Η-模塊包括:
[0095] 第Η--單元,用于將ImageNet數(shù)據(jù)庫中的樣本圖像縮放到相同的分辨率;
[0096] 第Η-二單元,用于將所述樣本圖像進(jìn)行減均值操作;
[0097] 第Η-Η單元,用于對減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切到統(tǒng)一尺寸;
[0098] 第Η-四單元,用于設(shè)置ImageNet模型的神經(jīng)網(wǎng)絡(luò)為依次連接的卷積層和全連 接層;
[0099] 第立一五單元,用于隨機(jī)裁切后的樣本圖像在神經(jīng)網(wǎng)絡(luò)前向傳播,計(jì)算出 ImageNet模型的待優(yōu)化的參數(shù)的損失值;
[0100] 第Η-六單元,用于根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過鏈?zhǔn)?求導(dǎo)法反向逐層求待優(yōu)化的參數(shù)的梯度,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對所述 待優(yōu)化的參數(shù)進(jìn)行優(yōu)化W得到優(yōu)化參數(shù)后的ImageNet模型。
[01(Π ] 進(jìn)一步的,第Η-五單元計(jì)算出ImageNet模型的待優(yōu)化的參數(shù)的損失值中,所述 待優(yōu)化的參數(shù)的損失值J( Θ )根據(jù)如下第二損失函數(shù)獲取,
[0102]
其中,Θ表示待優(yōu)化的參數(shù),η表示樣本 圖像的數(shù)量,k表示輸出類別的個數(shù),:(6/表示第i個樣本最后一個全連接層第j個類別的輸 出值。
[0103] 進(jìn)一步的,第Η-六單元根據(jù)如下公式求得待優(yōu)化的參數(shù)的梯度:
[0104]
[0105] 其中,gt表示第t次迭代的待優(yōu)化的參數(shù)的梯度,g W表示第t+1次迭代的所述 待優(yōu)化的參數(shù)的梯度,Θ t表示第t次迭代的待優(yōu)化的參數(shù),
表示第二損失函數(shù) J( Θ )對當(dāng)前待優(yōu)化的參數(shù)Θ = Θ t時的梯度,0. 9,g t表示慣性動量,0. 0005 · Θ t是對Θ 的正則化約束,η表示學(xué)習(xí)率。
[0106] 進(jìn)一步的,第Η-六單元通過如下公式對所述待優(yōu)化的參數(shù)進(jìn)行優(yōu)化:
[0107] Θ w= Θ t+gw,其中,Θ W表示第t+1次迭代的待優(yōu)化的參數(shù)。
[010引進(jìn)一步的,所述第Η二模塊包括:
[0109] 第Η二一單元,用于獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本;
[0110] 第Η二二單元,用于將證件圖像訓(xùn)練樣本縮放到與ImageNet模型中隨機(jī)裁切后 的樣本圖像相同的尺寸;
[0111] 第Η二Η單元,用于將縮放后的證件圖像訓(xùn)練樣本進(jìn)行減均值操作;
[0112] 第Η二四單元,用于使用所述優(yōu)化參數(shù)后的ImageNet模型提取減均值操作后的 每個證件圖像訓(xùn)練樣本的所述全連接層高層語義特征;
[0113] 第Η二五單元,用于將每個證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行稀疏化操作, 并采用二范數(shù)將經(jīng)過稀疏化操作的高層語義特征進(jìn)行歸一化操作。
[0114] 與現(xiàn)有技術(shù)相比,本申請通過訓(xùn)練好的證件檢測器檢測出證件圖像在待檢測圖像 中的位置,與傳統(tǒng)的基于邊緣的身份證檢測算法相比,本申請基于機(jī)器學(xué)習(xí)的算法更加魯 棒,且能夠處理證件圖像的背景復(fù)雜的問題。
[0115] 另外,本申請通過對所述待檢測圖像校正角度,從而實(shí)現(xiàn)對旋轉(zhuǎn)的待檢測圖像進(jìn) 行證件圖像所在位置的更精確的檢測。
【附圖說明】
[0116] 通過閱讀參照W下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本申請的其它 特征、目的和優(yōu)點(diǎn)將會變得更明顯:
[0117] 圖1示出根據(jù)本申請一個方面的證件圖像檢測方法的流程圖;
[0118] 圖2示出本申請一優(yōu)選實(shí)施例的證件圖像檢測方法的流程圖;
[0119] 圖3示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0120] 圖4示出本申請一實(shí)施例的證件檢測器的檢測原理圖;
[0121] 圖5示出本申請另一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0122] 圖6示出本申請一實(shí)施例的每個區(qū)域的二進(jìn)制、十進(jìn)制編碼MB-LBP特征獲取原理 圖;
[0123] 圖7示出本申請?jiān)僖桓鼉?yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0124] 圖8示出本申請又一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0125] 圖9示出本申請另一優(yōu)選的實(shí)施例的證件圖像檢測方法的流程圖;
[0126] 圖10示出本申請另一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0127] 圖11示出本申請?jiān)僖桓鼉?yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0128] 圖12示出本申請一實(shí)施例的ImageNet模型的神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖;
[0129] 圖13示出本申請又一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖;
[0130] 圖14示出本申請另一方面的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0131] 圖15示出本申請一優(yōu)選實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0132] 圖16示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0133] 圖17示出本申請另一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0134] 圖18示出本申請?jiān)僖桓鼉?yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0135] 圖19示出本申請另一優(yōu)選的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0136] 圖20示出本申請另一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0137] 圖21示出本申請?jiān)僖桓鼉?yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[013引圖22示出本申請又一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖;
[0139] 圖23示出本申請一具體應(yīng)用實(shí)施例的原理圖。
[0140] 附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0141] 在本申請一個典型的配置中,終端、服務(wù)網(wǎng)絡(luò)的設(shè)備和可信方均包括一個或多個 處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
[0142] 內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(RAM)和/ 或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì) 的示例。
[0143] 計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可W由任何方法 或技術(shù)來實(shí)現(xiàn)信息存儲。信息可W是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。 計(jì)算機(jī)的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲器(SRAM)、 動態(tài)隨機(jī)存取存儲器值RAM)、其他類型的隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、電 可擦除可編程只讀存儲器巧EPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器 (CD-ROM)、數(shù)字多功能光盤值VD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁盤存儲或其他磁性 存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可W被計(jì)算設(shè)備訪問的信息。按照本文中的 界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信 號和載波。
[0144] 圖1示出根據(jù)本申請一個方面的證件圖像檢測方法的流程圖,結(jié)合圖1,本申請?zhí)?出一種證件圖像檢測方法包括:
[014引 步驟 S1,基于 MB-LBP (Multiscale Block Local Binary F^attern)特征訓(xùn)練由多 個強(qiáng)分類器級聯(lián)成的證件檢測器;
[0146] 步驟S3,通過所述證件檢測器檢測待檢測圖像中的證件圖像。在此,所述證件圖像 包括但不限于身份證圖像、護(hù)照圖像、工作證圖像、學(xué)生證圖像和駕駛證圖像。本步驟中,檢 測待檢測圖像中的證件圖像不僅是指檢測待檢測圖像中是否存在證件圖像,還包括檢測證 件圖像在待檢測圖像中的位置。本實(shí)施例通過訓(xùn)練好的證件檢測器檢測出證件圖像在待檢 測圖像中的位置,與傳統(tǒng)的基于邊緣的身份證檢測算法相比,本實(shí)施例基于機(jī)器學(xué)習(xí)的算 法更加魯棒,且能夠處理證件圖像的背景復(fù)雜的問題。
[0147] 圖2示出本申請一優(yōu)選實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖2,圖1中的 步驟S1包括:
[014引步驟S11,獲取多個證件圖像和非證件圖像分別作為正樣本和負(fù)樣本;例如,本步 驟中可W使用103個正樣本和500個負(fù)樣本,正樣本就是分辨率為40X60的身份證圖像, 負(fù)樣本是不包含身份證的任意圖像;
[0149] 步驟S12,從正樣本和負(fù)樣本中隨機(jī)選擇不同的區(qū)域,分別提取不同的區(qū)域的 MB-LBP 特征;
[0150] 步驟S13,基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測 器。在此,每個強(qiáng)分類器由多個多分支回歸樹弱分類器生成,每個多分支回歸樹弱分類器由 基于所述正樣本和負(fù)樣本的MB-LBP特征訓(xùn)練得到。
[0151] 圖3示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖3,圖2中 的步驟S13包括:
[015引步驟S131,基于不同的區(qū)域的MB-LBP特征并使用gentle Ad油oost策略進(jìn)行特征 選擇,根據(jù)選擇的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類器;
[0153] 步驟S132,使用cascade Ad油oost策略將多個強(qiáng)分類器級聯(lián)成的證件檢測器。由 于不同的區(qū)域的MB-LBP特征是二進(jìn)制的01編碼,無法采用一般的距離進(jìn)行度量。所W在 此,訓(xùn)練弱分類器采用多分支回歸樹的策略,然后使用gentle Ad油oost策略進(jìn)行特征選 擇,組合出強(qiáng)分類器,最后引入cascade Ad油oost策略來加速證件的檢測算法。
[0154] 本申請一更優(yōu)的實(shí)施例中,所述證件檢測器中在前的強(qiáng)分類器的多分支回歸樹弱 分類器的數(shù)量較少,在后的強(qiáng)分類器的多分支回歸樹弱分類器的數(shù)量較多。在此,為了使得 訓(xùn)練得到的檢測器具有較高的檢測率和較低的時間復(fù)雜度,采用級聯(lián)強(qiáng)分類器的策略來訓(xùn) 練身份證檢測的檢測器。級聯(lián)分類器的訓(xùn)練過程主要是強(qiáng)分類器的結(jié)合,越前面的強(qiáng)分類 器越簡單,只要保證較高的檢測率,所W前面幾個強(qiáng)分類器主要用于過濾不是身份證的候 選區(qū)域。越后面級聯(lián)的強(qiáng)分類器需要較高的準(zhǔn)確率,從而確保過濾到不是身份證的區(qū)域。例 女口,可W訓(xùn)練由16個強(qiáng)分類器級聯(lián)而成的證件檢測器。例如,步驟S13中生成了如圖4所 示的由16個強(qiáng)分類器級聯(lián)成的證件檢測器,相應(yīng)的,步驟S3中,將待檢測圖像輸入證件檢 測器,證件檢測器在檢測證件區(qū)域的時候是一個逐級過濾非證件區(qū)域的過程,通過在候選 區(qū)域中計(jì)算MB-LBP特征,通過級聯(lián)的強(qiáng)分類器一個一個判定,如果不是證件區(qū)域,就直接 認(rèn)為該區(qū)域不是證件,如果通過強(qiáng)分類器判定為證件,進(jìn)入下一個強(qiáng)分類器進(jìn)行判定,只有 當(dāng)所有的強(qiáng)分類器都認(rèn)為是證件時,該區(qū)域才是證件所在的位置。本領(lǐng)域技術(shù)人員應(yīng)能理 解上述證件檢測器的訓(xùn)練的描述僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的證件檢測器的訓(xùn) 練如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0155] 圖5示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖5,圖2中 的步驟S12中的分別提取不同的區(qū)域的MB-LBP特征包括:
[0156] 步驟S121,分別將每個區(qū)域劃分為若干個子區(qū)域,計(jì)算每個子區(qū)域的像素均值;
[0157] 步驟S122,通過比較每個區(qū)域內(nèi)的中必子區(qū)域的像素均值與周圍子區(qū)域的像素均 值獲得每個區(qū)域的二進(jìn)制編碼的MB-LBP特征;
[0158] 步驟S123,將每個區(qū)域的二進(jìn)制編碼MB-LBP特征轉(zhuǎn)化成十進(jìn)制的MB-LBP特征。 例如,如圖6所示,如果S121中將每個正樣本和負(fù)樣本劃分為9干個矩形區(qū)域,可通過如下 公式將每個正樣本或負(fù)樣本的二進(jìn)制的編碼轉(zhuǎn)化成十進(jìn)制的特征值XUP:
[0159]
b表示8個周圍區(qū)域 中的其中一個區(qū)域的序號,gb表示8個周圍區(qū)域中的其中一個區(qū)域的平均像素值,g。表示 中必區(qū)域的平均像素值,圖6中的區(qū)域的二進(jìn)制編碼的MB-LBP特征為11101001,轉(zhuǎn)化成十 進(jìn)制的MB-LBP特征為223。本領(lǐng)域技術(shù)人員應(yīng)能理解上述提取MB-LBP特征的描述僅為舉 例,其他現(xiàn)有的或今后可能出現(xiàn)的提取MB-LBP特征如可適用于本申請,也應(yīng)包含在本申請 保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0160] 圖7示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖7,圖3中 的步驟S131,包括:
[0161] 步驟S1311,根據(jù)正樣本和負(fù)樣本的數(shù)量N設(shè)置每個正樣本或負(fù)樣本的權(quán)重 化*占丟,初始化強(qiáng)分類器F(x) = 0;
[016引步驟S1312,基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重訓(xùn) 練得到對應(yīng)的多分支回歸樹弱分類器;
[0163] 步驟S1313,從多分支回歸樹弱分類器中選擇具有最小損失的多分支回歸樹弱分 類器加入強(qiáng)分類器;
[0164] 步驟S1314,根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本和負(fù)樣本的權(quán)重, 判斷當(dāng)前強(qiáng)分類器中的多分支回歸樹弱分類器的個數(shù)是否達(dá)到預(yù)設(shè)的個數(shù),若是,則轉(zhuǎn)到 步驟S1315,若否,則轉(zhuǎn)到步驟S1312 ;
[0165] 步驟S1315,輸出生成的強(qiáng)分類器
[0166] 圖8示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖8,圖7中 的步驟S1312,包括:
[0167] 步驟S13121,基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重 得到第一損失函數(shù);
[016引步驟S13122,通過第一損失函數(shù)最小化后訓(xùn)練得到對應(yīng)于不同的區(qū)域的十進(jìn)制的 MB-LBP特征的每個多分支回歸樹弱分類器。
[0169] 本申請一更優(yōu)的實(shí)施例中,步驟S13121中的所述第一損失函數(shù)表示如下:
[0170]
其中,fm(x\w)表示第m個弱分類器, N表示正樣本和負(fù)樣本的數(shù)量,表示第i個正樣本或負(fù)樣本的區(qū)域的十進(jìn)制的MB-LBP 特征,表示樣本的類型,為正樣本時y 1= 1,為負(fù)樣本時y 1= -l,w 1表示當(dāng)前第i個正樣 本或負(fù)樣本的權(quán)重,雌奏,fm(x\ep)采用多分支樹,fm(x\ep)定義如下:
[0171]
[017引本申請一更優(yōu)的實(shí)施例中,步驟S13122中通過最小化fm(x\BP))求得
即fm(x\ep)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述損失函數(shù)的描述僅為舉 例,其他現(xiàn)有的或今后可能出現(xiàn)的損失函數(shù)如可適用于本申請,也應(yīng)包含在本申請保護(hù)范 圍W內(nèi),并在此W引用方式包含于此。
[0173] 本申請一更優(yōu)的實(shí)施例中,步驟S1314中的根據(jù)選擇得到的多分支回歸樹弱分類 器更新正樣本和負(fù)樣本的權(quán)重中,所述權(quán)重根據(jù)下式更正:
[0174] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述權(quán)重更正的描述僅為 3 舉例,其他現(xiàn)有的或今后可能出現(xiàn)的權(quán)重更正如可適用于本申請,也應(yīng)包含在本申請保護(hù) 范圍W內(nèi),并在此W引用方式包含于此。
[0175] 圖9示出本申請一優(yōu)選的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖9,圖1中 的步驟S3之前還包括:
[0176] 步驟S2,對所述待檢測圖像校正角度,從而實(shí)現(xiàn)對旋轉(zhuǎn)的待檢測圖像進(jìn)行證件圖 像所在位置的更精確的檢測。
[0177] 圖10示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖10,圖9 中的步驟S2,包括:
[017引步驟S21,訓(xùn)練ImageNet模型;具體的,圖像分類是計(jì)算機(jī)視覺、模式識別和機(jī)器 學(xué)習(xí)領(lǐng)域一個非?;钴S的研究方向,近年來,隨著大規(guī)模圖像數(shù)據(jù)集的健全,圖像分類算法 的準(zhǔn)確率得到了極大程度的提升,而且每年都有基于Image化t數(shù)據(jù)庫(100多萬樣本,1000 個類別)的圖像分類競賽平臺,深度卷積神經(jīng)網(wǎng)絡(luò)目前在圖像理解的領(lǐng)域,包括圖像分類, 圖像檢索,目標(biāo)檢測等,得到了廣泛的使用。特別是在圖像分類方面,基于深度卷積神經(jīng)網(wǎng) 絡(luò)的圖像分類算法在準(zhǔn)確率方面往往比傳統(tǒng)的BOW模型相比高出10個百分點(diǎn),當(dāng)樣本量 比較小的時候,訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的ImageNet模型容易出現(xiàn)過擬合的現(xiàn)象,從而導(dǎo)致 模型的泛化能力很差,為了克服送個缺點(diǎn),本申請中首先訓(xùn)練在ImageNet數(shù)據(jù)集合上訓(xùn)練 1000類的圖像分類模型,然后用送個模型來提取旋轉(zhuǎn)圖像的高層特征,最后用使用線性支 撐向量機(jī)(liblinear svm)分類器來進(jìn)行圖像分類,送種圖像分類方法綜合了深度學(xué)習(xí)和 線性svm分類器的特點(diǎn),從而使得得到的模型具有較高的準(zhǔn)確率W及較好的泛化能力; [0179] 步驟S22,獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本,使用所述ImageNet模型提取 每個證件圖像訓(xùn)練樣本的高層語義特征;具體的,在互聯(lián)網(wǎng)環(huán)境中有成千上萬的不同年齡 段,不同性格的用戶,用戶上傳的待檢測圖像如手持證件照照片也是千奇百怪,通過數(shù)據(jù)分 析,發(fā)現(xiàn)很多用戶上傳的手持照片是旋轉(zhuǎn)過的,一般可W分為正常旋轉(zhuǎn)0度,旋轉(zhuǎn)90度,旋 轉(zhuǎn)180度,旋轉(zhuǎn)270度旋轉(zhuǎn),針對送些特點(diǎn),本申請采用圖像分類的方式來判斷待檢測圖像 的旋轉(zhuǎn)角度,在此,可W收集多個沒有旋轉(zhuǎn)的同一類證件圖像,然后隨機(jī)對送些證件圖像進(jìn) 行旋轉(zhuǎn),如分別旋轉(zhuǎn)90度,180度,270度,從而得到4個不同旋轉(zhuǎn)方向的證件圖像作為用于 判斷送一類證件圖像旋轉(zhuǎn)方向的證件圖像訓(xùn)練樣本,例如可W獲得8609個樣本(Ii,yi),具 體用公式表示如下:
[0182] 其中,li表示證件圖像訓(xùn)練樣本,y i表示證件圖像訓(xùn)練樣本的標(biāo)識1油el, Rg(I)表 示對證件圖像訓(xùn)練樣本旋轉(zhuǎn)a度。本領(lǐng)域技術(shù)人員應(yīng)能理解上述證件圖像訓(xùn)練樣本的描述 僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的證件圖像訓(xùn)練樣本如可適用于本申請,也應(yīng)包含 在本申請保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0183] 步驟S23,使用線性支撐向量機(jī)對證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行訓(xùn)練得 到確定圖像旋轉(zhuǎn)角度的分類器;
[0184] 步驟S24,通過所述分類器確定一待檢測圖像的旋轉(zhuǎn)角度,根據(jù)待檢測圖像的旋轉(zhuǎn) 角度調(diào)整該待檢測圖像的角度。在此,當(dāng)待檢測圖像照輸入時,首先用步驟S23訓(xùn)練好的確 定圖像旋轉(zhuǎn)角度的分類器確定待檢測圖像的旋轉(zhuǎn)角度,然后對待檢測圖像進(jìn)行調(diào)整如調(diào)整 到0旋轉(zhuǎn)角度,后續(xù)即可使用步驟S1訓(xùn)練好的證件檢測器對調(diào)整過的待檢測圖像進(jìn)行證件 所在位置的檢測,例如,如果檢測到證件圖像,郝么可W對證件區(qū)域進(jìn)行放大展示,如果未 檢測到,就提示用戶上傳的待檢測圖像不符合規(guī)范。
[0185] 圖11示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖11,圖 10中的步驟S21,包括:
[0186] 步驟S211,將ImageNet數(shù)據(jù)庫中的樣本圖像縮放到相同的分辨率;例如,可 將ImageNet數(shù)據(jù)庫中的樣本圖像都縮放到256X256X3的分辨率,優(yōu)選的,為了得到較 好的縮放效果,在ImageNet數(shù)據(jù)庫中的樣本圖像的分辨率大于256的時候,采用抗銀齒 (ANTI-ALIASING)的圖像縮放算法;當(dāng)ImageNet數(shù)據(jù)庫中的樣本圖像的分辨率小于256的 時候,采用雙Η次差值度ICUBIC)縮放算法,從而降低因圖像縮放導(dǎo)致的損失,可通過如下 公式得到縮放到相同的分辨率的樣本圖像I。^;
[0187]
其中,I表示縮放前的 樣本圖像,表示縮放前的樣本圖像I的寬度,I h表示表示縮放前的樣本圖像I的高度, Rcsizc^,.、,,、、(I)表示采用抗銀齒(ANTI-ALIASING)的圖像縮放算法將Image化t數(shù)據(jù)庫中 的樣本圖像都縮放到256X256的分辨率,R.饋ize證uBic(〇表示將Image化t數(shù)據(jù)庫中的樣本 圖像都縮放到256X256的分辨率。本領(lǐng)域技術(shù)人員應(yīng)能理解上述樣本圖像縮放的描述僅 為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的樣本圖像縮放如可適用于本申請,也應(yīng)包含在本申 請保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[018引步驟S212,將所述樣本圖像進(jìn)行減均值操作;在此將樣本圖像的均值歸一化到0, 減均值操作后的樣本圖像1。?!?可通過如下公式得到:
[0189]
,其中,η表示樣本圖像的數(shù)量,i表示η個樣本圖像中的 某個樣本圖像的序號;
[0190] 步驟S213,對減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切到統(tǒng)一尺寸;在此,為了使 得模型具有平移不變性,在訓(xùn)練ImageNet模型的時候需要對縮放后的圖像進(jìn)行隨機(jī)裁 切,裁切的分辨率設(shè)置為32,從而將原先縮放到分辨率256X256X3的圖像裁切到分辨率 224X224X3,可通過如下公式得到隨機(jī)裁切后的樣本圖像I。。心
[0191] x〇= rand (Ο, 31), y 〇= rand (0, 31)
[0192]
,其中,X。表示減均值操作后的樣本圖像進(jìn) 行隨機(jī)裁切的X向裁切起始點(diǎn),y。表示減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切的y向裁切 起始點(diǎn),I"e>^3(x,y)表示隨機(jī)裁切后的樣本圖像的某個像素點(diǎn)的像素值,Le?2(x+XD,y+y。)表 示表示隨機(jī)裁切前的樣本圖像的某個像素點(diǎn)的像素值
[0193] 步驟S214,設(shè)置ImageNet模型的神經(jīng)網(wǎng)絡(luò)為依次連接的卷積層和全連接層; 在此,可在GPU(Gra地ic Processing化it,圖形處理器)上訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的 ImageNet模型,卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算的過程中會對每個圖像進(jìn)行卷積操作,密集采樣的卷 積操作會使得計(jì)算復(fù)雜度非常高,所W訓(xùn)練的過程中可采用GPU進(jìn)行訓(xùn)練,例如可采用的 GPU型號為tesla k20系列GPU,深度卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,主要有2個 特點(diǎn),一個是卷積,用于提取圖像特征,另外一個就是網(wǎng)絡(luò)的深度比較深,模型包含大量的 參數(shù)。如圖12所示,ImageNet模型的神經(jīng)網(wǎng)絡(luò)包含了 5個卷積層和3個全連接層,,總共 可含有650萬個待優(yōu)化的參數(shù),其中,5個卷積層分別為CPN1、CPN2、C0NV3、C0NV4和CP5, 3個全連接層分別為FC6、FC7和FC8, CPN1依次進(jìn)行卷積操作(filter、padding、stride、 filtersize)、池化操作(sizex、stride)和歸一化操作,CPN2依次進(jìn)行卷積操作(filter、 group、padding、stride、filtersize)、池化操作(sizex、stride)和歸一化操作,C0NV3 依 次進(jìn)行卷積操作(filter、padding、stride、filtersize)和歸一化操作,C0NV4依次進(jìn)行 卷積操作(filter、padding、stride、filtersize)和歸一化操作,CP5依次進(jìn)行卷積操作 (filter、g;roup、padding、stride、filtersize)、池化操作(sizex、stride)和歸一化操作, FC6有4096個輸出,F(xiàn)C7有4096個輸出,F(xiàn)C8有4096個輸出;本領(lǐng)域技術(shù)人員應(yīng)能理解上 述ImageNet模型的神經(jīng)網(wǎng)絡(luò)的描述僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的ImageNet模 型的神經(jīng)網(wǎng)絡(luò)如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式包 含于此。
[0194] 步驟S215,隨機(jī)裁切后的樣本圖像在神經(jīng)網(wǎng)絡(luò)前向傳播,計(jì)算出ImageNet模型的 待優(yōu)化的參數(shù)的損失值;
[0195] 步驟S216,根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過鏈?zhǔn)角髮?dǎo)法反 向逐層求待優(yōu)化的參數(shù)的梯度,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法(SGD)對所述待 優(yōu)化的參數(shù)進(jìn)行優(yōu)化W得到優(yōu)化參數(shù)后的ImageNet模型。
[0196] 本申請一更優(yōu)的實(shí)施例中,步驟S215中所述待優(yōu)化的參數(shù)的損失值J( Θ )根據(jù)如 下第二損失函數(shù)獲取,
[0197]
,其中,Θ表示待優(yōu)化的參數(shù),η表示樣本 圖像的數(shù)量,k表示輸出類別的個數(shù),1/表示第i個樣本最后一個全連接層第j個類別的輸 出值。本領(lǐng)域技術(shù)人員應(yīng)能理解上述損失函數(shù)的描述僅為舉例,其他現(xiàn)有的或今后可能出 現(xiàn)的損失函數(shù)如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式包 含于此。
[019引本申請一更優(yōu)的實(shí)施例中,步驟S216中根據(jù)如下公式求得待優(yōu)化的參數(shù)的梯度:
[0199] J
[0200] 其中,gt表示第t次迭代的待優(yōu)化的參數(shù)的梯度,g W表示第t+1次迭代的所述 待優(yōu)化的參數(shù)的梯度,Θ t表示第t次迭代的待優(yōu)化的參數(shù),
表示第二損失函數(shù) J(e)對當(dāng)前待優(yōu)化的參數(shù)Θ = 時的梯度,0.9· gt表示慣性動量,慣性動量的引入使 得損失函數(shù)J(e)的下降和梯度更新更加平穩(wěn),0.0005 · θι是對Θ的正則化約束,η表 示學(xué)習(xí)率,一般地,學(xué)習(xí)率在一開始訓(xùn)練的時候設(shè)置為0.01,當(dāng)訓(xùn)練到損失函數(shù)J( Θ)不下 降的時候,將學(xué)習(xí)率調(diào)小10倍即0. 001。本領(lǐng)域技術(shù)人員應(yīng)能理解上述求得待優(yōu)化的參數(shù) 的梯度的描述僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的求得待優(yōu)化的參數(shù)的梯度的方式如 可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0201] 本申請一更優(yōu)的實(shí)施例中,步驟S216中,通過如下公式對所述待優(yōu)化的參數(shù)進(jìn)行 優(yōu)化:
[0202] Θ w= Θ t+gw,其中,Θ W表示第t+1次迭代的待優(yōu)化的參數(shù)。本領(lǐng)域技術(shù)人員 應(yīng)能理解上述對待優(yōu)化的參數(shù)進(jìn)行優(yōu)化的描述僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的對 待優(yōu)化的參數(shù)進(jìn)行優(yōu)化的方式如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在 此W引用方式包含于此。
[0203] 圖13示出本申請一更優(yōu)的實(shí)施例的證件圖像檢測方法的流程圖。結(jié)合圖13,圖10 的步驟S22中,使用所述ImageNet模型提取每個證件圖像訓(xùn)練樣本的高層語義特征包括:
[0204] 步驟S221,將證件圖像訓(xùn)練樣本縮放到與ImageNet模型中隨機(jī)裁切后的樣 本圖像相同的尺寸;在此,可采用采用雙線性插值的方式將證件圖像訓(xùn)練樣本縮放到 與ImageNet模型中隨機(jī)裁切后的樣本圖像相同的尺寸,例如,如果S213中訓(xùn)練得到的 ImageNet模型輸入數(shù)據(jù)即隨機(jī)裁切后的樣本圖像的分辨率為224X224X3,所W對證件圖 像訓(xùn)練樣本直接縮放到分辨率224 X 224 X 3 ;
[0205] 步驟S222,將縮放后的證件圖像訓(xùn)練樣本進(jìn)行減均值操作;具體的,本步驟中將 證件圖像的均值歸一化到0,減均值操作后的證件圖像訓(xùn)練樣本1。?!?可通過如下公式得 到;
[0206]
,其中,1。。《4表示減均值操作前的證件圖像訓(xùn)練樣本, η'表示證件圖像訓(xùn)練樣本的數(shù)量,i'表示η'個樣本圖像中的某個證件圖像訓(xùn)練樣本的 序號;
[0207] 步驟S223,使用所述優(yōu)化參數(shù)后的ImageNet模型提取減均值操作后的每個證件 圖像訓(xùn)練樣本的所述全連接層高層語義特征;在此,提取到的是每個證件圖像訓(xùn)練樣本的 所述3個全連接層(f6,巧,巧全連接層)高層語義特征,例如,可W提取到總共的高層語義 特征的維數(shù)為9192 ;
[020引步驟S224,將每個證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行稀疏化操作,并采用二 范數(shù)將經(jīng)過稀疏化操作的高層語義特征進(jìn)行歸一化操作。在此,進(jìn)行稀疏化操作通過下式 實(shí)現(xiàn):
[0209]
其中,護(hù)表示稀疏化操作前的第i維高層語義特征, 表示稀疏化操作后的第i維高層語義特征;
[0210] 采用二范數(shù)將經(jīng)過稀疏化操作的高層語義特征進(jìn)行歸一化操作通過下式實(shí)現(xiàn):
[0211]
其中,巧。表示經(jīng)過歸一化操作后的高層語義特征。本領(lǐng)域 技術(shù)人員應(yīng)能理解上述稀疏化和歸一化的描述僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的稀 疏化和歸一化方式如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方 式包含于此。
[0212] 優(yōu)選的,S23中使用線性支撐向量機(jī)對經(jīng)過稀疏化和歸一化的證件圖像訓(xùn)練樣本 的高層語義特征訓(xùn)練W得到確定圖像旋轉(zhuǎn)角度的分類器。在此,由于經(jīng)過稀疏化和歸一化 即步驟S224的證件圖像訓(xùn)練樣本的高層語義特征具有稀疏和高維度的特點(diǎn),送種特征往 往都是線性可分的。所W,采用線性支撐向量機(jī)作為分類器,用于證件圖像旋轉(zhuǎn)角度的判 斷。實(shí)際訓(xùn)練過程中,可將所有訓(xùn)練樣本分成5份,4份作為證件圖像訓(xùn)練樣本用于訓(xùn)練, 1份作為證件圖像測試樣本用于測試,交叉校驗(yàn)后,訓(xùn)練得到確定圖像旋轉(zhuǎn)角度的分類器的 準(zhǔn)確率為99%。
[0213] 上述實(shí)施例可通過C++語言實(shí)現(xiàn),在Image化t模型訓(xùn)練階段,使用GPU進(jìn)行訓(xùn)練, GPU型號可為tesla K20,另外待檢測圖像旋轉(zhuǎn)方向的確定W及證件區(qū)域的檢測都可用C++ 語言實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述實(shí)施例的語言實(shí)現(xiàn)方式的描述僅為舉例,其他現(xiàn) 有的或今后可能出現(xiàn)的實(shí)施例的語言實(shí)現(xiàn)方式如可適用于本申請,也應(yīng)包含在本申請保護(hù) 范圍W內(nèi),并在此W引用方式包含于此。
[0214] 圖14示出根據(jù)本申請另一個方面的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖,結(jié)合圖 14,本申請?zhí)岢鲆环N用于證件圖像檢測的設(shè)備100,包括:
[0215] 第一裝置1,用于基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器;
[0216] 第二裝置2,用于通過所述證件檢測器檢測待檢測圖像中的證件圖像。在此,所述 證件圖像包括但不限于身份證圖像、護(hù)照圖像、工作證圖像、學(xué)生證圖像和駕駛證圖像。本 步驟中,檢測待檢測圖像中的證件圖像不僅是指檢測待檢測圖像中是否存在證件圖像,還 包括檢測證件圖像在待檢測圖像中的位置。本實(shí)施例通過訓(xùn)練好的證件檢測器檢測出證件 圖像在待檢測圖像中的位置,與傳統(tǒng)的基于邊緣的身份證檢測算法相比,本實(shí)施例基于機(jī) 器學(xué)習(xí)的算法更加魯棒,且能夠處理證件圖像的背景復(fù)雜的問題。
[0217] 圖15示出本申請一優(yōu)選實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖,結(jié)合圖15, 圖14中所述第一裝置1包括:
[021引第一一模塊11,用于獲取多個證件圖像和非證件圖像分別作為正樣本和負(fù)樣本; 例如,第一一模塊11可W使用103個正樣本和500個負(fù)樣本,正樣本就是分辨率為40X60 的身份證圖像,負(fù)樣本是不包含身份證的任意圖像;
[0219] 第一二模塊12,用于從正樣本和負(fù)樣本中隨機(jī)選擇不同的區(qū)域,分別提取不同的 區(qū)域的MB-LBP特征;
[0220] 第一Η模塊13,用于基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成 的證件檢測器。在此,每個強(qiáng)分類器由多個多分支回歸樹弱分類器生成,每個多分支回歸樹 弱分類器由基于所述正樣本和負(fù)樣本的MB-LBP特征訓(xùn)練得到。
[0221] 圖16示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 16,圖15中所述第一Η模塊13包括:
[022引第一Η-單元131,用于基于不同的區(qū)域的MB-LBP特征并使用gentle Ad油oost 策略進(jìn)行特征選擇,根據(jù)選擇的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類 器;
[022引第一Η二單元132,用于使用cascade Ad油oost策略將多個強(qiáng)分類器級聯(lián)成的證 件檢測器。由于不同的區(qū)域的MB-LBP特征是二進(jìn)制的01編碼,無法采用一般的距離進(jìn)行 度量。所W在此,訓(xùn)練弱分類器采用多分支回歸樹的策略,然后使用gentle Adaboost策略 進(jìn)行特征選擇,組合出強(qiáng)分類器,最后引入cascade Ad油oost策略來加速證件的檢測算法。
[0224] 本申請一更優(yōu)的實(shí)施例中,所述證件檢測器中在前的強(qiáng)分類器的多分支回歸樹弱 分類器的數(shù)量較少,在后的強(qiáng)分類器的多分支回歸樹弱分類器的數(shù)量較多。在此,為了使得 訓(xùn)練得到的檢測器具有較高的檢測率和較低的時間復(fù)雜度,采用級聯(lián)強(qiáng)分類器的策略來訓(xùn) 練身份證檢測的檢測器。級聯(lián)分類器的訓(xùn)練過程主要是強(qiáng)分類器的結(jié)合,越前面的強(qiáng)分類 器越簡單,只要保證較高的檢測率,所W前面幾個強(qiáng)分類器主要用于過濾不是身份證的候 選區(qū)域。越后面級聯(lián)的強(qiáng)分類器需要較高的準(zhǔn)確率,從而確保過濾到不是身份證的區(qū)域。例 女口,可W訓(xùn)練由16個強(qiáng)分類器級聯(lián)而成的證件檢測器。例如,第一Η模塊13生成了如圖4 所示的由16個強(qiáng)分類器級聯(lián)成的證件檢測器,相應(yīng)的,第二裝置2將待檢測圖像輸入證件 檢測器,證件檢測器在檢測證件區(qū)域的時候是一個逐級過濾非證件區(qū)域的過程,通過在候 選區(qū)域中計(jì)算MB-LBP特征,通過級聯(lián)的強(qiáng)分類器一個一個判定,如果不是證件區(qū)域,就直 接認(rèn)為該區(qū)域不是證件,如果通過強(qiáng)分類器判定為證件,進(jìn)入下一個強(qiáng)分類器進(jìn)行判定,只 有當(dāng)所有的強(qiáng)分類器都認(rèn)為是證件時,該區(qū)域才是證件所在的位置。本領(lǐng)域技術(shù)人員應(yīng)能 理解上述證件檢測器的訓(xùn)練的描述僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的證件檢測器的 訓(xùn)練如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0225] 圖17示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 17, 圖15中第一二模塊12包括:
[0226] 第一二一單元121,用于分別將每個區(qū)域劃分為若干個子區(qū)域,計(jì)算每個子區(qū)域的 像素均值;
[0227] 第一二二單元122,用于通過比較每個區(qū)域內(nèi)的中必子區(qū)域的像素均值與周圍子 區(qū)域的像素均值獲得每個區(qū)域的二進(jìn)制編碼的MB-LBP特征;
[0228] 第一二Η單元123,用于將每個區(qū)域的二進(jìn)制編碼MB-LBP特征轉(zhuǎn)化成十進(jìn)制的 MB-LBP特征。例如,如圖6所示,如果第一二一單元121將每個正樣本和負(fù)樣本劃分為9干 個矩形區(qū)域,可通過如下公式將每個正樣本或負(fù)樣本的二進(jìn)制的編碼轉(zhuǎn)化成十進(jìn)制的特征 值 Xlbp;
[0229]
b表示8個周圍區(qū)域 中的其中一個區(qū)域的序號,gb表示8個周圍區(qū)域中的其中一個區(qū)域的平均像素值,g。表示 中必區(qū)域的平均像素值,圖6中的區(qū)域的二進(jìn)制編碼的MB-LBP特征為11101001,轉(zhuǎn)化成十 進(jìn)制的MB-LBP特征為223。本領(lǐng)域技術(shù)人員應(yīng)能理解上述提取MB-LBP特征的描述僅為舉 例,其他現(xiàn)有的或今后可能出現(xiàn)的提取MB-LBP特征如可適用于本申請,也應(yīng)包含在本申請 保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0230] 圖18示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 18, 圖16中第一Η-單元131包括:
[0231] 第一 Η-一子單元1311,用于根據(jù)正樣本和負(fù)樣本的數(shù)量設(shè)置每個正樣本或負(fù)樣 本的權(quán)重,初始化強(qiáng)分類器;在此,可根據(jù)正樣本和負(fù)樣本的數(shù)量Ν設(shè)置每個正樣本或負(fù)樣 本的權(quán)重"V - -I,初始化強(qiáng)分類器F(x) = 0 ;
[0232] 第一Η-二子單元1312,用于基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本 或負(fù)樣本的權(quán)重訓(xùn)練得到對應(yīng)的多分支回歸樹弱分類器;
[0233] 第一Η-Η子單元1313,用于從多分支回歸樹弱分類器中選擇具有最小損失的多 分支回歸樹弱分類器加入強(qiáng)分類器;
[0234] 第一Η-四子單元1314,用于根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本 和負(fù)樣本的權(quán)重,判斷當(dāng)前強(qiáng)分類器中的多分支回歸樹弱分類器的個數(shù)是否達(dá)到預(yù)設(shè)的個 數(shù),若是,則轉(zhuǎn)到第一Η-五子單元1315執(zhí)行,若否,則轉(zhuǎn)到第一Η-二子單元1312執(zhí)行;
[0235] 第一三一五子單兀1315,用于輸出生成的強(qiáng)分類器
[0236] 本申請一更優(yōu)的實(shí)施例中,所述第一Η-二子單元1312,用于基于不同的區(qū)域的 十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重得到第一損失函數(shù),通過第一損失函數(shù)最 小化后訓(xùn)練得到對應(yīng)于不同的區(qū)域的十進(jìn)制的MB-LBP特征的每個多分支回歸樹弱分類 器。
[0237] 本申請一更優(yōu)的實(shí)施例中,所述第一 Η-二子單元得到的所述第一損失函數(shù)中, 表示如下:
[023引
其中,表示第m個弱分類器, N表示正樣本和負(fù)樣本的數(shù)量,表示第i個正樣本或負(fù)樣本的區(qū)域的十進(jìn)制的MB-LBP 特征,表示樣本的類型,為正樣本時y 1= 1,為負(fù)樣本時y 1= -l,w 1表示當(dāng)前第i個正樣 本或負(fù)樣本的權(quán)重,W;表,fm(x\w)采用多分支樹,fm(x\w)定義如下:
[0239]
[0240] 本申請一更優(yōu)的實(shí)施例中,所述第一Η-二子單元13122通過最小化 JlMsOW,fm(xiLBP))求得
[0241] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述損失函數(shù)的描述僅為舉例,其他現(xiàn)有的或今后可能 出現(xiàn)的損失函數(shù)如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式 包含于此。
[0242] 本申請一更優(yōu)的實(shí)施例中,第一Η-四子單元1314根據(jù)選擇得到的多分支回歸 樹弱分類器更新正樣本和負(fù)樣本的權(quán)重中,所述權(quán)重根據(jù)下式更正:
[0243]
[0244] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述權(quán)重更正的描述僅為舉例,其他現(xiàn)有的或今后可能 出現(xiàn)的權(quán)重更正如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用方式 包含于此。
[0245] 圖19示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 19, 圖14,還包括第Η裝置3,用于對所述待檢測圖像校正角度,從而實(shí)現(xiàn)對旋轉(zhuǎn)的待檢測 圖像進(jìn)行證件圖像所在位置的更精確的檢測。
[0246] 圖20示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 20, 圖19中所述第Η裝置3包括:
[0247] 第Η-模塊31,訓(xùn)練ImageNet模型;具體的,圖像分類是計(jì)算機(jī)視覺、模式識別和 機(jī)器學(xué)習(xí)領(lǐng)域一個非?;钴S的研究方向,近年來,隨著大規(guī)模圖像數(shù)據(jù)集的健全,圖像分類 算法的準(zhǔn)確率得到了極大程度的提升,而且每年都有基于Image化t數(shù)據(jù)庫(100多萬樣本, 1000個類別)的圖像分類競賽平臺,深度卷積神經(jīng)網(wǎng)絡(luò)目前在圖像理解的領(lǐng)域,包括圖像 分類,圖像檢索,目標(biāo)檢測等,得到了廣泛的使用。特別是在圖像分類方面,基于深度卷積神 經(jīng)網(wǎng)絡(luò)的圖像分類算法在準(zhǔn)確率方面往往比傳統(tǒng)的BOW模型相比高出10個百分點(diǎn),當(dāng)樣本 量比較小的時候,訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的ImageNet模型容易出現(xiàn)過擬合的現(xiàn)象,從而導(dǎo) 致模型的泛化能力很差,為了克服送個缺點(diǎn),本申請中首先訓(xùn)練在Image化t數(shù)據(jù)集合上訓(xùn) 練1000類的圖像分類模型,然后用送個模型來提取旋轉(zhuǎn)圖像的高層特征,最后用使用線性 支撐向量機(jī)(liblinear svm)分類器來進(jìn)行圖像分類,送種圖像分類方法綜合了深度學(xué)習(xí) 和線性svm分類器的特點(diǎn),從而使得得到的模型具有較高的準(zhǔn)確率W及較好的泛化能力; [024引第Η二模塊32,獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本,使用所述ImageNet模型 提取每個證件圖像訓(xùn)練樣本的高層語義特征;具體的,在互聯(lián)網(wǎng)環(huán)境中有成千上萬的不同 年齡段,不同性格的用戶,用戶上傳的待檢測圖像如手持證件照照片也是千奇百怪,通過數(shù) 據(jù)分析,發(fā)現(xiàn)很多用戶上傳的手持照片是旋轉(zhuǎn)過的,一般可W分為正常旋轉(zhuǎn)0度,旋轉(zhuǎn)90 度,旋轉(zhuǎn)180度,旋轉(zhuǎn)270度旋轉(zhuǎn),針對送些特點(diǎn),本申請采用圖像分類的方式來判斷待檢測 圖像的旋轉(zhuǎn)角度,在此,可W收集多個沒有旋轉(zhuǎn)的同一類證件圖像,然后隨機(jī)對送些證件圖 像進(jìn)行旋轉(zhuǎn),如分別旋轉(zhuǎn)90度,180度,270度,從而得到4個不同旋轉(zhuǎn)方向的證件圖像作為 用于判斷送一類證件圖像旋轉(zhuǎn)方向的證件圖像訓(xùn)練樣本,例如可W獲得8609個樣本(Ii, yi),具體用公式表示如下:
[024引 r = random (0,4),
[0 巧 0]
[0巧1] 其中,Ii表示證件圖像訓(xùn)練樣本,表示證件圖像訓(xùn)練樣本的標(biāo)識1油el,Rg(I)表 示對證件圖像訓(xùn)練樣本旋轉(zhuǎn)a度。本領(lǐng)域技術(shù)人員應(yīng)能理解上述證件圖像訓(xùn)練樣本的描述 僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的證件圖像訓(xùn)練樣本如可適用于本申請,也應(yīng)包含 在本申請保護(hù)范圍W內(nèi),并在此W引用方式包含于此。
[0252] 第HH模塊33,使用線性支撐向量機(jī)對證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行訓(xùn) 練得到確定圖像旋轉(zhuǎn)角度的分類器;
[0253] 第Η四模塊34,通過所述分類器確定一待檢測圖像的旋轉(zhuǎn)角度,根據(jù)待檢測圖像 的旋轉(zhuǎn)角度調(diào)整該待檢測圖像的角度。在此,當(dāng)待檢測圖像照輸入時,首先用步驟S23訓(xùn)練 好的確定圖像旋轉(zhuǎn)角度的分類器確定待檢測圖像的旋轉(zhuǎn)角度,然后對待檢測圖像進(jìn)行調(diào)整 如調(diào)整到0旋轉(zhuǎn)角度,后續(xù)即可使用步驟S1訓(xùn)練好的證件檢測器對調(diào)整過的待檢測圖像進(jìn) 行證件所在位置的檢測,例如,如果檢測到證件圖像,郝么可W對證件區(qū)域進(jìn)行放大展示, 如果未檢測到,就提示用戶上傳的待檢測圖像不符合規(guī)范。
[0巧4] 圖21示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 21,圖20中所述第Η-模塊31包括:
[0巧引第Η-一單元311,用于將ImageNet數(shù)據(jù)庫中的樣本圖像縮放到相同的分辨率; [0巧6] 第Η-二單元312,用于將所述樣本圖像進(jìn)行減均值操作;
[ο巧7] 第Η-Η單元312,用于對減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切到統(tǒng)一尺寸;
[0巧引第Η-四單元314,用于設(shè)置ImageNet模型的神經(jīng)網(wǎng)絡(luò)為依次連接的卷積層和全 連接層;
[0巧9] 第Η-五單元315,用于隨機(jī)裁切后的樣本圖像在神經(jīng)網(wǎng)絡(luò)前向傳播,計(jì)算出 ImageNet模型的待優(yōu)化的參數(shù)的損失值;
[0260] 第Η-六單元316,用于根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過 鏈?zhǔn)角髮?dǎo)法反向逐層求待優(yōu)化的參數(shù)的梯度,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對 所述待優(yōu)化的參數(shù)進(jìn)行優(yōu)化W得到優(yōu)化參數(shù)后的ImageNet模型。
[026。 本申請一更優(yōu)的實(shí)施例中,第Η-五單元315計(jì)算出ImageNet模型的待優(yōu)化的參 數(shù)的損失值中,所述待優(yōu)化的參數(shù)的損失值J( Θ )根據(jù)如下第二損失函數(shù)獲取,
[0262]
庚中,Θ表示待優(yōu)化的參數(shù),η表示樣本 圖像的數(shù)量,k表示輸出類別的個數(shù),x/表示第i個樣本最后一個全連接層第j個類別的輸 出值。
[0263] 本申請一更優(yōu)的實(shí)施例中,第Η-六單元316根據(jù)如下公式求得待優(yōu)化的參數(shù)的 梯度:
[0264]
[0265] 其中,gt表示第t次迭代的待優(yōu)化的參數(shù)的梯度,g W表示第t+1次迭代的所述 待優(yōu)化的參數(shù)的梯度,Θ t表示第t次迭代的待優(yōu)化的參數(shù),
表示第二損失函數(shù) J( Θ )對當(dāng)前待優(yōu)化的參數(shù)Θ = Θ t時的梯度,0. 9,g t表示慣性動量,0. 0005 · Θ t是對Θ 的正則化約束,η表示學(xué)習(xí)率。
[0266] 本申請一更優(yōu)的實(shí)施例中,第Η-六單元316通過如下公式對所述待優(yōu)化的參數(shù) 進(jìn)行優(yōu)化:
[0267] Θ w= Θ t+gw,其中,白W表示第t+1次迭代的待優(yōu)化的參數(shù)。
[026引圖22示出本申請一更優(yōu)的實(shí)施例的用于證件圖像檢測的設(shè)備的結(jié)構(gòu)圖。結(jié)合圖 22,圖20中,所述第Η二模塊32包括:
[0269] 第Η二一單元321,用于獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本;
[0270] 第Η二二單元322,用于將證件圖像訓(xùn)練樣本縮放到與ImageNet模型中隨機(jī)裁切 后的樣本圖像相同的尺寸;
[0271] 第Η二Η單元323,用于將縮放后的證件圖像訓(xùn)練樣本進(jìn)行減均值操作;
[0272] 第Η二四單元324,用于使用所述優(yōu)化參數(shù)后的ImageNet模型提取減均值操作后 的每個證件圖像訓(xùn)練樣本的所述全連接層高層語義特征;
[0273] 第Η二五單元325,用于將每個證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行稀疏化操 作,并采用二范數(shù)將經(jīng)過稀疏化操作的高層語義特征進(jìn)行歸一化操作。
[0274] 上述實(shí)施例可通過C++語言實(shí)現(xiàn),在Image化t模型訓(xùn)練階段,使用GPU進(jìn)行訓(xùn)練, GPU型號可為tesla K20,另外待檢測圖像旋轉(zhuǎn)方向的確定W及證件區(qū)域的檢測都可用C++ 語言實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述實(shí)施例的語言實(shí)現(xiàn)方式的描述僅為舉例,其他現(xiàn) 有的或今后可能出現(xiàn)的實(shí)施例的語言實(shí)現(xiàn)方式如可適用于本申請,也應(yīng)包含在本申請保護(hù) 范圍W內(nèi),并在此W引用方式包含于此。
[0275] 在一具體的應(yīng)用實(shí)施例中,需要檢測用戶人提供的手持照片中是否有身份證圖 像,如果有則確定身份證圖像在手持照片中的位置。如圖23所示,采用本申請的方法,首先 獲取到手持照片201,可W通過步驟S23中得到的分類器確定手持照片201的旋轉(zhuǎn)角度,根 據(jù)手持照片201的旋轉(zhuǎn)角度手持照片201的角度得到調(diào)整角度的圖片202,通過步驟S1中 訓(xùn)練得到證件檢測器送里是身份證檢測器檢測待檢測圖像中的身份證圖像得到框出身份 理證圖像所在位置的手持照片203。
[0276] 綜上所述,本申請通過訓(xùn)練好的證件檢測器檢測出證件圖像在待檢測圖像中的位 置,與傳統(tǒng)的基于邊緣的身份證檢測算法相比,本申請基于機(jī)器學(xué)習(xí)的算法更加魯棒,且能 夠處理證件圖像的背景復(fù)雜的問題。
[0277] 另外,本申請通過對所述待檢測圖像校正角度,從而實(shí)現(xiàn)對旋轉(zhuǎn)的待檢測圖像進(jìn) 行證件圖像所在位置的更精確的檢測。
[027引顯然,本領(lǐng)域的技術(shù)人員可W對本申請進(jìn)行各種改動和變型而不脫離本申請的精 神和范圍。送樣,倘若本申請的送些修改和變型屬于本申請權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則本申請也意圖包含送些改動和變型在內(nèi)。
[0279] 需要注意的是,本申請可在軟件和/或軟件與硬件的組合體中被實(shí)施,例如,可采 用專用集成電路(ASIC)、通用目的計(jì)算機(jī)或任何其他類似硬件設(shè)備來實(shí)現(xiàn)。在一個實(shí)施例 中,本申請的軟件程序可W通過處理器執(zhí)行W實(shí)現(xiàn)上文所述步驟或功能。同樣地,本申請的 軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可W被存儲到計(jì)算機(jī)可讀記錄介質(zhì)中,例如,RAM存儲器, 磁或光驅(qū)動器或軟磁盤及類似設(shè)備。另外,本申請的一些步驟或功能可采用硬件來實(shí)現(xiàn),例 女口,作為與處理器配合從而執(zhí)行各個步驟或功能的電路。
[0280] 另外,本申請的一部分可被應(yīng)用為計(jì)算機(jī)程序產(chǎn)品,例如計(jì)算機(jī)程序指令,當(dāng)其被 計(jì)算機(jī)執(zhí)行時,通過該計(jì)算機(jī)的操作,可W調(diào)用或提供根據(jù)本申請的方法和/或技術(shù)方案。 而調(diào)用本申請的方法的程序指令,可能被存儲在固定的或可移動的記錄介質(zhì)中,和/或通 過廣播或其他信號承載媒體中的數(shù)據(jù)流而被傳輸,和/或被存儲在根據(jù)所述程序指令運(yùn)行 的計(jì)算機(jī)設(shè)備的工作存儲器中。在此,根據(jù)本申請的一個實(shí)施例包括一個裝置,該裝置包括 用于存儲計(jì)算機(jī)程序指令的存儲器和用于執(zhí)行程序指令的處理器,其中,當(dāng)該計(jì)算機(jī)程序 指令被該處理器執(zhí)行時,觸發(fā)該裝置運(yùn)行基于前述根據(jù)本申請的多個實(shí)施例的方法和/或 技術(shù)方案。
[0281] 對于本領(lǐng)域技術(shù)人員而言,顯然本申請不限于上述示范性實(shí)施例的細(xì)節(jié),而且在 不背離本申請的精神或基本特征的情況下,能夠W其他的具體形式實(shí)現(xiàn)本申請。因此,無論 從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本申請的范圍由所附權(quán) 利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化涵括在本申請內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此 夕b顯然"包括"一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多 個單元或裝置也可W由一個單元或裝置通過軟件或者硬件來實(shí)現(xiàn)。第一,第二等詞語用來 表示名稱,而并不表示任何特定的順序。
【主權(quán)項(xiàng)】
1. 一種證件圖像檢測方法,其中,包括: 基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器; 通過所述證件檢測器檢測待檢測圖像中的證件圖像。2. 如權(quán)利要求1所述的方法,其中,基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證 件檢測器包括: 獲取多個證件圖像和非證件圖像分別作為正樣本和負(fù)樣本; 從正樣本和負(fù)樣本中隨機(jī)選擇不同的區(qū)域,分別提取不同的區(qū)域的MB-LBP特征; 基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器。3. 如權(quán)利要求2所述的方法,其中,基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類 器級聯(lián)成的證件檢測器包括: 基于不同的區(qū)域的MB-LBP特征并使用gentle Adaboost策略進(jìn)行特征選擇,根據(jù)選擇 的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類器; 使用cascade Adaboost策略將多個強(qiáng)分類器級聯(lián)成的證件檢測器。4. 如權(quán)利要求3所述的方法,其中,分別提取不同的區(qū)域的MB-LBP特征包括: 分別將每個區(qū)域劃分為若干個子區(qū)域,計(jì)算每個子區(qū)域的像素均值; 通過比較每個區(qū)域內(nèi)的中心子區(qū)域的像素均值與周圍子區(qū)域的像素均值獲得每個區(qū) 域的二進(jìn)制編碼的MB-LBP特征; 將每個區(qū)域的二進(jìn)制編碼MB-LBP特征轉(zhuǎn)化成十進(jìn)制的MB-LBP特征。5. 如權(quán)利要求4所述的方法,其中,基于不同的區(qū)域的MB-LBP特征并使用gentle Adaboost策略進(jìn)行特征選擇,根據(jù)選擇的特征生成每個由多個多分支回歸樹弱分類器組成 的強(qiáng)分類器包括: 重復(fù)下述步驟直至當(dāng)前強(qiáng)分類器中的多分支回歸樹弱分類器的個數(shù)是否達(dá)到預(yù)設(shè)的 個數(shù),并輸出生成的強(qiáng)分類器: 根據(jù)正樣本和負(fù)樣本的數(shù)量設(shè)置每個正樣本或負(fù)樣本的權(quán)重,初始化強(qiáng)分類器; 基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重訓(xùn)練得到對應(yīng)的多 分支回歸樹弱分類器; 從多分支回歸樹弱分類器中選擇具有最小損失的多分支回歸樹弱分類器加入強(qiáng)分類 器; 根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本和負(fù)樣本的權(quán)重。6. 如權(quán)利要求5所述的方法,其中,基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本 或負(fù)樣本的權(quán)重訓(xùn)練得到對應(yīng)的多分支回歸樹弱分類器包括: 基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重得到第一損失函 數(shù); 通過第一損失函數(shù)最小化后訓(xùn)練得到對應(yīng)于不同的區(qū)域的十進(jìn)制的MB-LBP特征的每 個多分支回歸樹弱分類器。7. 如權(quán)利要求6所述的方法,其中,所述第一損失函數(shù)表示如下:,其中表不第m個弱分類器,N表 示正樣本和負(fù)樣本的數(shù)量,x\BP表示第i個正樣本或負(fù)樣本的區(qū)域的十進(jìn)制的MB-LBP特 征,y;表示樣本的類型,為正樣本時y i= 1,為負(fù)樣本時y i= -1,w ;表示當(dāng)前第i個正樣本 或負(fù)樣本的權(quán)重,采用多分支樹,定義如下:8. 如權(quán)利要求7所述的方法,其中,通過第一損失函數(shù)最小化后訓(xùn)練得到對應(yīng)于不同 的區(qū)域的十進(jìn)制的MB-LBP特征的每個多分支回歸樹弱分類器中, 通過取小化 JldSS (XlbP,fm(X LBP))9. 如權(quán)利要求8所述的方法,其中,根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣 本和負(fù)樣本的權(quán)重中,所述權(quán)重根據(jù)下式更正:10. 如權(quán)利要求1至9任一項(xiàng)所述的方法,其中,通過所述證件檢測器檢測待檢測圖像 中的證件圖像之前還包括: 對所述待檢測圖像校正角度。11. 如權(quán)利要求10所述的方法,其中,對所述待檢測圖像校正角度包括: 訓(xùn)練ImageNet模型; 獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本,使用所述ImageNet模型提取每個證件圖像 訓(xùn)練樣本的高層語義特征; 使用線性支撐向量機(jī)對證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行訓(xùn)練得到確定圖像旋 轉(zhuǎn)角度的分類器; 通過所述分類器確定一待檢測圖像的旋轉(zhuǎn)角度,根據(jù)待檢測圖像的旋轉(zhuǎn)角度調(diào)整該待 檢測圖像的角度。12. 如權(quán)利要求11所述的方法,其中,訓(xùn)練ImageNet模型包括: 將ImageNet數(shù)據(jù)庫中的樣本圖像縮放到相同的分辨率; 將所述樣本圖像進(jìn)行減均值操作; 對減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切到統(tǒng)一尺寸; 設(shè)置ImageNet模型的神經(jīng)網(wǎng)絡(luò)為依次連接的卷積層和全連接層; 隨機(jī)裁切后的樣本圖像在神經(jīng)網(wǎng)絡(luò)前向傳播,計(jì)算出ImageNet模型的待優(yōu)化的參數(shù) 的損失值; 根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過鏈?zhǔn)角髮?dǎo)法反向逐層求待優(yōu) 化的參數(shù)的梯度,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對所述待優(yōu)化的參數(shù)進(jìn)行優(yōu)化 以得到優(yōu)化參數(shù)后的ImageNet模型。13. 如權(quán)利要求12所述的方法,其中,計(jì)算出ImageNet模型的待優(yōu)化的參數(shù)的損失值 中,所述待優(yōu)化的參數(shù)的損失值J( Θ )根據(jù)如下第二損失函數(shù)獲取,其中,Θ表示待優(yōu)化的參數(shù),n表示樣本圖像 的數(shù)量,k表示輸出類別的個數(shù),表示第i個樣本最后一個全連接層第j個類別的輸出 值。14. 如權(quán)利要求13所述的方法,其中,根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng) 絡(luò)上通過鏈?zhǔn)角髮?dǎo)法反向逐層求待優(yōu)化的參數(shù)的梯度中,根據(jù)如下公式求得待優(yōu)化的參數(shù) 的梯度:其中,gt表示第t次迭代的待優(yōu)化的參數(shù)的梯度,g t+1表示第t+Ι次迭代的所述待優(yōu)化 的參數(shù)的梯度,Θ t表示第t次迭代的待優(yōu)化的參數(shù),表示第二損失函數(shù)J( Θ ) 對當(dāng)前待優(yōu)化的參數(shù)Θ = 9t時的梯度,〇.9· 8,表示慣性動量,0.0005 · Θ t是對Θ的正 則化約束,Π 表示學(xué)習(xí)率。15. 如權(quán)利要求14所述的方法,其中,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對所 述待優(yōu)化的參數(shù)進(jìn)行優(yōu)化以得到優(yōu)化參數(shù)后的ImageNet模型中,通過如下公式對所述待 優(yōu)化的參數(shù)進(jìn)行優(yōu)化: 0t+1= Θ t+gt+1,其中,0t+1表示第t+Ι次迭代的待優(yōu)化的參數(shù)。16. 如權(quán)利要求12所述的方法,其中,使用所述ImageNet模型提取每個證件圖像訓(xùn)練 樣本的高層語義特征包括: 將證件圖像訓(xùn)練樣本縮放到與ImageNet模型中隨機(jī)裁切后的樣本圖像相同的尺寸; 將縮放后的證件圖像訓(xùn)練樣本進(jìn)行減均值操作; 使用所述優(yōu)化參數(shù)后的ImageNet模型提取減均值操作后的每個證件圖像訓(xùn)練樣本的 所述全連接層高層語義特征; 將每個證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行稀疏化操作,并采用二范數(shù)將經(jīng)過稀疏 化操作的高層語義特征進(jìn)行歸一化操作。17. -種用于證件圖像檢測的設(shè)備,其中,包括: 第一裝置,用于基于MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件檢測器; 第二裝置,用于通過所述證件檢測器檢測待檢測圖像中的證件圖像。18. 如權(quán)利要求17所述的設(shè)備,其中,所述第一裝置包括: 第一一模塊,用于獲取多個證件圖像和非證件圖像分別作為正樣本和負(fù)樣本; 第一二模塊,用于從正樣本和負(fù)樣本中隨機(jī)選擇不同的區(qū)域,分別提取不同的區(qū)域的 MB-LBP 特征; 第一三模塊,用于基于不同的區(qū)域的MB-LBP特征訓(xùn)練由多個強(qiáng)分類器級聯(lián)成的證件 檢測器。19. 如權(quán)利要求18所述的設(shè)備,其中,所述第一三模塊包括: 第一三一單元,用于基于不同的區(qū)域的MB-LBP特征并使用gentle Adaboost策略進(jìn)行 特征選擇,根據(jù)選擇的特征生成每個由多個多分支回歸樹弱分類器組成的強(qiáng)分類器; 第一三二單元,用于使用cascade Adaboost策略將多個強(qiáng)分類器級聯(lián)成的證件檢測 器。20. 如權(quán)利要求19所述的設(shè)備,其中,第一二模塊包括: 第一二一單元,用于分別將每個區(qū)域劃分為若干個子區(qū)域,計(jì)算每個子區(qū)域的像素均 值; 第一二二單元,用于通過比較每個區(qū)域內(nèi)的中心子區(qū)域的像素均值與周圍子區(qū)域的像 素均值獲得每個區(qū)域的二進(jìn)制編碼的MB-LBP特征; 第一二三單元,用于將每個區(qū)域的二進(jìn)制編碼MB-LBP特征轉(zhuǎn)化成十進(jìn)制的MB-LBP特 征。21. 如權(quán)利要求20所述的設(shè)備,其中,第一三一單元包括: 第一三一一子單元,用于根據(jù)正樣本和負(fù)樣本的數(shù)量設(shè)置每個正樣本或負(fù)樣本的權(quán) 重,初始化強(qiáng)分類器; 第一三一二子單元,用于基于不同的區(qū)域的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本 的權(quán)重訓(xùn)練得到對應(yīng)的多分支回歸樹弱分類器; 第一三一三子單元,用于從多分支回歸樹弱分類器中選擇具有最小損失的多分支回歸 樹弱分類器加入強(qiáng)分類器; 第一三一四子單元,用于根據(jù)選擇得到的多分支回歸樹弱分類器更新正樣本和負(fù)樣本 的權(quán)重,判斷當(dāng)前強(qiáng)分類器中的多分支回歸樹弱分類器的個數(shù)是否達(dá)到預(yù)設(shè)的個數(shù),若是, 則轉(zhuǎn)到第一三一五子單元執(zhí)行,若否,則轉(zhuǎn)到第一三一二子單元執(zhí)行; 第一三一五子單元,用于輸出生成的強(qiáng)分類器。22. 如權(quán)利要求21所述的設(shè)備,其中,所述第一三一二子單元,用于基于不同的區(qū)域 的十進(jìn)制的MB-LBP特征和正樣本或負(fù)樣本的權(quán)重得到第一損失函數(shù),通過第一損失函數(shù) 最小化后訓(xùn)練得到對應(yīng)于不同的區(qū)域的十進(jìn)制的MB-LBP特征的每個多分支回歸樹弱分類 器。23. 如權(quán)利要求22所述的設(shè)備,其中,所述第一三一二子單元得到的所述第一損失函 數(shù)中,表示如下:其中,?^χ^ρ)表不第m個弱分類器,N表 示正樣本和負(fù)樣本的數(shù)量,x\BP表示第i個正樣本或負(fù)樣本的區(qū)域的十進(jìn)制的MB-LBP特 征,y;表示樣本的類型,為正樣本時y i= 1,為負(fù)樣本時y i= -1,w ;表示當(dāng)前第i個正樣本 或負(fù)樣本的權(quán)重,紙=^ 采用多分支樹,fjx^p)定義如下:24. 如權(quán)利要求23所述的設(shè)備,其中,所述第一三一二子單元通過最小化25. 如權(quán)利要求24所述的設(shè)備,其中,第一三一四子單元根據(jù)選擇得到的多分支回歸 樹弱分類器更新正樣本和負(fù)樣本的權(quán)重中,所述權(quán)重根據(jù)下式更正:26. 如權(quán)利要求17至25任一項(xiàng)所述的設(shè)備,其中,還包括第三裝置,用于對所述待檢測 圖像校正角度。27. 如權(quán)利要求26所述的設(shè)備,其中,所述第三裝置包括: 第三一模塊,訓(xùn)練ImageNet模型; 第三二模塊,獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本,使用所述ImageNet模型提取每 個證件圖像訓(xùn)練樣本的高層語義特征; 第三三模塊,使用線性支撐向量機(jī)對證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行訓(xùn)練得到 確定圖像旋轉(zhuǎn)角度的分類器; 第三四模塊,通過所述分類器確定一待檢測圖像的旋轉(zhuǎn)角度,根據(jù)待檢測圖像的旋轉(zhuǎn) 角度調(diào)整該待檢測圖像的角度。28. 如權(quán)利要求27所述的設(shè)備,其中,所述第三一模塊包括: 第三--單元,用于將ImageNet數(shù)據(jù)庫中的樣本圖像縮放到相同的分辨率; 第三一二單元,用于將所述樣本圖像進(jìn)行減均值操作; 第三一三單元,用于對減均值操作后的樣本圖像進(jìn)行隨機(jī)裁切到統(tǒng)一尺寸; 第三一四單元,用于設(shè)置ImageNet模型的神經(jīng)網(wǎng)絡(luò)為依次連接的卷積層和全連接層; 第三一五單元,用于隨機(jī)裁切后的樣本圖像在神經(jīng)網(wǎng)絡(luò)前向傳播,計(jì)算出ImageNet模 型的待優(yōu)化的參數(shù)的損失值; 第三一六單元,用于根據(jù)所述待優(yōu)化的參數(shù)的損失值在所述神經(jīng)網(wǎng)絡(luò)上通過鏈?zhǔn)角髮?dǎo) 法反向逐層求待優(yōu)化的參數(shù)的梯度,根據(jù)求得的梯度并使用隨機(jī)梯度下降算法對所述待優(yōu) 化的參數(shù)進(jìn)行優(yōu)化以得到優(yōu)化參數(shù)后的ImageNet模型。29. 如權(quán)利要求28所述的設(shè)備,其中,第三一五單元計(jì)算出ImageNet模型的待優(yōu)化的 參數(shù)的損失值中,所述待優(yōu)化的參數(shù)的損失值J( Θ )根據(jù)如下第二損失函數(shù)獲取,,其中,Θ表示待優(yōu)化的參數(shù),n表示樣本圖像 的數(shù)量,k表示輸出類別的個數(shù),;r/表示第i個樣本最后一個全連接層第j個類別的輸出 值。30. 如權(quán)利要求29所述的設(shè)備,其中,第三一六單元根據(jù)如下公式求得待優(yōu)化的參數(shù) 的梯度:其中,gt表示第t次迭代的待優(yōu)化的參數(shù)的梯度,g t+1表示第t+Ι次迭代的所述待優(yōu)化 的參數(shù)的梯度,Θ t表示第t次迭代的待優(yōu)化的參數(shù),表示第二損失函數(shù)J( Θ ) 對當(dāng)前待優(yōu)化的參數(shù)Θ = 9t時的梯度,〇.9· 8,表示慣性動量,0.0005 · Θ t是對Θ的正 則化約束,Π 表示學(xué)習(xí)率。31. 如權(quán)利要求30所述的設(shè)備,其中,第三一六單元通過如下公式對所述待優(yōu)化的參 數(shù)進(jìn)行優(yōu)化: 0t+1= Θ t+gt+1,其中,0t+1表示第t+Ι次迭代的待優(yōu)化的參數(shù)。32. 如權(quán)利要求28所述的設(shè)備,其中,所述第三二模塊包括: 第三二一單元,用于獲取多種旋轉(zhuǎn)角度的證件圖像訓(xùn)練樣本; 第三二二單元,用于將證件圖像訓(xùn)練樣本縮放到與ImageNet模型中隨機(jī)裁切后的樣 本圖像相同的尺寸; 第三二三單元,用于將縮放后的證件圖像訓(xùn)練樣本進(jìn)行減均值操作; 第三二四單元,用于使用所述優(yōu)化參數(shù)后的ImageNet模型提取減均值操作后的每個 證件圖像訓(xùn)練樣本的所述全連接層高層語義特征; 第三二五單元,用于將每個證件圖像訓(xùn)練樣本的高層語義特征進(jìn)行稀疏化操作,并采 用二范數(shù)將經(jīng)過稀疏化操作的高層語義特征進(jìn)行歸一化操作。
【文檔編號】G06K9/66GK105825243SQ201510007186
【公開日】2016年8月3日
【申請日】2015年1月7日
【發(fā)明人】陳岳峰
【申請人】阿里巴巴集團(tuán)控股有限公司