本申請(qǐng)涉及圖像識(shí)別
技術(shù)領(lǐng)域:
:,特別是涉及一種字符識(shí)別方法和一種字符識(shí)別裝置。
背景技術(shù):
::近年來隨著計(jì)算機(jī)技術(shù)和數(shù)字圖像處理技術(shù)的飛速發(fā)展,圖片識(shí)別技術(shù)尤其是對(duì)于圖片中的數(shù)字、字母、特殊符號(hào)等字符進(jìn)行識(shí)別的技術(shù)越來越多的在各個(gè)方面都有著較為廣泛的應(yīng)用需求。對(duì)于識(shí)別圖片中的字符,目前存在的識(shí)別過程是:1、檢測(cè)到圖片中字符的位置;2、切分成包含單個(gè)字符的圖片數(shù)據(jù);3、使用字符分類器識(shí)別各個(gè)圖片數(shù)據(jù)。其中,對(duì)于字符分類器,目前實(shí)現(xiàn)的方案主要包括以下兩種:1)首先提取圖片的特征,比如hog(histogramoforientedgradient,方向梯度直方圖)特征,然后使用svm(supportvectormachine,支持向量機(jī))分類器、神經(jīng)網(wǎng)絡(luò)分類器等訓(xùn)練字符識(shí)別模型;2)利用卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,cnn),訓(xùn)練字符識(shí)別模型。然后利用訓(xùn)練好的字符識(shí)別模型對(duì)輸入的圖片數(shù)據(jù)進(jìn)行字符識(shí)別。但是在實(shí)際應(yīng)用過程中,例如在圖片比較模糊或者圖片中包含的字符比較多的情況下,可能會(huì)導(dǎo)致檢測(cè)到的字符位置不夠準(zhǔn)確,其中會(huì)存在一些噪聲,例如不是字符的斑點(diǎn)等被檢測(cè)為字符,進(jìn)而造成切分成的圖片數(shù)據(jù)中存在一些包含噪聲的圖片數(shù)據(jù),所以在利用分類器識(shí)別各個(gè)圖片數(shù)據(jù)之后,需要從中篩選出不是噪聲的輸出結(jié)果。以身份證識(shí)別為例,如圖1a,其是從一張身份證圖片的身份證號(hào)碼區(qū)域切分得到的單字圖。如圖1a,在圖片本身比較模糊的時(shí)候,定位號(hào)碼行會(huì)不是很準(zhǔn)確,頭部或者尾部會(huì)多出來一些噪聲,造成切單字的時(shí)候,會(huì)切出來前邊的噪聲,導(dǎo)致切出來的單字大于18個(gè),需要選取18個(gè)數(shù)字。針對(duì)上述的問題,已有的技術(shù)方案是增加一個(gè)識(shí)別“是不是字符”的cnn分類器。利用這個(gè)分類器,先排除不是數(shù)字的圖片數(shù)據(jù),然后再利用“是何種字符”的字符分類器識(shí)別剩下的圖片數(shù)據(jù),從剩下的圖片數(shù)據(jù)中識(shí)別具體的字符。但是該技術(shù)方案存在一定的缺點(diǎn),如下:首先,增加一個(gè)分類器,其是先后進(jìn)行計(jì)算,意味著同時(shí)增加了計(jì)算時(shí)間,影響運(yùn)行效率;其次,在實(shí)際操作中,如果增加的用以識(shí)別“是不是數(shù)字”的cnn分類器的計(jì)算結(jié)果出現(xiàn)錯(cuò)誤,則不管后續(xù)的字符識(shí)別模型是否會(huì)出現(xiàn)問題,整個(gè)識(shí)別過程都會(huì)不可避免地發(fā)生錯(cuò)誤,降低了字符識(shí)別的準(zhǔn)確性。技術(shù)實(shí)現(xiàn)要素:鑒于上述問題,提出了本申請(qǐng)實(shí)施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種字符識(shí)別方法和相應(yīng)的一種字符識(shí)別裝置。為了解決上述問題,本申請(qǐng)公開了一種字符識(shí)別方法,其特征在于,包括:獲取圖片數(shù)據(jù);利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;所述第一分類器為從圖片數(shù)據(jù)中識(shí)別具體字符的分類器;所述第二分類器為識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器;將所述第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;根據(jù)所述第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;根據(jù)置信度,輸出字符的識(shí)別結(jié)果。優(yōu)選地,還包括:利用字符圖片樣本訓(xùn)練第一分類器的各計(jì)算層的參數(shù)值;所述第一分類 器包括前n層計(jì)算層和后m層計(jì)算層;固定第二分類器的前n層計(jì)算層的參數(shù)為第一分類器的前n層計(jì)算層的參數(shù),并利用非字符圖片樣本和字符圖片樣本訓(xùn)練第二分類器的后l層的參數(shù)值。優(yōu)選地,所述第一分類器和第二分類器共享的計(jì)算層包括:卷積層、或者卷積層和至少一層全連接層。優(yōu)選地,所述字符為數(shù)字。優(yōu)選地,所述獲取圖片數(shù)據(jù)的步驟,包括:從身份證明的圖片的號(hào)碼區(qū)域,切分各個(gè)圖片數(shù)據(jù)。優(yōu)選地,所述根據(jù)所述第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度的步驟包括:將最大的第一概率與第二概率相乘,得到所述圖片數(shù)據(jù)為最大的第一概率對(duì)應(yīng)的數(shù)字的置信度。優(yōu)選地,所述根據(jù)置信度,輸出字符的識(shí)別結(jié)果的步驟,包括:從各個(gè)圖片數(shù)據(jù)中,選擇排序靠前的符合所述身份證規(guī)定個(gè)數(shù)的圖片所對(duì)應(yīng)的數(shù)字,并按序輸出。本申請(qǐng)還公開了一種字符識(shí)別裝置,其特征在于,包括:圖片獲取模塊,適于獲取圖片數(shù)據(jù);第一結(jié)果計(jì)算模塊,適于利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;所述第一分類器為從圖片數(shù)據(jù)中識(shí)別具體字符的分類器;所述第二分類器為識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器;第一概率計(jì)算模塊,適于將所述第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;第二概率計(jì)算模塊,適于將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;置信度計(jì)算模塊,適于根據(jù)所述第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;輸出模塊,適于根據(jù)置信度,輸出字符的識(shí)別結(jié)果。優(yōu)選地,還包括:第一分類器訓(xùn)練模塊,適于利用字符圖片樣本訓(xùn)練第一分類器的各計(jì)算層的參數(shù)值;所述第一分類器包括前n層計(jì)算層和后m層計(jì)算層;第二分類器訓(xùn)練模塊,適于固定第二分類器的前n層計(jì)算層的參數(shù)為第一分類器的前n層計(jì)算層的參數(shù),并利用非字符圖片樣本和字符圖片樣本訓(xùn)練第二分類器的后l層的參數(shù)值。優(yōu)選地,所述第一分類器和第二分類器共享的計(jì)算層包括:卷積層、或者卷積層和至少一層全連接層。優(yōu)選地,所述字符為數(shù)字。優(yōu)選地,所述圖片獲取模塊,包括:圖片切分子模塊,適于從身份證明的圖片的號(hào)碼區(qū)域,切分各個(gè)圖片數(shù)據(jù)。優(yōu)選地,所述置信度計(jì)算模塊,包括:置信度計(jì)算子模塊,適于將最大的第一概率與第二概率相乘,得到所述圖片數(shù)據(jù)為最大的第一概率對(duì)應(yīng)的數(shù)字的置信度。優(yōu)選地,所述輸出模塊,包括:輸出子模塊,適于從各個(gè)圖片數(shù)據(jù)中,選擇排序靠前的符合所述身份證規(guī)定個(gè)數(shù)的圖片所對(duì)應(yīng)的數(shù)字,并按序輸出。本申請(qǐng)實(shí)施例包括以下優(yōu)點(diǎn):本申請(qǐng)實(shí)施例,在獲取圖片數(shù)據(jù)之后利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;然后分別將第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;進(jìn)而根據(jù)第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;最后根據(jù)置信度,輸出字符的識(shí)別結(jié)果。其中,第二分類器時(shí)與第一分類器共享一部分計(jì)算層的,對(duì)于第二分類 器與第一分類器共享的計(jì)算層,其計(jì)算過程以及計(jì)算結(jié)果也是共享的,所以相對(duì)于
背景技術(shù):
:在字符分類器之前增加一個(gè)完整的“是不是字符”分類器,然后按序?qū)D片進(jìn)行計(jì)算的過程,本申請(qǐng)相對(duì)增加的計(jì)算量比較少,降低了計(jì)算時(shí)間,相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的效率。另外,第二分類器與第一分類器并不是前后順序使用,而是將兩個(gè)分類器分別得到的概率值相乘得到一個(gè)置信度,然后根據(jù)置信度值輸出相應(yīng)的識(shí)別結(jié)果,相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的準(zhǔn)確率,不會(huì)因?yàn)椤笆遣皇亲址狈诸惼鞒霈F(xiàn)問題,而對(duì)整個(gè)識(shí)別過程產(chǎn)生太大的影響。附圖說明圖1是本申請(qǐng)的一種字符識(shí)別方法實(shí)施例的步驟流程圖;圖1a是本申請(qǐng)的一種身份證號(hào)碼示意圖;圖1b是本申請(qǐng)的一種第一分類器和第二分類器的示意圖;圖2本申請(qǐng)的一種字符識(shí)別方法實(shí)施例的步驟流程圖;圖3是本申請(qǐng)的一種字符識(shí)別裝置實(shí)施例的結(jié)構(gòu)框圖;以及圖4是本申請(qǐng)的一種字符識(shí)別裝置實(shí)施例的結(jié)構(gòu)框圖。具體實(shí)施方式為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說明。本申請(qǐng)實(shí)施例的核心構(gòu)思之一在于,在獲取圖片數(shù)據(jù)之后利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;然后分別將第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;進(jìn)而根據(jù)第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;最后根據(jù)置信度,輸出字符的識(shí)別結(jié)果。本申請(qǐng)使從圖片數(shù)據(jù)中識(shí)別具體字符的第一分類器和識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器的第二分類器可以共享部分計(jì)算層數(shù)據(jù),從而在計(jì)算時(shí)可以同時(shí)對(duì)圖片數(shù)據(jù),并且計(jì)算過程存在重合,降 低計(jì)算量,提高計(jì)算準(zhǔn)確度,并且通過兩個(gè)分類器計(jì)算結(jié)果一起對(duì)圖片進(jìn)行識(shí)別,提高準(zhǔn)確率,降低第二分類器出現(xiàn)問題對(duì)整個(gè)識(shí)別過程的影響。實(shí)施例一參照?qǐng)D1,示出了本申請(qǐng)的一種字符識(shí)別方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:步驟110,獲取圖片數(shù)據(jù)。本申請(qǐng)介紹的是一種針對(duì)圖片的字符識(shí)別方法,首先需要獲取所要識(shí)別的圖片數(shù)據(jù)。圖片是指由圖形、圖像等構(gòu)成的平面媒體。本申請(qǐng)所述的圖片數(shù)據(jù)是數(shù)字圖片,數(shù)字圖片常用的存儲(chǔ)格式很多,例如bmp(bitmap,標(biāo)準(zhǔn)圖像文件格式)、tiff(taggedimagefileformat,位圖圖像格式)、jpeg(jointphotographicexpertsgroup,聯(lián)合圖像專家小組)、gif(graphicsinterchangeformat,圖像互換格式)、psd(photoshop專用格式)、pdf(portabledocumentformat,可移植文件格式)等格式。但是本申請(qǐng)對(duì)于具體的數(shù)字圖片的存儲(chǔ)格式不加以限定。在本申請(qǐng)實(shí)施例中,還可以對(duì)步驟110獲取的圖片數(shù)據(jù)進(jìn)行預(yù)處理,比如將上述圖片數(shù)據(jù)進(jìn)行灰度化,那么可以將彩色的圖片數(shù)據(jù)變成灰度的圖片數(shù)據(jù),從而可以降低計(jì)算量。步驟120,利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;所述第一分類器為從圖片數(shù)據(jù)中識(shí)別具體字符的分類器;所述第二分類器為識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器。為了降低識(shí)別錯(cuò)誤的可能性,本申請(qǐng)利用兩個(gè)分類器完成對(duì)圖片數(shù)據(jù)的識(shí)別,其中第一分類器用以從圖片數(shù)據(jù)中識(shí)別具體字符,第二分類器用以識(shí)別圖片數(shù)據(jù)是否為字符圖片。同時(shí)為了降低識(shí)別的時(shí)間成本,提高識(shí)別的效率以及準(zhǔn)確率所以第一分類器和第二分類器共用一部分計(jì)算層。在本申請(qǐng)實(shí)施例中,所述具體字符比如0~9的阿拉伯?dāng)?shù)字,又比如希臘字符α、β、γ等字符,也可以為其他字符,具體可以根據(jù)實(shí)際需求設(shè)定。相應(yīng)的模型也可以根據(jù)相應(yīng)字符的相應(yīng)確定。第一分類器和第二分類器都可以采用卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,cnn)分類模型。卷積神經(jīng)網(wǎng)絡(luò)分類模型包括至少一個(gè)卷積層、至少一個(gè)全連接層、以及一個(gè)softmax層。如圖1b為一個(gè)第一分類器和第二分類器的示意圖。其中,卷積層a、卷積層b、全連接層c、全連接層d、softmax層以及數(shù)字分類器構(gòu)成了第一分類器,而卷積層a、卷積層b、全連接層c、全連接層e、softmax層以及是不是數(shù)字分類器構(gòu)成了第二分類器。可見,此時(shí)第一分類器和第二分類器共享的計(jì)算層為卷積層a、卷積層b以及全連接層c,第一分類器和第二分類器不共享的是一個(gè)全連接層和一個(gè)softmax層。在圖1b中,第一分類器和第二分類器都包含兩個(gè)卷積層、兩個(gè)全連接層以及一個(gè)softmax層。但是,在實(shí)際應(yīng)用中,可以根據(jù)需求靈活設(shè)定第一分類器和第二分類器所包含的卷積層以及全連接層的具體數(shù)量,對(duì)此本申請(qǐng)實(shí)施例不加以限定。在本申請(qǐng)實(shí)施例中,可以先利用相應(yīng)字符的圖片數(shù)據(jù)樣本,訓(xùn)練第一分類器。比如,利用0~9的數(shù)字圖片樣本,訓(xùn)練“是何種數(shù)字”的第一分類器。訓(xùn)練第一分類器時(shí),實(shí)際上是訓(xùn)練該分類器的各個(gè)計(jì)算層的參數(shù)值。那么本申請(qǐng)實(shí)施例在訓(xùn)練了第一分類器后,可以固定前面部分計(jì)算層的參數(shù),比如固定所有卷積層的參數(shù),然后利用不是數(shù)字的圖片數(shù)據(jù)樣本和是數(shù)字的圖片數(shù)據(jù)樣本,在固定了卷積層的參數(shù)值的情況下,訓(xùn)練后續(xù)計(jì)算層的參數(shù)值。如此第二分類器與第一分類器則共享了參數(shù)值相同的計(jì)算層。在本申請(qǐng)實(shí)施例中,最優(yōu)的情況是共享卷積層,和除最后一層全連接層之前的全連接層。如此可以降低計(jì)算量,也可以提高準(zhǔn)確度。其中,卷積層的計(jì)算過程如下:假設(shè)輸入的圖片數(shù)據(jù)的維度為c×n×n,卷積層的卷積核(kernel)的大小是m×m。其中,c表示圖片數(shù)據(jù)的r(red,紅色)、g(green、綠色)、b(blue、藍(lán)色)三通道,n×n的前后兩個(gè)n分別表示圖片數(shù)據(jù)在橫向方向上的像素大小與縱向方向上的像素大小,根據(jù)輸入圖像數(shù)據(jù)的不同,前后兩個(gè)n的值可以不同,也可以相同,對(duì)此本發(fā)明實(shí)施例不加以限定。對(duì)于卷積核的大小m×m,前后兩個(gè)m的值也可以相同或者不同,對(duì)此本發(fā)明實(shí)施例 也不加以限定。需要說明的是,兩個(gè)m中的較大值應(yīng)該小于兩個(gè)n中的較小值。則經(jīng)過卷積層后,輸出值為:其中,k,i,j表示輸出值的坐標(biāo),k對(duì)應(yīng)于圖片數(shù)據(jù)的r、g、b三通道,i對(duì)應(yīng)于圖片數(shù)據(jù)在橫向方向上的像素點(diǎn)位置,j對(duì)應(yīng)于圖片數(shù)據(jù)在縱向方向上的像素位置。w是卷積層的參數(shù)值,x是輸入值,y是輸出值。在本申請(qǐng)實(shí)施例中,w是已知的參數(shù),可以通過預(yù)先的對(duì)卷積層訓(xùn)練獲得。在本申請(qǐng)實(shí)施例中,對(duì)于每個(gè)卷積層,可以有多個(gè)卷積核,例如卷積核的個(gè)數(shù)可以與輸入圖片數(shù)據(jù)除了在橫向方向上像素大小以及在縱向方向上的像素大小之外的維度一致,例如前述圖片數(shù)據(jù)的三維矩陣c×n×n中的c,因?yàn)閏代表圖片數(shù)據(jù)r、g、b三通道,所以此時(shí)卷積層可以有3個(gè)如前述的m×m的卷積核,則此時(shí)由該卷積層的卷積核構(gòu)成的3×m×m的三維矩陣,即為該卷基層的卷積矩陣。在具體運(yùn)算過程中,每個(gè)卷積核m×m與輸入圖片數(shù)據(jù)的三維矩陣c×n×n進(jìn)行卷積,得到一個(gè)二維矩陣。例如:第一個(gè)卷積核m×m與c為r通道時(shí)的圖片數(shù)據(jù)卷積,得到一個(gè)二維矩陣;第二個(gè)卷積核m×m與c為g通道時(shí)的圖片數(shù)據(jù)卷積,得到一個(gè)二維矩陣;第三個(gè)卷積核m×m與c為b通道時(shí)的圖片數(shù)據(jù)卷積,得到一個(gè)二維矩陣;將三個(gè)卷積核卷積得出的三個(gè)二維矩陣構(gòu)成一個(gè)三維的矩陣,這個(gè)三維的矩陣就是公式(1)所示的卷積層的輸出結(jié)果。全連接層的計(jì)算公式如下:假設(shè)輸入數(shù)據(jù)的維度為n,則經(jīng)過全連接層后,輸出值為:其中,σ(*)為sigmoid函數(shù),w為全連接層的參數(shù)。softmax層的計(jì)算公式如下:其中,x為輸入值,j表示每一個(gè)類別,y表示類別標(biāo)簽,θ為softmax層的參數(shù),e為常量。以數(shù)字為例y的類別包括0,1,2……9。那么該公式可以計(jì)算數(shù)字圖片數(shù)據(jù)對(duì)應(yīng)0、1、2……9這9個(gè)數(shù)字的概率。由上述分析以及圖1b知,在將獲取的圖片數(shù)據(jù)輸入之后,第一分類器和第一分類器共享的計(jì)算層的計(jì)算過程是一致的,因此在經(jīng)過第一分類器和第一分類器共享的計(jì)算層之后,獲取的第一結(jié)果也是一致的,而后,對(duì)于第一分類器和第一分類器不共享的計(jì)算層,如圖1b中的全連接層d和全連接層e,是將第一結(jié)果分別作為第一分類器和第一分類器不共享的計(jì)算層的輸入,此時(shí),第一分類器和第一分類器不共享的計(jì)算層的計(jì)算過程不相同。所以在本申請(qǐng)實(shí)施例中,先利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果。在本申請(qǐng)另一個(gè)優(yōu)選的實(shí)施例中,在步驟120之前,還包括:步驟s11,利用字符圖片樣本訓(xùn)練第一分類器的各計(jì)算層的參數(shù)值;所述第一分類器包括前n層計(jì)算層和后m層計(jì)算層。因?yàn)榈谝环诸惼骱偷诙诸惼髦械膮?shù)可能為未知的,或者是為了進(jìn)一步提高兩者的準(zhǔn)確度,在本申請(qǐng)實(shí)施例中,在利用第一分類器以及第二分類器分別執(zhí)行計(jì)算過程之前,需要先訓(xùn)練第一分類器以及第二分類器中的參數(shù)。因?yàn)榈谝环诸惼骱偷诙诸惼髯罱K計(jì)算的概率本質(zhì)上是不同的,所以對(duì)于第一分類器的訓(xùn)練不需要考慮圖片數(shù)據(jù)不是字符的情況,所以在本申請(qǐng)實(shí)施例中,可以首先利用字符圖片樣本訓(xùn)練第一分類器的各計(jì)算層的參數(shù)值。其中,第一分類器包括前n層計(jì)算層和后m層計(jì)算層,其前n層計(jì)算層是與第二分類器共享的計(jì)算層,后m層計(jì)算層則是不與第二分類器共享的計(jì)算層。在本申請(qǐng)實(shí)施例中,可以利用至少一個(gè)字符圖片樣本訓(xùn)練第一分類器,其中的字符圖片樣本是指已經(jīng)明確識(shí)別出字符的字符圖片樣本,字符圖片樣本包括的字符種類應(yīng)該大于設(shè)定的第一分類器和第二分類器可識(shí)別的字符種類。所以可知,對(duì)應(yīng)于字符圖片樣本,其識(shí)別為自身對(duì)應(yīng)的字符的概率為1,為其他字符的概率都為0。此時(shí),可以將字符圖片樣本作為第一分類器的輸入,將字符圖片樣本的概率為0的分類以及概率為1的分類作為理想輸出,對(duì)第一分類器的參數(shù)進(jìn)行訓(xùn)練。訓(xùn)練過程主要包括四步,這四步被分為兩個(gè)階段:第一階段,向前傳播階段:(1)、選擇一個(gè)字符圖片樣本,輸入第一分類器;(2)、計(jì)算相應(yīng)的實(shí)際輸出;在此階段,第一分類器會(huì)隨機(jī)生成初始參數(shù),字符圖片數(shù)據(jù)從輸入層經(jīng)過逐級(jí)的變換,傳送到輸出層。這個(gè)過程也是第一分類器在完成訓(xùn)練后正常執(zhí)行時(shí)執(zhí)行的過程。第二階段,向后傳播階段:(1)、計(jì)算實(shí)際輸出與相應(yīng)的理想輸出的差;(2)、按極小化誤差的方法調(diào)整參數(shù)。這兩個(gè)階段的工作一般應(yīng)受到精度要求的控制,精度要求可以根據(jù)需求靈活設(shè)定,對(duì)此本申請(qǐng)不加以限定。對(duì)于第一分類器的訓(xùn)練,實(shí)際上是訓(xùn)練各個(gè)卷積層對(duì)應(yīng)的公式(1)中的參數(shù)w,各全連接層對(duì)應(yīng)的公式(2)中的參數(shù)w,以及softmax層中的參數(shù)θ。其中,不同的卷積層的公式(1)的w不同,不同的全連接層的公式(2)的w不同.步驟s12,固定第二分類器的前n層計(jì)算層的參數(shù)為第一分類器的前n層計(jì)算層的參數(shù),并利用非字符圖片樣本和字符圖片樣本訓(xùn)練第二分類器的后l層的參數(shù)值。因?yàn)榈诙诸惼鞯那皀層計(jì)算層是與第一分類器的前n層計(jì)算層共享的,所以在確定了第一分類器的前n層計(jì)算層的參數(shù)之后,那么此時(shí)相當(dāng)于第二分類器的前n層計(jì)算層的參數(shù)也一樣確定了,可以只訓(xùn)練第二分類器的 后l層的參數(shù)值,其中l(wèi)與m可以相同,也可以不同,對(duì)此本申請(qǐng)不加以限定。因?yàn)榈诙诸惼鲿r(shí)計(jì)算輸入圖片數(shù)據(jù)為字符圖片的概率,所以在對(duì)其訓(xùn)練的過程還需要考慮非字符圖片的情況,所以,在申請(qǐng)實(shí)施例中,可以利用至少一個(gè)非字符圖片樣本和至少一個(gè)字符圖片樣本訓(xùn)練第二分類器的后l層計(jì)算層的參數(shù)值。對(duì)于非字符圖片樣本,其是字符圖片的概率為0,不是字符圖片的概率為1;而對(duì)于字符圖片樣本,其是字符圖片的概率為1,不是字符圖片的概率為0。此時(shí),可以將各字符圖片樣本作為第二分類器的輸入,將概率為1作為理想輸出;將各非字符圖片樣本作為第二分類器的輸入,將概率為0作為理想輸出;對(duì)第二分類器的參數(shù)進(jìn)行訓(xùn)練。具體的訓(xùn)練過程,與步驟s11第一分類器的訓(xùn)練過程類似,同樣主要包括四步,這四步被分為兩個(gè)階段:第一階段,向前傳播階段:(1)、選擇一個(gè)字符圖片樣本或者非字符圖片樣本,輸入第一分類器;(2)、計(jì)算相應(yīng)的實(shí)際輸出;在此階段,第一分類器會(huì)隨機(jī)生成初始參數(shù),字符圖片數(shù)據(jù)或者非字符圖片數(shù)據(jù)從輸入層經(jīng)過逐級(jí)的變換,傳送到輸出層。這個(gè)過程也是第二分類器在完成訓(xùn)練后正常執(zhí)行時(shí)執(zhí)行的過程。第二階段,向后傳播階段:(1)、計(jì)算實(shí)際輸出與相應(yīng)的理想輸出的差;(2)、按極小化誤差的方法調(diào)整參數(shù)。這兩個(gè)階段的工作一般也應(yīng)受到精度要求的控制,第二分類器器的精度要求同樣可以根據(jù)需求靈活設(shè)定,對(duì)此本申請(qǐng)不加以限定。需要說明的是,在本申請(qǐng)的另一優(yōu)選地實(shí)施例中,也可以先利用非字符圖片樣本和字符圖片樣本訓(xùn)練第二分類器的前n層計(jì)算層和后l層計(jì)算層的參數(shù)值,然后固定第一分類器的前n層計(jì)算層的參數(shù)為第二分類器的前n層計(jì)算層的參數(shù),并利用字符圖片樣本訓(xùn)練第一分類器的后m層計(jì)算層的參數(shù)值。對(duì)于第二分類器的訓(xùn)練,如果與第一分類器共享卷積層,則其各卷積層的公式(1)的參數(shù)由步驟s11確定;然后實(shí)際上利用前述(字符圖片數(shù)據(jù)樣本+非字符圖片數(shù)據(jù)樣本)訓(xùn)練各全連接層對(duì)應(yīng)的公式(2)中的參數(shù)w,以及softmax層中的參數(shù)θ。如果如果與第一分類器共享卷積層+部分全連接層,當(dāng)然共享的全連接層是按照參數(shù)的輸入順序共享,即共享排序靠前的全連接層,那么其各卷積層的公式(1)的參數(shù)由步驟s11確定,其共享部分的全連接層的公式(2)中的參數(shù)w也由步驟s11確定。然后利用前述(字符圖片數(shù)據(jù)樣本+非字符圖片數(shù)據(jù)樣本)訓(xùn)練剩余的未共享的全連接層對(duì)應(yīng)的公式(2)中的參數(shù)w,以及softmax層中的參數(shù)θ。步驟130,將所述第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率。第一分類器是用以從圖片數(shù)據(jù)中識(shí)別具體字符的分類器,將經(jīng)步驟120得到的第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,即可以得到圖片數(shù)據(jù)可能為各字符的第一概率。例如將第一結(jié)果作為輸入值帶入圖1b所示的第一分類器中的全連接層d以及softmax層1組成的整體,即可以得到對(duì)應(yīng)各字符的第一概率。其中,圖片數(shù)據(jù)對(duì)應(yīng)的字符可以為0到9之間的阿拉伯?dāng)?shù)字,也可以為大寫字符a到z之間以及小寫字母a到z之間的52個(gè)英文字符,或者是標(biāo)點(diǎn)符號(hào)、特殊符號(hào)、漢字、羅馬字符等等在圖片數(shù)據(jù)中可能出現(xiàn)的字符類型中一種或多種字符。在本申請(qǐng)實(shí)施例中,所對(duì)應(yīng)的具體字符種類可以根據(jù)需求設(shè)定,對(duì)此本發(fā)明實(shí)施例中不加以限定。在softmax層,如果已經(jīng)設(shè)定可能的字符種類,則利用softmax層的分類算法,即可以算出輸入的圖片數(shù)據(jù)可能為各個(gè)字符的概率,即為其對(duì)應(yīng)各字符的第一概率。步驟140,將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率。第二分類器是用以識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器,將經(jīng)步驟 120得到的第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,即可以得到圖片數(shù)據(jù)為字符圖片的第二概率。例如將第一結(jié)果作為輸入值帶入圖1b所示的第二分類器中的全連接層e以及softmax層2組成的整體,即可以得到對(duì)應(yīng)各字符的第二概率。第二分類器得到的第二概率是圖片數(shù)據(jù)為字符圖片的概率,其中字符圖片所對(duì)應(yīng)的字符同樣可能為步驟130所述的各種字符類型,可以根據(jù)需求設(shè)定,但是需要說明的是,第一分類器對(duì)應(yīng)的字符種類與第二分類器對(duì)應(yīng)的字符種類可以是一致的,或者第二分類器對(duì)應(yīng)的字符種類包含第一分類器對(duì)應(yīng)的字符種類,對(duì)此本發(fā)明實(shí)施例不加以限定。但是相對(duì)而言,對(duì)于第一分類器對(duì)應(yīng)的字符種類與第二分類器對(duì)應(yīng)的字符種類一致的情況,最終識(shí)別字符的效率以及準(zhǔn)確度會(huì)更高。對(duì)于第二分類器而言,字符圖片是指包含設(shè)定的字符類型的圖片,計(jì)算圖片數(shù)據(jù)為字符圖片的概率是指計(jì)算圖片數(shù)據(jù)為包含設(shè)定的字符類型的圖片的概率,得到的結(jié)果即為第二概率。第二分類器也是利用其自身的softmax層計(jì)算第二概率,如果已經(jīng)設(shè)定可能的字符種類,則利用softmax層的分類算法,即可以算出輸入的圖片數(shù)據(jù)可能為字符圖片的概率,即為其對(duì)應(yīng)各字符的第一概率。需要說明的是,因?yàn)榈谝环诸惼骱偷诙诸惼饔?jì)算得到的第一概率和第二概率的本質(zhì)不相同,所以第一分類器和第二分類器除了共享的計(jì)算層之外剩余的計(jì)算層,尤其是softmax層的參數(shù)以及結(jié)構(gòu)并不一定相同。步驟150,根據(jù)所述第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度。如前述,第一概率是指圖片數(shù)據(jù)可能為各個(gè)字符的概率,而第二概率是指圖片數(shù)據(jù)可能為字符圖片的概率,可知,對(duì)于一個(gè)圖片數(shù)據(jù)而言,其第一概率的個(gè)數(shù)是與設(shè)定的字符種類相對(duì)應(yīng)的,第一概率的個(gè)數(shù)等同于字符種類的個(gè)數(shù),至少為一個(gè),而對(duì)應(yīng)輸入一個(gè)圖片數(shù)據(jù),得到的第二概率只能為一個(gè)。此時(shí),根據(jù)圖像數(shù)據(jù)的第一概率和第二概率,可以計(jì)算該圖片數(shù)據(jù)可以識(shí)別為各個(gè)字符的置信度。例如,可以通過分別將圖像數(shù)據(jù)對(duì)應(yīng)于各個(gè)字符的第一概率與該圖片數(shù)據(jù)的第二概率相乘,得到該圖片數(shù)據(jù)識(shí)別為各個(gè)字符 的置信度。例如若要識(shí)別一個(gè)圖片數(shù)據(jù)是否為0到9之間的阿拉伯?dāng)?shù)字,則經(jīng)過第一分類器可以得到十個(gè)第一概率,分別對(duì)應(yīng)于該圖片數(shù)據(jù)為0到9之間的阿拉伯?dāng)?shù)字的概率,例如第一概率p0是指該圖片數(shù)據(jù)為字符0的概率,第一概率p1是指該圖片數(shù)據(jù)為字符1的概率,第一概率p9是指該圖片數(shù)據(jù)為字符9的概率,等等。而經(jīng)過第二分類器只能得到一個(gè)第二概率,即為該圖片數(shù)據(jù)滿足設(shè)定的條件,例如為阿拉伯?dāng)?shù)字的概率s。此時(shí),將p0與s相乘,得到的即為該圖片數(shù)據(jù)識(shí)別為字符0的置信度,而將p9與s相乘,得到的即為該圖片數(shù)據(jù)識(shí)別為字符9的置信度。步驟160,根據(jù)置信度,輸出字符的識(shí)別結(jié)果。在本申請(qǐng)實(shí)施例中,可以根據(jù)計(jì)算出來的圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度,輸出其中對(duì)應(yīng)置信度最高的字符作為識(shí)別結(jié)果輸出。例如,步驟150中所述的識(shí)別一個(gè)圖片數(shù)據(jù)是否為0到9之間的阿拉伯?dāng)?shù)字,若最終計(jì)算得到的對(duì)應(yīng)各個(gè)字符的置信度中,p9與s相乘得到的置信度最大,則可以將字符9作為識(shí)別結(jié)果輸出。在本申請(qǐng)實(shí)施例中,在獲取圖片數(shù)據(jù)之后利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;然后分別將第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;進(jìn)而根據(jù)第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;最后根據(jù)置信度,輸出字符的識(shí)別結(jié)果。其中,第二分類器時(shí)與第一分類器共享一部分計(jì)算層的,對(duì)于第二分類器與第一分類器共享的計(jì)算層,其計(jì)算過程以及計(jì)算結(jié)果也是共享的,所以相對(duì)于
背景技術(shù):
:在字符分類器之前增加一個(gè)完整的“是不是字符”分類器,然后按序?qū)D片進(jìn)行計(jì)算的過程,本申請(qǐng)相對(duì)增加的計(jì)算量比較少,降低了計(jì)算時(shí)間,相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的效率。另外,第二分類器與第一分類器并不是前后順序使用,而是將兩個(gè)分類 器分別得到的概率值相乘得到一個(gè)置信度,然后根據(jù)置信度值輸出相應(yīng)的識(shí)別結(jié)果,相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的準(zhǔn)確率,不會(huì)因?yàn)椤笆遣皇亲址狈诸惼鞒霈F(xiàn)問題,而對(duì)整個(gè)識(shí)別過程產(chǎn)生太大的影響。實(shí)施例二參照?qǐng)D2,示出了本申請(qǐng)的一種字符識(shí)別方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:步驟210,從身份證明的圖片的號(hào)碼區(qū)域,切分各個(gè)圖片數(shù)據(jù)。在本申請(qǐng)實(shí)施例中,是對(duì)身份證明的圖片進(jìn)行號(hào)碼識(shí)別,因?yàn)樯矸葑C明的圖片中可能包含多個(gè)號(hào)碼,例如身份證號(hào)碼,所以為了識(shí)別的方便,首先需要從身份證明的圖片的號(hào)碼區(qū)域,切分各個(gè)圖片數(shù)據(jù),如圖1a,切分得到多個(gè)圖片數(shù)據(jù)。例如將身份證號(hào)碼所在的區(qū)域按序切分成只包含一位號(hào)碼的圖片數(shù)據(jù),對(duì)于具體的切分方法,屬于本領(lǐng)域的公知技術(shù),對(duì)此本申請(qǐng)實(shí)施例不加以贅述。步驟220,利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;所述第一分類器為從圖片數(shù)據(jù)中識(shí)別具體字符的分類器;所述第二分類器為識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器。在本申請(qǐng)的另一個(gè)優(yōu)選的實(shí)施例中,所述第一分類器和第二分類器共享的計(jì)算層包括:卷積層、或者卷積層和至少一層全連接層。在本申請(qǐng)的另一個(gè)優(yōu)選的實(shí)施例中,所述字符為數(shù)字。此時(shí),第一分類器是計(jì)算輸入圖片數(shù)據(jù)分別為0到9之間任一數(shù)字的概率,第二分類器是計(jì)算輸入圖片數(shù)據(jù)可識(shí)別為數(shù)字的概率。步驟230,將所述第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率。步驟240,將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率。步驟250,將最大的第一概率與第二概率相乘,得到所述圖片數(shù)據(jù)為最大的第一概率對(duì)應(yīng)的數(shù)字的置信度。其中最大的第一概率即為輸入圖片數(shù)據(jù)最可能為的數(shù)字對(duì)應(yīng)的第一概 率,將最大的第一概率與第二概率相乘,即可以得到輸入的圖片數(shù)據(jù)為最大的第一概率對(duì)應(yīng)的數(shù)字的置信度。步驟260,從各個(gè)圖片數(shù)據(jù)中,選擇排序靠前的符合所述身份證規(guī)定個(gè)數(shù)的圖片所對(duì)應(yīng)的數(shù)字,并按序輸出。由于對(duì)切分得到的各個(gè)圖片都有對(duì)應(yīng)數(shù)字0~9概率,而圖1b切分的圖片按身份證的撰寫習(xí)慣,從左端至右端切分的排列的多個(gè)圖片。那么本申請(qǐng)則確定各張圖片對(duì)應(yīng)0~9中最大的概率,然后從排列好的圖片中以每張圖片最大的概率選擇概率最靠前的18張圖片,然后將相應(yīng)概率數(shù)字圖片的排序組合,即得到身份證號(hào)碼。當(dāng)然,在本申請(qǐng)實(shí)施例中,圖片的排序在步驟210切圖時(shí),可以對(duì)圖片進(jìn)行標(biāo)注以記錄。例如,對(duì)于圖1a所示的身份證號(hào)碼進(jìn)行字符識(shí)別,首先將其切分為多個(gè)字符數(shù)據(jù),按照撰寫習(xí)慣,可以從左端到右端對(duì)其進(jìn)行切分成互不相連的22個(gè)圖片數(shù)據(jù),依次分別為a1到a22,然后利用第一分類器和第二分類器,計(jì)算各圖片數(shù)據(jù)對(duì)應(yīng)最大的概率數(shù)字的置信度,并按照置信度從高到低的順序選擇18個(gè)圖片數(shù)據(jù)及18個(gè)圖片數(shù)據(jù)對(duì)應(yīng)最大概率的數(shù)字,假設(shè)選擇出的圖片數(shù)據(jù)按該圖片中各數(shù)字的最大的照置信度從高到低的順序分別為:a5:(0.95,2)、a6:(0.94,0)、a12:(0.93,8)、a15:(0.92,9)、a11:(0.92,9)、a13:(0.90,9)、a16:(0.90,2)、a4:(0.89,4)、a10(0.89,1)、a14:(0.88,0),a7:(0.87,9)、a17:(0.86,6)、a8:(0.85,2)、a18:(0.84,5)、a9:(0.84,1)、a19:(0.83,1),a20:(0.81,3)、a21:(0.80,8),a2(0.1,8),a1(0.1,9),a22(0.09,0),a3(0.09,0)但是在輸出的過程中,仍然是按照最初切分時(shí)候的先后順序,輸出順序?yàn)椋篴4、a5、a6、a7、a8、a9、a10、a11、a12、a13、a14、a15、a16、a17、a18、a19、a20、a21,則輸出的數(shù)字序列為420921198909265138對(duì)于身份證明的圖片的號(hào)碼區(qū)域,可以切分為多個(gè)圖片數(shù)據(jù),依次分別利用第一分類器和第二分類器,執(zhí)行上述的步驟220-250,計(jì)算各個(gè)圖片數(shù)據(jù)置信度,并分別按序輸出各第一概率對(duì)應(yīng)的數(shù)字,從而實(shí)現(xiàn)了對(duì)身份證明 的號(hào)碼,例如身份證號(hào)碼的數(shù)字識(shí)別。在本申請(qǐng)實(shí)施例中,同樣在獲取圖片數(shù)據(jù)之后利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;然后分別將第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;進(jìn)而根據(jù)第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;最后根據(jù)置信度,輸出字符的識(shí)別結(jié)果。進(jìn)而相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的效率以及準(zhǔn)確率。另外,本申請(qǐng)?jiān)趯?duì)第一分類器和第二分類器進(jìn)行訓(xùn)練的過程中,可以先訓(xùn)練其中一個(gè)分類器,然后將第一分類器和第二分類器共享的計(jì)算層固定,繼續(xù)訓(xùn)練另一個(gè)分類器未被訓(xùn)練的計(jì)算層,相對(duì)于
背景技術(shù):
:,降低了訓(xùn)練的工作量,也提高了對(duì)第一分類器和第二分類器訓(xùn)練的效率。進(jìn)一步提高了字符識(shí)別的效率以及準(zhǔn)確率。需要說明的是,對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng)實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本申請(qǐng)實(shí)施例所必須的。實(shí)施例三參照?qǐng)D3,示出了本申請(qǐng)的一種字符識(shí)別裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:圖片獲取模塊310,適于獲取圖片數(shù)據(jù)。第一結(jié)果計(jì)算模塊320,適于利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;所述第一分類器為從圖片數(shù)據(jù)中識(shí)別具體字符的分類器;所述第二分類器為識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器。第一概率計(jì)算模塊330,適于將所述第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率。第二概率計(jì)算模塊340,適于將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率。置信度計(jì)算模塊350,適于根據(jù)所述第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度。輸出模塊360,適于根據(jù)置信度,輸出字符的識(shí)別結(jié)果。在本申請(qǐng)的又一個(gè)優(yōu)選地實(shí)施例中,在第一結(jié)果計(jì)算模塊320之前,還包括:第一分類器訓(xùn)練模塊370,適于利用字符圖片樣本訓(xùn)練第一分類器的各計(jì)算層的參數(shù)值;所述第一分類器包括前n層計(jì)算層和后m層計(jì)算層。在本申請(qǐng)的又一個(gè)優(yōu)選地實(shí)施例中,在第二概率計(jì)算模塊340之前,還包括:第二分類器訓(xùn)練模塊380,適于固定第二分類器的前n層計(jì)算層的參數(shù)為第一分類器的前n層計(jì)算層的參數(shù),并利用非字符圖片樣本和字符圖片樣本訓(xùn)練第二分類器的后l層的參數(shù)值。在本申請(qǐng)實(shí)施例中,在獲取圖片數(shù)據(jù)之后利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;然后分別將第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;進(jìn)而根據(jù)第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;最后根據(jù)置信度,輸出字符的識(shí)別結(jié)果。其中,第二分類器時(shí)與第一分類器共享一部分計(jì)算層的,對(duì)于第二分類器與第一分類器共享的計(jì)算層,其計(jì)算過程以及計(jì)算結(jié)果也是共享的,所以相對(duì)于
背景技術(shù):
:增加一個(gè)完整的分類器,本申請(qǐng)相對(duì)增加的計(jì)算量比較少,相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的效率。另外,第二分類器與第一分類器并不是前后順序使用,而是將兩個(gè)分類器分別得到的概率值相乘得到一個(gè)置信度,然后根據(jù)置信度值輸出相應(yīng)的識(shí)別結(jié)果,相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的準(zhǔn)確率。實(shí)施例四參照?qǐng)D4,示出了本申請(qǐng)的一種字符識(shí)別裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:圖片獲取模塊410,適于獲取圖片數(shù)據(jù)。具體包括:圖片切分子模塊411,適于從身份證明的圖片的號(hào)碼區(qū)域,切分各個(gè)圖片數(shù)據(jù)。第一結(jié)果計(jì)算模塊420,適于利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;所述第一分類器為從圖片數(shù)據(jù)中識(shí)別具體字符的分類器;所述第二分類器為識(shí)別圖片數(shù)據(jù)是否為字符圖片的分類器。第一概率計(jì)算模塊430,適于將所述第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率。第二概率計(jì)算模塊440,適于將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率。置信度計(jì)算模塊450,適于根據(jù)所述第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度。具體包括:置信度計(jì)算子模塊451,適于將最大的第一概率與第二概率相乘,得到所述圖片數(shù)據(jù)為最大的第一概率對(duì)應(yīng)的數(shù)字的置信度。輸出模塊460,適于根據(jù)置信度,輸出字符的識(shí)別結(jié)果。具體包括:輸出子模塊461,適于從各個(gè)圖片數(shù)據(jù)中,選擇排序靠前的符合所述身份證規(guī)定個(gè)數(shù)的圖片所對(duì)應(yīng)的數(shù)字,并按序輸出。在本申請(qǐng)實(shí)施例中,同樣在獲取圖片數(shù)據(jù)之后利用第一分類器和第二分類器共享的計(jì)算層對(duì)所述圖片數(shù)據(jù)進(jìn)行計(jì)算,得到第一結(jié)果;然后分別將第一結(jié)果帶入第一分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到對(duì)應(yīng)各字符的第一概率;將所述第一結(jié)果帶入第二分類器中除共享的計(jì)算層之外剩余的計(jì)算層進(jìn)行計(jì)算,得到第二概率;進(jìn)而根據(jù)第一概率和第二概率,計(jì)算所述圖片數(shù)據(jù)識(shí)別為各個(gè)字符的置信度;最后根據(jù)置信度,輸出字符的識(shí)別結(jié)果。進(jìn)而相對(duì)于
背景技術(shù):
:提高了字符識(shí)別的效率以及準(zhǔn)確率。另外,本申請(qǐng)?jiān)趯?duì)第一分類器和第二分類器進(jìn)行訓(xùn)練的過程中,可以先訓(xùn)練其中一個(gè)分類器,然后將第一分類器和第二分類器共享的計(jì)算層固定,繼續(xù)訓(xùn)練另一個(gè)分類器未被訓(xùn)練的計(jì)算層,相對(duì)于
背景技術(shù):
:,降低了訓(xùn)練的工作量,也提高了對(duì)第一分類器和第二分類器訓(xùn)練的效率。進(jìn)一步提高了字符識(shí)別的效率以及準(zhǔn)確率。對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請(qǐng)實(shí)施例的實(shí)施例可提供為方法、裝置、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)實(shí)施例可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)實(shí)施例可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。在一個(gè)典型的配置中,所述計(jì)算機(jī)設(shè)備包括一個(gè)或多個(gè)處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、其他類型的隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、電可擦除可編程只讀存儲(chǔ)器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(cd-rom)、字符多功能光盤(dvd)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其 他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非持續(xù)性的電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號(hào)和載波。本申請(qǐng)實(shí)施例是參照根據(jù)本申請(qǐng)實(shí)施例的方法、終端設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。盡管已描述了本申請(qǐng)實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本申請(qǐng)實(shí)施例范圍的所有變更和修改。最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得 包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。以上對(duì)本申請(qǐng)所提供的一種字符識(shí)別方法和一種字符識(shí)別裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。當(dāng)前第1頁12當(dāng)前第1頁12