專利名稱:一種點(diǎn)密度非線性歸一化文字識別方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及手寫識別技術(shù)領(lǐng)域,特別是涉及一種點(diǎn)密度非線性歸一化文字識別方 法和裝置。
背景技術(shù):
在手寫識別中,需要對用戶輸入的漢字進(jìn)行預(yù)處理,由于字符大小不一,為了便于 提取字符特征,需要對樣本進(jìn)行大小歸一化。歸一化可分為線性歸一化和非線性歸一化兩 種方法。線性歸一化就是將文字圖像按照一定的比例系數(shù)線性放大或縮小,其中X方向和 Y方向的比例系數(shù)可以相同也可以不同。一般的做法是將每一個(gè)字符塊調(diào)節(jié)到一個(gè)正方形 內(nèi),即先用一個(gè)框?qū)⒆址麎K圍起來,然后將方框拉伸為正方形,此方法主要是基于漢字為方 塊字的假設(shè)。這種方法采用的算法簡單、失真較小,但是無法調(diào)整手寫漢字的中心位置和筆 劃密度?!叭恕笔且粋€(gè)標(biāo)準(zhǔn)的方塊漢字,一般而言不同的兩個(gè)人書寫出的這個(gè)漢字只有大小 之分,在做完線性歸一化將字符歸一化到相同尺寸,比如說100*100的范圍,從ζ軸上看它 們的重合程度非常大,用一個(gè)非常簡單的判別算法也能夠判斷出這兩個(gè)字是非常相似的。 不同人的書寫習(xí)慣不同,有的人寫得胖,有的人寫的瘦,經(jīng)線性歸一化后,仍然可以看到很 大的重合度。但有些人寫字非常拖,一捺拉得很長,一撇只能占到整個(gè)字符的三分之一寬 度,這時(shí)如果經(jīng)采用線性歸一化,再從ζ軸上看,就會發(fā)現(xiàn)只有一撇的收筆部分會有些重 合。為了解決這個(gè)問題,可以采用基于點(diǎn)密度的非線性歸一化算法。非線性歸一化強(qiáng)調(diào)按照手寫漢字的特征分布來處理,它是在一個(gè)二維平面上,沿 著X軸和y軸分別計(jì)算每個(gè)坐標(biāo)點(diǎn)上的點(diǎn)密度,然后利用映射函數(shù),可以計(jì)算原坐標(biāo)(X,y) 在平面上新的坐標(biāo)點(diǎn)(χ’,y’)。這種點(diǎn)密度的非線性歸一化算法,能夠一定程度上消除不 同人,不同時(shí)間,不同設(shè)備環(huán)境下書寫出的相同漢字的變形,從而為識別算法減輕壓力。但在非線性歸一化方法也會帶來漢字的變形問題。比如“ I,,“一”等非標(biāo)準(zhǔn)的方 塊字符,如果是嚴(yán)格的印刷體漢字,經(jīng)非線性歸一化算法,得到的仍是豎或者橫。但是在手 寫識別中,由于用戶手寫軌跡不規(guī)則,那么,在豎和橫稍有傾斜的情況下,“ I ”經(jīng)非線性歸一 化后得到的是撇或者捺,“一”經(jīng)非線性歸一化得到的則是提或者捺。又如,撇和捺等非標(biāo)準(zhǔn) 的方塊漢字,經(jīng)非線性歸一化后得到的是嚴(yán)格意義上45°或者135°傾斜的撇或者捺,原 有的傾斜角度差異不再出現(xiàn)。此外,又如“日”等漢字,經(jīng)非線性歸一化得到的是一個(gè)滿格 的“曰”字,最后識別時(shí)將無法區(qū)分“日,,和“曰”。總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是如何能夠提供一種文 字識別技術(shù),可以減少文字的變形失真,提高識別的可靠性。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種點(diǎn)密度非線性歸一化文字識別方法和裝 置,能夠減少文字的變形、失真,提高識別的可靠性。
為了解決上述問題,本發(fā)明公開了一種點(diǎn)密度非線性歸一化文字識別方法,包 括針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌跡的外接矩形;判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi);若是,則將外接矩形擴(kuò)大為正方形,并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡 的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo);若否,則直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn) 密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。進(jìn)一步,所述點(diǎn)密度非線性歸一化處理包括將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn) 的點(diǎn)密度fm,以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ;其中,按照正方形或外接矩形的寬 度在X軸上依次取M個(gè)坐標(biāo)點(diǎn),按照正方形或外接矩形的高度在Y軸上依次取N個(gè)坐標(biāo)點(diǎn); m = 1,2,3......M ;η = 1,2,3......N ;依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm,以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱 向歸一密度 Vn ;其中,Hm = f\+f2+......+fffl ;Vn = gl+g2+......+gn;依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y ;其中,X(m,n)= W1 (Hm-H1) /Hm ;Y (m, n) = W2 (Vn-V1) /Vn 和W2為非線性歸一化后正方形的寬度和高度。優(yōu)選的,正方形或外接矩形的左下頂點(diǎn)位于二維坐標(biāo)平面上的(1,1)點(diǎn);則按照 正方形或外接矩形的寬度在X軸上從(1,0)點(diǎn)開始依次取M個(gè)坐標(biāo)點(diǎn);按照正方形或外接 矩形的高度在Y軸上從(0,1)點(diǎn)開始依次取N個(gè)坐標(biāo)點(diǎn)。優(yōu)選的,所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù);其中,所 述密度系數(shù)的取值范圍為1 2。優(yōu)選的,所述預(yù)置比值的范圍為大于等于第一預(yù)置比值,以及小于等于第二預(yù)置 比值;其中,所述第一預(yù)置比值的范圍為2 3,所述第二預(yù)置比值的范圍為0. 5 0. 333。進(jìn)一步,將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一預(yù)置比值時(shí),外接矩形的寬度不變,高度 增大至與寬度等值;當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí),外接矩形的高度不變,寬度 增大至與高度等值。此外,本發(fā)明還公開了一種點(diǎn)密度非線性歸一化文字識別裝置,包括外接矩形獲取單元,用于針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌跡 的外接矩形;寬高比判斷單元,用于判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi);若 是,則觸發(fā)矩形擴(kuò)大單元;若否,則觸發(fā)非線性歸一化單元;矩形擴(kuò)大單元,用于將外接矩形擴(kuò)大為正方形,并觸發(fā)非線性歸一化單元;非線性歸一化單元,用于在正方形或外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各 個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。進(jìn)一步,所述非線性歸一化單元包括點(diǎn)密度計(jì)算子單元,用于將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm,以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ;其中,按照 正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn),按照正方形或外接矩形的高度在Y 軸上依次取N個(gè)坐標(biāo)點(diǎn);m= 1,2,3......M;n = 1,2,3......N ;歸一密度計(jì)算子單元,用于依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密 度民,以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度Vn;其中,Hm = f\+f2+......+fm;Vn =
gl+g2+......+gn ;歸一坐標(biāo)計(jì)算子單元,用于依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X 和縱坐標(biāo) Y ;其中,X (m,n) = W1 (Hm-H1) /Hm ;Y (m, η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化 后正方形的寬度和高度。優(yōu)選的,所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù);其中,所 述密度系數(shù)的取值范圍為1 2。優(yōu)選的,所述預(yù)置比值的范圍為大于等于第一預(yù)置比值,以及小于等于第二預(yù)置 比值;其中,所述第一預(yù)置比值的范圍為2 3,所述第二預(yù)置比值的范圍為0. 5 0. 333。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)本發(fā)明獲得當(dāng)前文字的手寫軌跡的外接矩形后,不同于現(xiàn)有技術(shù),直接在手寫軌 跡的外接矩形框內(nèi)對各個(gè)像素點(diǎn)進(jìn)行非線性歸一化處理,而是計(jì)算該外接矩形的寬高比, 以寬高比作為判斷條件,執(zhí)行不同的操作步驟當(dāng)寬高比不在預(yù)置比值范圍之內(nèi)時(shí),該手寫 軌跡的寬度和高度相差不大,則直接進(jìn)行點(diǎn)密度非線性歸一化處理,漢字的形變較小,不會 對識別效果產(chǎn)生影響;當(dāng)寬高比在預(yù)置比值范圍之內(nèi)時(shí),該手寫軌跡的寬度和高度相差較 大,若直接進(jìn)行點(diǎn)密度非線性歸一化處理,則會產(chǎn)生較大的形變,嚴(yán)重影響識別結(jié)果,則本 發(fā)明先將外接矩形擴(kuò)大為正方形,然后再在該正方形內(nèi)進(jìn)行點(diǎn)密度非線性歸一化處理,從 而使歸一后漢字產(chǎn)生較小的形變??傊?,通過本發(fā)明提出的方法,在點(diǎn)密度非線性歸一化處理后,減少了文字軌跡的 變形、失真,提高文字識別的可靠性。
圖1是本發(fā)明一種點(diǎn)密度非線性歸一化文字識別方法實(shí)施例一的流程圖;圖2是本發(fā)明一種點(diǎn)密度非線性歸一化文字識別方法實(shí)施例二的流程圖;圖3是手寫軌跡“ I,,的點(diǎn)密度非線性歸一化識別結(jié)果對比示意圖;圖4是手寫軌跡“一”的點(diǎn)密度非線性歸一化識別結(jié)果對比示意圖;圖5是本發(fā)明一種點(diǎn)密度非線性歸一化文字識別裝置實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。參照圖1,示出了本發(fā)明一種非線性歸一化文字識別方法實(shí)施例一的流程圖,包 括步驟101,針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌跡的外接矩形;所述外接矩形的寬為水平,高為豎直。具體的,分別在該手寫軌跡的左邊界點(diǎn)和右
6邊界點(diǎn)上做豎直的直線,分別在該手寫軌跡的上邊界點(diǎn)和下邊界點(diǎn)上作水平的直線,四條 直線圍成的區(qū)域即該手寫軌跡的外接矩形。步驟102,判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi);若是,則執(zhí)行步 驟103 ;若否,則執(zhí)行步驟104;不同于現(xiàn)有技術(shù),直接在手寫軌跡的外接矩形框內(nèi)對各個(gè)像素點(diǎn)進(jìn)行非線性歸 一化處理,本發(fā)明需要計(jì)算該外接矩形的寬高比,當(dāng)寬高比不同時(shí),執(zhí)行不同的操作步驟。 進(jìn)一步,所述預(yù)置比值的范圍為大于等于第一預(yù)置比值,以及小于等于第二預(yù)置比值;其 中,所述第一預(yù)置比值的范圍為2 3,所述第二預(yù)置比值的范圍為0. 5 0. 333。步驟103,將外接矩形擴(kuò)大為正方形,并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡 的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo);其中,將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一 預(yù)置比值時(shí),也即外接矩形為寬大于高的矩形,則外接矩形的寬度不變,高度以原中線為中 心上下增大至與寬度等值;當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí),也即外接 矩形為寬小于高的矩形,則外接矩形的高度不變,寬度以原中線為中心左右增大至與高度 等值。步驟104,直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行 點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。本發(fā)明實(shí)施例以寬高比作為判斷條件,當(dāng)寬高比不在預(yù)置比值范圍之內(nèi)時(shí),則直 接進(jìn)行點(diǎn)密度非線性歸一化處理,由于此時(shí)該手寫軌跡的寬度和高度相差不大,漢字的形 變較小,不會對識別效果產(chǎn)生影響;當(dāng)寬高比在預(yù)置比值范圍之內(nèi)時(shí),該手寫軌跡的寬度和 高度相差較大,若直接進(jìn)行點(diǎn)密度非線性歸一化處理,則會產(chǎn)生較大的形變,嚴(yán)重影響識別 結(jié)果,本發(fā)明創(chuàng)造性的先將外接矩形擴(kuò)大為正方形,然后再在該正方形內(nèi)進(jìn)行點(diǎn)密度非線 性歸一化處理,從而使歸一后漢字產(chǎn)生較小的形變,提高了文字識別的可靠性。具體的,步驟103和步驟104中所述點(diǎn)密度非線性歸一化處理包括如下子步驟子步驟Al,將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X軸上投影到 各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm,以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ;其中,按照正方形或外 接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn),按照正方形或外接矩形的高度在Y軸上依次取 N 個(gè)坐標(biāo)點(diǎn);m = 1,2,3......M ;n = 1,2,3......N ;貝IJ,fm為X軸上第m個(gè)坐標(biāo)點(diǎn)對應(yīng)的點(diǎn)密度;gn為Y軸上第η個(gè)坐標(biāo)點(diǎn)對應(yīng)的點(diǎn) 密度。一般的,點(diǎn)密度可以是坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)。在本發(fā)明的優(yōu)選實(shí)施例中, 為了保證歸一化的精確度,所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù); 其中,所述密度系數(shù)的取值范圍為1 2。子步驟Α2,依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm,以及Y軸上各個(gè) 點(diǎn)對應(yīng)的縱向歸一密度Vn ;其中,Hm = f!+f2+......+fm ;Vn = gl+g2+......+gn;也就是說,X軸上第m個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm為第1至第m個(gè)坐標(biāo)點(diǎn)的 點(diǎn)密度的累加和;Y軸上第η個(gè)坐標(biāo)點(diǎn)對應(yīng)的縱向歸一密度Vn為第1至第η個(gè)坐標(biāo)點(diǎn)的點(diǎn) 密度的累加和。子步驟A3,依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y ;其 中,X(m,n) = W1 (Hm-H1) /Hm ;Y(m, η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化后正方形的寬
7度和高度。本步驟最終獲得原像素點(diǎn)經(jīng)歸一化后坐標(biāo)平面上新的坐標(biāo)(X,Y),X(m, η)為與X 軸第m個(gè)坐標(biāo)點(diǎn)以及Y軸第η個(gè)坐標(biāo)點(diǎn)對應(yīng)投影的原像素點(diǎn)的新的橫坐標(biāo),H1為X軸上第1 個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度,Hm為X軸上第M個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度;Y(m,η)為 與X軸第m個(gè)坐標(biāo)點(diǎn)以及Y軸第η個(gè)坐標(biāo)點(diǎn)對應(yīng)投影的原像素點(diǎn)的新的縱坐標(biāo),V1為Y軸 上第1個(gè)坐標(biāo)點(diǎn)對應(yīng)的縱向歸一密度,Vn為Y軸上第N個(gè)坐標(biāo)點(diǎn)對應(yīng)的縱向歸一密度。最 后,根據(jù)各個(gè)像素點(diǎn)的新的坐標(biāo),即可獲得最終非線性歸一化后的文字。需要說明的是,一般巧和^的取值相同,則歸一化后的文字位于正方形內(nèi)。此外, 通常將手寫軌跡置于擴(kuò)大后的正方形中心,即,將原外接矩形的中心位于擴(kuò)大后的正方形 的中心上,此時(shí),經(jīng)非線性歸一化后的文字位于正方形的中心。下面,舉一個(gè)具體的例子對本發(fā)明進(jìn)行詳細(xì)說明,本發(fā)明實(shí)施例中,以用戶輸入的 “ I ”作為示例。參見圖2,為本發(fā)明一種點(diǎn)密度非線性歸一化文字識別方法實(shí)施例二的流程 圖,具體的,該方法包括步驟201,針對用戶輸入的手寫軌跡,獲取該手寫軌跡的外接矩形;如圖3所示,為手寫軌跡“ I ”的點(diǎn)密度非線性歸一化識別結(jié)果對比示意圖。其中, 圖3(a)所示,為用戶輸入的手寫軌跡“|”的軌跡示意圖,從圖3(a)中可以看出,該軌跡不 是嚴(yán)格意義上的豎直,而是向右下略有傾斜。步驟202,判斷得到所述外接矩形的寬高比位于預(yù)置比值范圍之內(nèi);計(jì)算得到該外接矩形的寬高比為3 100 = 0.03。在本發(fā)明實(shí)施例中,所述預(yù)置 比值的范圍為大于等于2,以及小于等于0. 5,則判斷所述外接矩形的寬高比位于預(yù)置比 值范圍之內(nèi)。步驟203,將外接矩形擴(kuò)大為正方形,使得外接矩形的高度不變,寬度增大至與高 度等值;本發(fā)明實(shí)施例中,將寬度增大至100。步驟204,將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X軸上各個(gè)坐標(biāo) 點(diǎn)投影得到的點(diǎn)密度fm,以及Y軸上各個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度gn ;需要說明的是,手寫軌跡進(jìn)行投影時(shí),通常將所述正方形或外接矩形置于坐標(biāo)平 面的第一象限,在本發(fā)明的優(yōu)選是實(shí)施例中,為了方便計(jì)算,將擴(kuò)大后的正方形的左下頂點(diǎn) 位于二維坐標(biāo)平面上的(1,1)點(diǎn);則按照正方形或外接矩形的寬度在X軸上從(1,0)點(diǎn)開 始依次取M個(gè)坐標(biāo)點(diǎn);按照正方形或外接矩形的高度在Y軸上從(0,1)點(diǎn)開始依次取N個(gè) 坐標(biāo)點(diǎn),本發(fā)明實(shí)施例中,所述M取值為100,N取值為100;進(jìn)一步,密度系數(shù)α取值為1。在該手寫軌跡上取a、b、c三個(gè)像素點(diǎn),如圖3(a)所示,其對應(yīng)在X軸上的三個(gè)坐 標(biāo)點(diǎn)上有投影,a點(diǎn)對應(yīng)X軸上第49個(gè)坐標(biāo)點(diǎn)、b對應(yīng)X軸上第50個(gè)坐標(biāo)點(diǎn)、c對應(yīng)X軸上 第51個(gè)坐標(biāo)點(diǎn)。由于第49、50、51個(gè)坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)為1,其余坐標(biāo)點(diǎn)上投 影得到像素點(diǎn)的個(gè)數(shù)為0,則X軸上各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度為fm = 0+ α = l,m= 1,2,3......100,m 乒 49,50,51 ;f49 = 1+ α =2 ; f50 = 1+α =2 ; f51 = 1+α = 2 ;該手寫軌跡上像素點(diǎn)在Y軸上的第1至第100個(gè)坐標(biāo)點(diǎn)上均有投影,且每個(gè)坐標(biāo) 點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)為1,則Y軸上各個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度為
8
gm = l+α = 2,η = 1,2,3......100 ;步驟205,依次計(jì)算X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度,以及Y軸上各個(gè)點(diǎn)對應(yīng)的 縱向歸一密度;X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度為H1 = f! = 1 ;H2 = H^f2 = 2 ;H3 = H2+f3 = 3 ;......H47 = H46+f47 = 47 ;H48 = H47+f48
=48 ;H49 = H48+f49 = 48+2 = 50 ;H50 = H49+f50 = 50+2 = 52 ;H51 = H50+f51 = 52+2 = 54 ;H52 = H51+f51 = 55 ;H53 = H52+f53 = 56 ;......H99 = H98+f99 = 102 ;H100 = H99+f100
=103 ;即 H[1 100] = {1,2,3,......47,48,50,52,54,55,56,......101,102,103}。Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度為V1 = gl = 2 ;V2 = V^g2 = 4 ;V3 = V2+g3 = 6 ;......V48 = V47+g48 = 96 ;V50 = V49+g50 = 100 ;......V99 = V98+f99 = 198 ;V100 = V99+f100 = 200 ;即 V[1 100] = {2,4,6,...... 100...... 196,198,200}。步驟206,依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y。在本發(fā)明實(shí)施例二中,假設(shè)非線性歸一化后正方形的大小為250X250,即寬度和 高度均為250。則a、b、c三個(gè)像素點(diǎn)歸一化后新的坐標(biāo)為X (49,100) = 250 X (H49-H1) /H100 = 250 X (50-1)/103 = 119 ;Y (49,100) = 250 X (V100-V1) /V100 = 250 X (200-2)/200 = 248 ;X (50,50) = 250 X (H50-H1) /H100 = 250 X (52-1)/103 = 124 ;Y (50,50) = 250 X (V50-V1) /V100 = 250 X (100-2)/200 = 123 ;X (51,1) = 250 X (H51-H1) /H100 = 250 X (54-1)/103 = 129 ;Y (51,1) = 250 X (V1-V1) /V100 = 250 X (2-2)/200 = 0 ;則(X,Y)a = (119,248) ; (X, Y)b = (124,123) ; (X, Y)c = (129,0) 由上述a、b、c三個(gè)點(diǎn)構(gòu)成新的文字軌跡。如圖3(b)所示,為圖3(a)所示的手寫 軌跡經(jīng)本發(fā)明實(shí)施例二所述的方法得到的文字軌跡。若不采用本發(fā)明實(shí)施例所述,直接在外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各 個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,則,按照外接矩形的寬度在X軸上從(1,0)點(diǎn)開始 依次取得3個(gè)坐標(biāo)點(diǎn);按照外接矩形的高度在Y軸上從(0,1)點(diǎn)開始依次取得100個(gè)坐標(biāo)點(diǎn)。該手寫軌跡上像素點(diǎn)在X軸上的第1至第3個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度為fm = 1+α = 2, m = 1,2,3 ;該手寫軌跡上像素點(diǎn)在Y軸上的第1至第100個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度為gm =1+α = 2, η = 1,2,3......100 ;進(jìn)一步,依次計(jì)算X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度,以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱 向歸一密度;X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度為H1 = fi = 2 ;H2 = H^f2 = 4 ;H3 = H2+f3 = 6 ;即 H[1 3] = {2,4,6}。Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度為
V[1 100] = {2,4,6,...... 100...... 196,198,200}。則a、b、c三個(gè)像素點(diǎn)歸一化后新的坐標(biāo)為X(l, 100) = 250X (HfH1)M3 = 250X (2-2)/6 = 0 ;Y(l, 100) = 250X (V100-V1)/V100 = 250X (200-2)/200 = 248 ;X (2,50) = 250 X (H2-H1) /H6 = 250 X (4-2) /6 = 83 ;Y (2,50) = 250 X (V50-V1) /V100 = 250 X (100—2)/200 = 123 ;X(3,1) = 250X (H3-H1)/H6 = 250X (6-2)/6 = 167 ;Y(3,1) = 250X (V1-V1)/V100 = 250X (2-2)/200 = 0 ;貝Ij(X, Y)a = (0,248) ; (X, Y)b = (83,123) ; (X,Y)C= (167,0)。由上述a、b、c三個(gè)點(diǎn)構(gòu)成新的文字軌跡。如圖3(c)所示,為圖3(a)所示的手寫 軌跡在不做外接矩形的擴(kuò)大后進(jìn)行點(diǎn)密度非線性歸一化后得到的文字軌跡??梢钥闯?,該 軌跡不再保持原有手寫軌跡的特征,原有的傾斜角度差異被放大,產(chǎn)生了嚴(yán)重的變形。如圖4(a)所示,為手寫軌跡“一”的非線性歸一化識別結(jié)果對比示意圖;其中,圖 4(a)為用戶輸入的手寫軌跡“一”的軌跡示意圖,該軌跡不是嚴(yán)格意義上的水平,而是向右 上略有傾斜。如圖4(b)所示,為圖4(a)所示的手寫軌跡經(jīng)本發(fā)明所述點(diǎn)密度非線性歸一 化后得到的文字軌跡。如圖4(c)所示,為圖4(a)所示的手寫軌跡在不做外接矩形的擴(kuò)大 后進(jìn)行點(diǎn)密度非線性歸一化后得到的文字軌跡。同樣可以看出,在手寫軌跡的外接矩形寬 高差距較大時(shí),采用現(xiàn)有技術(shù)的方法,可產(chǎn)生較大的形變,而利用本發(fā)明提出的方法,則能 夠保持原有軌跡的特征。需要說明的是,上述實(shí)施例中僅給出一種簡單示例,在具體實(shí)施時(shí),需要同時(shí)將一 個(gè)單字的所有手寫軌跡進(jìn)行非線性歸一化處理,即,獲取整個(gè)文字對應(yīng)的手寫軌跡的外接 矩形??梢岳斫獾氖?,若外接矩形的寬高比不在預(yù)置比值范圍之內(nèi),直接進(jìn)行歸一化處 理的方法與擴(kuò)大為正方形再進(jìn)行歸一化處理的方法類似,不同的是,此時(shí)坐標(biāo)軸上兩端處 的坐標(biāo)點(diǎn)投影到的像素點(diǎn)的個(gè)數(shù)不再為零,具體示例此處不再贅述。參照圖5,示出了本發(fā)明一種點(diǎn)密度非線性歸一化文字識別裝置實(shí)施例的結(jié)構(gòu)圖, 包括外接矩形獲取單元501,用于針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌 跡的外接矩形;寬高比判斷單元502,用于判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi); 若是,則觸發(fā)矩形擴(kuò)大單元;若否,則觸發(fā)非線性歸一化單元;外接矩形擴(kuò)大單元503,用于將外接矩形擴(kuò)大為正方形,并觸發(fā)非線性歸一化單 元;非線性歸一化單元504,用于在正方形或外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡 的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。進(jìn)一步,所述非線性歸一化單元包括點(diǎn)密度計(jì)算子單元,用于將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X 軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm,以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ;其中,按照 正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn),按照正方形或外接矩形的高度在Y
10軸上依次取N個(gè)坐標(biāo)點(diǎn);m= 1,2,3......M ;n = 1,2,3......N;歸一密度計(jì)算子單元,用于依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密 度民,以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度Vn;其中,Hm = f\+f2+......+fm;Vn =
gl+g2+......+gn ;歸一坐標(biāo)計(jì)算子單元,用于依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X 和縱坐標(biāo) Y ;其中,X (m,n) = W1 (Hm-H1) /Hm ;Y (m, η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化 后正方形的寬度和高度。在本發(fā)明一個(gè)優(yōu)選實(shí)施例中,所述正方形或外接矩形的左下頂點(diǎn)位于二維坐標(biāo)平 面上的(1,1)點(diǎn);則按照正方形或外接矩形的寬度在X軸上從(1,0)點(diǎn)開始依次取M個(gè)坐 標(biāo)點(diǎn);按照正方形或外接矩形的高度在Y軸上從(0,1)點(diǎn)開始依次取N個(gè)坐標(biāo)點(diǎn)。優(yōu)選的,所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù);其中,所 述密度系數(shù)的取值范圍為1 2。在本發(fā)明的優(yōu)選實(shí)施例中,所述預(yù)置比值的范圍為大于等于第一預(yù)置比值,以及 小于等于第二預(yù)置比值;其中,所述第一預(yù)置比值的范圍為2 3,所述第二預(yù)置比值的范 圍為0. 5 0. 333。進(jìn)一步,在具體實(shí)施時(shí),將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高 比大于等于第一預(yù)置比值時(shí),外接矩形的寬度不變,高度增大至與寬度等值;當(dāng)所述外接矩 形的寬高比小于等于第一預(yù)置比值時(shí),外接矩形的高度不變,寬度增大至與高度等值。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與 其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對于裝置實(shí)施例 而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部 分說明即可。以上對本發(fā)明所提供的一種點(diǎn)密度非線性歸一化文字識別方法和裝置,進(jìn)行了詳 細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說 明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù) 本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不 應(yīng)理解為對本發(fā)明的限制。
1權(quán)利要求
一種點(diǎn)密度非線性歸一化文字識別方法,其特征在于,包括針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌跡的外接矩形;判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi);若是,則將外接矩形擴(kuò)大為正方形,并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo);若否,則直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。
2.如權(quán)利要求1所述的方法,其特征在于,所述點(diǎn)密度非線性歸一化處理包括將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn) 密度fm,以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ;其中,按照正方形或外接矩形的寬度在 X軸上依次取M個(gè)坐標(biāo)點(diǎn),按照正方形或外接矩形的高度在Y軸上依次取N個(gè)坐標(biāo)點(diǎn);m =1,2,3......M ;η = 1,2,3......N ;依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm,以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度 Vn ;其中,Hm = f!+f2+......+fm ;Vn = gl+g2+......+gn;依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y;其中,X(m, η)= W1 (Hm-H1) /Hm ;Y (m, η) = W2 (Vn-V1) /Vn 和W2為非線性歸一化后正方形的寬度和高度。
3.如權(quán)利要求2所述的方法,其特征在于,正方形或外接矩形的左下頂點(diǎn)位于二維坐標(biāo)平面上的(1,1)點(diǎn); 則按照正方形或外接矩形的寬度在X軸上從(1,0)點(diǎn)開始依次取M個(gè)坐標(biāo)點(diǎn);按照正 方形或外接矩形的高度在Y軸上從(0,1)點(diǎn)開始依次取N個(gè)坐標(biāo)點(diǎn)。
4.如權(quán)利要求2所述的方法,其特征在于,所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù); 其中,所述密度系數(shù)的取值范圍為1 2。
5.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)置比值的范圍為大于等于第一預(yù)置比值,以及小于等于第二預(yù)置比值; 其中,所述第一預(yù)置比值的范圍為2 3,所述第二預(yù)置比值的范圍為0. 5 0. 333。
6.如權(quán)利要求5所述的方法,其特征在于,將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一預(yù)置比值時(shí),外接矩形的寬度不變,高度增大 至與寬度等值;當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí),外接矩形的高度不變,寬度增大 至與高度等值。
7.一種點(diǎn)密度非線性歸一化文字識別裝置,其特征在于,包括外接矩形獲取單元,用于針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌跡的外 接矩形;寬高比判斷單元,用于判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi);若是,則 觸發(fā)矩形擴(kuò)大單元;若否,則觸發(fā)非線性歸一化單元;矩形擴(kuò)大單元,用于將外接矩形擴(kuò)大為正方形,并觸發(fā)非線性歸一化單元; 非線性歸一化單元,用于在正方形或外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像 素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。
8.如權(quán)利要求7所述的裝置,其特征在于,所述非線性歸一化單元包括點(diǎn)密度計(jì)算子單元,用于將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影,計(jì)算X軸上 投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm,以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ;其中,按照正方 形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn),按照正方形或外接矩形的高度在Y軸上 依次取 N 個(gè)坐標(biāo)點(diǎn);m= 1,2,3......M;n = 1,2,3......N ;歸一密度計(jì)算子單元,用于依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm,以及Y 軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度Vn ;其中,Hm = f\+f2+......+fm ;Vn = gl+g2+......+gn;歸一坐標(biāo)計(jì)算子單元,用于依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱 坐標(biāo) Y ;其中,X (m,η) = W1 (Hm-H1) /Hm ;Y (m,η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化后正 方形的寬度和高度。
9.如權(quán)利要求8所述的裝置,其特征在于,所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù);其中,所述密度系數(shù)的取值范圍為1 2。
10.如權(quán)利要求7所述的裝置,其特征在于,所述預(yù)置比值的范圍為大于等于第一預(yù)置比值,以及小于等于第二預(yù)置比值;其中,所述第一預(yù)置比值的范圍為2 3,所述第二預(yù)置比值的范圍為0. 5 0. 333。
全文摘要
本發(fā)明提供了一種點(diǎn)密度非線性歸一化文字識別方法和裝置,所述方法包括針對用戶輸入的當(dāng)前文字的手寫軌跡,獲取該手寫軌跡的外接矩形;判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi);若是,則將外接矩形擴(kuò)大為正方形,并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo);若否,則直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理,獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。通過本發(fā)明能夠減少文字識別中的變形、失真,提高識別的可靠性。
文檔編號G06F3/041GK101901075SQ201010219460
公開日2010年12月1日 申請日期2010年6月25日 優(yōu)先權(quán)日2010年6月25日
發(fā)明者張連毅, 李健, 武衛(wèi)東 申請人:北京捷通華聲語音技術(shù)有限公司