一種點(diǎn)密度非線性歸一化文字識別方法和裝置的制作方法

文檔序號：6605421閱讀：286來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種點(diǎn)密度非線性歸一化文字識別方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及手寫識別技術(shù)領(lǐng)域，特別是涉及一種點(diǎn)密度非線性歸一化文字識別方法和裝置。
背景技術(shù)：
在手寫識別中，需要對用戶輸入的漢字進(jìn)行預(yù)處理，由于字符大小不一，為了便于提取字符特征，需要對樣本進(jìn)行大小歸一化。歸一化可分為線性歸一化和非線性歸一化兩種方法。線性歸一化就是將文字圖像按照一定的比例系數(shù)線性放大或縮小，其中X方向和 Y方向的比例系數(shù)可以相同也可以不同。一般的做法是將每一個(gè)字符塊調(diào)節(jié)到一個(gè)正方形內(nèi)，即先用一個(gè)框?qū)⒆址麎K圍起來，然后將方框拉伸為正方形，此方法主要是基于漢字為方塊字的假設(shè)。這種方法采用的算法簡單、失真較小，但是無法調(diào)整手寫漢字的中心位置和筆劃密度?！叭恕笔且粋€(gè)標(biāo)準(zhǔn)的方塊漢字，一般而言不同的兩個(gè)人書寫出的這個(gè)漢字只有大小之分，在做完線性歸一化將字符歸一化到相同尺寸，比如說100*100的范圍，從ζ軸上看它們的重合程度非常大，用一個(gè)非常簡單的判別算法也能夠判斷出這兩個(gè)字是非常相似的。不同人的書寫習(xí)慣不同，有的人寫得胖，有的人寫的瘦，經(jīng)線性歸一化后，仍然可以看到很大的重合度。但有些人寫字非常拖，一捺拉得很長，一撇只能占到整個(gè)字符的三分之一寬度，這時(shí)如果經(jīng)采用線性歸一化，再從ζ軸上看，就會發(fā)現(xiàn)只有一撇的收筆部分會有些重合。為了解決這個(gè)問題，可以采用基于點(diǎn)密度的非線性歸一化算法。非線性歸一化強(qiáng)調(diào)按照手寫漢字的特征分布來處理，它是在一個(gè)二維平面上，沿著X軸和y軸分別計(jì)算每個(gè)坐標(biāo)點(diǎn)上的點(diǎn)密度，然后利用映射函數(shù)，可以計(jì)算原坐標(biāo)(X，y) 在平面上新的坐標(biāo)點(diǎn)(χ’，y’)。這種點(diǎn)密度的非線性歸一化算法，能夠一定程度上消除不同人，不同時(shí)間，不同設(shè)備環(huán)境下書寫出的相同漢字的變形，從而為識別算法減輕壓力。但在非線性歸一化方法也會帶來漢字的變形問題。比如“ I，，“一”等非標(biāo)準(zhǔn)的方塊字符，如果是嚴(yán)格的印刷體漢字，經(jīng)非線性歸一化算法，得到的仍是豎或者橫。但是在手寫識別中，由于用戶手寫軌跡不規(guī)則，那么，在豎和橫稍有傾斜的情況下，“ I ”經(jīng)非線性歸一化后得到的是撇或者捺，“一”經(jīng)非線性歸一化得到的則是提或者捺。又如，撇和捺等非標(biāo)準(zhǔn) 的方塊漢字，經(jīng)非線性歸一化后得到的是嚴(yán)格意義上45°或者135°傾斜的撇或者捺，原有的傾斜角度差異不再出現(xiàn)。此外，又如“日”等漢字，經(jīng)非線性歸一化得到的是一個(gè)滿格的“曰”字，最后識別時(shí)將無法區(qū)分“日，，和“曰”。總之，需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是如何能夠提供一種文字識別技術(shù)，可以減少文字的變形失真，提高識別的可靠性。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種點(diǎn)密度非線性歸一化文字識別方法和裝置，能夠減少文字的變形、失真，提高識別的可靠性。
為了解決上述問題，本發(fā)明公開了一種點(diǎn)密度非線性歸一化文字識別方法，包括針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則將外接矩形擴(kuò)大為正方形，并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)；若否，則直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn) 密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。進(jìn)一步，所述點(diǎn)密度非線性歸一化處理包括將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn) 的點(diǎn)密度fm，以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ；其中，按照正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn)，按照正方形或外接矩形的高度在Y軸上依次取N個(gè)坐標(biāo)點(diǎn)； m = 1,2,3......M ；η = 1,2,3......N ；依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm，以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度 Vn ；其中，Hm = f\+f2+......+fffl ;Vn = gl+g2+......+gn；依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y ；其中，X(m，n)= W1 (Hm-H1) /Hm ；Y (m, n) = W2 (Vn-V1) /Vn 和W2為非線性歸一化后正方形的寬度和高度。優(yōu)選的，正方形或外接矩形的左下頂點(diǎn)位于二維坐標(biāo)平面上的(1，1)點(diǎn)；則按照正方形或外接矩形的寬度在X軸上從(1，0)點(diǎn)開始依次取M個(gè)坐標(biāo)點(diǎn)；按照正方形或外接矩形的高度在Y軸上從(0，1)點(diǎn)開始依次取N個(gè)坐標(biāo)點(diǎn)。優(yōu)選的，所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù)；其中，所述密度系數(shù)的取值范圍為1 2。優(yōu)選的，所述預(yù)置比值的范圍為大于等于第一預(yù)置比值，以及小于等于第二預(yù)置比值；其中，所述第一預(yù)置比值的范圍為2 3，所述第二預(yù)置比值的范圍為0. 5 0. 333。進(jìn)一步，將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一預(yù)置比值時(shí)，外接矩形的寬度不變，高度增大至與寬度等值；當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí)，外接矩形的高度不變，寬度增大至與高度等值。此外，本發(fā)明還公開了一種點(diǎn)密度非線性歸一化文字識別裝置，包括外接矩形獲取單元，用于針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；寬高比判斷單元，用于判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則觸發(fā)矩形擴(kuò)大單元；若否，則觸發(fā)非線性歸一化單元；矩形擴(kuò)大單元，用于將外接矩形擴(kuò)大為正方形，并觸發(fā)非線性歸一化單元；非線性歸一化單元，用于在正方形或外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。進(jìn)一步，所述非線性歸一化單元包括點(diǎn)密度計(jì)算子單元，用于將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm，以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ；其中，按照正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn)，按照正方形或外接矩形的高度在Y 軸上依次取N個(gè)坐標(biāo)點(diǎn)；m= 1，2，3......M;n = 1,2,3......N ；歸一密度計(jì)算子單元，用于依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度民，以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度Vn;其中，Hm = f\+f2+......+fm;Vn =
gl+g2+......+gn ；歸一坐標(biāo)計(jì)算子單元，用于依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X 和縱坐標(biāo) Y ；其中，X (m，n) = W1 (Hm-H1) /Hm ；Y (m, η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化后正方形的寬度和高度。優(yōu)選的，所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù)；其中，所述密度系數(shù)的取值范圍為1 2。優(yōu)選的，所述預(yù)置比值的范圍為大于等于第一預(yù)置比值，以及小于等于第二預(yù)置比值；其中，所述第一預(yù)置比值的范圍為2 3，所述第二預(yù)置比值的范圍為0. 5 0. 333。與現(xiàn)有技術(shù)相比，本發(fā)明具有以下優(yōu)點(diǎn)本發(fā)明獲得當(dāng)前文字的手寫軌跡的外接矩形后，不同于現(xiàn)有技術(shù)，直接在手寫軌跡的外接矩形框內(nèi)對各個(gè)像素點(diǎn)進(jìn)行非線性歸一化處理，而是計(jì)算該外接矩形的寬高比，以寬高比作為判斷條件，執(zhí)行不同的操作步驟當(dāng)寬高比不在預(yù)置比值范圍之內(nèi)時(shí)，該手寫軌跡的寬度和高度相差不大，則直接進(jìn)行點(diǎn)密度非線性歸一化處理，漢字的形變較小，不會對識別效果產(chǎn)生影響；當(dāng)寬高比在預(yù)置比值范圍之內(nèi)時(shí)，該手寫軌跡的寬度和高度相差較大，若直接進(jìn)行點(diǎn)密度非線性歸一化處理，則會產(chǎn)生較大的形變，嚴(yán)重影響識別結(jié)果，則本發(fā)明先將外接矩形擴(kuò)大為正方形，然后再在該正方形內(nèi)進(jìn)行點(diǎn)密度非線性歸一化處理，從而使歸一后漢字產(chǎn)生較小的形變?？傊?，通過本發(fā)明提出的方法，在點(diǎn)密度非線性歸一化處理后，減少了文字軌跡的變形、失真，提高文字識別的可靠性。

圖1是本發(fā)明一種點(diǎn)密度非線性歸一化文字識別方法實(shí)施例一的流程圖；圖2是本發(fā)明一種點(diǎn)密度非線性歸一化文字識別方法實(shí)施例二的流程圖；圖3是手寫軌跡“ I，，的點(diǎn)密度非線性歸一化識別結(jié)果對比示意圖；圖4是手寫軌跡“一”的點(diǎn)密度非線性歸一化識別結(jié)果對比示意圖；圖5是本發(fā)明一種點(diǎn)密度非線性歸一化文字識別裝置實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂，下面結(jié)合附圖和具體實(shí) 施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。參照圖1，示出了本發(fā)明一種非線性歸一化文字識別方法實(shí)施例一的流程圖，包括步驟101，針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；所述外接矩形的寬為水平，高為豎直。具體的，分別在該手寫軌跡的左邊界點(diǎn)和右
6邊界點(diǎn)上做豎直的直線，分別在該手寫軌跡的上邊界點(diǎn)和下邊界點(diǎn)上作水平的直線，四條直線圍成的區(qū)域即該手寫軌跡的外接矩形。步驟102，判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則執(zhí)行步驟103 ；若否，則執(zhí)行步驟104;不同于現(xiàn)有技術(shù)，直接在手寫軌跡的外接矩形框內(nèi)對各個(gè)像素點(diǎn)進(jìn)行非線性歸一化處理，本發(fā)明需要計(jì)算該外接矩形的寬高比，當(dāng)寬高比不同時(shí)，執(zhí)行不同的操作步驟。進(jìn)一步，所述預(yù)置比值的范圍為大于等于第一預(yù)置比值，以及小于等于第二預(yù)置比值；其中，所述第一預(yù)置比值的范圍為2 3，所述第二預(yù)置比值的范圍為0. 5 0. 333。步驟103，將外接矩形擴(kuò)大為正方形，并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)；其中，將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一預(yù)置比值時(shí)，也即外接矩形為寬大于高的矩形，則外接矩形的寬度不變，高度以原中線為中心上下增大至與寬度等值；當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí)，也即外接矩形為寬小于高的矩形，則外接矩形的高度不變，寬度以原中線為中心左右增大至與高度等值。步驟104，直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。本發(fā)明實(shí)施例以寬高比作為判斷條件，當(dāng)寬高比不在預(yù)置比值范圍之內(nèi)時(shí)，則直接進(jìn)行點(diǎn)密度非線性歸一化處理，由于此時(shí)該手寫軌跡的寬度和高度相差不大，漢字的形變較小，不會對識別效果產(chǎn)生影響；當(dāng)寬高比在預(yù)置比值范圍之內(nèi)時(shí)，該手寫軌跡的寬度和高度相差較大，若直接進(jìn)行點(diǎn)密度非線性歸一化處理，則會產(chǎn)生較大的形變，嚴(yán)重影響識別結(jié)果，本發(fā)明創(chuàng)造性的先將外接矩形擴(kuò)大為正方形，然后再在該正方形內(nèi)進(jìn)行點(diǎn)密度非線性歸一化處理，從而使歸一后漢字產(chǎn)生較小的形變，提高了文字識別的可靠性。具體的，步驟103和步驟104中所述點(diǎn)密度非線性歸一化處理包括如下子步驟子步驟Al，將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm，以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ；其中，按照正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn)，按照正方形或外接矩形的高度在Y軸上依次取 N 個(gè)坐標(biāo)點(diǎn)；m = 1，2，3......M ;n = 1,2,3......N ；貝IJ，fm為X軸上第m個(gè)坐標(biāo)點(diǎn)對應(yīng)的點(diǎn)密度；gn為Y軸上第η個(gè)坐標(biāo)點(diǎn)對應(yīng)的點(diǎn) 密度。一般的，點(diǎn)密度可以是坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)。在本發(fā)明的優(yōu)選實(shí)施例中，為了保證歸一化的精確度，所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù)；其中，所述密度系數(shù)的取值范圍為1 2。子步驟Α2，依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm，以及Y軸上各個(gè) 點(diǎn)對應(yīng)的縱向歸一密度Vn ；其中，Hm = f!+f2+......+fm ;Vn = gl+g2+......+gn；也就是說，X軸上第m個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm為第1至第m個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度的累加和；Y軸上第η個(gè)坐標(biāo)點(diǎn)對應(yīng)的縱向歸一密度Vn為第1至第η個(gè)坐標(biāo)點(diǎn)的點(diǎn) 密度的累加和。子步驟A3，依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y ；其中，X(m，n) = W1 (Hm-H1) /Hm ；Y(m, η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化后正方形的寬
7度和高度。本步驟最終獲得原像素點(diǎn)經(jīng)歸一化后坐標(biāo)平面上新的坐標(biāo)(X，Y)，X(m, η)為與X 軸第m個(gè)坐標(biāo)點(diǎn)以及Y軸第η個(gè)坐標(biāo)點(diǎn)對應(yīng)投影的原像素點(diǎn)的新的橫坐標(biāo)，H1為X軸上第1 個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度，Hm為X軸上第M個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度；Y(m，η)為與X軸第m個(gè)坐標(biāo)點(diǎn)以及Y軸第η個(gè)坐標(biāo)點(diǎn)對應(yīng)投影的原像素點(diǎn)的新的縱坐標(biāo)，V1為Y軸上第1個(gè)坐標(biāo)點(diǎn)對應(yīng)的縱向歸一密度，Vn為Y軸上第N個(gè)坐標(biāo)點(diǎn)對應(yīng)的縱向歸一密度。最后，根據(jù)各個(gè)像素點(diǎn)的新的坐標(biāo)，即可獲得最終非線性歸一化后的文字。需要說明的是，一般巧和^的取值相同，則歸一化后的文字位于正方形內(nèi)。此外，通常將手寫軌跡置于擴(kuò)大后的正方形中心，即，將原外接矩形的中心位于擴(kuò)大后的正方形的中心上，此時(shí)，經(jīng)非線性歸一化后的文字位于正方形的中心。下面，舉一個(gè)具體的例子對本發(fā)明進(jìn)行詳細(xì)說明，本發(fā)明實(shí)施例中，以用戶輸入的 “ I ”作為示例。參見圖2，為本發(fā)明一種點(diǎn)密度非線性歸一化文字識別方法實(shí)施例二的流程圖，具體的，該方法包括步驟201，針對用戶輸入的手寫軌跡，獲取該手寫軌跡的外接矩形；如圖3所示，為手寫軌跡“ I ”的點(diǎn)密度非線性歸一化識別結(jié)果對比示意圖。其中，圖3(a)所示，為用戶輸入的手寫軌跡“|”的軌跡示意圖，從圖3(a)中可以看出，該軌跡不是嚴(yán)格意義上的豎直，而是向右下略有傾斜。步驟202，判斷得到所述外接矩形的寬高比位于預(yù)置比值范圍之內(nèi)；計(jì)算得到該外接矩形的寬高比為3 100 = 0.03。在本發(fā)明實(shí)施例中，所述預(yù)置比值的范圍為大于等于2，以及小于等于0. 5，則判斷所述外接矩形的寬高比位于預(yù)置比值范圍之內(nèi)。步驟203，將外接矩形擴(kuò)大為正方形，使得外接矩形的高度不變，寬度增大至與高度等值；本發(fā)明實(shí)施例中，將寬度增大至100。步驟204，將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X軸上各個(gè)坐標(biāo) 點(diǎn)投影得到的點(diǎn)密度fm，以及Y軸上各個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度gn ；需要說明的是，手寫軌跡進(jìn)行投影時(shí)，通常將所述正方形或外接矩形置于坐標(biāo)平面的第一象限，在本發(fā)明的優(yōu)選是實(shí)施例中，為了方便計(jì)算，將擴(kuò)大后的正方形的左下頂點(diǎn) 位于二維坐標(biāo)平面上的(1，1)點(diǎn)；則按照正方形或外接矩形的寬度在X軸上從(1，0)點(diǎn)開始依次取M個(gè)坐標(biāo)點(diǎn)；按照正方形或外接矩形的高度在Y軸上從(0，1)點(diǎn)開始依次取N個(gè) 坐標(biāo)點(diǎn)，本發(fā)明實(shí)施例中，所述M取值為100，N取值為100;進(jìn)一步，密度系數(shù)α取值為1。在該手寫軌跡上取a、b、c三個(gè)像素點(diǎn)，如圖3(a)所示，其對應(yīng)在X軸上的三個(gè)坐標(biāo)點(diǎn)上有投影，a點(diǎn)對應(yīng)X軸上第49個(gè)坐標(biāo)點(diǎn)、b對應(yīng)X軸上第50個(gè)坐標(biāo)點(diǎn)、c對應(yīng)X軸上第51個(gè)坐標(biāo)點(diǎn)。由于第49、50、51個(gè)坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)為1，其余坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)為0，則X軸上各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度為fm = 0+ α = l,m= 1,2,3......100，m 乒 49，50，51 ；f49 = 1+ α =2 ； f50 = 1+α =2 ； f51 = 1+α = 2 ；該手寫軌跡上像素點(diǎn)在Y軸上的第1至第100個(gè)坐標(biāo)點(diǎn)上均有投影，且每個(gè)坐標(biāo) 點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)為1，則Y軸上各個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度為
8
gm = l+α = 2，η = 1，2，3......100 ；步驟205，依次計(jì)算X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度，以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度；X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度為H1 = f！ = 1 ;H2 = H^f2 = 2 ;H3 = H2+f3 = 3 ；......H47 = H46+f47 = 47 ；H48 = H47+f48
=48 ；H49 = H48+f49 = 48+2 = 50 ；H50 = H49+f50 = 50+2 = 52 ；H51 = H50+f51 = 52+2 = 54 ；H52 = H51+f51 = 55 ；H53 = H52+f53 = 56 ；......H99 = H98+f99 = 102 ；H100 = H99+f100
=103 ；即 H[1 100] = {1,2,3,......47，48，50，52，54，55，56，......101，102，103}。Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度為V1 = gl = 2 ;V2 = V^g2 = 4 ;V3 = V2+g3 = 6 ；......V48 = V47+g48 = 96 ；V50 = V49+g50 = 100 ；......V99 = V98+f99 = 198 ；V100 = V99+f100 = 200 ；即 V[1 100] = {2,4,6,...... 100...... 196，198，200}。步驟206，依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y。在本發(fā)明實(shí)施例二中，假設(shè)非線性歸一化后正方形的大小為250X250，即寬度和高度均為250。則a、b、c三個(gè)像素點(diǎn)歸一化后新的坐標(biāo)為X (49，100) = 250 X (H49-H1) /H100 = 250 X (50-1)/103 = 119 ；Y (49，100) = 250 X (V100-V1) /V100 = 250 X (200-2)/200 = 248 ；X (50，50) = 250 X (H50-H1) /H100 = 250 X (52-1)/103 = 124 ；Y (50，50) = 250 X (V50-V1) /V100 = 250 X (100-2)/200 = 123 ；X (51,1) = 250 X (H51-H1) /H100 = 250 X (54-1)/103 = 129 ；Y (51,1) = 250 X (V1-V1) /V100 = 250 X (2-2)/200 = 0 ；則(X,Y)a = (119，248) ； (X, Y)b = (124，123) ； (X, Y)c = (129,0) 由上述a、b、c三個(gè)點(diǎn)構(gòu)成新的文字軌跡。如圖3(b)所示，為圖3(a)所示的手寫軌跡經(jīng)本發(fā)明實(shí)施例二所述的方法得到的文字軌跡。若不采用本發(fā)明實(shí)施例所述，直接在外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，則，按照外接矩形的寬度在X軸上從(1，0)點(diǎn)開始依次取得3個(gè)坐標(biāo)點(diǎn)；按照外接矩形的高度在Y軸上從(0，1)點(diǎn)開始依次取得100個(gè)坐標(biāo)點(diǎn)。該手寫軌跡上像素點(diǎn)在X軸上的第1至第3個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度為fm = 1+α = 2, m = 1,2,3 ；該手寫軌跡上像素點(diǎn)在Y軸上的第1至第100個(gè)坐標(biāo)點(diǎn)投影得到的點(diǎn)密度為gm =1+α = 2, η = 1,2,3......100 ；進(jìn)一步，依次計(jì)算X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度，以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度；X軸上各個(gè)點(diǎn)對應(yīng)的橫向歸一密度為H1 = fi = 2 ；H2 = H^f2 = 4 ;H3 = H2+f3 = 6 ；即 H[1 3] = {2,4,6}。Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度為
V[1 100] = {2,4,6,...... 100...... 196，198，200}。則a、b、c三個(gè)像素點(diǎn)歸一化后新的坐標(biāo)為X(l, 100) = 250X (HfH1)M3 = 250X (2-2)/6 = 0 ；Y(l, 100) = 250X (V100-V1)/V100 = 250X (200-2)/200 = 248 ；X (2，50) = 250 X (H2-H1) /H6 = 250 X (4-2) /6 = 83 ；Y (2，50) = 250 X (V50-V1) /V100 = 250 X (100—2)/200 = 123 ；X(3,1) = 250X (H3-H1)/H6 = 250X (6-2)/6 = 167 ；Y(3,1) = 250X (V1-V1)/V100 = 250X (2-2)/200 = 0 ；貝Ij(X, Y)a = (0,248) ； (X, Y)b = (83，123) ； (X，Y)C= (167，0)。由上述a、b、c三個(gè)點(diǎn)構(gòu)成新的文字軌跡。如圖3(c)所示，為圖3(a)所示的手寫軌跡在不做外接矩形的擴(kuò)大后進(jìn)行點(diǎn)密度非線性歸一化后得到的文字軌跡?？梢钥闯?，該軌跡不再保持原有手寫軌跡的特征，原有的傾斜角度差異被放大，產(chǎn)生了嚴(yán)重的變形。如圖4(a)所示，為手寫軌跡“一”的非線性歸一化識別結(jié)果對比示意圖；其中，圖 4(a)為用戶輸入的手寫軌跡“一”的軌跡示意圖，該軌跡不是嚴(yán)格意義上的水平，而是向右上略有傾斜。如圖4(b)所示，為圖4(a)所示的手寫軌跡經(jīng)本發(fā)明所述點(diǎn)密度非線性歸一化后得到的文字軌跡。如圖4(c)所示，為圖4(a)所示的手寫軌跡在不做外接矩形的擴(kuò)大后進(jìn)行點(diǎn)密度非線性歸一化后得到的文字軌跡。同樣可以看出，在手寫軌跡的外接矩形寬高差距較大時(shí)，采用現(xiàn)有技術(shù)的方法，可產(chǎn)生較大的形變，而利用本發(fā)明提出的方法，則能夠保持原有軌跡的特征。需要說明的是，上述實(shí)施例中僅給出一種簡單示例，在具體實(shí)施時(shí)，需要同時(shí)將一個(gè)單字的所有手寫軌跡進(jìn)行非線性歸一化處理，即，獲取整個(gè)文字對應(yīng)的手寫軌跡的外接矩形?？梢岳斫獾氖?，若外接矩形的寬高比不在預(yù)置比值范圍之內(nèi)，直接進(jìn)行歸一化處理的方法與擴(kuò)大為正方形再進(jìn)行歸一化處理的方法類似，不同的是，此時(shí)坐標(biāo)軸上兩端處的坐標(biāo)點(diǎn)投影到的像素點(diǎn)的個(gè)數(shù)不再為零，具體示例此處不再贅述。參照圖5，示出了本發(fā)明一種點(diǎn)密度非線性歸一化文字識別裝置實(shí)施例的結(jié)構(gòu)圖，包括外接矩形獲取單元501，用于針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；寬高比判斷單元502，用于判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則觸發(fā)矩形擴(kuò)大單元；若否，則觸發(fā)非線性歸一化單元；外接矩形擴(kuò)大單元503，用于將外接矩形擴(kuò)大為正方形，并觸發(fā)非線性歸一化單元；非線性歸一化單元504，用于在正方形或外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。進(jìn)一步，所述非線性歸一化單元包括點(diǎn)密度計(jì)算子單元，用于將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X 軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm，以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ；其中，按照正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn)，按照正方形或外接矩形的高度在Y
10軸上依次取N個(gè)坐標(biāo)點(diǎn)；m= 1，2，3......M ;n = 1,2,3......N；歸一密度計(jì)算子單元，用于依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度民，以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度Vn;其中，Hm = f\+f2+......+fm;Vn =
gl+g2+......+gn ；歸一坐標(biāo)計(jì)算子單元，用于依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X 和縱坐標(biāo) Y ；其中，X (m，n) = W1 (Hm-H1) /Hm ；Y (m, η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化后正方形的寬度和高度。在本發(fā)明一個(gè)優(yōu)選實(shí)施例中，所述正方形或外接矩形的左下頂點(diǎn)位于二維坐標(biāo)平面上的(1，1)點(diǎn)；則按照正方形或外接矩形的寬度在X軸上從(1，0)點(diǎn)開始依次取M個(gè)坐標(biāo)點(diǎn)；按照正方形或外接矩形的高度在Y軸上從(0，1)點(diǎn)開始依次取N個(gè)坐標(biāo)點(diǎn)。優(yōu)選的，所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù)；其中，所述密度系數(shù)的取值范圍為1 2。在本發(fā)明的優(yōu)選實(shí)施例中，所述預(yù)置比值的范圍為大于等于第一預(yù)置比值，以及小于等于第二預(yù)置比值；其中，所述第一預(yù)置比值的范圍為2 3，所述第二預(yù)置比值的范圍為0. 5 0. 333。進(jìn)一步，在具體實(shí)施時(shí)，將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一預(yù)置比值時(shí)，外接矩形的寬度不變，高度增大至與寬度等值；當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí)，外接矩形的高度不變，寬度增大至與高度等值。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述，每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處，各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對于裝置實(shí)施例而言，由于其與方法實(shí)施例基本相似，所以描述的比較簡單，相關(guān)之處參見方法實(shí)施例的部分說明即可。以上對本發(fā)明所提供的一種點(diǎn)密度非線性歸一化文字識別方法和裝置，進(jìn)行了詳細(xì)介紹，本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述，以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時(shí)，對于本領(lǐng)域的一般技術(shù)人員，依據(jù) 本發(fā)明的思想，在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
1權(quán)利要求
一種點(diǎn)密度非線性歸一化文字識別方法，其特征在于，包括針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則將外接矩形擴(kuò)大為正方形，并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)；若否，則直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。
2.如權(quán)利要求1所述的方法，其特征在于，所述點(diǎn)密度非線性歸一化處理包括將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn) 密度fm，以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ；其中，按照正方形或外接矩形的寬度在 X軸上依次取M個(gè)坐標(biāo)點(diǎn)，按照正方形或外接矩形的高度在Y軸上依次取N個(gè)坐標(biāo)點(diǎn)；m =1,2,3......M ；η = 1,2,3......N ；依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm，以及Y軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度 Vn ；其中，Hm = f!+f2+......+fm ;Vn = gl+g2+......+gn；依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo)Y;其中，X(m, η)= W1 (Hm-H1) /Hm ；Y (m, η) = W2 (Vn-V1) /Vn 和W2為非線性歸一化后正方形的寬度和高度。
3.如權(quán)利要求2所述的方法，其特征在于，正方形或外接矩形的左下頂點(diǎn)位于二維坐標(biāo)平面上的(1，1)點(diǎn)；則按照正方形或外接矩形的寬度在X軸上從(1，0)點(diǎn)開始依次取M個(gè)坐標(biāo)點(diǎn)；按照正方形或外接矩形的高度在Y軸上從(0，1)點(diǎn)開始依次取N個(gè)坐標(biāo)點(diǎn)。
4.如權(quán)利要求2所述的方法，其特征在于，所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù)；其中，所述密度系數(shù)的取值范圍為1 2。
5.如權(quán)利要求1所述的方法，其特征在于，所述預(yù)置比值的范圍為大于等于第一預(yù)置比值，以及小于等于第二預(yù)置比值；其中，所述第一預(yù)置比值的范圍為2 3，所述第二預(yù)置比值的范圍為0. 5 0. 333。
6.如權(quán)利要求5所述的方法，其特征在于，將外接矩形擴(kuò)大為正方形具體為當(dāng)所述外接矩形的寬高比大于等于第一預(yù)置比值時(shí)，外接矩形的寬度不變，高度增大至與寬度等值；當(dāng)所述外接矩形的寬高比小于等于第一預(yù)置比值時(shí)，外接矩形的高度不變，寬度增大至與高度等值。
7.一種點(diǎn)密度非線性歸一化文字識別裝置，其特征在于，包括外接矩形獲取單元，用于針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；寬高比判斷單元，用于判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則觸發(fā)矩形擴(kuò)大單元；若否，則觸發(fā)非線性歸一化單元；矩形擴(kuò)大單元，用于將外接矩形擴(kuò)大為正方形，并觸發(fā)非線性歸一化單元；非線性歸一化單元，用于在正方形或外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。
8.如權(quán)利要求7所述的裝置，其特征在于，所述非線性歸一化單元包括點(diǎn)密度計(jì)算子單元，用于將手寫軌跡的各個(gè)像素點(diǎn)分別向X軸和Y軸投影，計(jì)算X軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度fm，以及Y軸上投影到各個(gè)坐標(biāo)點(diǎn)的點(diǎn)密度gn ；其中，按照正方形或外接矩形的寬度在X軸上依次取M個(gè)坐標(biāo)點(diǎn)，按照正方形或外接矩形的高度在Y軸上依次取 N 個(gè)坐標(biāo)點(diǎn)；m= 1，2，3......M;n = 1,2,3......N ；歸一密度計(jì)算子單元，用于依次計(jì)算X軸上各個(gè)坐標(biāo)點(diǎn)對應(yīng)的橫向歸一密度Hm，以及Y 軸上各個(gè)點(diǎn)對應(yīng)的縱向歸一密度Vn ；其中，Hm = f\+f2+......+fm ;Vn = gl+g2+......+gn；歸一坐標(biāo)計(jì)算子單元，用于依次計(jì)算手寫軌跡的各個(gè)像素點(diǎn)歸一化后的橫坐標(biāo)X和縱坐標(biāo) Y ；其中，X (m，η) = W1 (Hm-H1) /Hm ；Y (m，η) = W2 (Vn-V1) /Vn 和 W2 為非線性歸一化后正方形的寬度和高度。
9.如權(quán)利要求8所述的裝置，其特征在于，所述點(diǎn)密度為坐標(biāo)點(diǎn)上投影得到像素點(diǎn)的個(gè)數(shù)加上密度系數(shù)；其中，所述密度系數(shù)的取值范圍為1 2。
10.如權(quán)利要求7所述的裝置，其特征在于，所述預(yù)置比值的范圍為大于等于第一預(yù)置比值，以及小于等于第二預(yù)置比值；其中，所述第一預(yù)置比值的范圍為2 3，所述第二預(yù)置比值的范圍為0. 5 0. 333。
全文摘要
本發(fā)明提供了一種點(diǎn)密度非線性歸一化文字識別方法和裝置，所述方法包括針對用戶輸入的當(dāng)前文字的手寫軌跡，獲取該手寫軌跡的外接矩形；判斷所述外接矩形的寬高比是否在預(yù)置比值范圍之內(nèi)；若是，則將外接矩形擴(kuò)大為正方形，并在該正方形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)；若否，則直接在所述外接矩形的二維坐標(biāo)平面內(nèi)對手寫軌跡的各個(gè)像素點(diǎn)進(jìn)行點(diǎn)密度非線性歸一化處理，獲得各個(gè)像素點(diǎn)歸一化后的坐標(biāo)。通過本發(fā)明能夠減少文字識別中的變形、失真，提高識別的可靠性。
文檔編號G06F3/041GK101901075SQ201010219460
公開日2010年12月1日申請日期2010年6月25日優(yōu)先權(quán)日2010年6月25日
發(fā)明者張連毅, 李健, 武衛(wèi)東申請人:北京捷通華聲語音技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李健;張連毅;武衛(wèi)東
技術(shù)所有人：北京捷通華聲語音技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：一種改進(jìn)的鼠標(biāo)墊的制作方法
上一篇：一種寫卡裝置及其寫卡方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種點(diǎn)密度非線性歸一化文字識別方法和裝置的制作方法