国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      手寫(xiě)體文字識(shí)別方法

      文檔序號(hào):6405893閱讀:1509來(lái)源:國(guó)知局
      專利名稱:手寫(xiě)體文字識(shí)別方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于文字模式識(shí)別領(lǐng)域,是涉及一種應(yīng)用直線段筆劃特征和直線段筆劃之間相對(duì)位置關(guān)系辨別手寫(xiě)體文字結(jié)構(gòu)特征的識(shí)別技術(shù)。
      目前,文字模式識(shí)別技術(shù)在識(shí)別印刷體文字上已趨實(shí)用化,但在手寫(xiě)體識(shí)別方面尚處于探索階段。由于手寫(xiě)體文字形體變化大,與印刷體的特點(diǎn)恰恰相反,所以印刷體識(shí)別中常用的、有效的方法不可能移植到手寫(xiě)體領(lǐng)域中來(lái)。近幾年來(lái)在手寫(xiě)體識(shí)別研究方面的參考文獻(xiàn)有1 北京工業(yè)大學(xué)的“以筆畫(huà)結(jié)構(gòu)分析為基礎(chǔ)的一種限制性手寫(xiě)漢字識(shí)別方法”(汪慶寶,張征,電子學(xué)報(bào),VOL 15,NO 3,1987年5月),是以漢字筆劃的交叉,包含為主要判決關(guān)系,以相對(duì)位置關(guān)系作為輔助判別關(guān)系,書(shū)寫(xiě)時(shí)不連筆,不潦草。經(jīng)預(yù)學(xué)習(xí)后,對(duì)五百字所作試驗(yàn),達(dá)到96.1%的識(shí)別率。
      2 上??萍即髮W(xué)的“手寫(xiě)體漢字識(shí)別系統(tǒng)”(陶國(guó)軒,計(jì)算機(jī)學(xué)報(bào),1989年11月),應(yīng)用首尾劃特征表示法,加上字形的總體外形特征進(jìn)行識(shí)別。
      3 美國(guó)波士頓東北大學(xué)計(jì)算機(jī)學(xué)院的“手書(shū)體中文字符的分解與識(shí)別”(中文信息,1989年第4期)采用一種數(shù)組語(yǔ)法來(lái)構(gòu)造各種中文字符的分析序列。
      上述文獻(xiàn)介紹的手寫(xiě)體漢字識(shí)別研究,明顯存在下列共同缺點(diǎn)1 提取的特征不很切合字的結(jié)構(gòu)特征。
      2 特征表示復(fù)雜。
      3 抗干擾能力差,識(shí)別率不高。
      本發(fā)明的目的在于研究一種準(zhǔn)確,簡(jiǎn)單的識(shí)別技術(shù),要求書(shū)寫(xiě)限制更少,不需預(yù)學(xué)習(xí)就能識(shí)別手寫(xiě)文字,本發(fā)明著重研究了手寫(xiě)體文字的結(jié)構(gòu)特征,認(rèn)為要提高手寫(xiě)體辨別能力,必須用直線段筆劃特征和直線段筆劃之間的相對(duì)位置關(guān)系來(lái)描述文字結(jié)構(gòu)特征。其主要優(yōu)點(diǎn)有
      1 非常切合文字的結(jié)構(gòu)特征。
      2 特征表示簡(jiǎn)單。
      3 允許一定程度上的連筆和識(shí)錯(cuò)干擾。
      4 只設(shè)一個(gè)標(biāo)準(zhǔn)樣本,不需預(yù)學(xué)習(xí)。

      發(fā)明內(nèi)容
      1 圖象輸入圖象輸入裝置將字稿轉(zhuǎn)化成一幅二值化圖象存儲(chǔ)入圖象存儲(chǔ)器中,待識(shí)別處理裝置從中進(jìn)行識(shí)別處理。圖象輸入裝置可采用任何一種圖文掃描設(shè)備。
      2 直線段筆劃分割自上而下對(duì)象素串掃描并填入該直線段筆劃序號(hào),記下象素串長(zhǎng)度L和始象素坐標(biāo),與鄰接象素串比較,求出象素串長(zhǎng)度增量和始象素位移量D,見(jiàn)圖1。
      當(dāng)象素串長(zhǎng)度增量大于預(yù)定數(shù)時(shí)(如3),繼續(xù)對(duì)鄰接的象素串掃描;當(dāng)象素串長(zhǎng)度增量小于或等于預(yù)定數(shù)時(shí),此時(shí)的象素串長(zhǎng)度和始點(diǎn)位移量分別記做LO和DO。以后繼續(xù)對(duì)鄰接象素串掃描時(shí)是用DO確定掃描上限和用LO確定掃描下限的。當(dāng)由LO、DO限定掃描范圍中的象素串長(zhǎng)度減到零或象素串長(zhǎng)度增量絕對(duì)值由大于預(yù)定數(shù)變?yōu)樾∮陬A(yù)定數(shù)時(shí)結(jié)束該直線段筆劃。
      3 直線段筆劃特征直線段筆劃特征包括了直線段筆劃的長(zhǎng)度、走向和端點(diǎn)位置。
      4 直線段筆劃的走向根據(jù)始象素串的始象素和終象素串的始象素二者的X-Y坐標(biāo)差值從速算表中查出相應(yīng)的距離S和方向值G,見(jiàn)圖2。
      當(dāng)象素串長(zhǎng)度LO>S時(shí),筆劃是豎向。當(dāng)LO<=S時(shí),筆劃走向是G方向。
      5 直線段筆劃的端點(diǎn)直線段筆劃的端點(diǎn)包括了上端點(diǎn)、下端點(diǎn)、左端點(diǎn)、右端點(diǎn)。當(dāng)筆劃是水平和接近水平時(shí),以此筆劃的始象素串的始象素為左端點(diǎn),終象素串的始象素為右端點(diǎn)。當(dāng)筆劃是垂直和接近垂直時(shí),以此筆劃中最上的象素為上端點(diǎn),最下的象素為下端點(diǎn)。同一直線段筆劃上同時(shí)有多個(gè)象素是最上(或最下)時(shí)選取其中最左邊的象素為上端點(diǎn)(或下端點(diǎn))。當(dāng)直線段筆劃是左斜或右斜時(shí),以此筆劃的始象素串的始象素為上端點(diǎn),終象素串的終象素為下端點(diǎn)。
      6 直線段筆劃的長(zhǎng)度以直線段筆劃兩端點(diǎn)的X-Y坐標(biāo)差值查速算表得出。
      7 直線段筆劃之間的相對(duì)位置關(guān)系直線段筆劃之間的相對(duì)位置關(guān)系包括了上、下、左、右、交叉、端接共6種關(guān)系。它們都是選定已識(shí)別過(guò)的直線段筆劃作為參考筆劃的。對(duì)上、下、左、右四種相對(duì)位置關(guān)系的判別,是經(jīng)過(guò)參考筆劃端點(diǎn)作橫豎界線,在平面上劃出上、下、左、右區(qū)域。目標(biāo)筆劃的部分或全部落在上述某一區(qū)域時(shí),該區(qū)域位置就是目標(biāo)筆劃相對(duì)于參考筆劃的相對(duì)位置關(guān)系。見(jiàn)圖3。圖中目標(biāo)筆劃B、C相對(duì)于參考筆劃的位置關(guān)系是“右”,目標(biāo)筆劃D既是“右”,也是“下”。
      8 部件將字作左右分開(kāi),每一部分就是一個(gè)部件,如“漢”字可分成“氵”和“又”兩個(gè)部件,“潛”字可分成“氵”和“替”兩個(gè)部件,“推”字則可分成“扌”,“亻”和“

      ”共三個(gè)部件。
      9 基元將部件作上下分開(kāi),每一部分就是一個(gè)基元。如“各”部件可分成“攵”和“口”兩個(gè)基元。對(duì)于內(nèi)外包含的基元,則外部分作上基元,內(nèi)部分作下基元。如“困”可分成“口”和“木”,“勾”可分成“勹”和“厶”。
      10 基元鏈把一個(gè)部件中的基元的基元碼自上而下順序排列就構(gòu)成基元鏈。如“各”部件的基元鏈順序是“攵口”。
      11 部件的鏈接信息部件的鏈接信息包括部件碼左右排列順序和相鄰部件之間的間隔寬度值。
      12 根據(jù)直線段筆劃特征和直線段筆劃之間的相對(duì)位置關(guān)系識(shí)別基元在圖象區(qū)的字域處找到最上的筆劃,根據(jù)其筆劃特征進(jìn)入路徑網(wǎng)絡(luò),依據(jù)路徑網(wǎng)絡(luò)中提供的下一步目標(biāo)筆劃特征及相對(duì)位置關(guān)系進(jìn)行搜索和匹配,根據(jù)匹配結(jié)果確定下一步的搜索方向,最后輸出基元碼。
      13 由基元鏈識(shí)別部件先以基元鏈中的首基元為索引,把部件表中具有相同首基元的部件與基元鏈一一匹配,如完全匹配則輸出,否則另以基元鏈上其他層次的基元為索引,重復(fù)上述匹配作法。輸出匹配率最高的結(jié)果。
      14 由部件鏈接信息識(shí)別字根據(jù)相鄰部件的間隔寬度特征分割出字的部件鏈與字表相匹配。如果部件鏈中的部件數(shù)多于4個(gè),則以最左邊的4個(gè)部件作為部件鏈。當(dāng)有多結(jié)果但部件數(shù)不等時(shí),輸出部件數(shù)最多而且下一部件可作另一字首部件的字,當(dāng)有多結(jié)果而且部件數(shù)相等時(shí),輸出使用頻率最高的字。
      實(shí)施案例使用設(shè)備及要求輸入裝置一臺(tái)圖文掃描儀,分辨率300點(diǎn)/英寸。
      識(shí)別處理裝置一臺(tái)IBM-PC微機(jī)。
      圖象存儲(chǔ)器在微機(jī)內(nèi)存辟出64K圖象存儲(chǔ)空間。
      輸出裝置打字機(jī)。
      識(shí)別過(guò)程圖文掃描儀將字稿轉(zhuǎn)化成二值化圖象輸入計(jì)算機(jī)。計(jì)算機(jī)對(duì)此圖象進(jìn)行行切割,求出行寬,以行寬和縱向間隔為特征大致切割出字。
      在字域中自上而下水平掃描找出最上筆劃,以此筆劃特征對(duì)應(yīng)進(jìn)入路徑網(wǎng)絡(luò)?,F(xiàn)以識(shí)別“午”字為例說(shuō)明,見(jiàn)圖4“午”中搜索到的最上筆劃是“丿”,因此進(jìn)入路徑網(wǎng)絡(luò)(下稱網(wǎng)絡(luò))中“丿”口。網(wǎng)絡(luò)中下一步是以“丿”為參考筆劃的交叉判別,由于結(jié)果中無(wú)與之交叉的筆劃,故轉(zhuǎn)入第二步中的“丿”路徑;網(wǎng)絡(luò)中下一步是“丿”的右邊筆劃,結(jié)果是有橫筆劃,因此轉(zhuǎn)入第三步的“”路徑;網(wǎng)絡(luò)中下一步是“一”筆劃右端端接筆劃,結(jié)果無(wú)端接筆劃,則最終基元碼是“”。
      繼續(xù)往下判別。
      最上筆劃是“丨”,由此進(jìn)入網(wǎng)絡(luò)中“丨”口。網(wǎng)絡(luò)中下一步是以“丨”為參考筆劃的交叉判別,結(jié)果是有橫筆劃交叉,轉(zhuǎn)入第二步中的“十”路徑;網(wǎng)絡(luò)下一步是“一”筆劃上的交叉判別,搜索結(jié)果無(wú)交叉,轉(zhuǎn)入第三步的“十”路徑;網(wǎng)絡(luò)中下一步是“一”之上和“丨”之左的筆劃,結(jié)果無(wú)筆劃,故轉(zhuǎn)入第四步的“十”路徑;網(wǎng)絡(luò)中下一步是“一”之下和“丨”之左的筆劃,結(jié)果無(wú)筆劃,轉(zhuǎn)入第五步的“十”路徑。最終基元碼是“十”。
      上述二個(gè)基元構(gòu)成的基元鏈?zhǔn)恰剥R十”,以此基元鏈與部件表匹配,就可識(shí)別出“午”部件。整行圖象都作部件識(shí)別后,就可根據(jù)部件鏈接信息將部件鏈與字表匹配識(shí)別出字了。


      圖1-筆劃掃描示意2-筆劃走向判別3-直線段筆劃相對(duì)位置判別4-部分基元路徑網(wǎng)絡(luò)圖
      權(quán)利要求
      1.一種手寫(xiě)體文字識(shí)別方法,其特征是包括字稿的二值化圖像輸入方法,直線段筆劃分割方法,直線段筆劃特征提取方法,根據(jù)直線段筆劃特征和直線段筆劃之間的相對(duì)位置關(guān)系識(shí)別基元的方法,根據(jù)基元鏈識(shí)別部件的方法,根據(jù)部件的鏈接信息識(shí)別字的方法。
      2.如同權(quán)利要求1中所述的方法,其特征是直線段筆劃分割是以象素串長(zhǎng)度增量和始象素位移量做為控制參數(shù)選擇該直線段掃描范圍。
      3.如同權(quán)利要求1或2中所述的方法,其特征是直線段筆劃的分割是對(duì)同一條直線段筆劃上的象素填入該直線段筆劃的序號(hào)。
      4.如同權(quán)利要求1或3中所述的方法,其特征是直線段筆劃的特征提取中其走向是用始象素串始象素與終象素串始象素的X-Y坐標(biāo)差值查速算表得出方向值G和長(zhǎng)度值S,當(dāng)象素串長(zhǎng)度LO大于S時(shí),筆劃是豎向,當(dāng)象素串長(zhǎng)度LO小于或等于S時(shí),筆劃走向是G方向。
      5.如同權(quán)利要求1或4中所述的方法,其特征是直線段筆劃的特征提取中其端點(diǎn)是如下確定的當(dāng)筆劃是水平和接近水平時(shí),以此直線段筆劃中始象素串的始象素為左端點(diǎn),終象素串的始象素為右端點(diǎn)。當(dāng)筆劃是垂直和接近垂直時(shí),以此直線段筆劃中最上的象素為上端點(diǎn),最下的象素為下端點(diǎn)。同一直線段筆劃上同時(shí)有多個(gè)象素是最上(或最下)時(shí)選取其中最左邊的象素為上端點(diǎn)(或下端點(diǎn))。當(dāng)直線段筆劃是左斜或右斜時(shí),以此直線段筆劃中的始象素串的始象素為上端點(diǎn),終象素串的終象素為下端點(diǎn)。
      6.如同權(quán)利要求1或5中所述的方法,其特征是直線段筆劃之間的上、下、左、右相對(duì)位置關(guān)系的判別是經(jīng)過(guò)參考筆劃的端點(diǎn)所作的橫豎界線在平面上劃出上、下、左、右區(qū)域,根據(jù)目標(biāo)筆劃所在區(qū)域確定其相對(duì)位置關(guān)系。
      7.如同權(quán)利要求6中所述的方法,其特征是直線段筆劃之間相對(duì)位置關(guān)系的判別是選擇已識(shí)別筆劃作參考筆劃。
      8.如同權(quán)利要求1、5、7中所述的方法,其特征是根據(jù)直線段筆劃特征和直線段筆劃之間相對(duì)位置關(guān)系識(shí)別基元的方法是依據(jù)路徑網(wǎng)絡(luò)中提供的下一步目標(biāo)筆劃特征及相對(duì)位置關(guān)系進(jìn)行搜索和匹配,根據(jù)匹配結(jié)果確定下一步的搜索方向,最后輸出基元碼。
      全文摘要
      本發(fā)明是一種通過(guò)辨別文字結(jié)構(gòu)信息來(lái)識(shí)別手寫(xiě)體文字的方法,字稿經(jīng)輸入設(shè)備轉(zhuǎn)化成二值化圖象輸入到存儲(chǔ)器,識(shí)別處理裝置從中作直線段筆劃分割和提取特征。按照“筆劃—基元—部件—字”的順序逐級(jí)識(shí)別。
      文檔編號(hào)G06K9/18GK1058481SQ90104900
      公開(kāi)日1992年2月5日 申請(qǐng)日期1990年7月25日 優(yōu)先權(quán)日1990年7月25日
      發(fā)明者馮清亮 申請(qǐng)人:馮清亮
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1