專利名稱:手寫體信息快速編輯排版方法和編輯符的識別方法
技術領域:
本發(fā)明涉及信息編輯處理技術,具體涉及一種對聯(lián)機輸入狀態(tài)下手寫寫入信息和在脫機 狀態(tài)下獲取的已有手寫文檔的數(shù)字化信息根據(jù)編輯指令進行快速編輯排版的方法和對編輯 過程中輸入的編輯符的識別方法。
背景技術:
現(xiàn)有技術中對于聯(lián)機狀態(tài)下輸入的信息進行編輯的技術已經(jīng)非常成熟,但對于在聯(lián)機輸 入狀態(tài)下手寫寫入信息和在脫機狀態(tài)下獲取的已有手寫文檔的掃描信息進行編輯的技術很 少。經(jīng)過大量檢索發(fā)現(xiàn)微軟公司有關于手寫體信息的編輯技術,該編輯技術將待編輯文檔的 作為一個整體單元,通過選擇系統(tǒng)提供的編輯指令完成對待編輯文檔的編輯操作。但微軟公 司的手寫體文字編輯技術存在一定技術缺陷,例如在執(zhí)行刪除操作時,當刪除掉整篇文檔中
的幾個文字或一段文字時,被刪除部分為空白,受刪除操作影響的后面信息不能自動跟進, 將空白間隙填補,也就是在編輯操作后,不能實現(xiàn)再排版,這樣將對文檔的整體性產(chǎn)生影響。
在文檔的書寫過程中如果需要對生成文檔進行編輯,現(xiàn)有技術是采用通過鼠標作為輔助 工具,通過鼠標勾選需要編輯的信息,當選中該信息后,在通過執(zhí)行相應編輯命令完成對文 檔內信息的編輯,雖然這種文檔編輯方法相比在紙件上直接進行編輯修改能有效的提高編輯 效率和使整體文檔在編輯后的清潔性和整體性更好,但是這種編輯方法還需要增加輔助構件 鼠標等工具,而且編輯過程仍然稍許復雜,為了使對文檔信息的編輯更高效,申請?zhí)枮?94108177. X,名稱為以筆勢符號為編輯指令的系統(tǒng)的發(fā)明專利公開了 一種直接對文檔信息進 行編輯的方法,該方法可以在書寫信息的同時,不需要借助鼠標等工具直接進行文檔信息的 編輯,操作過程中通過書寫信息的手寫筆等輸入構件直接對文檔中的信息進行編輯,并通過 手寫筆等輸入構件直接在文檔中劃入編輯符號就可以實現(xiàn)文檔信息輸入和編輯的同步高效 進行,但這種編輯方法存在一定的技術問題,因為該專利中所公開的文檔編輯命令符號在文 檔中寫入時,系統(tǒng)要根據(jù)這些編輯符號的線段長短、或符號中線條的傾斜角度與系統(tǒng)內設的 符號點值參數(shù)進行比對,當操作者寫入的這些符號如果不規(guī)范,超出了系統(tǒng)內設符號點值參 數(shù)可以識別的有效范圍時,系統(tǒng)對這些符號便不能識別。這也相應提高了操作者編輯文檔時 的難度,給編輯操作帶來了不便,所以該技術仍然存在技術缺陷。
發(fā)明內容
為了解決現(xiàn)有技術中存在的在對聯(lián)機輸入狀態(tài)下手寫寫入信息和在脫機狀態(tài)下獲取的已 有手寫文檔的數(shù)字化信息進行編輯完成后,不能實現(xiàn)再排版,影響文檔整體性的技術問題, 本發(fā)明提供了 一種對手寫體信息進行快速編輯排版的方法。
為了解決現(xiàn)有技術中存在的對手寫體編輯符的識別準確率低的技術問題,本發(fā)明提供了 一種編輯符的識別方法。
本發(fā)明解決現(xiàn)有技術中存在的第一個技術問題所采用的技術方案為提供一種對手寫體 信息進行快速編輯排版的方法,所述對手寫體信息進行快速編輯排版的方法包括步驟第一、 將手寫體信息進行切分或合并處理成個體單位的獨立信息單元;第二、對切分或合并處理后
的所述手寫體信息進行編碼,建立支持編輯操作的索引,進行索引計算,得出各獨立信息單元 在整體信息單元中的物理位置,并計算所述信息相對于顯示頁面的動態(tài)索引;第三、輸入編 輯指令,執(zhí)行所述編輯指令完成對所迷手寫體信息的編輯;第四、對每次執(zhí)行編輯指令后受到影響的信息單元進行自動排版。
根據(jù)本發(fā)明的 一優(yōu)選實施例所述第 一步中對所述手寫體信息的切分包括操作者在聯(lián)機 輸入狀態(tài)下手寫寫入信息的切分和在脫機狀態(tài)下荻取的已有手寫文檔的掃描信息的切分。
根據(jù)本發(fā)明的一優(yōu)選實施例所述操作者在聯(lián)機輸入狀態(tài)下手寫寫入信息的切分方法包 括步驟 一、獲取操作者聯(lián)機寫入的單行手寫體信息;二、對所述單行手寫體信息進行投影;
三、 根據(jù)投影像素進行計算,判斷,切分或合并得到單個手寫體信息; 根據(jù)本發(fā)明的一優(yōu)選實施例所述脫機狀態(tài)下獲取的已有手寫文檔的掃描信息的切分方
法包括步驟 一、讀入整篇在所述脫機狀態(tài)下獲取的已有手寫體信息或圖片信息;二、將上 述已有手寫體信息或圖片信息進行格式轉化成系統(tǒng)可以識別的格式;三、分離出非文字信息;
四、 將轉化格式后的所述手寫體信息進行投影并根據(jù)投影像素進行判斷,實施行切分;五、 對所述行切分信息根據(jù)投影像素進行計算,判斷,切分或合并得到單個手寫體信息。
根據(jù)本發(fā)明的一優(yōu)選實施例所迷單個手寫體信息的切分包括粗切分、重疊漢字的切分、 粘連漢字的切分。
根據(jù)本發(fā)明的一優(yōu)選實施例所述對輸入手寫體信息的粗切分方法具體包括計算字符 左右邊界、字寬w,、平均字寬^、高寬比r,、平均高寬比7、字間距d,、平均字間距^, 引入判斷系數(shù)a和-,當1",>"*7時,作為合并的候選,當r,乂-^^時,作為切分的候選。
根據(jù)本發(fā)明的一優(yōu)選實施例所述重疊漢字的切分包括步驟 一、獲取待切分手寫體信 息;二、對所述待切分手寫體信息進行像素的垂直投影;三、在相連的兩投影信息上確定投 影最低點,并以該點為界進行重疊漢字的切分。
根據(jù)本發(fā)明的一優(yōu)選實施例所述粘連漢字的切分包括步驟 一、通過傅立葉變換方法 確定粘連漢字;二、對所述粘連漢字進行細化處理;三、確定切分點進行粘連漢字的切分。
才艮據(jù)本發(fā)明的一優(yōu)選實施例所述第三步中所述編輯指令為手寫體編輯符或系統(tǒng)提供的 編輯選擇指令。
根據(jù)本發(fā)明的一優(yōu)選實施例所述第四步中對每次執(zhí)行編輯指令后受到影響的信息單元 進行自動排版包括步驟 一、執(zhí)行編輯指令完成編輯操作;二、調整受編輯影響各獨立信息 單元在整體信息單元中的物理位置;三、生成新的整體信息單元接受下次編輯操作。
本發(fā)明解決現(xiàn)有技術中存在的第二個技術問題所采用的技術方案為提供一種手寫體編 輯符的識別方法,所述手寫體編輯符的識別方法包括步驟第一、將平面坐標系劃分為8個 方位,通過系統(tǒng)采集到編輯符號的軌跡信息,計算出所述編輯符號軌跡在前后兩個坐標之間 的變化向量;第二、 ^換方位對所述編碼符號進行編碼,將編輯符號信息轉換成編碼信息,所 述編碼信息描述了所述編輯符號的結構信息;第三、通過語法模式識別出所迷編輯符號的編 碼信息。
根據(jù)本發(fā)明的一優(yōu)選實施例所述第三步中所述語法模式為每個語法模式為一個數(shù)字 串,該數(shù)字串中的每個數(shù)字代表了與筆跡中該數(shù)字對應的當前點的位置與前一點的位置之間 的差向量最接近的方位。
本發(fā)明一種對手寫體信息進行快速編輯排版的方法有效的解決了現(xiàn)有技術中存在的技 術問題,能靈活、快捷的對在聯(lián)機輸入狀態(tài)下手寫寫入信息和在脫機狀態(tài)下獲取的已有手寫 文檔的掃描信息進行編輯,對于每次完成編輯操作后能馬上完成對文檔的再排版,使文檔內 其余信息不受編輯4乘作的影響,經(jīng)過編輯后的文檔整體性不受影響。
本發(fā)明 一種手寫體編輯符的識別方法有效的解決了現(xiàn)有技術中存在的系統(tǒng)要根據(jù)編輯 符號的線段長短或符號中線條的傾斜角度與系統(tǒng)內設的符號點值參數(shù)進行比對,當操作者寫
5入的編輯符號如果不規(guī)范,超出了系統(tǒng)內設符號點值參數(shù)可以識別的有效范圍時,系統(tǒng)對這 些符號變不能識別導致對編輯符的識別準確率低的問題。本發(fā)明中通過系統(tǒng)按方位對編碼符 號進行編碼,并將編輯符號信息轉換成編碼信息,該編碼信息描述了編輯符號的結構信息, 再通過系統(tǒng)語法模式識別出編輯符號的編碼信息由系統(tǒng)執(zhí)行編輯操作。所以只要操作者輸入 的編輯符號結構是大體正確的,系統(tǒng)都能正確識別并做出準確判斷,這樣就提高了操作的準 確性和易用性,系統(tǒng)對編輯符的識別錯誤率非常低。
圖1.本發(fā)明一種對手寫體信息進行快速編輯排版的方法流程圖2.單行手寫體字符切分方法流程圖3.脫機手寫體整篇漢字切分方法流程圖4. 二次線性插值算法壓縮圖像舉例示意圖5.二次線性插值算法原理圖6.位圖無損壓縮縮小處理流程困;
圖7.位圖無級放大處理流程圖8.初始索引的計算流程圖9.未編輯狀態(tài)下圖像的顯示流程圖10.編輯狀態(tài)下圖像的刷新顯示流程圖11.識別左選擇符時狀態(tài)機理圖12.識別右選擇符時狀態(tài)機理圖13.識別復制符時狀態(tài)枳J里圖14.識別粘貼符時狀態(tài);bL理圖15.識別插入符時狀態(tài)枳j理圖16.識別刪除符時狀態(tài)積J里圖17.識別剪切符時狀態(tài)機理圖18.識別縮進(或空格)符時狀態(tài)機理圖19.識別回格符時狀態(tài)才兒理圖20.識別換行符時狀態(tài)^L理圖21.語法模式識別法狀態(tài)機理圖22.重疊漢字的切分示意圖23.粘連漢字的切分示意圖24.多行文檔切分方法舉例示意圖25.在當前手寫文檔中插入掃描的圖片化脫機文檔舉例示意圖; 圖26.根據(jù)密度比合并中原始單字圖像與對應垂直投影對應關系舉例示意圖; 圖27.編輯符結構示意圖; 圖28.坐標方位編碼表示意圖; 圖29.編輯文檔中的刪除操作演示示意圖; 圖30.編輯文檔中的插入操作演示示意圖; 圖31.其它相關編輯操作演示示意圖。
具體實施例方式
下面結合附圖和實施例對本發(fā)明作進一步說明
請參閱圖1本發(fā)明一種對手寫體信息進行快速編輯排版的方法流程圖,如圖1所示對手寫體信息進行快速編輯排版的方法包括步驟第一、獲取手寫體信息;第二、將手寫體信息 進行切分或合并處理成個體單位的獨立信息單元;第三、對切分或合并處理后的所述手寫體 信息進行編碼,并根據(jù)需要對所述編碼進行存儲;第四、建立支持編輯操作的索引,進行索引 計算,得出各獨立信息單元在整體信息單元中的物理位置,并計算所述信息相對于顯示頁面 的動態(tài)索引;第五、輸入編輯指令,執(zhí)行所述編輯指令完成對所述手寫體信息的編輯;第六、 對每次執(zhí)行編輯指令后受到影響的信息單元進行自動排版。
其中,第一步中獲取手寫體信息包括獲取聯(lián)機輸入狀態(tài)下手寫寫入信息或在脫機狀態(tài)下 獲取的已有手寫文檔的掃描信息。本發(fā)明中所述的編輯方法也可以適用于對非手寫信息的編 輯。
第二步完成對在聯(lián)機輸入狀態(tài)下手寫寫入信息的切分或在脫機狀態(tài)下獲取的已有手寫 文檔的掃描信息的切分。具體包括所述操作者在聯(lián)機輸入狀態(tài)下手寫寫入信息的切分方法 包括步驟 一、獲取操作者聯(lián)機寫入的單行手寫體信息;二、對所迷單行手寫體信息進行投 影;三、根據(jù)投影像素進行計算,判斷,切分或合并得到單個手寫體信息。所述脫機狀態(tài)下 獲取的已有手寫文檔的掃描信息的切分方法包括步驟 一、讀入整篇在所述脫機狀態(tài)下獲取 的已有手寫體信息或圖片信息;二、將上述已有手寫體信息或圖片信息進行格式轉化成系統(tǒng) 可以識別的格式;三、分離出無需進一步切分的非文字信息;四、將轉化格式后的所述手寫 體信息進行投影并根據(jù)投影像素進行判斷,實施行切分;五、對所述行切分信息根據(jù)投影像 素進行計算,判斷,切分或合并得到單個手寫體信息。所述單個手寫體信息的切分包括粗切 分、重疊漢字的切分、粘連漢字的切分。
第五步中所述編輯指令為手寫體編輯符或系統(tǒng)提供的編輯選擇指令。 第六步中對每次執(zhí)行編輯指令后受到影響的信息單元進行自動排版包括步驟 一、執(zhí)行 編輯指令完成編輯操作;二、調整受編輯影響各獨立信息單元在整體信息單元中的物理位置;
三、生成新的整體信息單元接受下次編輯操作。
具體展開說明切分處理或合并處理的實現(xiàn)方法及算法。
本發(fā)明一種對手寫體信息進行快速編輯排版的方法是針對文字信息進行編輯。對于輸 入構件寫入的字符,必須進行準確快速的切分以獲得正確的單信息集而對于圖畫和完整 地公式等,并不需要進行切分,直接進行縮放處理,對于借助掃描儀等設備讀入的整篇手寫 文字圖像中如果有圖畫和完整地公式等,也不需要進行切分。
切分部分采用了兩階段切分方法粗切分和細切分,細切分包括重疊字切分和粘連字的 切分。
聯(lián)機輸入的漢字切分
第一、粗切分。對于從輸入?yún)^(qū)獲取的單行手寫體字符圖像,首先對單行圖像進行垂直投 影。根據(jù)像素空白處進行粗切分,獲得粗切分字段集,并計算字符左右邊界、字寬w,、平 均字寬、高寬比r,、平均高寬比"字間距",、平均字間距S。通過對不同人的大量手寫 體漢字訓練發(fā)現(xiàn),同一個筆記者完整漢字的高寬比在一定范圍內/3承7和cr *^即變化。當 r,〉o^7時,作為合并的候選,而1",</9*7,將其作為再切分的候選。
第二、重疊漢字的切分
重疊字,是指兩個漢字垂直投影重疊,但是沒有共享的像素。舉例如附圖"所示。 本方法中中我們提出一種基于連通城和垂直投影的重疊字切分算法。首先對于w>^* 6 或者高寬比r〉-八的部分,將其作為候選。對候選圖像,求背景(圖中為白色)求連通域, 如果連通域的高度等于候選圖像的高度,則證明該候選為重疊漢字,進行重疊字的切分。首先對候選圖像,進行像素垂直投影,在中間位置一定范圍內(經(jīng)驗值)找到投影最低 點c,作為候選切分位置。如附圖22中豎線標注,即為候選位置處粗切分線。以位置c為 中心,對圖像作加窗處理,窗口寬度為K如附圖22中點線標注所示。從上到下按行r,處理, 如果粗分線經(jīng)過背景,則該位置加入到切分位置數(shù)組,slicek,]=c。否則的話,粗分線在 該行經(jīng)過前景點。判斷筆畫的歸屬。方法填充窗口內該行c列往右的像素為前景,然后 通過前述的計算背景連通域高度的方法,判斷連通性。如果不連通了,說明筆畫屬于左邊, 我們求出該點開始粗分線右邊的前景連通域,把該連通域的每行最右點對應的列。加入到切 分位置數(shù)組,即slice[r,]- 。。然后繼續(xù)處理連通域最后一行的下一行,直至處理完所有 行。判斷筆畫屬于右邊漢字的處理過程相似。如果左右填充后,均連通,則應用高寬比、字 寬等知識判斷其歸屬,然后采用求slice數(shù)組的方法。根據(jù)slice數(shù)組中的值,將原來重疊 的漢字,分成獨立的漢字,如附圖22所示結果。紅色像素左邊和右邊分別為一個完整的漢 字。
第三、粘連漢字的切分 粘連漢字的切分舉例如附圖23所示。
粘連漢字,指的是兩個漢字不僅垂直投影重疊,而且有筆畫連接在一起,共享一定像素 區(qū)域。用傅立葉變換方法判斷其是否為粘連字段。若為粘連字段,近一步切分成幾個單字符。 切分方法為首先對原圖像進行細化操作,得到細化圖像,原圖像垂直投影,得到粗切分列 的位置c (圖中豎直線對應的位置)。對于粘連漢字中的三種點叉點、端點和角點,其中 叉點、角點可作為候選點。細化圖像中從粗切分位置向兩邊掃描尋找候選分割點,對應細化 圖像中所示A、 B兩點為找到的叉點候選點。結合漢字高寬比、字寬、方差等信息,選擇一 個合適的候選,本例中為B點。因為B在粗切分右邊,所以在原圖像中,把從B點開始的向 左和向下方向的連續(xù)前景(黑色)變?yōu)楸尘?白色)。若為左側,則向右向下改變連續(xù)前景 為背景。改變后的圖像如前景變背景效果圖所示。至此,我們可采用重疊字的切分方法進行 切分,得到切分結果顯示。
上述單行手寫體字符切分方法流程圖可以參閱圖2 脫機文字圖像切分
讀入整篇手寫體字符圖像,用戶首先標示出該文字圖像中不需要切分的信息單元,如字 圖像、公式等。對余下部分,系統(tǒng)判斷其是否為多行圖像。對多行圖像的切分方法為對多 行文本圖像進行水平投影發(fā)現(xiàn),不同行的像素投影重疊現(xiàn)象嚴重,這是由于文本行書寫時切 斜所造成的。而書寫傾斜是無限制自由手寫體漢字書寫中的常見問題,因此多行切分需重點 解決這一問題。解決的思想是對于總體趨勢傾斜的行,我們可以將其分為若千個切斜角度 很小的行拼接成的。這樣,將一整篇文檔(高為、寬為w )劃分為6 (經(jīng)驗值)篇高為A, 寬度1/6*^的子文檔。對每篇子文檔根據(jù)水平投影切分,切分過程與單行粗切分思想相同。 然后按對應行號將子行重新合并成行。然后我們對每一行文字,釆取與聯(lián)機輸入漢字圖像切 分相同的策略進行切分,該切分方法流程圖可以參閱圖3。具體多行文檔切分方法舉例可參 閱附圖24。
在當前手寫文檔中插入掃描的圖片化脫機文檔的例子可以參閱附圖2 5: 過分部分合并。許多漢字都是左右結構的,這樣當書寫比較分散時,粗切分會將該漢字 的左右部分切分成兩個以上部分。必須釆取算法將它們合并。本方法中我們結合3種方法進 行合并,保證合并的準確。實驗證明,取得了很好的效果。這三一、 根據(jù)高寬比合并
用p,表示第i部分,其高寬比對應為r, Do (〃合并候選表List
計算合并前方差Sj
Pi=List. get(0); 〃讀List表頭元素
List. Delete (0); 〃讀取后刪除頭元素
Float Lr=Rate(p,, p,— );〃Rate()計算p,左合并的高寬比并附值Lr Float Rr=Rate(p,, p,+l); 〃 p,右合并后高寬比并附{直Rr If (Lr >"*7) {〃左合并后仍是候選
P-Merge(p,, p,一,); //合并p,和p,一為p;
List. Add (0, p);〃p添加到表頭以便繼續(xù)處理
else If (Rr 〉a*r) {〃右合并后仍是候選 P=Merge(p,., p,+,); 〃合并p,和p,+1為p; List. Add (0, p);〃p添加到表頭以便繼續(xù)處理
else {
r = Lr和RR中更接近7的一個; if(Lr比RR接近7) P-Merge(p,, p,—,); else P=Merge(p,, p,.+1); 重新計算高寬比方差S; If (r<》"I I w>w*S I I S > "S,)( Cancel (); 〃取消不合理的合并
}
}while (List不為空);
二、 根據(jù)密度比合并
同時訓練發(fā)現(xiàn),相鄰的兩個部分,例如p,, p,+l。如果,p,的像素數(shù)量與Pw的像素數(shù) 量比值大于一定閾值,則在直方圖投影上,顯示出明顯的密度大小差距,即相鄰兩個部分投 影面積的差距很明顯。具體舉例可以參閱附圖26。
我們通過計算某個部分的密度值,結合考慮漢字高寬比,字間距、密度比等信息,從左 右鄰居中選擇最合適的一個與其合并。合并后也必須保證高寬比方差減小并且r〉/ 沐7,并 且合并后字寬小于;* 6 ,否則取消合并。
三、 根據(jù)間距合并
根據(jù)人們的書寫習慣,以及訓練結果顯示,人們書寫漢字時,往往字間的距離要大于漢 字部首間的距離。如果相鄰兩個部分的間距小于平均字間距^,則考慮合并這兩個部分。當 然,結合考慮漢字高寬比,字間距等信息,從左右鄰居中選擇最合適的一個與其合并。對于 不合適的合并要予以取消。
壓縮部分的實現(xiàn)方法及算法
壓縮部分的主要功能是完成對切分后的文字圖像進行無損壓縮存儲,將輸入的文字的 手寫特征盡可能多的保存下來,提供給索引作存儲要占用盡可能少的存儲空間同時,對編
9輯顯示狀態(tài)下的候選文字作放大的操作,要保證文字的無限放大不失真,無鋸齒,保留原有 書法特4正。
傳統(tǒng)的圖像放大算法是將每一象素在水平和垂直的方向上重復顯示若干次,而縮小算法 是將源文件每隔若干個象素取出一個象素。這種簡單的放大方法對于灰度圖像,偽彩和真彩 色圖像來說,還勉強可以接受,量化后相鄰象素間的差值不是很大。但對于二值圖像來說,放 大后會形成色塊,圖像反差強烈,效果不佳,特別是曲線或存在噪聲的情況下,這一現(xiàn)象尤為 明顯。
本方法中的圖像的預處理采用基于雙線性插值的縮放算法,縮小采用基于像素交迭的等 權值矩陣縮小算法;放大采用邊緣檢測算法,位圖形狀轉化為矢量圖形,再進行像素填充的 方法進行縮放處理。
第一、切分圖像的歸一化壓縮處理二次線性插值算法壓縮圖像舉例示意圖如圖4所示。 縮放映射原理
— 0) /(Sw廳-0) = (A — 0) /(Z)w融—0) & = Z)/Sw淑/ Z)w融 (S少—0) /(幼/g似—0) = (A — 0) /(DWg似一 0)
W幼妙/ /飾妙f
聚焦看看(Sx, Sy)坐標點(Sx, Sy為浮點數(shù))附近的情況,如圖5所示。
二次線性插值需要考慮(Sx,Sy)坐標點周圍的 4 個顏色值 ColorO\Colorl\Color2\Color3,把(Sx,Sy)到A\B\C\D坐標點的距離作為系數(shù)來把4個顏色 混合出縮放后點的顏色;(u=Sx-floor (Sx); v=Sy-f loor (Sy);說明floor函數(shù)的返回值為
小于等于參數(shù)的最大整數(shù)) 二次線性插值公式為
鄉(xiāng)Co/wO = Co/orO * (1 — w) + CWor2 * w 加/ Co/orl = Co/wl * (1 — + Co/or3 * w jDwCo/or =加/ Co/o/"0 * (1 — v>) +加/ CWw2 * v
展開公式為
,0 = (1 ——v)
= v*(l —m) 戸2 = - v) 戸3 = k * v
則顏色混合公式為
Ds/"Co/o/" = Co/or0 *戸O + *戸l + Co/or2 * ,2 + Co/or3 *戸3
等權值縮小算法(圖象的縮小灰度級顯示算法)
若位像是二值的,縮小顯示的時候由于n個點轉化成一個點會導致圖像局部細節(jié)信 息丟失,比如一條寬度一個象素的細線由于縮小可能就會沒有顯示,而使用灰度級顯示能解 決這個縮小顯示的問題。
基本約定
一、 灰度級縮小顯示只針對黑白或者灰度影像
二、 只有在顯示<100%的時候灰度級顯示才生效
三、 灰度級縮小算法是基于原始圖像來運算具體算法
一、 縮小算法
按照與原圖比例1: n來對原圖n*n個點生成1個點(n可以是浮點數(shù)),考慮到效率 可以使用灰度級變換,從0-255取中間點127大于該值顯示白小于改值顯示黑色。
二、 灰度級顯示算法
結合縮小算法n*n個點生成一個點的原則,在原圖上按照每個點的權值和顏色相乘再除 以n來得到生成點的顏色值。這是一維坐標,擴展到二維空間算法相同。 位圖壓縮縮小處理流程圖可以參閱圖6。 具體展開說明索引圖像的無級放大 位困無級放大處理流程圖可以參閱圖7。
一、 Perwitt算子邊錄J險測
經(jīng)典的插值方法,插值后的圖像會出現(xiàn)邊緣模糊或邊緣鋸齒等現(xiàn)象,這是因為這些傳統(tǒng) 的圖像縮放方法實質上是對源圖像建立了連續(xù)的數(shù)學模型,沒有考慮邊緣部分的高頻信息損 失的問題。人眼對圖像的邊緣部分特別敏感,插值后圖像的邊緣性質對一幅圖像的質量有十 分重要的影響。為使插值后的圖像邊緣保持良好的特性,采用基于Perwitt算子邊沿檢測方 法的圖像縮放算法,先檢測邊沿,對確認為處于邊緣區(qū)域的像素,插值沿邊沿方向進行;對 平坦區(qū)域的像素,進行插值。該算法能在很大程度上消除插值后圖像邊緣的模糊和鋸齒現(xiàn)象, 提高插值后圖像的視覺質量。
基于Perwitt算子的邊緣;險測算法基本步驟包括
第一、濾波。邊緣檢測主要基于導數(shù)計算,但受噪聲影響。但濾波器在降低噪聲的同時 也導致邊緣強度的損失。
第二、增強。增強算法將鄰域中灰度有顯著變化的點突出顯示。 一般通過計算梯度幅值 完成。
第三、檢測。但在有些圖象中梯度幅值較大的并不是邊緣點。最簡單的邊緣檢測是梯度 幅值閾值判定。
第四、定位。精確確定邊緣的位置。
邊緣檢測算法流程
第一步用高斯濾波器平滑圖象;
第二步:用一階偏導的有限差分來計算梯度的幅值和方向; 第三步:對梯度幅值進行非極大值抑制; 第四部用雙閾值算法檢測和連接邊緣。
二、 位圖形狀轉矢量圖形縮放
當字號特別大時,用字做的圖邊緣部分不平滑,采用將提取出的字體邊緣轉換為矢量 圖形,采用矢量縮放算法進行平滑縮放,然后繪出筆畫輪廓填充之。在有些情況下,即使 用平滑的曲線繪畫仍然不可避免的會有鋸齒,這是人的視覺特征決定的,所以仍然需要優(yōu)化。
一般的矢量縮放應用很好的處理軟件之所以會感覺平滑,是因為它在字體邊緣部分增加 了過渡區(qū),在前景色和背景色做了一個平滑的色彩過渡。之所以感覺沒有鋸齒,是利用了人 的視覺心理特征。所以在處理的后期,還需要在繪制好的文字邊緣增加過渡色彩,這樣就會 感覺相當平滑。
另外由于設備分辨率有限,在屏幕上繪各種幾何曲線都會有"鋸齒"形,鋸齒大小為一 個像元。字體能無級縮放,不論放大多少"鋸齒"總是一像元大,而字體的"鋸齒"會隨字形放大而增大。為了使感覺沒有鋸齒,可采用特殊算法,如反走樣法進行優(yōu)化。 顯示平臺的處理流程
顯示主要完成對初始輸入文本的壓縮存儲與初始顯示,以及編輯狀態(tài)下文本的快速定位,
刷新顯示,主要流程包括如圖8所示的初始索引的計算流程圖;圖9所示的未編輯狀態(tài)下
圖像的顯示和圖10所示的編輯狀態(tài)下圖像的刷新顯示流程圖.為了確定每個信息單元在當
前顯示頁面上的物理位置,采用了如下方法計算當前單元的坐標(Xe^,yeujJ:設前一個單元
的坐標為(x^e,y^e),寬度為w,w為當前單元的寬度;WIDTH為頁面的顯示寬度, \ pic pie/ jjre cur
X一Margin、Y—Margin分別表示fi&的上下邊距,Unit —Interv表示顯示單元之間的橫向間隔,
Row—Interv表示行距。
判斷前一個單元是否為空,如果為空,貝'J:
x = X Margin cur — e
y = Y Margin J cur - o
否則,判斷前一個單元的類型,如果為換行符或換頁符
x = X Margin cur — e
y = y + Row Interv J cur "7 pre —
否則,如果前一個單元是其他類型 計算出判斷因子A,義
xpre +wpre +Unit_Interv+wcur WIDTH
,(入=0, l),那么當前單元的
坐標為:
Xcur = (1-義)Hxpre+Wpre+Unit一Inte—"承X —Margin
'pre "pre
y = y + /1 * Row Interv -7 cur J pre —
坐標修正
設imageCollection記錄了當前頁產(chǎn)中已經(jīng)t^現(xiàn)的圖像單元信息,則判斷當前單元的坐 標是否"落"到任一圖像單元內,更新(Xcur,ycur)直到當前單元不"落"在任一圖像內。 存儲及索引
一、存儲及索引的結構
將每幅壓縮完畢的圖像按像素展開成為一維數(shù)組,將每個字的寬度和總長度放在數(shù)組的 最前端,設一位的添加刪除位。這樣文檔的內容便存儲在一系列的數(shù)組中。全局索引的結構 分兩個部分,第一個字節(jié)存儲的內容為對應字的圖像在全文中的位置,第二個字節(jié)存放的為 圖像數(shù)據(jù)在文件中存儲的位置。動態(tài)索引記錄下了每個顯示在操作頁面上的字圖像開始顯示 時左上角的坐標值,動態(tài)索引的作用在于能夠根據(jù)光標的位置快速準確地定位光標所選定的 圖像。動態(tài)索引在打開文件時創(chuàng)建,關閉文件時刪除,并不保存在文件中。
文檔的結構均由特殊字符控制,特殊字符和文字圖像一同存儲在文檔內容中,特殊字符 包括換行符,段落符,分欄符,首字縮進符,空行符。每遇到特殊字符時,在如三所述的 顯示過程中采取特殊操作,從而控制文檔顯示的格式。二 、索引支持的添加刪除編輯操作
經(jīng)過如五所述的方法識別出添加或者刪除的動作,選定將要添加或者刪除的文字圖像, 根據(jù)動態(tài)索引所存儲的坐標,定位將要承夯參者刑除的位置,先在索引中進行編輯操作。添 加時將索引添加在正確的位置上,文字圖像內容直接加在文件的末端,刪除時先只在索引中 將對應文字圖像的索引刪除,并將文字圖像的刪除位置1,直到用戶保存文檔時才真正將文 字圖像內容從文件中刪除。
三、緩沖區(qū)保存操作
每當打開一個文字圖像文檔時在內存中設置緩沖區(qū),用來保存近20步的操作,用來在 特殊情況下的文檔修復工作。
編輯部分的實現(xiàn)方法及算法
一、 編輯符的確定
確定編輯符時,我們應該以簡單,方便、符合我們的手寫習慣為根本原則,確定了左選 擇符、右選擇符、復制符、粘貼符、插入符、刪除符、剪切符、縮進(或空格)符、回格符 和換行符,各編輯符的結構示意圖可以參閱附圖27。
雖然每個編輯操作的具體功能在顯示設備上具體顯示是不一樣的,但他們的執(zhí)行過程是 一樣的,即
第一,確定編輯操作的當前位置;
第二,確定用戶發(fā)出的編輯指令;
第三,根據(jù)對應的編輯指令執(zhí)行相應的操作,具體來說,所定義的操作指令執(zhí)行的所執(zhí) 行的操作不同的系統(tǒng)可以定義不同行為,以下給出其中一種常用的行為模式,但本方法并不 限定于以下模式
插入操作確定當前位置,等待新的信息單元從輸入構建輸入,在索引中插入新的信息 單元信息,刷新顯示頁面;
左選捧操作系統(tǒng)記錄當前位置所對應的信息單元,并等待右選擇操作,如果下一個操
作不是右選擇,則該操作撤銷;
右選擇操作如果上一個操作是左選擇,記錄當前信息單元,如果當前信息單元的位置 在左選擇記錄的信息單元之前,則撤銷左右選擇操作,否則,將系統(tǒng)記錄的左選擇操作的信 息單元到當前信息單元之間的所有信息進行標記為已選擇,等待下一步操作;
刪除操作確定被選擇的信息單元為非空,從索引中刪除被選定的信息單元,刷新顯示;
復制操作清空復制緩沖區(qū),將標記為已選擇的信息單元拷貝到緩沖區(qū);
粘貼操作確定操作的當前位置,將復制緩沖區(qū)中的信息單元在當前位置插入,刷新顯
示;
剪切操作先對所選定的信息單元執(zhí)行復制操作,再對所選定的信息單元執(zhí)行刪除操作; 縮進操作先執(zhí)行插入操作,并自動插入一個空格后結束插入操作; 回格操作自動執(zhí)行左右選擇操作選定當前位置的前一個信息單元,并執(zhí)行刪除操作; 換行操作確定當前位置,在當前位置插入一個換行符,刷新顯示。
二、 編輯符的識別
編輯符的識別可以用語法模式識別法(構造自動機識別)
將平面坐標系劃分為8個方位,8個坐標方位分別編碼為0, 1, 2, 3, 4, 5, 6, 7。 通過系統(tǒng)采集到編輯符的軌跡信息,并進行平滑和采樣,計算出編輯符軌跡在前后兩個采樣 點坐標之間的變化向量,根據(jù)向量的方向在對應的方位對其分別進行編碼,組成一個碼串,此串描述了該編輯符的結構信息,也稱為該編輯符的語法模式;通過語法模式識別方法設計 識別器(自動機)識別出該編輯符。
坐標方位編碼表可以參閱附圖28,如附圖28 ( — )所示
識別算法如下
屏幕中的坐標系如附圖28 (二)所示。
首先,根據(jù)由系統(tǒng)得到的軌跡信息求出該軌跡的特征碼串,假設,該軌跡的點序列如下 a, Y,) , (X2, Y2),……a, yj , (Xw, Yi+,), ... . (X —,, Y H) , (X , Y ) 計算任何兩個相鄰點的變化向量,見附圖28中的(三)。得到n-l個變化向量
(X2-Xb Y「Y》,.......a+,-Xi, Y卜「Yi)..........(X -X —b Y -Y —')
計算每個變化向量所對應的特征碼
假設,(a,b)為上面n-1個變化向量中的一個元素,它與X軸的角度為e,參見附圖28 中的(四)。計算6的余弦cosg = a/V^2 +&2 ;
計算其反余弦得到角度a = arccos(fl/V^TP"),如果6》0 ,則6 = a ;否則,6 =2
TT_0C 。
根據(jù)e在坐標方位困中對應的位置判斷該變化向量與表一中哪一個方位最接近,該變化
向量對應的特征碼即為該方位的編號(0-7).
同理,可得到該軌跡的所有變化向量的特征碼。假設,整個特征碼串為
入,,入2,.......入i.......入 .(其中,入 =-1,表示串的結束)
其次,設計自動才幾依次識別各個編輯符
手寫編輯符的時候,存在顫抖,也就不可避免的有噪音,因此我們得到的特征碼串也包 含噪音,所以在設計自動機識別的時候一定要能夠容忍這些噪音。為此,我們采取了如下措
施
只要所識別的碼串中的碼元對某一編輯符特征碼串的符合率達到一定的閾值,如8 0 %,我們就認為當前所識別的碼串就是該編輯符。為此,我們記錄下特征碼串中的符合某一 編輯符特征的每一個分量的個數(shù),以及它們的總數(shù),只有每個分量個數(shù)和總數(shù)達到一定的閾 值,我們才認為識別出了該編輯符。以下對各所述編輯符的識別進行詳述 .
左選擇符的識別
手寫的左選擇符對應的碼串2322210010。它的特征碼就是2和0,里面存在著噪音碼 3,1,但該碼串中2和0以及二者在整個碼串中所占的比例達到一定的閾值,我們就認為, 該軌跡就是左選擇符。附圖請參閱圖11識別左選擇符時狀態(tài)機理圖,圖中Cl:符合某編輯 符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出錯的編 輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有特征碼的個數(shù)須達到 的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。
右選擇符的識別
手寫的右選擇符對應的碼串2322234454。它的特征碼就是2和4,里面存在著噪音碼 3, 5,但該碼串中2和4以及二者在整個碼串中所占的比例達到一定的閾值,我們就認為, 該軌跡就是右選擇符。附圖請參閱圖12識別右選擇符時狀態(tài)機理圖,圖中,Cl:符合某編輯 符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出錯的編 輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有特征碼的個數(shù)須達到 的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。
復制符的識別
14手寫的復制符對應的碼串6, 5, 4, 3, 3, 3, 2, 2, 0, 0。標準的復制符的特征碼是 5, 4, 3, 2, 1, 0, 7;由于手寫的復制符的隨意性,并不是每個特征碼都會出現(xiàn)在我們得 到的碼串中,如果嚴格的要求每一個特征碼的先后關系,那么對于不同人有不同手寫習慣的 復制符來說識別率將會非常低,因此,我們必須設計一比較靈活、對特征碼限制較為寬松的 狀態(tài)機,同時排除一些由于狀態(tài)機限制寬松而有可能混淆的類似的編輯符。附圖請參閱圖 13識別復制符時狀態(tài)機理圖,圖中Cl:符合某編輯符的單個特征碼的個數(shù);C2:所有符合 某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出錯的編輯碼的個ft; Tl:單個特征碼必須達到 的閥值;T2:符合編輯符的所有特征碼的個數(shù)須達到的閥值;Terr:如杲Cerr超過該值就 認為該軌跡不能被識別;C — 2 — 0:當前碼串中出現(xiàn)特征碼2和0的總數(shù);C_ 3 — 1:當前碼串中出 現(xiàn)特征碼3和1的總數(shù);C—4_2:當前碼串中出現(xiàn)特征碼4和2的總數(shù);C—1-7:當前碼串中 出現(xiàn)特征碼1和7的總數(shù);C— 3- 0:當前碼串中出現(xiàn)特征碼3和0的總數(shù);C—4 -1:當前碼串 中出現(xiàn)特征碼4和1的總數(shù)。.
粘貼符的識別
手寫的復制符對應的碼串6, 0, 0, 2, 2, 3, 3, 3, 4, 5。標準的粘貼符的特征碼是 7, 0, 1, 2, 3, 4, 5;同復制符的識別類似。附圖請參閱圖14識別粘貼符時狀態(tài)機理圖, 圖中Cl:符合某編輯符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù); Cerr:已經(jīng)出錯的編輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有 特征碼的個數(shù)須達到的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別;C-2 —4: 當前碼串中出現(xiàn)特征碼2和4的總數(shù);C-l-3:當前碼串中出現(xiàn)特征碼1和3的總數(shù);C—0-2: 當前碼串中出現(xiàn)特征碼0和2的總數(shù);C-7-l:當前碼串中出現(xiàn)特征碼7和1的總數(shù);C-0-3: 當前碼串中出現(xiàn)特征碼0和3的總數(shù);C-l-4:當前碼串中出現(xiàn)特征碼1和4的總數(shù)。
插入符的識別
手寫的右選擇符對應的碼串67776012112。它的特征碼就是7和1,但在手寫插入符 的時候,特征碼6和7, l和2很難區(qū)分,所以,在識別插入符的時候,我們將之等同,這 可以大大地提高其識別率'附圖請參閱圖15識別插入符時狀態(tài)^L理圖,圖中Cl:符合某編 輯符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出錯的 編輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有特征碼的個數(shù)須達 到的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。
刪除符的識別
刪除符是由兩條4黃線組成,我們一次識別它的一半,即一次識別一條橫線。手寫的左選 擇符對應的碼串1000770001。它的特征碼就是0,里面存在著噪音碼7, 1,但該碼串中0 在整個碼串中所占的比例達到一定的閾值,我們就認為,該軌跡就是一條橫線。附圖請參閱 圖16識別刪除符時狀態(tài)機理圖,圖中Cl:符合某編輯符的單個特征碼的個數(shù);C2:所有符 合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出錯的編輯碼的個數(shù);Tl:單個特征碼必須達 到的閥值;T2:符合編輯符的所有特征碼的個數(shù)須達到的閥值;Terr:如果Cerr超過該值 就認為該軌跡不能被識別。
剪切符的識別
剪切符是由兩條斜線組成,我們一次識別它的一半,即一次識別一條斜線。我們稱從左 邊開始的斜線為左剪切符,從右邊開始的叫右剪切符。手寫的左剪切符對應的碼串 211111011。它的特征碼就是l,里面存在著噪音碼2, 1。手寫的右剪切符對應的可能的碼 串2333332334。它的特征碼就是3,里面存在著噪音碼2, 4。附圖請參閱圖17識別剪切符時狀態(tài)機理圖,圖中入剪切符的特征碼,其中,入=1時,是左剪切符入=3時,是右剪切 符;Cl:符合某編輯符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù); Cerr:已經(jīng)出錯的編輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有 特征碼的個數(shù)須達到的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。 空格(縮進)符的識別
手寫的空格符對應的碼串01110233434。它的特征碼就是1和3,但在手寫空格符的 時候,特征碼O和l, 4和3很難區(qū)分,所以,在識別空格符的時候,我們將之等同,這可 以大大地提高其識別率。附圖請參閱圖18識別空格(縮進)符時狀態(tài)機理圖,圖中C1:符合 某編輯符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出 錯的編輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有特征碼的個數(shù) 須達到的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。
回格符的識別
手寫的回格符對應的碼串33434201110。它的特征碼就是3和1,但在手寫回格符的 時候,特征碼4和3, 0和1很難區(qū)分,所以,在識別回格符的時候,我們將之等同,這可 以大大地提高其識別率。附圖請參閱圖19識別空格(縮進)符時狀態(tài)機理圖,圖中C1:符合 某編輯符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出 錯的編輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有特征碼的個數(shù) 須達到的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。
換行符的識別
手寫的換行符對應的碼串1001023222。它的特征碼就是0和2,里面存在著噪音碼l, 3,但該碼串中2和0以及二者在整個碼串中所占的比例達到一定的閾值,我們就認為,該 軌跡就是換行符。附圖請參閱圖20識別空格(縮進)符時狀態(tài)機理圖,圖中Cl:符合某編輯 符的單個特征碼的個數(shù);C2:所有符合某編輯符的單個特征碼的個數(shù);Cerr:已經(jīng)出錯的編 輯碼的個數(shù);Tl:單個特征碼必須達到的閥值;T2:符合編輯符的所有特征碼的個數(shù)須達到 的閥值;Terr:如果Cerr超過該值就認為該軌跡不能被識別。
編輯操作序列要有一定的限制,比如,要復制一段圖像文字,先要選定該段圖像文字; 采用狀態(tài)機來實現(xiàn)不同編輯操作之間的先后制約關系。該語法模式識別法整體狀態(tài)機理圖, 可以參閱圖21。
以下對操作過程進行舉例說明
編輯文檔中的刪除操作,如附圖29所示
編輯文檔中的插入操作,如附圖30所示
其它相關操作演示示意圖如附圖31所示
以上實施例中作為舉例說明采用了手寫體編輯符作為編輯指令,本發(fā)明的編輯操作也可 以采用系統(tǒng)提供的編輯選擇指令完成編輯操作,具體原理和上述原理相同,也應視為本發(fā)明 的保護范圍。
以上內容是結合具體的優(yōu)選實施方式對本發(fā)明所作的進一步詳細說明,不能認定本發(fā)明 的具體實施只局限于這些說明。對于本發(fā)明所屬技術領域的普通技術人員來說,在不脫離本 發(fā)明構思的前提下,還可以做出若干推演或替換,都應當視為屬于本發(fā)明的保護范圍。
權利要求
1. 一種手寫體信息快速編輯排版的方法,其特征在于所述手寫體信息快速編輯排版的方法包括步驟A將手寫體信息進行切分或合并處理成個體單位的獨立信息單元;B對切分或合并處理后的所述手寫體信息進行編碼,建立支持編輯操作的索引,進行索引計算,得出各獨立信息單元在整體信息單元中的物理位置,并計算所述信息相對于顯示頁面的動態(tài)索引;C輸入編輯指令,執(zhí)行所述編輯指令完成對所述手寫體信息的編輯;D對每次執(zhí)行編輯指令后受到影響的信息單元進行自動排版。
2. 根據(jù)權利要求1所述編輯排版的方法,其特征在于所述步驟A中對所述手寫 體信息的切分包括操作者在聯(lián)機輸入狀態(tài)下手寫寫入信息的切分和在脫機狀態(tài)下獲取 的已有手寫文檔的數(shù)字化信息的切分。
3. 根據(jù)權利要求2所述編輯排版的方法,其特征在于所述操作者在聯(lián)機輸入狀 態(tài)下手寫寫入信息的切分方法包括步驟Al:獲取操作者聯(lián)機寫入的單行手寫體信息; A2:對所述單行手寫體信息進行投影;A3:根據(jù)投影像素進行計算,判斷,切分或合并得到單個手寫體信息;
4. 根據(jù)權利要求2所述編輯排版的方法,其特征在于所述脫機狀態(tài)下獲取的已 有手寫文檔的掃描信息的切分方法包括步驟al:讀入整篇在所述脫機狀態(tài)下獲取的已有手寫體信息或圖片信息;a2:將上述已有手寫體信息或圖片信息進行格式轉化成系統(tǒng)可以識別的格式;a3:分離出圖片信息;a4:將轉化格式后的所述手寫體信息進行投影并根據(jù)投影像素進行判斷,實施行 切分;a5:對所述行切分信息根據(jù)投影像素進行計算,判斷,切分或合并得到單個手寫 體信息。
5. 根據(jù)權利要求3或4所述編輯排版的方法,其特征在于所述單個手寫體信息 的切分包括粗切分、重疊漢字的切分、粘連漢字的切分。
6. 根據(jù)4又利要求5所述編輯排版的方法,其特征在于所述對輸入手寫體信息的 粗切分方法具體包括:計算字符左右邊界、字寬w,、平均字寬^、高寬比r,、平均高 寬比7、字間距J,、平均字間距孑,引入判斷系數(shù)"和/ ,當r,〉a承7時,作為合并的4美選,科吉華烽當r,X^^^時,作為切分的候選。
7. 根據(jù)權利要求5所述編輯排版的方法,其特征在于所述重疊漢字的切分包括 步驟E:獲取待切分手寫體信息;F:對所述待切分手寫體信息進行像素的垂直投影;G:在相連的兩投影信息上確定投影最低點,并以該點為界進行重疊漢字的切分。
8. 根據(jù)權利要求5所述編輯排版的方法,其特征在于所述粘連漢字的切分包括 步驟H:通過傅立葉變換方法確定粘連漢字; I:對所述粘連漢字進行細化處理; J:確定切分點進行粘連漢字的切分。
9. 根據(jù)權利要求1所述編輯排版的方法,其特征在于所述步驟C中所述編輯指 令為手寫體編輯符或系統(tǒng)提供的編輯選擇指令。
10. 根據(jù)權利要求1所述編輯排版的方法,其特征在于所述步驟D中對每次執(zhí) 行編輯指令后受到影響的信息單元進行自動排版包括步驟K:執(zhí)行編輯指令完成編輯操作;L:調整受編輯影響各獨立信息單元在整體信息單元中的物理位置; M:生成新的整體信息單元接受下次編輯操作。
11. 一種手寫體編輯符的識別方法,其特征在于所述手寫體編輯符的識別方法包 括步驟N、將平面坐標系劃分為8個方位,通過系統(tǒng)采集到編輯符號的軌跡信息,計算出 所述編輯符號軌跡在前后兩個坐標之間的變化向量;0、按方位對所述編碼符號進行編碼,將編輯符號信息轉換成編碼信息,所述編碼 信息描述了所述編輯符號的結構信息;P、通過語法模式識別出所述編輯符號的編碼信息。
12. 根據(jù)權利要求11所述手寫體編輯符的識別方法,其特征在于所述步驟P中 所述語法模式為每個語法模式為一個數(shù)字串,該數(shù)字串中的每個數(shù)字代表了與筆跡 中該數(shù)字對應的當前點的位置與前一點的位置之間的差向量最接近的方位。
全文摘要
本發(fā)明涉及信息編輯處理技術,具體涉及一種對聯(lián)機輸入狀態(tài)下手寫寫入信息和在脫機狀態(tài)下獲取的已有手寫文檔的掃描信息根據(jù)編輯指令進行快速編輯排版的方法和對編輯過程中輸入的編輯符的識別方法。通過將手寫體信息進行切分或合并處理成獨立信息單元,并將處理后的手寫體信息進行編碼,建立支持編輯操作的索引,并通過執(zhí)行編輯指令實現(xiàn)在編輯后對受編輯影響的信息單元進行自動排版。本發(fā)明有效的解決了對聯(lián)機輸入狀態(tài)下手寫寫入信息和在脫機狀態(tài)下獲取的已有手寫文檔的掃描信息進行編輯完成后,不能實現(xiàn)再排版,影響文檔整體性的技術問題;系統(tǒng)對編輯過程中輸入的編輯符識別準確、高效、識別錯誤率低。
文檔編號G06F17/24GK101452444SQ20081000907
公開日2009年6月10日 申請日期2008年1月26日 優(yōu)先權日2007年12月4日
發(fā)明者馮交交, 尤鳳凱, 梁乃臣, 王曉龍, 陳清財 申請人:哈爾濱工業(yè)大學深圳研究生院