橫向校對和輸出雙層pdf的方法和裝置制造方法
【專利摘要】一種橫向校對和輸出雙層PDF的方法和裝置,涉及文字處理領(lǐng)域。本發(fā)明實(shí)施例提供的方法,包括如下步驟:從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;修改錯誤文字和修改文字位置;根據(jù)字符圖像位置和大小輸出雙層PDF文件。本發(fā)明適用于文字校對、雙層PDF文件加工系統(tǒng)。本發(fā)明為解決目前書籍資料電子化生成雙層PDF過程中文字位置校正精度低、效率低的問題而發(fā)明。利用OCR識別的文字位置信息導(dǎo)入行圖像和字符圖像的位置,在文字校對的過程中,通過拆分、合并和調(diào)整字符圖像位置,使輸出的雙層PDF文件文字層和圖像層完全重合,相對之前的雙層PDF生成方法,本發(fā)明大大減少了修改工作量,提高了雙層PDF質(zhì)量,以所見即所得的方式生成雙層PDF文件。
【專利說明】橫向校對和輸出雙層PDF的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于文字處理領(lǐng)域,涉及一種數(shù)據(jù)校對和輸出雙層TOF的方法和裝置,具體涉及一種橫向校對和輸出雙層HF的方法和裝置。
【背景技術(shù)】
[0002]一個完整的數(shù)據(jù)校對和輸出雙層TOF的系統(tǒng)分為以下部分:紙質(zhì)資料的掃描、圖像處理、圖像版面分析、字符識別、橫向校對、輸出雙層HF、修改PDF文字層字符大小和位置。
[0003]橫向校對就是以字符為背景,調(diào)用字符所對應(yīng)的圖像與字符進(jìn)行比對,同時,以顏色標(biāo)記識別可信度和修改過的文字。由于以字符為背景,無法在校對過程中修改字符圖像拆分錯誤和調(diào)整字符圖像精度,使輸出的雙層PDF文件文字層和圖像層對應(yīng)的精度低,字符大小不準(zhǔn)確。后期使用其他工具修改字符大小和位置的工作量非常大。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問題是提出一種橫向校對方法和裝置,將對于文檔中識別轉(zhuǎn)換時拆分錯誤的字符圖像進(jìn)行合并和拆分,調(diào)整字符圖像位置,使字符位置和字符圖像位置一一精確對應(yīng),使輸出的雙層PDF文件和該裝置校對時的效果達(dá)到所見即所得的效果。提高了校對效率和輸出精度。
[0005]本發(fā)明公開了一種橫向校對和輸出雙層PDF的方法,包括以下步驟:
步驟1:從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;
步驟2:修改字符和字符圖像位置;
步驟3:根據(jù)字符圖像位置和大小輸出雙層PDF文件;
所述步驟I包括以下步驟:
步驟1.1:根據(jù)每個字符在圖像中的位置,分析出行圖像,計算出行圖像的位置。
[0006]步驟1.2:根據(jù)每個字符在圖像中的位置和所在行圖像的位置,使用行圖像的上下邊界和字符圖像左右邊界形成的矩形框得到字符圖像的位置。
[0007]所述步驟2包括以下步驟:
步驟2.1:瀏覽字符圖像和字符文字,查找錯誤字符和位置錯誤的文字圖像;
步驟2.2:對識別成多個字符結(jié)果的字符圖像進(jìn)行合并處理;對識別成單個字符結(jié)果的多個字符圖像進(jìn)行拆分處理;修改錯誤的文字;調(diào)整字符圖像的位置和大??;
所述步驟2.1中,有以下幾種顯示方式:
方式3.1:以圖像為背景,文字行顯示在圖像行的上方或下方;
方式3.2:以圖像為背景,文字行和圖像行完全重合;
方式3.3:文字行和圖像行交錯顯示;
所述步驟2.1中,文字行和圖像行有以下幾種對齊方式: 方式4.1:文字行中每個字符相對于圖像行中的字符圖像居中對齊;
方式4.2:文字行整行相對于圖像行居中對齊;
所述步驟2.2的合并處理是:合并所述多個字符結(jié)果的外接矩形,得到正確的字符圖像。
[0008]所述步驟2.2的拆分處理是:將選中的字符圖像外接矩形分成左右兩個字符圖像。
[0009]所述步驟2.2的調(diào)整字符圖像的位置和大小是:調(diào)整字符圖像的外接矩形的大小和位置,選中字符圖像,調(diào)整外接矩形框的寬度、高度或者位置。
[0010]所述步驟3中輸出雙層PDF文件時根據(jù)行圖像高度計算字體大小,根據(jù)文字圖像中心位置計算輸出字符的中心位置。
[0011]本發(fā)明還公開了一種橫向校對和輸出雙層TOF的裝置,其特征在于:包括以下模塊:
輸入模塊,從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;
校對模塊,修改字符和字符圖像位置;
輸出模塊,根據(jù)字符圖像位置和大小輸出雙層PDF文件。
[0012]OCR識別過程中,存在文字識別錯誤和文字圖像拆分錯誤,一個字符圖像被識別成多個字符,多個字符圖像被識別成一個字符。傳統(tǒng)的校對方式是以識別后的文字為背景,只能修改識別錯誤的文字,無法修改文字和圖像的對應(yīng)關(guān)系。本發(fā)明橫向校對和輸出雙層HF的方法和裝置的優(yōu)點(diǎn)在于:在橫向校對時以圖像為背景,提取每個文字圖像行對應(yīng)的字符行進(jìn)行校對,校對過程中可以相對于每個字符圖像對齊顯示字符,可以拆分、合并和調(diào)整文字對應(yīng)的圖像位置。在輸出雙層TOF時,使用文字對應(yīng)的圖像的大小計算文字大小和位置輸出。使輸出的雙層PDF文件和該裝置校對時的效果達(dá)到所見即所得的效果。提高了校對效率和輸出精度。
【專利附圖】
【附圖說明】
[0013]圖1為本發(fā)明橫向校對方法和輸出雙層PDF的流程圖;
圖2為本發(fā)明橫向校對和輸出雙層PDF方法在拆分前顯示狀態(tài)圖;
圖3為本發(fā)明橫向校對和輸出雙層PDF方法在拆分后顯示狀態(tài)圖;
圖4為本發(fā)明橫向校對和輸出雙層PDF方法在合并前顯示狀態(tài)圖;
圖5為本發(fā)明橫向校對和輸出雙層PDF方法在合并后顯示狀態(tài)圖;
圖6為本發(fā)明橫向校對和輸出雙層PDF方法在改正文字和調(diào)整字符圖像位置后顯示狀態(tài)圖;
圖7為本發(fā)明橫向校對和輸出雙層PDF方法在輸出前顯示狀態(tài)圖;
圖8為本發(fā)明橫向校對和輸出雙層PDF方法在輸出后顯示狀態(tài)圖;
圖9為本發(fā)明數(shù)據(jù)標(biāo)引導(dǎo)入字符外接矩形和生成文字行的算法流程。
【具體實(shí)施方式】
[0014]為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0015]本發(fā)明公開了一種橫向校對和輸出雙層TOF的方法,如圖1所示,包括以下步驟: 步驟1:從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置,根據(jù)每個文字外
接矩形構(gòu)建文字行的位置。如果文字外接矩形上邊緣小于文字行下邊緣,文字行上邊緣小于文字外接矩形下邊緣,那么認(rèn)定該文字在該行中。文字行外接矩形是該行中所有文字外接矩形的合并結(jié)果。具體算法流程見附圖9。
[0016]步驟2:修改字符和字符圖像位置;
逐行比對字符圖像和字符圖像對應(yīng)的字符文字,找到錯誤字符和位置錯誤的文字圖像。本實(shí)施例中,字符圖像和對應(yīng)的字符居中顯示時,很容易發(fā)現(xiàn)錯誤的字符和不正確的字符拆分。如圖2所示的是多個字符被識別成單個字符圖像的情況。如圖4所示的是單個字符被識別成多個字符圖像的情況。
[0017]當(dāng)一個字符圖像被識別成多個字符結(jié)果時,進(jìn)行合并處理,選中多個字符,合并這些字符的外接矩形,得到正確的字符圖像。如圖5所示的是合并后的處理結(jié)果。對識別成單個字符結(jié)果的多個字符圖像進(jìn)行拆分處理,將選中的字符圖像外接矩形分成左右兩個字符圖像,如圖3所示的是拆分后的處理結(jié)果。修改錯誤的文字;調(diào)整字符圖像的外接矩形的大小和位置,選中字符圖像,調(diào)整外接矩形框的寬度、高度或者位置。如圖6所示的是改正文字和調(diào)整字符圖像位置后的處理結(jié)果。
[0018]所述步驟2中,本實(shí)施例中有以下幾種顯示方式:
如圖2、圖3和圖6所示以圖像為背景,文字行顯示在圖像行的上方或下方;
如圖7所示以圖像為背景,文字行和圖像行完全重合;
如圖4和圖5所示,文字行和圖像行交錯顯示;
所述步驟2中,本實(shí)施例中文字行和圖像行有以下幾種對齊方式:
如圖2和圖4所示,文字行中每個字符相對于圖像行中的字符圖像居中對齊;
如圖3和圖5所示,文字行整行相對于圖像行居中對齊;
所述步驟3中,本實(shí)施例先向PDF文件輸出圖像層,然后根據(jù)校對后字符圖像位置,得到文本層的輸出位置,根據(jù)字符圖像外接矩形寬度得到文字大小,輸出文本層。得到雙層PDF文件,如圖7所示是輸出前,如圖8所示是輸出后同時顯示文字和圖像的效果圖。
[0019]本發(fā)明還公開了一種橫向校對和輸出雙層TOF的裝置,包括以下模塊:
一種橫向校對和輸出雙層PDF的裝置,包括以下模塊:
輸入模塊,從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;其中,導(dǎo)入行圖像和字符圖像的位置包括:根據(jù)每個字符在圖像中的位置,分析出行圖像,計算出行圖像的位置;根據(jù)每個字符在圖像中的位置和所在行圖像的位置,使用行圖像的上下邊界和字符圖像左右邊界形成的矩形框得到字符圖像的位置;
校對模塊,修改字符和字符圖像位置;其中,修改字符和字符圖像位置包括:瀏覽字符圖像和字符文字,查找錯誤字符和位置錯誤的文字圖像;對識別成多個字符結(jié)果的字符圖像進(jìn)行合并處理;對識別成單個字符結(jié)果的多個字符圖像進(jìn)行拆分處理;修改錯誤的文字;調(diào)整字符圖像的位置和大小;
輸出模塊,根據(jù)字符圖像位置和大小輸出雙層PDF文件。
[0020]本發(fā)明首先對于文檔中識別成單個字符的多個字符圖像進(jìn)行拆分,對于文檔中識別成多個字符的單個字符圖像進(jìn)行合并,對精度錯誤的字符位置進(jìn)行調(diào)整,得到字符圖像和字符完全對應(yīng)的結(jié)果,并且按多種顯示方式顯示,方便檢查和改錯。使字符位置和字符圖像位置一一精確對應(yīng),使輸出的雙層PDF文件和該裝置校對時的效果達(dá)到所見即所得的效果。提高了校對效率和輸出精度。
【權(quán)利要求】
1.一種橫向校對和輸出雙層HF的方法,包括以下步驟: 步驟1:從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置; 步驟2:修改字符和字符圖像位置; 步驟3:根據(jù)字符圖像位置和大小輸出雙層PDF文件; 其中, 所述步驟I的導(dǎo)入行圖像和字符圖像的位置,包括以下步驟: 步驟1.1:根據(jù)每個字符在圖像中的位置,分析出行圖像,計算出行圖像的位置; 步驟1.2:根據(jù)每個字符在圖像中的位置和所在行圖像的位置,使用行圖像的上下邊界和字符圖像左右邊界形成的矩形框得到字符圖像的位置; 所述步驟2的修改字符和字符圖像位置,包括以下步驟: 步驟2.1:瀏覽字符圖像和字符文字,查找錯誤字符和位置錯誤的文字圖像; 步驟2.2:對識別成多個字符結(jié)果的字符圖像進(jìn)行合并處理;對識別成單個字符結(jié)果的多個字符圖像進(jìn)行拆分處理;修改錯誤的文字;調(diào)整字符圖像的位置和大小。
2.根據(jù)權(quán)利要求1所述的方法,所述步驟2.1中,有以下幾種顯示方式: 方式3.1:以圖像為背景,文字行顯示在圖像行的上方或下方; 方式3.2:以圖像為背景,文字行和圖像行完全重合; 方式3.3:文字行和圖像行交錯顯示。
3.根據(jù)權(quán)利要求1所述的方法,所述步驟2.1中,文字行和圖像行有以下幾種對齊方式: 方式4.1:文字行中每個字符相對于圖像行中的字符圖像居中對齊; 方式4.2:文字行整行相對于圖像行居中對齊。
4.根據(jù)權(quán)利要求1所述的方法,所述步驟2.2的合并處理是:合并所述多個字符結(jié)果的外接矩形,得到正確的字符圖像。
5.根據(jù)權(quán)利要求1所述的方法,所述步驟2.2的拆分處理是:將選中的字符圖像外接矩形分成左右兩個字符圖像。
6.根據(jù)權(quán)利要求1所述的方法,所述步驟2.2的調(diào)整字符圖像的位置和大小是:調(diào)整字符圖像的外接矩形的大小和位置,選中字符圖像,調(diào)整外接矩形框的寬度、高度或者位置。
7.根據(jù)權(quán)利要求1所述的方法,所述步驟3中,輸出雙層PDF文件時根據(jù)行圖像高度計算字體大小,根據(jù)文字圖像中心位置計算輸出文字的中心位置。
8.—種橫向校對和輸出雙層PDF的裝置,包括以下模塊: 輸入模塊,從OCR識別引擎記錄的每個字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;其中,導(dǎo)入行圖像和字符圖像的位置包括:根據(jù)每個字符在圖像中的位置,分析出行圖像,計算出行圖像的位置;根據(jù)每個字符在圖像中的位置和所在行圖像的位置,使用行圖像的上下邊界和字符圖像左右邊界形成的矩形框得到字符圖像的位置; 校對模塊,修改字符和字符圖像位置;其中,修改字符和字符圖像位置包括:瀏覽字符圖像和字符文字,查找錯誤字符和位置錯誤的文字圖像;對識別成多個字符結(jié)果的字符圖像進(jìn)行合并處理;對識別成單個字符結(jié)果的多個字符圖像進(jìn)行拆分處理;修改錯誤的文字;調(diào)整字符圖像的位置和大??;輸出模塊,根據(jù)字符圖像位置和大小輸出`雙層PDF文件。
【文檔編號】G06F17/25GK103714047SQ201310558843
【公開日】2014年4月9日 申請日期:2013年11月12日 優(yōu)先權(quán)日:2013年11月12日
【發(fā)明者】段雅東, 陳永生, 高志強(qiáng) 申請人:知識產(chǎn)權(quán)出版社