国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖文分離及文字增強(qiáng)方法

      文檔序號:7652625閱讀:330來源:國知局

      專利名稱::圖文分離及文字增強(qiáng)方法
      技術(shù)領(lǐng)域
      :本發(fā)明關(guān)于一種圖文分離及文字增強(qiáng)方法。
      背景技術(shù)
      :多功能事務(wù)機(jī)是目前常用的數(shù)字圖像處理裝置,提供了圖像掃描以及打印等功能。在多功能事務(wù)機(jī)中,圖文分離以及文字增強(qiáng)處理是常被使用的圖像處理技術(shù)。一般的文件圖像多包含圖片以及文字兩部分,通過圖文分離技術(shù)可以分辨出圖像中的圖片以及文字以便做進(jìn)一步的處理。例如,在沒有進(jìn)行圖文分離處理的情況中,當(dāng)進(jìn)行文件打印時,打印機(jī)會使用由多種顏色組成的彩色墨盒來打印整個文件圖像,也就是說即使是文字部分也會使用彩色墨盒打印,對于墨水的使用效率而言,使用以多種顏色組成的彩色墨盒來打印黑色的文字將造成墨水的浪費。而在進(jìn)行圖文分離處理的情況中,打印機(jī)會使用彩色的墨盒打印圖片部分,而使用黑色的墨盒打印文字部分,因而不會造成墨水的浪費。公知的圖文分離處理包含色調(diào)調(diào)整方法、邊緣檢測方法以及彩度亮度檢測方法等等。這些公知的圖文分離方法并沒有針對文件圖像進(jìn)行分類,而是用單一一種處理方式對整份文件進(jìn)行處理。在沒有對圖像進(jìn)行分類處理的情況下所進(jìn)行的圖文分離處理并不能產(chǎn)生好的效果。例如,色調(diào)調(diào)整方法是通過調(diào)整整張文件的色調(diào),如將整張文件亮的圖像調(diào)整為更亮,黑的圖像調(diào)整為更黑,來達(dá)到圖文分離的目的。但是由于是以同一種色調(diào)處理圖片部分及文字部分,因此很容易對整張文件的色調(diào)造成不良影響。此外,邊緣檢測方法容易將文件圖像中的噪聲以及圖片誤認(rèn)為文字,因此造成錯誤的檢測結(jié)果。而使用彩度以及亮度所進(jìn)行的圖文分離方法對于低彩度或無彩度的圖片容易造成誤判的情況。而文字增強(qiáng)的目的則是要讓文字的圖像更清晰。公知的處理文字增強(qiáng)的方法并沒有先將文件中的圖片及文字分離,而是通過調(diào)整整張文件的圖像亮度而達(dá)到使凸顯文字圖像的目的。但這樣的調(diào)整方式會讓文件中的圖片失去原來的色調(diào)。
      發(fā)明內(nèi)容本發(fā)明的主要目的是提供一種圖文分離方法,通過將文件圖像區(qū)分為多個圖像片段,并判斷每一片段的型態(tài)而達(dá)到精確的圖文分離結(jié)果。本發(fā)明的另一目的是提供一種文字增強(qiáng)方法,通過先進(jìn)行一圖文分離處理辨識出圖片與文字,再針對文字部分進(jìn)行增強(qiáng)處理,以達(dá)到良好的文字增強(qiáng)效果。本發(fā)明提供一種圖文分離方法,用以分離一圖像所包含的一圖片部與一文字部,包含(a).—粗略分類步驟,包含al.將該圖像分割為多行,并將每一所述行分割為多個片段,其中每一所述片段包含多個像素;a2.將所述多個片段分為圖片片段、白色片段、黑色片段、網(wǎng)點片段、半網(wǎng)點片段以及未定義片段;a3.計算每一所述片段的亮度轉(zhuǎn)態(tài)數(shù)目,以判斷所述片段是否為一轉(zhuǎn)態(tài)片段或一圖片上文字片段;(b).—進(jìn)階分類步驟,包含bl.判斷所述未定義型態(tài)片段是否為文字片段;b2.將所述多個片段分割為多個區(qū)塊,其中每一所述區(qū)塊包含JxK個片段并依據(jù)每一所述區(qū)塊所包含的片段型態(tài)的數(shù)量決定每一所述區(qū)塊為圖片區(qū)塊、背景區(qū)塊或非圖片區(qū)塊;b3.修正每一所述區(qū)塊內(nèi)的片段屬性;b4.依據(jù)一非圖片區(qū)塊的兩側(cè)相鄰區(qū)塊的屬性判斷是否修改該非圖片區(qū)塊為圖片區(qū)塊;以及(c).一圖片上文字檢測步驟以一圖片上文字片段為中心決定一另一區(qū)塊范圍,該另一區(qū)塊范圍包括LxM個片段,并依據(jù)該另一區(qū)塊范圍內(nèi)包含的圖片上文字片段數(shù)目判斷是否將該另一區(qū)塊范圍內(nèi)的轉(zhuǎn)態(tài)片段修正為圖片上文字片段或是將該另一區(qū)塊范圍內(nèi)的圖片上文字片段修正為圖片片段。優(yōu)選地,在該a2步驟中使用彩度統(tǒng)計、亮度統(tǒng)計、網(wǎng)點檢測以及邊緣檢測決定所述片段所屬的型態(tài)。優(yōu)選地,該彩度統(tǒng)計包括將每一所述片段的每一像素分類為高彩度像素、中彩度像素或低彩度像素,以及決定該像素是否為一圖片像素。優(yōu)選地,該圖像的每一像素依據(jù)以下方式而被區(qū)分為高彩度像素、中彩度像素或低彩度像素以該像素為中心,計算該像素的一周邊范圍內(nèi)所包含的多個像素的每一像素的彩度及亮度,其中該周邊范圍為一MxM矩陣;依據(jù)該彩度及亮度將該周邊范圍內(nèi)的所述多個像素區(qū)分為高彩度像素、中彩度像素以及低彩度像素;以及依據(jù)該周邊范圍內(nèi)的像素所包含的高彩度像素數(shù)目或中彩度像素數(shù)目而決定該像素是否屬于該圖片像素。優(yōu)選地,依據(jù)每一所述片段所包含的圖片像素的數(shù)目而決定該片段是否為-圖片片段。優(yōu)選地,該亮度統(tǒng)計包括使用該圖像的像素亮度數(shù)據(jù)將該圖像的每一像素分類為白色像素、灰色像素或黑色像素。優(yōu)選地,該像素依據(jù)以下方法而被分類為白色像素、灰色像素或黑色像素以該像素為中心,計算該像素的該周邊范圍內(nèi)所包含的多個像素的每一像素的亮度;依據(jù)該亮度將該周邊范圍內(nèi)的所述多個像素分類為白色像素、灰色像素或黑色像素;以及依據(jù)該周邊范圍內(nèi)的像素所包含的白色像素、灰色像素或黑色像素數(shù)目而決定該像素是屬于白色像素、灰色像素或黑色像素。優(yōu)選地,本發(fā)明依據(jù)每一片段所包含的背景像素數(shù)目決定該片段是否為白色片段、依據(jù)每一片段所包含的灰色像素數(shù)目決定該片段是否為圖片片段以及依據(jù)每一片段所包含的黑色像素數(shù)目決定該片段是否為黑色片段。優(yōu)選地,該邊緣檢測包括計算該圖像的每一像素的邊緣值(edgevalue);依據(jù)該邊緣值的絕對值判斷該像素是否為有效邊緣;計算屬于有效邊緣的像素的梯度值(gradient);以及將該梯度值大于零的像素歸類為文字像素,而將該梯度值小于零的像素歸類為白色像素。優(yōu)選地,本發(fā)明依據(jù)每一所述片段所包含的該網(wǎng)點型態(tài)像素數(shù)目而決定該片段是否為一網(wǎng)點片段或一半網(wǎng)點片段。優(yōu)選地,該像素依據(jù)以下方法而被判斷是否為一網(wǎng)點像素以該像素為中心,使用一拉普拉斯(Lapladan)梯度算子計算該像素的該周邊范圍內(nèi)所包含的多個像素是否位于一網(wǎng)點區(qū)域;以及依據(jù)該周邊范圍內(nèi)位于該網(wǎng)點區(qū)域內(nèi)的像素數(shù)目決定該像素是否為一網(wǎng)點像素。優(yōu)選地,該亮度轉(zhuǎn)態(tài)計算包括依據(jù)每一所述片段的像素的亮度分布計算每一所述片段的亮度轉(zhuǎn)態(tài)(tmnsition)數(shù)目;設(shè)定具有至少一亮度轉(zhuǎn)態(tài)的片段為轉(zhuǎn)態(tài)片段;以及依據(jù)三個相鄰轉(zhuǎn)態(tài)片段所包含的亮度轉(zhuǎn)態(tài)數(shù)目來判斷所述多個轉(zhuǎn)態(tài)片段是否至少有一轉(zhuǎn)態(tài)片段被認(rèn)定為圖片上文字片段,其中當(dāng)所述三個相鄰轉(zhuǎn)態(tài)片段的亮度轉(zhuǎn)態(tài)數(shù)目在一數(shù)字范圍內(nèi)且位于所述三個相鄰轉(zhuǎn)態(tài)片段中間的片段為圖片片段時,判斷所述三個相鄰轉(zhuǎn)態(tài)片段的中間片段為圖片上文字片段。優(yōu)選地,該b2步驟包括依據(jù)該區(qū)塊所包含的網(wǎng)點片段數(shù)目以及圖片片段數(shù)目判斷該區(qū)塊是否為一非圖片區(qū)塊;依據(jù)該區(qū)塊所包含的圖片片段數(shù)目、網(wǎng)點片段數(shù)目以及半網(wǎng)點片段數(shù)目的總和而判斷該區(qū)塊是否為圖片區(qū)塊;依據(jù)該區(qū)旨包含的衝片片段數(shù)百與網(wǎng)點片段數(shù)目的總和以及M^J^數(shù)目而判斷該區(qū)塊是否為圖片區(qū)塊;依據(jù)該區(qū)塊所包含的圖片片段數(shù)目而判斷該區(qū)塊是否為圖片區(qū)塊;以及依據(jù)該區(qū)塊所包含的背景片段數(shù)目而判斷該區(qū)塊是否為背景區(qū)塊。優(yōu)選地,在步驟b4中,當(dāng)一非圖片區(qū)塊的相鄰兩側(cè)的至少一區(qū)塊均為圖片區(qū)塊時,修正該非圖片區(qū)塊為圖片區(qū)塊;以及將圖片區(qū)塊中所包含的網(wǎng)點片段及黑色片段修正為圖片片段。本發(fā)明還提供一種文字增強(qiáng)方法,用以增強(qiáng)包含一圖片部以及一文字部的圖像中的該文字部,包括a.—圖文分離步驟,用以分離該圖片部與該文字部,包含將該圖片分割為多行,并將每一所述行分割為多個片段;將所述片段分類為圖片片段、以及文字片段,其中該文字片段為黑色文字片段或白色文字片段;;b.—文字增強(qiáng)步驟,包含當(dāng)該文字片段為黑色文字片段時將該黑色文字片段的亮度值設(shè)定為0或當(dāng)該文字片段為白色文字片段時將該白色文字片段的亮度值設(shè)定為255。在本發(fā)明的另一種文字增強(qiáng)方法中,包括以下步驟a.—圖文分離步驟,用以分離該圖片部與該文字部,包含將該圖片分割為多行,并將每一所述行分割為多個片段;將所述片段分類為圖片片段以及文字片段;b.—文字增強(qiáng)步驟,包含對所述文字片段進(jìn)行銳化處理以加強(qiáng)所述文字片段的對比度。本發(fā)明的圖文分離及文字增強(qiáng)方法能夠輕易地針對每種文件進(jìn)行處理,有效地達(dá)到文字增強(qiáng)的效果,但不會對文件中的圖片部產(chǎn)生不適當(dāng)?shù)纳{(diào)改變。其中,對于代表圖片的圖片片段可以不必處理。而對于代表文字的片段(包含位于背景上的文字以及位于圖片上的文字),可以采用變更亮度值的方法來讓文字更清晰。圖1為一包含圖片部及文字部的文件示意圖。圖2A為文件被分為多行及多個片段的示意圖。圖2B為每一片段被分為多個像素的示意圖。圖3為MxM像素矩陣圖。圖4為亮度轉(zhuǎn)態(tài)示意圖。圖5為相鄰區(qū)塊示意圖。其中,附圖標(biāo)記說明如下10文件100圖片部200文字部Ll-Ln圖像行300圖像片段P1-PN像素具體實施方式請參照圖1,其顯示包含圖片及文字的文件10。如圖1所示,文件10包含圖片部100以及文字部200。其中圖片部100包含有圖案以及圖案上的文字"WELCOME",而文字部200則是由多個字符T所構(gòu)成。本發(fā)明的圖文分離方法即是為了辨識出文件10的圖片部100以及文字部200。而本發(fā)明的文字增強(qiáng)方法則是在完成圖文分離之后,將文字部200的圖像增強(qiáng),以便讓文字部200以及圖片部100內(nèi)的文字更清晰。以下說明本發(fā)明圖文分離方法的細(xì)節(jié)。請參閱圖2A和圖2B,如圖2A所示,本發(fā)明的圖文分離方法主要是將文件10的圖像分為多行L1-Ln,而每一行再被分為多個片段(chip)300。如圖2B所示,其中每一片段300由多個像素組成,在圖2B中以N個像素為例。當(dāng)文件10的圖像被分割為多個片段之后,再依據(jù)多種規(guī)則判斷每一片段是屬于圖片部或文字部,如此即可明確區(qū)分出圖片部100與文字部200。本發(fā)明的圖文分離方法主要包括兩個步驟(1)粗略分類步驟,以及(2)進(jìn)階分類步驟,而在需要時還可加上一檢測圖片上文字的步驟。說明如下。粗略分類步驟在粗略分類步驟中,通過使用彩度統(tǒng)計(chromastatistic)、亮度統(tǒng)計(luminancestatistic)、邊緣檢測(boundarydetection)以及網(wǎng)點檢領(lǐng)!j(screendetection)來將文件10所包含的片段分類為圖片片段(photochip)、白色片段(whitechip)、黑色片段(blackchip)、未定義片段(undefmedchip)、網(wǎng)點片段(screenchip)以及半網(wǎng)點片段(semi-screenchip)。此外,還利用亮度轉(zhuǎn)態(tài)檢測(transitiondetection)尋找出轉(zhuǎn)態(tài)片段(transitionchip)以及圖片上文字片段(text-on-photochip)。G).彩度統(tǒng)計由于文件中的圖片部一般具有高彩度特性,因此可以使用彩度來尋找圖片部。所謂的彩度統(tǒng)計是使用像素的色差值a、b所產(chǎn)生的彩度,以及像素的亮度值L來將像素分類為低彩度(colorless)像素、中彩度(mid-color)像素以及高彩度(colorful)像素。由于像素的彩度值以及亮度值的計算屬于公知,所以在此處不再贅述。依據(jù)每一像素的彩度及亮度值可以判斷該像素是屬于低彩度像素、中彩度像素或高彩度(colorful)像素。如下表所示<table>tableseeoriginaldocumentpage12</column></row><table>例如,當(dāng)像素的彩度大于或等于B1且其亮度值在A1-A2之間時,此像素被歸類為高彩度像素。而當(dāng)像素的彩度小于B1且大于B2,且其亮度值在Al-A2之間時,此像素被歸類為中彩度像素。依此類推。為了判斷圖像片段是否為圖片片段,必須要先判斷每一片段所包含的像素是否為圖片像素。請參照圖3,在圖3中我們要判斷像素P6是否為圖片像素。首先統(tǒng)計以像素P6為中心的周邊范圍內(nèi)的像素所包含的低彩度像素、中彩度像素以及高彩度像素的數(shù)目。在圖3中以MxM矩陣為統(tǒng)計的范圍。再依據(jù)該MxM矩陣范圍內(nèi)所包含的低彩度像素、中彩度像素以及高彩度像素的數(shù)目來決定中心像素P6是否為圖片像素。例如,若MxM矩陣范圍內(nèi)包含超過cl個中彩度像素或是超過c2個高彩度像素,則像素P6被分類為圖片像素。依據(jù)此方法可統(tǒng)計出片段300所包含的像素P1-PN有多少個是圖片像素,再依據(jù)片段300所包含的圖片像素數(shù)目來決定片段300是否為一圖片片段。例如當(dāng)片段300包含的圖片像素大于c3個時即將片段300分類為圖片片段。(2).亮度統(tǒng)計亮度統(tǒng)計主要是將圖像片段分類為白色片段(S卩指文件中的背景部分,又稱為背景片段)、灰色片段以及黑色片段。我們依據(jù)不同的亮度值范圍將圖像區(qū)分為背景、灰色以及黑色,如下表所示<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>如同彩度統(tǒng)計的方式,同樣地,在決定圖像片段是否屬于背景片段、灰色片段或黑色片段之前,必須先判斷每一圖像片段所包含的像素是屬于背景像素、灰色像素或是黑色像素。同圖3所示,以要被進(jìn)行判斷的像素P6為中心,判斷像素P6周邊范圍內(nèi),例如MxM矩陣范圍,的像素是屬于背景像素、灰色像素或黑色像素。依據(jù)MxM矩陣范圍內(nèi)所包含的背景像素、灰色像素以及黑色像素數(shù)目來判斷中心像素P6是哪一種像素。例如,當(dāng)矩陣中有dl個以上的像素是位于"極亮"類別中時,則中心像素P6為背景像素。當(dāng)矩陣中有d2個以上的像素是屬于灰/灰白類別時,則中心像素P6為灰色像素。而當(dāng)矩陣中有d3個以上的像素是屬于暗灰類別時,則中心像素P6為黑色像素。當(dāng)每一片段中的像素屬性被決定之后,接著依據(jù)每一片段所包含的背景像素、灰色像素以及黑色像素的數(shù)目來決定圖像片段的類別。例如,單一圖像片段包含超過d4個像素為背景像素,則此片段為背景片段。單一圖像片段包含超過d5個像素為灰色像素,則此片段為灰色片段。單一圖像片段包含超過d6個像素為黑色像素,則此片段為黑色片段。其中,"背景片段"一般代表的圖片背景大部分是白色。而由于文件圖片一般具有灰色色調(diào),因此"灰色片段"也被視為是圖片片段。此外,"黑色片段"指的是文件中偏黑色的部分。(3).網(wǎng)點檢測像素的亮度統(tǒng)計也可以用來判斷出圖像中的網(wǎng)點區(qū)域。在本發(fā)明中,除了前述的片段型態(tài)之外,我們進(jìn)一步利用亮度的統(tǒng)計來定義出網(wǎng)點片段(screenchip)以及半網(wǎng)點片段(semi-screenchip)。就一般印刷稿的特性而言,有網(wǎng)點的區(qū)域幾乎都是有色彩的區(qū)域。網(wǎng)點片段以及半網(wǎng)點片段系通過每一片段所包含的像素有多少為網(wǎng)點像素而定。例如,當(dāng)一片段中包含了fl個網(wǎng)點像素時即稱此片段為網(wǎng)點片段。當(dāng)一片段中的網(wǎng)點像素數(shù)目大于f2但小于fl時,此片段被稱為半網(wǎng)點片段。片段中的像素是依據(jù)以下的原則而被判定是否屬于網(wǎng)點像素以一像素為中心,使用拉普拉斯(Laplacian)梯度算子計算該像素的MxM矩陣的周邊范圍內(nèi)所包含的多個像素是否位于一網(wǎng)點區(qū)域;依據(jù)該周邊范圍內(nèi)位于該網(wǎng)點區(qū)域內(nèi)的像素數(shù)目決定該像素是否為一網(wǎng)點型態(tài)像素。在MxM范圍內(nèi)如有超過f4個像素位于網(wǎng)點區(qū)域內(nèi),則此中心像素為一網(wǎng)點像素。這些網(wǎng)點片段或半網(wǎng)點片段將進(jìn)一步被修正為圖片片段或圖片上文字片段(text-on-photochip)。(4).邊緣檢測邊緣檢測(edgeorboundarydetection)主要的目的是尋找文字的邊緣,在本發(fā)明中,不屬于圖片片段、背景片段或灰色片段的"未定義"片段即有可能是文件中的文字部。邊緣檢測包含以下步驟1.計算每一像素的邊緣值(edgevalue)。2.依據(jù)像素的邊緣值的絕對值判斷該像素是否為有效邊緣。例如,當(dāng)邊緣值大于el時,此像素為有效邊緣,反之則為無效邊緣。3.計算有效邊緣的像素的梯度值(gradient)。若像素的梯度值大于0,則此像素為低亮度邊緣。若像素的梯度值小于0,則此像素為高亮度邊緣。4.將該梯度值大于零的像素歸類為文字像素,而將該梯度值小于零的像素歸類為背景像素。特別說明的是,由于像素的邊緣值及梯度值的計算為本領(lǐng)域技術(shù)人員所公知,因此本文中不再詳述。(5).亮度轉(zhuǎn)態(tài)檢測亮度轉(zhuǎn)態(tài)檢測(transitiondetection)是用來尋找亮度在空間上或時間上瞬間較劇烈變化的位置,尤其是突然變黑或突然變白的情況。在本發(fā)明中將計算每一片段的亮度轉(zhuǎn)態(tài)的數(shù)目來判斷有哪些片段是屬于亮度轉(zhuǎn)態(tài)片段或是圖片上文字片段(text-on-photochip)。請參閱圖4,其表示了片段中所呈現(xiàn)的亮度轉(zhuǎn)態(tài)。圖4中表示一片段的所有像素的亮度曲線圖,在圖4中出現(xiàn)了像素亮度的劇烈變化T(從高亮度突然變成低亮度,也就是相鄰兩像素的亮度差異很大),而T即被稱為一個亮度轉(zhuǎn)態(tài)(transition)。亮度轉(zhuǎn)態(tài)檢測包括以下步驟依據(jù)每一片段的像素的亮度分布以決定該片段是否具有一亮度轉(zhuǎn)態(tài)(transition);設(shè)定具有該亮度轉(zhuǎn)態(tài)的片段為轉(zhuǎn)態(tài)片段(tmnsitionchip);以及依據(jù)多個相鄰轉(zhuǎn)態(tài)片段所包含的亮度轉(zhuǎn)態(tài)數(shù)目來決定所述多個轉(zhuǎn)態(tài)片段是否至少有一轉(zhuǎn)態(tài)片段被認(rèn)定為一圖片上文字片段。舉例而言,我們計算三個位置相鄰的轉(zhuǎn)態(tài)片段所包含的轉(zhuǎn)態(tài)的數(shù)目總和,如果轉(zhuǎn)態(tài)數(shù)目總和大于gl個且小于g2個時,我們判斷位于中間位置的轉(zhuǎn)態(tài)片段(此轉(zhuǎn)態(tài)片段必須也是在彩度統(tǒng)計時被判定為圖片片段或網(wǎng)點檢測為網(wǎng)點片段)是屬于圖片上文字片段(text-on-photochip)。而轉(zhuǎn)態(tài)數(shù)目總和不符前述標(biāo)準(zhǔn)的片段,仍被視為轉(zhuǎn)態(tài)片段。進(jìn)階分類步驟經(jīng)過前述的彩度統(tǒng)計及亮度統(tǒng)計之后可以將文件圖像分為六種片段,也即,圖片片段、白色片段、黑色片段、未定義片段、網(wǎng)點片段以及半網(wǎng)點片段以供進(jìn)階分類步驟中使用。在進(jìn)階分類步驟中,最終的目標(biāo)在于將所有的片段分類為圖片片段、白色片段、黑色片段以及文字片段(在進(jìn)階分類后,所有的未定義片段都會被視為文字片段)。此外,在進(jìn)階分類步驟之后還加上檢測圖片上文字片段的步驟。為檢測圖片上文字片段,會使用前述亮度轉(zhuǎn)態(tài)檢測所獲得的轉(zhuǎn)態(tài)片段以及圖片上文字片段。在進(jìn)階分類步驟中,我們先進(jìn)一步判斷未定義片段所屬的型態(tài),接著再將多個片段組成區(qū)塊,以區(qū)塊為單位來判斷每一區(qū)塊是屬于圖片區(qū)塊型態(tài)、背景區(qū)塊型態(tài)或非圖片區(qū)塊型態(tài),最后再判斷是否將非圖片型態(tài)區(qū)塊修正為圖片型態(tài)區(qū)塊。換句話說,在進(jìn)階分類階段中,我們以二維的空間概念,利用相鄰片段之間的型態(tài)來細(xì)部修正粗略分類步驟中所獲得的片段的型態(tài)。接著再以多個片段組成的區(qū)塊為單位來判斷每個區(qū)塊的型態(tài),當(dāng)區(qū)塊的型態(tài)被決定之后,區(qū)塊中有些未能被定義的片段即可被歸納為與該區(qū)塊相同的型態(tài)。以下先說明本發(fā)明以片段為單位所進(jìn)行的分類修正。圖片型態(tài)的片段通常是位于文件的圖片部,而白色型態(tài)的片段通常是位于文件底色部分,黑色片段則是文件的黑色部分,而未定義片段則是指未能被明確定義的片段,而這些未定義片段則即有可能是文件中的文字部。然而,未定義片段也可能是圖片片段。因此需在進(jìn)階分類步驟中確認(rèn)這些未定義片段是否屬于文字部。接著說明以區(qū)塊為單位進(jìn)行型態(tài)修正的方法。我們可以令一區(qū)塊包含JxK個片段。依據(jù)每一區(qū)塊的JxK個片段中所包含的片段的型態(tài)來判斷區(qū)塊的型態(tài)。判斷的方式如下表所示。<table>tableseeoriginaldocumentpage16</column></row><table>依據(jù)上表將區(qū)塊分類為非圖片區(qū)塊、圖片區(qū)塊以及背景區(qū)塊之后,根據(jù)目前分類的結(jié)果先將區(qū)塊中有可能成為圖片的片段(例如網(wǎng)點片段、半網(wǎng)點片段和黑色片段)修正成圖片片段或?qū)刖W(wǎng)點片段變成未定義(文字)片段。接著再利用相鄰區(qū)塊間的相關(guān)性做進(jìn)一步的區(qū)塊型態(tài)修正。如圖5所示,對于非圖片型態(tài)區(qū)塊n而言,如果其兩側(cè)相鄰各m個區(qū)塊均為圖片區(qū)塊,則將區(qū)塊n修正為圖片型態(tài)區(qū)塊。圖片型態(tài)區(qū)塊中所包含的網(wǎng)點片段以及黑色片段都會被修正為圖片片段。此外,在進(jìn)階分類步驟完成后,尚未被修正的半網(wǎng)點片段會被視為未定義片段。其它未被處理的未定義片段中的像素如果具有邊緣特性(依據(jù)前述的邊緣檢測步驟),則此未定義片段被分類為文字片段。此外,若單一的未定義片段是由全黑或全白的像素所組成,則此未定義片段被視為是文字片段。而在進(jìn)階分類步驟完成后,所有的未定義片段全部被視為文字片段。圖片上文字檢測步驟此外,為檢測圖片上文字,我們可以依據(jù)另一種區(qū)塊范圍所包含的圖片上文字片段的數(shù)目來決定。此區(qū)塊范圍通常是矩形,也就是水平方向的范圍較長而垂直方向的范圍較短的形狀。此區(qū)塊范圍的選擇通常也和目標(biāo)字體的大小有關(guān)(所謂的目標(biāo)字體大小是指被檢測的文字經(jīng)掃描后該文字的字體圖像所占的像素數(shù)目)。例如,當(dāng)一區(qū)塊所包含的圖片上文字片段的數(shù)目大于某數(shù)值時則認(rèn)定該區(qū)塊是位于文字區(qū)中,此時可將區(qū)塊中的轉(zhuǎn)態(tài)片段修改為圖片上文字片段,而當(dāng)圖片上文字片段的數(shù)目小于該某數(shù)值時,便將圖片上文字片段修改為圖片片段。文字增強(qiáng)經(jīng)過圖文分離的處理之后,我們可以利用此圖文分離的結(jié)果來進(jìn)行文字增強(qiáng)(textenhancement)的處理。由于文件中的圖片與文字己經(jīng)被分類為代表文件圖片部(圖片片段)、背景部(白色片段)及文字部(黑色片段),因此我們可以輕易地針對每種片段進(jìn)行處理,有效地達(dá)到文字增強(qiáng)的效果,但不會對文件中的圖片部產(chǎn)生不適當(dāng)?shù)纳{(diào)改變。其中,對于代表圖片的圖片片段可以不必處理。而對于代表文字的片段(包含位于背景上的文字以及位于圖片上的文字),我們可以采用變更亮度值的方法來讓文字更清晰。詳細(xì)而言,文字片段可依據(jù)其所包含的像素的亮度被分為白色文字片段或黑色文字片段。當(dāng)一文字片段中有Nl個以上的像素的亮度大于亮度Tl時,此文字片段被視為白色文字片段。而當(dāng)一文字片段中有N2個以上的像素的亮度小于亮度T1時,此文字片段被視為黑色文字片段。我們可將黑色文字片段的亮度值設(shè)定為0以及將白色文字片段的亮度值設(shè)定為255。也就是讓黑色的部分更黑,白色的部分更白?;蛘邔⑽淖制沃械乃袛?shù)據(jù)經(jīng)過一銳化屏蔽(imsharpmask)處理,來加強(qiáng)文字片段內(nèi)容的對比度。以上所述僅為本發(fā)明的優(yōu)選實施例,并非用以限定本發(fā)明的保護(hù)范圍,其它在未脫離本發(fā)明所揭示的精神下所完成的等效改變或修飾,均應(yīng)包含在下述的權(quán)利要求的范圍內(nèi)。權(quán)利要求1.一種圖文分離方法,用以分離一圖像所包含的一圖片部與一文字部,包含a.一粗略分類步驟,包含a1.將該圖像分割為多行,并將每一所述行分割為多個片段,其中每一所述片段包含多個像素;a2.將所述多個片段分為圖片片段、白色片段、黑色片段、網(wǎng)點片段、半網(wǎng)點片段以及未定義片段;a3.計算每一所述片段的亮度轉(zhuǎn)態(tài)數(shù)目,以判斷所述片段是否為一轉(zhuǎn)態(tài)片段或一圖片上文字片段;b.一進(jìn)階分類步驟,包含b1.判斷該未定義型態(tài)片段是否為文字片段;b2.將所述多個片段分割為多個區(qū)塊,其中每一所述區(qū)塊包含JxK個片段并依據(jù)每一所述區(qū)塊所包含的片段型態(tài)的數(shù)量決定每一所述區(qū)塊為圖片區(qū)塊、背景區(qū)塊或非圖片區(qū)塊;b3.修正每一所述區(qū)塊內(nèi)的片段的屬性;b4.依據(jù)一非圖片區(qū)塊的兩側(cè)相鄰區(qū)塊的屬性判斷是否修改該非圖片區(qū)塊為圖片區(qū)塊;以及c.一圖片上文字檢測步驟以一圖片上文字片段為中心決定一另一區(qū)塊范圍,該另一區(qū)塊范圍包括LxM個片段,并依據(jù)該另一區(qū)塊范圍內(nèi)包含的圖片上文字片段數(shù)目判斷是否將該另一區(qū)塊范圍內(nèi)的轉(zhuǎn)態(tài)片段修正為圖片上文字片段或是將該另一區(qū)塊范圍內(nèi)的圖片上文字片段修正為圖片片段。2.如權(quán)利要求1所述的圖文分離方法,其中,在該a2步驟中使用彩度統(tǒng)計、亮度統(tǒng)計、網(wǎng)點檢測以及邊緣檢測決定所述片段所屬的型態(tài)。3.如權(quán)利要求2所述的圖文分離方法,其中該彩度統(tǒng)計包括將每一所述片段的每一像素分類為高彩度像素、中彩度像素或低彩度像素;以及決定所述像素是否為一圖片像素。4.如權(quán)利要求3所述的圖文分離方法,其中該圖像的每一像素是依據(jù)以下方式而被區(qū)分為高彩度像素、中彩度像素或低彩度像素以該像素為中心,計算該像素的一周邊范圍內(nèi)所包含的多個像素的每一像素的彩度及亮度,其中該周邊范圍為一MxM矩陣;依據(jù)該彩度及亮度將該周邊范圍內(nèi)的所述多個像素區(qū)分為高彩度像素、中彩度像素以及低彩度像素;以及依據(jù)該周邊范圍內(nèi)的像素所包含的高彩度像素數(shù)目或中彩度像素數(shù)目而決定該像素是否屬于該圖片像素。5.如權(quán)利要求4所述的圖文分離方法,其中,依據(jù)每一所述片段所包含的該圖片像素的數(shù)目而決定所述片段是否為一圖片片段。6.如權(quán)利要求5所述的圖文分離方法,其中該亮度統(tǒng)計包括使用該圖像的像素的亮度數(shù)據(jù)將該圖像的每一像素分類為白色像素、灰色像素或黑色像素。7.如權(quán)利要求6所述的圖文分離方法,其中該像素是依據(jù)以下方法而被分類為白色像素、灰色像素或黑色像素以該像素為中心,計算該像素的該周邊范圍內(nèi)所包含的多個像素的每一像素的亮度;依據(jù)該亮度將該周邊范圍內(nèi)的所述多個像素分類為白色像素、灰色像素或黑色像素;以及依據(jù)該周邊范圍內(nèi)的像素所包含的白色像素、灰色像素或黑色像素數(shù)目而決定該像素是屬于白色像素、灰色像素或黑色像素。8.如權(quán)利要求7所述的圖文分離方法,其中,依據(jù)每一片段所包含的背景像素數(shù)目決定該片段是否為白色片段、依據(jù)每一片段所包含的灰色像素數(shù)目決定該片段是否為圖片片段以及依據(jù)每一片段所包含的黑色像素數(shù)目決定該片段是否為黑色片段。9.如權(quán)利要求8所述的圖文分離方法,其中該邊緣檢測包括計算該圖像的每一像素的邊緣值;依據(jù)該邊緣值的絕對值判斷該像素是否為有效邊緣;計算屬于有效邊緣的像素的梯度值;以及將該梯度值大于零的像素歸類為文字像素,而將該梯度值小于零的像素歸類為白色像素。10.如權(quán)利要求9所述的圖文分離方法,其中依據(jù)每一所述片段所包含的該網(wǎng)點型態(tài)像素數(shù)目而決定所述片段是否為一網(wǎng)點片段或一半網(wǎng)點片段。11.如權(quán)利要求9所述的圖文分離方法,其中該像素是依據(jù)以下方法而被判斷是否為一網(wǎng)點像素以該像素為中心,使用一拉普拉斯梯度算子計算該像素的該周邊范圍內(nèi)所包含的多個像素是否位于一網(wǎng)點區(qū)域;依據(jù)該周邊范圍內(nèi)位于該網(wǎng)點區(qū)域內(nèi)的像素數(shù)目決定該像素是否為一網(wǎng)點像素。12.如權(quán)利要求ll所述的圖文分離方法,其中該亮度轉(zhuǎn)態(tài)計算包括依據(jù)每一所述片段的像素的亮度分布計算每一所述片段的亮度轉(zhuǎn)態(tài)數(shù)目;設(shè)定具有至少一亮度轉(zhuǎn)態(tài)的片段為轉(zhuǎn)態(tài)片段;以及依據(jù)三個相鄰轉(zhuǎn)態(tài)片段所包含的亮度轉(zhuǎn)態(tài)數(shù)目來判斷所述多個轉(zhuǎn)態(tài)片段是否至少有一轉(zhuǎn)態(tài)片段被認(rèn)定為圖片上文字片段,其中當(dāng)所述三個相鄰轉(zhuǎn)態(tài)片段的亮度轉(zhuǎn)態(tài)數(shù)目在一數(shù)字范圍內(nèi)且位于所述三個相鄰轉(zhuǎn)態(tài)片段中間的片段為圖片片段時,判斷所述三個相鄰轉(zhuǎn)態(tài)片段的中間片段為圖片上文字片段。13.如權(quán)利要求12所述的圖文分離方法,其中在該b2步驟包括依據(jù)所述區(qū)塊所包含的網(wǎng)點片段數(shù)目以及圖片片段數(shù)目判斷所述區(qū)塊是否為一非圖片區(qū)塊;依據(jù)所述區(qū)塊所包含的圖片片段數(shù)目、網(wǎng)點片段數(shù)目以及半網(wǎng)點片段數(shù)目的總和而判斷所述區(qū)塊是否為圖片區(qū)塊;依據(jù)所述區(qū)塊所包含的圖片片段數(shù)目與網(wǎng)點片段數(shù)目的總和以及黑色片段數(shù)目而判斷所述區(qū)塊是否為圖片區(qū)塊;依據(jù)所述區(qū)塊所包含的圖片片段數(shù)目而判斷所述區(qū)塊是否為圖片區(qū)塊;以及依據(jù)所述區(qū)塊所包含的背景片段數(shù)目而判斷所述區(qū)塊是否為背景區(qū)塊。14.如權(quán)利要求13所述的圖文分離方法,在步驟b4中,當(dāng)一非圖片區(qū)塊的相鄰兩側(cè)的至少一區(qū)塊均為圖片區(qū)塊時,修正該非圖片區(qū)塊為圖片區(qū)塊;以及將圖片區(qū)塊中所包含的網(wǎng)點片段及黑色片段修正為圖片片段。15.—種文字增強(qiáng)方法,用以增強(qiáng)包含一圖片部以及一文字部的圖像中的該文字部,包括a.—圖文分離步驟,用以分離該圖片部與該文字部,包含將該圖片分割為多行,并將每一所述行分割為多個片段;將所述片段分類為圖片片段以及文字片段,其中該文字片段為黑色文字片段或白色文字片段;b.—文字增強(qiáng)步驟,包含當(dāng)該文字片段為黑色文字片段時將該黑色文字片段的亮度值設(shè)定為0或當(dāng)該文字片段為白色文字片段時將該白色文字片段的亮度值設(shè)定為255。16.—種文字增強(qiáng)方法,用以增強(qiáng)包含一圖片部以及一文字部的圖像中的該文字部,包括a.—圖文分離步驟,用以分離該圖片部與該文字部,包含將該圖片分割為多行,并將每一所述行分割為多個片段;將所述片段分類為圖片片段以及文字片段;b.—文字增強(qiáng)步驟,包含對所述文字片段進(jìn)行銳化處理以加強(qiáng)所述文字片段的對比度。全文摘要本發(fā)明提供一種圖文分離及文字增強(qiáng)方法。該圖文分離方法用以分離一圖像的圖片部與文字部,包含一粗略分類步驟,一進(jìn)階分類步驟以及一圖片上文字檢測步驟。該文字增強(qiáng)方法,用以增強(qiáng)包含一圖片部以及一文字部的圖像中的該文字部,包括a.一圖文分離步驟,用以分離該圖片部與該文字部,包含將該圖片分割為多行,并將每一所述行分割為多個片段;將所述片段分類為圖片片段以及文字片段;b.一文字增強(qiáng)步驟,包含對所述文字片段進(jìn)行銳化處理以加強(qiáng)所述文字片段的對比度。本發(fā)明的圖文分離及文字增強(qiáng)方法對所獲得的文字部進(jìn)行亮度調(diào)整以增強(qiáng)該文字部的圖像。文檔編號H04N1/387GK101291384SQ200710100860公開日2008年10月22日申請日期2007年4月20日優(yōu)先權(quán)日2007年4月20日發(fā)明者廖武杰,殷孟云申請人:致伸科技股份有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1