專利名稱:文件傾斜角度的估算方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明關(guān)于一種估算方法及其裝置,特別是關(guān)于估算于掃描一文件時(shí)所產(chǎn)生的傾斜角度的方法及其裝置。
背景技術(shù):
在復(fù)印或掃描文件時(shí),有時(shí)會(huì)因?yàn)槭褂谜唠S意擺放文件而導(dǎo)致掃描出歪斜的圖像。當(dāng)文件數(shù)量很多的時(shí)候,使用者必須由手動(dòng)的方式一頁(yè)一頁(yè)將文件擺正,相當(dāng)費(fèi)時(shí)也費(fèi)事。
常規(guī)技術(shù)中,文件傾斜角度可利用軟件的方式計(jì)算進(jìn)而將其轉(zhuǎn)正。如美國(guó)專利第6,493,470號(hào)所公開(kāi)的方法,即是利用軟件程序來(lái)執(zhí)行掃描文件傾斜角度轉(zhuǎn)正功能。
本發(fā)明的主要目的在于提供一種估算文件傾斜的角度并且將文件掃描圖像轉(zhuǎn)正的方法。
發(fā)明內(nèi)容
本發(fā)明的一目的在于提供一種估算一傾斜角度的方法,其可用于估算掃描一文件時(shí)所產(chǎn)生的傾斜角度,進(jìn)而將掃描圖像轉(zhuǎn)正。
本發(fā)明的另一目的在于提供一種用以估算一傾斜角度的裝置,其可自動(dòng)地估算掃描一文件時(shí)所產(chǎn)生的傾斜角度,進(jìn)而將掃描圖像轉(zhuǎn)正。
根據(jù)本發(fā)明估算掃描一文件時(shí)所產(chǎn)生的傾斜角度的方法中,首先掃描文件以產(chǎn)生一第一掃描數(shù)據(jù)。接著將第一掃描數(shù)據(jù)轉(zhuǎn)換為一灰度圖像(grayimage),再依據(jù)一閾值將灰度圖像轉(zhuǎn)換為二元圖像(binary image)。
判斷二元圖像有否包含圖形(graph)區(qū),若有則自二元圖像中刪除圖形區(qū)以產(chǎn)生一刪除二元圖像。利用一預(yù)定判別方式并依據(jù)刪除二元圖像,計(jì)算傾斜角度。再以一第二預(yù)定分辨率掃描文件,以產(chǎn)生一第二掃描數(shù)據(jù);以及依據(jù)計(jì)算出的傾斜角度,旋轉(zhuǎn)第二掃描數(shù)據(jù)。
本發(fā)明估算傾斜角度的方法中,可設(shè)計(jì)軟件程序自動(dòng)去計(jì)算出掃描文件的傾斜角度,并且自動(dòng)進(jìn)行文件掃描圖像轉(zhuǎn)正的工作。因此應(yīng)用本發(fā)明估算傾斜角度的方法于掃描或復(fù)印文件時(shí),不需要由使用者利用手動(dòng)的方式一張一張去擺正待掃描/復(fù)印的文件,以節(jié)省時(shí)間與人力。
關(guān)于本發(fā)明的優(yōu)點(diǎn)與精神可以經(jīng)由以下的發(fā)明詳述及所附圖示得到進(jìn)一步的了解。
圖1為本發(fā)明估算文件傾斜角度裝置的系統(tǒng)方塊圖。
圖2為本發(fā)明估算文件傾斜角度方法利用的直方圖的示意圖。
圖3為本發(fā)明估算文件傾斜角度方法的閾值運(yùn)算方法流程圖。
圖4為本發(fā)明估算文件傾斜角度方法的掩膜判斷法的示意圖。
圖5為本發(fā)明估算文件傾斜角度方法的步驟流程6為本發(fā)明估算文件傾斜角度方法的另一實(shí)施例的步驟流程圖。
附圖標(biāo)號(hào)說(shuō)明10估算裝置 11控制器12轉(zhuǎn)換模塊 14判斷模塊16計(jì)算模塊 30掩膜具體實(shí)施方式
請(qǐng)參閱圖1,圖1為本發(fā)明文件傾斜角度的估算裝置10的系統(tǒng)方塊圖。本發(fā)明的估算裝置10用以估算于掃描一文件時(shí)所產(chǎn)生的傾斜角度。估算裝置10包含一控制器11、一轉(zhuǎn)換模塊12、一判斷模塊14、以及一計(jì)算模塊16。
控制器11用一預(yù)定分辨率掃描一文件以產(chǎn)生一第一掃描數(shù)據(jù)。該預(yù)定分辨率必須以降低文件的圖像,以無(wú)法辨識(shí)文件的文字內(nèi)容為目標(biāo)。于一實(shí)施例中,該預(yù)定分辨率約為30dpi。于另一實(shí)施例中,該預(yù)定分辨率為掃描文件時(shí)預(yù)覽(preview)圖像所使用的分辨率。
轉(zhuǎn)換模塊12用以將第一掃描數(shù)據(jù)轉(zhuǎn)換為一二元圖像(binary image)。判斷模塊14用以判斷該二元圖像有否包含一圖形區(qū);若有,則自該二元圖像中刪除圖形區(qū)以產(chǎn)生一刪除二元圖像。計(jì)算模塊16利用一預(yù)定判別方式并依據(jù)刪除二元圖像,計(jì)算傾斜角度。
請(qǐng)參閱圖2及圖3,圖2為圖1的轉(zhuǎn)換模塊12所利用的一直方圖(histogram)的示意圖,圖3為圖1轉(zhuǎn)換模塊12所利用的閾值的運(yùn)算方法流程圖。轉(zhuǎn)換模塊12將第一掃描數(shù)據(jù)轉(zhuǎn)換為一灰度圖像(gray image),并且依據(jù)一閾值將該灰度圖像轉(zhuǎn)換為一二元圖像(binary image)。以下將利用一具有256個(gè)色彩級(jí)的直方圖的實(shí)施例來(lái)說(shuō)明灰度圖像轉(zhuǎn)換為二元圖像的方式。于圖2所示的實(shí)施例中,灰度圖像分為256個(gè)級(jí),即0至255個(gè)級(jí)。每個(gè)級(jí)包含的圖像個(gè)數(shù)即代表所轉(zhuǎn)換的灰度圖像在該級(jí)所占的圖像個(gè)數(shù)。例如,當(dāng)?shù)谝粧呙钄?shù)據(jù)轉(zhuǎn)換為灰度圖像后,經(jīng)由這種直方圖可以得到灰度圖像中,每個(gè)級(jí)所占的圖像個(gè)數(shù),并據(jù)以設(shè)定一閾值(threshold)以將圖像轉(zhuǎn)換為二元圖像。
該閾值的設(shè)定則考慮到文字與背景的關(guān)系。于一實(shí)施例中,狀態(tài)一為背景暗而文字亮的情況,狀態(tài)二為背景亮而文字暗的情況;該閾值的公式分別為公式一及公式二。
公式一(狀態(tài)一)threshold=max{n|Σi=0nHi<X*&Tgr;};]]>公式二(狀態(tài)二)threshold=min{n|Σi=0nHi>(1-X)*T}.]]>上述公式一、二中,i代表第i個(gè)級(jí),X為實(shí)驗(yàn)觀察而得的背景占全部文字的百分比,H為直方圖中每個(gè)級(jí)中所占個(gè)數(shù)的累計(jì)值,T為所有像素的個(gè)數(shù)。
于一實(shí)施例中,該閾值可利用軟件系統(tǒng)加以運(yùn)算。圖3顯示該閾值的運(yùn)算流程的一實(shí)施例;將灰度圖像直方圖內(nèi)所得到的數(shù)據(jù),輸入該運(yùn)算流程,可求得一級(jí)的值即為threshold。依據(jù)threshold值可將灰度圖像直方圖分成兩個(gè)區(qū)域,進(jìn)而將圖像轉(zhuǎn)換為二元圖像,而二元圖像可視為只有黑色及白色兩種色彩即0與1,其中0代表二元圖像內(nèi)色彩為黑色的圖像,而1則代表二元圖像內(nèi)色彩為白色的圖像。以上說(shuō)明為灰度圖像轉(zhuǎn)換為二元圖像的閾值動(dòng)態(tài)計(jì)算的一實(shí)施例。有關(guān)閾值的取決方式有許多種,且為本領(lǐng)域所公知,因此其他方式不再詳述。
判斷模塊14用以判斷該二元圖像有否包含一圖形區(qū)。判斷模塊14可依據(jù)一種四連通(4-connectivity)方法、一種八連通(8-connectivity)方法或一掩膜(mask)方法,判斷二元圖像有否包含圖形(graph)區(qū)。若有,則自該二元圖像中刪除圖形區(qū)以產(chǎn)生一刪除二元圖像。四連通方法、八連通方法皆為業(yè)界所常規(guī)。其相連通的區(qū)域若大于某預(yù)定值,則視為欲刪除的圖形區(qū)。
請(qǐng)參閱圖4,圖4為圖1的判斷模塊14所利用掩膜的示意圖。于另一實(shí)施例中,判斷模塊14利用掩膜法來(lái)判斷二元圖像有否包含圖形(graph)區(qū)。于圖4所示的實(shí)施例為一個(gè)3*3掩膜,將此掩膜利用在二元圖像上,如果二元圖像中的區(qū)域?qū)?yīng)掩膜乘積和大于一預(yù)定值時(shí),如大于4時(shí),則判定此塊區(qū)域?yàn)橐粓D形區(qū)。此方法的復(fù)雜度遠(yuǎn)小于四連通、八連通方法。
計(jì)算模塊16利用一預(yù)定判別方式并依據(jù)刪除二元圖像,計(jì)算傾斜角度。計(jì)算模塊16的預(yù)定判別方式包含一霍夫轉(zhuǎn)換(Hough Transform)步驟,其利用霍夫轉(zhuǎn)換如下ρ=xcosθ+ysinθ;0θ<π。
在霍夫轉(zhuǎn)換中,(x,y)座標(biāo)平面上共線的M個(gè)點(diǎn),于(ρ,θ)座標(biāo)平面相對(duì)應(yīng)為交于同一點(diǎn)的M條正弦曲線。利用霍夫轉(zhuǎn)換此特性,可將刪除二元圖像上的點(diǎn)集合的(x,y)座標(biāo)值轉(zhuǎn)換為(ρ,θ)平面上的正弦曲線集合,這些正弦曲線將依其文件上文字的方向性,大部分會(huì)交于具有相近θ值的多個(gè)點(diǎn)。利用這些點(diǎn)集合的數(shù)值,以平均或比重的計(jì)算方式,即可得到文件傾斜的近似角度值(θ)。
控制器11并可以一第二預(yù)定分辨率掃描文件,以產(chǎn)生一第二掃描數(shù)據(jù),其中第二預(yù)定分辨率即為一般掃描文件的正常分辨率,能完整掃描出文件上的數(shù)據(jù)。其中第一預(yù)定分辨率低于第二預(yù)定分辨率??刂破?1依據(jù)計(jì)算出來(lái)的文件傾斜角度旋轉(zhuǎn)第二掃描數(shù)據(jù)將文件轉(zhuǎn)正。
請(qǐng)參閱圖5,圖5為本發(fā)明估算文件傾斜角度方法的步驟流程圖。本發(fā)明亦提供于掃描一文件時(shí)所產(chǎn)生傾斜角度的估算方法。利用本發(fā)明估算文件傾斜角度方法掃描一文件的流程包含下列步驟S40掃描該文件以產(chǎn)生一第一掃描數(shù)據(jù);S42將第一掃描數(shù)據(jù)轉(zhuǎn)換為一灰度圖像(gray image);S44依據(jù)一閾值將該灰度圖像轉(zhuǎn)換為該二元圖像(binary image);S46判斷該二元圖像有否包含一圖形(graph)區(qū)。若有,則進(jìn)行步驟S48;若否,則跳至步驟S50;S48自該二元圖像中刪除該圖形區(qū),以產(chǎn)生一刪除二元圖像;S50利用一預(yù)定判別方式,計(jì)算該傾斜角度;S52以一第二預(yù)定分辨率掃描該文件,以產(chǎn)生一第二掃描數(shù)據(jù);S54依據(jù)該傾斜角度,旋轉(zhuǎn)該第二掃描數(shù)據(jù)。
請(qǐng)參閱圖6,圖6為本發(fā)明估算文件傾斜角度方法的另一實(shí)施例的步驟流程圖。于另一實(shí)施例中,利用本發(fā)明估算文件傾斜角度方法掃描一文件的流程包含下列步驟S80掃描該文件產(chǎn)生掃描數(shù)據(jù);S82降低該掃描數(shù)據(jù)的分辨率;S84判斷掃描數(shù)據(jù)是否為彩色圖像。若是,跳至步驟S90;若否,則進(jìn)行步驟S86;S86判斷掃描數(shù)據(jù)是否為灰度圖像。若是,則跳至步驟92;若否,則進(jìn)行步驟S88;S88判斷掃描數(shù)據(jù)是否為二元圖像。若是,則跳至步驟94;若否,則重新開(kāi)始;S90將彩色圖像轉(zhuǎn)換為灰度圖像;S92將灰度圖像轉(zhuǎn)換為二元圖像;S94刪除二元圖像的圖形區(qū),以產(chǎn)生刪除二元圖像;S96進(jìn)行霍夫轉(zhuǎn)換;S98計(jì)算傾斜角度值;S100旋轉(zhuǎn)掃描數(shù)據(jù)。
于圖6所示的實(shí)施例中,不需掃描文件兩次,只需降低掃描數(shù)據(jù)的分辨率,即可計(jì)算出傾斜角度并將文件轉(zhuǎn)正,因此可節(jié)省時(shí)間及人力。
本發(fā)明估算傾斜角度的方法或裝置可利用軟件,自動(dòng)去計(jì)算出掃描文件的傾斜角度,并且自動(dòng)進(jìn)行文件掃描圖像轉(zhuǎn)正的工作。因此應(yīng)用本發(fā)明估算傾斜角度的方法或裝置于掃描或復(fù)印文件時(shí),不需要由使用者利用手動(dòng)的方式一張一張去擺正待掃描/復(fù)印的文件,以節(jié)省時(shí)間與人力。
經(jīng)由以上較佳具體實(shí)施例的詳述,希望能更加清楚描述本發(fā)明的特征與精神,而并非以上述所公開(kāi)的較佳具體實(shí)施例來(lái)對(duì)本發(fā)明的范疇加以限制。相反地,其目的是希望能涵蓋各種改變及具等效性的安排于本發(fā)明所欲申請(qǐng)的范圍的范疇內(nèi)。因此,本發(fā)明所申請(qǐng)的范圍的范疇?wèi)?yīng)根據(jù)上述的說(shuō)明作最寬廣的解釋,以致使其涵蓋所有可能的改變以及具等效性的安排。
權(quán)利要求
1.一種估算一傾斜角度的方法,該傾斜角度于掃描一文件時(shí)所產(chǎn)生,該方法包含下列步驟(a)掃描該文件以產(chǎn)生一第一掃描數(shù)據(jù);(b)將該第一掃描數(shù)據(jù)轉(zhuǎn)換為一二元圖像;(c)判斷該二元圖像有否包含一圖形區(qū),若有則自該二元圖像中刪除該圖形區(qū)以產(chǎn)生一刪除二元圖像;以及(d)利用一預(yù)定判別方式并依據(jù)該刪除二元圖像,計(jì)算該傾斜角度。
2.如權(quán)利要求第1所述的方法,該方法還包含(e)以一第二預(yù)定分辨率掃描該文件,以產(chǎn)生一第二掃描數(shù)據(jù);以及(f)依據(jù)該傾斜角度,旋轉(zhuǎn)該第二掃描數(shù)據(jù)。
3.如權(quán)利要求第2所述的方法,第(a)步驟以一第一預(yù)定分辨率進(jìn)行掃描,其中該第一預(yù)定分辨率小于該第二預(yù)定分辨率。
4.如權(quán)利要求第1所述的方法,其中第(b)步驟包含(b1)將該第一掃描數(shù)據(jù)轉(zhuǎn)換為一灰度圖像;以及(b2)將該灰度圖像轉(zhuǎn)換為該二元圖像。
5.如權(quán)利要求第4所述的方法,其中第(b2)步驟依據(jù)一閾值將該灰度圖像轉(zhuǎn)換為該二元圖像。
6.如權(quán)利要求第1所述的方法,其中第(c)步驟依據(jù)一種四連通判斷法,判斷該二元圖像有否包含該圖形區(qū)。
7.如權(quán)利要求第1所述的方法,其中第(c)步驟依據(jù)一種八連通判斷法,判斷該二元圖像有否包含該圖形區(qū)。
8.如權(quán)利要求第1所述的方法,其中第(c)步驟依據(jù)一掩膜(mask)方法,判斷該二元圖像有否包含該圖形區(qū)。
9.如權(quán)利要求第1所述的方法,其中第(d)步驟的該預(yù)定判別方式包含一霍夫轉(zhuǎn)換步驟。
10.如權(quán)利要求第1所述的方法,該方法還包含(g)依據(jù)該傾斜角度,旋轉(zhuǎn)該第一掃描數(shù)據(jù)。
11.如權(quán)利要求第10所述的方法,其中第(b)步驟包含(bI)降低該第一掃描數(shù)據(jù),以產(chǎn)生低分辨率的該第一掃描數(shù)據(jù)。(bII)將低分辨率的該第一掃描數(shù)據(jù)轉(zhuǎn)換為一灰度圖像;(bIII)將該灰度圖像轉(zhuǎn)換為該二元圖像。
12.一種用以估算傾斜角度的裝置,該傾斜角度于掃描一文件時(shí)所產(chǎn)生,該估算裝置包含一控制器,用以掃描該文件以產(chǎn)生一第一掃描數(shù)據(jù);一轉(zhuǎn)換模塊,用以將該第一掃描數(shù)據(jù)轉(zhuǎn)換為一二元圖像;一判斷模塊,用以判斷該二元圖像有否包含一圖形區(qū),若有則自該二元圖像中刪除該圖形區(qū)以產(chǎn)生一刪除二元圖像;一計(jì)算模塊,利用一預(yù)定判別方式并依據(jù)該刪除二元圖像,計(jì)算該傾斜角度。
13.如權(quán)利要求第12所述的估算裝置,其中該控制器以一第二預(yù)定分辨率掃描該文件,以產(chǎn)生一第二掃描數(shù)據(jù);并且依據(jù)該傾斜角度,旋轉(zhuǎn)該第二掃描數(shù)據(jù)。
14.如權(quán)利要求第13所述的估算裝置,該控制器以一第一預(yù)定分辨率進(jìn)行掃描,其中該第一預(yù)定分辨率小于該第二預(yù)定分辨率。
15.如權(quán)利要求第12所述的估算裝置,其中轉(zhuǎn)換模塊將該第一掃描數(shù)據(jù)轉(zhuǎn)換為一灰度圖像,并且將該灰度圖像轉(zhuǎn)換為該二元圖像。
16.如權(quán)利要求第15所述的估算裝置,其中轉(zhuǎn)換模塊依據(jù)一閾值將該灰度圖像轉(zhuǎn)換為該二元圖像。
17.如權(quán)利要求第12所述的估算裝置,其中該判斷模塊依據(jù)一種四連通判斷法,判斷該二元圖像有否包含該圖形區(qū)。
18.如權(quán)利要求第12所述的估算裝置,其中該判斷模塊依據(jù)一種八連通判斷法,判斷該二元圖像有否包含該圖形區(qū)。
19.如權(quán)利要求第12所述的估算裝置,其中該判斷模塊依據(jù)一掩膜方法,判斷該二元圖像有否包含該圖形區(qū)。
20.權(quán)利要求第12所述的估算裝置,其中計(jì)算模塊的該預(yù)定判別方式包含一霍夫轉(zhuǎn)換步驟。
21.如權(quán)利要求第12所述的估算裝置,其中該轉(zhuǎn)換模塊先降低該第一掃描數(shù)據(jù)的分辨率,以產(chǎn)生低分辨率的該第一掃描數(shù)據(jù),將低分辨率的該第一掃描數(shù)據(jù)轉(zhuǎn)換該灰度圖像,再將該灰度圖像轉(zhuǎn)換為該二元圖像。
全文摘要
本發(fā)明提供一種估算一傾斜角度的方法,傾斜角度于掃描一文件時(shí)所產(chǎn)生。首先掃描文件以產(chǎn)生一第一掃描數(shù)據(jù),將第一掃描數(shù)據(jù)轉(zhuǎn)換為一二元圖像。判斷二元圖像有否包含一圖形區(qū),若有則自二元圖像中刪除圖形區(qū)以產(chǎn)生一刪除二元圖像。然后利用一預(yù)定判別方式并依據(jù)刪除二元圖像,計(jì)算傾斜角度。
文檔編號(hào)H04N1/047GK1734471SQ20041005657
公開(kāi)日2006年2月15日 申請(qǐng)日期2004年8月10日 優(yōu)先權(quán)日2004年8月10日
發(fā)明者鄧宜珍 申請(qǐng)人:明基電通股份有限公司