圖像處理裝置制造方法
【專利摘要】本發(fā)明的圖像處理裝置能夠高速地檢測(cè)出原圖像中的濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符;在該圖像處理裝置中,邊緣圖像生成部(1)生成由從原圖像中檢測(cè)出的邊緣構(gòu)成的邊緣圖像;連通像素提取部(2)提取該邊緣圖像內(nèi)的連通像素集合;二值圖像生成部(4)按照連通像素集合的顏色對(duì)連通像素集合進(jìn)行分類并針對(duì)各種顏色生成字符圖像;另外,背景圖像生成部(5)根據(jù)該字符圖像生成原圖像的背景圖像;然后,圖像壓縮部(6)將字符圖像的圖像數(shù)據(jù)和背景圖像的圖像數(shù)據(jù)按照互不相同的壓縮方式加以壓縮;而且,二值圖像生成部(4)根據(jù)與連通像素集合外接的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像內(nèi)的亮度值來確定該連通像素集合為濃度反轉(zhuǎn)字符、標(biāo)準(zhǔn)字符以及非字符中的哪一種,并針對(duì)濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符生成字符圖像。
【專利說明】I圖像生成部,其檢測(cè)原圖像中的邊緣并生&素提取部,其提取上述邊緣圖像內(nèi)的連通素集合的顏色對(duì)上述連通像素集合進(jìn)行分中,上述字符圖像為二值圖像;背景圖像生景圖像;以及圖像壓縮部,其將上述字符圖1:不相同的壓縮方式加以壓縮。而且,上述的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像內(nèi)符、標(biāo)準(zhǔn)字符以及非字符中的哪一種,并且I!字符圖像。
度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符。
中的濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符。`[0013]邊緣圖像生成部I檢測(cè)原圖像中的邊緣,并生成由檢測(cè)出的上述邊緣構(gòu)成的邊緣圖像。在該實(shí)施方式中,邊緣圖像是表示檢測(cè)出的邊緣的高濃度側(cè)像素的位置的圖像,且是二值圖像。即,檢測(cè)出的邊緣的高濃度側(cè)像素的值為1,其他像素的值為O。
[0014]在該實(shí)施方式中,原圖像為多值的彩色圖像,邊緣圖像生成部I僅生成原圖像的亮度成分的圖像,并在該圖像中檢測(cè)邊緣且生成由檢測(cè)出的邊緣構(gòu)成的邊緣圖像。
[0015]連通像素提取部2提取邊緣圖像內(nèi)的連通像素集合,并以能夠作為一個(gè)集合進(jìn)行識(shí)別的方式來管理相連的連通像素(connected pixel)。即,當(dāng)一個(gè)連通像素與另一個(gè)連通像素未連通時(shí),則以能夠作為兩個(gè)集合分別進(jìn)行識(shí)別的方式來管理這兩個(gè)連通像素。另外,連通像素集合是由上述高濃度側(cè)像素(像素值為I的像素)中的一個(gè)單獨(dú)像素或者相互連通的多個(gè)像素構(gòu)成。
[0016]連通像素結(jié)合部3檢測(cè)與連通像素集合外接的矩形相互靠近的多個(gè)連通像素集合,并將該多個(gè)連通像素集合結(jié)合為一個(gè)連通像素集合。即,當(dāng)兩個(gè)連通像素集合被結(jié)合時(shí),則作為一個(gè)連通像素集合進(jìn)行管理。例如,當(dāng)與連通像素集合外接的矩形的一部分重疊或者與連通像素集合外接的矩形之間的距離小于規(guī)定值等的規(guī)定條件成立時(shí),則將這些連通像素集合加以結(jié)合。
[0017]二值圖像生成部4按照連通像素集合的顏色(即原圖像內(nèi)的顏色)對(duì)連通像素集合進(jìn)行分類,并針對(duì)各種顏色分別生成字符圖像(character image)。該字符圖像為二值圖像。此時(shí),根據(jù)不符合字符(即非字符)的連通像素集合以外的其他連通像素集合而生成字符圖像。
[0018]例如,當(dāng)存在五個(gè)連通像素集合A?E,且原圖像中的連通像素集合A、B為第一顏色、原圖像中的連通像素集合C為第二顏色(不同于第一顏色的顏色)、原圖像中的連通像素集合D、E為第三顏色(不同于第一、第二顏色的顏色)時(shí),針對(duì)第一顏色而生成連通像素集合A、B位置處的像素值為1、其他位置處的像素值為O的字符圖像,針對(duì)第二顏色而生成連通像素集合C位置處的像素值為1、其他位置處的像素值為O的字符圖像,針對(duì)第三顏色而生成連通像素集合D、E位置處的像素值為1、其他位置處的像素值為O的字符圖像。
[0019]背景圖像生成部5根據(jù)上述字符圖像生成原圖像的背景圖像。具體來說,背景圖像生成部5根據(jù)字符圖像來確定上述字符圖像中的字符的位置(即像素值為I的像素的位置),并如下那樣變換原圖像中的該位置處的像素值,從而生成背景圖像。
[0020]背景圖像生成部5將原圖像中的、字符圖像位置(即字符圖像內(nèi)像素值為I的像素的位置)處的像素值變換為與連通像素集合外接的矩形周圍的至少一部分像素在原圖像中的像素值的平均值,從而生成背景圖像。
[0021]圖2是表示在圖1所示的圖像處理裝置中提取出的連通像素集合的一例的圖。
[0022]圖2(A)所示的例子是在原圖像中存在“工”這一字符時(shí)的例子,在該例子中,檢測(cè)到連通像素集合101,并確定了與該連通像素集合101外接的矩形102。在該例子中,根據(jù)矩形102周圍的附以星狀標(biāo)記的像素在原圖像中的像素值來確定背景圖像中的、該連通像素集合101的位置處的像素值。
[0023]圖2(B)所示的例子是在原圖像中存在“E”這一字符時(shí)的例子,在該例子中,檢測(cè)到連通像素集合111,并確定了與該連通像素集合111外接的矩形112。在該例子中,根據(jù)矩形112周圍的附以星狀標(biāo)記的像素在原圖像中的像素值來確定背景圖像中的、該連通像素集合ill的位置處的像素值。
[0024]圖2(C)所示的例子是在原圖像中存在“9”這一字符時(shí)的例子,在該例子中,檢測(cè)到連通像素集合121,并確定了與該連通像素集合121外接的矩形122。在該例子中,根據(jù)矩形122周圍的附以星狀標(biāo)記的像素在原圖像中的像素值來確定背景圖像中的、該連通像素集合121的位置處的像素值。
[0025]另外,背景圖像生成部5也可以將原圖像中的、字符圖像位置處的像素值變換為上述矩形周圍的所有像素在原圖像中的像素值的平均值,從而生成背景圖像。
[0026]另外,背景圖像生成部5也可以將原圖像中的、字符圖像位置處的像素值變換為位于上述矩形周圍的四個(gè)頂點(diǎn)處的四個(gè)像素(圖2中的黑色星狀標(biāo)記的像素)在原圖像中的像素值的平均值,從而生成背景圖像。
[0027]另外,當(dāng)存在被結(jié)合的連通像素集合時(shí),二值圖像生成部4按照該連通像素集合的結(jié)合組(group)的顏色對(duì)結(jié)合后的連通像素集合進(jìn)行分類,并針對(duì)各種顏色分別生成字符圖像。此時(shí),當(dāng)未被結(jié)合的連通像素集合的顏色與被結(jié)合的連通像素集合的顏色相同時(shí),則它們被包含在同一字符圖像中。而且,針對(duì)結(jié)合后的連通像素集合,背景圖像生成部5將原圖像中的、字符圖像位置處的像素值變換為與結(jié)合后的連通像素集合整體外接的矩形周圍的至少一部分像素在原圖像中的像素值的平均值,從而生成背景圖像。
[0028]圖像壓縮部6將上述字符圖像的圖像數(shù)據(jù)和背景圖像的圖像數(shù)據(jù)按照互不相同的壓縮方式加以壓縮。例如,圖像壓縮部6將字符圖像的圖像數(shù)據(jù)按照MMR(ModifiedModified READ、改進(jìn)的二維壓縮編碼)方式加以壓縮,而將背景圖像的圖像數(shù)據(jù)按照J(rèn)PEG (Joint Photographic Experts Group、聯(lián)合圖像專家組)方式加以壓縮。另外,字符圖像的圖像數(shù)據(jù)存在與顏色的數(shù)量相同數(shù)量的數(shù)據(jù)并且分別被壓縮。另外,各種顏色的值以與該顏色的字符圖像的壓縮后的圖像數(shù)據(jù)相對(duì)應(yīng)的方式進(jìn)行管理。
[0029]接下來,對(duì)于上述圖像處理裝置的動(dòng)作進(jìn)行說明。
[0030]首先,邊緣圖像生成部I檢測(cè)原圖像中的邊緣,并生成由檢測(cè)出的邊緣構(gòu)成的邊緣圖像。
[0031]接著,連通像素提取部2提取邊緣圖像內(nèi)的連通像素集合,并以能夠作為一個(gè)集合進(jìn)行識(shí)別的方式來管理相連的連通像素。
[0032]此時(shí),連通像素結(jié)合部3確定與由連通像素提取部2提取出的連通像素集合外接的矩形的位置和尺寸,當(dāng)存在該矩形相互靠近的連通像素集合時(shí),檢測(cè)出該矩形相互靠近的連通像素集合并將其結(jié)合為一個(gè)連通像素集合。
[0033]然后,二值圖像生成部4按照連通像素集合的顏色(即原圖像內(nèi)的顏色)對(duì)連通像素集合進(jìn)行分類,并針對(duì)各種顏色分別生成字符圖像。
[0034]由此,按照顏色生成字符圖像。
[0035]另外,背景圖像生成部5根據(jù)上述字符圖像生成原圖像的背景圖像。此時(shí),如上所述,背景圖像生成部5將原圖像中的、字符圖像位置處的像素值變換為與連通像素集合外接的矩形周圍的至少一部分像素在原圖像中的像素值的平均值,從而生成背景圖像。
[0036]由此,生成背景圖像。
[0037]然后,圖像壓縮部6將上述字符圖像的圖像數(shù)據(jù)和背景圖像的圖像數(shù)據(jù)按照互不相同的壓縮方式加以壓縮。[0038]由此,將字符圖像和背景圖像從原圖像中分離出來,并將各圖像數(shù)據(jù)分別加以壓縮。
[0039]另外,上述實(shí)施方式涉及的圖像處理裝置如下那樣檢測(cè)與空心字符(outlinecharacter)等的濃度反轉(zhuǎn)字符(thickness inverted character)(即濃度低于背景的字符)對(duì)應(yīng)的連通像素集合。二值圖像生成部4根據(jù)與連通像素集合(包括結(jié)合后的連通像素集合)外接的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像內(nèi)的亮度值來確定連通像素集合為標(biāo)準(zhǔn)字符(normal character)(濃度反轉(zhuǎn)字符以外的其他字符)、濃度反轉(zhuǎn)字符以及非字符(non-character)中的哪一種。
[0040]在該實(shí)施方式中,當(dāng)與連通像素集合(包括結(jié)合后的連通像素集合)外接的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像內(nèi)的亮度值全部大于規(guī)定的二值化閾值時(shí),二值圖像生成部4判斷連通像素集合為標(biāo)準(zhǔn)字符,當(dāng)上述四個(gè)亮度值全部小于該二值化閾值時(shí),二值圖像生成部4判斷連通像素集合為濃度反轉(zhuǎn)字符,在其他情況下,二值圖像生成部4判斷連通像素集合為非字符。
[0041]與標(biāo)準(zhǔn)字符時(shí)同樣地,濃度反轉(zhuǎn)字符時(shí)也如上述實(shí)施方式所示按照濃度反轉(zhuǎn)字符的顏色生成字符圖像。即,針對(duì)濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符生成字符圖像,而不針對(duì)非字符生成字符圖像。
[0042]圖3是表示在圖1所示的圖像處理裝置中提取出的連通像素集合的另一例的圖。
[0043]圖3(A)所示的例子是在原圖像中存在“工”這一空心字符時(shí)的例子,在該例子中,檢測(cè)到連通像素集合201,并確定了與該連通像素集合201外接的矩形202。在此,根據(jù)矩形202內(nèi)的四個(gè)頂點(diǎn)處的像素(白色星狀標(biāo)記的像素)在原圖像中的亮度值來確定該連通像素集合201為空心字符。
[0044]圖3(B)所示的例子是在原圖像中存在“E”這一空心字符時(shí)的例子,在該例子中,檢測(cè)到連通像素集合211,并確定了與該連通像素集合211外接的矩形212。在此,根據(jù)矩形212內(nèi)的四個(gè)頂點(diǎn)處的像素(白色星狀標(biāo)記的像素)在原圖像中的亮度值來確定該連通像素集合211為空心字符。
[0045]圖3(C)所示的例子是在原圖像中存在“I”這一空心字符時(shí)的例子,在該例子中,檢測(cè)到連通像素集合221,并確定了與該連通像素集合221外接的矩形222。在此,根據(jù)矩形222內(nèi)的四個(gè)頂點(diǎn)處的像素(白色星狀標(biāo)記的像素)在原圖像中的亮度值來確定該連通像素集合221為空心字符。
[0046]如上所述,根據(jù)上述實(shí)施方式,邊緣圖像生成部I檢測(cè)原圖像中的邊緣并生成由檢測(cè)出的邊緣構(gòu)成的邊緣圖像,連通像素提取部2提取該邊緣圖像內(nèi)的連通像素集合,二值圖像生成部4按照連通像素集合的顏色對(duì)連通像素集合進(jìn)行分類,并針對(duì)各種顏色分別生成字符圖像,其中,該字符圖像為二值圖像。
[0047]另外,背景圖像生成部5根據(jù)該字符圖像生成原圖像的背景圖像。然后,圖像壓縮部6將字符圖像的圖像數(shù)據(jù)和背景圖像的圖像數(shù)據(jù)按照互不相同的壓縮方式加以壓縮。而且,二值圖像生成部4根據(jù)與連通像素集合外接的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像中的亮度值來確定該連通像素集合為濃度反轉(zhuǎn)字符、標(biāo)準(zhǔn)字符以及非字符中的哪一種,并且針對(duì)濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符生成字符圖像。
[0048]由此,由于是通過僅提取關(guān)于具有點(diǎn)(dot)的像素的連通像素集合而不提取關(guān)于不具有點(diǎn)的像素的連通像素集合,由此來檢測(cè)濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符,因此,能夠高速地檢測(cè)出原圖像中的濃度反轉(zhuǎn)字符和標(biāo)準(zhǔn)字符。
[0049]另外,上述實(shí)施方式為本發(fā)明的適宜的例子,但本發(fā)明并不限定于此,在不脫離本發(fā)明的要旨的范圍內(nèi)能夠進(jìn)行各種變形、變更。
[0050](工業(yè)上的可利用性)
[0051 ] 本發(fā)明可以適用于例如圖像數(shù)據(jù)的壓縮中。
【權(quán)利要求】
1.一種圖像處理裝置,其特征在于,具備: 邊緣圖像生成部,其檢測(cè)原圖像中的邊緣并生成由檢測(cè)出的所述邊緣構(gòu)成的邊緣圖像; 連通像素提取部,其提取所述邊緣圖像內(nèi)的連通像素集合; 二值圖像生成部,其按照所述連通像素集合的顏色對(duì)所述連通像素集合進(jìn)行分類,并針對(duì)各種所述顏色分別生成字符圖像,其中,所述字符圖像為二值圖像; 背景圖像生成部,其根據(jù)所述字符圖像生成所述原圖像的背景圖像;以及 圖像壓縮部,其將所述字符圖像的圖像數(shù)據(jù)和所述背景圖像的圖像數(shù)據(jù)按照互不相同的壓縮方式加以壓縮, 所述二值圖像生成部,根據(jù)與所述連通像素集合外接的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像內(nèi)的亮度值,確定所述連通像素集合為濃度反轉(zhuǎn)字符、標(biāo)準(zhǔn)字符以及非字符中的哪一種,并且針對(duì)所述濃度反轉(zhuǎn)字符和所述標(biāo)準(zhǔn)字符生成所述字符圖像。
2.如權(quán)利要求1所述的圖像處理裝置,其特征在于, 當(dāng)所述亮度值全部小于規(guī)定的二值化閾值時(shí),所述二值圖像生成部判斷所述連通像素集合為濃度反轉(zhuǎn)字符, 當(dāng)所述亮度值全部大于所述二值化閾值時(shí),所述二值圖像生成部判斷所述連通像素集合為標(biāo)準(zhǔn)字符, 當(dāng)所述亮度值中的至少一個(gè)大于所述二值化閾值且所述亮度值中的至少一個(gè)小于所述二值化閾值時(shí),所述二值圖像生成部判斷所述連通像素集合為非字符。
3.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于, 所述圖像處理裝置還具備連通像素結(jié)合部,其中,所述連通像素結(jié)合部檢測(cè)與所述連通像素集合外接的矩形相互靠近的多個(gè)所述連通像素集合,并將多個(gè)所述連通像素集合結(jié)合為一個(gè)連通像素集合, 針對(duì)結(jié)合后的連通像素集合,所述二值圖像生成部根據(jù)與結(jié)合后的連通像素集合外接的矩形內(nèi)的四個(gè)頂點(diǎn)處的像素在原圖像內(nèi)的亮度值來確定結(jié)合后的連通像素集合為濃度反轉(zhuǎn)字符、標(biāo)準(zhǔn)字符以及非字符中的哪一種。
4.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于, 所述背景圖像生成部將所述原圖像中的、所述字符圖像的位置處的像素值變換為所述矩形周圍的至少一部分像素在所述原圖像中的像素值的平均值,從而生成所述背景圖像。
5.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于, 所述原圖像為多值的彩色圖像, 所述邊緣圖像生成部?jī)H生成所述原圖像的亮度成分的圖像,并在該圖像中檢測(cè)邊緣且生成由檢測(cè)出的所述邊緣構(gòu)成的邊緣圖像。
【文檔編號(hào)】H04N19/00GK103841416SQ201310596423
【公開日】2014年6月4日 申請(qǐng)日期:2013年11月22日 優(yōu)先權(quán)日:2012年11月27日
【發(fā)明者】六尾敏明, 馬場(chǎng)政樹 申請(qǐng)人:京瓷辦公信息系統(tǒng)株式會(huì)社