国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種在自然場(chǎng)景圖像中基于極值連通域的中文檢測(cè)方法與流程

      文檔序號(hào):11601911閱讀:276來(lái)源:國(guó)知局
      一種在自然場(chǎng)景圖像中基于極值連通域的中文檢測(cè)方法與流程
      本發(fā)明涉及一種圖像處理技術(shù)領(lǐng)域,具體地說(shuō),涉及的是一種在自然場(chǎng)景圖像中基于極值連通域的文字檢測(cè)方法。

      背景技術(shù):
      文本是計(jì)算機(jī)視覺(jué)的許多應(yīng)用中的一項(xiàng)重要特征。圖像中的文本存有很多有用的信息,對(duì)視覺(jué)內(nèi)容理解和獲取至關(guān)重要。文本提取的主要目的是將文本圖像轉(zhuǎn)化為符號(hào)形式,從而利于修改、檢索、利用及傳輸。文本定位是文本提取的一個(gè)重要步驟。文本定位是對(duì)圖像中文本位置的精確定位?;跇O值連通域的文本定位方法首先將圖像表示為一個(gè)個(gè)的連通域,然后從結(jié)構(gòu)分析出發(fā),通過(guò)合并方法將文本行標(biāo)示,輸出結(jié)果。傳統(tǒng)的合并方法在處理一些結(jié)構(gòu)復(fù)雜的漢字時(shí)效果不甚理想。外語(yǔ)如最常見(jiàn)的英語(yǔ)單詞字符之間一般水平排列。對(duì)于中文文字,情況更加復(fù)雜。經(jīng)檢索,本申請(qǐng)人申請(qǐng)的公開(kāi)號(hào)為103093228A、申請(qǐng)?zhí)枮?01310017804.8的發(fā)明專(zhuān)利申請(qǐng),該發(fā)明公開(kāi)了一種在自然場(chǎng)景圖像中基于極值連通域的中文檢測(cè)方法,該方法首先獲取自然場(chǎng)景圖像,將自然場(chǎng)景圖像進(jìn)行筆劃寬度變換預(yù)處理;筆劃寬度變換的輸出是一個(gè)圖像,該圖像的每一個(gè)像素值代表原始圖像相應(yīng)位置的像素的最大可能筆劃寬度,在這一步中進(jìn)行圖像像素的連通域標(biāo)定;在獲得連通分量之后,提取連通分量的各種特征,這些特征組合能很好的表達(dá)連通分量;從中文結(jié)構(gòu)出發(fā),首先執(zhí)行字內(nèi)合并,接著執(zhí)行字間合并,字內(nèi)合并方法檢測(cè)單個(gè)的漢字,字間合并方法檢測(cè)文本行,并用矩形框?qū)ξ谋緟^(qū)域加以標(biāo)定。該發(fā)明使用筆劃寬度變換提取連通域的方法在部分中文字體的識(shí)別上效果不佳,原因是此類(lèi)字體字內(nèi)筆畫(huà)寬度變化較大。

      技術(shù)實(shí)現(xiàn)要素:
      本發(fā)明的目的在于針對(duì)目前圖像文本定位上的定位不甚理想的情況,提出一種在自然場(chǎng)景圖像中基于極值連通域的中文檢測(cè)方法,采用基于最大穩(wěn)定極值區(qū)域的提取方法,可以克服上述問(wèn)題,提高識(shí)別效果。為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:本發(fā)明抓住文字區(qū)域邊緣表現(xiàn)的特征,利用分離的最大穩(wěn)定極值區(qū)域提取連通區(qū)域,并利用文字的結(jié)構(gòu)信息來(lái)進(jìn)行連通區(qū)域的合并,提高對(duì)字內(nèi)對(duì)比度變化較大的文字的檢測(cè),同時(shí)實(shí)現(xiàn)文字區(qū)域定位和分割,方法簡(jiǎn)單有效。這種方法以文字在圖像中的特殊表現(xiàn)為出發(fā)點(diǎn),在文字檢測(cè)方面具有更好的針對(duì)性,因此具有更高的主動(dòng)性和精確性。具體的,本發(fā)明所述的基于極值連通域的文字檢測(cè)的方法,包括以下步驟:第一步,進(jìn)行分離的最大穩(wěn)定極值區(qū)域提取,分離的最大穩(wěn)定極值區(qū)域輸出是一系列互不交疊的區(qū)域,在這一步中將進(jìn)行圖像像素的連通域標(biāo)定。第二步,在獲得連通分量之后,提取連通分量的各種特征,這些特征組合必須能很好的表達(dá)連通分量。第三步,得到連通分量的各種特征之后,從文字結(jié)構(gòu)出發(fā),首先執(zhí)行字內(nèi)合并,接著執(zhí)行字間合并,字內(nèi)合并方法檢測(cè)單個(gè)的文字,字間合并方法檢測(cè)文本行。第四步,分析文本行的角點(diǎn)分布,篩選得到文字區(qū)域,并用矩形框?qū)ξ谋緟^(qū)域加以標(biāo)定。上述第一步中,需要對(duì)原始圖像進(jìn)行分離的最大穩(wěn)定極值區(qū)域提取,具體過(guò)程如下:(1)在進(jìn)行分離的最大穩(wěn)定極值區(qū)域提取之前,將彩色圖像轉(zhuǎn)化為灰度圖像;(2)利用穩(wěn)定極值區(qū)域算法提取圖像的極值區(qū)域;(3)獲取(2)中極值區(qū)域的生長(zhǎng)樹(shù),生長(zhǎng)樹(shù)包含的區(qū)域以及區(qū)域間關(guān)系由它們?cè)趫D像中的位置和重疊情況確定;(4)分離的最大穩(wěn)定極值區(qū)域,將極值區(qū)域生長(zhǎng)樹(shù)上的相鄰區(qū)域進(jìn)行合并或分離操作后得到的最大穩(wěn)定極值區(qū)域;(5)合并操作:若相鄰區(qū)域在大小上符合設(shè)定條件,則將它們進(jìn)行合并,視為同一個(gè)區(qū)域;(6)分離操作:若相鄰區(qū)域在大小上不符合設(shè)定條件,則將它們進(jìn)行分離,分離后的子區(qū)域視為一個(gè)分離的最大穩(wěn)定極值區(qū)域。上述第二步中,對(duì)連通區(qū)域進(jìn)行特征提取,具體特征如下:(1)連通區(qū)域的寬度;(2)連通區(qū)域的高度;(3)連通區(qū)域的寬高比;(4)連通區(qū)域包含的像素點(diǎn)數(shù);(5)連通區(qū)域的平均顏色。上述第三步中,所述字內(nèi)合并方法是指:每一個(gè)連通域被認(rèn)為是一個(gè)文字或文字的一部分,如果連通域上下相接并且滿足定義的限制條件,執(zhí)行字內(nèi)合并方法,將兩個(gè)連通域合并為一個(gè),所述限制條件如下:1)兩個(gè)連通域的平均顏色歐式距離小于0.1;2)兩個(gè)連通域像素點(diǎn)數(shù)之差小于其中較小連通域點(diǎn)數(shù)的5倍;3)兩個(gè)連通域?qū)挾戎钚∮谄渲休^寬連通域?qū)挾?/2。上述第三步中,所述字間合并方法用來(lái)檢測(cè)文本行,在執(zhí)行完字內(nèi)合并方法之后,接著執(zhí)行字間合并方法,將連通域合并以形成文本行,字間合并方法限制條件如下:1)屬于一個(gè)文本行里的文字的寬度比值該在0.25和4之間;2)屬于一個(gè)文本行里的文字的高度比值該在0.5和2之間;3)兩個(gè)漢字的連通域外接矩形的中心點(diǎn)y坐標(biāo)差值不大于兩個(gè)連通域之間最高的高度值的1/2;4)兩個(gè)漢字的連通域外接矩形的中心點(diǎn)x坐標(biāo)差值不大于兩個(gè)連通域之間最寬的寬度值的2倍。上述第四步中,利用步驟3得到的文本行,執(zhí)行基于交點(diǎn)分布的文本行篩選算法,具體過(guò)程如下:(1)使用Harris角點(diǎn)算法提取圖像中的角點(diǎn);(2)對(duì)文本行中包含的角點(diǎn)進(jìn)行水平和垂直方向上的統(tǒng)計(jì);(3)根據(jù)均值、方差統(tǒng)計(jì)信息篩選文本行。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:本發(fā)明利用分離的最大極值區(qū)域獲得候選文字連通域,然后使用字內(nèi)和字間合并方法利用連通域的特征進(jìn)行文本行提取,最后使用基于角點(diǎn)分布的文本行篩選方法檢測(cè)圖像中的文本。傳統(tǒng)的區(qū)域提取方法在處理一些字內(nèi)亮度變化的文字時(shí)效果不甚理想,比如最常見(jiàn)的閃光燈下的文字,傳統(tǒng)方法會(huì)將一個(gè)文字的不同部分和背景連成一體,成為混合了背景的多個(gè)區(qū)域。本發(fā)明的分離的最大極值區(qū)域提取方法可以將文字從背景中獨(dú)立出來(lái),同時(shí)使背景區(qū)域分化為多個(gè)明顯非文字區(qū)域,因此在處理復(fù)雜亮度變化文字具有更高的準(zhǔn)確性。綜上,本發(fā)明基于極值連通域的文字檢測(cè)方法相比于傳統(tǒng)的文本檢測(cè)等方法,擁有更高的主動(dòng)性和精確性。附圖說(shuō)明通過(guò)閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:圖1是本發(fā)明的流程圖。圖2是本發(fā)明一實(shí)施例分離的最大穩(wěn)定極值區(qū)域提取的流程圖。具體實(shí)施方式下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。如圖1所示,本實(shí)施例提供一種基于極值連通域的文字檢測(cè)方法,流程可以分為以下幾個(gè)步驟:步驟1:得到輸入圖像,對(duì)圖像進(jìn)行分離的最大極值區(qū)域提取,獲得連通域;步驟2:針對(duì)每一個(gè)連通域,提取連通域特征信息;步驟3:根據(jù)得到的連通域特征信息,將連通域合并,執(zhí)行字內(nèi)合并過(guò)程;步驟4:執(zhí)行字間合并過(guò)程;步驟5:針對(duì)每一個(gè)文本行,提取文本行角點(diǎn)信息。步驟6:篩選出的文本行,檢測(cè)結(jié)束。步驟1的過(guò)程如圖2所示,需要注意的是,分離的最大極值區(qū)域提取只是區(qū)域提取的一種可能方式,也可以采取其它方式得到連通域信息。分離的最大極值區(qū)域提取的思路如下:首先對(duì)輸入圖像進(jìn)行極值區(qū)域檢測(cè),得到區(qū)域信息;然后構(gòu)建極值區(qū)域的生長(zhǎng)樹(shù),生長(zhǎng)樹(shù)包含的區(qū)域以及區(qū)域間關(guān)系由它們?cè)趫D像中的位置和重疊情況確定;將極值區(qū)域生長(zhǎng)樹(shù)上的相鄰區(qū)域根據(jù)它們的重疊度關(guān)系,對(duì)他們進(jìn)行合并或分離操作后得到的最大穩(wěn)定極值區(qū)域。利用分離的最大極值區(qū)域信息可以獲取可能的文本信息,因?yàn)榉蛛x的最大極值區(qū)域很有可能是文本區(qū)域。具體過(guò)程如下:(1)在進(jìn)行分離的最大穩(wěn)定極值區(qū)域提取之前,將彩色圖像轉(zhuǎn)化為灰度圖像;(2)利用穩(wěn)定極值區(qū)域算法提取圖像的極值區(qū)域;(3)獲取(2)中極值區(qū)域的生長(zhǎng)樹(shù),生長(zhǎng)樹(shù)包含的區(qū)域以及區(qū)域間關(guān)系由它們?cè)趫D像中的位置和重疊情況確定;(4)分離的最大穩(wěn)定極值區(qū)域,將極值區(qū)域生長(zhǎng)樹(shù)上的相鄰區(qū)域進(jìn)行合并或分離操作后得到的最大穩(wěn)定極值區(qū)域;(5)合并操作:若相鄰區(qū)域在大小上符合設(shè)定條件,則將它們進(jìn)行合并,視為同一個(gè)區(qū)域;(6)分離操作:若相鄰區(qū)域在大小上不符合設(shè)定條件,則將它們進(jìn)行分離,分離后的子區(qū)域視為一個(gè)分離的最大穩(wěn)定極值區(qū)域。上述設(shè)定條件為相鄰區(qū)域的大小之比小于預(yù)設(shè)值,若相鄰區(qū)域的大小分別為m和n,其比例m/n(假設(shè)m小于n)若小于預(yù)設(shè)值r,則其符合設(shè)定條件,反之則不符合。本實(shí)施例中,預(yù)設(shè)值r一般取0.15,也可以根據(jù)需要選擇其他數(shù)值。步驟2使用連通域特征信息用于判斷連通域是否是文字,或者兩個(gè)連通域是否屬于同一個(gè)字。作此判斷的依據(jù)條件有5個(gè):(1)連通區(qū)域的寬度(2)連通區(qū)域的高度(3)連通區(qū)域的寬高比(4)連通區(qū)域包含的像素點(diǎn)數(shù)(5)連通區(qū)域的平均顏色在提取到連通域信息之后,可以通過(guò)連通域信息判斷連通域是否是文本區(qū)域。具體過(guò)程如下:①字內(nèi)合并方法合并條件:1)兩個(gè)連通域的平均顏色歐式距離小于0.1;2)兩個(gè)連通域像素點(diǎn)數(shù)之差小于較小連通域點(diǎn)數(shù)的5倍;3)兩個(gè)連通域?qū)挾戎钚∮谳^寬連通域?qū)挾?/2;②字間合并方法合并條件:1)屬于一個(gè)文本行里的文字的寬度比值該在0.25和4之間;2)屬于一個(gè)文本行里的文字的高度比值該在0.5和2之間;3)兩個(gè)漢字的連通域外接矩形的中心點(diǎn)y坐標(biāo)差值不大于兩個(gè)連通域之間最高的高度值的1/2。4)兩個(gè)漢字的連通域外接矩形的中心點(diǎn)x坐標(biāo)差值不大于兩個(gè)連通域之間最寬的寬度值的2倍。③首先執(zhí)行字內(nèi)合并,過(guò)程如下:1)遍歷所有連通域,如果兩個(gè)連通域滿足字內(nèi)合并條件,合并,形成一個(gè)連通域?qū)Γ?)遍歷所有連通域?qū)?,如果兩個(gè)連通域?qū)灿幸粋€(gè)連通域,各并成一個(gè)新的連通域組,去除原來(lái)的連通域?qū)Α?)將2)中得到的連通域組更新位新的連通域。④執(zhí)行字間合并,各并條件如②所示,合并過(guò)程與字內(nèi)合并相同。⑤得到字間合并的連通域。步驟5使用角點(diǎn)提取算法提取候選文本行中的角點(diǎn)信息,并使用角點(diǎn)分布算法對(duì)其進(jìn)行分布信息提取,根據(jù)角點(diǎn)分布信息篩選出文字文本行。具體過(guò)程如下:(1)使用Harris角點(diǎn)算法提取圖像中的角點(diǎn);(2)對(duì)文本行中包含的角點(diǎn)進(jìn)行水平和垂直方向上的統(tǒng)計(jì);(3)根據(jù)均值、方差統(tǒng)計(jì)信息篩選文本行。常用的區(qū)域提取方法在處理一些字內(nèi)亮度變化的文字時(shí)效果不甚理想,比如最常見(jiàn)的閃光燈下的文字,傳統(tǒng)方法會(huì)將一個(gè)文字的不同部分和背景連成一體,成為混合了背景的多個(gè)區(qū)域。本發(fā)明的分離的最大極值區(qū)域提取方法可以將文字從背景中獨(dú)立出來(lái),同時(shí)使背景區(qū)域分化為多個(gè)明顯非文字區(qū)域,因此在處理復(fù)雜亮度變化文字具有更高的準(zhǔn)確性,方法簡(jiǎn)單有效,而且對(duì)復(fù)雜背景圖像文字檢測(cè)有非常好的效果。以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。
      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1