圖像中字符分割方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別涉及一種圖像中字符分割方法及裝置。
【背景技術(shù)】
[0002]為了獲取包含有字符的圖像所包含的信息,經(jīng)常需要對(duì)圖像進(jìn)行分析處理。在分析處理過(guò)程中,首先分割圖像中包含的字符,然后識(shí)別得到的獨(dú)立字符,從而獲取圖像包含的信息。例如,由于網(wǎng)站可能設(shè)置有圖像驗(yàn)證碼,測(cè)試人員在對(duì)網(wǎng)站進(jìn)行自動(dòng)化測(cè)試和信息的快速發(fā)布等操作時(shí),需要識(shí)別圖像驗(yàn)證碼,所述圖像驗(yàn)證碼中通常包含有多個(gè)驗(yàn)證碼圖像,其中,每個(gè)驗(yàn)證碼圖像包含一個(gè)字符。這種情況下,就需要分割所述圖像驗(yàn)證碼,然后識(shí)別分割后獲取的各個(gè)獨(dú)立的驗(yàn)證碼圖像,從而確定所述圖像驗(yàn)證碼包含的信息。
[0003]目前,對(duì)圖像中的字符進(jìn)行分割,通常采用的是基于連通體的分割方法。該方法將需要進(jìn)行字符分割的圖像作為目標(biāo)圖像,首先確定所述目標(biāo)圖像中的文本區(qū)域,所述文本區(qū)域?yàn)樽址嫉膮^(qū)域,然后將字符與文本區(qū)域的邊框相交的點(diǎn)作為種子,利用種子填充算法獲取該點(diǎn)對(duì)應(yīng)的連通體,并認(rèn)為每個(gè)連通體為一個(gè)獨(dú)立的字符,進(jìn)而完成對(duì)所述目標(biāo)圖像中字符的分割。
[0004]但是,發(fā)明人在本申請(qǐng)的研究過(guò)程中發(fā)現(xiàn),在實(shí)際應(yīng)用中,相鄰字符間時(shí)常發(fā)生粘連,此時(shí)采用所述基于連通體分割的方法,對(duì)圖像中的字符進(jìn)行分割,就會(huì)將發(fā)生粘連的字符分割為一個(gè)連通體,將其作為一個(gè)獨(dú)立的字符,出現(xiàn)分割錯(cuò)誤,進(jìn)而導(dǎo)致字符分割的準(zhǔn)確性較低。
【發(fā)明內(nèi)容】
[0005]為了解決現(xiàn)有技術(shù)中,對(duì)圖像中的字符進(jìn)行分割時(shí)準(zhǔn)確性低的問(wèn)題,本申請(qǐng)公開(kāi)了一種圖像中字符分割方法及裝置。
[0006]為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了如下技術(shù)方案:
[0007]第一方面,提供一種圖像中字符分割方法,所述方法包括:
[0008]基于目標(biāo)圖像中各個(gè)字符形成的連通體,分割所述目標(biāo)圖像,獲取各個(gè)獨(dú)立的連通體;
[0009]根據(jù)所述目標(biāo)圖像中,各個(gè)字符所占的字符區(qū)域的寬度,和/或高度,判斷所述各個(gè)獨(dú)立的連通體中,是否包含有粘連字符;
[0010]當(dāng)根據(jù)判斷結(jié)果,確定存在包含有粘連字符的連通體時(shí),對(duì)所述粘連字符的輪廓進(jìn)行檢測(cè),獲取所述粘連字符中存在的封閉區(qū)域的中心位置;
[0011]根據(jù)所述封閉區(qū)域的中心位置,確定所述粘連字符的中心位置,并根據(jù)所述粘連字符的中心位置,以及所述各個(gè)字符所占的字符區(qū)域的寬度,和/或高度,對(duì)所述粘連字符進(jìn)行分割,獲取分割后的字符。
[0012]結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述圖像中字符分割方法還包括:
[0013]獲取多個(gè)訓(xùn)練圖像,所述訓(xùn)練圖像的類型與所述目標(biāo)圖像的類型相同;
[0014]基于所述訓(xùn)練圖像中各個(gè)字符形成的連通體,對(duì)所述訓(xùn)練圖像進(jìn)行分割,獲取各個(gè)獨(dú)立的連通體;
[0015]計(jì)算所述各個(gè)獨(dú)立的連通體所占的連通體區(qū)域的寬度,和/或高度,統(tǒng)計(jì)各個(gè)所述連通體區(qū)域的寬度,和/或高度出現(xiàn)的概率,并將概率值最大的寬度,和/或高度作為所述目標(biāo)圖像中各個(gè)字符所占的字符區(qū)域的寬度,和/或高度。
[0016]結(jié)合第一方面,在第一方面的第二種可能的實(shí)現(xiàn)方式中,所述判斷所述各個(gè)獨(dú)立的連通體中,是否包含有粘連字符的步驟包括:
[0017]獲取所述目標(biāo)圖像中,各個(gè)獨(dú)立的連通體所占的連通體區(qū)域的寬度,和/或高度,將其與所述各個(gè)字符所占的字符區(qū)域的寬度,和/或高度相比較;
[0018]當(dāng)根據(jù)比較結(jié)果,確定一個(gè)或多個(gè)連通體所占的連通體區(qū)域的寬度,和/或高度,大于所述字符區(qū)域的寬度,和/或高度時(shí),判定所述一個(gè)或多個(gè)連通體中包含有粘連字符。
[0019]結(jié)合第一方面,在第一方面的第三種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述封閉區(qū)域的中心位置,確定所述粘連字符的中心位置的步驟包括:
[0020]根據(jù)所述獨(dú)立的連通體的數(shù)量,以及已知的所述目標(biāo)圖像中包含的字符個(gè)數(shù),確定所述粘連字符的個(gè)數(shù)M,其中M為正整數(shù);
[0021]根據(jù)所述粘連字符的個(gè)數(shù)M,對(duì)所述封閉區(qū)域的中心位置進(jìn)行聚類計(jì)算,獲取M個(gè)中心位置,將所述M個(gè)中心位置作為所述粘連字符的中心位置。
[0022]結(jié)合第一方面,結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,所述基于目標(biāo)圖像中各字符形成的連通體,對(duì)所述目標(biāo)圖像進(jìn)行分割之前,還包括:
[0023]濾除目標(biāo)圖像中,亮度值小于預(yù)設(shè)的亮度閾值的像素點(diǎn),以濾除所述目標(biāo)圖像中的背景顏色和背景噪音;
[0024]在濾除所述亮度值小于預(yù)設(shè)的亮度閾值的像素點(diǎn)后,根據(jù)HSV顏色空間下的目標(biāo)圖像中各個(gè)像素點(diǎn)的亮度,對(duì)所述目標(biāo)圖像中的像素點(diǎn)進(jìn)行聚類統(tǒng)計(jì),獲取多個(gè)類別,其中,每一類別中的各個(gè)像素點(diǎn)的亮度在相同的亮度范圍內(nèi);
[0025]對(duì)所述多個(gè)類別中的像素點(diǎn)的個(gè)數(shù)進(jìn)行統(tǒng)計(jì),并濾除所述多個(gè)類別中,像素點(diǎn)的個(gè)數(shù)較少的N個(gè)類別,以濾除所述目標(biāo)圖像的前景噪音,其中N為預(yù)設(shè)的正整數(shù);
[0026]在濾除所述目標(biāo)圖像的前景噪音后,對(duì)所述目標(biāo)圖像進(jìn)行單色化處理,以便對(duì)經(jīng)過(guò)單色化處理的目標(biāo)圖像進(jìn)行基于連通體的分割。
[0027]第二方面,本申請(qǐng)公開(kāi)了一種圖像中字符分割裝置,所述裝置包括:
[0028]連通體分割模塊,用于基于目標(biāo)圖像中各個(gè)字符形成的連通體,分割所述目標(biāo)圖像,獲取各個(gè)獨(dú)立的連通體;
[0029]判斷模塊,用于根據(jù)所述目標(biāo)圖像中,各個(gè)字符所占的字符區(qū)域的寬度,和/或高度,判斷所述各個(gè)獨(dú)立的連通體中,是否包含有粘連字符;
[0030]輪廓檢測(cè)模塊,用于當(dāng)根據(jù)判斷結(jié)果,確定存在包含有粘連字符的連通體時(shí),對(duì)所述粘連字符的輪廓進(jìn)行檢測(cè),獲取所述粘連字符中存在的封閉區(qū)域的中心位置;
[0031]粘連字符分割模塊,用于根據(jù)所述封閉區(qū)域的中心位置,確定所述粘連字符的中心位置,并根據(jù)所述粘連字符的中心位置,以及所述各個(gè)字符所占的字符區(qū)域的寬度,和/或高度,對(duì)所述粘連字符進(jìn)行分割,獲取分割后的字符。
[0032]結(jié)合第二方面,在第二方面的第一種可能的實(shí)現(xiàn)方式中,所述圖像中字符分割裝置還包括:
[0033]訓(xùn)練圖像獲取模塊,用于獲取多個(gè)訓(xùn)練圖像,所述訓(xùn)練圖像的類型與所述目標(biāo)圖像的類型相同;
[0034]訓(xùn)練圖像分割模塊,用于基于所述訓(xùn)練圖像中各個(gè)字符形成的連通體,對(duì)所述訓(xùn)練圖像進(jìn)行分割,獲取各個(gè)獨(dú)立的連通體;
[0035]字符區(qū)域確定模塊,用于計(jì)算所述各個(gè)獨(dú)立的連通體所占的連通體區(qū)域的寬度,和/或高度,統(tǒng)計(jì)各個(gè)所述連通體區(qū)域的寬度,和/或高度出現(xiàn)的概率,并將概率值最大的寬度,和/或高度作為所述目標(biāo)圖像中各個(gè)字符所占的字符區(qū)域的寬度,和/或高度。
[0036]結(jié)合第二方面,在第二方面的第二種可能的實(shí)現(xiàn)方式中,所述判斷模塊包括:
[0037]比較單元,用于獲取所述目標(biāo)圖像中,各個(gè)獨(dú)立的連通體所占的連通體區(qū)域的寬度,和/或高度,將其與所述各個(gè)字符所占的字符區(qū)域的寬度,和/或高度相比較;
[0038]判定單元,用于當(dāng)根據(jù)比較結(jié)果,確定一個(gè)或多個(gè)連通體所占的連通體區(qū)域的寬度,和/或高度,大于所述字符區(qū)域的寬度,和/或高度時(shí),判定所述一個(gè)或多個(gè)連通體中包含有粘連字符。
[0039]結(jié)合第二方面,在第二方面的第三種可能的實(shí)現(xiàn)方式中,所述粘連字符分割模塊包括中心位置確定子模塊,所述中心位置確定子模塊用于根據(jù)所述封閉區(qū)域的中心位置,確定所述粘連字符的中心位置,包括:
[0040]粘連字符個(gè)數(shù)確定單元,用于根據(jù)所述獨(dú)立的連通體的數(shù)量,以及已知的所述目標(biāo)圖像中包含的字符個(gè)數(shù),確定所述粘連字符的個(gè)數(shù)M,其中M為正整數(shù);
[0041]中心位置確定單元,用于根據(jù)所述粘連字符的個(gè)數(shù)M,對(duì)所述封閉區(qū)域的中心位置進(jìn)行聚類計(jì)算,獲取M個(gè)中心位置,將所述M個(gè)中心位置作為所述粘連字符的中心位置。
[0042]結(jié)合第二方面,結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,結(jié)合第二方面的第三種可能的實(shí)現(xiàn)方式,在第二方面的第四種可能的實(shí)現(xiàn)方式中,
[0043]所述圖像中字符分割裝置還包括:
[0044]第一濾除單元,用于濾除目標(biāo)圖像中,亮度值小于預(yù)設(shè)的亮度閾值的像素點(diǎn),以濾除所述目標(biāo)圖像中的背景顏色和背景噪音;