一種文本檢測方法及電子設備的制作方法
【專利摘要】本申請公開了一種文本檢測方法及電子設備,所述方法包括:根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像;對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積;通過預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像;依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
【專利說明】一種文本檢測方法及電子設備
【技術領域】
[0001]本申請涉及圖像處理【技術領域】,特別涉及一種文本檢測方法及電子設備。
【背景技術】
[0002]目前,可以通過圖像處理技術從圖片數(shù)據(jù)中提取目標數(shù)據(jù)如文本或數(shù)字信息,如在圖片中提取聯(lián)系人電話號碼或銀行號碼等,能夠對提取到的文本或數(shù)字等信息進行分享或存儲等操作,改善用戶體驗。
[0003]現(xiàn)有的從圖片中提取文本或數(shù)字信息的方案,通常是基于大內存、高配置的操作系統(tǒng),利用圖片上的特殊信息如紋理、顏色、深度等對圖片進行前景和背景分割而實現(xiàn)文本數(shù)據(jù)的提取。
[0004]但現(xiàn)有利用紋理或顏色等信息進行文本數(shù)據(jù)獲取的方案,由于需要對特殊信息如紋理、顏色、深度等進行處理,其計算量較大,使得文本數(shù)據(jù)的獲取效率較低。
【發(fā)明內容】
[0005]本申請所要解決的技術問題是提供一種文本檢測方法及電子設備,用以解決現(xiàn)有技術中利用紋理或顏色等信息進行目標數(shù)據(jù)獲取的方案,其計算量較大,使得文本數(shù)據(jù)的獲取效率較低的技術問題。
[0006]本申請?zhí)峁┝艘环N文本檢測方法,包括:
[0007]根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像;
[0008]對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積;
[0009]通過預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像;
[0010]依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
[0011]上述方法,優(yōu)選的,所述對所述第一目標區(qū)域圖像進行圖像背景分割,得到第二目標區(qū)域圖像,包括:
[0012]確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框;
[0013]依據(jù)所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像,利用圖像分割GrabCut算法獲取所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像;
[0014]其中,所述區(qū)域框,將所述第一目標區(qū)域圖像中的所述第二目標區(qū)域圖像與所述背景圖像分隔開。
[0015]上述方法,優(yōu)選的,所述確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框,包括:
[0016]對所述第一目標區(qū)域圖像進行灰度處理及二值化操作;[0017]依據(jù)經(jīng)過二值化操作的第一目標區(qū)域圖像,確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
[0018]上述方法,優(yōu)選的,所述通過預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像,包括:
[0019]以預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行空白像素點掃描;
[0020]其中,在掃描到空白像素點時,確定掃描到的空白像素點所在行之前的第一區(qū)域圖像,對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像,并確定掃描到的空白像素點所在行之后的第二區(qū)域圖像,依據(jù)所述像素點掃描方式對所述第二區(qū)域圖像繼續(xù)進行空白像素點的掃描。
[0021]上述方法,優(yōu)選的,所述對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像,包括:
[0022]確定所述第一區(qū)域圖像的行像素點中起始點與終止點之間的第一差值,并確定所述第一區(qū)域圖像的列像素點中起始點與終止點之間的第二差值;
[0023]在所述第一差值與所述第二差值之間的差值絕對值大于所述第一差值或所述第二差值的情況下,在所述第一區(qū)域圖像中進行字符圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
[0024]本申請還提供了 一種電子設備,所述電子設備包括:
[0025]目標圖像確定單元,用于根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像;
[0026]背景分割單元,用于對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積;
[0027]字符分割單元,用于通過預算的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像;
[0028]文本數(shù)據(jù)獲取單元,用于依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
[0029]上述電子設備,優(yōu)選的,所述背景分割單元包括:
[0030]區(qū)域框確定子單元,用于確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框;
[0031]圖像分割子單元,用于依據(jù)所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像,利用GrabCut算法獲取所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像;
[0032]其中,所述區(qū)域框,將所述第一目標區(qū)域圖像中的所述第二目標區(qū)域圖像與所述背景圖像分隔開。
[0033]上述電子設備,優(yōu)選的,所述區(qū)域框確定子單元包括:
[0034]區(qū)域操作模塊,用于對所述第一目標區(qū)域圖像進行灰度處理及二值化操作;
[0035]區(qū)域框確定模塊,用于依據(jù)經(jīng)過二值化操作的第一目標區(qū)域圖像,確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
[0036]上述電子設備,優(yōu)選的,所述字符分割單元包括:
[0037]像素點掃描子單元,用于以預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行空白像素點掃描,其中,在掃描到空白像素點時,觸發(fā)第一區(qū)域確定子單元和第二區(qū)域確定子單元;
[0038]第一區(qū)域確定子單元,用于確定掃描到的空白像素點所在行之前的第一區(qū)域圖像,觸發(fā)目標分割子單元;
[0039]目標分割子單元,用于對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像;
[0040]第二區(qū)域確定子單元,用于確定掃描到的空白像素點所在行之后的第二區(qū)域圖像,觸發(fā)所述像素點掃描子單元依據(jù)所述像素點掃描方式對所述第二區(qū)域圖像繼續(xù)進行空白像素點掃描。
[0041]上述電子設備,優(yōu)選的,所述目標分割子單元包括:
[0042]差值確定模塊,用于確定所述第一區(qū)域圖像的行像素點中起始點與終止點之間的第一差值,并確定所述第一區(qū)域圖像的列像素點中起始點與終止點之間的第二差值;
[0043]字符分割模塊,用于在所述第一差值與所述第二差值之間的差值絕對值大于所述第一差值或所述第二差值的情況下,在所述第一區(qū)域圖像中進行字符圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
[0044]由上述方案可知,本申請?zhí)峁┑囊环N文本檢測方法及電子設備,通過用戶對目標圖像的選擇操作確定目標圖像中的第一目標區(qū)域圖像之后,對第一目標區(qū)域圖像進行圖像背景分割,得到第一目標區(qū)域圖像中的第二目標區(qū)域圖像,再對第二目標區(qū)域圖像進行單字符分割,以得到至少一個目標字符圖像,進而利用識別庫中字符圖像與字符數(shù)據(jù)的對應關系,得到每個目標字符圖像各自對應的目標字符數(shù)據(jù),以得到由目標字符數(shù)據(jù)組成的文本數(shù)據(jù)。本申請在實現(xiàn)目標圖像的文本檢測過程中,無需對目標圖像中的特殊信息如紋理、顏色、深度等數(shù)據(jù)進行處理,而是通過圖像分割及像素點掃描等方式完成對字符數(shù)據(jù)的識別檢測,以得到文本數(shù)據(jù),其計算量明顯小于現(xiàn)有文本數(shù)據(jù)獲取方案的計算量,明顯提高獲取文本數(shù)據(jù)的效率。
【專利附圖】
【附圖說明】
[0045]為了更清楚地說明本申請實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0046]圖1為本申請?zhí)峁┑囊环N文本檢測方法實施例一的流程圖;
[0047]圖2為本申請?zhí)峁┑囊环N文本檢測方法實施例二的部分流程圖;
[0048]圖3為本申請實施例的應用示例圖;
[0049]圖4為本申請實施例二的部分流程圖;
[0050]圖5為本申請實施例的另一應用示例圖;
[0051]圖6為本申請?zhí)峁┑囊环N文本檢測方法實施例三的部分流程圖;
[0052]圖7為本申請?zhí)峁┑囊环N電子設備實施例四的結構示意圖;
[0053]圖8為本申請?zhí)峁┑囊环N電子設備實施例五的部分結構示意圖;
[0054]圖9為本申請實施例五的另一部分結構示意圖;[0055]圖10為本申請?zhí)峁┑囊环N電子設備實施例六的部分結構示意圖;
[0056]圖11為本申請實施例六的另一部分結構示意圖。
【具體實施方式】
[0057]下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
[0058]參考圖1,為本申請?zhí)峁┑囊环N文本檢測方法實施例一的流程圖,本實施例的目的在于將圖像數(shù)據(jù)中的文本數(shù)據(jù)進行檢測獲取,在本實施例中,所述方法可以包括以下步驟:
[0059]步驟101:根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像。
[0060]其中,在本實施例運行之前,預先將所述目標圖像顯示給用戶,用戶通過手勢選擇操作在所述目標圖像中劃定用戶感興趣的區(qū)域,例如圖像剪切操作等,由此,在所述步驟101中,識別用戶對所述目標圖像的選擇操作,在所述目標圖像中確定用戶剛興趣的第一目標區(qū)域圖像。
[0061]需要說明的是,在所述步驟101中確定第一目標區(qū)域圖像之后,可以將所述第一目標區(qū)域圖像作為本實施例運行系統(tǒng)的本地臨時文件進行保存。
[0062]步驟102:對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像。
[0063]其中,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積。
[0064]需要說明的是,所述第一目標區(qū)域圖像上的字符文本等圖像與背景圖像相區(qū)分,因此,在所述步驟102中,首先對第一目標區(qū)域圖像中的背景圖像進行分割,得到的第二目標區(qū)域圖像為字符文本的最大聯(lián)通圖像或者多個字符文本的聯(lián)通圖像的組合。
[0065]步驟103:通過預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分害I],得到至少一個目標字符圖像。
[0066]其中,所述像素點掃描方式可以為空白像素點、或者色度低于預設值的行或列像素點掃描方式。
[0067]步驟104:依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
[0068]其中,所述識別庫可以為本實施例運行系統(tǒng)提供的手勢識別庫,在所述步驟104的具體實現(xiàn)中,可以通過該手勢識別庫GestureLib的接口函數(shù),調取所述識別庫中字符圖像與字符數(shù)據(jù)的對應關系,將每個所述目標字符圖像分別與所述識別庫中的字符圖像進行循環(huán)比較,以得到每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),進而通過將每個所述目標字符數(shù)據(jù)進行拷貝獲取,以便對目標字符數(shù)據(jù)組成的文本數(shù)據(jù)進行拷貝、粘貼等操作。
[0069]由上述方案可知,本申請?zhí)峁┑囊环N文本檢測方法實施例一,通過用戶對目標圖像的選擇操作確定目標圖像中的第一目標區(qū)域圖像之后,對第一目標區(qū)域圖像進行圖像背景分割,得到第一目標區(qū)域圖像中的第二目標區(qū)域圖像,再對第二目標區(qū)域圖像進行單字符分割,以得到至少一個目標字符圖像,進而利用識別庫中字符圖像與字符數(shù)據(jù)的對應關系,得到每個目標字符圖像各自對應的目標字符數(shù)據(jù),以得到由目標字符數(shù)據(jù)組成的文本數(shù)據(jù)。本申請實施例在實現(xiàn)目標圖像的文本檢測過程中,無需對目標圖像中的特殊信息如紋理、顏色、深度等數(shù)據(jù)進行處理,而是通過圖像分割及像素點掃描等方式完成對字符數(shù)據(jù)的識別檢測,以得到文本數(shù)據(jù),其計算量明顯小于現(xiàn)有文本數(shù)據(jù)獲取方案的計算量,明顯提高獲取文本數(shù)據(jù)的效率。
[0070]參考圖2,為本申請?zhí)峁┑囊环N文本檢測方法實施例二中所述步驟102的實現(xiàn)流程圖,其中,所述步驟102可以通過以下步驟實現(xiàn):
[0071]步驟121:確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
[0072]其中,所述區(qū)域框為所述第一目標區(qū)域圖像中最大聯(lián)通區(qū)域的區(qū)域框。如圖3中所示的第一目標區(qū)域圖像301為例,所述第一目標區(qū)域圖像301中具有最大聯(lián)通區(qū)域302,所述區(qū)域框303可以理解為所述第一目標區(qū)域圖像中的最大聯(lián)通區(qū)域302的邊緣框,所述聯(lián)通區(qū)域可以理解為:字符圖像集中區(qū)域或連接區(qū)域。
[0073]具體的,參考圖4,為本申請實施例中所述步驟121的實現(xiàn)流程圖,其中,所述步驟121可以通過以下步驟實現(xiàn):
[0074]步驟401:對所述第一目標區(qū)域圖像進行灰度處理及二值化操作。
[0075]步驟402:依據(jù)經(jīng)過二值化操作的第一目標區(qū)域圖像,確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
[0076]其中,所述步驟401的具體實現(xiàn)可以為:變換所述第一目標區(qū)域圖像為灰色圖像,使用中央周邊直方圖算法對所述變換后的第一目標區(qū)域圖像進行操作,得到第一目標區(qū)域圖像的顯著性圖像,之后,對第一目標區(qū)域圖像利用其平均灰度閾值進行二值化,得到二值化的第一目標區(qū)域圖像。在所述步驟402中,依據(jù)經(jīng)過二值化的第一目標區(qū)域圖像確定其最大聯(lián)通區(qū)域的區(qū)域框時,可以提高區(qū)域框的準確率。
[0077]步驟122:依據(jù)所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像,利用GrabCut算法獲取所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像。
[0078]具體的,所述步驟122中可以為:以所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像為初始化值來初始化GrabCut算法,由此通過迭代化得到能量最小化的第二目標區(qū)域圖像,以達到在所述第一目標區(qū)域圖像中分割第二目標區(qū)域圖像的目的,此時,所述區(qū)域框將所述第一目標區(qū)域圖像中的第二目標圖像與所述背景圖像分隔開,如圖5中所述區(qū)域框303將所述背景圖像304與所述第二目標區(qū)域圖像305分隔開,所述背景圖像304與所述第二目標區(qū)域圖像305組成所述第一目標區(qū)域圖像301。
[0079]參考圖6,為本申請?zhí)峁┑囊环N文本檢測方法實施例三中所述步驟103的實現(xiàn)流程圖,其中,所述步驟103可以包括以下步驟:
[0080]步驟131:以預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行空白像素點掃描,在掃描到空白像素點時,執(zhí)行步驟132及步驟134。
[0081]其中,所述步驟131中可以通過依次對每行像素點進行掃描的方式完成對整個第二目標區(qū)域圖像的掃描,如本實施例中的實現(xiàn)方案;也可以通過依次對每列像素點進行掃描的方式完成對整個第二目標區(qū)域圖像的掃描,其具體實現(xiàn)可參考本實施例實現(xiàn)方案,在本文中不再詳細描述。
[0082]步驟132:確定掃描到的空白像素點所在行之前的第一區(qū)域圖像,執(zhí)行步驟133。
[0083]步驟133:對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
[0084]具體的,所述步驟133可以通過以下方式實現(xiàn):
[0085]確定所述第一區(qū)域圖像的行像素點中起始點與終止點之間的第一差值,并確定所述第一區(qū)域圖像的列像素點中起始點與終止點之間的第二差值,之后對所述第一差值與所述第二差值之間的差值絕對值與所述第一差值及所述第二差值之間進行比對,并在所述第一差值與所述第二差值之間的差值絕對值大于所述第一差值或所述第二差值的情況下,在所述第一區(qū)域圖像中進行字符圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
[0086]步驟134:確定掃描到的空白像素點所在行之后的第二區(qū)域圖像,返回執(zhí)行所述步驟131中依據(jù)所述像素點掃描方式對所述第二區(qū)域圖像繼續(xù)進行空白像素點的掃描。
[0087]上述實現(xiàn)方案可以理解為:對所述第二目標區(qū)域圖像的整幅圖像進行空白像素點掃描,當行或列循環(huán)掃描出現(xiàn)空白像素點時,就再對第二目標區(qū)域圖像整體做一次細分割,空白像素點所在的行或列之前的部分直接進行后續(xù)的單個字符圖像的分割;而掃描到的空白像素點所在行或列之后的部分先沿襲所述第二目標區(qū)域圖像之前的像素點掃描方式,在確定好單個字符的邊界之后,進行單個字符圖像的分割。例如,將數(shù)字字符近似認為是一個正方形區(qū)域,愛確定單個字符圖像的邊界時,比較掃描過程中持續(xù)捕獲到的像素點中起始點與終止點之間的差值,與列掃描過程中持續(xù)捕獲到的像素點中起始點與終止點之間的差值,若兩個差值相差的結果絕對值已經(jīng)遠大于其中的一個差值,則認為是含有數(shù)字的前景目標像素點,依次類推,完成對整幅圖像中目標字符圖像的分割獲取。
[0088]參考圖7,為本申請?zhí)峁┑囊环N電子設備實施例四的結構示意圖,其中,所述電子設備可以包括以下結構:
[0089]目標圖像確定單元701,用于根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像。
[0090]其中,在本實施例運行之前,預先將所述目標圖像顯示給用戶,用戶通過手勢選擇操作在所述目標圖像中劃定用戶感興趣的區(qū)域,例如圖像剪切操作等,由此,在所述目標圖像確定單元701中,識別用戶對所述目標圖像的選擇操作,在所述目標圖像中確定用戶剛興趣的第一目標區(qū)域圖像。
[0091]需要說明的是,在所述目標圖像確定單元701確定第一目標區(qū)域圖像之后,可以將所述第一目標區(qū)域圖像作為本實施例運行系統(tǒng)的本地臨時文件進行保存。
[0092]背景分割單元702,用于對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像。
[0093]其中,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積。
[0094]需要說明的是,所述第一目標區(qū)域圖像上的字符文本等圖像與背景圖像相區(qū)分,因此,在所述背景分割單元702中,首先對第一目標區(qū)域圖像中的背景圖像進行分割,得到的第二目標區(qū)域圖像為字符文本的最大聯(lián)通圖像或者多個字符文本的聯(lián)通圖像的組合。
[0095]字符分割單元703,用于通過預算的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像。
[0096]其中,所述像素點掃描方式可以為空白像素點、或者色度低于預設值的行或列像素點掃描方式。
[0097]文本數(shù)據(jù)獲取單元704,用于依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
[0098]其中,所述識別庫可以為本實施例運行系統(tǒng)提供的手勢識別庫,在所述文本數(shù)據(jù)獲取單元704的具體實現(xiàn)中,可以通過該手勢識別庫GestureLib的接口函數(shù),調取所述識別庫中字符圖像與字符數(shù)據(jù)的對應關系,將每個所述目標字符圖像分別與所述識別庫中的字符圖像進行循環(huán)比較,以得到每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),進而通過將每個所述目標字符數(shù)據(jù)進行拷貝獲取,以便對目標字符數(shù)據(jù)組成的文本數(shù)據(jù)進行拷貝、粘貼等操作。
[0099]由上述方案可知,本申請?zhí)峁┑囊环N電子設備實施例四,通過用戶對目標圖像的選擇操作確定目標圖像中的第一目標區(qū)域圖像之后,對第一目標區(qū)域圖像進行圖像背景分害I],得到第一目標區(qū)域圖像中的第二目標區(qū)域圖像,再對第二目標區(qū)域圖像進行單字符分害I],以得到至少一個目標字符圖像,進而利用識別庫中字符圖像與字符數(shù)據(jù)的對應關系,得到每個目標字符圖像各自對應的目標字符數(shù)據(jù),以得到由目標字符數(shù)據(jù)組成的文本數(shù)據(jù)。本申請實施例在實現(xiàn)目標圖像的文本檢測過程中,無需對目標圖像中的特殊信息如紋理、顏色、深度等數(shù)據(jù)進行處理,而是通過圖像分割及像素點掃描等方式完成對字符數(shù)據(jù)的識別檢測,以得到文本數(shù)據(jù),其計算量明顯小于現(xiàn)有文本數(shù)據(jù)獲取方案的計算量,明顯提高獲取文本數(shù)據(jù)的效率。
[0100]參考圖8,為本申請?zhí)峁┑囊环N電子設備實施例五中所述背景分割單元702的結構示意圖,其中,所述背景分割單元702可以包括以下結構:
[0101]區(qū)域框確定子單元721,用于確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
[0102]其中,所述區(qū)域框為所述第一目標區(qū)域圖像中最大聯(lián)通區(qū)域的區(qū)域框。如圖3中所示的第一目標區(qū)域圖像301為例,所述第一目標區(qū)域圖像301中具有最大聯(lián)通區(qū)域302,所述區(qū)域框303可以理解為所述第一目標區(qū)域圖像中的最大聯(lián)通區(qū)域302的邊緣框,所述聯(lián)通區(qū)域可以理解為:字符圖像集中區(qū)域或連接區(qū)域。
[0103]具體的,參考圖9,為本申請實施例中所述區(qū)域框確定子單元721的結構示意圖,其中,所述區(qū)域框確定子單元721中可以包括以下模塊:
[0104]區(qū)域操作模塊901,用于對所述第一目標區(qū)域圖像進行灰度處理及二值化操作。
[0105]區(qū)域框確定模塊902,用于依據(jù)經(jīng)過二值化操作的第一目標區(qū)域圖像,確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
[0106]其中,所述區(qū)域操作模塊901的具體實現(xiàn)可以為:變換所述第一目標區(qū)域圖像為灰色圖像,使用中央周邊直方圖算法對所述變換后的第一目標區(qū)域圖像進行操作,得到第一目標區(qū)域圖像的顯著性圖像,之后,對第一目標區(qū)域圖像利用其平均灰度閾值進行二值化,得到二值化的第一目標區(qū)域圖像。之后,所述區(qū)域框確定模塊902中依據(jù)經(jīng)過二值化的第一目標區(qū)域圖像確定其最大聯(lián)通區(qū)域的區(qū)域框時,可以提高區(qū)域框的準確率。
[0107]圖像分割子單元722,用于依據(jù)所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像,利用GrabCut算法獲取所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像。
[0108]具體的,所述圖像分割子單元722的運行方案可以為:以所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像為初始化值來初始化GrabCut算法,由此通過迭代化得到能量最小化的第二目標區(qū)域圖像,以達到在所述第一目標區(qū)域圖像中分割第二目標區(qū)域圖像的目的,此時,所述區(qū)域框將所述第一目標區(qū)域圖像中的第二目標圖像與所述背景圖像分隔開,如圖5中所述區(qū)域框303將所述背景圖像304與所述第二目標區(qū)域圖像305分隔開,所述背景圖像304與所述第二目標區(qū)域圖像305組成所述第一目標區(qū)域圖像301。
[0109]參考圖10,為本申請?zhí)峁┑囊环N電子設備實施例六中所述字符分割單元703的結構示意圖,其中,所述字符分割單元703可以包括以下結構:
[0110]像素點掃描子單元731,用于以預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行空白像素點掃描,其中,在掃描到空白像素點時,觸發(fā)第一區(qū)域確定子單元732和第二區(qū)域確定子單元734。
[0111]其中,所述像素點掃描子單元731中可以通過依次對每行像素點進行掃描的方式完成對整個第二目標區(qū)域圖像的掃描,如本實施例中的實現(xiàn)方案;也可以通過依次對每列像素點進行掃描的方式完成對整個第二目標區(qū)域圖像的掃描,其具體實現(xiàn)可參考本實施例實現(xiàn)方案,在本文中不再詳細描述。
[0112]第一區(qū)域確定子單元732,用于確定掃描到的空白像素點所在行之前的第一區(qū)域圖像,觸發(fā)目標分割子單元733。
[0113]目標分割子單元733,用于對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
[0114]具體的,參考圖11,為本申請實施例中所述目標分割子單元733的結構示意圖,其中,所述目標分割子單元733可以包括以下模塊:
[0115]差值確定模塊1101,用于確定所述第一區(qū)域圖像的行像素點中起始點與終止點之間的第一差值,并確定所述第一區(qū)域圖像的列像素點中起始點與終止點之間的第二差值。
[0116]字符分割模塊1102,用于在所述第一差值與所述第二差值之間的差值絕對值大于所述第一差值或所述第二差值的情況下,在所述第一區(qū)域圖像中進行字符圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
[0117]第二區(qū)域確定子單元734,用于確定掃描到的空白像素點所在行之后的第二區(qū)域圖像,觸發(fā)所述像素點掃描子單元731依據(jù)所述像素點掃描方式對所述第二區(qū)域圖像繼續(xù)進行空白像素點掃描。
[0118]上述所述字符分割單元703的實現(xiàn)方案可以理解為:所述字符分割單元703對所述第二目標區(qū)域圖像的整幅圖像進行空白像素點掃描,當行或列循環(huán)掃描出現(xiàn)空白像素點時,就再對第二目標區(qū)域圖像整體做一次細分割,空白像素點所在的行或列之前的部分直接進行后續(xù)的單個字符圖像的分割;而掃描到的空白像素點所在行或列之后的部分先沿襲所述第二目標區(qū)域圖像之前的像素點掃描方式,在確定好單個字符的邊界之后,進行單個字符圖像的分割。例如,將數(shù)字字符近似認為是一個正方形區(qū)域,愛確定單個字符圖像的邊界時,比較掃描過程中持續(xù)捕獲到的像素點中起始點與終止點之間的差值,與列掃描過程中持續(xù)捕獲到的像素點中起始點與終止點之間的差值,若兩個差值相差的結果絕對值已經(jīng)遠大于其中的一個差值,則認為是含有數(shù)字的前景目標像素點,依次類推,完成對整幅圖像中目標字符圖像的分割獲取。
[0119]需要說明的是,本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
[0120]最后,還需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
[0121] 以上對本申請所提供的一種文本檢測方法及電子設備進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本申請的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本申請的限制。
【權利要求】
1.一種文本檢測方法,其特征在于,包括: 根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像; 對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積; 通過預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像; 依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
2.根據(jù)權利要求1所述的方法,其特征在于,所述對所述第一目標區(qū)域圖像進行圖像背景分割,得到第二目標區(qū)域圖像,包括: 確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框; 依據(jù)所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像,利用圖像分割GrabCut算法獲取所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像; 其中,所述區(qū)域框,將所述第一目標區(qū)域圖像中的所述第二目標區(qū)域圖像與所述背景圖像分隔開。
3.根據(jù)權利要求2所述的方法,其特征在于,所述確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框,包括: 對所述第一目標區(qū)域圖像進行灰度處理及二值化操作; 依據(jù)經(jīng)過二值化操作的第一目標區(qū)域圖像,確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
4.根據(jù)權利要求1所述的方法,其特征在于,所述通過預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像,包括: 以預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行空白像素點掃描; 其中,在掃描到空白像素點時,確定掃描到的空白像素點所在行之前的第一區(qū)域圖像,對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像,并確定掃描到的空白像素點所在行之后的第二區(qū)域圖像,依據(jù)所述像素點掃描方式對所述第二區(qū)域圖像繼續(xù)進行空白像素點的掃描。
5.根據(jù)權利要求4所述的方法,其特征在于,所述對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像,包括: 確定所述第一區(qū)域圖像的行像素點中起始點與終止點之間的第一差值,并確定所述第一區(qū)域圖像的列像素點中起始點與終止點之間的第二差值; 在所述第一差值與所述第二差值之間的差值絕對值大于所述第一差值或所述第二差值的情況下,在所述第一區(qū)域圖像中進行字符圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
6.—種電子設備,其特征在于,所述電子設備包括: 目標圖像確定單元,用于根據(jù)接收到的用戶對目標圖像的選擇操作,在目標圖像中確定第一目標區(qū)域圖像; 背景分割單元,用于對所述第一目標區(qū)域圖像進行圖像背景分割,得到所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像,所述第二目標區(qū)域圖像的圖像面積小于所述第一目標區(qū)域圖像的圖像面積; 字符分割單元,用于通過預算的像素點掃描方式,對所述第二目標區(qū)域圖像進行單字符分割,得到至少一個目標字符圖像; 文本數(shù)據(jù)獲取單元,用于依據(jù)預設識別庫中字符圖像與字符數(shù)據(jù)的對應關系,分別獲取每個所述目標字符圖像各自對應的目標字符數(shù)據(jù),將獲取到的目標字符數(shù)據(jù)組成文本數(shù)據(jù)。
7.根據(jù)權利要求6所述的電子設備,其特征在于,所述背景分割單元包括: 區(qū)域框確定子單元,用于確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框; 圖像分割子單元,用于依據(jù)所述第一目標區(qū)域圖像中所述區(qū)域框之外的背景圖像,利用GrabCut算法獲取所述第一目標區(qū)域圖像中的第二目標區(qū)域圖像; 其中,所述區(qū)域框,將所述第一目標區(qū)域圖像中的所述第二目標區(qū)域圖像與所述背景圖像分隔開。
8.根據(jù)權利要求7所述的電子設備,其特征在于,所述區(qū)域框確定子單元包括: 區(qū)域操作模塊,用于對所述第一目標區(qū)域圖像進行灰度處理及二值化操作; 區(qū)域框確定模塊,用于依據(jù)經(jīng)過二值化操作的第一目標區(qū)域圖像,確定所述第一目標區(qū)域圖像中聯(lián)通區(qū)域的區(qū)域框。
9.根據(jù)權利要求6所述的電子設備,其特征在于,所述字符分割單元包括: 像素點掃描子單元,用于以預設的像素點掃描方式,對所述第二目標區(qū)域圖像進行空白像素點掃描,其中,在掃描到空白像素點時,觸發(fā)第一區(qū)域確定子單元和第二區(qū)域確定子單元; 第一區(qū)域確定子單元,用于確定掃描到的空白像素點所在行之前的第一區(qū)域圖像,觸發(fā)目標分割子單兀; 目標分割子單元,用于對所述第一區(qū)域圖像進行圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像; 第二區(qū)域確定子單元,用于確定掃描到的空白像素點所在行之后的第二區(qū)域圖像,觸發(fā)所述像素點掃描子單元依據(jù)所述像素點掃描方式對所述第二區(qū)域圖像繼續(xù)進行空白像素點掃描。
10.根據(jù)權利要求9所述的電子設備,其特征在于,所述目標分割子單元包括: 差值確定模塊,用于確定所述第一區(qū)域圖像的行像素點中起始點與終止點之間的第一差值,并確定所述第一區(qū)域圖像的列像素點中起始點與終止點之間的第二差值; 字符分割模塊,用于在所述第一差值與所述第二差值之間的差值絕對值大于所述第一差值或所述第二差值的情況下,在所述第一區(qū)域圖像中進行字符圖像分割,得到所述第一區(qū)域圖像中的目標字符圖像。
【文檔編號】G06K9/20GK104036272SQ201410289155
【公開日】2014年9月10日 申請日期:2014年6月24日 優(yōu)先權日:2014年6月24日
【發(fā)明者】婁紅書, 張子丹 申請人:聯(lián)想(北京)有限公司