用于從圖像確定文本信息的并行處理方法和設(shè)備的制作方法
【專利摘要】本發(fā)明揭示一種用于處理多通道圖像的方法。所述方法包含從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像。在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū),且從所述至少一個(gè)文本區(qū)確定文本區(qū)信息。所述方法基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。在所述至少一個(gè)文本區(qū)包含多個(gè)文本區(qū)的情況下,合并來自所述多個(gè)文本區(qū)的文本區(qū)信息以產(chǎn)生所述文本信息。并行地處理所述多個(gè)所述灰度級(jí)圖像。在識(shí)別所述至少一個(gè)文本區(qū)的過程中,可在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)候選文本區(qū),且可在所述所識(shí)別的候選文本區(qū)中識(shí)別所述至少一個(gè)文本區(qū)。
【專利說明】用于從圖像確定文本信息的并行處理方法和設(shè)備
[0001]相關(guān)申請(qǐng)案的交叉參考
[0002]本申請(qǐng)案主張2011年7月8日申請(qǐng)的第61/505,984號(hào)美國(guó)臨時(shí)專利申請(qǐng)案以及2012年7月2日申請(qǐng)的第13/539,797號(hào)美國(guó)非臨時(shí)申請(qǐng)案中的每一者的優(yōu)先權(quán),且以引用的方式并入。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明大體上涉及處理圖像。更具體來說,本發(fā)明涉及通過并行處理通道從多通道圖像產(chǎn)生文本信息。
【背景技術(shù)】
[0004]數(shù)字圖像可含有多種對(duì)象,例如包含字符、數(shù)字和符號(hào)的文本對(duì)象以及非文本對(duì)象。在這些對(duì)象中,文本對(duì)象可提供上下文信息,這對(duì)于用戶是特別有意義和有用的。常規(guī)的算法常使用常使用標(biāo)量像素值來處理此些數(shù)字圖像。舉例來說,包含SIFT(尺度不變特征變換)和MSER(最穩(wěn)定外部區(qū))的常規(guī)算法已用于基于標(biāo)量像素值來檢測(cè)數(shù)字圖像中的文本對(duì)象。
[0005]如今使用的大多數(shù)數(shù)字圖像是彩色圖像。彩色圖像通常包含色彩信息,例如圖像中的每一像素的RGB值、CMY值或色調(diào)、亮度和色度值的組合。一股來說,數(shù)字彩色圖像中的色彩是由多維向量(例如,RGB值或CMY值)表示。因此,使用處理圖像的標(biāo)量值的常規(guī)算法一股不適合辨識(shí)彩色圖像中的文本對(duì)象。替代地,已經(jīng)使用使用彩色圖像中的像素的向量值來辨識(shí)文本對(duì)象的算法,例如MSCR(最穩(wěn)定色彩區(qū))。然而,此些基于向量的算法一股比基于標(biāo)量的算法復(fù)雜得多并且需要多得多的計(jì)算資源。
[0006]為了減少?gòu)?fù)雜度和計(jì)算資源,常規(guī)的方案已經(jīng)使用基于標(biāo)量的算法來提高彩色圖像中的處理速度。舉例來說,通過將原始彩色圖像轉(zhuǎn)換為具有標(biāo)量像素值的圖像而從原始彩色圖像辨識(shí)出文本對(duì)象中的個(gè)別字符。然而,此過程可導(dǎo)致一些文本對(duì)象與其背景之間的對(duì)比度的損失,使得可能不會(huì)正確地辨識(shí)出文本對(duì)象中的字符。
【發(fā)明內(nèi)容】
[0007]本發(fā)明提供用于處理多通道圖像以產(chǎn)生與所述多通道圖像相關(guān)聯(lián)的文本信息的方法和設(shè)備。在這些方法和設(shè)備中,從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像。隨后通過并行地處理所述灰度級(jí)圖像而產(chǎn)生文本信息。
[0008]根據(jù)本發(fā)明的一個(gè)方面,揭示一種用于處理多通道圖像的方法。所述方法包含從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像。在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū),且從所述至少一個(gè)文本區(qū)確定文本區(qū)信息。所述方法隨后基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。本發(fā)明還描述與此方法相關(guān)的設(shè)備、裝置的組合,以及計(jì)算機(jī)可讀媒體。
[0009]根據(jù)本發(fā)明的另一方面,揭示一種用于處理多通道圖像的設(shè)備。所述設(shè)備包含至少一個(gè)圖像轉(zhuǎn)換器、多個(gè)文本區(qū)檢測(cè)器以及一合并單元。所述至少一個(gè)圖像轉(zhuǎn)換器從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像。所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū),且從所述至少一個(gè)文本區(qū)確定文本區(qū)信息。通過所述合并單元基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
[0010]根據(jù)本發(fā)明的又一方面,揭示用于處理多通道圖像的另一方法。所述方法從所述多通道圖像產(chǎn)生第一和第二灰度級(jí)圖像。在所述第一灰度級(jí)圖像中識(shí)別第一文本區(qū)且在所述第二灰度級(jí)圖像中識(shí)別第二文本區(qū)。另外,分別從所述第一文本區(qū)和所述第二文本區(qū)確定第一和第二文本區(qū)信息。所述方法基于所述第一和第二文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。本發(fā)明還描述與此方法相關(guān)的設(shè)備、裝置的組合,以及計(jì)算機(jī)可讀媒體。
[0011]根據(jù)本發(fā)明的再一方面,揭示用于處理多通道圖像的另一設(shè)備。所述設(shè)備包含至少一個(gè)圖像轉(zhuǎn)換器、第一文本區(qū)檢測(cè)器和第二文本區(qū)檢測(cè)器以及合并單元。所述至少一個(gè)圖像轉(zhuǎn)換器從所述多通道圖像產(chǎn)生第一和第二灰度級(jí)圖像。所述第一文本區(qū)檢測(cè)器經(jīng)配置以在所述第一灰度級(jí)圖像中識(shí)別第一文本區(qū)且從所述第一文本區(qū)確定第一文本區(qū)信息。所述第二文本區(qū)檢測(cè)器經(jīng)配置以在所述第二灰度級(jí)圖像中識(shí)別第二文本區(qū)且從所述第二文本區(qū)確定第二文本區(qū)信息。通過所述合并單元基于所述第一和第二文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
【專利附圖】
【附圖說明】
[0012]圖1說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的圖像處理設(shè)備。
[0013]圖2說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的另一圖像處理設(shè)備。
[0014]圖3說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的又一圖像處理設(shè)備。
[0015]圖4表示根據(jù)本發(fā)明的一個(gè)實(shí)施例的由圖像處理設(shè)備執(zhí)行的用于接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的方法的流程圖。
[0016]圖5說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的使用并行布置的處理通道從多通道圖像產(chǎn)生文本信息的圖。
[0017]圖6說明確定與處理通道的文本區(qū)相關(guān)聯(lián)的文本區(qū)信息的更詳細(xì)圖。
[0018]圖7說明由文本區(qū)檢測(cè)器執(zhí)行的通過團(tuán)點(diǎn)檢測(cè)技術(shù)在灰度級(jí)圖像中識(shí)別出文本區(qū)的操作。
[0019]圖8說明確定與用于處理通道的灰度級(jí)圖像中的文本區(qū)相關(guān)聯(lián)的文本區(qū)信息的更詳細(xì)圖。
[0020]圖9說明確定與用于另一處理通道的另一灰度級(jí)圖像中的另一文本區(qū)相關(guān)聯(lián)的文本區(qū)信息的更詳細(xì)圖。
[0021]圖10說明由合并單元執(zhí)行的合并文本區(qū)信息以產(chǎn)生文本信息的操作。
[0022]圖11說明分別在不同灰度級(jí)圖像中識(shí)別出的兩個(gè)文本區(qū)在位置上重疊時(shí)產(chǎn)生文本信息的圖。
[0023]圖12說明分別在不同灰度級(jí)圖像中識(shí)別出的兩個(gè)文本區(qū)在位置上重疊時(shí)產(chǎn)生文本信息的另一圖。
[0024]圖13說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以通過確定候選文本區(qū)而從圖像產(chǎn)生文本信息的圖像處理設(shè)備。
[0025]圖14表示根據(jù)本發(fā)明的一個(gè)實(shí)施例的由圖像處理設(shè)備執(zhí)行的用于接收?qǐng)D像且通過識(shí)別出候選文本區(qū)而從所接收的圖像產(chǎn)生文本信息的方法的流程圖。
[0026]圖15是根據(jù)本發(fā)明的一個(gè)實(shí)施例的使用并行布置的處理通道從多通道圖像產(chǎn)生文本信息的圖。
[0027]圖16說明確定與用于處理通道的候選文本區(qū)相關(guān)聯(lián)的候選文本區(qū)定位符的更詳細(xì)圖。
[0028]圖17說明確定與用于另一處理通道的另一候選文本區(qū)相關(guān)聯(lián)的另一候選文本區(qū)定位符的更詳細(xì)圖。
[0029]圖18說明由控制器執(zhí)行的通過識(shí)別出灰度級(jí)圖像中的非候選文本區(qū)的共同部分來調(diào)整候選文本區(qū)的操作。
[0030]圖19說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以通過調(diào)整處理通道之間的處理負(fù)荷而從圖像產(chǎn)生文本信息的圖像處理設(shè)備。
[0031]圖20表示根據(jù)本發(fā)明的一個(gè)實(shí)施例的由圖像處理設(shè)備執(zhí)行的用于在基于所估計(jì)的處理負(fù)荷而調(diào)整的候選文本區(qū)中識(shí)別出文本區(qū)的方法的流程圖。
[0032]圖21是使用并行布置的處理通道以及用于處理通道之間的負(fù)荷平衡的負(fù)荷控制器從多通道圖像產(chǎn)生文本信息的圖。
[0033]圖22說明確定與用于處理通道的候選文本區(qū)相關(guān)聯(lián)的候選文本區(qū)定位符的更詳細(xì)圖。
[0034]圖23說明確定用于另一處理通道的另一候選文本區(qū)定位符的更詳細(xì)圖。
[0035]圖24說明通過負(fù)荷控制器產(chǎn)生負(fù)荷平衡的候選文本區(qū)且將所述候選文本區(qū)指派給文本區(qū)檢測(cè)器的更詳細(xì)圖。
[0036]圖25是示范性移動(dòng)計(jì)算裝置的框圖,可在所述移動(dòng)計(jì)算裝置中實(shí)施根據(jù)本發(fā)明的一些實(shí)施例的本發(fā)明的圖像處理設(shè)備和方法。
【具體實(shí)施方式】
[0037]現(xiàn)在參考圖式來描述各種實(shí)施例,其中相同參考標(biāo)號(hào)始終用于指代相同元件。在以下描述中,出于解釋的目的,闡述許多特定細(xì)節(jié)以便提供對(duì)一個(gè)或一個(gè)以上實(shí)施例的徹底理解。然而,可顯而易見,可在無這些特定細(xì)節(jié)的情況下實(shí)踐此類實(shí)施例。在其它情況下,以框圖形式展示眾所周知的結(jié)構(gòu)和裝置,以便促進(jìn)描述一個(gè)或一個(gè)以上實(shí)施例。
[0038]圖1說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的圖像處理設(shè)備100。圖像處理設(shè)備100包含圖像轉(zhuǎn)換器110、文本區(qū)檢測(cè)器120和130以及合并單元140。所接收的圖像是包含多個(gè)通道的多通道圖像且含有具有文本或字符的一個(gè)或一個(gè)以上文本區(qū)。多通道圖像的一些實(shí)例是包含RGB、YUV或YCrCb通道的三通道圖像或包含對(duì)所述三個(gè)通道的額外的紅外通道的四通道圖像。
[0039]圖像轉(zhuǎn)換器110接收多通道圖像且將所述多通道圖像轉(zhuǎn)換為一對(duì)灰度級(jí)圖像以由一對(duì)處理通道CHl和CH2進(jìn)行處理。經(jīng)轉(zhuǎn)換的圖像可存儲(chǔ)在存儲(chǔ)器(未圖示)中,文本區(qū)檢測(cè)器120和130和/或合并單元140可存取所述存儲(chǔ)器以用于處理所存儲(chǔ)的圖像。每一灰度級(jí)圖像是單通道圖像,其中每一像素的標(biāo)量值指示根據(jù)通道的像素的強(qiáng)度。通常灰度級(jí)圖像中的每一像素是由選自兩個(gè)以上灰度水平的陰影水平呈現(xiàn),且不同于黑白二進(jìn)制圖像,其中所述灰度水平在最弱強(qiáng)度的黑色與最強(qiáng)強(qiáng)度的白色之間變化。舉例來說,在RGB多通道圖像的情況下,可從R通道和G通道產(chǎn)生一對(duì)灰度級(jí)圖像。替代地或另外地,可通過對(duì)不同通道的像素值進(jìn)行加權(quán)且組合經(jīng)加權(quán)的像素值來產(chǎn)生灰度級(jí)圖像。
[0040]從圖像轉(zhuǎn)換器110產(chǎn)生的所述對(duì)不同灰度級(jí)圖像分別被輸入到文本區(qū)檢測(cè)器120和130。舉例來說,由R通道中的像素值構(gòu)成的一個(gè)灰度級(jí)圖像可被輸入到文本區(qū)檢測(cè)器120,而由G通道中的像素值構(gòu)成的另一灰度級(jí)圖像可被輸入到文本區(qū)檢測(cè)器130。雖然圖1說明兩個(gè)灰度級(jí)圖像以及兩個(gè)文本區(qū)檢測(cè)器120和130,但僅通過實(shí)例的方式來呈現(xiàn)所述數(shù)目,且因此圖像處理設(shè)備100可被配置有任何合適數(shù)目的此類灰度級(jí)圖像和文本區(qū)檢測(cè)器。
[0041]文本區(qū)檢測(cè)器120和130經(jīng)配置以識(shí)別相應(yīng)灰度級(jí)圖像中的一個(gè)或一個(gè)以上文本區(qū)。由于文本區(qū)檢測(cè)器120和130接收多通道圖像的不同灰度級(jí)圖像,所以所識(shí)別的文本區(qū)可彼此相同或不同。文本區(qū)檢測(cè)器120和130進(jìn)一步經(jīng)配置以確定與相應(yīng)的文本區(qū)相關(guān)聯(lián)的文本區(qū)信息。所述文本區(qū)信息包含與相關(guān)聯(lián)的文本區(qū)相關(guān)的任何合適的信息,例如灰度級(jí)圖像中的文本區(qū)的位置信息以及在文本區(qū)中所檢測(cè)和辨識(shí)出的任何文本的文本辨識(shí)信息。隨后從文本區(qū)檢測(cè)器120和130將文本區(qū)信息輸出到合并單元140。
[0042]在圖1中,如果文本區(qū)檢測(cè)器120在所接收的灰度級(jí)圖像中識(shí)別出兩個(gè)或兩個(gè)以上文本區(qū),那么文本區(qū)檢測(cè)器120確定并輸出與所識(shí)別的文本區(qū)中的全部相關(guān)聯(lián)的文本區(qū)信息。另一方面,如果未識(shí)別出文本區(qū),那么文本區(qū)檢測(cè)器120可輸出灰度級(jí)圖像不具有所識(shí)別的文本區(qū)的指示。文本區(qū)檢測(cè)器130以與文本區(qū)檢測(cè)器120類似的方式操作。圖像處理設(shè)備100中的文本區(qū)檢測(cè)器120和130界定并行處理通道CHl和CH2。因此,并行地執(zhí)行文本區(qū)檢測(cè)器120和130的操作。
[0043]合并單元140經(jīng)配置以合并從文本區(qū)檢測(cè)器120和130接收的文本區(qū)信息且產(chǎn)生與多通道圖像相關(guān)聯(lián)的文本信息。在其中處理通道CHl和CH2中的所識(shí)別的文本區(qū)不同的情況下,通過組合從文本區(qū)檢測(cè)器120和130接收的文本區(qū)信息而產(chǎn)生文本信息。另一方面,如果所識(shí)別的文本區(qū)的位置是相同的,那么基于具有更大的文本辨識(shí)準(zhǔn)確度或文本區(qū)識(shí)別準(zhǔn)確度的可能性的文本區(qū)信息而產(chǎn)生文本信息,這將在下文更詳細(xì)地描述。
[0044]可執(zhí)行例如OCR或手寫辨識(shí)等文本辨識(shí)操作來辨識(shí)文本區(qū)檢測(cè)器120和130中的所識(shí)別的文本區(qū)中的文本。在替代性實(shí)施例中,可在合并單元140而不是文本區(qū)檢測(cè)器120和130中執(zhí)行此類文本辨識(shí)操作。在此情況下,合并單元140可存取并處理存儲(chǔ)于存儲(chǔ)器中的灰度級(jí)圖像以辨識(shí)所識(shí)別的文本區(qū)中的文本。
[0045]圖2說明根據(jù)本發(fā)明的另一實(shí)施例的經(jīng)配置以接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的圖像處理設(shè)備200。圖像處理設(shè)備200包含文本區(qū)檢測(cè)器120和130以及合并單元140,其是與圖1的圖像處理設(shè)備100中所包含的單元相同或類似的單元。圖像處理設(shè)備200進(jìn)一步包含圖像轉(zhuǎn)換器210和220來取代圖像處理設(shè)備100的圖像轉(zhuǎn)換器110。如圖2中所描繪,圖像轉(zhuǎn)換器210和220中的每一者接收多通道圖像且產(chǎn)生灰度級(jí)圖像。由于圖像轉(zhuǎn)換器210和220使用不同的轉(zhuǎn)換方法,所以所產(chǎn)生的灰度級(jí)圖像可彼此不同。所產(chǎn)生的灰度級(jí)圖像分別被輸入到文本區(qū)檢測(cè)器120和130。雖然圖2說明兩個(gè)圖像轉(zhuǎn)換器210和220以及兩個(gè)文本區(qū)檢測(cè)器120和130,但僅通過實(shí)例的方式來呈現(xiàn)所述數(shù)目,且因此圖像處理設(shè)備200可被配置有任何合適數(shù)目的此類圖像轉(zhuǎn)換器和文本區(qū)檢測(cè)器。
[0046]可以與參考圖1所描述的方式相同的方式來執(zhí)行文本區(qū)檢測(cè)器120和130以及合并單元140的操作。在此實(shí)施例中,通過一個(gè)處理通道CHl來執(zhí)行文本區(qū)檢測(cè)器120的操作,而通過另一處理通道CH2來執(zhí)行文本區(qū)檢測(cè)器130的操作。因此,可以彼此并行地執(zhí)行相應(yīng)的灰度級(jí)圖像上的操作。
[0047]圖1的實(shí)施例可適合于其中產(chǎn)生多個(gè)灰度級(jí)圖像的過程是彼此相關(guān)聯(lián)的情況,而圖2的實(shí)施例可適合于其中此類過程彼此幾乎不相關(guān)聯(lián)的情況。舉例來說,從多個(gè)通道產(chǎn)生不同的灰度級(jí)圖像的過程可在彼此之間共享中間處理信息(例如,與通道相關(guān)聯(lián)的某些參數(shù)或值)。在此情況下,如果單個(gè)單元(即,圖1中所描繪的圖像轉(zhuǎn)換器110)共同地執(zhí)行灰度級(jí)圖像產(chǎn)生過程同時(shí)共享過程之間的相關(guān)聯(lián)的信息,那么可提高整個(gè)操作的處理量。
[0048]圖3說明根據(jù)本發(fā)明的又一實(shí)施例的經(jīng)配置以接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的圖像處理設(shè)備300。圖像處理設(shè)備300包含圖像轉(zhuǎn)換器110、文本區(qū)檢測(cè)器120和130以及合并單元140,其是與圖1的圖像處理設(shè)備100中所包含的單元相同或類似的單元。圖像處理設(shè)備300進(jìn)一步包含圖像轉(zhuǎn)換器310和文本區(qū)檢測(cè)器320、330和340。如圖3中所描繪,圖像轉(zhuǎn)換器110接收多通道圖像且產(chǎn)生兩個(gè)灰度級(jí)圖像。圖像轉(zhuǎn)換器310也接收多通道圖像且產(chǎn)生三個(gè)灰度級(jí)圖像。由于使用不同的轉(zhuǎn)換方法,所以五個(gè)灰度級(jí)圖像可彼此不同。從圖像轉(zhuǎn)換器Iio產(chǎn)生的兩個(gè)級(jí)圖像分別被輸入到文本區(qū)檢測(cè)器120和130。另外,從圖像轉(zhuǎn)換器310產(chǎn)生的三個(gè)級(jí)圖像分別被輸入到文本區(qū)檢測(cè)器320、330和340。雖然圖3說明兩個(gè)圖像轉(zhuǎn)換器110和310以及五個(gè)文本區(qū)檢測(cè)器120、130、320、330和340,但僅通過實(shí)例的方式來呈現(xiàn)所述數(shù)目,且因此圖像處理設(shè)備300可被配置有任何合適數(shù)目的此類圖像轉(zhuǎn)換器和文本區(qū)檢測(cè)器。
[0049]文本區(qū)檢測(cè)器120、130、320、330和340識(shí)別相應(yīng)的灰度級(jí)圖像中的文本區(qū)且確定與相應(yīng)的所識(shí)別文本區(qū)相關(guān)聯(lián)的文本區(qū)信息。如圖3中所示,文本區(qū)檢測(cè)器120、130、320、330和340可通過相應(yīng)的處理通道CHl到CH5來并行地執(zhí)行上文提及的識(shí)別和確定操作。合并單元140從文本區(qū)檢測(cè)器120、130、320、330和340接收所確定的文本區(qū)信息,且合并所接收的文本區(qū)信息以產(chǎn)生文本信息。圖像處理設(shè)備100、200和300中的上述單元可由在計(jì)算裝置或系統(tǒng)中的一個(gè)或一個(gè)以上處理器中執(zhí)行的硬件、軟件和/或其組合來實(shí)施。
[0050]圖4表示由圖像處理設(shè)備100執(zhí)行的用于接收?qǐng)D像且從所接收的圖像產(chǎn)生文本信息的方法400的流程圖。首先,圖像轉(zhuǎn)換器110在410處接收多通道圖像。其后,在420處,圖像轉(zhuǎn)換器110通過使用多種圖像轉(zhuǎn)換方法從所接收的多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像。在430處,不同的灰度級(jí)圖像被輸入到對(duì)應(yīng)的文本區(qū)檢測(cè)器120和130,且每一文本區(qū)檢測(cè)器識(shí)別其所接收的灰度級(jí)圖像中的文本區(qū)。在440處,文本區(qū)檢測(cè)器120和130中的每一者進(jìn)一步確定與其所識(shí)別的文本區(qū)相關(guān)聯(lián)的文本區(qū)信息。在450處,合并單元140從文本區(qū)檢測(cè)器120和130接收文本區(qū)信息且通過合并所接收的文本區(qū)信息而產(chǎn)生文本信息。還可在設(shè)備200和300中使用上述單元來執(zhí)行參考圖4所描述的以上操作。
[0051]圖5說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的使用并行布置的處理通道CHl和CH2從多通道圖像510產(chǎn)生文本信息560的圖。多通道圖像510包含兩個(gè)文本部分,一個(gè)在上部部分(“上部文本”),且另一個(gè)在下部部分(“下部文本”)。圖像轉(zhuǎn)換器110通過使用如上文所描述的不同圖像轉(zhuǎn)換方法將多通道圖像510轉(zhuǎn)換為分別用于處理通道CHl和CH2的兩個(gè)不同的灰度級(jí)圖像520和540。將多通道圖像轉(zhuǎn)換為不同灰度級(jí)圖像可使得一些文本部分變得更突出以用于更容易的檢測(cè),而一些其它部分可變得在灰度級(jí)圖像中較不突出。在經(jīng)轉(zhuǎn)換的灰度級(jí)圖像520中,上部部分“上部文本”中的文本保持突出,而下部部分“下部文本”中的文本可不容易與背景區(qū)別開。相比而言,在經(jīng)轉(zhuǎn)換的灰度級(jí)圖像540中,下部部分“下部文本”中的文本相對(duì)于背景更突出,而上部部分“上部文本”中的文本可不容易與背景區(qū)別開。
[0052]在接收到灰度級(jí)圖像520之后,處理通道CHl中的文本區(qū)檢測(cè)器120即刻處理圖像520以識(shí)別圖像520中含有“上部文本”的文本區(qū)530。同樣,處理通道CH2中的文本區(qū)檢測(cè)器130處理圖像540以識(shí)別圖像540中含有“下部文本”的文本區(qū)550。因此,不將不含有任何可辨識(shí)文本的部分(例如,灰度級(jí)圖像520中的下部部分和灰度級(jí)圖像540中的上部部分)識(shí)別為文本區(qū)。另外,文本區(qū)檢測(cè)器120和130分別確定和輸出與所識(shí)別的文本區(qū)530和550相關(guān)聯(lián)的文本區(qū)信息。
[0053]分別從處理通道CHl和CH2將與文本區(qū)530和550相關(guān)聯(lián)的文本區(qū)信息提供給合并單元140。合并單元140隨后合并來自處理通道CHl和CH2的文本區(qū)信息以產(chǎn)生用于多通道圖像510的文本信息560。還可在設(shè)備200和300中使用上述單元來執(zhí)行參考圖5所描述的以上操作。
[0054]圖6說明確定與處理通道CHl的文本區(qū)530相關(guān)聯(lián)的文本區(qū)信息610的更詳細(xì)圖。如上文所陳述,灰度級(jí)圖像520的上部部分中的“上部文本”與其背景不同。在本發(fā)明中,此類不同的文本(或彼此靠近定位的一組字符)被稱作文本分量且可被識(shí)別為文本區(qū)。因此,文本區(qū)檢測(cè)器120將含有文本分量的區(qū)(即,“上部文本”)識(shí)別為文本區(qū)530。在識(shí)別文本區(qū)530的過程中,文本區(qū)530的邊界經(jīng)配置以根據(jù)文本分量中的字符的布置而包含文本分量。
[0055]一旦已識(shí)別出文本區(qū)530,文本區(qū)檢測(cè)器120便確定與文本區(qū)530相關(guān)聯(lián)的文本區(qū)信息610。舉例來說,文本區(qū)信息610包含指示灰度級(jí)圖像520中的文本區(qū)530的位置的位置信息(例如,文本區(qū)530的頂點(diǎn)的坐標(biāo))以及指示所識(shí)別的文本區(qū)530的置信度值的區(qū)置信度信息(例如,從0.0到1.0或從0%到100%的數(shù)值)。舉例來說,區(qū)置信度信息可為指示所識(shí)別的文本區(qū)530含有文本分量的準(zhǔn)確度的值。
[0056]在其中文本區(qū)檢測(cè)器120對(duì)所識(shí)別的文本區(qū)530執(zhí)行文本辨識(shí)操作的情況下,文本區(qū)信息610可進(jìn)一步包含指示文本區(qū)530中的所辨識(shí)的文本(在此實(shí)例中,“上部文本”)的文本辨識(shí)信息以及指示所辨識(shí)的文本的置信度值的文本置信度信息(例如,從0.0到1.0或從0%到100%的數(shù)值)。舉例來說,文本置信度信息可為指示所辨識(shí)的文本的準(zhǔn)確度的值??赏ㄟ^使用常規(guī)的OCR技術(shù)來辨識(shí)文本且可計(jì)算其置信度值。在確定文本區(qū)信息610的過程中,可僅對(duì)文本區(qū)530,而不是整個(gè)灰度級(jí)圖像520,執(zhí)行文本辨識(shí)操作。通過僅對(duì)所識(shí)別的文本區(qū)530執(zhí)行文本辨識(shí),可實(shí)質(zhì)上減少在上面執(zhí)行文本辨識(shí)操作的區(qū)域,使得處理時(shí)間和所需的計(jì)算資源會(huì)減少。
[0057]圖7說明由文本區(qū)檢測(cè)器120執(zhí)行的使用團(tuán)點(diǎn)檢測(cè)技術(shù)在灰度級(jí)圖像520中識(shí)別出文本區(qū)530的操作?;叶燃?jí)圖像520包含其上部部分中的不同文本分量“上部文本”。文本區(qū)檢測(cè)器120執(zhí)行團(tuán)點(diǎn)檢測(cè)操作以確定文本區(qū)中的個(gè)別字符的團(tuán)點(diǎn)。具體來說,文本區(qū)檢測(cè)器120識(shí)別同質(zhì)區(qū)以確定團(tuán)點(diǎn)。舉例來說,在圖7中,字符“U”、“E”、“T”或“X”具有由所述字符的外部邊界畫出輪廓的單個(gè)同質(zhì)區(qū)。另一方面,字符“P”或“R”具有兩個(gè)同質(zhì)區(qū),其中所述兩個(gè)同質(zhì)區(qū)中的一者是由所述字符的外部邊界畫出輪廓,且另一同質(zhì)區(qū)是由(圓圈狀)內(nèi)部邊界畫出輪廓?;谒R(shí)別的同質(zhì)區(qū),文本區(qū)檢測(cè)器120隨后將某些同質(zhì)區(qū)確定為表示字符的團(tuán)點(diǎn)。
[0058]隨后執(zhí)行團(tuán)點(diǎn)群集操作以確定含有如上文所確定的團(tuán)點(diǎn)的簇710。團(tuán)點(diǎn)群集操作可利用團(tuán)點(diǎn)的位置、強(qiáng)度和/或筆劃寬度信息。舉例來說,從單個(gè)文本導(dǎo)出的團(tuán)點(diǎn)將位于彼此的緊密附近內(nèi)。另外,此類團(tuán)點(diǎn)可具有相同或類似的強(qiáng)度或筆劃寬度。因此,如果某些團(tuán)點(diǎn)滿足以上要求,那么可將這些團(tuán)點(diǎn)合并為簇,如圖7中的簇710。
[0059]隨后,可執(zhí)行投影輪廓分析以確定沿其對(duì)準(zhǔn)文本分量中的字符的方向。舉例來說,沿著平行于箭頭A的方向的水平線720來計(jì)算團(tuán)點(diǎn)中的像素的強(qiáng)度值的總和。此外,沿著額外的平行水平線730、740、750和760中的每一者來計(jì)算像素強(qiáng)度值的總和。另外,沿著平行于箭頭B的方向的垂直線中的每一者并且還沿著平行于箭頭C的方向的傾斜線中的每一者來計(jì)算像素強(qiáng)度值的總和。給定團(tuán)點(diǎn)內(nèi)的像素的強(qiáng)度值高于團(tuán)點(diǎn)外的像素的強(qiáng)度值,由于線730和750穿過團(tuán)點(diǎn)且線720、740和760未穿過團(tuán)點(diǎn),如圖7中所示,所以沿著線730和750的像素強(qiáng)度值的總和將大于沿著剩余三條線720、740和760的像素強(qiáng)度值的總和
[0060]在一實(shí)施例中,可將沿著線的強(qiáng)度值的總和與預(yù)定參考值進(jìn)行比較,使得在所述總和超過預(yù)定參考值時(shí),確定沿著所述線存在團(tuán)點(diǎn)。相比而言,如果所述總和未超過預(yù)定參考值,那么確定沿著所述線不存在團(tuán)點(diǎn)。在圖7的實(shí)例中,沿著線730和750的像素強(qiáng)度值的總和可大于預(yù)定參考值,而沿著線720、740和760的總和可小于預(yù)定參考值。在垂直線的情況下,這些線中的大多數(shù)穿過團(tuán)點(diǎn),且沿著這些垂直線的總和將大于預(yù)定參考值。類似地,在傾斜線的情況下,這些線中的大多數(shù)穿過團(tuán)點(diǎn),且沿著這些傾斜直線的總和將大于預(yù)定參考值。隨后確定文本分量在水平方向上對(duì)準(zhǔn),因?yàn)檠刂骄€的像素強(qiáng)度值的總和包含大于預(yù)定參考值的最小數(shù)目的總和。一旦已確定文本分量的方向,便可根據(jù)眾所周知的文本區(qū)檢測(cè)算法來識(shí)別文本區(qū)530。
[0061]此外,可通過使用機(jī)器學(xué)習(xí)技術(shù)來確定用于指示所識(shí)別的文本區(qū)530的準(zhǔn)確度的區(qū)置信度值。文本分量和非文本分量在其形狀、大小規(guī)則性、寬度和長(zhǎng)度等方面來看具有不同的特性。舉例來說,從文本分量確定的團(tuán)點(diǎn)可具有相當(dāng)規(guī)則的筆劃寬度,而從非文本分量確定的團(tuán)點(diǎn)可具有不同的筆劃寬度。因此,可使用常規(guī)的機(jī)器學(xué)習(xí)技術(shù)從一組訓(xùn)練文本/非文本分量樣本提取文本分量和非文本分量的此些特性,且可將此些特性存儲(chǔ)在機(jī)器學(xué)習(xí)數(shù)據(jù)庫中。舉例來說,所述數(shù)據(jù)庫可包含文本分量和非文本分量的若干參考特性。一旦如上文那股識(shí)別出文本區(qū)530,數(shù)據(jù)庫可將文本區(qū)530的特性與參考特性進(jìn)行比較,且隨后通過反映文本區(qū)530有多符合或匹配文本分量的參考特性而確定區(qū)置信度值。
[0062]圖8說明確定與用于處理通道CHl的灰度級(jí)圖像520中的文本區(qū)810相關(guān)聯(lián)的文本區(qū)信息820的另一更詳細(xì)圖。在圖8中,文本區(qū)檢測(cè)器120將含有文本分量的區(qū)(即,上部部分中的“上部文本”)識(shí)別為文本區(qū)810。然而,不同于圖6的實(shí)施例,文本區(qū)810的邊界是矩形形狀。舉例來說,所述矩形可為能夠含有文本分量的最小矩形。文本區(qū)檢測(cè)器120隨后確定并輸出與文本區(qū)810相關(guān)聯(lián)的文本區(qū)信息820。類似于圖6,文本區(qū)信息820可包含位置信息、區(qū)置信度信息、文本辨識(shí)信息以及文本置信度信息。
[0063]圖8說明確定與用于處理通道CH2的灰度級(jí)圖像540中的文本區(qū)550相關(guān)聯(lián)的文本區(qū)信息910的更詳細(xì)圖。以與參考圖6所描述的方式相同的方式,文本區(qū)檢測(cè)器130將含有文本分量的區(qū)(即,下部部分中的“下部文本”)識(shí)別為文本區(qū)550。文本區(qū)檢測(cè)器130隨后確定并輸出與文本區(qū)550相關(guān)聯(lián)的文本區(qū)信息910。類似地,文本區(qū)信息910可包含位置信息、區(qū)置信度信息、文本辨識(shí)信息以及文本置信度信息。
[0064]圖10說明由合并單元140執(zhí)行的合并文本區(qū)信息610和910以產(chǎn)生文本信息560的操作。合并單元140分別從文本區(qū)檢測(cè)器120和130接收文本區(qū)信息610和910,如圖6和9中所描述。隨后合并文本區(qū)信息610和910以產(chǎn)生用于多通道圖像510的文本信息560。舉例來說,由于多通道圖像510含有兩個(gè)文本區(qū)530和550,所以文本信息560可具有表示為“文本I”和“文本2”的兩個(gè)文本信息子集。具體來說,“文本I”的文本信息包含來自文本區(qū)信息610的信息,例如圖6中的位置信息、區(qū)置信度信息、文本辨識(shí)信息以及文本置信度信息。類似地,“文本2”的文本信息包含來自文本區(qū)信息910的信息,例如圖9中的位置信息、區(qū)置信度信息、文本辨識(shí)信息以及文本置信度信息。根據(jù)圖像處理設(shè)備100的設(shè)計(jì)和要求,除了上述信息之外,文本信息560還可包含其它信息,例如與多通道圖像510相關(guān)聯(lián)的元數(shù)據(jù)。另外地或替代地,文本信息560可省略一些上述信息,例如區(qū)置信度信息。
[0065]在另一實(shí)施例中,在合并單元140而不是文本區(qū)檢測(cè)器120和130中執(zhí)行對(duì)所識(shí)別的文本區(qū)530和550的文本辨識(shí)。在此情況下,合并單元140從文本區(qū)檢測(cè)器120和130接收不具有文本辨識(shí)信息和文本置信度信息的文本區(qū)信息,以產(chǎn)生用于多通道圖像510的文本信息560。類似于以上實(shí)施例中所描述的合并操作,合并單元140產(chǎn)生包含分別用于文本區(qū)信息610和910的兩個(gè)子集“文本I”和“文本2”的文本信息560。每一子集包含來自文本區(qū)信息610或910的相關(guān)聯(lián)的位置信息和區(qū)置信度信息。另外,基于從文本區(qū)檢測(cè)器120接收到的文本區(qū)信息的位置信息,合并單元140辨識(shí)由位置信息界定的灰度級(jí)圖像520的區(qū)中的文本,且確定所辨識(shí)的文本的文本置信度值。類似地,基于從文本區(qū)檢測(cè)器130接收到的文本區(qū)信息的位置信息,合并單元140辨識(shí)由位置信息界定的灰度級(jí)圖像540的區(qū)中的文本,且確定所辨識(shí)的文本的文本置信度值。隨后,將來自灰度級(jí)圖像520和540的所辨識(shí)的文本以及其文本置信度值添加到文本信息560的相應(yīng)子集,8卩“文本I”和“文本2”。
[0066]圖11說明分別在不同灰度級(jí)圖像520和1110中識(shí)別出的文本區(qū)530和1120在位置上重疊時(shí)產(chǎn)生文本信息1140的圖。在此實(shí)施例中,在文本區(qū)檢測(cè)器120和130中執(zhí)行文本區(qū)530和1120上的文本辨識(shí)操作以產(chǎn)生文本區(qū)信息610和1130。不同于圖5、6、8和9中所描述的實(shí)施例,由文本區(qū)檢測(cè)器120和130識(shí)別出的文本區(qū)530和1120彼此重疊。因此,由文本區(qū)檢測(cè)器120和130產(chǎn)生的文本區(qū)信息可具有帶有文本區(qū)530和1120兩者的相同或不同的區(qū)置信度信息、文本辨識(shí)信息和文本置信度信息的相同位置信息。
[0067]在圖11的實(shí)例中,文本區(qū)檢測(cè)器120從所識(shí)別的文本區(qū)530辨識(shí)出文本“上部文本”。文本區(qū)檢測(cè)器120進(jìn)一步確定所辨識(shí)的文本的文本置信度值,其可為例如0.9的數(shù)值。同樣,文本區(qū)檢測(cè)器130從所識(shí)別的文本區(qū)1120辨識(shí)出文本“上部文本”且確定所辨識(shí)的文本的文本置信度值,例如0.8。基于以上文本區(qū)信息610和1130,合并單元140確定文本區(qū)530和1120彼此重疊,但所辨識(shí)的文本“上部文本”和“上部文本”是不同的。在此情況下,合并單元140基于其文本置信度值來確定所辨識(shí)的文本中的哪一者更準(zhǔn)確。舉例來說,由于具有0.9的文本置信度值的“上部文本”具有比具有0.8的文本置信度值的“上部文本”高的置信度值,所以合并單元140選擇與“上部文本”相關(guān)聯(lián)的文本區(qū)信息610來產(chǎn)生用于多通道圖像510的文本信息1140。雖然在此實(shí)例中兩個(gè)文本區(qū)530和1120彼此重疊,但三個(gè)或三個(gè)以上文本區(qū)可彼此重疊,且隨后合并單元140將選擇對(duì)應(yīng)于相關(guān)聯(lián)的文本置信度值中最高的文本置信度值的文本區(qū)信息。
[0068]根據(jù)另一實(shí)施例,文本區(qū)可僅部分重疊。合并單元140選擇文本區(qū)中具有最高文本置信度值的一個(gè)文本區(qū)以產(chǎn)生多通道圖像的文本信息的一部分。另外,合并單元140確定其它文本區(qū)中的非重疊部分,且將與非重疊部分相關(guān)聯(lián)的文本區(qū)信息添加到部分產(chǎn)生的文本信息以產(chǎn)生用于多通道圖像的文本信息??蓮呐c文本區(qū)相關(guān)聯(lián)或根據(jù)每一文本區(qū)的適當(dāng)分布而加權(quán)的文本區(qū)信息中的任一者來選擇文本信息的文本置信度信息。
[0069]圖12說明由合并單元140執(zhí)行的分別在不同灰度級(jí)圖像520和1210中識(shí)別出的文本區(qū)530和1220在位置上重疊時(shí)產(chǎn)生文本信息1240的另一圖。在此實(shí)施例中,在合并單元140而不是文本區(qū)檢測(cè)器120和130中執(zhí)行對(duì)文本區(qū)530和1220的文本辨識(shí)操作。文本區(qū)檢測(cè)器120識(shí)別灰度級(jí)圖像520中的文本區(qū)530。類似地,文本區(qū)檢測(cè)器130識(shí)別另一灰度級(jí)圖像1210中的文本區(qū)1220。如圖12中所示,由于由文本區(qū)檢測(cè)器120和130識(shí)別的文本區(qū)530和1220彼此部分重疊,所以由文本區(qū)檢測(cè)器120和130產(chǎn)生的文本區(qū)信息包含不同的位置信息。文本區(qū)檢測(cè)器120進(jìn)一步確定所識(shí)別的文本530的區(qū)置信度值,其可為例如0.9的數(shù)值。同樣,文本區(qū)檢測(cè)器130確定所識(shí)別的文本區(qū)1220的區(qū)置信度值,例如0.5。文本區(qū)檢測(cè)器120和130隨后分別產(chǎn)生并輸出包含相關(guān)聯(lián)的位置信息和區(qū)置信度信息的文本區(qū)信息610和1230。
[0070]基于分別從文本區(qū)檢測(cè)器120和130接收的文本區(qū)信息610和1230,合并單元140執(zhí)行合并操作。在合并操作中,合并單元140基于包含在文本區(qū)信息610和1230中的文本區(qū)530和1220的位置信息而確定文本區(qū)530和1220彼此部分重疊。在此情況下,合并單元140基于其區(qū)置信度值來確定所識(shí)別的文本區(qū)中的哪一者更準(zhǔn)確。舉例來說,由于具有0.9的區(qū)置信度值的文本區(qū)530具有比具有0.5的區(qū)置信度值的文本區(qū)1220高的置信度值,所以合并單元140選擇文本區(qū)信息610。合并單元140隨后辨識(shí)由選定的文本區(qū)信息610的位置信息界定的灰度級(jí)圖像520中的區(qū)中的文本。雖然在此實(shí)例中兩個(gè)文本區(qū)530和1220重疊,但三個(gè)或三個(gè)以上文本區(qū)可重疊,且隨后合并單元140將選擇對(duì)應(yīng)于相關(guān)聯(lián)的區(qū)置信度值中最高的區(qū)置信度值的文本區(qū)信息。因此,根據(jù)本發(fā)明的以上實(shí)施例,可通過合并從多通道圖像提取的多個(gè)灰度級(jí)圖像的文本辨識(shí)結(jié)果來提高多通道圖像的文本辨識(shí)準(zhǔn)確度。此外,由于多個(gè)灰度級(jí)圖像上的文本辨識(shí)操作是并行地執(zhí)行的,所以將不會(huì)與灰度級(jí)圖像的數(shù)目成比例地增加總處理時(shí)間。而且,可將總處理時(shí)間控制成不大于多通道圖像所需的處理時(shí)間。
[0071]圖13說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以通過確定候選文本區(qū)而從圖像產(chǎn)生文本信息的圖像處理設(shè)備1300。圖像處理設(shè)備1300包含圖像轉(zhuǎn)換器110、文本區(qū)檢測(cè)器120和130以及合并單元140,其以與以上圖1中所示的設(shè)備100相同的方式操作。圖像處理設(shè)備1300進(jìn)一步包含經(jīng)配置以識(shí)別灰度級(jí)圖像中的候選文本區(qū)的候選文本區(qū)檢測(cè)器1310和1320,和經(jīng)配置以調(diào)整候選文本區(qū)以防止遺漏文本區(qū)信息的控制器1330,這將在稍后描述。[0072]在圖像處理設(shè)備1300中,圖像轉(zhuǎn)換器110接收多通道圖像且產(chǎn)生一對(duì)灰度級(jí)圖像,將所述對(duì)灰度級(jí)圖像分別提供給候選文本區(qū)檢測(cè)器1310和1320。候選文本區(qū)檢測(cè)器1310和1320經(jīng)配置以識(shí)別相應(yīng)灰度級(jí)圖像中的一個(gè)或一個(gè)以上候選文本區(qū)。在每一候選文本區(qū)檢測(cè)器中,將在其所接收的灰度級(jí)圖像中含有文本分量和/或類文本分量的區(qū)識(shí)別為候選文本區(qū)。此外,類文本分量是指不是由字符而是由具有與字符類似的特性的圖案或?qū)ο髽?gòu)成以使得它們有可能被錯(cuò)誤地辨識(shí)為字符的分量。舉例來說,此些圖案或?qū)ο笫怯梢粋€(gè)或一個(gè)以上垂直、水平或傾斜直線和/或曲線或其組合形成。將在圖15中說明類文本分量的實(shí)例。如將在下文更詳細(xì)地描述,與識(shí)別文本區(qū)的操作相比,可以在文本辨識(shí)準(zhǔn)確度方面較粗糙或不精確的方式來執(zhí)行識(shí)別候選文本區(qū)的操作。然而,與文本區(qū)的識(shí)別相比,可以相當(dāng)短的時(shí)間來執(zhí)行候選文本區(qū)的識(shí)別,且不需要大量計(jì)算資源。
[0073]候選文本區(qū)檢測(cè)器1310和1320進(jìn)一步經(jīng)配置以分別確定與所識(shí)別的候選文本區(qū)相關(guān)聯(lián)的候選文本區(qū)定位符。舉例來說,候選文本區(qū)定位符指示灰度級(jí)圖像中的相關(guān)聯(lián)的候選文本區(qū)的位置,且包含候選文本區(qū)的頂點(diǎn)的坐標(biāo)。
[0074]如果候選文本區(qū)檢測(cè)器1310在所接收的灰度級(jí)圖像中識(shí)別出兩個(gè)或兩個(gè)以上候選文本區(qū),那么候選文本區(qū)檢測(cè)器1310確定并輸出與候選文本區(qū)中的全部相關(guān)聯(lián)的候選文本區(qū)定位符。另一方面,如果未識(shí)別出候選文本區(qū),那么候選文本區(qū)檢測(cè)器1310可輸出指示灰度級(jí)圖像不具有所識(shí)別的候選文本區(qū)的候選文本區(qū)定位符。候選文本區(qū)檢測(cè)器1320以與候選文本區(qū)檢測(cè)器1310類似的方式操作。
[0075]文本區(qū)檢測(cè)器120和130分別從候選文本區(qū)檢測(cè)器1310和1320接收候選文本區(qū)定位符?;谙鄳?yīng)的候選文本區(qū)定位符,文本區(qū)檢測(cè)器120和130中的每一者存取候選文本區(qū)且確定在候選文本區(qū)中所識(shí)別的文本區(qū)的文本區(qū)信息。隨后分別從文本區(qū)檢測(cè)器120和130將文本區(qū)信息輸出到合并單元140。合并單元140合并文本區(qū)信息且產(chǎn)生用于多通道圖像的文本信息。
[0076]在此實(shí)施例中,候選文本區(qū)檢測(cè)器1310和文本區(qū)檢測(cè)器120界定處理通道CHl,且候選文本區(qū)檢測(cè)器1320和文本區(qū)檢測(cè)器130界定另一處理通道CH2。因此,通過處理通道CHl和CH2的操作是并行地執(zhí)行的。雖然圖13說明通過兩個(gè)處理通道來識(shí)別候選文本區(qū),但圖像處理設(shè)備1300可被配置有任何合適數(shù)目的包含候選文本區(qū)檢測(cè)器和文本區(qū)檢測(cè)器的處理通道。圖像處理設(shè)備1300中的上述單元可由計(jì)算裝置和系統(tǒng)的一個(gè)或一個(gè)以上處理器執(zhí)行的硬件、軟件和/或其組合來實(shí)施。
[0077]圖14表示由圖像處理設(shè)備1300執(zhí)行的用于接收?qǐng)D像且基于所識(shí)別的候選文本區(qū)而產(chǎn)生文本信息的方法1400的流程圖。首先,圖像轉(zhuǎn)換器110在1410處接收多通道圖像。在1420處,圖像轉(zhuǎn)換器110隨后通過使用多種圖像轉(zhuǎn)換方法而產(chǎn)生多個(gè)不同灰度級(jí)圖像。在1430處,將所產(chǎn)生的灰度級(jí)圖像分別輸入到候選文本區(qū)檢測(cè)器1310和1320,且候選文本區(qū)檢測(cè)器1310和1320中的每一者識(shí)別所接收的灰度級(jí)圖像中的候選文本區(qū)。此外,候選文本區(qū)檢測(cè)器1310和1320確定識(shí)別相應(yīng)的候選文本區(qū)的位置的候選文本區(qū)定位符。在1440處,通過使用相應(yīng)的候選文本區(qū)定位符,文本區(qū)檢測(cè)器120和130中的每一者隨后從相關(guān)聯(lián)的候選文本區(qū)識(shí)別出文本區(qū)。在1450處,文本區(qū)檢測(cè)器120和130進(jìn)一步確定與相應(yīng)的所識(shí)別的文本區(qū)的文本區(qū)信息。在1460處,合并單元140從文本區(qū)檢測(cè)器120和130接收文本區(qū)信息且通過合并所接收的文本區(qū)信息而產(chǎn)生文本信息。[0078]圖15是根據(jù)本發(fā)明的一個(gè)實(shí)施例的使用并行布置的處理通道CHl和CH2從包含類文本分量的多通道圖像1510產(chǎn)生文本信息1580的圖。多通道圖像1510包含兩個(gè)文本部分,一個(gè)在上部部分(“上部文本”),且另一個(gè)在下部部分(“下部文本”)。圖像1510進(jìn)一步包含中間部分中的圖案,所述圖案看似由一連串“#”構(gòu)成且可被稱作如上文所描述的類文本分量。通過使用不同圖像轉(zhuǎn)換方法將多通道圖像1510轉(zhuǎn)換為分別用于處理通道CHl和CH2的兩個(gè)不同的灰度級(jí)圖像1520和1550。在經(jīng)轉(zhuǎn)換的灰度級(jí)圖像1520中,上部部分“上部文本”中的文本以及中間部分中的圖案保持突出,而下部部分“下部文本”中的文本可不容易與背景區(qū)別開。相比而言,在經(jīng)轉(zhuǎn)換的灰度級(jí)圖像1550中,下部部分“下部文本”中的文本以及中間部分中的圖案顯得更突出,而上部部分“上部文本”中的文本可不容易與背景區(qū)別開。
[0079]在接收到灰度級(jí)圖像1520之后,處理通道CHl中的候選文本區(qū)檢測(cè)器1310即刻識(shí)別圖像1520中含有“上部文本”以及圖案(或類文本分量)的候選文本區(qū)1530。同樣,處理通道CH2中的候選文本區(qū)檢測(cè)器1320識(shí)別圖像1550中含有“下部文本”以及圖案的候選文本區(qū)1560。候選文本區(qū)檢測(cè)器1310和1320隨后分別確定與所識(shí)別的候選文本區(qū)1530和1560相關(guān)聯(lián)的候選文本區(qū)定位符。候選文本區(qū)定位符分別指示灰度級(jí)圖像1520和1550中的候選文本區(qū)1530和1560的位置。
[0080]基于從候選文本區(qū)檢測(cè)器1310接收到的候選文本區(qū)定位符,處理通道CHl中的文本區(qū)檢測(cè)器120識(shí)別候選文本區(qū)1530中含有文本分量“上部文本”的文本區(qū)1540。同樣,基于從候選文本區(qū)檢測(cè)器1320接收到的候選文本區(qū)定位符,處理通道CH2中的文本區(qū)檢測(cè)器130識(shí)別候選文本區(qū)1560中含有文本分量“下部文本”的文本區(qū)1570。因此,中間部分中的圖案不含有任何文本分量,而是僅含有類文本分量,且不被識(shí)別為文本區(qū)。另外,文本區(qū)檢測(cè)器120和130分別確定和輸出與所識(shí)別的文本區(qū)1540和1570相關(guān)聯(lián)的文本區(qū)信息。在識(shí)別文本區(qū)1540和1570的過程中,可僅對(duì)候選文本區(qū)1530和1560,而不是整個(gè)灰度級(jí)圖像1520和1550,執(zhí)行識(shí)別操作。通過僅對(duì)所識(shí)別的候選文本區(qū)1530和1560執(zhí)行識(shí)別操作,可實(shí)質(zhì)上減少在上面執(zhí)行識(shí)別操作的區(qū)域。而且,雖然額外地在識(shí)別文本區(qū)1540和1570之前執(zhí)行用于識(shí)別候選文本區(qū)1530和1560的操作,但與整個(gè)處理時(shí)間相比,此類額外操作所需的處理時(shí)間不顯著,使得整個(gè)處理時(shí)間和所需的計(jì)算資源會(huì)減少。
[0081 ] 分別從處理通道CHl和CH2中的文本區(qū)檢測(cè)器120和130將與文本區(qū)1540和1570相關(guān)聯(lián)的文本區(qū)信息提供給合并單元140。合并單元140隨后合并來自處理通道CHl和CH2的文本區(qū)信息以產(chǎn)生用于多通道圖像1510的文本信息1580。文本信息1580可包含分別對(duì)應(yīng)于文本區(qū)1540和1570的兩個(gè)子集,文本信息1580的每一子集包含位置信息、區(qū)置信度信息、文本辨識(shí)信息以及文本置信度信息。
[0082]圖16說明確定與處理通道中的候選文本區(qū)1530相關(guān)聯(lián)的候選文本區(qū)定位符1610的更詳細(xì)圖。如上文所陳述,灰度級(jí)圖像1520的上部部分中的“上部文本”以及中間部分中的圖案與其背景不同。在此情況下,“上部文本”對(duì)應(yīng)于文本分量且圖案對(duì)應(yīng)于類文本分量。因此,因?yàn)楹蜻x文本區(qū)檢測(cè)器1310經(jīng)配置以不區(qū)別文本分量與類文本分量,所以候選文本區(qū)檢測(cè)器1310確定候選文本區(qū)1530含有文本分量和類文本分量?jī)烧摺?br>
[0083]為了識(shí)別此候選文本區(qū),可對(duì)灰度級(jí)圖像執(zhí)行掃描操作以評(píng)估灰度級(jí)圖像中的強(qiáng)度變化。一股來說,文本分量和/或類文本分量與其背景不同,且文本分量和/或類文本分量與背景之間的強(qiáng)度變化與背景相比是相對(duì)大的。因此,舉例來說,當(dāng)在從左側(cè)到右側(cè)的方向上掃描灰度級(jí)圖像時(shí),計(jì)算出在相鄰像素的強(qiáng)度值之間的一階倒數(shù),且所述候選文本區(qū)包含其中可觀察到較大的強(qiáng)度變化的區(qū)。舉例來說,在圖16中,掃描操作將再現(xiàn)在背景與上部部分中的“上部文本”和中間部分中的圖案之間具有高強(qiáng)度變化的候選文本區(qū)1530。
[0084]一旦已識(shí)別出候選文本區(qū)1530,候選文本區(qū)檢測(cè)器1310便確定與候選文本區(qū)1530相關(guān)聯(lián)的候選文本區(qū)定位符1610。候選文本區(qū)定位符1610指示灰度級(jí)圖像1520中的候選文本區(qū)1530的位置,且可包含候選文本區(qū)1530的頂點(diǎn)的坐標(biāo)。將把所確定的候選文本區(qū)定位符1610提供給合并單元140。
[0085]圖17說明確定與處理通道CH2中的灰度級(jí)圖像1550中的候選文本區(qū)1560相關(guān)聯(lián)的候選文本區(qū)定位符1710的更詳細(xì)圖。以與參考圖16所描述的方式相同的方式,候選文本區(qū)檢測(cè)器1320將含有文本分量(即,下部部分中的“下部文本”)以及中間部分中的類文本分量的區(qū)識(shí)別為候選文本區(qū)1560。隨后,候選文本區(qū)檢測(cè)器1320確定并輸出與候選文本區(qū)1560相關(guān)聯(lián)的候選文本區(qū)定位符1710。與上文一樣,候選文本區(qū)定位符1710指示灰度級(jí)圖像1550中的候選文本區(qū)1560的位置,且將被提供給合并單元140。
[0086]圖18說明由控制器1330執(zhí)行的通過識(shí)別出灰度級(jí)圖像1520和1550中的非候選文本區(qū)的共同部分來調(diào)整候選文本區(qū)1530和1560的操作??刂破?330經(jīng)配置以分別從候選文本區(qū)檢測(cè)器1310和1320接收與候選文本區(qū)1530和1560相關(guān)聯(lián)的候選文本區(qū)定位符1610和1710?;谥甘竞蜻x文本區(qū)1530和1560的位置的所接收的候選文本區(qū)定位符1610和1710,控制器1330處理灰度級(jí)圖像1520和1550以識(shí)別非候選文本區(qū)。非候選文本區(qū)對(duì)應(yīng)于圖像1520和1550中除了候選文本區(qū)1530和1560之外的剩余區(qū)。因此,此些非候選文本區(qū)不包含文本分量和類文本分量。在由圖18說明的實(shí)例中,控制器1330從灰度級(jí)圖像1520識(shí)別出非候選文本區(qū)1812和1814。類似地,控制器1330還從灰度級(jí)圖像1550識(shí)別出非候選文本區(qū)1822和1824。
[0087]控制器1330將非候選文本區(qū)1812和1814與非候選文本區(qū)1822和1824進(jìn)行比較,且識(shí)別出共同部分1832和1834,在所述共同部分處,來自灰度級(jí)圖像1520和1550的非候選文本區(qū)彼此重疊。控制器1330隨后將共同部分1832和1834添加到候選文本區(qū)1530以產(chǎn)生經(jīng)調(diào)整的候選文本區(qū)1840。同樣,控制器1330將共同部分1832和1834添加到候選文本區(qū)1560以產(chǎn)生另一經(jīng)調(diào)整的候選文本區(qū)1850??刂破?330進(jìn)一步確定與經(jīng)調(diào)整的候選文本區(qū)1840和1850相關(guān)聯(lián)的經(jīng)調(diào)整的候選文本區(qū)定位符。將經(jīng)調(diào)整的候選文本區(qū)定位符分別提供給文本區(qū)檢測(cè)器120和130?;诮?jīng)調(diào)整的候選文本區(qū)定位符,文本區(qū)檢測(cè)器120和130分別識(shí)別經(jīng)調(diào)整的候選文本區(qū)1840和1850中的文本區(qū),且確定相關(guān)聯(lián)的文本區(qū)信息。
[0088]對(duì)于一些灰度級(jí)圖像來說,即使灰度級(jí)圖像含有文本分量和/或類文本分量,兩個(gè)候選文本區(qū)檢測(cè)器1310和1320也可能會(huì)錯(cuò)誤地將此類區(qū)辨識(shí)為候選文本區(qū)。在此情況下,與含有文本分量和/或類文本分量的某些區(qū)相關(guān)聯(lián)的信息將不由文本區(qū)檢測(cè)器120和130中的任一者處理,且關(guān)于所述區(qū)的文本辨識(shí)信息將丟失。在圖18的實(shí)例中,如果共同部分1832和1834含有文本分量,且被錯(cuò)誤地從候選文本區(qū)1530和1560丟棄,那么部分1832和1834將不由文本區(qū)檢測(cè)器120和130中的任一者處理。因此,為了防止文本辨識(shí)信息的此類丟失,控制器1330識(shí)別共同部分1832和1834且產(chǎn)生包含共同部分1832和1834的經(jīng)調(diào)整的候選文本區(qū)1840和1850,使得文本區(qū)檢測(cè)器120和130可執(zhí)行完整的文本區(qū)檢測(cè)操作。
[0089]圖19說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以通過調(diào)整處理通道CHl和CH2之間的處理負(fù)荷而從圖像產(chǎn)生文本信息的圖像處理設(shè)備1900。圖像處理設(shè)備1900包含圖像轉(zhuǎn)換器110、候選文本區(qū)檢測(cè)器1310和1320、文本區(qū)檢測(cè)器120和130以及合并單元140,其以與以上圖13中所示的設(shè)備1300相同的方式操作。圖像處理設(shè)備1900進(jìn)一步包含負(fù)荷控制器1910以用于調(diào)整處理通道CHl和CH2之間的處理負(fù)荷。
[0090]在圖像處理設(shè)備1900中,圖像轉(zhuǎn)換器110接收多通道圖像且產(chǎn)生用于候選文本區(qū)檢測(cè)器1310和1320中的每一者的灰度級(jí)圖像。候選文本區(qū)檢測(cè)器1310和1320識(shí)別相應(yīng)的灰度級(jí)圖像中的一個(gè)或一個(gè)以上候選文本區(qū)且確定與所述候選文本區(qū)相關(guān)聯(lián)的候選文本區(qū)定位符。候選文本區(qū)檢測(cè)器1310和1320將候選文本區(qū)定位符提供給負(fù)荷控制器1910,所述負(fù)荷控制器基于相關(guān)聯(lián)的候選文本區(qū)定位符來估計(jì)每一候選文本區(qū)的處理負(fù)荷。舉例來說,可基于來自相關(guān)聯(lián)的候選文本區(qū)定位符的候選文本區(qū)的大小來估計(jì)用于確定來自每一候選文本區(qū)的文本區(qū)的處理負(fù)荷?;谒烙?jì)的處理負(fù)荷,負(fù)荷控制器1910調(diào)整候選文本區(qū)的大小以產(chǎn)生負(fù)荷平衡的候選文本區(qū),如下文更詳細(xì)地描述。另外,負(fù)荷控制器1910新確定負(fù)荷平衡的候選文本區(qū)的候選文本區(qū)定位符。新確定的候選文本區(qū)定位符隨后分別輸出到并行處理通道CHl和CH2中的文本區(qū)檢測(cè)器120和130。
[0091]基于來自負(fù)荷控制器1910的候選文本區(qū)定位符,文本區(qū)檢測(cè)器120和130中的每一者存取負(fù)荷平衡的候選文本區(qū)且確定在負(fù)荷平衡的候選文本區(qū)中所識(shí)別的文本區(qū)的文本區(qū)信息。隨后從文本區(qū)檢測(cè)器120和130將文本區(qū)信息輸出到合并單元140。合并單元140合并與由文本區(qū)檢測(cè)器120和130識(shí)別的文本區(qū)相關(guān)聯(lián)的信息,且產(chǎn)生用于多通道圖像的文本信息。
[0092]在圖像處理設(shè)備1900中,候選文本區(qū)檢測(cè)器1310和文本區(qū)檢測(cè)器120界定處理通道CH1,而候選文本區(qū)檢測(cè)器1320和文本區(qū)檢測(cè)器130界定另一處理通道CH2。因此,處理通道CHl和CH2的操作是并行地執(zhí)行的。雖然圖19說明平衡兩個(gè)處理通道之間的處理負(fù)荷,但圖像處理設(shè)備1900可被配置有任何合適數(shù)目的包含候選文本區(qū)檢測(cè)器和文本區(qū)檢測(cè)器的處理通道。圖像處理設(shè)備1900中的上述單元可由計(jì)算裝置和系統(tǒng)的一個(gè)或一個(gè)以上處理器執(zhí)行的硬件、軟件和/或其組合來實(shí)施。
[0093]圖20表示由圖像處理設(shè)備1900執(zhí)行的用于在基于所估計(jì)的處理負(fù)荷而調(diào)整的候選文本區(qū)中識(shí)別出文本區(qū)的方法的流程圖。圖20的操作可為用于識(shí)別文本區(qū)的圖14的操作1440的子操作。在2010處,在從候選文本區(qū)檢測(cè)器1310和1320接收到候選文本區(qū)定位符之后,負(fù)荷控制器1910估計(jì)候選文本區(qū)中的每一者的處理負(fù)荷。在2020處,一旦估計(jì)出候選文本區(qū)的處理負(fù)荷,負(fù)荷控制器1910基于所估計(jì)的處理負(fù)荷來調(diào)整候選文本區(qū)以產(chǎn)生分別用于處理通道CHl和CH2的負(fù)荷平衡的候選文本區(qū)。負(fù)荷控制器1910隨后新確定負(fù)荷平衡的候選文本區(qū)的候選文本區(qū)定位符。在2030處,將負(fù)荷平衡的候選文本區(qū)指派給文本區(qū)檢測(cè)器120和130以進(jìn)行處理。新確定的候選文本區(qū)定位符隨后分別輸出到并行處理通道CHl和CH2中的文本區(qū)檢測(cè)器120和130。在2040處,文本區(qū)檢測(cè)器120和130隨后識(shí)別其相應(yīng)的所指派的負(fù)荷平衡的候選文本區(qū)中的文本區(qū)。
[0094]圖21是使用并行布置的處理通道CHl和CH2以及用于處理通道CHl和CH2之間的負(fù)荷平衡的負(fù)荷控制器1910從多通道圖像2110產(chǎn)生文本信息2190的圖。多通道圖像2110包含兩個(gè)文本分量,一個(gè)在上部部分(“上部文本”),且另一個(gè)在下部部分(“文本”)。圖像2110進(jìn)一步包含中間部分中的類文本分量,所述類文本分量看似由一連串重疊的“O”構(gòu)成。通過使用不同圖像轉(zhuǎn)換方法將多通道圖像2110轉(zhuǎn)換為分別用于處理通道CHl和CH2的兩個(gè)不同的灰度級(jí)圖像2120和2140。在經(jīng)轉(zhuǎn)換的灰度級(jí)圖像2120中,文本分量“上部文本”以及“文本”以及類文本分量全部與背景不同。相比而言,在經(jīng)轉(zhuǎn)換的灰度級(jí)圖像2140中,從背景找不到不同的分量。
[0095]在接收到灰度級(jí)圖像2120之后,處理通道CHl中的候選文本區(qū)檢測(cè)器1310即刻處理圖像2120以識(shí)別圖像2120中含有全部文本分量和類文本分量的候選文本區(qū)2130。另夕卜,候選文本區(qū)檢測(cè)器1310確定指示灰度級(jí)圖像2120中的候選文本區(qū)2130的位置的用于候選文本區(qū)2130的候選文本區(qū)定位符。另一方面,處理通道CH2中的候選文本區(qū)檢測(cè)器1320處理灰度級(jí)圖像2140且無法識(shí)別任何候選文本區(qū)。因此,候選文本區(qū)檢測(cè)器1320確定指示灰度級(jí)圖像2140中不存在所識(shí)別的候選文本區(qū)的用于灰度級(jí)圖像2140的候選文本區(qū)定位符。
[0096]從候選文本區(qū)檢測(cè)器1310和1320將候選文本區(qū)定位符提供給負(fù)荷控制器1910?;趶暮蜻x文本區(qū)檢測(cè)器1310接收到的候選文本區(qū)定位符,負(fù)荷控制器1910估計(jì)候選文本區(qū)2130的大小以及處理通道CHl的對(duì)應(yīng)處理負(fù)荷。另一方面,基于從候選文本區(qū)檢測(cè)器1320接收到的候選文本區(qū)定位符,負(fù)荷控制器1910確定處理通道CH2的處理負(fù)荷是零。
[0097]為了平衡處理通道CHl和CH2之間的處理負(fù)荷,負(fù)荷控制器1910基于所估計(jì)的處理負(fù)荷來調(diào)整候選文本區(qū)2130。舉例來說,如圖21中所示,因?yàn)樘幚硗ǖ繡H2中的灰度級(jí)圖像2140不包含任何所識(shí)別的候選文本區(qū),所以處理通道CHl中的處理負(fù)荷大于處理通道CH2中的處理負(fù)荷。因此,負(fù)荷控制器1910通過將候選文本區(qū)2130分割為負(fù)荷平衡的候選文本區(qū)2150和2160來減小處理通道CHl中的處理負(fù)荷。另外,負(fù)荷控制器1910新確定分別與負(fù)荷平衡的候選文本區(qū)2150和2160相關(guān)聯(lián)的候選文本區(qū)定位符。隨后,負(fù)荷控制器1910將新確定的候選文本區(qū)定位符分別指派給處理通道CHl和CH2。具體來說,處理通道CHl的文本區(qū)檢測(cè)器120接收與負(fù)荷平衡的候選文本區(qū)2150相關(guān)聯(lián)的負(fù)荷平衡的候選文本區(qū)定位符,且識(shí)別區(qū)2150中的文本區(qū)2170。類似地,處理通道CH2的文本區(qū)檢測(cè)器130接收與負(fù)荷平衡的候選文本區(qū)2160相關(guān)聯(lián)的候選文本區(qū)定位符,且識(shí)別區(qū)2160中的文本區(qū)2180。另外,文本區(qū)檢測(cè)器120和130分別確定與文本區(qū)2170和2180相關(guān)聯(lián)的文本區(qū)信息且將所述文本區(qū)信息輸出到合并單元140。在合并單元140中,通過合并所確定的文本區(qū)信息來產(chǎn)生文本信息2190。
[0098]圖22說明確定與處理通道CHl的候選文本區(qū)2130相關(guān)聯(lián)的候選文本區(qū)定位符2210的更詳細(xì)圖。灰度級(jí)圖像2120含有文本分量“上部文本”和“文本”以及中間部分中的類文本分量。候選文本區(qū)檢測(cè)器1310將環(huán)繞文本分量和類文本分量的區(qū)識(shí)別為候選文本區(qū)2130。候選文本區(qū)檢測(cè)器1310隨后確定指示灰度級(jí)圖像2120中的所識(shí)別的候選文本區(qū)2130的位置信息的候選文本區(qū)定位符2210。
[0099]圖23說明確定用于處理通道CH2的候選文本區(qū)定位符2310的更詳細(xì)圖。與灰度級(jí)圖像2120相比,灰度級(jí)圖像2140不含有文本分量和類文本分量。因此,從灰度級(jí)圖像2140確定沒有區(qū)是候選文本區(qū)。因此,候選文本區(qū)檢測(cè)器1320確定指示灰度級(jí)圖像2140中不存在所識(shí)別的候選文本區(qū)的候選文本區(qū)定位符2310。
[0100]圖24說明通過負(fù)荷控制器1910產(chǎn)生負(fù)荷平衡的候選文本區(qū)2150和2160且將所述候選文本區(qū)指派給文本區(qū)檢測(cè)器120和130的更詳細(xì)圖。如以上圖22和23中所描述,產(chǎn)生灰度級(jí)圖像2120和2140的候選文本區(qū)定位符2210和2310,且將其提供給負(fù)荷控制器1910。在所說明的實(shí)施例中,灰度級(jí)圖像2120具有所識(shí)別的候選文本區(qū)2130,而灰度級(jí)圖像2140不具有所識(shí)別的候選文本區(qū)。因此,負(fù)荷控制器1910基于所識(shí)別的區(qū)2130的大小來估計(jì)處理通道CHl的處理負(fù)荷,且將零處理負(fù)荷指派給處理通道CH2。然而,如果灰度級(jí)圖像2140具有所識(shí)別的候選文本區(qū),那么也將基于所識(shí)別的候選文本區(qū)的大小來估計(jì)其處理負(fù)荷。
[0101]為了產(chǎn)生文本區(qū)檢測(cè)器120和130的負(fù)荷平衡的候選文本區(qū),負(fù)荷控制器1910分割具有較大的處理負(fù)荷的候選文本區(qū)2130。舉例來說,負(fù)荷控制器1910將候選文本區(qū)2130分割為兩個(gè)負(fù)荷平衡的候選文本區(qū)2150和2160,且分別確定與經(jīng)分割的區(qū)2150和2160相關(guān)聯(lián)的候選文本區(qū)定位符。將與區(qū)2150相關(guān)聯(lián)的候選文本區(qū)定位符提供給處理通道CHl中的文本區(qū)檢測(cè)器120。類似地,將與區(qū)2160相關(guān)聯(lián)的候選文本區(qū)定位符提供給處理通道CH2中的文本區(qū)檢測(cè)器130。
[0102]圖25是示范性移動(dòng)計(jì)算裝置2500的框圖,可在所述移動(dòng)計(jì)算裝置中實(shí)施根據(jù)本發(fā)明的一些實(shí)施例的本發(fā)明的圖像處理設(shè)備和方法。移動(dòng)計(jì)算裝置2500的配置可實(shí)施于圖像處理設(shè)備100、200、300、1300和1900中。移動(dòng)裝置2500可以是蜂窩式電話、終端、手持機(jī)、個(gè)人數(shù)字助理(PDA)、無線調(diào)制解調(diào)器、無繩電話等。無線通信系統(tǒng)可以是碼分多址(CDMA)系統(tǒng)、全球移動(dòng)通信系統(tǒng)(GSM)系統(tǒng)、寬帶CDMA(W-CDMA)系統(tǒng)、長(zhǎng)期演進(jìn)(LTE)系統(tǒng)、LTE高級(jí)系統(tǒng)等。此外,移動(dòng)裝置2500可例如使用W1-Fi直接、藍(lán)牙或FlashLinq技術(shù)與另一移動(dòng)裝置直接通信。
[0103]移動(dòng)裝置2500能夠經(jīng)由接收路徑和發(fā)射路徑提供雙向通信。在接收路徑上,由基站發(fā)射的信號(hào)被天線2512接收且被提供給接收器(RCVR) 2514。接收器2514調(diào)節(jié)并數(shù)字化所接收的信號(hào),且將經(jīng)調(diào)節(jié)和數(shù)字化的信號(hào)提供給數(shù)字區(qū)段2520以進(jìn)行進(jìn)一步處理。在發(fā)射路徑上,發(fā)射器(TMTR) 2516接收將從數(shù)字區(qū)段2520發(fā)射的數(shù)據(jù)、處理并調(diào)節(jié)所述數(shù)據(jù),且產(chǎn)生調(diào)制信號(hào),所述調(diào)制信號(hào)經(jīng)由天線2512而被發(fā)射到基站。接收器2514和發(fā)射器2516可以是可支持CDMA、GSM、ff-CDMA, LTE、LTE高級(jí)等的收發(fā)器的一部分。
[0104]數(shù)字區(qū)段2520包含各種處理、接口和存儲(chǔ)器單元,例如,調(diào)制解調(diào)器處理器2522、精簡(jiǎn)指令集計(jì)算機(jī)/數(shù)字信號(hào)處理器(RISC/DSP) 2524、控制器/處理器2526、內(nèi)部存儲(chǔ)器2528、一股化音頻編碼器2532、一股化音頻解碼器2534、圖形/顯示處理器2536和外部總線接口(EBI) 2538。調(diào)制解調(diào)器處理器2522可處理數(shù)據(jù)發(fā)射和接收,例如,編碼、調(diào)制、解調(diào)和解碼。RISC/DSP2524可執(zhí)行用于移動(dòng)裝置2500的一股和專門的處理??刂破?處理器2526可控制數(shù)字區(qū)段2520內(nèi)的各種處理和接口單元的操作。內(nèi)部存儲(chǔ)器2528可將用于各種單元的數(shù)據(jù)和/或指令存儲(chǔ)在數(shù)字區(qū)段2520內(nèi)。
[0105]—股化音頻編碼器2532可執(zhí)行用于來自音頻源2542、麥克風(fēng)2543等的輸入信號(hào)的編碼。一股化音頻解碼器2534可解碼經(jīng)譯碼的音頻數(shù)據(jù),且可將經(jīng)解碼的輸出信號(hào)提供給揚(yáng)聲器/耳機(jī)2544。應(yīng)注意,不一定需要一股化音頻編碼器2532和一股化音頻解碼器2534來與音頻源、麥克風(fēng)2543和揚(yáng)聲器/耳機(jī)2544介接,且因此可在移動(dòng)裝置2500中省略。圖形/顯示處理器2536可處理圖形、視頻、圖像和文本,其可呈現(xiàn)給顯示單元2546。EBI2538可促進(jìn)在數(shù)字區(qū)段2520與主存儲(chǔ)器2548之間傳遞數(shù)據(jù)。
[0106]可用一個(gè)或一個(gè)以上處理器、DSP、微處理器、RISC等實(shí)施數(shù)字區(qū)段2520。數(shù)字區(qū)段2520還可被制造在一個(gè)或一個(gè)以上專用集成電路(ASIC)和/或一些其它類型的集成電路(IC)上。
[0107]一股來說,本文中所描述的任何裝置可表示各種類型的裝置,例如無線電話、蜂窩式電話、膝上型計(jì)算機(jī)、無線多媒體裝置、無線通信個(gè)人計(jì)算機(jī)(PC)卡、PDA、外部或內(nèi)部調(diào)制解調(diào)器、通過無線信道進(jìn)行通信的裝置等。裝置可具有各種名稱,例如接入終端(AT)、接入單元、訂戶單元、移動(dòng)臺(tái)、移動(dòng)裝置、移動(dòng)單元、移動(dòng)電話、移動(dòng)體、遠(yuǎn)程站、遠(yuǎn)程終端、遠(yuǎn)程單元、用戶裝置、用戶設(shè)備、手持式裝置等。本文中所描述的任何裝置可具有用于存儲(chǔ)指令和數(shù)據(jù)的存儲(chǔ)器,以及硬件、軟件、固件或其組合。
[0108]本文中所描述的技術(shù)可由各種裝置實(shí)施。舉例來說,可以硬件、固件、軟件或其組合來實(shí)施這些技術(shù)。所屬領(lǐng)域的技術(shù)人員將進(jìn)一步了解,結(jié)合本文中的揭示內(nèi)容而描述的各種說明性邏輯塊、模塊、電路和算法步驟可實(shí)施為電子硬件、計(jì)算機(jī)軟件,或兩者的組合。為清楚說明硬件與軟件的此互換性,上文已大致關(guān)于其功能性而描述了各種說明性組件、塊、模塊、電路及步驟。所述功能性是實(shí)施為硬件還是軟件取決于特定應(yīng)用及強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束。所屬領(lǐng)域的技術(shù)人員可針對(duì)每一特定應(yīng)用以不同方式實(shí)施所描述的功能性,但所述實(shí)施決策不應(yīng)被解釋為導(dǎo)致偏離本發(fā)明的范圍。
[0109]對(duì)于硬件實(shí)施方案來說,用以執(zhí)行所述技術(shù)的處理單元可實(shí)施于一個(gè)或一個(gè)以上ASIC、DSP、數(shù)字信號(hào)處理裝置(DSro)、可編程邏輯裝置(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計(jì)以執(zhí)行本文中所描述的功能的其它電子單元、計(jì)算機(jī),或其組合中。
[0110]可使用通用處理器、DSP、ASIC、FPGA或其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬件組件,或其經(jīng)設(shè)計(jì)以執(zhí)行本文中所描述的功能的任何組合來實(shí)施或執(zhí)行結(jié)合本文中的揭示內(nèi)容而描述的各種說明性邏輯塊、模塊和電路。通用處理器可以是微處理器,但在替代方案中,處理器可以是任何常規(guī)處理器、控制器、微控制器或狀態(tài)機(jī)。處理器還可實(shí)施為計(jì)算裝置的組合,例如,DSP與微處理器的組合、多個(gè)微處理器的組合、一個(gè)或一個(gè)以上微處理器與DSP核心的聯(lián)合,或任何其它此配置。
[0111]對(duì)于固件和/或軟件實(shí)施方案來說,所述技術(shù)可作為指令而體現(xiàn)于處理器可讀媒體上,例如,隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、非易失性隨機(jī)存取存儲(chǔ)器(NVRAM)、可編程只讀存儲(chǔ)器(PROM)、電可擦除PROM(EEPROM)、快閃存儲(chǔ)器、壓縮光盤(CD)、磁性或光學(xué)數(shù)據(jù)存儲(chǔ)裝置等。所述指令可由一個(gè)或一個(gè)以上處理器執(zhí)行且可致使所述處理器執(zhí)行本文中所描述的功能性的某些方面。
[0112]如果實(shí)施于軟件中,則可將功能作為計(jì)算機(jī)可讀媒體上的一個(gè)或一個(gè)以上指令或代碼而加以存儲(chǔ)或傳輸。計(jì)算機(jī)可讀媒體包括計(jì)算機(jī)存儲(chǔ)媒體與包括促進(jìn)將計(jì)算機(jī)程序從一處傳遞到另一處的任何媒體的通信媒體兩者。存儲(chǔ)媒體可為可由計(jì)算機(jī)存取的任何可用媒體。以實(shí)例方式(且并非作為限制),所述計(jì)算機(jī)可讀媒體可包含RAM、ROM、EEPROM、CD-ROM或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置,或可用于載送或存儲(chǔ)呈指令或數(shù)據(jù)結(jié)構(gòu)的形式的所要程序碼且可由計(jì)算機(jī)存取的任何其它媒體。而且,恰當(dāng)?shù)貙⑷魏芜B接稱作計(jì)算機(jī)可讀媒體。舉例來說,如果使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線(DSL)或例如紅外線、無線電及微波的無線技術(shù)從網(wǎng)站、服務(wù)器或其它遠(yuǎn)程源傳輸軟件,則同軸電纜、光纖電纜、雙絞線、DSL或例如紅外線、無線電及微波的無線技術(shù)包括于媒體的定義中。如本文中所使用,磁盤及光盤包括壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟盤及藍(lán)光光盤,其中磁盤通常磁性地再現(xiàn)數(shù)據(jù),而光盤使用激光光學(xué)地再現(xiàn)數(shù)據(jù)。以上各者的組合也應(yīng)包括在計(jì)算機(jī)可讀媒體的范圍內(nèi)。
[0113]軟件模塊可駐留在RAM存儲(chǔ)器、閃存存儲(chǔ)器、ROM存儲(chǔ)器、EPROM存儲(chǔ)器、EEPROM存儲(chǔ)器、寄存器、硬盤、可裝卸磁盤、CD-ROM,或此項(xiàng)技術(shù)中已知的任一其它形式的存儲(chǔ)媒體中。示范性存儲(chǔ)媒體耦合到處理器,使得處理器可從存儲(chǔ)媒體讀取信息并將信息寫入到存儲(chǔ)媒體。替代地,存儲(chǔ)媒體可與處理器成一體式。處理器及存儲(chǔ)媒體可駐留于ASIC中。ASIC可駐留于用戶終端中。替代地,處理器及存儲(chǔ)媒體可作為離散組件駐留于用戶終端中。
[0114]提供本發(fā)明的先前描述以使所屬領(lǐng)域的技術(shù)人員能夠制作或使用本發(fā)明。所屬領(lǐng)域的技術(shù)人員將容易了解對(duì)本發(fā)明的各種修改,且本文中界定的一股原理可應(yīng)用于其它變化而不背離本發(fā)明的精神或范圍。因此,本發(fā)明無意限于本文中所描述的實(shí)例,而是應(yīng)被賦予與本文中所揭示的原理和新穎特征一致的最廣泛范圍。
[0115]雖然示范性實(shí)施方案可能涉及在一個(gè)或一個(gè)以上獨(dú)立計(jì)算機(jī)系統(tǒng)的背景下利用目前揭示的標(biāo)的物的若干方面,但標(biāo)的物不受如此限制,而是可結(jié)合任何計(jì)算環(huán)境來實(shí)施,例如網(wǎng)絡(luò)或分布式計(jì)算環(huán)境。此外,目前揭示的標(biāo)的物的若干方面可實(shí)施于多個(gè)處理芯片或裝置中或上,且可在多個(gè)裝置上類似地實(shí)現(xiàn)存儲(chǔ)。此些裝置可包含PC、網(wǎng)絡(luò)服務(wù)器和手持式裝置。
[0116]盡管已用結(jié)構(gòu)特征和/或方法動(dòng)作特有的語言描述了標(biāo)的物,但應(yīng)理解,所附權(quán)利要求書中所界定的標(biāo)的物不一定限于上文所描述的特定特征或動(dòng)作。而是,上文所描述的特定特征和動(dòng)作是作為實(shí)施權(quán)利要求書的實(shí)例形式而揭示的。
【權(quán)利要求】
1.一種用于處理多通道圖像的方法,所述方法包括: 從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像; 在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū); 從所述至少一個(gè)文本區(qū)確定文本區(qū)信息;以及 基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
2.根據(jù)權(quán)利要求1所述的方法,其中產(chǎn)生所述多通道圖像的所述文本信息包含: 在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)的情況下,合并來自所述兩個(gè)或兩個(gè)以上文本區(qū)的所述文本區(qū)信息。
3.根據(jù)權(quán)利要求1所述的方法,其中識(shí)別所述至少一個(gè)文本區(qū)包含并行地處理所述多個(gè)灰度級(jí)圖像。
4.根據(jù)權(quán)利要求1所述的方法,其中識(shí)別所述至少一個(gè)文本區(qū)包含: 在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)候選文本區(qū);以及 在所述所識(shí)別的至少一個(gè)候選文本區(qū)中識(shí)別所述至少一個(gè)文本區(qū)。
5.根據(jù)權(quán)利要求4所述的方法,其中識(shí)別所述至少一個(gè)候選文本區(qū)包含: 在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)非候選文本區(qū); 在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)非候選文本區(qū)中的兩個(gè)或兩個(gè)以上非候選文本區(qū)的情況下,識(shí)別所述兩個(gè)或兩個(gè)以上非候選文本區(qū)的共同部分;以及 將所述共同部分添加到所述至少一個(gè)候選文本區(qū)。
6.根據(jù)權(quán)利要求1所述的方法,其中確定所述文本區(qū)信息包含: 識(shí)別所述至少一個(gè)文本區(qū)的每一區(qū)的位置;以及 辨識(shí)所述至少一個(gè)文本區(qū)的每一區(qū)的文本。
7.根據(jù)權(quán)利要求6所述的方法,其中確定所述文本區(qū)信息進(jìn)一步包含,在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)的情況下,確定所述所識(shí)別的文本區(qū)中的每一者中的所辨識(shí)的文本的文本置信度值,且 其中產(chǎn)生所述多通道圖像的所述文本信息包含,在所述所識(shí)別的文本區(qū)中的至少兩者的所述所識(shí)別的位置至少部分重疊的情況下,從所述至少兩個(gè)重疊文本區(qū)選擇所述所辨識(shí)的文本中的一者,其中所述選定的文本對(duì)應(yīng)于所述所確定的文本置信度值中的最大值。
8.根據(jù)權(quán)利要求1所述的方法,其中確定所述文本區(qū)信息包含: 識(shí)別所述至少一個(gè)文本區(qū)的每一區(qū)的位置;以及 確定所述至少一個(gè)文本區(qū)的每一區(qū)的區(qū)置信度值。
9.根據(jù)權(quán)利要求8所述的方法,其中確定所述多通道圖像的所述文本信息進(jìn)一步包含: 在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)且所述所識(shí)別的文本區(qū)中的至少兩者的所述所識(shí)別的位置至少部分重疊的情況下,選擇所述至少兩個(gè)重疊文本區(qū)中的一者,其中所述選定的文本區(qū)對(duì)應(yīng)于所述所確定的區(qū)置信度值的最大值;以及辨識(shí)所述選定的文本區(qū)中的文本。
10.一種用于處理多通道圖像的設(shè)備,所述設(shè)備包括:至少一個(gè)圖像轉(zhuǎn)換器,其經(jīng)配置以從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像; 多個(gè)文本區(qū)檢測(cè)器,其經(jīng)配置以在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū),且從所述至少一個(gè)文本區(qū)確定文本區(qū)信息;以及 合并單元,其經(jīng)配置以基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其中所述合并單元經(jīng)配置以在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)的情況下,合并來自所述兩個(gè)或兩個(gè)以上文本區(qū)的所述文本區(qū)信息。
12.根據(jù)權(quán)利要求10所述的設(shè)備,其中所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以并行地處理所述多個(gè)灰度級(jí)圖像。
13.根據(jù)權(quán)利要求10所述的設(shè)備,其中所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以: 在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)候選文本區(qū);以及 在所述所識(shí)別的至少一個(gè)候選文本區(qū)中識(shí)別所述至少一個(gè)文本區(qū)。
14.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以: 在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)非候選文本區(qū); 在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)非候選文本區(qū)中的兩個(gè)或兩個(gè)以上非候選文本區(qū)的情況下,識(shí)別所述兩個(gè)或兩個(gè)以上非候選文本區(qū)的共同部分;以及 將所述共同部分添加到所述至少一個(gè)候選文本區(qū)。
15.根據(jù)權(quán)利要求10所述的設(shè)備,其中所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以: 識(shí)別所述至少一個(gè)文本區(qū)中的每一者的位置;以及 辨識(shí)所述至少一個(gè)文本區(qū)中的每一者的文本。
16.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)的情況下,確定所述所識(shí)別的文本區(qū)中的每一者中的所辨識(shí)的文本的文本置信度值,且 其中所述合并單元經(jīng)配置以在所述所識(shí)別的文本區(qū)中的至少兩者的所述所識(shí)別的位置至少部分重疊的情況下,從所述至少兩個(gè)重疊文本區(qū)選擇所述所辨識(shí)的文本中的一者,其中所述選定的文本對(duì)應(yīng)于所述所確定的文本置信度值中的最大值。
17.根據(jù)權(quán)利要求10所述的設(shè)備,其中所述多個(gè)文本區(qū)檢測(cè)器經(jīng)配置以: 識(shí)別所述至少一個(gè)文本區(qū)中的每一者的位置;以及 辨識(shí)所述至少一個(gè)文本區(qū)中的每一者的區(qū)置信度值。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中所述合并單元經(jīng)配置以: 在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)且所述所識(shí)別的文本區(qū)中的至少兩者的所述所識(shí)別的位置至少部分重疊的情況下,選擇所述至少兩個(gè)重疊文本區(qū)中的一者,其中所述選定的文本區(qū)對(duì)應(yīng)于所述所確定的區(qū)置信度值的最大值;以及辨識(shí)所述選定的文本區(qū)中的文本。
19.一種用于處理多通道圖像的設(shè)備,所述設(shè)備包括: 用于從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像的裝置; 用于在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū)且從所述至少一個(gè)文本區(qū)確定文本區(qū)信息的裝置;以及 用于基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息的裝置。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中所述用于產(chǎn)生所述文本信息的裝置經(jīng)配置以在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)的情況下,合并來自所述兩個(gè)或兩個(gè)以上文本區(qū)的所述文本區(qū)信息。
21.根據(jù)權(quán)利要求19所述的設(shè)備,其中所述用于識(shí)別所述至少一個(gè)文本區(qū)的裝置經(jīng)配置以并行地處理所述多個(gè)灰度級(jí)圖像。
22.—種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其包括用于處理多通道圖像的指令,所述指令致使處理器執(zhí)行以下操作: 從所述多通道圖像產(chǎn)生多個(gè)灰度級(jí)圖像; 在所述多個(gè)灰度級(jí)圖像中識(shí)別至少一個(gè)文本區(qū); 從所述至少一個(gè)文本區(qū)確定文本區(qū)信息;以及 基于所述文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
23.根據(jù)權(quán)利要求22所述的媒體,其中產(chǎn)生所述多通道圖像的所述文本信息包含: 在所述多個(gè)灰度級(jí)圖像中的兩者或兩者以上中識(shí)別出所述至少一個(gè)文本區(qū)中的兩個(gè)或兩個(gè)以上文本區(qū)的情況下,合并來自所述兩個(gè)或兩個(gè)以上文本區(qū)的所述文本區(qū)信息。
24.根據(jù)權(quán)利要求22所述的媒體,其中識(shí)別所述至少一個(gè)文本區(qū)包含并行地處理所述多個(gè)灰度級(jí)圖像。
25.一種用于處理多通道`圖像的方法,所述方法包括: 從所述多通道圖像產(chǎn)生第一和第二灰度級(jí)圖像; 在所述第一灰度級(jí)圖像中識(shí)別第一文本區(qū); 在所述第二灰度級(jí)圖像中識(shí)別第二文本區(qū); 分別從所述第一文本區(qū)和所述第二文本區(qū)確定第一和第二文本區(qū)信息;以及 基于所述第一文本區(qū)信息和所述第二文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
26.根據(jù)權(quán)利要求25所述的方法,其中產(chǎn)生所述文本信息包含合并所述第一文本區(qū)信息和所述第二文本區(qū)信息。
27.根據(jù)權(quán)利要求25所述的方法,其中并行地執(zhí)行識(shí)別所述第一文本區(qū)和識(shí)別所述第二文本區(qū)。
28.根據(jù)權(quán)利要求25所述的方法,其中識(shí)別所述第一文本區(qū)包含: 在所述第一灰度級(jí)圖像中識(shí)別第一候選文本區(qū);以及 在所述所識(shí)別的第一候選文本區(qū)中識(shí)別所述第一文本區(qū),且 其中識(shí)別所述第二文本區(qū)包含: 在所述第二灰度級(jí)圖像中識(shí)別第二候選文本區(qū);以及 在所述所識(shí)別的第二候選文本區(qū)中識(shí)別所述第二文本區(qū)。
29.根據(jù)權(quán)利要求28所述的方法,其進(jìn)一步包括: 估計(jì)用以處理所述第一候選文本區(qū)的第一負(fù)荷; 估計(jì)用以處理所述第二候選文本區(qū)的第二負(fù)荷;以及 基于所述第一負(fù)荷和所述第二負(fù)荷來調(diào)整所述第一候選文本區(qū)和所述第二候選文本區(qū)以產(chǎn)生第一和第二負(fù)荷平衡的候選文本區(qū)。
30.根據(jù)權(quán)利要求29所述的方法,其中在所述第一負(fù)荷平衡的候選文本區(qū)中識(shí)別所述第一文本區(qū)。
31.根據(jù)權(quán)利要求29所述的方法,其中基于所述第一候選文本區(qū)的大小來估計(jì)所述第一負(fù)荷。
32.根據(jù)權(quán)利要求29所述的方法,其中通過將所述第一候選文本區(qū)的一部分提供給所述第二候選文本區(qū)來調(diào)整所述第一候選文本區(qū)和所述第二候選文本區(qū)。
33.一種用于處理多通道圖像的設(shè)備,所述設(shè)備包括: 至少一個(gè)圖像轉(zhuǎn)換器,其經(jīng)配置以從所述多通道圖像產(chǎn)生第一和第二灰度級(jí)圖像;第一文本區(qū)檢測(cè)器,其經(jīng)配置以在所述第一灰度級(jí)圖像中識(shí)別第一文本區(qū)且從所述第一文本區(qū)確定第一文本區(qū)信息; 第二文本區(qū)檢測(cè)器,其經(jīng)配置以在所述第二灰度級(jí)圖像中識(shí)別第二文本區(qū)且從所述第二文本區(qū)確定第二文本區(qū)信息;以及 合并單元,其經(jīng)配置以基于所述第一文本區(qū)信息和所述第二文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
34.根據(jù)權(quán)利要求33所述的設(shè)備,其中所述合并單元經(jīng)配置以合并所述第一文本區(qū)信息和所述第二文本區(qū)信息。
35.根據(jù)權(quán)利要求33所述的設(shè)備,其中所述第一文本區(qū)檢測(cè)器和所述第二文本區(qū)檢測(cè)器經(jīng)配置以并行地處理所述第一灰度級(jí)圖像和所述第二灰度級(jí)圖像。
36.根據(jù)權(quán)利要求33所述的設(shè)備,其中所述第一文本區(qū)檢測(cè)器經(jīng)配置以: 在所述第一灰度級(jí)圖像中識(shí)別第一候選文本區(qū);以及 在所述所識(shí)別的第一候選文本區(qū)中識(shí)別所述第一文本區(qū),且 其中所述第二文本區(qū)檢測(cè)器經(jīng)配置以: 在所述第二灰度級(jí)圖像中識(shí)別第二候選文本區(qū);以及 在所述所識(shí)別的第二候選文本區(qū)中識(shí)別所述第二文本區(qū)。
37.根據(jù)權(quán)利要求36所述的設(shè)備,其進(jìn)一步包括負(fù)荷控制器,所述負(fù)荷控制器經(jīng)配置以: 估計(jì)用以處理所述第一候選文本區(qū)的第一負(fù)荷; 估計(jì)用以處理所述第二候選文本區(qū)的第二負(fù)荷;以及 基于所述第一負(fù)荷和所述第二負(fù)荷來調(diào)整所述第一候選文本區(qū)和所述第二候選文本區(qū)以產(chǎn)生第一和第二負(fù)荷平衡的候選文本區(qū)。
38.根據(jù)權(quán)利要求37所述的設(shè)備,其中所述第一文本區(qū)檢測(cè)器經(jīng)配置以識(shí)別所述第一負(fù)荷平衡的候選文本區(qū)中的所述第一文本區(qū)。
39.根據(jù)權(quán)利要求37所述的設(shè)備,其中所述負(fù)荷控制器經(jīng)配置以基于所述第一候選文本區(qū)的大小來估計(jì)所述第一負(fù)荷。
40.根據(jù)權(quán)利要求37所述的設(shè)備,其中所述負(fù)荷控制器經(jīng)配置以通過將所述第一候選文本區(qū)的一部分提供給所述第二候選文本區(qū)來調(diào)整所述第一候選文本區(qū)和所述第二候選文本區(qū)。
41.一種用于處理多通道圖像的設(shè)備,所述設(shè)備包括: 用于從所述多通道圖像產(chǎn)生第一和第二灰度級(jí)圖像的裝置;用于在所述第一灰度級(jí)圖像中識(shí)別第一文本區(qū)且從所述第一文本區(qū)確定第一文本區(qū)信息的裝置; 用于在所述第二灰度級(jí)圖像中識(shí)別第二文本區(qū)且從所述第二文本區(qū)確定第二文本區(qū)信息的裝置;以及 用于基于所述第一文本區(qū)信息和所述第二文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息的裝置。
42.根據(jù)權(quán)利要求41所述的設(shè)備,其中所述用于識(shí)別所述第一文本區(qū)的裝置經(jīng)配置以: 在所述第一灰度級(jí)圖像中識(shí)別第一候選文本區(qū);以及 在所述所識(shí)別的第一候選文本區(qū)中識(shí)別所述第一文本區(qū),且 其中所述用于識(shí)別所述第二文本區(qū)的裝置經(jīng)配置以: 在所述第二灰度級(jí)圖像中識(shí)別第二候選文本區(qū);以及 在所述所識(shí)別的第二候選文本區(qū)中識(shí)別所述第二文本區(qū)。
43.根據(jù)權(quán)利要求42所述的設(shè)備,其進(jìn)一步包括: 用于估計(jì)用以處理所述第一候選文本區(qū)的第一負(fù)荷的裝置; 用于估計(jì)用以處理所述第二候選文本區(qū)的第二負(fù)荷的裝置;以及用于基于所述第一負(fù)荷和所述第二負(fù)荷來調(diào)整所述第一候選文本區(qū)和所述第二候選文本區(qū)以產(chǎn)生第一和第二負(fù)荷平衡的候選文本區(qū)的裝置。
44.一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其包括用于處理多通道圖像的指令,所述指令致使處理器執(zhí)行以下操作: 從所述多通道圖像產(chǎn)生第一和第二灰度級(jí)圖像; 在所述第一和灰度級(jí)圖像中識(shí)別第一文本區(qū); 在所述第二灰度級(jí)圖像中識(shí)別第二文本區(qū); 分別從所述第一文本區(qū)和所述第二文本區(qū)確定第一和第二文本區(qū)信息;以及 基于所述第一文本區(qū)信息和所述第二文本區(qū)信息而產(chǎn)生所述多通道圖像的文本信息。
45.根據(jù)權(quán)利要求44所述的媒體,其中識(shí)別所述第一文本區(qū)包含: 在所述第一灰度級(jí)圖像中識(shí)別第一候選文本區(qū);以及 在所述所識(shí)別的第一候選文本區(qū)中識(shí)別所述第一文本區(qū),且 其中識(shí)別所述第二文本區(qū)包含: 在所述第二灰度級(jí)圖像中識(shí)別第二候選文本區(qū);以及 在所述所識(shí)別的第二候選文本區(qū)中識(shí)別所述第二文本區(qū)。
46.根據(jù)權(quán)利要求45所述的媒體,其中所述操作進(jìn)一步包括: 估計(jì)用以處理所述第一候選文本區(qū)的第一負(fù)荷, 估計(jì)用以處理所述第二候選文本區(qū)的第二負(fù)荷;以及 基于所述第一負(fù)荷和所述第二負(fù)荷來調(diào)整所述第一候選文本區(qū)和所述第二候選文本區(qū)以產(chǎn)生第一和第二負(fù)荷平衡的候選文本區(qū)。
【文檔編號(hào)】G06K9/38GK103608823SQ201280029600
【公開日】2014年2月26日 申請(qǐng)日期:2012年7月3日 優(yōu)先權(quán)日:2011年7月8日
【發(fā)明者】延奇宣, 丘衡一, 朝玄默 申請(qǐng)人:高通股份有限公司