使用圖像區(qū)域的文本檢測的制作方法
【專利摘要】一種方法包含接收在圖像數(shù)據(jù)中識別的一組圖像區(qū)域的指示。所述方法進一步包含從所述組圖像區(qū)域中選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取。
【專利說明】使用圖像區(qū)域的文本檢測
[0001]本申請案要求2011年9月6日申請的第61/531,547號美國臨時專利申請案、2011年10月5日申請的第61/543,548號美國臨時專利申請案和2012年3月6日申請的第13/412,853號美國非臨時申請案的優(yōu)先權,所述申請案中的每一者以全文引用的方式并入本文中。
【技術領域】
[0002]本發(fā)明總地來說涉及圖像處理。
【背景技術】
[0003]技術進步已經(jīng)產(chǎn)生更小且更強大的計算裝置。舉例來說,當前存在多種便攜式個人計算裝置,包含無線計算裝置,例如便攜式無線電話、個人數(shù)字助理(PDA)和尋呼裝置,其體積小,重量輕,且易于由用戶攜帶。更具體來說,例如蜂窩電話和因特網(wǎng)協(xié)議(IP)電話等便攜式無線電話可經(jīng)由無線網(wǎng)絡傳達語音和數(shù)據(jù)包。此外,許多此類無線電話包含并入其中的其它類型的裝置。舉例來說,無線電話還可包含數(shù)碼照像機、數(shù)碼攝像機、數(shù)碼記錄器,和音頻文件播放器。
[0004]計算裝置可以執(zhí)行文本檢測以識別已通過裝置的相機俘獲的圖像中的文本。常規(guī)文本檢測可能明確地或隱含地必需圖像中的文本的色彩不同于圖像的背景色彩。此常規(guī)文本檢測可能無法可靠地檢測具有與圖像的背景基本上相同色彩的文本?;蛘?,可以使用色彩分段方法來進行文本檢測。色彩分段可以實現(xiàn)對于具有與圖像背景基本上相同色彩的文本的文本檢測。但是,色彩分段對于基于個人計算機的實施方案往往在計算方面要求很高,而且可能不適合例如無線電話等便攜型電子裝置。
[0005]在執(zhí)行二進制化進程以產(chǎn)生將輸入圖像的檢測到的文本部分與輸入圖像的非文本部分對比的二值圖像之后`,可以對二值圖像應用投影輪廓分析,以便估計文本行的歪斜(例如文本行偏離于水平方向的角度)和/或估計文本的傾斜(例如比如斜體文本的文本傾斜角度)。對于傾斜和歪斜的補償可以實現(xiàn)對文本的更加穩(wěn)固的字符辨識。但是,二值圖像中的文本的精確的投影輪廓分析同樣在計算方面要求很高,并且可能不適合便攜型電子
>J-U ρ?α裝直。
【發(fā)明內容】
[0006]基于斑點的文本提取包含將圖像中的文本斑點定位為穩(wěn)定的、曲線的及非重疊的斑點??稍谕队拜喞治鲋皥?zhí)行斑點抽象化以減少投影輪廓分析的計算負荷??苫谕队拜喞治鰜硌a償文本的傾斜和歪斜以用于后續(xù)的字符辨識處理。
[0007]在特定實施例中,一種方法包含接收在圖像數(shù)據(jù)中識別的一組圖像區(qū)域的指示,以及從所述組圖像區(qū)域選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取。在一些實施例中,可進一步至少部分基于圖像區(qū)域曲線性來選擇所述圖像區(qū)域。
[0008]在另一特定實施例中,一種設備包含圖像區(qū)域提取器,其經(jīng)配置以產(chǎn)生在圖像數(shù)據(jù)中識別的一組圖像區(qū)域的指示。所述設備還包含文本圖像區(qū)域選擇器,其經(jīng)配置以從所述組圖像區(qū)域選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取。
[0009]在另一特定實施例中,一種方法包含識別對應于圖像區(qū)域的幾何圖形。所述圖像區(qū)域對應于所述在圖像數(shù)據(jù)中識別的文本的至少一部分。所述方法進一步包含至少部分基于所述幾何圖形而確定文本的限定框。
[0010]在一些實施例中,可利用配合錯誤。舉例來說,響應于第一幾何圖形相對于圖像區(qū)域的第一配合錯誤超過閾值,所述方法可包含識別對應于所述圖像區(qū)域的多個幾何圖形。
[0011]在一些實施例中,可利用投影輪廓分析。舉例來說,所述方法可包含使用多個投影線來確定所述幾何圖形的投影輪廓。所述投影輪廓的值可對應于每一特定投影線,且可基于所述特定投影線與幾何圖形的相交點之間的距離。
[0012]在另一特定實施例中,所述方法可包含識別對應于圖像區(qū)域的多個幾何圖形,所述圖像區(qū)域中的每一者對應于文本的至少一部分??纱_定所述多個幾何圖形的第一投影輪廓來估計所述文本的歪斜??纱_定所述多個幾何圖形的第二投影輪廓來估計所述文本的傾斜。
[0013]在另一特定實施例中,所述方法可包含從一組圖像區(qū)域提取若干圖像區(qū)域,所述圖像區(qū)域中的每一者對應于所述文本的至少一部分。所述方法可進一步包含將所述所提取的圖像區(qū)域分割為多個群集,且獨立于其它群集中的每一者來確定每一群集的投影輪廓。
[0014]在另一特定實施例中,所述方法可包含對對應于在在圖像數(shù)據(jù)中識別的圖像區(qū)域的第一組幾何圖形執(zhí)行第一投影輪廓分析。所述第一投影輪廓分析可將所述第一組幾何圖形分割為第二組幾何圖形和第三組幾何圖形。所述方法可進一步包含對所述第二組幾何圖形執(zhí)行第二投影輪廓分析。所述第二投影輪廓分析可將所述第二組幾何圖形分割為第四組幾何圖形和第五組幾何圖形。
[0015]由所揭示的實施例中的至少一者提供的特定優(yōu)點包含與通常需要與背景色彩有區(qū)別的文本色彩的常規(guī)二值化技術相比,在不需要與背景色彩有區(qū)別的文本色彩的情況下辨識圖像內的文本的能力,以及與色彩分段技術相比減小的計算需求。
[0016]在檢視整個申請案后,將明白本發(fā)明的其它方面、優(yōu)點和特征,申請案包含以下部分:【專利附圖】
【附圖說明】、【具體實施方式】和權利要求書。
【專利附圖】
【附圖說明】
[0017]圖1是用以提供文本檢測的系統(tǒng)的特定實施例的框圖;
[0018]圖2是圖1的系統(tǒng)可以執(zhí)行的文本檢測方法的流程圖;
[0019]圖3圖解說明包含圖1的系統(tǒng)可以檢測到的文本的圖像的實例;
[0020]圖4是描繪圖1的系統(tǒng)可以執(zhí)行的斑點提取的說明性實例的圖;
[0021]圖5是描繪圖4的斑點提取的結果的說明性實例的圖;
[0022]圖6圖解說明圖1的系統(tǒng)可以檢測到的文本圖像數(shù)據(jù)的實例;
[0023]圖7是描繪圖1的系統(tǒng)可以執(zhí)行的投影輪廓分析的說明性實例的圖;
[0024]圖8是描繪圖1的系統(tǒng)可以執(zhí)行的斑點抽象化的說明性實例的圖;
[0025]圖9圖解說明圖1的系統(tǒng)可以執(zhí)行的文本效果補償?shù)膶嵗?br>
[0026]圖10圖解說明圖1的系統(tǒng)可以執(zhí)行的文本效果補償?shù)牧硗鈱嵗?;[0027]圖11是描繪圖1的系統(tǒng)可以執(zhí)行的傾斜補償?shù)恼f明性實例的圖;
[0028]圖12是描繪圖1的系統(tǒng)可以檢測和校正的文本歪斜和傾斜的說明性實例的圖;
[0029]圖13圖解說明圖1的系統(tǒng)可以執(zhí)行的對抽象化斑點的中心線處理的特定實施例;
[0030]圖14是描繪圖1的系統(tǒng)可以執(zhí)行的筆劃寬度確定的說明性實例的圖;
[0031]圖15描繪基于斑點的文本檢測的特定說明性實施例的流程圖;
[0032]圖16圖解說明圖1的系統(tǒng)可以執(zhí)行的斑點抽象化的實例;
[0033]圖17描繪圖1的系統(tǒng)可以執(zhí)行的使用幾何圖形的斑點抽象化方法的特定說明性實施例的流程圖;
[0034]圖18是描繪圖1的系統(tǒng)可以執(zhí)行的斑點投影的說明性實例的圖;
[0035]圖19描繪圖1的系統(tǒng)可以執(zhí)行的使用幾何圖形的斑點投影方法的特定說明性實施例的流程圖;
[0036]圖20是描繪圖1的系統(tǒng)可以執(zhí)行的投影輪廓分析的說明性實例的圖;
[0037]圖21描繪圖1的系統(tǒng)可以執(zhí)行的投影輪廓分析方法的特定說明性實施例的流程圖;
[0038]圖22是描繪圖1的系統(tǒng)可以執(zhí)行的分割一組斑點的說明性實例的圖;
[0039]圖23描繪圖1的系統(tǒng)可以執(zhí)行的分割一組斑點的方法的特定說明性實施例的流程圖;
[0040]圖24是描繪圖1的系統(tǒng)可以執(zhí)行的對于幾何圖形的多個投影輪廓分析的說明性實例的圖;
[0041]圖25描繪圖1的系統(tǒng)可以執(zhí)行的對于幾何圖形執(zhí)行多個投影分析的方法的特定說明性實施例的流程圖;以及
[0042]圖26是包含基于斑點的文本提取器的便攜型裝置的框圖。
【具體實施方式】
[0043]參看圖1,圖解說明包含基于圖像區(qū)域的文本檢測(例如斑點提取)的系統(tǒng)100的特定實施例。系統(tǒng)100包含文本斑點提取器104,其耦合到斑點抽象化器112。斑點抽象化器112耦合到文本區(qū)域檢測器和二進制化引擎114。文本斑點提取器104經(jīng)配置以接收圖像數(shù)據(jù)102并且在斑點提取器106處識別斑點?!鞍唿c”是圖像數(shù)據(jù)102的基本上均質的區(qū)域。舉例來說,斑點提取器106可經(jīng)配置以掃描圖像數(shù)據(jù)102,并且識別圖像數(shù)據(jù)102的具有基本上不變的像素色彩值或強度的區(qū)域。為了說明,可以識別圖像色彩空間的區(qū)域,并且具有經(jīng)識別的色彩空間內的像素值的一組連續(xù)像素可以被識別為斑點。斑點提取器106可以是“通用”斑點提取器,其經(jīng)配置以識別圖像數(shù)據(jù)中的斑點,而未具體經(jīng)配置以檢測任何斑點是文本候選還是非文本候選??梢韵蛭谋景唿c選擇器107提供斑點提取器106識別的斑點的指示105。舉例來說,所述指示105可包含經(jīng)識別的斑點的列表,例如每一經(jīng)識別的斑點的索引和對應于每一經(jīng)識別的斑點的圖像數(shù)據(jù)102的像素的列表。作為另一實例,所述指示105可包含指向斑點像素數(shù)據(jù)的指針的列表或陣列。作為另一實例,所述指示105可包含圖像數(shù)據(jù)102或圖像數(shù)據(jù)102的子集,并且針對每一像素可以指示所述像素所屬于的每一斑點(如果存在的話)。[0044]在特定實施例中,文本斑點選擇器107包含穩(wěn)定并且曲線的斑點選擇器108和重疊區(qū)域移除器110。文本斑點選擇器107可經(jīng)配置以接收斑點提取器106所識別的斑點的指示105并且選擇穩(wěn)定并且曲線的一組斑點。舉例來說,斑點的穩(wěn)定性可以指示斑點的大小不會隨閾值的變化而大幅改變。為了說明,閾值可以對應于圖像色彩空間中的一個區(qū)域的邊界,并且色彩空間區(qū)域的邊界中的較小變化可能導致穩(wěn)定斑點的大小的相對較小變化,而不穩(wěn)定斑點可能會響應于色彩空間區(qū)域邊界中的較小變化而顯著改變大小。在定位了一個或一個以上穩(wěn)定斑點后,穩(wěn)定并且曲線的斑點選擇器108即刻可經(jīng)配置以確定所識別穩(wěn)定斑點是否也是曲線的。如本文所使用,“曲線的”對應于具有與斑點的大小相比較小的筆劃寬度。舉例來說,包含字母“s”的斑點可以具有對應于字母“s”的外部尺寸的大小,并且可以具有對應于字母的橫截面的厚度的筆劃寬度。因為文本往往是曲線的(例如,字母和字符往往是由可以通過筆或其它書寫工具形成的直線和曲線形成的),所以不是曲線的斑點可能不被視為文本候選。穩(wěn)定并且曲線的斑點選擇器108在識別出滿足穩(wěn)定性要求并且進一步滿足曲線性要求的斑點后,即刻可以向重疊區(qū)域移除器110提供所識別的斑點的指示。
[0045]重疊區(qū)域移除器110可以移除被斑點提取器106識別的并且與穩(wěn)定并且曲線的斑點選擇器108選擇的特定穩(wěn)定并且曲線的斑點重疊的斑點。為了說明,斑點提取器106可以識別圖像的單個區(qū)域內可以彼此重疊的多個斑點。因為重疊斑點可能會在文本檢測中引入模糊,所以一旦識別出可能對應于辨識出的字母或對應于其它文本的穩(wěn)定并且曲線的斑點,重疊區(qū)域移除器110就定位和移除所有其它與經(jīng)識別的穩(wěn)定并且曲線的斑點重疊的斑點??杉僭O圖像數(shù)據(jù)102中出現(xiàn)的字母或其它文本不彼此重疊。因此,一旦一個斑點被選擇為滿足字母或文本的準則,就可以移除任何與所選的斑點重疊的斑點。在重疊區(qū)域移除器110已經(jīng)移除重疊斑點之后,穩(wěn)定并且曲線的斑點選擇器108就可以繼續(xù)處理斑點提取器106所識別的所述組斑點中的其余斑點,以便識別符合穩(wěn)定性和曲線要求的另外斑點,直到文本斑點選擇器107已經(jīng)識別出一組穩(wěn)定、曲線的并且不重疊的斑點為止。文本斑點提取器104輸出這組被識別為很可能對應于圖像數(shù)據(jù)102中的文本的斑點。
[0046]在特定實施例中,斑點抽象化器112經(jīng)配置以對從文本斑點提取器104接收到的斑點執(zhí)行一個或一個以上計算,并且執(zhí)行分析以輔助文本區(qū)域檢測器和二進制化引擎114處的操作。舉例來說,如相對于圖8所解釋,斑點抽象化器112可經(jīng)配置以確定對應于所識別的斑點的一組幾何形狀,并且處理所述幾何形狀以確定歪斜、傾斜或其它可能會影響后來的光學字符辨識(OCR)處理的文本辨識的效果。舉例來說,通過將所識別的斑點抽象化成幾何圖形而不是成組的像素,可以顯著減少計算要求。減少的計算要求可以使得能夠在手持式裝置或其它與桌上型計算系統(tǒng)相比可以具有相對有限處理資源的裝置上執(zhí)行文本提取。
[0047]文本區(qū)域檢測器和二進制化引擎114經(jīng)配置以從斑點提取器112接收輸出,并且執(zhí)行文本區(qū)域檢測和二進制化。舉例來說,文本區(qū)域檢測器和二進制化引擎114可經(jīng)配置以定位圖像數(shù)據(jù)102中的對應于文本的區(qū)域,并且產(chǎn)生具有對應于具有一值的文本區(qū)域的像素和對應于具有另一值的非文本區(qū)域的像素的二值圖像,例如具有黑色背景上的白色文本或白色背景上的黑色文本的黑白圖像。文本區(qū)域檢測器和二進制化引擎114可以產(chǎn)生文本圖像數(shù)據(jù)116,其可包含將檢測到的文本與圖像的非文本區(qū)域對比的二值圖像。圖9到11中圖解說明文本圖像數(shù)據(jù)的實例。
[0048]參看圖2,使用斑點的文本辨識方法的特定實施例被描繪并且總地來說標示為200。可以在基于斑點的圖像處理文本引擎(例如圖1的系統(tǒng)100)處執(zhí)行方法200。方法200包含在202處識別斑點。舉例來說,可以接收圖像數(shù)據(jù),并且可以對接收到的圖像數(shù)據(jù)執(zhí)行一個或一個以上測試或過濾,以便識別圖像的基本上均質的區(qū)域。為了說明,可以選擇像素值的一個或一個以上范圍,并且可以將成組的像素識別為在連續(xù)區(qū)域中并且具有在所選范圍中的值。作為另一實例,可以識別特定像素,并且可以定位鄰近于具有在所識別的像素的像素值的預定義范圍內的像素值的所識別像素的其它像素。以此方式,可以將圖像的具有基本上均質的像素值或色彩空間值的區(qū)域識別為斑點。
[0049]在204-212處,在處理環(huán)路中對所識別的斑點進行處理以便識別測試候選(相對于圖4描繪另一實例)。在204處選擇所識別的斑點中的最穩(wěn)定的斑點。舉例來說,可以處理所述斑點中的每一者以便確定每一斑點的特定穩(wěn)定性值。為了說明,可以使用不同閾值多次執(zhí)行一個可以類似于二進制化的進程??梢源_定響應于所識別斑點中的每一者的閾值變化的斑點大小變化。舉例來說,斑點的大小相對于閾值變化的變化程度或衍生值可以被識別并且用作穩(wěn)定性的測量標準。在識別出所識別斑點中的最穩(wěn)定斑點之后,在206處確定斑點是否為曲線的。舉例來說,可以將斑點的筆劃寬度與斑點的大小比較。相對于圖14圖解說明斑點曲線確定的實例。
[0050]響應于在206處確定所識別斑點是曲線的,在208處移除重疊的斑點。舉例來說,在208處可以移除任何與被曲線的斑點占據(jù)的區(qū)域重疊的斑點。因此,在假設文本不與圖像內的其它文本重疊的情況下,可以移除所識別的斑點組中的重疊斑點所引起的模糊。響應于在206處確定斑點不是曲線的,或在208處移除所識別曲線的斑點的區(qū)域中的重疊斑點之后,在210處處理繼續(xù)以確定是否剩下任何更多的所識別斑點有待處理。響應于在210處確定剩下更多的斑點有待處理,在212處選擇下一個最穩(wěn)定斑點,并且在206處處理繼續(xù)以確定下一個最穩(wěn)定斑點是否為曲線的。處理可以一直繼續(xù),直到在202處識別的所有斑點都已經(jīng)被處理并且被識別為穩(wěn)定的曲線的斑點或被移除為止。
[0051]在處理期間,可以響應于在206處確定斑點不是曲線的或響應于確定斑點與被確定為曲線的另一斑點重疊而在208處從所述組所識別的斑點中移除一個斑點。在其它實施例中,可以響應于確定斑點不是穩(wěn)定的來移除斑點。當在210處確定了沒有更多的斑點有待處理時(例如每個所識別的斑點已經(jīng)在206處被確定為曲線的或已被移除),在214處對其余的斑點(即尚未移除的斑點)進行抽象化。舉例來說,可以識別對應于所述斑點的參數(shù)化的幾何形狀以進行額外圖像文本處理,如相對于圖8描述。在214處對其余的斑點進行抽象化之后,在216處檢測一個文本區(qū)域并且產(chǎn)生一個或一個以上歸一化的二值圖像。可以基于對其余的斑點進行抽象化的結果來執(zhí)行檢測文本區(qū)域和產(chǎn)生歸一化的二值圖像。舉例來說,作為說明性實例,歸一化可包含處理圖像數(shù)據(jù)以移除包含歪斜和傾斜的文本效果。
[0052]通過使用斑點識別和應用選擇曲線的并且穩(wěn)定的斑點的準則來執(zhí)行文本提取,方法200能夠在與基于色彩分段的方法相比大幅減少的處理復雜度下檢測輸入圖像的字符類型的區(qū)域。舉例來說,色彩分段可能必需對于基于個人計算機的實施方案在計算方面要求很高的處理。此外,通過執(zhí)行斑點提取和斑點抽象化,可以高效地產(chǎn)生歸一化的二值圖像,而并不明確地或隱含地要求圖像數(shù)據(jù)具有單個背景色彩和不同于所述背景色彩的單個文本色彩。而是,基于圖像的滿足非重疊的、穩(wěn)定的并且曲線的準則的均質區(qū)域(均質區(qū)域可以是任何色彩)來識別文本。圖3中圖解說明其中可以使用圖1的系統(tǒng)100或通過執(zhí)行圖2的方法200來識別文本的圖像的實例。
[0053]圖3圖解說明含有可以使用斑點提取檢測的文本的圖像302、304和306。圖像302包含其中文本色彩和背景色彩相同的文本。不基于斑點提取的二進制化引擎(例如基于色彩的二進制化)可能無法正確地識別第一圖像302中的文本,因為二進制化引擎可能預期文本色彩不同于背景色彩。但是,相對于圖1和圖2描述的斑點提取和抽象化可以將字母中的每一者識別為不同色彩的邊界內的均質區(qū)域,并且因而可以正確地識別圖像302中的文本。
[0054]圖像304包含具有基本上類似于圖像背景色彩的色彩并且與不同色彩的區(qū)域交界的亞洲字符文本。常規(guī)文本提取引擎可能難以識別與圖像背景共享相同色彩并且被不同色彩的像素的大型區(qū)域包圍的文本字符。
[0055]圖像306包含疊加在具有復雜色彩方案(具有許多邊緣和各種色彩)的背景圖象上的白色文本的標志。因為圖像306中的文本的背景具有多種色彩并且比較復雜,并且因為文本的色彩(例如詞語“fish”中的“ish”)類似于背景的部分,所以常規(guī)二進制化和文本提取可能不能夠區(qū)分所述文本。但是,圖2的基于斑點的方法200使得能夠識別圖像306中的文本,如相對于圖4所圖解說明。
[0056]參看圖4,圖解說明圖2的方法200的應用的總圖被圖解說明并且總地來說標示為400。檢查對應于圖3的圖像306的圖像402以進行文本提取。在處理期間,可以識別一組斑點并且評估其穩(wěn)定性。舉例來說,對圖像402的區(qū)域404的處理可能會引起識別多個斑點。可以將斑點406識別為所識別斑點中最穩(wěn)定的斑點。斑點406對應于圖像402中基本上類似色彩的大型區(qū)域。斑點406可以是涵蓋來自圖像402中的短語“fish & chips”的字母“ish”和“&”的多個重疊斑點中的最大斑點。
[0057]在將斑點406識別為圖像402中或區(qū)域404中的一組所識別斑點中的最穩(wěn)定斑點之后,確定408斑點406是否為曲線的。因為斑點406的筆劃寬度與斑點406的大小相比較大(如相對于圖14更詳細描述),所以確定斑點406不大可能對應于圖像402中的文本。
[0058]識別所述組所識別斑點中的下一個最穩(wěn)定斑點。舉例來說,另一斑點410 (與斑點406重疊)可以被識別為下一個最穩(wěn)定斑點。斑點410被檢查并且被確定為不是曲線的。因此,移除斑點410不予考慮。可以基于斑點410的穩(wěn)定性并且獨立于斑點410是否與先前檢查的斑點406重疊來選擇斑點410進行曲線測試。
[0059]當另一斑點412被識別為下一個最穩(wěn)定斑點時,檢查斑點412的曲線性。確定斑點412不滿足曲線性的約束,并且將其移除而不予考慮。當斑點416 (接近地對應于詞語“fish”中的字母“s”)被識別為下一個最穩(wěn)定斑點時,測試斑點416的曲線性,并且確定414斑點416是曲線的。因為斑點416是穩(wěn)定的曲線的斑點,所以斑點416可能很可能對應于文本并且與斑點416重疊的斑點被移除。類似地,當斑點418(對應于字母“i”)被識別為下一個最穩(wěn)定斑點并且被確定為是曲線的時,移除與斑點418重疊的斑點而不予考慮。
[0060]可以將斑點420識別為下一個最穩(wěn)定斑點。斑點420包含字母“c”并且還包含圖像背景的具有與字母“c”基本上類似色彩的部分。斑點420被識別為不是曲線的,并且被移除而不予考慮。斑點420與僅含有字母“c”的斑點重疊,所述斑點可以被確定為下一個最穩(wěn)定斑點并且被確定為是曲線的。因此,保留含有字母“C”的斑點作為文本的候選物。以此方式,使用穩(wěn)定性和曲線準則的斑點提取可以成功地識別圖像402的與類似色彩的背景重疊的字母,從而顯露出對應于區(qū)域404中的文本的斑點。
[0061]雖然斑點406被描述為最穩(wěn)定的斑點,并且重疊斑點410、412和416被描述為連續(xù)的下一個最穩(wěn)定斑點,但是應理解,斑點穩(wěn)定性的確定可以與斑點大小和/或重疊無關。舉例來說,可以確定斑點406是最穩(wěn)定斑點。在確定斑點406不是曲線的之后,可以確定斑點416是下一個最穩(wěn)定斑點。在這個實例中,在確定斑點416是曲線的之后,因為與曲線的斑點416重疊,所以重疊斑點410和412被移除而不予考慮,而無需測試斑點410或412是否為曲線的。作為另一實例,可以確定斑點416(而非斑點406)是最穩(wěn)定斑點。在確定斑點416是曲線的之后,移除與斑點416重疊的斑點406、410和412而不予考慮,而無需確定斑點406、410和410中的任一者是否為曲線的。
[0062]參看圖5,圖解說明對應于圖4的圖像402的圖像502和根據(jù)圖2的方法200執(zhí)行圖像504的區(qū)的斑點提取的結果。一組斑點506對應于圖像502的穩(wěn)定的、曲線的并且非重疊的區(qū)段。在執(zhí)行文本區(qū)域檢測和產(chǎn)生歸一化的二值圖像之前,可以向斑點抽象化器提供所述組斑點506以便進行抽象化,如相對于圖8更詳細地描述。
[0063]參看圖6,基于斑點的文本提取的實例600包含第一圖像602和第一圖像602的斑點提取/歸一化結果,圖解說明為斑點組603。所述斑點組603圖解說明已經(jīng)根據(jù)斑點提取和穩(wěn)定性、曲線性和非重疊準則的應用而識別了第一圖像602中的標志中存在的字母中的每一者。已經(jīng)通過移除文本效果以產(chǎn)生所述組斑點603而將所識別的斑點歸一化。
[0064]實例600進一步包含第二圖像604,其包含具有與背景不同色彩的第一組字母“boo”和具有與背景相同色彩并且具有畫出每一字母的白色邊界的第二組字母“hoo”。相對于圖1-5描述的斑點提取進程可以產(chǎn)生提取出的斑點,通過移除文本效果可以將所述斑點歸一化以產(chǎn)生斑點組605。斑點組605包含對應于字母“boo”的第一組斑點和對應于字母“hoo”的第二組斑點。
[0065]參看圖7,投影輪廓分析的實例被圖解說明并且總地來說標示為700。第一實例702圖解說明使用遵循第一投影方向(其與一系列經(jīng)識別的斑點交叉)的第一組投影線706的投影輪廓分析,并且產(chǎn)生文本行的投影輪廓708。投影輪廓分析的第二實例704圖解說明遵循第二投影方向的第二組投影線710,從而產(chǎn)生文本行的較大投影輪廓712。
[0066]可以對通過圖1的文本斑點提取器104識別或相對于圖2的方法200的斑點提取部分描述的斑點執(zhí)行投影輪廓分析。投影輪廓分析可包含選擇多個待測試的方向(例如M個方向),并且可以對圖像的具有寬度W和高度H的區(qū)域的每一像素執(zhí)行投影輪廓分析,從而產(chǎn)生大約WXHXM的執(zhí)行投影輪廓分析的總復雜度。投影輪廓分析可包含選擇最小所確定的投影輪廓(例如選擇小于投影輪廓712的投影輪廓708),并且可包含識別對應于投影輪廓的線(即產(chǎn)生最小計算投影輪廓的線)相對于水平方向的角度的文本歪斜。雖然可以對作為像素群組提取的斑點執(zhí)行圖7中圖解說明的投影輪廓分析,但是通過在投影輪廓分析之前執(zhí)行斑點抽象化可以顯著減少確定文本歪斜和傾斜的計算復雜度,如相對于圖8更詳細解釋。
[0067]參看圖8,斑點抽象化的實例被描繪并且總地來說標示為800。圖像802包含具有數(shù)字和韓語字符的文本。對應于圖像802的斑點提取產(chǎn)生圖像804中圖解說明的斑點的識另lj。圖像804將所提取的斑點圖解說明為白色像素對照黑色背景??梢酝ㄟ^斑點抽象化進程處理圖像804中提取的斑點,以便產(chǎn)生圖像806中的經(jīng)抽象化的斑點。
[0068]可以通過定位基本上覆蓋或涵蓋所識別的斑點中的每一者的橢圓形(或其它形狀)來執(zhí)行斑點抽象化??梢允褂脜?shù)圖形,例如橢圓形、三角形、矩形或其它可以使用相對很少數(shù)目的參數(shù)來識別的形狀,作為使用所識別的斑點作為各個像素的集合(并且因而具有等于每一斑點中的像素數(shù)目的數(shù)目個參數(shù))的計算成本較低的替代方案。如圖像806中描繪的斑點抽象化結果中圖解說明,已經(jīng)使來自斑點提取的每一斑點與橢圓形(例如代表性橢圓形807)配合。可以根據(jù)能量最小化技術、最小平方誤差技術或一個或一個以上其它技術來選擇橢圓形,以便獲得幾何形狀與其對應斑點的配合,使得幾何形狀總地來說對應于與斑點相同的跨距和傾斜角度。
[0069]圖8包含一個包含文本的圖像808的第二實例。在包含對應于圖像808中的文本的斑點并且還包含一個或一個以上其它非文本斑點的圖像810中提供斑點提取的結果。在圖像812中描繪執(zhí)行斑點抽象化的結果。如圖解說明,圖像812中的斑點抽象化的結果包含一組橢圓形,每一橢圓形總地來說對應于對應斑點的大小,并且具有基本上與其對應斑點的定向對準的定向(即長軸)。已經(jīng)因為非文本斑點的對應橢圓形無法滿足一個或一個以上最小大小閾值而排除非文本斑點。
[0070]在執(zhí)行斑點抽象化之后,在一個實施例中可以通過使用在所識別的幾何圖形內封閉的像素(例如在圖8中圖解說明的橢圓形內的像素)執(zhí)行投影輪廓分析而在計算方面簡化投影輪廓分析。在另一實施例中,通過根據(jù)描述幾何圖形的等式確定幾何圖形中的每一者的投影值,可以更加顯著地減少計算復雜度。舉例來說,確定橢圓形的投影值的計算相對直接,從而產(chǎn)生復雜度為nxM的總投影輪廓分析,其中η對應于抽象化的斑點的數(shù)目(即橢圓形的數(shù)目),并且其中M對應于待測試的文本投影角度的數(shù)目。
[0071]與直接對所提取的斑點執(zhí)行投影輪廓分析相比,通過在投影輪廓分析之前使用斑點抽象化可以節(jié)省的計算循環(huán),使得可以執(zhí)行額外處理操作,而不會在文本提取期間引入大量延遲。舉例來說,雖然投影輪廓分析可以實現(xiàn)文本行的歪斜的確定(例如相對于圖12更詳細描述),但是也可以執(zhí)行其它處理,例如估計傾斜、對于微弱透視失真的補償和多重歪斜處置,相對于圖10更詳細地描述其中的每一者。
[0072]參看圖9,描繪圖像中的基于斑點抽象化的文本歪斜和傾斜校正的實例900。圖像902被圖解說明為具有文本,所述文本被識別為在被圖解說明為平行四邊形的文本區(qū)域內。所述文本具有傾斜,這指示每一字母是傾斜的(例如使用斜體),并且文本總地來說遵循水平文本行并且因而具有極少或沒有歪斜??梢允褂冒唿c提取來識別圖像902中的文本,并且將其抽象化成橢圓形或其它參數(shù)形狀。可以執(zhí)行投影輪廓分析以識別斑點中的每一者的傾斜量(即所識別文本中的字母中的每一者的傾斜),并且可以補償針對斑點中的每一者識別的傾斜,以便產(chǎn)生經(jīng)補償?shù)陌唿c組903。經(jīng)補償?shù)陌唿c組903被圖解說明為基本上沒有傾斜。因此,通過排除因為傾斜而引起的字符重疊,可以用提高的可靠性來執(zhí)行字符辨識,如相對于圖11更詳細地描述。
[0073]圖9圖解說明包含所識別文本區(qū)域內的字符的第二圖像904。在斑點提取、抽象化和歪斜與傾斜補償之后,將所識別文本區(qū)域內的字符圖解說明為經(jīng)補償?shù)陌唿c組905。圖9圖解說明包含兩個文本區(qū)的第三圖像906。提供應用于第三圖像906的斑點抽象化、提取和補償?shù)慕Y果作為經(jīng)補償?shù)陌唿c組907。
[0074]參看圖10,圖解說明輸入圖像以及對應斑點提取、抽象化和補償結果的第一實例1002。第一實例1002圖解說明應用于文本“Software That Sees”并且還應用于文本“HOME”和“ENTERTAINMENT”的傾斜補償。在傾斜補償之后,可以用更大可靠性執(zhí)行光學字符辨識。第二實例1004圖解說明微弱透視補償。微弱透視可以是可能在遠處的對象的圖像俘獲期間引起的相對常見失真。對于微弱透視效果的補償可以類似于歪斜檢測和補償以及傾斜檢測和補償。第三實例1006圖解說明文本行分離,其使得能夠通過將圖像的區(qū)域識別為分開的文本行來檢測多個文本行。第四實例1008提供多重歪斜處置的實例。實例1008中的圖像具有三個文本行,前兩個文本行具有第一歪斜方向,并且第三文本行具有第二歪斜方向。多重歪斜處置可以執(zhí)行第一投影輪廓分析,其將文本的底部行識別為單個文本行并且將兩個上部文本行識別為另一文本行,所述兩行均具有水平偏斜。對圖像的上部部分的二級投影輪廓分析可以識別兩個分開的文本行,其中的每一者具有類似的非水平歪斜。實例1002-1008圖解說明傾斜補償、透視補償、文本行分離和多重歪斜處置,其因為斑點抽象化所產(chǎn)生的效率而具有減少的計算要求。
[0075]參看圖11,圖解說明包含傾斜的圖像文本的實例1102。圖像文本的每一字母是傾斜的,使得識別對應于每一有待檢查的字母的垂直間隙的字符分段例程可能未識別字母之間的清晰分離。舉例來說,字母“f” 1106的分段可能會省略“f”的兩端,從而導致“f”在光學字符辨識期間不可辨識。類似地,還可能歸因于與“f”重疊而誤識別鄰近于“f”的字母“ο”和“t”。作為另一實例,字母“h” 1110的分段可能在光學字符辨識期間產(chǎn)生誤差,因為“h”的左側部分已被切掉。
[0076]經(jīng)傾斜補償?shù)奈谋镜膶嵗?104可能起因于應用于具有傾斜的文本的實例1102的相對于圖8圖解說明和描述的斑點抽象化。舉例來說,可以對在實例1102中圖解說明的斑點執(zhí)行斑點抽象化和投影輪廓分析以便估計斑點的傾斜,并且可以基于估計的傾斜來修改斑點,以便產(chǎn)生實例1104的經(jīng)傾斜補償?shù)奈谋?。?jīng)傾斜補償?shù)奈谋緢D解說明字母“f”1108和字母“h” 1112的字符分段在傾斜補償之后可以更準確地區(qū)分字母。
[0077]參看圖12,描繪文本的歪斜和傾斜的說明性實例1200,其可以被檢測和補償以便在相對于圖1到11描述的投影輪廓分析之前使用基于斑點的文本提取和斑點抽象化。文本1202圖解說明為具有基線1204?;€1204總地來說對應于文本1202的字母中的每一者的底部?;€1204相對于水平線1208形成一個角度1210。角度1210被稱作文本1202的歪斜。此外,文本1202的每一字符形成相對于垂直于基線1204的行1206的角度1214。字符相對于垂直于基線1204的行1206的角度1214被稱作字符的傾斜度。如本文中圖解說明和描述,可以檢測字符歪斜和傾斜兩者,并且對其進行補償以便在投影輪廓分析之前使用由于斑點提取和斑點抽象化而引起的減少的處理復雜度。
[0078]圖13描繪一個展示文本圖像和斑點提取和抽象化結果1310的實例1300。在實例1300中,將文本圖解說明為韓語字符。已提取文本,并且已經(jīng)根據(jù)被圖解說明為橢圓形的代表性斑點抽象化1304對所識別的斑點進行抽象化。因為許多類型的文本(例如亞洲字符和其它字母表)可能不嚴密符合壓頭線和基線(例如圖12中圖解說明的基線),所以可以補充或代替其它對準準則而使用中心線識別。
[0079]舉例來說,第一抽象化斑點1304具有比第二抽象化斑點1306顯著小的大小。因此,基礎分析可能未產(chǎn)生對文本1302的文本行的正確識別。但是,發(fā)現(xiàn)穿過斑點的中心的行1308(例如使用最小均方分析)可以產(chǎn)生對中心線的識別以便實現(xiàn)歪斜估計。
[0080]可以根據(jù)所揭示的系統(tǒng)和方法使用的歪斜估計方法的其它實例包含基線/壓頭線配合(這可能對于字母表是有效的)、投影輪廓歪斜估計(例如相對于圖7描述,這可能對于多個行的文本是有效的),和基于斑點抽象化的中心線配合,如在圖13中圖解說明。因為使用抽象化斑點的歪斜估計方法中的每一者的計算負荷可能相對較小,所以可以執(zhí)行多個歪斜估計方法,并且可以使用所述多個歪斜估計方法的最有意義的結果或最佳結果作為所選歪斜以用于進一步處理。
[0081]圖14提供使用筆劃寬度確定曲線性的方法的說明性實施例1400。實施例1400圖解說明一個斑點,其包含具有多個像素的字母A,所述像素例如是第一代表性像素p1、第二代表性像素P2和第三代表性像素p3。字母A橫跨具有寬度W和高度H的像素區(qū)??梢岳绺鶕?jù)隨機或偽隨機選擇來選擇一組點(例如包含pl,p2,p3)。作為一實例,可以選擇一百個點。對于每一所選點,可以通過確定穿過所選點的一組行(例如圖解說明為穿過Pl的代表性的一組行1404)而獲得對筆劃寬度的估計。每一行W可以成不同角度,并且具有穿過第i個所選點的最短長度的行可以對應于穿過所選點(Si)的筆劃寬度:
[0082]Si = min (W1, w2, w3...}
[0083]為了說明 ,穿過像素pl的圖解說明的代表性行1404的組中的最短行1402指示在像素Pi處的斑點的筆劃寬度。類似地,可以針對每一所選點確定筆劃寬度,并且可以將平均筆劃寬度確定為針對所選點所確定的筆劃寬度的算術平均值。舉例來說,可以通過下式確定平均筆劃寬度:
[0084]
【權利要求】
1.一種計算機實施的方法,其包括: 接收在圖像數(shù)據(jù)中識別的一組圖像區(qū)域的指示;以及 從所述組圖像區(qū)域中選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取。
2.根據(jù)權利要求1所述的計算機實施的方法,其中所述組圖像區(qū)域中的每一圖像區(qū)域是對應于所述圖像數(shù)據(jù)的具有大體上類似的像素值的相連像素群組的斑點。
3.根據(jù)權利要求1所述的計算機實施的方法,其中至少部分基于圖像區(qū)域曲線性來進一步選擇所述圖像區(qū)域。
4.根據(jù)權利要求3所述的計算機實施的方法,其中至少部分基于圖像區(qū)域大小與圖像區(qū)域筆劃寬度的比較來確定所述圖像區(qū)域曲線性。
5.根據(jù)權利要求3所述的計算機實施的方法,其中選擇所述圖像區(qū)域包含: 識別所述組圖像區(qū)域中的滿足穩(wěn)定性準則的一圖像區(qū)域; 以及確定所述所識別的圖像區(qū)域是否滿足曲線性準則。
6.根據(jù)權利要求5所述的計算機實施的方法,其進一步包括確定所述組圖像區(qū)域中的每一圖像區(qū)域的穩(wěn)定性量度,且其中識別滿足所述穩(wěn)定性準則的所述圖像區(qū)域包括基于所述所確定的穩(wěn)定性量度的比較來選擇所述組圖像區(qū)域中的最穩(wěn)定圖像區(qū)域。
7.根據(jù)權利要求6所述的計算機實施的方法,其中每一所確定的穩(wěn)定性量度指示相對于閾值中的改變的圖像區(qū)域大小中的改變。
8.根據(jù)權利要求5所述的計算機實施的方法,其中選擇所述圖像區(qū)域進一步包含,在確定所述所識別的圖像區(qū)域滿足所述曲線性準則之后,從所述組圖像區(qū)域移除與所述所識別的圖像區(qū)域重疊的所有圖像區(qū)域。
9.根據(jù)權利要求1所述的計算機實施的方法,其進一步包括: 確定對應于所述選定的圖像區(qū)域的一組幾何圖形; 以及確定所述組幾何圖形的投影輪廓。
10.根據(jù)權利要求1所述的計算機實施的方法,其中選擇所述組圖像區(qū)域中的至少一個圖像區(qū)域以用于文本提取,且其中不選擇所述組圖像區(qū)域中的至少另一圖像區(qū)域以用于文本提取。
11.根據(jù)權利要求1所述的計算機實施的方法,其中所述組圖像區(qū)域中的至少一個圖像區(qū)域與所述組圖像區(qū)域中的另一圖像區(qū)域重疊。
12.—種設備,其包括: 圖像區(qū)域提取器,其經(jīng)配置以產(chǎn)生在圖像數(shù)據(jù)中識別的一組圖像區(qū)域的指示;以及文本圖像區(qū)域選擇器,其經(jīng)配置以從所述組圖像區(qū)域中選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取。
13.根據(jù)權利要求12所述的設備,其中所述文本圖像區(qū)域選擇器進一步經(jīng)配置以至少部分基于圖像區(qū)域曲線性來選擇所述圖像區(qū)域。
14.根據(jù)權利要求13所述的設備,其中所述文本圖像區(qū)域選擇器包含: 選擇器,其經(jīng)配置以從所述組圖像區(qū)域中選擇穩(wěn)定且曲線的圖像區(qū)域;以及重疊區(qū)域移除器,其經(jīng)配置以從所述組圖像區(qū)域移除與所述選定的穩(wěn)定且曲線的圖像區(qū)域重疊的圖像區(qū)域。
15.根據(jù)權利要求12所述的設備,其進一步包括圖像區(qū)域抽象化器,其經(jīng)配置以確定對應于所述選定的圖像區(qū)域的一組幾何圖形。
16.根據(jù)權利要求12所述的設備,其進一步包括文本區(qū)域檢測器,所述文本區(qū)域檢測器經(jīng)配置以確定所述組幾何圖形的投影輪廓。
17.—種設備,其包括: 用于識別圖像數(shù)據(jù)中的一組圖像區(qū)域的裝置;以及 用于從所述組圖像區(qū)域中選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取的裝置。
18.根據(jù)權利要求17所述的設備,其中所述圖像區(qū)域是至少部分基于圖像區(qū)域曲線性而進一步選擇。
19.一種計算機可讀存儲媒體,其存儲可由處理器執(zhí)行的程序指令,所述程序指令包括: 用于接收在圖像數(shù)據(jù)中識別的一組圖像區(qū)域的指示的代碼;以及 用于從所述組圖像區(qū)域中選擇若干圖像區(qū)域以用于至少部分基于圖像區(qū)域穩(wěn)定性進行文本提取的代碼。
20.根據(jù)權利要求19所述的計算機可讀存儲媒體,其中所述程序指令進一步包括用于至少部分基于圖像區(qū)域曲線性來進一步選擇所述圖像區(qū)域的代碼。
21.—種計算機實施的方法,其包括:` 識別對應于圖像區(qū)域的幾何圖形,所述圖像區(qū)域對應于在圖像數(shù)據(jù)中識別的文本的至少一部分;以及至少部分基于所述幾何圖形而確定所述文本的限定框。
22.根據(jù)權利要求21所述的計算機實施的方法,其進一步包括: 響應于所述幾何圖形相對于所述圖像區(qū)域的第一配合錯誤超過閾值,識別對應于所述圖像區(qū)域的多個幾何圖形。
23.根據(jù)權利要求22所述的計算機實施的方法,其中所述第一配合錯誤對應于與所述圖像區(qū)域的總面積相比位于所述幾何圖形之外的所述圖像區(qū)域的面積。
24.根據(jù)權利要求22所述的計算機實施的方法,其進一步包括響應于所述多個幾何圖形的第二配合錯誤小于所述第一配合錯誤而對所述多個幾何圖形執(zhí)行投影輪廓分析。
25.根據(jù)權利要求22所述的計算機實施的方法,其中所述多個幾何圖形是由兩個幾何圖形組成。
26.根據(jù)權利要求22所述的計算機實施的方法,其中所述幾何圖形是橢圓形且其中所述多個幾何圖形包含多個橢圓形。
27.根據(jù)權利要求21所述的計算機實施的方法,其進一步包括: 使用多個投影線來確定所述幾何圖形的投影輪廓,其中對應于每一特定投影線的所述投影輪廓的值是基于所述特定投影線與所述幾何圖形的相交點之間的距離。
28.根據(jù)權利要求21所述的計算機實施的方法,其進一步包括: 識別對應于圖像區(qū)域的多個幾何圖形,所述圖像區(qū)域中的每一者對應于所述文本的至少一部分; 確定所述多個幾何圖形的第一投影輪廓來估計所述文本的偏斜;以及 確定所述多個幾何圖形的第二投影輪廓來估計所述文本的傾斜。
29.根據(jù)權利要求28所述的計算機實施的方法,其中確定所述第一投影輪廓包含確定對應于多組平行投影線與所述多個幾何圖形相交的角度的多個投影線,以及從所述多個投影輪廓中選擇小于所述多個投影輪廓中的任何其它投影輪廓的一投影輪廓。
30.根據(jù)權利要求29所述的計算機實施的方法,其中所述偏斜對應于與水平參考相對應的所述平行投影線的所述角度。
31.根據(jù)權利要求28所述的計算機實施的方法,其中確定所述第二投影輪廓包含確定對應于多組平行投影線與所述多個幾何圖形相交的角度的多個投影線,以及從所述多個投影輪廓中選擇具有比所述多個投影輪廓中的任何其它投影輪廓少的平行投影線與所述多個幾何圖形的相交點的一投影輪廓。
32.根據(jù)權利要求21所述的計算機實施的方法,其進一步包括: 從一組圖像區(qū)域中提取若干圖像區(qū)域,所述圖像區(qū)域中的每一者對應于所述文本的至少一部分; 將所述所提取的圖像區(qū)域分割為多個群集;以及 獨立于其它群集中的每一者來確定每一群集的投影輪廓。
33.根據(jù)權利要求32所述的計算機實施的方法,其中分割所述所提取的圖像區(qū)域是至少部分基于所述文本的筆劃寬度。
34.根據(jù)權利要求32所述的計算機實施的方法,其中分割所述所提取的圖像區(qū)域是至少部分基于所述 文本的色彩。
35.根據(jù)權利要求21所述的計算機實施的方法,其進一步包括: 對對應于在所述圖像數(shù)據(jù)中識別的圖像區(qū)域的第一組幾何圖形執(zhí)行第一投影輪廓分析以將所述第一組幾何圖形分割為第二組幾何圖形和第三組幾何圖形;以及對所述第二組幾何圖形執(zhí)行第二投影輪廓分析以將所述第二組幾何圖形分割為第四組幾何圖形和第五組幾何圖形。
36.根據(jù)權利要求35所述的計算機實施的方法,其中所述第三組幾何圖形對應于所述文本的第一條線,其中所述第四組幾何圖形對應于所述文本的第二條線,且其中所述第五組幾何圖形對應于所述文本的第三條線。
37.一種設備,其包括: 處理器;以及 存儲器,其存儲可由所述處理器執(zhí)行以進行以下操作的指令: 識別對應于圖像區(qū)域的幾何圖形,所述圖像區(qū)域對應于在圖像數(shù)據(jù)中識別的文本的至少一部分;以及 至少部分基于所述幾何圖形而確定所述文本的限定框。
38.根據(jù)權利要求37所述的設備,其中所述指令進一步可由所述處理器執(zhí)行以響應于所述幾何圖形相對于所述圖像區(qū)域的第一配合錯誤超過閾值,識別對應于所述圖像區(qū)域的多個幾何圖形。
39.根據(jù)權利要求27所述的設備,其中所述指令進一步可由所述處理器執(zhí)行以使用多個投影線來確定所述幾何圖形的投影輪廓,其中對應于每一特定投影線的所述投影輪廓的值是基于所述特定投影線與所述幾何圖形的相交點之間的距離。
40.根據(jù)權利要求27所述的設備,其中所述指令進一步可由所述處理器執(zhí)行以:識別對應于圖像區(qū)域的多個幾何圖形,所述圖像區(qū)域中的每一者對應于所述文本的至少一部分; 確定所述多個幾何圖形的第一投影輪廓來估計所述文本的偏斜;以及 確定所述多個幾何圖形的第二投影輪廓來估計所述文本的傾斜。
41.根據(jù)權利要求27所述的設備,其中所述指令進一步可由所述處理器執(zhí)行以: 從一組圖像區(qū)域中提取若干圖像區(qū)域,所述圖像區(qū)域中的每一者對應于所述文本的至少一部分; 將所述所提取的圖像區(qū)域分割為多個群集;以及 獨立于其它群集中的每一者來確定每一群集的投影輪廓。
42.根據(jù)權利要求27所述的設備,其中所述指令進一步可由所述處理器執(zhí)行以: 對對應于在所述圖像數(shù)據(jù)中識別的圖像區(qū)域的第一組幾何圖形執(zhí)行第一投影輪廓分析以將所述第一組幾何圖形分割為第二組幾何圖形和第三組幾何圖形;以及對所述第二組幾何圖形執(zhí)行第二投影輪廓分析以將所述第二組幾何圖形分割為第四組幾何圖形和第五組幾 何圖形。
【文檔編號】G06K9/32GK103765441SQ201280041787
【公開日】2014年4月30日 申請日期:2012年7月31日 優(yōu)先權日:2011年9月6日
【發(fā)明者】丘衡一, 延奇宣 申請人:高通股份有限公司