一種圖像識別的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種圖像識別的方法及系統(tǒng),其中圖像識別的方法包括:A.在采集物體的圖像時確定采集設(shè)備的錄入方向;B.利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像;C.利用矯正后的圖像進行圖像識別,得到最終的圖像識別結(jié)果。通過上述方式,本發(fā)明可以有效提高圖像識別的準(zhǔn)確度。
【專利說明】—種圖像識別的方法及系統(tǒng)
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及圖像識別技術(shù),特別涉及一種圖像識別的方法及系統(tǒng)。
【【背景技術(shù)】】
[0002]在現(xiàn)有的圖像識別技術(shù)里,圖像識別過程中對輸入圖像進行分析,通常只涉及到特征提取和特征比對,例如從輸入圖像中提取圖像特征,然后將圖像特征與已知物體的特征進行比對,從而確認待識別的圖像是否為已知物體。
[0003]然而,相同的物體在不同角度下拍攝得到的圖像是不同的,而不同的圖像在特征提取時會得到不同的特征,從而在與已知物體的特征進行比對時得到不同的匹配度。請參考圖1和圖2,圖1和圖2分別為相同的文字在不同的角度下拍攝得到的圖像示意圖。從圖1和圖2可以看出,相同的文字在不同的拍攝角度下得到的圖像是不同的,而不同的圖像可能得到不同的識別結(jié)果,例如圖1中的文字可能被識別為“圖像識別”,而圖2中的文字卻被識別為“圖像織別”,這說明圖2中的圖像識別發(fā)生了錯誤??梢?,圖像的拍攝角度會影響圖像識別的準(zhǔn)確度,在一些角度下采集圖像,會降低圖像識別的準(zhǔn)確度。
[0004]現(xiàn)有的圖像識別技術(shù)中,尚無任何考慮圖像拍攝角度的識別方案。
【
【發(fā)明內(nèi)容】
】
[0005]本發(fā)明所要解決的技術(shù)問題是提供一種圖像識別的方法及系統(tǒng),以解決現(xiàn)有圖像識別技術(shù)中存在的由圖 像拍攝角度引起的圖像識別準(zhǔn)確度降低的問題。
[0006]本發(fā)明為解決技術(shù)問題而采用的技術(shù)方案是提供一種圖像識別的方法,包括:A.在采集物體的圖像時確定采集設(shè)備的錄入方向;B.利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像;C.利用矯正后的圖像進行圖像識別,得到最終的圖像識別結(jié)果。
[0007]根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟A具體包括:獲取所述采集設(shè)備在采集圖像時的橫滾角,并以所述橫滾角確定所述采集設(shè)備的錄入方向。
[0008]根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟B具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0009]根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟A具體包括:獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角,并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
[0010]根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟B具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn),并且,根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
[0011]根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟C具體包括:C1.對矯正前的圖像進行識另|J,得到第一識別結(jié)果;C2.對矯正后的圖像進行識別,得到第二識別結(jié)果;C3.根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果,并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。[0012]根據(jù)本發(fā)明之一優(yōu)選實施例,根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括:當(dāng)所述物體為文字時,確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y,并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果;或者,利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K,并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0013]根據(jù)本發(fā)明之一優(yōu)選實施例,根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括:確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0014]本發(fā)明還提供了一種圖像識別的系統(tǒng),包括:圖像采集裝置,用于采集物體的圖像;方向獲取裝置,用于在所述圖像采集裝置采集物體的圖像時確定采集設(shè)備的錄入方向;矯正裝置,用于利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像;結(jié)果獲取裝置,用于利用矯正后的圖像進行圖像識別,得到最終的圖像識別結(jié)果。
[0015]根據(jù)本發(fā)明之一優(yōu)選實施例,所述方向獲取裝置確定采集設(shè)備的錄入方向的方式具體包括:獲取所述采集設(shè)備在采集圖像時的橫滾角,并以所述橫滾角確定所述采集設(shè)備的錄入方向。
[0016]根據(jù)本發(fā)明之一優(yōu)選實施例,所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0017]根據(jù)本發(fā)明之一優(yōu)選實施例,所述方向獲取裝置確定采集設(shè)備的錄入方向的具體方式包括:獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角,并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
[0018]根據(jù)本發(fā)明之一優(yōu)選實施例,所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn),并且,根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
[0019]根據(jù)本發(fā)明之一優(yōu)選實施例,所述結(jié)果獲取裝置包括:第一識別單元,用于對矯正前的圖像進行識別,得到第一識別結(jié)果;第二識別單元,用于對矯正后的圖像進行識別,得到第二識別結(jié)果;結(jié)果確定單元,用于根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果,并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
[0020]根據(jù)本發(fā)明之一優(yōu)選實施例,所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括:當(dāng)所述物體為文字時,確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y,并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果;或者,利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K,并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0021]根據(jù)本發(fā)明之一優(yōu)選實施例,所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括:確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0022]由以上技術(shù)方案可以看出,通過在采集圖像時,獲取采集設(shè)備的錄入方向,可以對采集到的圖像進行矯正,利用矯正后的圖像進行圖像識別,能夠為物體的圖像識別提供更多的數(shù)據(jù)參考,從而可以有效地減少由圖像拍攝角度導(dǎo)致的圖像識別錯誤,提高圖像識別的準(zhǔn)確度。
【【專利附圖】
【附圖說明】】
[0023]圖1為文字在角度一的情況下拍攝得到的圖像示意圖;
[0024]圖2為文字在角度二的情況下拍攝得到的圖像示意圖;
[0025]圖3為本發(fā)明中圖像識別的方法的流程示意圖;
[0026]圖4為本發(fā)明中采集設(shè)備的參考坐標(biāo)系的示意圖;
[0027]圖5為文字在角度三的情況下拍攝得到的圖像示意圖;
[0028]圖6為本發(fā)明中圖像識別的系統(tǒng)的結(jié)構(gòu)示意框圖;
[0029]圖7為本發(fā)明中結(jié)果獲取裝置的實施例的結(jié)構(gòu)示意框圖;
[0030]圖8為本發(fā)明中圖像識別的系統(tǒng)的一個分布示意圖;
[0031]圖9為本發(fā)明中圖像識別的系統(tǒng)的另一個分布示意圖。
【【具體實施方式】】
[0032]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述。
[0033]請參考圖3,圖3為本發(fā)明中圖像識別的方法的流程示意圖。如圖3所示,該方法包括:
[0034]步驟SlOl:在采集物體的圖像時確定采集設(shè)備的錄入方向。
[0035]步驟S102:利用采集設(shè)備的錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像。
[0036]步驟S103:利用矯正后的圖像進行圖像識別,得到最終的圖像識別結(jié)果。
[0037]下面對上述步驟進行詳細說明。
[0038]本發(fā)明中的圖像采集設(shè)備,包括各種能感知自身姿態(tài)變化的拍攝裝置,例如各種帶有陀螺儀的可拍照手機、平板或相機等設(shè)備。
[0039]根據(jù)陀螺儀的測量原理,能感知自身姿態(tài)變化的載體,在水平放置時,其前后方向、左右方向和上下方向相互垂直的軸分別構(gòu)成該載體的參考坐標(biāo)系,其前后方向形成的軸為橫滾軸,左右方向形成的軸為俯仰軸,上下方向形成的軸為航向軸。當(dāng)載體圍繞橫滾軸旋轉(zhuǎn)時,偏離橫滾軸的角度為橫滾角,圍繞俯仰軸旋轉(zhuǎn)時,偏離俯仰軸的角度為俯仰角,圍繞航向軸旋轉(zhuǎn)時,偏離航向軸的角度為航向角。
[0040]請參考圖4,圖4為本發(fā)明中采集設(shè)備的參考坐標(biāo)系的示意圖。步驟SlOl中,通過采集設(shè)備的姿態(tài)感知裝置,獲取到該采集設(shè)備在采集圖像時的橫滾角(即采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)形成的偏移角)、俯仰角(即采集設(shè)備圍繞俯仰軸旋轉(zhuǎn)形成的偏移角)和航向角(即采集設(shè)備圍繞航向角旋轉(zhuǎn)形成的偏移角),由這三個角度,就可以確定采集設(shè)備的錄入方向了。
[0041]可以理解,將采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)前采集的圖像與采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)后采集到的圖像進行對比,后者的圖像相對前者,在平面內(nèi)發(fā)生了旋轉(zhuǎn)。請參考圖1和圖2,其中圖1為采集設(shè)備水平放置時(即圍繞橫滾軸、俯仰軸和航向軸的旋轉(zhuǎn)均為零時),獲取到的圖像,圖2為采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)一定角度后進行圖像采集得到的圖像。與圖1相比,圖2中的圖像在平面內(nèi)旋轉(zhuǎn)了一定角度,根據(jù)成像原理可以知道,圖2中的圖像正是以和采集設(shè)備旋轉(zhuǎn)方向相反的方向旋轉(zhuǎn)了與采集設(shè)備相同的旋轉(zhuǎn)角度。因此,在步驟S102中,對采集到的圖像進行成像矯正的具體方式包括根據(jù)采集設(shè)備的橫滾角對采集到的圖像進行旋轉(zhuǎn),從而使得由于采集設(shè)備傾斜造成的圖像傾斜得到矯正。例如設(shè)備的橫滾角為逆時針30度,則步驟S102中將采集到的圖像在平面內(nèi)逆時針旋轉(zhuǎn)30度。
[0042]另外,可以理解,將采集設(shè)備圍繞航向軸或俯仰軸旋轉(zhuǎn),旋轉(zhuǎn)前采集的圖像與旋轉(zhuǎn)后采集到的圖像相比,前者的圖像顯示比例比后者要均勻。請參考圖1和圖5,其中圖5為采集設(shè)備圍繞航向軸旋轉(zhuǎn)一定角度時獲取到的圖像。從圖5可以看出,采集設(shè)備圍繞航向角進行旋轉(zhuǎn)后,得到的圖像的兩頭大小會發(fā)生改變,距離采集設(shè)備較近一頭的圖像會比距離采集設(shè)備較遠一頭的圖像大。同樣的道理,當(dāng)采集設(shè)備圍繞俯仰角進行旋轉(zhuǎn)后,也會出現(xiàn)圖像比例改變的情況,在此不再贅述。根據(jù)上述說明中的成像規(guī)律,本發(fā)明在步驟S103中,對采集到的圖像進行成像矯正的具體方式包括根據(jù)航向角或俯仰角對采集到的圖像進行縮放,具體地包括根據(jù)航向角或俯仰角的大小,成比例地對采集到的圖像兩頭分別進行縮放,該比例可預(yù)先通過試驗數(shù)據(jù)確定,在此不再詳述。
[0043]以上說明是以最優(yōu)實施方式對步驟SlOl和步驟S102進行介紹的。實際上可以看出,采集設(shè)備圍繞航向角和俯仰角旋轉(zhuǎn)而對圖像產(chǎn)生的影響并不顯著,作為一種較為簡單的實施方式,本發(fā)明也可以忽略采集設(shè)備的航向角和俯仰角對圖像造成的影響。這樣,在步驟SlOl中,也可以僅獲取采集設(shè)備在采集圖像時的橫滾角,并以該橫滾角確定采集設(shè)備的錄入方向,相應(yīng)地,步驟S102中對采集到的圖像進行成像矯正的具體方式就是根據(jù)采集設(shè)備的橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0044]值得注意的是,在前面的說明中,是以圖4所示的參考坐標(biāo)系來描述各個角度的,實際上,如果采集設(shè)備的參考坐標(biāo)系更改,例如更改了采集設(shè)備中陀螺儀的測量基準(zhǔn),則更改前后,采集設(shè)備在同一姿態(tài)下得到的橫滾角、俯仰角或航向角的值是不相同的,但無論參考坐標(biāo)系如何設(shè)置,本發(fā)明均根據(jù)步驟SlOl中獲取的各個由參考坐標(biāo)系決定的角度來確定設(shè)備的錄入方向,并根據(jù)設(shè)備的錄入方向進行后續(xù)處理。
[0045]在得到矯正后的圖像后,步驟S103中就可以根據(jù)矯正后的圖像進行圖像識別。在一個實施例中,步驟S103中可以直接采用現(xiàn)有的圖像識別算法,對矯正后的圖像進行識另O,并將識別結(jié)果作為最終的圖像識別結(jié)果。
[0046]但是,在一些情況下,矯正后的圖像未必是最有利于圖像識別的圖像。例如物體以傾斜的方式放置,此時采集設(shè)備水平放置獲取的圖像并不利于進行圖像識別,反而將采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)后獲取的圖像可能更利于圖像識別,也就是說,矯正后的圖像反而不利于進行圖像識別了。因此,優(yōu)選地,本發(fā)明還提供了步驟S103的另一種實施方式。在該實施方式中,具體地,步驟S103包括:
[0047]步驟S1031:對矯正前的圖像進行識別,得到第一識別結(jié)果。
[0048]步驟S1032:對矯正后的圖像進行識別,得到第二識別結(jié)果。
[0049]步驟S1033:根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果,并將最優(yōu)識別結(jié)果作為最終的識別結(jié)果。[0050]其中步驟S1031和步驟S1032中均可采用現(xiàn)有的圖像識別算法對輸入圖像進行識另IJ,分別得到第一識別結(jié)果和第二識別結(jié)果。
[0051]步驟S1033中根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果,可以有多種實施方式。其中,如果圖像中的物體為文字時,步驟S1033可按照下列方式實施:
[0052]確定第一識別結(jié)果包含的識別項數(shù)據(jù)X和第二識別結(jié)果包含的識別項數(shù)目Y,并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0053]識別項即識別出的文字,例如第一識別結(jié)果為“我愛北京天安門”,其包含的識別項數(shù)目X等于7,第二識別結(jié)果為“我北京天安門”,其包含的識別項Y等于6,由于X大于Y,則X對應(yīng)的“我愛北京天安門”就是最優(yōu)識別結(jié)果。
[0054]此外,如果圖像中的物體為文字時,步驟S1033還可以按照下列方式實施:
[0055]利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K,并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0056]語言模型是對大量的語料進行統(tǒng)計后得到的、用以確定文本的文法概率的模型。以二元統(tǒng)計語言模型為例,P (我愛北京天安門)=P (我)*P (愛I我)*P (北京I愛)*P (天安門北京),其中P (我愛北京天安門)為文本“我愛北京天安門”的文法概率,P (我)為大規(guī)模語料庫中文本“我”的出現(xiàn)概率,P (愛I我)為大規(guī)模語料庫中文本“我”出現(xiàn)的條件下文本“愛”出現(xiàn)的概率,其余的概率含義與之類似。P (我)、p (愛I我)等概率均可從語言模型中查到,因此利用語言模型,即可確定文本“我愛北京天安門”的文法概率。
[0057]由于圖像識別中的錯誤,會造成文本的可讀性降低,文本的文法概率自然也會降低,因此通過本實施方式中的文法概率,可以很好地衡量圖像識別的效果。
[0058]對于包括文字識別在內(nèi)的一般的物體識別,例如人臉識別等,步驟S1033中根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果,還可以按照下列方式實施:
[0059]確定第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0060]在步驟S1031中對矯正前的圖像進行識別以及步驟S1032中對矯正后的圖像進行識別時,根據(jù)現(xiàn)有的圖像識別方法可知,圖像識別中會將待識別圖像的特征與已知特征進行比對,此時會產(chǎn)生一個匹配度,在本實施例中,將利用圖像識別中特征比對的匹配度來確定哪個識別結(jié)果更優(yōu),很顯然,與已知特征相似度高的那個識別結(jié)果就是最優(yōu)識別結(jié)果。
[0061]此外,本發(fā)明在步驟S1033中,還可以根據(jù)第一識別結(jié)果和第二識別結(jié)果判斷圖像識別的滿意度,例如以文字識別為例,為識別結(jié)果的文法概率設(shè)置一個閾值,以此判斷第一識別結(jié)果和第二識別結(jié)果的識別效果,當(dāng)?shù)谝蛔R別結(jié)果和第二識別結(jié)果的文法概率均低于這個閾值時,確定第一識別結(jié)果和第二識別結(jié)果的滿意度不符合要求。此時,本發(fā)明還可以進一步對采集到的圖像進行二次矯正,如果在步驟SlOl中獲取到的采集設(shè)備的橫滾角不為零,則在二次矯正的過程中,將采集到的圖像在平面內(nèi)進行多個角度的旋轉(zhuǎn)嘗試,并在每個角度的旋轉(zhuǎn)嘗試下,進行一次圖像識別,將各識別結(jié)果中,文法概率最高的識別結(jié)果作為最優(yōu)識別結(jié)果。
[0062]值得說明的是,本發(fā)明中,步驟S102或步驟S103,既可在客戶端執(zhí)行,也可在服務(wù)器執(zhí)行。例如,客戶端(如可拍照的手機、平板或具有通訊功能的相機等)在獲取到采集設(shè)備的錄入方向后,將采集到的圖像和設(shè)備錄入方向發(fā)送至服務(wù)器,由服務(wù)器對采集到的圖像進行矯正和圖像識別,也可以在客戶端獲取到采集設(shè)備的錄入方向后,在本地對采集到的圖像進行矯正,并將相關(guān)數(shù)據(jù)發(fā)送至服務(wù)器,由服務(wù)器執(zhí)行步驟S103。
[0063]請參考圖6,圖6為本發(fā)明中圖像識別的系統(tǒng)的結(jié)構(gòu)示意框圖。如圖6所示,該系統(tǒng)包括:采集裝置201、方向確定裝置202、矯正裝置203及結(jié)果獲取裝置204。
[0064]其中采集裝置201,用于采集物體的圖像。
[0065]方向獲取裝置202,用于在圖像采集裝置采集物體的圖像時確定采集設(shè)備的錄入方向。
[0066]矯正裝置203,用于利用采集設(shè)備的錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像。
[0067]結(jié)果獲取裝置204,用于利用矯正后的圖像進行圖像識別,得到最終的識別結(jié)果。
[0068]根據(jù)一個實施例,方向獲取裝置202確定采集設(shè)備的錄入方向的方式具體包括:獲取采集設(shè)備在采集圖像時的橫滾角,并以該橫滾角確定采集設(shè)備的錄入方向。相應(yīng)地,矯正裝置203對采集到的圖像進行成像矯正的方式具體包括:根據(jù)上述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0069]根據(jù)另一個優(yōu)選實施例,方向獲取裝置202確定采集設(shè)備的錄入方向的方式具體包括:獲取采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角,并以該橫滾角、俯仰角和航向角確定采集設(shè)備的錄入方向。相應(yīng)地,矯正裝置203對采集到的圖像進行成像矯正的方式具體包括:根據(jù)上述橫滾角對采集到的圖像進行旋轉(zhuǎn),并且,根據(jù)上述俯仰角和上述航向角對采集到的圖像進行縮放。
[0070]請參考圖7,圖7為本發(fā)明中結(jié)果獲取裝置的實施例的結(jié)構(gòu)示意框圖。如圖7所示,結(jié)果獲取裝置204包括:第一識別單元2041、第二識別單元2042以及結(jié)果確定單元2043。
[0071]其中,第一識別單元2041,用于對矯正前的圖像進行識別,得到第一識別結(jié)果。第二識別單元2042,用于對矯正后的圖像進行識別,得到第二識別結(jié)果。結(jié)果確定單元2043,用于根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果,并將最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
[0072]其中,第一識別單元2041和第二識別單元2042進行圖像識別,均可采用現(xiàn)有的圖像識別算法,在此不再贅述。
[0073]根據(jù)一個實施例,結(jié)果確定單元2043根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括:
[0074]當(dāng)圖像中的物體為文字時,確定第一識別結(jié)果包含的識別項數(shù)目X和第二識別結(jié)果包含的識別項數(shù)目Y,并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果;或者,利用預(yù)置的語言模型確定第一識別結(jié)果的文法概率J和第二識別結(jié)果的文法概率K,并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0075]根據(jù)另一個實施例,結(jié)果確定單元2043根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式還可以是:
[0076]確定第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。[0077]實施本發(fā)明中的系統(tǒng),可將各裝置均置于客戶端,也可僅將采集裝置201和方向確定裝置202置于客戶端,而將矯正裝置203和結(jié)果獲取裝置204置于服務(wù)器(請參考圖8),或者將采集裝置201、方向確定裝置202和矯正裝置203置于客戶端,而將結(jié)果獲取裝置204置于服務(wù)器(請參考圖9)。在本領(lǐng)域技術(shù)人員可以想到的范圍內(nèi),本發(fā)明對此不做限制。
[0078]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明保護的范圍之內(nèi)。
【權(quán)利要求】
1.一種圖像識別的方法,包括: A.在采集物體的圖像時確定采集設(shè)備的錄入方向; B.利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像; C.利用矯正后的圖像進行圖像識別,得到最終的圖像識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A具體包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角,并以所述橫滾角確定所述采集設(shè)備的錄入方向。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟B具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A具體包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角,并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟B具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn),并且,根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟C具體包括: Cl.對矯正前的圖像進行識別,得到第一識別結(jié)果; C2.對矯正后的圖像進行識別,得到第二識別結(jié)果; C3.根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果,并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括: 當(dāng)所述物體為文字時,確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y,并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果;或者,利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K,并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括: 確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
9.一種圖像識別的系統(tǒng),包括: 圖像采集裝置,用于采集物體的圖像; 方向獲取裝置,用于在所述圖像采集裝置采集物體的圖像時確定采集設(shè)備的錄入方向; 矯正裝置,用于利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正,得到矯正后的圖像; 結(jié)果獲取裝置,用于利用矯正后的圖像進行圖像識別,得到最終的圖像識別結(jié)果。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述方向獲取裝置確定采集設(shè)備的錄入方向的方式具體包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角,并以所述橫滾角確定所述采集設(shè)備的錄入方向。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
12.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述方向獲取裝置確定采集設(shè)備的錄入方向的具體方式包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角,并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn),并且,根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
14.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述結(jié)果獲取裝置包括: 第一識別單元,用于對矯正前的圖像進行識別,得到第一識別結(jié)果; 第二識別單元,用于對矯正后的圖像進行識別,得到第二識別結(jié)果; 結(jié)果確定單元,用于根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果,并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括: 當(dāng)所述物體為文字時,確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y,并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果;或者,利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K,并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
16.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括: 確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
【文檔編號】G06K9/00GK103593643SQ201210293317
【公開日】2014年2月19日 申請日期:2012年8月16日 優(yōu)先權(quán)日:2012年8月16日
【發(fā)明者】劉俊啟 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司