一種圖像識別的方法及系統(tǒng)的制作方法

文檔序號：6487924閱讀：189來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種圖像識別的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種圖像識別的方法及系統(tǒng)，其中圖像識別的方法包括：A.在采集物體的圖像時確定采集設(shè)備的錄入方向；B.利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像；C.利用矯正后的圖像進行圖像識別，得到最終的圖像識別結(jié)果。通過上述方式，本發(fā)明可以有效提高圖像識別的準(zhǔn)確度。
【專利說明】—種圖像識別的方法及系統(tǒng)
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及圖像識別技術(shù)，特別涉及一種圖像識別的方法及系統(tǒng)。
【【背景技術(shù)】】
[0002]在現(xiàn)有的圖像識別技術(shù)里，圖像識別過程中對輸入圖像進行分析，通常只涉及到特征提取和特征比對，例如從輸入圖像中提取圖像特征，然后將圖像特征與已知物體的特征進行比對，從而確認待識別的圖像是否為已知物體。
[0003]然而，相同的物體在不同角度下拍攝得到的圖像是不同的，而不同的圖像在特征提取時會得到不同的特征，從而在與已知物體的特征進行比對時得到不同的匹配度。請參考圖1和圖2，圖1和圖2分別為相同的文字在不同的角度下拍攝得到的圖像示意圖。從圖1和圖2可以看出，相同的文字在不同的拍攝角度下得到的圖像是不同的，而不同的圖像可能得到不同的識別結(jié)果，例如圖1中的文字可能被識別為“圖像識別”，而圖2中的文字卻被識別為“圖像織別”，這說明圖2中的圖像識別發(fā)生了錯誤?？梢?，圖像的拍攝角度會影響圖像識別的準(zhǔn)確度，在一些角度下采集圖像，會降低圖像識別的準(zhǔn)確度。
[0004]現(xiàn)有的圖像識別技術(shù)中，尚無任何考慮圖像拍攝角度的識別方案。
【
【發(fā)明內(nèi)容】
】
[0005]本發(fā)明所要解決的技術(shù)問題是提供一種圖像識別的方法及系統(tǒng)，以解決現(xiàn)有圖像識別技術(shù)中存在的由圖像拍攝角度引起的圖像識別準(zhǔn)確度降低的問題。
[0006]本發(fā)明為解決技術(shù)問題而采用的技術(shù)方案是提供一種圖像識別的方法，包括:A.在采集物體的圖像時確定采集設(shè)備的錄入方向；B.利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像；C.利用矯正后的圖像進行圖像識別，得到最終的圖像識別結(jié)果。
[0007]根據(jù)本發(fā)明之一優(yōu)選實施例，所述步驟A具體包括:獲取所述采集設(shè)備在采集圖像時的橫滾角，并以所述橫滾角確定所述采集設(shè)備的錄入方向。
[0008]根據(jù)本發(fā)明之一優(yōu)選實施例，所述步驟B具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0009]根據(jù)本發(fā)明之一優(yōu)選實施例，所述步驟A具體包括:獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角，并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
[0010]根據(jù)本發(fā)明之一優(yōu)選實施例，所述步驟B具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)，并且，根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
[0011]根據(jù)本發(fā)明之一優(yōu)選實施例，所述步驟C具體包括:C1.對矯正前的圖像進行識另|J，得到第一識別結(jié)果；C2.對矯正后的圖像進行識別，得到第二識別結(jié)果；C3.根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果，并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。[0012]根據(jù)本發(fā)明之一優(yōu)選實施例，根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括:當(dāng)所述物體為文字時，確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y，并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果；或者，利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K，并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0013]根據(jù)本發(fā)明之一優(yōu)選實施例，根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括:確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N，并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0014]本發(fā)明還提供了一種圖像識別的系統(tǒng)，包括:圖像采集裝置，用于采集物體的圖像；方向獲取裝置，用于在所述圖像采集裝置采集物體的圖像時確定采集設(shè)備的錄入方向；矯正裝置，用于利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像；結(jié)果獲取裝置，用于利用矯正后的圖像進行圖像識別，得到最終的圖像識別結(jié)果。
[0015]根據(jù)本發(fā)明之一優(yōu)選實施例，所述方向獲取裝置確定采集設(shè)備的錄入方向的方式具體包括:獲取所述采集設(shè)備在采集圖像時的橫滾角，并以所述橫滾角確定所述采集設(shè)備的錄入方向。
[0016]根據(jù)本發(fā)明之一優(yōu)選實施例，所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0017]根據(jù)本發(fā)明之一優(yōu)選實施例，所述方向獲取裝置確定采集設(shè)備的錄入方向的具體方式包括:獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角，并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
[0018]根據(jù)本發(fā)明之一優(yōu)選實施例，所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括:根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)，并且，根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
[0019]根據(jù)本發(fā)明之一優(yōu)選實施例，所述結(jié)果獲取裝置包括:第一識別單元，用于對矯正前的圖像進行識別，得到第一識別結(jié)果；第二識別單元，用于對矯正后的圖像進行識別，得到第二識別結(jié)果；結(jié)果確定單元，用于根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果，并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
[0020]根據(jù)本發(fā)明之一優(yōu)選實施例，所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括:當(dāng)所述物體為文字時，確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y，并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果；或者，利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K，并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0021]根據(jù)本發(fā)明之一優(yōu)選實施例，所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括:確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N,并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0022]由以上技術(shù)方案可以看出，通過在采集圖像時，獲取采集設(shè)備的錄入方向，可以對采集到的圖像進行矯正，利用矯正后的圖像進行圖像識別，能夠為物體的圖像識別提供更多的數(shù)據(jù)參考，從而可以有效地減少由圖像拍攝角度導(dǎo)致的圖像識別錯誤，提高圖像識別的準(zhǔn)確度。
【【專利附圖】

【附圖說明】】
[0023]圖1為文字在角度一的情況下拍攝得到的圖像示意圖；
[0024]圖2為文字在角度二的情況下拍攝得到的圖像示意圖；
[0025]圖3為本發(fā)明中圖像識別的方法的流程示意圖；
[0026]圖4為本發(fā)明中采集設(shè)備的參考坐標(biāo)系的示意圖；
[0027]圖5為文字在角度三的情況下拍攝得到的圖像示意圖；
[0028]圖6為本發(fā)明中圖像識別的系統(tǒng)的結(jié)構(gòu)示意框圖；
[0029]圖7為本發(fā)明中結(jié)果獲取裝置的實施例的結(jié)構(gòu)示意框圖；
[0030]圖8為本發(fā)明中圖像識別的系統(tǒng)的一個分布示意圖；
[0031]圖9為本發(fā)明中圖像識別的系統(tǒng)的另一個分布示意圖。
【【具體實施方式】】
[0032]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚，下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述。
[0033]請參考圖3，圖3為本發(fā)明中圖像識別的方法的流程示意圖。如圖3所示，該方法包括:
[0034]步驟SlOl:在采集物體的圖像時確定采集設(shè)備的錄入方向。
[0035]步驟S102:利用采集設(shè)備的錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像。
[0036]步驟S103:利用矯正后的圖像進行圖像識別，得到最終的圖像識別結(jié)果。
[0037]下面對上述步驟進行詳細說明。
[0038]本發(fā)明中的圖像采集設(shè)備，包括各種能感知自身姿態(tài)變化的拍攝裝置，例如各種帶有陀螺儀的可拍照手機、平板或相機等設(shè)備。
[0039]根據(jù)陀螺儀的測量原理，能感知自身姿態(tài)變化的載體，在水平放置時，其前后方向、左右方向和上下方向相互垂直的軸分別構(gòu)成該載體的參考坐標(biāo)系，其前后方向形成的軸為橫滾軸，左右方向形成的軸為俯仰軸，上下方向形成的軸為航向軸。當(dāng)載體圍繞橫滾軸旋轉(zhuǎn)時，偏離橫滾軸的角度為橫滾角，圍繞俯仰軸旋轉(zhuǎn)時，偏離俯仰軸的角度為俯仰角，圍繞航向軸旋轉(zhuǎn)時，偏離航向軸的角度為航向角。
[0040]請參考圖4,圖4為本發(fā)明中采集設(shè)備的參考坐標(biāo)系的示意圖。步驟SlOl中，通過采集設(shè)備的姿態(tài)感知裝置，獲取到該采集設(shè)備在采集圖像時的橫滾角(即采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)形成的偏移角)、俯仰角(即采集設(shè)備圍繞俯仰軸旋轉(zhuǎn)形成的偏移角)和航向角(即采集設(shè)備圍繞航向角旋轉(zhuǎn)形成的偏移角)，由這三個角度，就可以確定采集設(shè)備的錄入方向了。
[0041]可以理解，將采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)前采集的圖像與采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)后采集到的圖像進行對比，后者的圖像相對前者，在平面內(nèi)發(fā)生了旋轉(zhuǎn)。請參考圖1和圖2，其中圖1為采集設(shè)備水平放置時(即圍繞橫滾軸、俯仰軸和航向軸的旋轉(zhuǎn)均為零時)，獲取到的圖像，圖2為采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)一定角度后進行圖像采集得到的圖像。與圖1相比，圖2中的圖像在平面內(nèi)旋轉(zhuǎn)了一定角度，根據(jù)成像原理可以知道，圖2中的圖像正是以和采集設(shè)備旋轉(zhuǎn)方向相反的方向旋轉(zhuǎn)了與采集設(shè)備相同的旋轉(zhuǎn)角度。因此，在步驟S102中，對采集到的圖像進行成像矯正的具體方式包括根據(jù)采集設(shè)備的橫滾角對采集到的圖像進行旋轉(zhuǎn)，從而使得由于采集設(shè)備傾斜造成的圖像傾斜得到矯正。例如設(shè)備的橫滾角為逆時針30度，則步驟S102中將采集到的圖像在平面內(nèi)逆時針旋轉(zhuǎn)30度。
[0042]另外，可以理解，將采集設(shè)備圍繞航向軸或俯仰軸旋轉(zhuǎn)，旋轉(zhuǎn)前采集的圖像與旋轉(zhuǎn)后采集到的圖像相比，前者的圖像顯示比例比后者要均勻。請參考圖1和圖5，其中圖5為采集設(shè)備圍繞航向軸旋轉(zhuǎn)一定角度時獲取到的圖像。從圖5可以看出，采集設(shè)備圍繞航向角進行旋轉(zhuǎn)后，得到的圖像的兩頭大小會發(fā)生改變，距離采集設(shè)備較近一頭的圖像會比距離采集設(shè)備較遠一頭的圖像大。同樣的道理，當(dāng)采集設(shè)備圍繞俯仰角進行旋轉(zhuǎn)后，也會出現(xiàn)圖像比例改變的情況，在此不再贅述。根據(jù)上述說明中的成像規(guī)律，本發(fā)明在步驟S103中，對采集到的圖像進行成像矯正的具體方式包括根據(jù)航向角或俯仰角對采集到的圖像進行縮放，具體地包括根據(jù)航向角或俯仰角的大小，成比例地對采集到的圖像兩頭分別進行縮放，該比例可預(yù)先通過試驗數(shù)據(jù)確定，在此不再詳述。
[0043]以上說明是以最優(yōu)實施方式對步驟SlOl和步驟S102進行介紹的。實際上可以看出，采集設(shè)備圍繞航向角和俯仰角旋轉(zhuǎn)而對圖像產(chǎn)生的影響并不顯著，作為一種較為簡單的實施方式，本發(fā)明也可以忽略采集設(shè)備的航向角和俯仰角對圖像造成的影響。這樣，在步驟SlOl中，也可以僅獲取采集設(shè)備在采集圖像時的橫滾角，并以該橫滾角確定采集設(shè)備的錄入方向，相應(yīng)地，步驟S102中對采集到的圖像進行成像矯正的具體方式就是根據(jù)采集設(shè)備的橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0044]值得注意的是，在前面的說明中，是以圖4所示的參考坐標(biāo)系來描述各個角度的，實際上，如果采集設(shè)備的參考坐標(biāo)系更改，例如更改了采集設(shè)備中陀螺儀的測量基準(zhǔn)，則更改前后，采集設(shè)備在同一姿態(tài)下得到的橫滾角、俯仰角或航向角的值是不相同的，但無論參考坐標(biāo)系如何設(shè)置，本發(fā)明均根據(jù)步驟SlOl中獲取的各個由參考坐標(biāo)系決定的角度來確定設(shè)備的錄入方向，并根據(jù)設(shè)備的錄入方向進行后續(xù)處理。
[0045]在得到矯正后的圖像后，步驟S103中就可以根據(jù)矯正后的圖像進行圖像識別。在一個實施例中，步驟S103中可以直接采用現(xiàn)有的圖像識別算法，對矯正后的圖像進行識另O，并將識別結(jié)果作為最終的圖像識別結(jié)果。
[0046]但是，在一些情況下，矯正后的圖像未必是最有利于圖像識別的圖像。例如物體以傾斜的方式放置，此時采集設(shè)備水平放置獲取的圖像并不利于進行圖像識別，反而將采集設(shè)備圍繞橫滾軸旋轉(zhuǎn)后獲取的圖像可能更利于圖像識別，也就是說，矯正后的圖像反而不利于進行圖像識別了。因此，優(yōu)選地，本發(fā)明還提供了步驟S103的另一種實施方式。在該實施方式中，具體地，步驟S103包括:
[0047]步驟S1031:對矯正前的圖像進行識別，得到第一識別結(jié)果。
[0048]步驟S1032:對矯正后的圖像進行識別，得到第二識別結(jié)果。
[0049]步驟S1033:根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果，并將最優(yōu)識別結(jié)果作為最終的識別結(jié)果。[0050]其中步驟S1031和步驟S1032中均可采用現(xiàn)有的圖像識別算法對輸入圖像進行識另IJ，分別得到第一識別結(jié)果和第二識別結(jié)果。
[0051]步驟S1033中根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果，可以有多種實施方式。其中，如果圖像中的物體為文字時，步驟S1033可按照下列方式實施:
[0052]確定第一識別結(jié)果包含的識別項數(shù)據(jù)X和第二識別結(jié)果包含的識別項數(shù)目Y，并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0053]識別項即識別出的文字，例如第一識別結(jié)果為“我愛北京天安門”，其包含的識別項數(shù)目X等于7，第二識別結(jié)果為“我北京天安門”，其包含的識別項Y等于6，由于X大于Y，則X對應(yīng)的“我愛北京天安門”就是最優(yōu)識別結(jié)果。
[0054]此外，如果圖像中的物體為文字時，步驟S1033還可以按照下列方式實施:
[0055]利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K，并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0056]語言模型是對大量的語料進行統(tǒng)計后得到的、用以確定文本的文法概率的模型。以二元統(tǒng)計語言模型為例，P (我愛北京天安門)=P (我)*P (愛I我)*P (北京I愛)*P (天安門北京)，其中P (我愛北京天安門)為文本“我愛北京天安門”的文法概率，P (我)為大規(guī)模語料庫中文本“我”的出現(xiàn)概率，P (愛I我)為大規(guī)模語料庫中文本“我”出現(xiàn)的條件下文本“愛”出現(xiàn)的概率，其余的概率含義與之類似。P (我)、p (愛I我)等概率均可從語言模型中查到，因此利用語言模型，即可確定文本“我愛北京天安門”的文法概率。
[0057]由于圖像識別中的錯誤，會造成文本的可讀性降低，文本的文法概率自然也會降低，因此通過本實施方式中的文法概率，可以很好地衡量圖像識別的效果。
[0058]對于包括文字識別在內(nèi)的一般的物體識別，例如人臉識別等，步驟S1033中根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果，還可以按照下列方式實施:
[0059]確定第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N，并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0060]在步驟S1031中對矯正前的圖像進行識別以及步驟S1032中對矯正后的圖像進行識別時，根據(jù)現(xiàn)有的圖像識別方法可知，圖像識別中會將待識別圖像的特征與已知特征進行比對，此時會產(chǎn)生一個匹配度，在本實施例中，將利用圖像識別中特征比對的匹配度來確定哪個識別結(jié)果更優(yōu)，很顯然，與已知特征相似度高的那個識別結(jié)果就是最優(yōu)識別結(jié)果。
[0061]此外，本發(fā)明在步驟S1033中，還可以根據(jù)第一識別結(jié)果和第二識別結(jié)果判斷圖像識別的滿意度，例如以文字識別為例，為識別結(jié)果的文法概率設(shè)置一個閾值，以此判斷第一識別結(jié)果和第二識別結(jié)果的識別效果，當(dāng)?shù)谝蛔R別結(jié)果和第二識別結(jié)果的文法概率均低于這個閾值時，確定第一識別結(jié)果和第二識別結(jié)果的滿意度不符合要求。此時，本發(fā)明還可以進一步對采集到的圖像進行二次矯正，如果在步驟SlOl中獲取到的采集設(shè)備的橫滾角不為零，則在二次矯正的過程中，將采集到的圖像在平面內(nèi)進行多個角度的旋轉(zhuǎn)嘗試，并在每個角度的旋轉(zhuǎn)嘗試下，進行一次圖像識別，將各識別結(jié)果中，文法概率最高的識別結(jié)果作為最優(yōu)識別結(jié)果。
[0062]值得說明的是，本發(fā)明中，步驟S102或步驟S103，既可在客戶端執(zhí)行，也可在服務(wù)器執(zhí)行。例如，客戶端(如可拍照的手機、平板或具有通訊功能的相機等)在獲取到采集設(shè)備的錄入方向后，將采集到的圖像和設(shè)備錄入方向發(fā)送至服務(wù)器，由服務(wù)器對采集到的圖像進行矯正和圖像識別，也可以在客戶端獲取到采集設(shè)備的錄入方向后，在本地對采集到的圖像進行矯正，并將相關(guān)數(shù)據(jù)發(fā)送至服務(wù)器，由服務(wù)器執(zhí)行步驟S103。
[0063]請參考圖6，圖6為本發(fā)明中圖像識別的系統(tǒng)的結(jié)構(gòu)示意框圖。如圖6所示，該系統(tǒng)包括:采集裝置201、方向確定裝置202、矯正裝置203及結(jié)果獲取裝置204。
[0064]其中采集裝置201，用于采集物體的圖像。
[0065]方向獲取裝置202，用于在圖像采集裝置采集物體的圖像時確定采集設(shè)備的錄入方向。
[0066]矯正裝置203，用于利用采集設(shè)備的錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像。
[0067]結(jié)果獲取裝置204，用于利用矯正后的圖像進行圖像識別，得到最終的識別結(jié)果。
[0068]根據(jù)一個實施例，方向獲取裝置202確定采集設(shè)備的錄入方向的方式具體包括:獲取采集設(shè)備在采集圖像時的橫滾角，并以該橫滾角確定采集設(shè)備的錄入方向。相應(yīng)地，矯正裝置203對采集到的圖像進行成像矯正的方式具體包括:根據(jù)上述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
[0069]根據(jù)另一個優(yōu)選實施例，方向獲取裝置202確定采集設(shè)備的錄入方向的方式具體包括:獲取采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角，并以該橫滾角、俯仰角和航向角確定采集設(shè)備的錄入方向。相應(yīng)地，矯正裝置203對采集到的圖像進行成像矯正的方式具體包括:根據(jù)上述橫滾角對采集到的圖像進行旋轉(zhuǎn)，并且，根據(jù)上述俯仰角和上述航向角對采集到的圖像進行縮放。
[0070]請參考圖7，圖7為本發(fā)明中結(jié)果獲取裝置的實施例的結(jié)構(gòu)示意框圖。如圖7所示，結(jié)果獲取裝置204包括:第一識別單元2041、第二識別單元2042以及結(jié)果確定單元2043。
[0071]其中，第一識別單元2041，用于對矯正前的圖像進行識別，得到第一識別結(jié)果。第二識別單元2042，用于對矯正后的圖像進行識別，得到第二識別結(jié)果。結(jié)果確定單元2043，用于根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果，并將最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
[0072]其中，第一識別單元2041和第二識別單元2042進行圖像識別，均可采用現(xiàn)有的圖像識別算法，在此不再贅述。
[0073]根據(jù)一個實施例，結(jié)果確定單元2043根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括:
[0074]當(dāng)圖像中的物體為文字時，確定第一識別結(jié)果包含的識別項數(shù)目X和第二識別結(jié)果包含的識別項數(shù)目Y，并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果；或者，利用預(yù)置的語言模型確定第一識別結(jié)果的文法概率J和第二識別結(jié)果的文法概率K，并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
[0075]根據(jù)另一個實施例，結(jié)果確定單元2043根據(jù)第一識別結(jié)果和第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式還可以是:
[0076]確定第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N，并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。[0077]實施本發(fā)明中的系統(tǒng)，可將各裝置均置于客戶端，也可僅將采集裝置201和方向確定裝置202置于客戶端，而將矯正裝置203和結(jié)果獲取裝置204置于服務(wù)器(請參考圖8)，或者將采集裝置201、方向確定裝置202和矯正裝置203置于客戶端，而將結(jié)果獲取裝置204置于服務(wù)器(請參考圖9)。在本領(lǐng)域技術(shù)人員可以想到的范圍內(nèi)，本發(fā)明對此不做限制。
[0078]以上所述僅為本發(fā)明的較佳實施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進等，均應(yīng)包含在本發(fā)明保護的范圍之內(nèi)。
【權(quán)利要求】
1.一種圖像識別的方法，包括: A.在采集物體的圖像時確定采集設(shè)備的錄入方向； B.利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像； C.利用矯正后的圖像進行圖像識別，得到最終的圖像識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟A具體包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角，并以所述橫滾角確定所述采集設(shè)備的錄入方向。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述步驟B具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟A具體包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角，并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述步驟B具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)，并且，根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟C具體包括: Cl.對矯正前的圖像進行識別，得到第一識別結(jié)果； C2.對矯正后的圖像進行識別，得到第二識別結(jié)果； C3.根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果，并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于，根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括: 當(dāng)所述物體為文字時，確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y，并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果；或者，利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K，并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
8.根據(jù)權(quán)利要求6所述的方法，其特征在于，根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的步驟具體包括: 確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N，并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
9.一種圖像識別的系統(tǒng)，包括: 圖像采集裝置，用于采集物體的圖像；方向獲取裝置，用于在所述圖像采集裝置采集物體的圖像時確定采集設(shè)備的錄入方向；矯正裝置，用于利用所述錄入方向?qū)Σ杉降膱D像進行成像矯正，得到矯正后的圖像；結(jié)果獲取裝置，用于利用矯正后的圖像進行圖像識別，得到最終的圖像識別結(jié)果。
10.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述方向獲取裝置確定采集設(shè)備的錄入方向的方式具體包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角，并以所述橫滾角確定所述采集設(shè)備的錄入方向。
11.根據(jù)權(quán)利要求10所述的系統(tǒng)，其特征在于，所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)。
12.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述方向獲取裝置確定采集設(shè)備的錄入方向的具體方式包括: 獲取所述采集設(shè)備在采集圖像時的橫滾角、俯仰角和航向角，并以所述橫滾角、所述俯仰角和所述航向角確定所述采集設(shè)備的錄入方向。
13.根據(jù)權(quán)利要求12所述的系統(tǒng)，其特征在于，所述矯正裝置對采集到的圖像進行成像矯正的方式具體包括: 根據(jù)所述橫滾角對采集到的圖像進行旋轉(zhuǎn)，并且，根據(jù)所述俯仰角和所述航向角對采集到的圖像進行縮放。
14.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述結(jié)果獲取裝置包括: 第一識別單元，用于對矯正前的圖像進行識別，得到第一識別結(jié)果；第二識別單元，用于對矯正后的圖像進行識別，得到第二識別結(jié)果；結(jié)果確定單元，用于根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果，并將所述最優(yōu)識別結(jié)果作為最終的圖像識別結(jié)果。
15.根據(jù)權(quán)利要求14所述的系統(tǒng)，其特征在于，所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括: 當(dāng)所述物體為文字時，確定所述第一識別結(jié)果包含的識別項數(shù)目X和所述第二識別結(jié)果包含的識別項數(shù)目Y，并取X和Y中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果；或者，利用預(yù)置的語言模型確定所述第一識別結(jié)果的文法概率J和所述第二識別結(jié)果的文法概率K，并取J和K中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
16.根據(jù)權(quán)利要求14所述的系統(tǒng)，其特征在于，所述結(jié)果確定單元根據(jù)所述第一識別結(jié)果和所述第二識別結(jié)果確定最優(yōu)識別結(jié)果的方式具體包括: 確定所述第一識別結(jié)果在圖像識別過程中與特征比對時的匹配度M和所述第二識別結(jié)果在圖像識別過程中與特征比對時的匹配度N，并取M和N中的較大值所對應(yīng)的識別結(jié)果為最優(yōu)識別結(jié)果。
【文檔編號】G06K9/00GK103593643SQ201210293317
【公開日】2014年2月19日申請日期:2012年8月16日優(yōu)先權(quán)日:2012年8月16日
【發(fā)明者】劉俊啟申請人:百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉俊啟
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
我是此專利的發(fā)明人

上一篇：一種可信行為識別的方法和裝置制造方法
上一篇：一種用于搜索結(jié)果排序的方法與設(shè)備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

圖像識別系統(tǒng)相關(guān)技術(shù)

智能圖像識別系統(tǒng)相關(guān)技術(shù)

圖像識別系統(tǒng)設(shè)計相關(guān)技術(shù)

圖像識別跟蹤系統(tǒng)相關(guān)技術(shù)

圖像識別系統(tǒng)架構(gòu)相關(guān)技術(shù)

ccd圖像識別系統(tǒng)相關(guān)技術(shù)

圖像識別與智能系統(tǒng)相關(guān)技術(shù)

圖像識別系統(tǒng)前景相關(guān)技術(shù)

三維圖像識別建模系統(tǒng)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種圖像識別的方法及系統(tǒng)的制作方法