專利名稱:基于三軸加速計的掃描識別裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及一種基于三軸加速計的掃描識別裝置和方法。
背景技術(shù):
電子掃描筆(簡稱掃描筆)是OCR的重要應(yīng)用之一。掃描筆的光學(xué)攝像頭按照一定頻率對被掃描資料進(jìn)行連續(xù)拍照,獲取被掃描資料的圖像幀序列,然后將圖像幀序列拼接成一幅全景圖像后進(jìn)行OCR處理。用戶在使用掃描筆掃描時,其掃描速度是變化的,一種典型的使用方式是,在剛剛開始掃描時,掃描筆的掃描速度從零開始逐漸增大,然后達(dá)到一個速度峰值,此后速度逐漸下降,直到掃描結(jié)束,在保證速度峰值時相鄰圖像幀之間有一定重疊內(nèi)容的情況下,掃描速度越低,相鄰圖像幀之間的重疊內(nèi)容越多,換言之,當(dāng)掃描速度較小時,當(dāng)前圖像幀不但與其前一圖像幀有重疊內(nèi)容,而且很可能與其前一幀之前的一個或多個圖像幀也有一定的重疊內(nèi)容,當(dāng)掃描速度很小時,當(dāng)前圖像幀一定與其前一幀之前的一個或多個圖像幀有一定的重疊內(nèi)容。另外,隨著硬件技術(shù)的提高,為了提高掃描筆支持的掃描速度峰值,提高用戶的使用感受,可以使用更高采樣頻率的光學(xué)傳感器。在當(dāng)前圖像幀與其前一幀之前的一個或多個圖像幀也有一定的重疊內(nèi)容時,特別是對于尺寸較大的圖像,每兩幀相鄰的圖像幀進(jìn)行配準(zhǔn)拼接的過程中,需要進(jìn)行大量計算,占用了硬件資源,降低了整個圖像幀序列的拼接速度。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種基于三軸加速計的掃描識別裝置和方法,通過三軸加速計對間隔固定位移的圖像幀進(jìn)行下采樣,對得到的采樣幀根據(jù)重疊內(nèi)容進(jìn)行拼接,降低了控制模塊的處理負(fù)荷,提高了整個圖像幀序列的拼接速度。本發(fā)明公開了一種基于三軸加速計的掃描識別裝置,包括
光學(xué)傳感器用于對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列; 所述圖像幀序列中每幀圖像的內(nèi)容與前一幀圖像的內(nèi)容部分重疊; 三軸加速計用于測量圖像幀序列中的圖像幀之間的相對位移; 控制模塊根據(jù)三軸加速計測量得到的相對位移對圖像幀序列進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對得到的各采樣幀進(jìn)行拼接,并對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。所述控制模塊將圖像幀序列中首幀圖像作為第一采樣幀。所述控制模塊包括
采樣單元,檢測所述第一采樣幀后的每一圖像幀與第一采樣幀的相對位移,取相對位移小于既定位移的最后一幀圖像作為第二采樣幀;拼接單元計算第二采樣幀與第一采樣幀的拼接信息,并將第一采樣幀更新為第二采樣幀,然后返回采樣單元,直至圖像幀序列中所有圖像幀下采樣完畢,根據(jù)所有采樣幀的拼接信息進(jìn)行拼接,得到全景圖像;所述拼接信息包括拼接方向、水平拼接位移和豎直拼接位移;
識別單元,對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。所述拼接單元計算第二采樣幀與第一采樣幀的拼接信息時,在以三軸加速計測量得到的相鄰采樣幀之間的相對位移為中心的既定窗口中搜索,計算相鄰采樣幀的拼接信肩、ο所述控制模塊將圖像幀序列中末幀圖像作為第二采樣幀。本發(fā)明還公開了一種基于三軸加速計的掃描識別方法,包括如下步驟
步驟一,對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列,并利用三軸加速計同步測量圖像幀序列中圖像幀之間的相對位移;所述圖像幀序列中每幀圖像的內(nèi)容與前一幀圖像的內(nèi)容部分重疊;
步驟二,根據(jù)三軸加速計測量得到的圖像幀序列中的圖像幀之間的相對位移對圖像幀序列進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對得到的各采樣幀進(jìn)行拼接;
步驟三,對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。所述步驟二中,將圖像幀序列中首幀圖像作為第一采樣幀。所述步驟二包括
步驟a,檢測所述第一采樣幀后的每一圖像幀與第一采樣幀的相對位移,取相對位移小于既定位移的最后一幀圖像作為第二采樣幀;
步驟b,計算第二采樣幀與第一采樣幀的拼接信息,然后將第一采樣幀更新為第二采樣幀,返回步驟a,直至圖像幀序列中所有圖像幀下采樣完畢,根據(jù)所有采樣幀的拼接信息進(jìn)行拼接,得到全景圖像。所述步驟二中對得到的各采樣幀進(jìn)行拼接時,在以三軸加速計測量得到的相鄰采樣幀之間的相對位移為中心的既定窗口中搜索,計算相鄰采樣幀的拼接信息。
所述步驟二還包括將圖像幀序列中末幀圖像作為第二采樣幀。所述拼接信息包括拼接方向、水平拼接位移和豎直拼接位移。本發(fā)明公開的一種基于三軸加速計的掃描識別裝置和方法,通過三軸加速計測量圖像幀之間的位移,特別是對于尺寸較大的圖像,避免了利用圖像重疊性計算位移的大量計算,大大降低了控制模塊的負(fù)荷;利用三軸加速計測量相鄰圖像幀之間的位移,對圖像幀序列進(jìn)行準(zhǔn)確下采樣,避免了基于預(yù)測的下采樣方法中的由于預(yù)測誤差導(dǎo)致的下采樣失敗,同時大大提高了拼接速度,實(shí)現(xiàn)了高精度配準(zhǔn)。
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明基于三軸加速計的掃描識別裝置的示意圖; 圖2為本發(fā)明基于三軸加速計的掃描識別裝置的結(jié)構(gòu)框圖; 圖3為本發(fā)明基于三軸加速計的掃描識別方法的流程圖4為本發(fā)明基于三軸加速計的掃描識別方法中步驟二的流程圖5為本發(fā)明基于三軸加速計的掃描識別方法中采樣幀和跳過幀的示意圖6為本發(fā)明基于三軸加速計的掃描識別方法實(shí)施例中各圖像幀及相關(guān)數(shù)據(jù)的示意
圖7為本發(fā)明基于三軸加速計的掃描識別方法的實(shí)施例中全景二值圖像; 圖8為本發(fā)明基于三軸加速計的掃描識別方法的實(shí)施例中傾斜校正后的全景二值圖像。圖中1、殼體 2、控制模塊 3、電路板 4、電池 5、光學(xué)傳感器 6、按鍵 7、存儲模塊 8、液晶屏9、USB模塊 10、顯示單元11、TTS模塊 12、三軸加速計 13、鏡頭組 14、照明單元。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明公開了一種基于三軸加速計的掃描識別裝置,如圖1、圖2所示,包括如下組件用于封裝并固定裝置組件的殼體1,用于圖像處理及字符識別的控制模塊2,用于集成組件的電路板3,用于為裝置各組件供電的電池4,用于對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列的光學(xué)傳感器5,用于觸發(fā)采集操作的按鍵6,用于裝載字符識別引擎的存儲模塊7,用于顯示輸出信息的液晶屏8,用于連接計算機(jī)的USB模塊9,用于驅(qū)動液晶屏8的顯示單元10,用于輸出語音的TTS模塊11和用于測量圖像幀序列中的圖像幀之間的相對位移的三軸加速計12。電路板3集成光學(xué)傳感器5、存儲模塊7、控制模塊2、顯示單元10、TTS模塊11、 USB模塊9和三軸加速計12。殼體1封裝液晶屏8、電池4、按鍵6和電路板3。按鍵6與電路板3上的光學(xué)傳感器5連接,將控制信號發(fā)送到光學(xué)傳感器5。光學(xué)傳感器5對被掃描字符進(jìn)行連續(xù)高速拍攝以得到含有被掃描字符的圖像幀序列,所述圖像幀序列中相鄰圖像幀內(nèi)容部分重疊;控制模塊2根據(jù)相對位移對圖像幀序列進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對下采樣后得到的各采樣幀進(jìn)行拼接,對拼接得到的全景圖像傾斜校正后進(jìn)行字符識別,得到被掃描字符的字符編碼。如圖2所示,電路板3集成控制模塊2、存儲模塊7、光學(xué)傳感器5、顯示單元10、TTS 模塊11、USB模塊9和三軸加速計12??刂颇K2分別連接存儲模塊7、光學(xué)傳感器5、顯示單元10、TTS模塊11和三軸加速計12。在控制模塊2的控制下,用戶通過按鍵6觸發(fā), 將控制信號發(fā)送到光學(xué)傳感器5,光學(xué)傳感器5進(jìn)行圖像信息采集,得到圖像幀序列,三軸加速計12檢測圖像幀序列中的圖像幀之間的相對位移,控制模塊2根據(jù)相對位移對圖像幀序列,即對間隔固定位移的圖像幀進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對下采樣后得到的各采樣幀進(jìn)行拼接,并對拼接得到的全景圖像傾斜校正后調(diào)用存儲模塊7中的識別引擎進(jìn)行字符識別,將識別后形成的被掃描字符的字符編碼在存儲模塊7中進(jìn)行存儲。顯示單元10可調(diào)用存儲在存儲模塊7中識別出的待掃描字符在液晶屏8上進(jìn)行顯示,控制模塊2可根據(jù)控制信號將被掃描字符的字符編碼發(fā)送到TTS模塊11,由TTS模塊11輸出語音。如圖1所示,本發(fā)明還包括,用于攝取圖像信息的鏡頭組13 ;用于照明待掃描字符的照明單元14。所述鏡頭組13的焦距為5至7mm,光圈10以上,保證了鏡頭組13達(dá)到的景深為30至50mm,可以有效的將文字信息進(jìn)行掃描,保證了良好的應(yīng)用效果。當(dāng)用戶進(jìn)行掃描時,照明單元14處于開啟狀態(tài),照明單元14發(fā)出光束并在被掃描字符上形成光斑,同時鏡頭組13將照明單元14定位的圖像信息攝取到集成于電路板3上的光學(xué)傳感器5上, 光學(xué)傳感器5對被掃描字符進(jìn)行連續(xù)拍攝,得到含有被掃描字符的圖像幀序列,所述圖像幀序列中相鄰圖像幀內(nèi)容部分重疊。三軸加速計12測量圖像幀序列中的圖像幀之間的相對位移,控制模塊2根據(jù)掃描速度對圖像幀序列進(jìn)行下采樣??刂颇K包括拼接單元、采樣單元和識別單元。采樣單元,檢測所述第一采樣幀后的每一圖像幀與第一采樣幀的相對位移,取相對位移小于既定位移的最后一幀圖像作為第二采樣幀;
拼接單元計算第二采樣幀與第一采樣幀的拼接信息,將拼接信息保存,并將第一采樣幀更新為第二采樣幀,然后返回采樣單元,直至圖像幀序列中所有圖像幀下采樣完畢,根據(jù)所有采樣幀的拼接信息進(jìn)行拼接,得到全景圖像;所述拼接信息包括拼接方向、水平拼接位移和豎直拼接位移;
識別單元,對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。拼接單元計算第二采樣幀與第一采樣幀的拼接信息時,根據(jù)三軸加速計測量得到的相鄰采樣幀之間的相對位移在既定窗口中對采樣幀進(jìn)行配準(zhǔn),利用配準(zhǔn)所得的拼接信息對采樣幀進(jìn)行拼接??刂颇K將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對下采樣后得到的各采樣幀進(jìn)行拼接,將拼接得到的全景圖像傾斜校正后進(jìn)行字符識別,得到被掃描字符的字符編碼并存儲到存儲模塊中。本發(fā)明還公開了一種基于三軸加速計的掃描識別方法,如圖3所示,包括如下步驟
步驟一,對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列,并利用三軸加速計同步測量圖像幀序列中圖像幀之間的相對位移;所述圖像幀序列中相鄰圖像幀內(nèi)容部分重疊;
采用本發(fā)明所述裝置掃描待掃描字符時,控制模塊2將控制信號發(fā)送到光學(xué)傳感器5 和三軸加速計12,在掃描待掃描字符時,光學(xué)傳感器5同步對文本頁中的被掃描字符進(jìn)行連續(xù)拍攝,以得到含有被掃描字符的圖像幀序列,圖像序列中相鄰圖像幀的內(nèi)容部分重疊, 同時通過三軸加速計測量圖像幀之間的相對位移。 步驟二,根據(jù)三軸加速計測量得到的圖像幀序列中的圖像幀之間的相對位移對圖像幀序列進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,
7對得到的各采樣幀進(jìn)行拼接。如圖4所示,步驟二包括如下步驟
步驟a,檢測所述第一采樣幀后的每一圖像幀與第一采樣幀的相對位移,取相對位移小于既定位移的最后一幀圖像作為第二采樣幀;
掃描識別裝置獲取的整個圖像幀序列被劃分為跳過幀和采樣幀,對圖像幀序列的第一幀進(jìn)行特殊處理,即將圖像幀序列中首幀圖像作為第一采樣幀,與第一采樣幀的相對位移小于既定位移的最后一幀圖像作為第二采樣幀。如圖5所示,其第一幀作為第一采樣幀,與第一采樣幀對應(yīng)的跳過幀的數(shù)目根據(jù)三軸加速計檢測到的圖像幀之間的相對位移確定,與第一采樣幀間隔的相對位移小于既定位移D的最后一幀圖像作為第二采樣幀,第二采樣幀與第一采樣幀之間的跳過幀數(shù)目可以為多幀,也可以為0。本實(shí)施例中相關(guān)的各圖像幀如圖6所示,具體包括圖像幀序號、圖像幀、三軸加速計測得的水平拼接位移、三軸加速計測得的豎直拼接位移、三軸加速計測得的拼接方向及幀屬性。其中,水平拼接位移和豎直拼接位移合成后得到兩圖像幀的相對位移。拼接方向共有四個取值,分別為右下、右上、左下、左上,幀屬性有兩個取值,分別為采樣幀和跳過幀, 對圖像幀中的采樣幀進(jìn)行拼接,對跳過幀直接不作處理。在本實(shí)施例中,各圖像幀的大小為 120X80,下采樣頻率為120幀/秒。在本實(shí)施例中,為方便敘述,圖像幀序號為X的圖像幀稱為第X圖像幀。在本實(shí)施例中,如圖6所示的圖像幀序號為1的圖像幀為本實(shí)施例中圖像幀序列的第一幀。將圖像幀序列中首幀圖像作為第一采樣幀,由于本實(shí)施例中中,圖像序列為從左向右掃描獲得,故只通過水平方向位移來進(jìn)行采樣,既定位移設(shè)為40,即將與第一采樣幀的相對位移小于40的最后一幀圖像作為第二采樣幀。第11幀圖像相對于第1幀圖像的水平位移為39,豎直位移為2,位移方向?yàn)橛蚁?,?2幀圖像相對于第1幀圖像的水平位移為 44,豎直位移為1,位移方向?yàn)橛蚁?,則由于第11圖像幀為與第1圖像幀的相對位移小于既定位移40的最后一幀圖像,故以第11圖像幀為第二采樣幀,序號為2至10的圖像幀為跳過幀,二者之間的水平位移為39,豎直位移為2,位移方向?yàn)橛蚁?。步驟b,計算第二采樣幀與第一采樣幀的拼接信息,然后將第一采樣幀更新為第二采樣幀,返回步驟a,直至圖像幀序列中所有圖像幀下采樣完畢,根據(jù)所有采樣幀的拼接信息進(jìn)行拼接,得到全景圖像。所述拼接信息包括拼接方向、水平拼接位移和豎直拼接位移。由于通過三軸加速計測量得到的相鄰采樣幀之間的拼接位移可能存在一定偏差, 為了得到精確的拼接信息,在對得到的各采樣幀進(jìn)行拼接時,在以三軸加速計測量得到的相鄰采樣幀之間的相對位移為中心的既定窗口中對采樣幀進(jìn)行配準(zhǔn),具體為在第二采樣幀和第一采樣幀中選取參考點(diǎn),并在第一采樣幀中以第二采樣幀和第一采樣幀的相對位移為中心取既定窗口,將第二采樣幀在既定窗口中逐像素點(diǎn)進(jìn)行配準(zhǔn),計算既定窗口內(nèi)各像素點(diǎn)對應(yīng)的拼接系數(shù),將拼接系數(shù)的最大值對應(yīng)的像素點(diǎn)處的拼接信息作為第二采樣幀相對于第一采樣幀的拼接信息。拼接系數(shù)即為二值化后的兩圖像幀在重疊區(qū)域中重合的黑像素點(diǎn)數(shù)目除以重疊區(qū)域中黑像素點(diǎn)總數(shù)的值。本實(shí)施例中,根據(jù)三軸加速計測量得到的第11幀圖像相對于第 1幀圖像的水平位移為39,豎直位移為2,位移方向?yàn)橛蚁拢韵鄬τ诘?幀圖像的水平位移為39,豎直位移為2的對應(yīng)坐標(biāo)點(diǎn)為中心點(diǎn),在11 X 11的既定窗口中搜索,計算既定窗口中的各像素點(diǎn)的拼接系數(shù),得到拼接系數(shù)的最大值為0. 8704,則將該點(diǎn)對應(yīng)的拼接信息,即水平位移42、豎直位移3及位移方向右下,作為第二采樣幀相對于第一采樣幀的拼接信息,然后返回步驟a;直至圖像幀序列中所有圖像幀下采樣完畢,特別的,圖像序列中的末幀圖像作為第二采樣幀。最后,根據(jù)圖像序列中所有采樣幀的拼接信息拼接得到全景圖像,本實(shí)施例中,最終獲取的全景二值圖像如圖7所示。步驟三,對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。控制模塊調(diào)用存儲模塊中的字符識別引擎對拼接得到的全景圖像進(jìn)行識別,在字符識別之前首先對拼接得到的全景圖像進(jìn)行傾斜校正,如圖8所示,將全景圖像中的各字符形成水平文字行后再調(diào)用字符識別引擎進(jìn)行識別,得到被掃描字符的字符編碼。識別后形成的被掃描字符的字符編碼在存儲模塊中進(jìn)行存儲。顯示單元可調(diào)用存儲在存儲模塊中識別出的待掃描字符在液晶屏上進(jìn)行顯示,控制模塊可根據(jù)控制信號將被掃描字符的字符編碼發(fā)送到TTS模塊,由TTS模塊輸出語音。本發(fā)明公開了一種基于三軸加速計的掃描識別裝置和方法,通過三軸加速計測量圖像幀之間的相對位移,特別是對于尺寸較大的圖像,避免了利用圖像重疊性計算位移的大量計算,大大降低了控制模塊的負(fù)荷;利用三軸加速計測量相鄰圖像幀之間的位移,對圖像幀序列進(jìn)行準(zhǔn)確下采樣,避免了基于預(yù)測的下采樣方法中的由于預(yù)測誤差導(dǎo)致的下采樣失敗,同時大大提高裝置的拼接速度,實(shí)現(xiàn)了高精度配準(zhǔn)。以上對本發(fā)明所提供的一種基于三軸加速計的掃描識別裝置和方法,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種基于三軸加速計的掃描識別裝置,其特征在于,包括光學(xué)傳感器用于對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列, 所述圖像幀序列中每幀圖像的內(nèi)容與前一幀圖像的內(nèi)容部分重疊; 三軸加速計用于測量圖像幀序列中的圖像幀之間的相對位移; 控制模塊根據(jù)三軸加速計測量得到的相對位移對圖像幀序列進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對得到的各采樣幀進(jìn)行拼接,并對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于所述控制模塊將圖像幀序列中首幀圖像作為第一采樣幀。
3.根據(jù)權(quán)利要求2所述的裝置,其特征在于所述控制模塊包括采樣單元,檢測所述第一采樣幀后的每一圖像幀與第一采樣幀的相對位移,取相對位移小于既定位移的最后一幀圖像作為第二采樣幀;拼接單元計算第二采樣幀與第一采樣幀的拼接信息,并將第一采樣幀更新為第二采樣幀,然后返回采樣單元,直至圖像幀序列中所有圖像幀下采樣完畢,根據(jù)所有采樣幀的拼接信息進(jìn)行拼接,得到全景圖像;所述拼接信息包括拼接方向、水平拼接位移和豎直拼接位移;識別單元,對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。
4.根據(jù)權(quán)利要求3所述的裝置,其特征在于所述拼接單元計算第二采樣幀與第一采樣幀的拼接信息時,在以三軸加速計測量得到的相鄰采樣幀之間的相對位移為中心的既定窗口中搜索,計算相鄰采樣幀的拼接信息。
5.根據(jù)權(quán)利要求3所述的裝置,其特征在于所述控制模塊將圖像幀序列中末幀圖像作為第二采樣幀。
6.一種基于三軸加速計的掃描識別方法,其特征在于,包括如下步驟步驟一,對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列,并利用三軸加速計同步測量圖像幀序列中圖像幀之間的相對位移;所述圖像幀序列中每幀圖像的內(nèi)容與前一幀圖像的內(nèi)容部分重疊;步驟二,根據(jù)三軸加速計測量得到的圖像幀序列中的圖像幀之間的相對位移對圖像幀序列進(jìn)行下采樣,將被下采樣的圖像幀作為采樣幀,未被下采樣的圖像幀作為跳過幀,對得到的各采樣幀進(jìn)行拼接;步驟三,對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于所述步驟二中,將圖像幀序列中首幀圖像作為第一采樣幀。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于所述步驟二包括步驟a,檢測所述第一采樣幀后的每一圖像幀與第一采樣幀的相對位移,取相對位移小于既定位移的最后一幀圖像作為第二采樣幀;步驟b,計算第二采樣幀與第一采樣幀的拼接信息,然后將第一采樣幀更新為第二采樣幀,返回步驟a,直至圖像幀序列中所有圖像幀下采樣完畢,根據(jù)所有采樣幀的拼接信息進(jìn)行拼接,得到全景圖像。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于所述步驟二中對得到的各采樣幀進(jìn)行拼接時,在以三軸加速計測量得到的相鄰采樣幀之間的相對位移為中心的既定窗口中搜索, 計算相鄰采樣幀的拼接信息。
10.根據(jù)權(quán)利要求7所述的方法,其特征在于所述步驟二還包括將圖像幀序列中末幀圖像作為第二采樣幀。
11.根據(jù)權(quán)利要求8所述的方法,其特征在于所述拼接信息包括拼接方向、水平拼接位移和豎直拼接位移。
全文摘要
本發(fā)明公開了一種基于三軸加速計的掃描識別裝置和方法,涉及圖像處理領(lǐng)域。裝置包括光學(xué)傳感器,用于對被掃描字符進(jìn)行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列;三軸加速計,用于測量圖像幀序列中的圖像幀之間的相對位移;控制模塊,根據(jù)三軸加速計得到的相對位移對圖像幀序列進(jìn)行下采樣,對得到的各采樣幀進(jìn)行拼接,并對拼接得到的全景圖像進(jìn)行字符識別,得到被掃描字符的字符編碼。本發(fā)明通過三軸加速計測量相鄰圖像幀之間的位移,并據(jù)之對圖像幀序列進(jìn)行準(zhǔn)確下采樣,在既定窗口中搜索計算相鄰采樣幀圖像的拼接信息,避免了圖像幀間、特別是大尺寸圖像幀間的大量計算,大大降低了控制模塊的負(fù)荷,同時提高了拼接速度,實(shí)現(xiàn)了高精度配準(zhǔn)。
文檔編號G06K9/20GK102393903SQ20111019966
公開日2012年3月28日 申請日期2011年7月15日 優(yōu)先權(quán)日2011年7月15日
發(fā)明者李永彬 申請人:漢王科技股份有限公司