一種信息輸入方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及到智能輸入技術(shù)領(lǐng)域,特別涉及到一種信息輸入方法及裝置。
【背景技術(shù)】
[0002]移動(dòng)終端(如手機(jī))具有大容量存儲(chǔ)空間、強(qiáng)大的處理能力,人們可通過(guò)該移動(dòng)終端打電話、發(fā)送短信、收發(fā)郵件、上網(wǎng)瀏覽等,當(dāng)人們需要輸入文字信息時(shí),一般都是通過(guò)拼音輸入法、五筆輸入法、手寫輸入法等類型。當(dāng)我們需要將大量紙質(zhì)文檔中的文字錄入到移動(dòng)終端時(shí),如果通過(guò)上述幾種輸入法進(jìn)行錄入,費(fèi)時(shí)又費(fèi)力。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的主要目的為提供一種信息輸入方法及裝置,旨在解決現(xiàn)有技術(shù)中在移動(dòng)終端錄入信息的費(fèi)時(shí)費(fèi)力的缺陷,實(shí)現(xiàn)信息的快速輸入。
[0004]本發(fā)明提供一種信息輸入方法,該方法包括:
[0005]通過(guò)圖像獲取模塊獲取圖像;
[0006]對(duì)獲取的圖像中的字符進(jìn)行切割處理;
[0007]對(duì)各個(gè)切割字符進(jìn)行文字識(shí)別,以識(shí)別出各個(gè)切割字符對(duì)應(yīng)的文字;
[0008]將識(shí)別的各個(gè)文字按對(duì)應(yīng)的切割字符在所述圖像的字符版面中的位置,進(jìn)行文字排版;
[0009]將排版后的文字按文字排版格式輸出到文本輸入框。
[0010]優(yōu)選地,所述對(duì)獲取的圖像中的字符進(jìn)行切割處理的步驟包括:
[0011]對(duì)獲取的圖像中的所有字符進(jìn)行切割處理;或者
[0012]提供選擇操作界面,供用戶在獲取的圖像中選擇待識(shí)別的圖像區(qū)域,鎖定用戶基于所述操作界面選擇的圖像區(qū)域,并對(duì)選擇的圖像區(qū)域中的字符進(jìn)行切割處理。
[0013]優(yōu)選地,所述對(duì)獲取的圖像中的字符進(jìn)行切割處理的步驟包括:
[0014]對(duì)獲取的圖像進(jìn)行二值化、傾斜校正、分段落分行及字符切割。
[0015]優(yōu)選地,所述鎖定用戶基于所述操作界面選擇的圖像區(qū)域的步驟包括:
[0016]A、獲取用戶在所述操作界面的第一選擇手勢(shì),所述第一選擇手勢(shì)為一條帶有預(yù)設(shè)寬度的直線,根據(jù)該第一選擇手勢(shì)將該帶有預(yù)設(shè)寬度的直線覆蓋的圖像區(qū)域鎖定為待識(shí)別的圖像區(qū)域;及/或
[0017]B、獲取用戶在所述操作界面的第二選擇手勢(shì),所述第二選擇手勢(shì)為兩條連續(xù)的直線,根據(jù)該第二選擇手勢(shì)中的兩條連續(xù)的直線鎖定一個(gè)平行四邊形區(qū)域作為待識(shí)別的圖像區(qū)域。
[0018]優(yōu)選地,所述將識(shí)別的各個(gè)文字按對(duì)應(yīng)的切割字符在所述圖像的字符版面中的位置,進(jìn)行文字排版;的步驟之后,該方法還包括:
[0019]將排版后的文字按文字排版格式傳送給終端。
[0020]本發(fā)明還提供一種信息輸入裝置,該裝置包括:
[0021]圖像獲取模塊,用于獲取圖像;
[0022]切割處理模塊,用于對(duì)獲取的圖像中的字符進(jìn)行切割處理;
[0023]OCR識(shí)別模塊,用于對(duì)各個(gè)切割字符進(jìn)行文字識(shí)別,以識(shí)別出各個(gè)切割字符對(duì)應(yīng)的文字;
[0024]排版模塊,用于將識(shí)別的各個(gè)文字按對(duì)應(yīng)的切割字符在所述圖像的字符版面中的位置,進(jìn)行文字排版;
[0025]輸入模塊,用于將排版后的文字按文字排版格式輸出到文本輸入框。
[0026]優(yōu)選地,所述切割處理模塊包括第一子切割處理單元或者第二子切割處理單元;
[0027]所述第一子切割處理單元,用于對(duì)獲取的圖像中的所有字符進(jìn)行切割處理;
[0028]所述第二子切割處理單元,用于提供選擇操作界面,供用戶在獲取的圖像中選擇待識(shí)別的圖像區(qū)域,鎖定用戶基于所述操作界面選擇的圖像區(qū)域,并對(duì)選擇的圖像區(qū)域中的字符進(jìn)行切割處理。
[0029]優(yōu)選地,所述切割處理模塊還用于對(duì)獲取的圖像進(jìn)行二值化、傾斜校正、分段落分行及字符切割。
[0030]優(yōu)選地,所述第二子切割處理單元包括:
[0031]提供單元,用于提供選擇操作界面,供用戶在獲取的圖像中選擇待識(shí)別的圖像區(qū)域;
[0032]鎖定單元,用于獲取用戶在所述操作界面的第一選擇手勢(shì),所述第一選擇手勢(shì)為一條帶有預(yù)設(shè)寬度的直線,根據(jù)該第一選擇手勢(shì)將該帶有預(yù)設(shè)寬度的直線覆蓋的圖像區(qū)域鎖定為待識(shí)別的圖像區(qū)域;及/或用于獲取用戶在所述操作界面的第二選擇手勢(shì),所述第二選擇手勢(shì)為兩條連續(xù)的直線,根據(jù)該第二選擇手勢(shì)中的兩條連續(xù)的直線鎖定一個(gè)平行四邊形區(qū)域作為待識(shí)別的圖像區(qū)域;
[0033]處理單元,用于對(duì)鎖定單元鎖定的待識(shí)別的圖像區(qū)域進(jìn)行切割處理。
[0034]優(yōu)選地,所述裝置還包括與所述排版模塊連接的輸出模塊,所述輸出模塊用于將排版后的文字按文字排版格式傳送給終端。
[0035]采用本發(fā)明實(shí)施例,可通過(guò)圖像獲取模塊獲取圖像;對(duì)獲取的圖像中的字符進(jìn)行切割處理;對(duì)各個(gè)切割字符進(jìn)行文字識(shí)別,以識(shí)別出各個(gè)切割字符對(duì)應(yīng)的文字;將識(shí)別的各個(gè)文字按對(duì)應(yīng)的切割字符在所述圖像的字符版面中的位置,進(jìn)行文字排版;將排版后的文字按文字排版格式輸出到文本輸入框??煞奖愕膶?shí)現(xiàn)信息輸入,省時(shí)省力,提高信息輸入效率。
【附圖說(shuō)明】
[0036]圖1為本發(fā)明的信息輸入方法的第一實(shí)施例流程示意圖;
[0037]圖2為本發(fā)明的信息輸入方法的第一實(shí)施例中的待識(shí)別區(qū)域的一示意圖;
[0038]圖3為本發(fā)明的信息輸入方法的第一實(shí)施例中的待識(shí)別區(qū)域的又一示意圖;
[0039]圖4為本發(fā)明的信息輸入方法的第二實(shí)施例流程示意圖;
[0040]圖5為本發(fā)明的信息輸入裝置的第一實(shí)施例結(jié)構(gòu)框圖;
[0041]圖6為本發(fā)明的信息輸入裝置的第二實(shí)施例結(jié)構(gòu)框圖。
[0042]本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說(shuō)明。
【具體實(shí)施方式】
[0043]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0044]參照?qǐng)D1,圖1為本發(fā)明的信息輸入方法的第一實(shí)施例流程示意圖,該方法包括:
[0045]S10、通過(guò)圖像獲取模塊獲取圖像。
[0046]該圖像獲取模塊可以是攝像頭,該攝像頭可以是數(shù)字?jǐn)z像頭和模擬攝像頭。當(dāng)用戶需要將外部的非計(jì)算機(jī)可識(shí)別信息變成計(jì)算機(jī)可識(shí)別信息時(shí)(如將紙質(zhì)文檔中的文字轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別信息),通過(guò)圖像獲取模塊獲取非計(jì)算機(jī)可識(shí)別信息的圖像,如通過(guò)攝像頭拍攝需要輸入信息所在紙的圖像。在該步驟中,還可對(duì)獲取的圖像進(jìn)行圖像清晰度判斷,如,用戶通過(guò)該圖像獲取模塊獲取圖像時(shí),由于手抖動(dòng)或被拍攝物體抖動(dòng),導(dǎo)致拍攝的圖像很模糊,達(dá)不到在后面步驟的文字識(shí)別要求;因此可先對(duì)獲取的圖像進(jìn)行圖像清晰度判斷,當(dāng)判斷結(jié)果為圖像的清晰度沒(méi)達(dá)到預(yù)設(shè)閥值時(shí),則提醒用戶重新通過(guò)圖像獲取模塊獲取圖像。在對(duì)獲取的圖形信息進(jìn)行圖像清晰度判斷時(shí),可利用圖像的平均邊緣強(qiáng)度作為檢測(cè)值,當(dāng)平均邊緣強(qiáng)度小于預(yù)設(shè)邊緣強(qiáng)度閥值時(shí),則認(rèn)為拍攝的圖像模糊,當(dāng)平均邊緣強(qiáng)度大于或等于預(yù)設(shè)邊緣強(qiáng)度閥值時(shí),則認(rèn)為拍攝的圖像清楚。該平均邊緣強(qiáng)度是指由邊緣算法(如Sobel算法等)獲得。
[0047]S20、對(duì)獲取的圖像中的字符進(jìn)行切割處理。
[0048]在該步驟S20中,對(duì)獲取的圖像中的字符進(jìn)行切割處理,具體的,可先對(duì)獲取的圖像進(jìn)行前景色噪聲過(guò)濾及背景色噪聲過(guò)濾,然后對(duì)噪聲過(guò)濾后的圖像進(jìn)行二值化、傾斜校正、分段落分行、字符切割。其中,二值化就是將圖像上的像素點(diǎn)的灰度值設(shè)置為O或255,也就是將整個(gè)圖像呈現(xiàn)出明顯的只有黑和白的視覺(jué)效果;傾斜校正,是對(duì)圖像中的傾斜內(nèi)容進(jìn)行校正(在通過(guò)圖像獲取模塊獲取圖像時(shí),當(dāng)被拍攝物傾斜放置時(shí),將使得獲得的內(nèi)容傾斜),可預(yù)先設(shè)置一個(gè)水平基準(zhǔn)線,再判斷該圖像邊緣(可通過(guò)圖像邊緣檢測(cè)檢測(cè)出圖像邊緣,如通過(guò)以下步驟檢測(cè)圖像邊緣:1、濾波:邊緣檢測(cè)主要基于導(dǎo)數(shù)計(jì)算,但受噪聲影響,但濾波器在降低噪聲的同時(shí)也導(dǎo)致邊緣強(qiáng)度的損失;2、增強(qiáng):增強(qiáng)算法將領(lǐng)域中灰度有顯著變化的點(diǎn)突出顯示。一般通過(guò)計(jì)算梯度幅值完成;3、檢測(cè):但在有些圖像中梯度幅值較大的并不是邊緣點(diǎn);4、定位:精確確定邊緣的位置。)與該水平基準(zhǔn)線的夾角值,當(dāng)該夾角值大于預(yù)設(shè)的傾斜角度值時(shí),認(rèn)為該圖像傾斜,則對(duì)該圖像進(jìn)行傾斜校正,以使得該圖像邊緣與水平基準(zhǔn)線的夾角值小于或等于預(yù)設(shè)的傾斜角度值,當(dāng)該夾角值小于或等于預(yù)設(shè)的傾斜角度值時(shí),認(rèn)為該圖像不傾斜,不需要進(jìn)行傾斜校正;分段落分行,對(duì)圖像中的文檔圖片先進(jìn)行分段落在分行即進(jìn)行版面分析。
[0049]S30、對(duì)各個(gè)切割字符進(jìn)行文字識(shí)別,以識(shí)別出各個(gè)切割字符對(duì)應(yīng)的文字。
[0050]在該步驟S30中,對(duì)各個(gè)切割字符進(jìn)行文字識(shí)別,以識(shí)別出各個(gè)切割字符對(duì)應(yīng)的文字,具體的,可通過(guò)預(yù)設(shè)的字符庫(kù)與算法對(duì)各個(gè)切割字符進(jìn)行識(shí)別,以識(shí)別出各個(gè)切割字符對(duì)應(yīng)的文字。在該步驟中,可采用微軟公司提供的OCR引擎進(jìn)行文字識(shí)別,它是一個(gè)公開的編程接口。
當(dāng)前第1頁(yè)
1 
2 
3