專利名稱:一種手寫識(shí)別方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及識(shí)別處理技術(shù)領(lǐng)域,更具體地說,涉及一種手寫識(shí)別方法和裝置。
背景技術(shù):
經(jīng)過多年的技術(shù)發(fā)展,手寫輸入作為一種重要的非鍵盤輸入方法已經(jīng)步入實(shí)用階 段,廣泛應(yīng)用于手機(jī)、筆記本電腦、iPad等設(shè)備。采用手寫輸入方式進(jìn)行信息數(shù)據(jù)輸入時(shí), 準(zhǔn)確判斷字符結(jié)束是實(shí)現(xiàn)信息數(shù)據(jù)正確輸入的關(guān)鍵。近年來,隨著識(shí)別技術(shù)的發(fā)展,手寫識(shí)別業(yè)內(nèi)提出了多種多筆劃字符結(jié)束判斷的 方案,比較常見的有如下幾種(1)使用雙格/多格輸入。通常,書寫區(qū)域有兩個(gè)或多個(gè)書寫窗口,用戶可以在雙 格/多格中交替輸入孤立字符,實(shí)現(xiàn)單字連續(xù)整句錄入。這種通過確定的界面來分隔孤立 字的方式可以高效可靠性判定單個(gè)字符的結(jié)束,因而成為當(dāng)前的手寫識(shí)別應(yīng)用市場(chǎng)上的一 種主流輸入方式。但是,這種輸入方式限定在特定的手寫框中精確定位,給喜歡自然流暢手 寫輸入的用戶帶來了不便。(2)引入特定的標(biāo)志符來標(biāo)定單字符輸入的結(jié)束,如可以被簡(jiǎn)單算法檢測(cè)到的手 勢(shì)符號(hào)。顯然,標(biāo)志符的增加會(huì)帶來混淆字識(shí)別難度,同時(shí),系統(tǒng)需要實(shí)時(shí)監(jiān)測(cè)標(biāo)志符,將對(duì) 識(shí)別率和識(shí)別效率帶來一定影響。(3)設(shè)置抬筆輪候時(shí)間。所謂抬筆輪候是指用戶在寫完一個(gè)孤立字符后,有意識(shí)的 抬筆讓筆端離開觸摸屏,直至界面清屏準(zhǔn)備接受下個(gè)字符。智能的抬筆輪候時(shí)間的設(shè)置機(jī) 制對(duì)提高系統(tǒng)性能,改善用戶體驗(yàn)起著至關(guān)重要的作用。如果抬筆輪候時(shí)間過早判定字符 錄入的結(jié)束而啟動(dòng)識(shí)別引擎,必將帶來識(shí)別率的降低。反之,雖然能較好可靠的保證單字結(jié) 束,但需要考驗(yàn)用戶的耐心,花費(fèi)較長(zhǎng)的等候時(shí)間。目前,最常用的設(shè)有抬筆輪候時(shí)間的單字連續(xù)輸入識(shí)別系統(tǒng)中,設(shè)置有抬筆輪候 時(shí)間累計(jì)器,該抬筆輪候時(shí)間累計(jì)器設(shè)置有一時(shí)間閾值。如果當(dāng)前抬筆輪候時(shí)間超過該時(shí) 間閾值,則確定當(dāng)前的字符書寫完畢,啟動(dòng)識(shí)別引擎對(duì)當(dāng)前字符進(jìn)行識(shí)別。然而,通過發(fā)明人的研究發(fā)現(xiàn),現(xiàn)有技術(shù)中的設(shè)有抬筆輪候時(shí)間的單字連續(xù)輸入 識(shí)別系統(tǒng)中仍然存在以下問題不同用戶適用于不同的抬筆輪候時(shí)間。比如年長(zhǎng)用戶更期望較長(zhǎng)的抬筆輪候時(shí) 間,而年輕用戶適用短暫的抬筆輪候時(shí)間??梢?,現(xiàn)有技術(shù)無法適應(yīng)所有用戶的書寫習(xí)慣, 容易產(chǎn)生錯(cuò)誤的字符結(jié)束判斷結(jié)果,從而導(dǎo)致字符識(shí)別效率低下。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種手寫識(shí)別方法和裝置,以實(shí)現(xiàn)對(duì)用戶書寫習(xí)慣 的不斷監(jiān)測(cè)學(xué)習(xí),實(shí)時(shí)更新抬筆輪候時(shí)間,提高字符識(shí)別效率。本發(fā)明實(shí)施例提供一種手寫識(shí)別方法,包括接收手寫輸入的字符數(shù)據(jù)信號(hào);
根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆輪候時(shí)間閾 值;判斷當(dāng)前的抬筆輪候時(shí)間間隔是否超過實(shí)時(shí)更新后的抬筆輪候時(shí)間閾值,若是, 則確定當(dāng)前字符輸入完畢;對(duì)當(dāng)前字符進(jìn)行識(shí)別。進(jìn)一步,所述方法還包括獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡信號(hào);根據(jù)所述書寫筆跡信號(hào)確定當(dāng)前字符的長(zhǎng)寬比,由所述當(dāng)前字符的長(zhǎng)寬比判斷所 述字符是否輸入完畢。進(jìn)一步,所述方法還包括獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù)信號(hào)在書寫界面四個(gè)象限的分布 情況;判斷所述書寫界面四個(gè)象限中是否都有書寫筆跡數(shù)據(jù)信號(hào),若是,則確定所述字 符輸入完畢。進(jìn)一步,所述方法還包括當(dāng)錯(cuò)誤判斷所述字符輸入完畢時(shí),利用預(yù)置的抬筆輪候時(shí)間閾值下限對(duì)當(dāng)前獲得 的抬筆輪候時(shí)間閾值進(jìn)行更新。優(yōu)選的,所述根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆 輪候時(shí)間閾值,具體包括根據(jù)歷史累計(jì)輪候時(shí)間間隔分布的第一均值及第一方差、以及當(dāng)前出現(xiàn)的抬筆輪 候時(shí)間間隔樣本,按照預(yù)置更新模型獲得更新后的抬筆輪候時(shí)間分布的第二均值及第二方 差;將所述第二均值及第二方差代入抬筆輪候時(shí)間所滿足的高斯分布模型,并根據(jù)當(dāng) 前抬筆輪候時(shí)間閾值范圍內(nèi)的各抬筆輪候時(shí)間滿足的預(yù)置累計(jì)概率,得到更新后的抬筆輪 候時(shí)間閾值。一種手寫識(shí)別裝置,包括信號(hào)接收模塊,用于接收手寫輸入的字符數(shù)據(jù)信號(hào);時(shí)間閾值更新模塊,用于根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間 隔,更新抬筆輪候時(shí)間閾值;第一判斷模塊,用于判斷當(dāng)前的抬筆輪候時(shí)間間隔是否超過實(shí)時(shí)更新后的抬筆輪 候時(shí)間閾值,若是,則確定當(dāng)前字符輸入完畢; 識(shí)別模塊,用于對(duì)當(dāng)前字符進(jìn)行識(shí)別。進(jìn)一步,所述裝置還包括書寫筆跡數(shù)據(jù)信號(hào)獲取模塊,用于獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù) 信號(hào);第二判斷模塊,用于根據(jù)所述書寫筆跡數(shù)據(jù)信號(hào)確定當(dāng)前字符的長(zhǎng)寬比,由所述 當(dāng)前字符的長(zhǎng)寬比判斷所述字符是否輸入完畢。進(jìn)一步,所述裝置還包括象限分布獲取模塊,用于獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù)信號(hào)在書寫界面四個(gè)象限的分布情況;第三判斷模塊,用于判斷所述書寫界面四個(gè)象限中是否都有書寫筆跡數(shù)據(jù)信號(hào), 若是,則確定所述字符輸入完畢。進(jìn)一步,所述裝置還包括抬筆輪候時(shí)間閾值下限設(shè)置模塊,用于當(dāng)錯(cuò)誤判斷所述字符輸入完畢時(shí),利用預(yù) 置的抬筆輪候時(shí)間閾值下限對(duì)當(dāng)前獲得的抬筆輪候時(shí)間閾值進(jìn)行更新。優(yōu)選的,所述時(shí)間閾值更新模塊具體包括第一計(jì)算子模塊,用于根據(jù)歷史累計(jì)輪候時(shí)間間隔分布的第一均值及第一方差、 以及當(dāng)前出現(xiàn)的抬筆輪候時(shí)間間隔樣本,按照預(yù)置更新模型獲得更新后的抬筆輪候時(shí)間分 布的第二均值及第二方差;第二計(jì)算子模塊,用于將所述第二均值及第二方差代入抬筆輪候時(shí)間所滿足的高 斯分布模型,并根據(jù)當(dāng)前抬筆輪候時(shí)間閾值范圍內(nèi)的各抬筆輪候時(shí)間滿足的預(yù)置累計(jì)概 率,得到更新后的抬筆輪候時(shí)間閾值。同現(xiàn)有技術(shù)相比,本發(fā)明提供的技術(shù)方案根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬 筆輪候時(shí)間間隔,更新抬筆輪候時(shí)間閾值,從而達(dá)到對(duì)用戶書寫過程中的抬筆輪候時(shí)間的 監(jiān)測(cè)和自適應(yīng)學(xué)習(xí),能夠針對(duì)不同用戶設(shè)置相應(yīng)的抬筆輪候時(shí)間閾值,以適應(yīng)相應(yīng)用戶的 書寫習(xí)慣,避免出現(xiàn)對(duì)字符輸入結(jié)束的錯(cuò)誤判斷,提高字符識(shí)別效率。
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中 所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí) 施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖 獲得其他的附圖。圖1為本發(fā)明實(shí)施例提供的一種手寫識(shí)別方法流程示意圖;圖2為本發(fā)明實(shí)施例提供的另一種手寫識(shí)別方法流程示意圖;圖3為本發(fā)明實(shí)施例提供的又一種手寫識(shí)別方法流程示意圖;圖4為本發(fā)明實(shí)施例提供的一種手寫識(shí)別裝置的結(jié)構(gòu)示意圖;圖5為本發(fā)明實(shí)施例提供的另一種手寫識(shí)別裝置的結(jié)構(gòu)示意圖;圖6為本發(fā)明實(shí)施例提供的又一種手寫識(shí)別裝置的結(jié)構(gòu)示意圖;圖7為本發(fā)明實(shí)施例提供的再一種手寫識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。人在正常書寫時(shí)多傾向于連續(xù)輸入,如果寫一個(gè)字等待識(shí)別,再寫下一個(gè)字,思維 往往會(huì)被中斷。因而支持連續(xù)輸入的手寫識(shí)別受到越來越多的關(guān)注。當(dāng)前,手寫識(shí)別領(lǐng)域 采用的輸入模式仍為單字符連續(xù)輸入的模式。
所謂的單字符連續(xù)輸入是指系統(tǒng)在判定用戶在完成單字符輸入后啟動(dòng)后端識(shí)別 引擎對(duì)字符進(jìn)行識(shí)別,并給出識(shí)別結(jié)果。顯然在這樣的識(shí)別模式下要實(shí)現(xiàn)連續(xù)輸入的功能, 需要同時(shí)具備幾個(gè)要求。首先其后端的單字識(shí)別引擎效率較高,可以盡快地完成識(shí)別;同時(shí) 存在一種高效準(zhǔn)確而又智能的孤立字符結(jié)束判斷準(zhǔn)則,以便在用戶單字符輸入結(jié)束時(shí)可以 及時(shí)啟動(dòng)識(shí)別引擎并準(zhǔn)備接受下個(gè)字符。在對(duì)孤立字符結(jié)束判斷過程中,抬筆輪候時(shí)間閾值的設(shè)定是很多手寫輸入產(chǎn)品, 特別是以單字輸入為主的產(chǎn)品的關(guān)注焦點(diǎn)。目前業(yè)內(nèi)大多數(shù)手寫輸入產(chǎn)品的抬筆輪候時(shí)間 閾值的設(shè)定是機(jī)械的,即預(yù)設(shè)多個(gè)備選供用戶在設(shè)置頁(yè)面中根據(jù)自己的習(xí)慣選擇一個(gè)合適 的抬筆輪候時(shí)間閾值。在手寫輸入過程中,當(dāng)用戶抬筆停頓時(shí)間超過預(yù)定時(shí)間閾值時(shí),系統(tǒng) 即認(rèn)定當(dāng)前字符輸入結(jié)束并開始識(shí)別。所以,如果當(dāng)前的單個(gè)字符寫到一半有間歇時(shí),一定 會(huì)有不期望的字被識(shí)別。特別是當(dāng)用戶為追求快速輸入而將抬筆輪候時(shí)間閾值設(shè)為較小值 時(shí),只要略略提筆,離開手寫板,則將會(huì)被認(rèn)為字符輸入結(jié)束,而在實(shí)際字符輸入沒有結(jié)束 時(shí)啟動(dòng)識(shí)別引擎,從而導(dǎo)致正常輸入的中斷,字符識(shí)別錯(cuò)誤。反之,當(dāng)設(shè)置抬筆輪候時(shí)間閾 值較長(zhǎng)時(shí),用戶往往需要等待足夠的時(shí)間才能進(jìn)入字符識(shí)別階段,從而影響了連續(xù)書寫效 果??梢姡_(dá)到手寫輸入效率和系統(tǒng)識(shí)別效率之間的一種平衡,需要合理設(shè)置抬筆輪候時(shí) 間閾值,在保證識(shí)別效率的前提下,盡可能符合用戶書寫習(xí)慣,幫助用戶實(shí)現(xiàn)自然流暢的連 續(xù)書寫。為了解決上述間題,相應(yīng)地,本發(fā)明實(shí)施例提供了一種手寫識(shí)別方法,相應(yīng)地,還 提供了一種手寫識(shí)別裝置。首先對(duì)本發(fā)明提供的一種手寫識(shí)別方法進(jìn)行說明,參照?qǐng)D1所示,所述方法包括步驟101、接收手寫輸入的字符數(shù)據(jù)信號(hào);步驟102、根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆輪候 時(shí)間閾值;步驟103、判斷當(dāng)前的抬筆輪候時(shí)間間隔是否超過實(shí)時(shí)更新后的抬筆輪候時(shí)間閾 值,若是,則確定當(dāng)前字符輸入完畢;步驟104、對(duì)當(dāng)前字符進(jìn)行識(shí)別。本發(fā)明實(shí)施例提供的技術(shù)方案在步驟102中,根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn) 的抬筆輪候時(shí)間間隔,更新抬筆輪候時(shí)間閾值,從而達(dá)到對(duì)用戶書寫過程中的抬筆輪候時(shí) 間的監(jiān)測(cè)和自適應(yīng)學(xué)習(xí),能夠針對(duì)不同用戶設(shè)置相應(yīng)的抬筆輪候時(shí)間閾值,以適應(yīng)相應(yīng)用 戶的書寫習(xí)慣,避免出現(xiàn)對(duì)字符輸入結(jié)束的錯(cuò)誤判斷,提高字符識(shí)別效率。通常,當(dāng)確定當(dāng)前字符輸入完畢后,則可以對(duì)該字符進(jìn)行識(shí)別。在本發(fā)明實(shí)施例技 術(shù)方案實(shí)施時(shí),為了保證手寫字符識(shí)別的準(zhǔn)確性,提高字符識(shí)別的效率,在確定當(dāng)前字符是 否輸入完畢的過程中,不僅要考察當(dāng)前的抬筆輪候時(shí)間間隔,還需要根據(jù)當(dāng)前字符的書寫 筆跡進(jìn)行具體判斷。由此,在本發(fā)明的另一個(gè)實(shí)施例中,當(dāng)確定當(dāng)前的抬筆輪候時(shí)間間隔超 過實(shí)時(shí)更新后的抬筆輪候時(shí)間閾值后,如圖2所示,還包括以下步驟步驟105、獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡信號(hào);步驟106、根據(jù)所述書寫筆跡信號(hào)確定當(dāng)前字符的長(zhǎng)寬比,由所述當(dāng)前字符的長(zhǎng)寬 比判斷所述字符是否輸入完畢。本發(fā)明實(shí)施例通過從字符的長(zhǎng)寬比,完整性等幾何特性方面對(duì)其是否輸入完畢進(jìn)行判斷。一個(gè)完整字符的長(zhǎng)寬比約在1左右,過小或過大的長(zhǎng)寬比值則反映了字符的不完 整性。例如對(duì)于左右結(jié)構(gòu)的漢字,在用戶書寫完成左半邊部首時(shí),當(dāng)前字符結(jié)構(gòu)的長(zhǎng)度比 寬度大很多,長(zhǎng)寬比值遠(yuǎn)遠(yuǎn)地大于1。反之,對(duì)于上下結(jié)構(gòu)的漢字,在部分完成時(shí),當(dāng)前字符 結(jié)構(gòu)的寬度要遠(yuǎn)遠(yuǎn)大于長(zhǎng)度。因而,一定程度上,從字符的長(zhǎng)寬比值上可以看出字符的完成 程度。本發(fā)明實(shí)施例中,可以引入一參考參數(shù)“置信度”,利用該參數(shù)表示通過當(dāng)前累計(jì)的所 述字符的所有書寫筆跡信號(hào)判斷是否出現(xiàn)完整、有效字符,該“置信度”可以用Y表示,可以 假設(shè)字符的長(zhǎng)度為H,寬度為W,則由長(zhǎng)寬比的特性計(jì)算得到的置信度為
Y=
0
當(dāng) W/H<0.5 或W/H>2
3.3W/H-1.67 當(dāng) 0.5<W/H<0.8 2.5-1.25W/H 當(dāng) 0.5<W/H<0.8 1
當(dāng) W/H>0.8 或 W/H<1.2根據(jù)上述對(duì)置信度的定義,當(dāng)字符的長(zhǎng)寬比值在0. 8 1. 2之間時(shí),基本可以確定 字符的完整性;而當(dāng)字符的長(zhǎng)寬比值小于0. 5或大于2時(shí),則認(rèn)為字符沒有完成;在其他條 件下,按照線形函數(shù)的方式計(jì)算具體置信度。在具體實(shí)施時(shí),書寫筆跡信號(hào)表現(xiàn)為筆端在書寫界面上的各接觸點(diǎn)的X、y軸坐標(biāo) 值。通過累計(jì)筆端在書寫界面上的各接觸點(diǎn)的坐標(biāo)值,獲得當(dāng)前字符的書寫筆跡。為了進(jìn)一步提高對(duì)字符輸入完整性判斷的準(zhǔn)確性,在本發(fā)明的另一個(gè)實(shí)施例中, 如圖3所示,當(dāng)確定了當(dāng)前輸入字符的長(zhǎng)寬比值之后,還可以包括以下步驟步驟107、獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù)信號(hào)在書寫界面四個(gè)象 限的分布情況;步驟108、判斷所述書寫界面四個(gè)象限中是否都有書寫筆跡數(shù)據(jù)信號(hào),若是,則確 定所述字符輸入完畢。在判斷輸入字符的完整性時(shí),作為對(duì)輸入字符長(zhǎng)寬比值特性的補(bǔ)充,還可以結(jié)合 該輸入字符的書寫筆跡在書寫界面中四個(gè)象限的分布情況。通常,完整輸入的正常字符在 書寫界面上的每個(gè)象限都有像素點(diǎn)的分布。而對(duì)于尚未完成的筆畫,往往在某些象限沒有 筆畫出現(xiàn)。比如字符“大”,在完成第一筆和第二筆后,其字符在書寫界面上第二象限沒有筆 畫出現(xiàn),因而當(dāng)確定該字符在書寫界面上第二象限沒有出現(xiàn)書寫筆跡時(shí),則可以確定該字 符沒有完成?;谠撎匦缘闹眯哦扔?jì)算可以記為
γ,=| 當(dāng)所有象限都有筆畫 "|ο存在部分象限沒有筆畫因此,當(dāng)確定置信度Y和Y’之后,可以獲得綜合置信度Yl =Υ*Υ’。也就是當(dāng)字符 為完整輸入的字符時(shí),其要求同時(shí)滿足長(zhǎng)寬比值和象限完整性。例如當(dāng)字符在書寫界面上 某象限存在空白區(qū)時(shí),即使字符的長(zhǎng)寬比等于1,綜合置信度Yl依然為0,仍可確定為是未 完整輸入的字符。具體實(shí)施時(shí),可以預(yù)置綜合置信度閾值,當(dāng)獲得的綜合置信度小于該綜合 置信度閾值時(shí),則確定當(dāng)前字符輸入不完整。需要說明的是,在利用實(shí)時(shí)抬筆輪候時(shí)間間隔更新抬筆輪候時(shí)間閾值的過程中, 可能出現(xiàn)以下的情形
8
當(dāng)根據(jù)更新后的抬筆輪候時(shí)間閾值確定當(dāng)前字符為完整字符,但是,根據(jù)該當(dāng)前 字符的書寫筆跡得到的綜合置信度小于綜合置信度閾值,為一不完整字符時(shí),則是由于過 短的抬筆輪候時(shí)間閾值(可以設(shè)為Ta)引起的判斷失誤。如果抬筆輪候時(shí)間閾值Ta數(shù)值設(shè) 置過小,那么用戶輸入過程中在字符內(nèi)不同筆畫之間的短暫停頓也會(huì)被認(rèn)定為是字符間的 抬筆停頓,從而引起判斷失誤,此種情形通常被成為過訓(xùn)練。為了避免過訓(xùn)練導(dǎo)致的過短抬 筆輪候時(shí)間閾值,可以預(yù)先設(shè)定一個(gè)較長(zhǎng)的抬筆輪候時(shí)間閾值下限Tb,在更新后的抬筆輪 候時(shí)間閾值過短不適應(yīng)實(shí)際應(yīng)用時(shí),利用Tb來更新等候時(shí)間Ta。通過設(shè)置抬筆輪候時(shí)間閾 值下限Tb,避免因?yàn)橛脩暨^短停頓時(shí)間而導(dǎo)致過短的不合理的抬筆輪候時(shí)間閾值。抬筆輪 候時(shí)間閾值下限Tb往往設(shè)置的余量較大,一般為正?;蛘呱月龝鴮懙墓铝⒆址g隔時(shí)間, 例如500ms。此外,根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆輪候時(shí) 間閾值,具體實(shí)現(xiàn)方式可以為根據(jù)歷史累計(jì)輪候時(shí)間間隔分布的第一均值及第一方差、以及當(dāng)前出現(xiàn)的抬筆輪 候時(shí)間間隔樣本,按照預(yù)置更新模型獲得更新后的抬筆輪候時(shí)間分布的第二均值及第二方 差;將所述第二均值及第二方差代入抬筆輪候時(shí)間所滿足的高斯分布模型,并根據(jù)當(dāng) 前抬筆輪候時(shí)間閾值范圍內(nèi)的各抬筆輪候時(shí)間滿足的預(yù)置累計(jì)概率,得到更新后的抬筆輪 候時(shí)間閾值。為了便于對(duì)這部分技術(shù)方案的理解,下面通過具體的實(shí)例對(duì)抬筆輪候時(shí)間閾值的 更新方案進(jìn)行詳細(xì)的介紹說明。在對(duì)大量手寫輸入數(shù)據(jù)的分析中,本領(lǐng)域技術(shù)人員可以獲知單個(gè)字符輸入過程 中的筆劃間停頓時(shí)間的分布和字符之間停頓時(shí)間的分布遵循高斯分布
權(quán)利要求
一種手寫識(shí)別方法,其特征在于,包括接收手寫輸入的字符數(shù)據(jù)信號(hào);根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆輪候時(shí)間閾值;判斷當(dāng)前的抬筆輪候時(shí)間間隔是否超過實(shí)時(shí)更新后的抬筆輪候時(shí)間閾值,若是,則確定當(dāng)前字符輸入完畢;對(duì)當(dāng)前字符進(jìn)行識(shí)別。
2.根據(jù)權(quán)利要求1所述的手寫識(shí)別方法,其特征在于,所述方法還包括 獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡信號(hào);根據(jù)所述書寫筆跡信號(hào)確定當(dāng)前字符的長(zhǎng)寬比,由所述當(dāng)前字符的長(zhǎng)寬比判斷所述字 符是否輸入完畢。
3.根據(jù)權(quán)利要求2所述的手寫識(shí)別方法,其特征在于,所述方法還包括獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù)信號(hào)在書寫界面四個(gè)象限的分布情況;判斷所述書寫界面四個(gè)象限中是否都有書寫筆跡數(shù)據(jù)信號(hào),若是,則確定所述字符輸 入完畢。
4.根據(jù)權(quán)利要求3所述的手寫識(shí)別方法,其特征在于,所述方法還包括當(dāng)錯(cuò)誤判斷所述字符輸入完畢時(shí),利用預(yù)置的抬筆輪候時(shí)間閾值下限對(duì)當(dāng)前獲得的抬 筆輪候時(shí)間閾值進(jìn)行更新。
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的手寫識(shí)別方法,其特征在于,所述根據(jù)所述字符 數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆輪候時(shí)間閾值,具體包括根據(jù)歷史累計(jì)輪候時(shí)間間隔分布的第一均值及第一方差、以及當(dāng)前出現(xiàn)的抬筆輪候時(shí) 間間隔樣本,按照預(yù)置更新模型獲得更新后的抬筆輪候時(shí)間分布的第二均值及第二方差;將所述第二均值及第二方差代入抬筆輪候時(shí)間所滿足的高斯分布模型,并根據(jù)當(dāng)前抬 筆輪候時(shí)間閾值范圍內(nèi)的各抬筆輪候時(shí)間滿足的預(yù)置累計(jì)概率,得到更新后的抬筆輪候時(shí) 間閾值。
6.一種手寫識(shí)別裝置,其特征在于,包括信號(hào)接收模塊,用于接收手寫輸入的字符數(shù)據(jù)信號(hào);時(shí)間閾值更新模塊,用于根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更 新抬筆輪候時(shí)間閾值;第一判斷模塊,用于判斷當(dāng)前的抬筆輪候時(shí)間間隔是否超過實(shí)時(shí)更新后的抬筆輪候時(shí) 間閾值,若是,則確定當(dāng)前字符輸入完畢; 識(shí)別模塊,用于對(duì)當(dāng)前字符進(jìn)行識(shí)別。
7.根據(jù)權(quán)利要求6所述的手寫識(shí)別裝置,其特征在于,還包括書寫筆跡數(shù)據(jù)信號(hào)獲取模塊,用于獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù)信號(hào);第二判斷模塊,用于根據(jù)所述書寫筆跡數(shù)據(jù)信號(hào)確定當(dāng)前字符的長(zhǎng)寬比,由所述當(dāng)前 字符的長(zhǎng)寬比判斷所述字符是否輸入完畢。
8.根據(jù)權(quán)利要求7所述的手寫識(shí)別裝置,其特征在于,還包括象限分布獲取模塊,用于獲取當(dāng)前累計(jì)的所述字符的所有書寫筆跡數(shù)據(jù)信號(hào)在書寫界面四個(gè)象限的分布情況;第三判斷模塊,用于判斷所述書寫界面四個(gè)象限中是否都有書寫筆跡數(shù)據(jù)信號(hào),若是, 則確定所述字符輸入完畢。
9.根據(jù)權(quán)利要求8所述的手寫識(shí)別裝置,其特征在于,還包括抬筆輪候時(shí)間閾值下限設(shè)置模塊,用于當(dāng)錯(cuò)誤判斷所述字符輸入完畢時(shí),利用預(yù)置的 抬筆輪候時(shí)間閾值下限對(duì)當(dāng)前獲得的抬筆輪候時(shí)間閾值進(jìn)行更新。
10.根據(jù)權(quán)利要求6-9中任一項(xiàng)所述的手寫識(shí)別裝置,其特征在于,所述時(shí)間閾值更新 模塊具體包括第一計(jì)算子模塊,用于根據(jù)歷史累計(jì)輪候時(shí)間間隔分布的第一均值及第一方差、以及 當(dāng)前出現(xiàn)的抬筆輪候時(shí)間間隔樣本,按照預(yù)置更新模型獲得更新后的抬筆輪候時(shí)間分布的 第二均值及第二方差;第二計(jì)算子模塊,用于將所述第二均值及第二方差代入抬筆輪候時(shí)間所滿足的高斯分 布模型,并根據(jù)當(dāng)前抬筆輪候時(shí)間閾值范圍內(nèi)的各抬筆輪候時(shí)間滿足的預(yù)置累計(jì)概率,得 到更新后的抬筆輪候時(shí)間閾值。
全文摘要
本發(fā)明公開了一種手寫識(shí)別方法和裝置。其中,所述方法包括接收手寫輸入的字符數(shù)據(jù)信號(hào);根據(jù)所述字符數(shù)據(jù)信號(hào)間實(shí)時(shí)出現(xiàn)的抬筆輪候時(shí)間間隔,更新抬筆輪候時(shí)間閾值;判斷當(dāng)前的抬筆輪候時(shí)間間隔是否超過實(shí)時(shí)更新后的抬筆輪候時(shí)間閾值,若是,則確定當(dāng)前字符輸入完畢;對(duì)當(dāng)前字符進(jìn)行識(shí)別。通過本發(fā)明,能夠?qū)崿F(xiàn)對(duì)用戶書寫習(xí)慣的不斷監(jiān)測(cè)學(xué)習(xí),實(shí)時(shí)更新抬筆輪候時(shí)間,提高字符識(shí)別效率。
文檔編號(hào)G06F3/041GK101976152SQ20101054294
公開日2011年2月16日 申請(qǐng)日期2010年11月12日 優(yōu)先權(quán)日2010年11月12日
發(fā)明者何婷婷, 劉慶峰, 潘小兵, 程坤, 胡國(guó)平, 胡郁, 黃明登 申請(qǐng)人:安徽科大訊飛信息科技股份有限公司