專利名稱::自適應手寫識別系統(tǒng)和方法
技術領域:
:本發(fā)明涉及一種手寫識別系統(tǒng)和方法,尤其涉及一種能夠自動適應不同用戶的手寫字符特點的自適應手寫識別系統(tǒng)和方法。
背景技術:
:利用數(shù)字化設備進行手寫字符的輸入已經(jīng)成為一種非常普遍的現(xiàn)象,這些數(shù)字化設備通常指具有觸摸屏等傳感器等裝置的Tablet-PC,PDA和手寫手機等設備,與之相應的手寫識別技術被廣泛的使用。在當前的比較成熟而且商用的手寫識別系統(tǒng)中,識別字符所用的字符特征模板基本上是通過大量的訓練樣本訓練得來的,不同人書寫同一個字符便可能會有多種不同的寫法,通過大量的不同人書寫的樣本采用模式識別的訓練算法進行訓練,從中得到該字符的書寫的共性,即得到每一個字符的特征模板代表的是該手寫字符不同寫法的共同特征,但是這種做法沒有能夠考慮對不同人的不同寫法的各自獨有特征。如果用戶的書寫風格和上面得到的字符的共性特征差異過大,那么針對該用戶的手寫識別率會低于平均水平。所以,這樣的系統(tǒng)不能很好的滿足每一個用戶的需要。為了考慮不同用戶的不同寫法的獨有特征,當前采用改進方法的手寫識別系統(tǒng)通常采用下列兩種方式(1)預先讓使用者書寫一些特定的文字,從中找到該用戶的書寫特點,這個過程叫做用戶手寫注冊,這個過程不僅給用戶帶來了不方便,而且由于用戶預先書寫的字符數(shù)量相對于能夠識別的全部字符集是非常少量的,并不能準確地反映該用戶的手寫字符各自的特點。舉例來說,簡體漢字6700多A,而用來注冊的漢字如果控制在100個以內,遠如果注冊的文字數(shù)量增大,則并不方便用戶的使用;(2)根據(jù)用戶手寫特點選擇不同分類器,這種方式同樣需要進行用戶手寫注冊過程,提取其獨有的特征,然后自動挑選多個分類器。這種方法依賴于多個分類器的挑選是否適合,即便是挑選的分類器比較準確,但對于不同用戶的不同寫法,便會不斷的提高算法的復雜度,不斷的增加相應的存儲空間的消耗,由此換來的手寫識另'j準確率的提高仍然是有限的。另外,用戶的手寫筆跡特點會隨著用戶的年齡或者身體肌肉等條件的變化而變化,如果采用以上的方法,則需要用戶重新注冊或者調整分類器,由此看來,現(xiàn)有的方法都不能很好的適用于個體用戶的使用。因此,當前的手寫識別系統(tǒng)不僅需要結合不同用戶的獨有特征來滿足不同用戶的需求,同時提高手寫字符識別的正確率,而且需要降低實現(xiàn)系統(tǒng)改進所占用的存儲和計算資源。
發(fā)明內容發(fā)明的目的是提供一種簡單的方便的自適應手寫識別系統(tǒng)和方法,從而可以自動的適應不同用戶的寫法,提高手寫識別的準確率,同時降低實現(xiàn)系統(tǒng)改進所占用的存儲和計算資源。根據(jù)本發(fā)明的一方面,提供了一種自適應手寫識別系統(tǒng),手寫字符輸入單元,用于使用戶輸入字符,并生成包含有字符筆跡點坐標的手寫筆跡數(shù)據(jù);至少一個通用字符特征模板庫,用于存儲通過預先樣本訓練得到的字符集及其對應的特征模板;至少一個用戶字符特征模板庫,用于存儲用戶字符特征模板;輸入字符識別單元,接收來自手寫輸入單元的手寫筆跡數(shù)據(jù),從手寫筆跡數(shù)據(jù)中提取輸入的手寫字符筆跡的特征向量,從通用字符特征模板庫中調用通用字符特征模板,基于所述特征向量和通用字符特征模板,對輸入字符進行識別,并根據(jù)識別結果,來更新用戶字符特征模板庫中的用戶字符特征模板。根據(jù)本發(fā)明的一方面,所述的自適應手寫識別系統(tǒng)還可包括用戶登錄單元,用于使不同用戶輸入含有各自的標識信息的用戶登錄信息,輸入字符識別單元根據(jù)用戶信息來更新不同用戶對應的用戶字符特征模板。根據(jù)本發(fā)明的一方面,所述輸入字符識別單元包括特征向量提取單元,用于從所述手寫筆跡數(shù)據(jù)中提取所述輸入字符的特征向量;至少一個共用分類器,比較所述字符的特征向量與所述通用字符特征模板庫中的特征模板之間的近似度,根據(jù)近似度從高到低順序給出多個候選字;控制選擇單元,用于使用戶從多個候選字中選擇自己所輸入的正確的字符;更新或創(chuàng)建單元,如果用戶所選擇的正確的字符不是多個候選字的首選字,則更新用戶字符特征才莫板庫中的特4正沖莫+反或創(chuàng)建用戶字符特征才莫4反。根據(jù)本發(fā)明的一方面,如果用戶字符特征模板存儲器中已經(jīng)存儲有用戶字符特征模板,則共用分類器還從用戶字符特征模板存儲器中調用用戶字符特征模板,在比較所述字符的特征向量與所述通用字符特征模板的近似度的同時,還比較與所述用戶字符特征模板之間的近似度。根據(jù)本發(fā)明的一方面,所述更新或創(chuàng)建單元根據(jù)所述字符的字符編碼查找用戶字符特征模板庫中查找和所述字符編碼對應的特征模板,如果查找到對應的模板,則將用戶輸入的字符的特征向量和所查找到的特征模板進行特征融合,生成新的模板,存儲到用戶字符特征模板庫中,從而更新用戶字符特征模板。根據(jù)本發(fā)明的一方面,如果沒有查找到與所述字符編碼對應的特征模板,則所述更新或創(chuàng)建單元根據(jù)用戶輸入的字符的特征向量創(chuàng)建特征模板并將其添加到用戶字符特征模板庫中,從而創(chuàng)建用戶字符特征模板。其中,所述更新或創(chuàng)建單元采用加權平均的方式進行融合。根據(jù)本發(fā)明的一方面,所述的自適應手寫識別系統(tǒng),還包括顯示單元,用于顯示所述多個候選字,以使用戶進行選擇。根據(jù)本發(fā)明的一方面,提供了一種自適應手寫識別方法,可包括(a)根據(jù)用戶手寫輸入的字符,生成包含手寫字符筆跡的坐標信息的手寫筆跡數(shù)據(jù);(b)從手寫筆跡數(shù)據(jù)中提取聽述字符的特征向量,將所述字符的特征向量與通用字符特征模板庫中的特征模板進行匹配來對字符進行識別;(c)根據(jù)匹配結果來判斷識別結果;(d)如果判斷出的識別結果為不能正確識別,則更新用戶字符特征模板庫中的用戶字符特征模板。根據(jù)本發(fā)明的一方面,所述的自適應手寫識別方法還可包括使不同用戶輸入含有各自的標識信息的用戶登錄信息的步驟,從而根據(jù)用戶的標識信息來對輸入字符進行識別,并根據(jù)識別結果更新用戶字符特征模板庫中的各個用戶對應的特征^t板。根據(jù)本發(fā)明的一方面,所述步驟(b)可包括(bl)調用通用字符特征模板,比較所述字符的特征向量與通用字符特征模板之間的近似度,根據(jù)近似度從高到底給出與特征模板對應的多個候選字;(b2)使用戶從多個候選字中選擇其想要輸入的正確的字符。根據(jù)本發(fā)明的一方面,所述步驟(c)包括判斷用戶所選擇的字符是否是多個候選字中的首選字,如果不是首選字,則判斷結果為不能正確識別。根據(jù)本發(fā)明的一方面,如果用戶字符特征模板存儲器中已經(jīng)存儲有用戶字符特征模板,則步驟(bl)還包括調用用戶字符特征模板,并比較所述字符的特征向量與所述用戶字符特征模板之間的近似度的步驟。根據(jù)本發(fā)明的一方面,在步驟(d)中,根據(jù)所述字符的字符編碼查找用戶字符特征模板庫中查找和所述字符編碼對應的特征模板,如果查找到對應的模板,則將用戶輸入的字符的特征向量和所查找到的特征模板進行特征融合,生成新的模板,存儲到用戶字符特征模板庫中,從而更新用戶字符特征模板。如果沒有查找到與所逆字符編碼對應的特征模板,則根據(jù)用戶輸入的字符的特征向量創(chuàng)建特征模板并將其添加到用戶字符特征模板庫中,從而創(chuàng)建用戶字符特征模板。根據(jù)本發(fā)明的一方面,將用戶輸入的字符的特征向量和所查找到的特征模板進行特征融合采用加權平均的方式進行融合。根據(jù)本發(fā)明的一方面,所述的自適應手寫識別方法還包括顯示所述多個候選字以使用戶進行選擇的步驟。通過下面結合示例性地示出一例的附圖進行的描述,本發(fā)明的上述和其他目的和特點將會變得更加清楚,其中圖1是根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)的框圖;圖2是圖1中的自適應手寫識別系統(tǒng)中的識別結果處理單元的結構框圖;圖3是根據(jù)本發(fā)明實施例的自適應手寫識別方法的流程圖;圖4是圖3中的更新用戶字符特征模板庫中的用戶字符特征模板的步驟的詳細流程圖;圖5是根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)能夠運行的計算環(huán)境的一個示例;圖6是根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)運行的常見物理平臺的示例。具體實施方式以下,將參照附圖詳細描述本發(fā)明的優(yōu)選實施例。在下面的描述中,為了清晰和簡明起見,省略了對公知功能或結構的詳細描述。在本發(fā)明中使用的術語"組件"指的是與本發(fā)明系統(tǒng)相關的實體,或者是硬件,硬件和軟件的結合、軟件,或者是執(zhí)行中的軟件。例如,組件可以是,但不局限于,運行在處理器上的進程、處理器、對象、可以執(zhí)行的東西、執(zhí)行的線程、程序和計算機。作為示例,運行在服務器上的應用程序和/或服務器可以是組件。另外組件可以包括一個或多個組件。圖1是根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)的框圖。如圖l所示,該自適應手寫識別系統(tǒng)包括手寫字符輸入單元101、特征向量提取單元102、通用字符特征模板庫103、共用分類器104、用戶字符特征模板庫105、識別結果處3里單元106。手寫字符輸入單元101在用戶輸入字符時生成手寫筆跡數(shù)據(jù),所述手寫筆跡數(shù)據(jù)表示用戶進行手寫輸入時外部組件提供的包含字符筆跡點坐標的數(shù)據(jù)集合。特征向量提取單元102,用于從手寫筆跡數(shù)據(jù)中提取輸入字符的手寫筆跡的特征向量。通用字符特征模板庫103存儲可以被識別的字符的所有或者部分特征模板,通用字符特征模板可以通過大量樣本訓練得到的字符集和其對應的特征模板,也可以是人為設定,代表各個手寫字符的共性特征的字符集和其對應的特征模板。這些字符集包含字符的種類和數(shù)量,即該手寫識別系統(tǒng)的識別范圍。通用字符特征模板庫103可以是一個或多個。用戶字符特征模板庫105用來存儲用戶手寫字符的特征模板,如果是多用戶系統(tǒng),則用戶字符特征模板庫存放與不同用戶對應的用戶字符特征模板。用戶字符特征模板庫中的特征模板的數(shù)量同用戶數(shù)量多少相關,用戶越多,用戶字符特征模板數(shù)就越多。用戶字符特征模板庫105可以是一個或多個。共用分類器104用來根據(jù)特征模板進行文字識別的組件,可以包含一個分類器,也可以是多個分類器的組合。分類器指的是在模式識別領域提供的各種可以被用于文字字符識別的分類方法,例如,貝葉斯分類器等。共用分類器104從特征向量提取單元102接收用戶輸入字符的特征向量,將該特征向量和通用字符特征模板庫103中的通用字符特征模板和用戶字符特征模板庫105中的用戶字符特征模板進行匹配比較,給出識別結果。識別結果處理單元106根據(jù)識別結果,判斷是否將字符的特征向量同用戶字符特征模板庫105中的對應的字符才莫板相結合,生成新的特征模板,再存入用戶字符特征模板庫105中。識別結果處理單元可包括如圖2所示的顯示單元107、選擇控制單元108和更新或創(chuàng)建單元109。顯示單元107顯示共用分類器104的識別結果,用戶通過選擇控制單元108對識別結果進行選擇和控制。更新或創(chuàng)建單元109根據(jù)用戶選擇的結果來確定是否更新或創(chuàng)建用戶字符特征模板。如果根據(jù)本發(fā)明的自適應手寫識別系統(tǒng)是用于多個用戶的,則該系統(tǒng)還包括用戶登錄單元110,用于提供用戶的各自標識,以區(qū)分不同的用戶,從而對用戶字符特征模板庫105進行創(chuàng)建和管理。如果該手寫識別系統(tǒng)僅用于單個用戶,則該用戶登錄單元110可以省略。在根據(jù)本發(fā)明的自適應手寫識別系統(tǒng)中所涉及到特征向量、特征模板和分類器均是模式識別領域中定義的和能夠被公開獲取的算法和概念,并不指特定的格式或者特定的實現(xiàn)方法。因為文字字符是以數(shù)字編碼的形式存放于計算機或者其他設備中,所以通用字符特征模板庫103和用戶字符特征模板庫105中存放著特征模板和字符編碼的對應關系。例如在UNICODE編碼情況下,漢字"志",對應的數(shù)字編碼值為"5FD7",假定特征模板R^rl,r2,...,rn}(n〉0)是"志"的特征模板,則特征模板R與"5FD7"相對應存放于特征模板庫中,這樣根據(jù)特征模板便可以找到相對應的字符編碼,即找到其對應的字符。這種對應關系同樣適用于其他各種字符編碼方式。下面,將參照圖1、圖2和圖3詳細描述根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)的自適應識別過程。圖3是根據(jù)本發(fā)明實施例的自適應手寫識別方法的流程圖。在步驟S301中,用戶從手寫字符輸入單元101手寫輸入字符,然后,手寫字符輸入單元101根據(jù)用戶輸入的字符生成手寫筆跡數(shù)據(jù),手寫筆跡數(shù)據(jù)中至少要包含手寫字符筆跡所經(jīng)過的點的部分或者全部坐標信息。在步驟S302中,特征向量提取單元102從字符筆跡數(shù)據(jù)中提取輸入的手寫字符筆跡的特征向量。在步驟S303中,共用分類器104從通用字符特征沖莫板庫103中調用通用字符特征模板,將提取的字符筆跡的特征向量同通用字符特征模板庫103中的全部或者部分模板進行匹配比較。如果用戶字符特征模板庫105中已經(jīng)存儲有用戶字符特征模板,則該步驟還包括從用戶字符特征模板庫105中調用用戶字符特征模板,然后與提取的字符筆跡的特征向量進行匹配比較。如果是多用戶系統(tǒng),則才艮據(jù)輸入的用戶登錄信息提供的用戶標識,從用戶字符特征模板庫105中調出與該用戶對應的字符特征模板,然后進行匹配比較。通用字符特征模板庫103中存放這通過大量樣本事先訓練好的特征模板,訓練算法屬于各種模式識別領域中的公知常識或已有技術,這里不再詳細描述。下面,詳細說明在步驟S303中共用分類器的分類過程。共用分類器計算輸入字符的特征向量與通用字符特征模板庫103和用戶字符特征模板庫105提供的特征模板兩兩之間的識別距離值。識別距離的計算方式有多種,同樣其量度單位也是不大相同的。這個過程使用任何能夠準確反映特征向量與已存的特征模板相似度的數(shù)值或其他可以比較大小的代碼。例如可以使用特征向量和特征模板之間的歐式距離作為識別距離,當然也存在其它的表現(xiàn)形式,但是其功用是相同或相似的。在識別距離為數(shù)值的情況下,該數(shù)值的越小,說明輸入字符的特征向量與該特征模板越相似,或者越大越相似??傊R別距離和相似度之間存在這正比或者反比的關系。為了節(jié)約計算比較的時間,可以使用快捷的計算方法,例如分級搜索等。共用分類器104根據(jù)i+算得到的識別距離的大小將特征模板對應的字符按照相似度由高到低進行排列,最終得到與輸入手寫字符最為相似的候選字組,該候選字組中包含文字的個數(shù)可以設定,一般小于20個。這里,首選字指代的是排在第一位的系統(tǒng)認為最為相似的候選字符,系統(tǒng)默認首選字為正確的識別結果。通過步驟S303得到的候選字組在步驟S304中通過顯示單元107顯示給使用該系統(tǒng)的用戶。如果首選字不是用戶想要輸入的字符,則在步驟S305中,用戶通過選擇控制單元108從侯選字組中選擇正確的識別結果,然后在步驟S306中,判斷正確字符結果是否等于首選字。如果不是首選字,則說明原有分類器還不能很好的適應用戶手寫這個字符的寫法特點。因此,在步驟S307中,更新或創(chuàng)建單元109需要根據(jù)字符特征向量更新用戶字符特征模板庫105中的字符特征模板,來創(chuàng)建或者更新用戶字符特征模板庫105中的特征模板。如果在步驟S306中,判斷結果為所選擇的正確的字符為首選字,則說明原有的分類器可以正確的識別用戶手寫這個字符的寫法,因而不需要創(chuàng)建或更新用戶的特征模板。下面,照圖4詳細描述在步驟S307中根據(jù)字符特征向量更新用戶字符特征模板庫105的過程。圖4是根據(jù)本發(fā)明實施例的自適應字符識別方法的更新用戶字符特征才莫板庫的方法的流程圖,即更新或創(chuàng)建單元109的操作過程。在步驟S401中,更新或創(chuàng)建單元109根據(jù)和正確字符結果對應的字符編碼以及用戶登錄信息中的用戶標識,從用戶字符特征模板庫中查找和字符編碼對應的特征模板。根據(jù)步驟S401的查找結果,在步驟S402,判斷在用戶字符特征模板庫中是否已經(jīng)存在該字符的特征模板。如果存在,則在步驟S404中,更改用戶字符特征模板庫中的特征模板,將用戶輸入的該字符的特征向量和用戶字符特征模板庫中對應的特征模板進行特征融合。特征融合方法有多種,根據(jù)特征模板和特征向量的構成的不同,其對應的融合方法也不相同,這里不是特指某種融合方法。本發(fā)明的實施例中,對于特征維數(shù)相同的情況下,可以采用加權平均的方式進行融合,例如用戶庫中原有的特征模板為T={U,t2,...,tn}(n〉0),n為特征維數(shù)。輸入字符的特征向量為A={al,a2,...,an},則新的特征模板B={(tl+al:)/2,(t2+a2)/2,...,(tn+an)/2},(n>0)。這只是一種實現(xiàn)方法,其他模式識別中所用到的特征融合方法也可以應用于本發(fā)明的實施例中,如均值聚類等。如果原來的用戶字符特征模板庫中不存在與所述輸入的字符對應的特征模板,則在步驟S403中,艱據(jù)在步驟圖3的步驟S303中提取的用戶輸入的該字符的特征向量,創(chuàng)建特征模板并將其添加到用戶字符特征模板庫中。根據(jù)特征向量創(chuàng)建特征模板的方法不是唯一的,可以采用目前或者將來在模式識別領域公開的各種方法。作為示例,如果特征向量和特征;漠板維數(shù)相同,那么可以采用直接等同的方式,即此時該字符的特征向量即為要添加到用戶庫中的特征模板。在步驟S403或者步驟S404處理完成后,該流程分別結束。字符特征模板能夠代表用戶手寫字符的特點,因而本發(fā)明提供的這種更新機制使本系統(tǒng)能夠自動的適應用戶手寫字符特點的變化。用戶通過本發(fā)明進行手寫識別時,會不斷的重復圖3和圖4所示流程,這樣隨著用戶不斷的使用該自適應手寫識別系統(tǒng),用戶的手寫字符的特征便被不斷地記錄下來。另外根據(jù)用戶字符特征模板融合或者添加的判斷準則,系統(tǒng)只記錄共用分類器組件不能夠識別的字符,這樣對于曾經(jīng)不能夠被共用分類器組件正確識別的字符,在下次書寫時便可以得到正確的結果。本發(fā)明涉及的模式識別領域提供的特征提取方法和共用分類器并不是特定的,同樣識別手寫字符的范圍也不是特定的。作為示例,下面描述一個手寫字符通過本發(fā)明的處理過程假定用戶第一次使用本系統(tǒng),用戶通過數(shù)字化儀手寫輸入漢字"新,,,其圖案為i,數(shù)字化儀給出該符號圖案的筆跡數(shù)據(jù)Q{xl,yl,…),(x2,y2,…),…,(xn,yn,...)};其中n為自然數(shù),表示該手寫字符所包舍的采樣點的個數(shù),(xl,yl),...,(xn,yn),指代這些采樣點的坐標值。然后得到該符號的特征向量?化1,:02,..."1!1},m〉0,指代特征向量的長度。通過共用分類器將通用字符特征模板庫中存放的特征模板和該特征向量進行匹配,可以得到一組識別結果候選字"刻敦新教......",首選字為"刻",而不是用戶想要輸入的正確結果"新",此時,用戶會從侯選字中選擇第三個,即"新"字。這樣系統(tǒng)判斷出共用分類器給出的首選字并不是與輸入手寫字符正確對應的,即識別結果不正確。這時,系統(tǒng)將特征向量PU轉變?yōu)樘卣髂0錜{}和"新"字對應的字符編碼(,果是UNICODE編碼,則該字符的編碼為"65B0")存放于用戶字符特征模板庫中。特征向量轉變?yōu)樘卣髂0宓姆椒ê芏?,這里可以直接讓RU二PU,這樣RU便包含了手寫字符的特征。當用戶再一次寫入漢字"新,,時,其圖案為;,可以看出這兩種寫法的特點是相似的,在完成特征向量提取之后,共用分類器將其與通用字符特征模板和用戶字符特征模板庫中特征模板進行匹配,由于此時用戶字符特征模板庫已經(jīng)存放了"新"字對應的具有同樣手寫特點的特征模板RU,這種情況下共用分類器會認為R"與的特征向量聶為匹配,則顯示識別候選結果為"新刻敦教......",首選字為"新"字,則識別結果正確。由此可以看出,本發(fā)明提供的系統(tǒng)和方法具有自動適應用戶的手寫字符特點,從而使用戶寫得越多,識別系統(tǒng)的識別準確率越高。根據(jù)本發(fā)明實施例的自適應手寫識別方法,采用共用分類器,通用字符特征模板庫和不同用戶字符特征模板庫相結合的方式,基于共用分類器的識別結果,能夠根據(jù)用戶選擇自動地將共用分類器識別錯誤的結果記錄下來,根據(jù)該用戶的手寫字符特征生成該用戶自己獨有的字符特征模板,使用戶在下一次書寫中能夠通過共用分類器得到正確的識別結果,從而提高手寫識別的正確率。圖5表示的本發(fā)明能夠運行的計算環(huán)境的一個示例。該計算環(huán)境包括手寫輸入單元501,中央處理單元502,顯示單元503,選擇控制單元504,程序和數(shù)據(jù)庫505和電源506共六個組件。這六個組件可以進行合并或者分裂,但是其所實現(xiàn)的功能要具備。501可以是能夠購買的或者專用的將手寫筆跡轉換為坐標,并且能夠被存儲到組件內的設備,例如手寫板,PDA和Tablet-PC上的觸摸屏/觸摸鍵盤等。502可以是一切能夠購買的常用處理器或者專用的處理器,另外,502可以由多于一個的處理器通過諸如并行或串行組合連接形成的多處理器。顯示單元503是可以顯示候選字結果的組件,例如PC的顯示器LCD,PDA的LCD和手機屏幕等。選擇控制單元504的功能是給用戶一種進行正確識別結果選擇的組件,例如鍵盤和觸摸屏等。程序和數(shù)據(jù)庫505用來指代本發(fā)明用到的通用字符特征模板庫,用戶字符特征模板庫和計算程序等數(shù)據(jù)信息,其存儲格式根據(jù)存儲介質的不同而不同。這些信息可以分開存儲。506為給本發(fā)明的系統(tǒng)供電的組件,例如手機電池,計算機電源等。圖5中的各個單元之間的連線是提供了一種連接方式,但并不局限于此方式。另外,各個單元之間也可以依靠其他通信組件通過網(wǎng)絡相連,例如有線/無線網(wǎng)卡,調制解調器,藍牙,紅外和移動通信設備的發(fā)送/接收天線等。圖6示出了根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)運行的常見的物理平臺的一個示例,如手寫板和PC相連601進行手寫字符輸入,有觸摸屏的PDA602和有觸摸屏的手機603。本發(fā)明在三星SCH-W399平臺上進行了測試,測試樣本是由3位不同的人分別在該平臺上手寫了含有3000個常用漢字的短文,共用分類器為常見的貝葉斯分類器。這三組漢字中相同漢字的重復次數(shù)是不定的,有的是沒有重復,有的是重復30次等,這是為了很好的模擬用戶實際的使用情況,因為對于不同的用戶而言不同的漢字使用的頻率也是不同的。將這三組漢字作為手寫數(shù)據(jù)分別送入到運行在SCH-W399手機上的自適應手寫識別系統(tǒng)和無自適應功能的手寫識別系統(tǒng),識別準確率如表1所示。識別準確率的定義為準確率=首選字正確的個數(shù)/手寫字符的總數(shù)。這里三組漢字所包括的手寫字符的總數(shù)均為3000個。表l識別準確率對照表<table>tableseeoriginaldocumentpage14</column></row><table>因為并沒有過多的增加運算復雜度,所以在該平臺上平均處理單個字符識別的時間增加值低于0.01%.從表1中可以看到本發(fā)明提供的自適應識別系統(tǒng)能夠有效的適應不同用戶的手寫特點,提高各自的手寫字符的識別準確率。實驗證明該系統(tǒng)能保存不同用戶的特性,彌補了共用分類器的不足,從而提高系統(tǒng)的識別準確率。針對不同的用戶創(chuàng)建各自的用戶庫文件,這樣用戶庫之間不會產(chǎn)生任何影響。對于單個用戶增加的容量空間都是極為有限的。尤其是PDA和手機等移動終端來說,其運算能力和空間都是有限的,而且往往是長時間被一個人使用,因而該自適應手寫識別系統(tǒng)適用于這些終端設備上。實驗還證明通過本發(fā)明可以在增加較少的計算量和空間的消耗下有效地提高手寫識別的準確率。才艮據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)和方法,具有下面幾方面的優(yōu)點無需進行用戶手寫注冊過程,自動適應用戶的書寫特點的變化;只需要共用分類器即可,基本沒有提高算法復雜度;針對不同用戶的手寫特點自動建立特征庫,適應不同用戶的手寫特點,從而彌補共用分類器的不足。本發(fā)明可以廣泛的運用于各種可以進行手寫輸入的移動終端設備上,也可以用于有外接錄入設備的有計算能力的設備上,如PC,服務器等。其涉及到的各個組件不局限于一個單一設備,可以分布在多個設備上,比如通過互聯(lián)網(wǎng)連接的服務器PC和客戶端PC上。另外,根據(jù)本發(fā)明實施例的自適應手寫識別系統(tǒng)和方法具有很好的擴展性和易用性,適合Tablet-PC,PDA和手寫手機等設備使用,尤其是對于手機這種計算能力弱,存儲空間有限的終端來說,其優(yōu)點尤為明顯。支持多用戶使用,可以分別提高每一個用戶的手寫識別準確率。盡管已經(jīng)參照示例性實施例具體顯示和描述了本發(fā)明,但是本領域的技術人員應該理解,在不脫離由權利要求限定的本發(fā)明的精神和范圍的情況下,可以對這些實施例進行形式和細節(jié)上的各種改變。權利要求1、一種自適應手寫識別系統(tǒng),包括手寫字符輸入單元,用于使用戶輸入字符,并生成包含有字符筆跡點坐標的手寫筆跡數(shù)據(jù);至少一個通用字符特征模板庫,用于存儲通過預先樣本訓練得到的字符集及其對應的特征模板;至少一個用戶字符特征模板庫,用于存儲用戶字符特征模板;輸入字符識別單元,接收來自手寫輸入單元的手寫筆跡數(shù)據(jù),從手寫筆跡數(shù)據(jù)中提取輸入的手寫字符筆跡的特征向量,從通用字符特征模板庫中調用通用字符特征模板,基于所述特征向量和通用字符特征模板,對輸入字符進行識別,并根據(jù)識別結果,來更新用戶字符特征模板庫中的用戶字符特征模板。2、如權利要求1所述的自適應手寫識別系統(tǒng),還包括用戶登錄單元,用于使不同用戶輸入含有各自的標識信息的用戶登錄信息,輸入字符識別單元根據(jù)用戶信息來更新不同用戶對應的用戶字符特征模板。3、如權利要求1所述的自適應手寫識別系統(tǒng),其中,所述輸入字符識別單元包括特征向量提取單元,用于從所述手寫筆跡數(shù)據(jù)中提取所述輸入字符的特征向量;至少一個共用分類器,比較所述字符的特征向量與所述通用字符特征模板庫中的特征模板之間的近似度,根據(jù)近似度從高到低順序給出多個候選字;控制選擇單元,用于使用戶從多個候選字中選擇自己所輸入的正確的字付;更新或創(chuàng)建單元,如果用戶所選擇的正確的字符不是多個候選字的首選字,則更新用戶字符特征模板庫中的特征模板或創(chuàng)建用戶字符特征模板。4、如權利要求3所述的自適應手寫識別系統(tǒng),其中,如果用戶字符特征模板存儲庫中已經(jīng)存儲有用戶字符特征模板,則共用分類器還從用戶字符特征模板存儲庫中調用用戶字符特征模板,在比較所述字符的特征向量與所述通用字符特征模板的近似度的同時,還比較與所述用戶字符特征模板之間的近似度。5、如權利要求3或4所述的自適應手寫識別系統(tǒng),其中,所述更新或創(chuàng)建單元根據(jù)所述字符的字符編碼查找用戶字符特征模板庫中查找和所述字符編碼對應的特征模板,如果查找到對應的模板,則將用戶輸入的字符的特征向量和所查找到的特征模板進行特征融合,生成新的模板,存儲到用戶字符特征模板庫中,從而更新用戶字符特征模板。6、如權利要求5所述的自適應手寫識別系統(tǒng),其中,如果沒有查找到與所述字符編碼對應的特征模板,則所述更新或創(chuàng)建單元根據(jù)用戶輸入的字符的特征向量創(chuàng)建特征模板并將其添加到用戶字符特征模板庫中,從而創(chuàng)建用戶字符特征模板。7、如權利要求5所述的自適應手寫識別系統(tǒng),其中,所述更新或創(chuàng)建單元采用加權平均的方式進行融合。8、如權利要求3所述的自適應手寫識別系統(tǒng),還包括顯示單元,用于顯示所述多個候選字,以使用戶進行選擇。9、一種自適應手寫識別方法,包括(a)根據(jù)用戶手寫輸入的字符,生成包含手寫字符筆跡的坐標信息的手寫筆跡數(shù)據(jù);(b)從手寫筆跡數(shù)據(jù)中提取所述字符的特征向量,將所述字符的特征向量與通用字符特征模板庫中的特征模板進行匹配來對字符進行識別;(c)根據(jù)匹配結果來判斷識別結果;Cd)如果判斷出的識別結杲為不能正確識別,則更新用戶字符特征模板庫中的用戶字符特征模板。10、如權利要求9所述的自適應手寫識別方法,還包括使不同用戶輸入含有各自的標識信息的用戶登錄信息的步驟,從而根據(jù)用戶的標識信息來對輸入字符進行識別,并根據(jù)識別結果更新用戶字符特征模板庫中的各個用戶對應的特征模板。11、如權利要求9所遲的自適應手寫識別方法,其中,所述步驟(b)包括(bl)調用通用字符特征模板,比較所述字符的特征向量與通用字符特征模板之間的近似度,才艮據(jù)近似度從高到低給出與特征模板對應的多個候選字;(b2)使用戶從多個候選字中選擇其想要輸入的正確的字符。12、如權利要求11所述的自適應手寫識別方法,其中,所述步驟(c)包 括判斷用戶所選擇的字符是否是多個候選字中的首選字,如果不是首選字,則判斷結果為不能正確識別。13、如權利要求11所述的自適應手寫識別方法,其中,如果用戶字符特征模板存儲器中已經(jīng)存儲有用戶字符特征模板,則步驟(bl)還包括調用用戶字符特征模板,并比較所述字符的特征向量與所述用戶字符特征模板之間的近似度的步驟。14、如權利要求12所述的自適應手寫識別方法,其中,在步驟(d)中,根據(jù)所述字符的字符編碼查找用戶字符特征模板庫中查找和所述字符編碼對應的特征模板,如果查找到對應的模板,則將用戶輸入的字符的特征向量和所查找到的特征模板進行特征融合,生成新的模板,存儲到用戶字符特征模板庫中,從而更新用戶字符特征模板。15、如權利要求14所述的自適應手寫識別方法,其中,如果沒有查找到與所述字符編碼對應的特征模板,則根據(jù)用戶輸入的字符的特征向量創(chuàng)建特征模板并將其添加到用戶字符特征模板庫中,從而創(chuàng)建用戶字符特征模板。16、如權利要求14所述的自適應手寫識別方法,其中,將用戶輸入的字符的特征向量和所查找到的特征模板進行特征融合采用加權平均的方式進行融合。17、如權利要求11所述的自適應手寫識別方法,還包括顯示所述多個候選字,以使用戶進行選擇。全文摘要提供了一種自適應手寫識別系統(tǒng)和方法。該自適應手寫識別系統(tǒng)包括手寫字符輸入單元,用于使用戶輸入字符,并生成與所述字符對應的特征向量;通用字符特征模板庫,用于存儲通過預先樣本訓練得到的字符集及其對應的特征模板;用戶字符特征模板庫,用于存儲用戶手寫筆跡特征模板;輸入字符識別單元,基于所述特征向量和通用字符特征模板庫中的通用字符特征模板,對輸入字符進行識別,并根據(jù)識別結果,來更新用戶字符特征模板庫。因此,根據(jù)本發(fā)明的系統(tǒng)和方法,不僅能夠提高手寫識別的正確率,而且能夠適應不同用戶的手寫特點。文檔編號G06K9/68GK101149804SQ200610154269公開日2008年3月26日申請日期2006年9月19日優(yōu)先權日2006年9月19日發(fā)明者炎王,胡洪濤,陳又新申請人:北京三星通信技術研究有限公司