專利名稱:漢字筆畫信息碼的制作方法
漢字筆畫信息碼涉及一種漢字信息處理技術,是一種漢字編碼方案。
常用的漢字編碼方案有區(qū)位碼、拼音碼、五筆字碼、自然碼、電報碼等等。
上述這些方案存在如下一些缺點區(qū)位碼和電報碼都是每一個漢字對應一個編碼,因為沒有編碼規(guī)則,所以要熟練掌握區(qū)位碼和電報碼的錄入技術,必須花費大量精力記熟每一個漢字編碼。故此,很難為大眾接受。
拼音碼和自然碼以漢字拼音為基礎,但漢字中同音字較多,因此重碼較多,況且,對于不會拼音或者拼音不準確的人來說,要掌握拼音碼或者自然碼輸入法非常困難。因此,這兩種方法也難為大眾接受。
目前,比較優(yōu)秀的漢字輸入法是由王永民先生發(fā)明的五筆字型輸人法,該方法是目前較為流行的一種輸入法。其基本思想是將漢字劃分為筆畫、字根、漢字三個層次。由筆畫組成字根,字根組成漢字,按習慣的書寫順序,以字根為基本單位,給漢字編碼,筆畫起輔助作用。
五筆字型編碼輸入法存在以下一些缺點要熟練掌握五筆字型編碼輸入技術,必須花費一定精力記熟基本字根并且要熟練掌握拆字方法。為了簡化漢字輸入技術,有人提出了一種五筆畫漢字輸入法。五筆畫漢字輸入法是一種常用五個鍵,利用漢字的五種基本筆畫,按照漢字筆畫的書寫順序輸入漢字的方法,這是一種簡單易學的方法,對于非專職從事計算機文字自理又不熟悉漢語拼音的人來說,它確是一種較佳的漢字輸入方法。
五筆畫輸入法的編碼一方法是按照漢字的第一、二、三、四、末共五筆來編碼輸入。其缺點是重碼多,速度慢,并且要使用專門的鍵盤。所以,其實用性不大。
本發(fā)明的目的是提供一種簡單易學,并且實用性較大的漢字輸入方法。
發(fā)明是這樣實現(xiàn)的通過對漢字構造的分析與研究,我發(fā)現(xiàn)了漢字具有如下的規(guī)律將構成漢字的筆畫分為橫、豎、撇、捺、折五大類,每個漢字都是由這些基本筆畫按照不同的排列組合組成。不同的漢字的主要區(qū)別是類型筆畫的利用率和使用頻率不同。如“王”字只利用橫和豎兩類筆畫,其中橫類筆畫使用頻率是3次,豎類筆畫使用頻率是1次。與“王”字相似的“壬”字就利用了撇、橫、豎共三類筆畫,其中撇的頻率是1,橫的頻率是2,豎的頻率是1。根據漢字的筆畫構造特點,我想出了一種巧妙的漢字編碼方法,這就是所謂的“漢字筆畫信息碼”。按照這種方法,所有的漢字都可以直接編碼。
漢字筆畫信息碼編碼的方法是直接按照漢字利用的筆畫類型及其使用頻率編碼,并按順序編程。具體特征是區(qū)號對應筆畫類型位號對應使用頻率。用這種方法編碼的漢字可直接使用普通的區(qū)位鍵盤。
漢字筆畫信息碼的優(yōu)點是字庫容量大,無需記憶字根,編碼方法簡單易學,輸入速度適中,重碼少。
編碼方法舉例①、“青”字第一類筆畫是橫,在1區(qū),使用頻率(即筆數)是5,所以輸入第一碼是15;第二類筆畫是豎,在2區(qū),使用頻率是1,輸入第二碼是21;第三類筆畫是撇,在3區(qū),使用頻率是1,輸入第三碼是31;第四類筆畫是折,在5區(qū),使用頻率是1,輸入第四碼是51。
②、“豎”字第一碼是22,第二碼是51,第三碼是44,第四碼是12。
③、“毛”字第一碼是31,第二碼是12,第三碼是51。
④、“高”字第一碼是41,第二碼是13,第三碼是23,第四碼是53。
⑤、“與”字第一碼是51,第二碼是12。
漢字筆畫信息碼的特殊規(guī)定同一類型的筆畫使用頻率在5次以上,當作5次看待。
權利要求
1.漢字筆畫信息碼的特征是無需記憶字根,只要能夠區(qū)分筆畫類型,能夠正確統(tǒng)計同類筆畫的使用頻率(即筆畫數),就可以拆字編碼。其具體特征是區(qū)號對應筆畫類型,位號對應同類筆畫的使用頻率(即筆畫數)。將區(qū)號作為十位數,位號作為個位數,區(qū)號與位號組合成一個碼。
2.根據權利1的要求,運用漢字筆畫信息碼開發(fā)的軟件。
全文摘要
漢字筆畫信息碼提供了一種大眾化的漢字輸入技術,其特點是按照構成漢字的筆畫類型和使用頻率,以及筆畫類型的排列次序直接編碼。具有字庫容量大,無需記憶字根,編碼方法簡單易學,輸入速度適中,重碼少等優(yōu)點。按照這種方法,所有的漢字都可以直接編碼。
文檔編號G06F3/023GK1304078SQ99124908
公開日2001年7月18日 申請日期1999年12月1日 優(yōu)先權日1999年12月1日
發(fā)明者封相如 申請人:封相如