專利名稱:字典碼漢字輸入法的制作方法
技術領域:
本發(fā)明涉及一種計算機漢字輸入方法,同時也是一種漢字的檢索方法,具體地說是一種字典碼漢字輸入法。
現有技術中的計算機漢字輸入方法有很多種,它們設計思想主要考慮了輸入速度快、容易掌握與重碼率低等方面,基本沒有考慮漢字輸入方法與中、小學生對漢字的學習相聯(lián)系,也沒有考慮輸入方法與字典的漢字編排、檢索相聯(lián)系。特別是那些采用拆分漢字結構來編碼的大多數輸入方案,人為制訂的漢字拆分規(guī)則,往往與國家有關部門制訂的漢字規(guī)范不一致,這對人們掌握漢字結構與書寫筆順都有很大的負面影響。隨著計算機的普及與大量使用,長期用鍵盤“寫字”,會造成人們用筆寫字能力的下降,很多經常在計算機上工作的人都出現了“提筆忘字”的現象。這種現象對正在學習階段的廣大中、小學生更是一種損害。學習計算機要從娃娃抓起,而長期使用鍵盤輸入與學習漢字又存在矛盾,現有的漢字輸入方法沒有解決這一問題。另外,中、小學生在學習各種漢字輸入法的同時,還在學習查字典的方法,目前的各種漢字輸入法與查字典的方法互不相干,而且按現有字典的編排方法,從部首檢索到查找字意要進行三次檢索,十分不便,這些都增加了學生的負擔。對成人來說,在字典里檢字是一種麻煩、枯燥的事,降低了人們識字用字的興趣。
本發(fā)明的任務是克服現有技術中漢字輸入與漢字檢索方法的缺點,提供一種輸入速度快、容易掌握、重碼率低,符合國家規(guī)范的漢字編碼方法,并且其編碼規(guī)律與中、小學生學習漢字的規(guī)律相同。本方法的漢字部件與編碼之間具有可拼讀的優(yōu)點,其規(guī)律就如人們習慣中常說的“弓長張;木子李”,能作到見字識碼,使中、小學生掌握這種漢字輸入方法的同時,鞏固對漢字結構的記憶與掌握;這種編碼方法又可以用于字典的漢字編排,使字典的檢索方法更加簡便,并且使學生對漢字的學習、對漢字鍵盤輸入方法的學習、對字典查閱方法的學習三者有機地結合起來,使這些方法更科學,更加容易掌握。本發(fā)明的標準依據是國家語委1997年發(fā)布,1998年實施的語言文字規(guī)范GF3001-1997《信息處理用GB13000.1字符集漢字部件規(guī)范》,以及國家語委1997年發(fā)布并實施的《現代漢語通用字筆劃規(guī)范》。本漢字編碼方法中的漢字分解無倒筆順,部件設置與拆分符合規(guī)范要求,符合漢字自身的特點,符合人們對漢字的基本認識。實現上述發(fā)明目的的技術方案是采用下述原理先將漢字分解成構字部件,然后對漢字部件進行編碼,最后取漢字部件的編碼作為該字的編碼(最長為四碼)。具體說明如下一、漢字的部件漢字可以分解成各種筆劃或部件,這些筆劃或部件的分類與編碼規(guī)則如下1、成字部件,取該漢字漢語拼音的首字母作為編碼,例如部件“人”字是成字,其編碼為R。非成字部件,取其名稱中反映該部件主要特征的那個漢字拼音的首字母作為編碼,例如非成字部件“亻”的名稱為“單人旁”,特征字為“人”,拼音首字母為R,則“亻”的編碼為R。
2、將漢字的部件分為可交叉部件和不可交叉部件兩大類,共計219個(組),部件編碼使用的字母21個,詳見“漢字部件編碼袁1”(主要用于漢字輸入)和“漢字部件編碼表2”(主要用于漢字檢索)??山徊娌考灿?個(組),這9個部件之間各可交叉(指部件之間的筆劃交叉),它們分別是
<p>雪字底(彐、
)編碼為X;成字口(口) 編碼為K成字目(曰) 編碼為R。
不可交叉部件共有210個(組),這些部件本身不能與其他部件相交叉(指筆劃之間的交叉)。例如“人”字為不可交叉部件,所以“內”字,不能拆分成“”和“人”,而是用可交叉部件拆分成“”和“丿、”,編碼為KPD。點與捺“丶和”可看成是搭掛在其他部件之上,不作為交叉部件看待。例如“斥”字應拆分成“斤丶”;“史”字應拆分成“
”。
二、漢字的拆分1、單筆劃漢字無需拆分,它的編碼即為部件的編碼,例如“一”字是一(橫)筆劃,它的編碼為H,“乙”字為一折筆劃,它的編碼為Z。
2、多筆劃漢字必須拆分成兩個以上的部件,如遇相鄰部件有交叉筆劃的情況,則用9種可交叉部件來拆分。一個多筆劃漢字有多種拆分結果時,必須遵循以下的優(yōu)先次序a、相鄰部件之間不允許倒筆劃(即不允許倒筆劃拆分漢字)b、部件大的優(yōu)先(即兩相鄰部件中能出現大部件的那種拆分結果最優(yōu)先)c、成字大的優(yōu)先(當兩相鄰部件中的最大部件筆劃數相同時,成字大的優(yōu)先)d、次序前的優(yōu)先(當兩相鄰部件中的最大部件筆劃數相同,且成字部件筆劃數相同或均沒有成字時,最大部件最先出現的那種拆分結果最優(yōu)先)。
3、漢字拆分的一般步驟是從最大的部件開始拆分和查找,若最大部件不是“字典碼部件編碼表”中的部件,則將其再拆分成小一些的部件,如遇到與相鄰部件有交叉筆劃的情況,優(yōu)先用九種可交叉部件來拆分。例如“順”字先分解為“川”和“頁”,查部件編碼表1或2,“川”的編碼為C,而“頁”不是本編碼表中的部件,因此將“頁”再拆分成“丆貝”,再查編碼表,其代碼分別為M和B,即“順”字分解成三個部件,編碼為CMB;又如“井”字由交叉部件組成,應用9種交叉部件來拆分,拆分結果為“二丿丨”編碼為HPS。
三、漢字編碼取漢字的第1、2、3與最后一個部件的編碼組成該字的編碼,最大碼長為四碼。本方案作為檢索方法時,每個漢字并不要求一定有四個碼;而作為漢字輸入方法,當一個字的部件編碼不足四碼時,用該漢字拼音的第一個字母補入,補入后仍不足四碼時,或因不會讀音而不能正確補入拼音字母時,則按空格鍵。例如“張”字的部件編碼為GC,補入其拼音首字母Z,則該字的字典碼為GCZ。又如“一”字的計算機漢字編碼為HY。
本編碼方案還設置有模糊鍵V,作為通用鍵。
本方案的重碼率非常低,如出現重碼時,則根據屏幕上提示同碼字順序,按下該字所標注的數碼鍵即可。
四、詞組編碼雙字詞由每字的前兩碼組成,三字詞前兩字取首碼,最后一字取前兩碼,四字詞取每字的第一碼,多字詞取前三字的首碼及最末一字的首碼。
本方案的“漢字部件編碼表1”和“漢字部件編碼表2”附在本《說明書》實施例的后面。
按照以上原理,本發(fā)明使用通用的計算機鍵盤具體操作方案是一種字典碼漢字輸入法,其步驟為a、按照書寫漢字時規(guī)范的筆畫順序,依次按下第1、2、3與最后一個部件的編碼鍵,b、對于部件編碼不足四碼的漢字,再按下該漢字拼音的第一個字母鍵或V鍵,鍵入后仍不足四碼時,再按空格鍵,c、出現重碼時,按數碼鍵。
輸入詞組的步驟為雙字詞按下第一字第一碼的字母鍵,按下第一字第二碼的字母鍵,按下第二字第一碼的字母鍵,按下第二字第二碼的字母鍵。
三字詞按下第一字第一碼的字母鍵,按下第二字第一碼的字母鍵,按下第三字第一碼的字母鍵,按下第三字第二碼的字母鍵。
四字詞按下第一字的第一碼的字母鍵,按下第二字的第一碼的字母鍵,按下第三字的第一碼的字母鍵,按下第四字的第一碼的字母鍵。
多字詞按下第一字第一碼的字母鍵,按下第二字第一碼的字母鍵,按下第三字第一碼的字母鍵,按下最末一字第一碼的字母鍵。
本發(fā)明的字典碼克服了現有漢字輸入方法的缺點,是一種輸入速度快、容易掌握、重碼率低,并且其編碼規(guī)律與中、小學生學習漢字的規(guī)律相同,在學校推廣使用本字典碼,可使中、小學生在掌握這種漢字輸入方法的同時,鞏固對漢字結構的記憶與掌握;這種編碼方法又可以用于字典的漢字編排,使字典的檢索方法更加簡便,并且使學生對漢字的學習、對漢字鍵盤輸入方法的學習、對字典查閱方法的學習三者結合起來,使這些方法更科學,中、小學生更容易掌握,而且可減輕學生的學習負擔。
實施例1,“事”字按書寫規(guī)范拆分成一、口、、丨四個可交叉部件,編碼為HKXS。
實施例2,“萬”字正確的拆分方法是分成“一
”,編碼為HB,而不是拆分成“廠
”或“一
丿”。
實施例3,“美”字應拆分成“丷王大”,編碼為DWD,而不是“土大”。
實施例4,“天”字應拆分成“一大”,編碼為HD,而不是“
”。
實施例5,“行”字應拆分成“彳一丁”,編碼為RYD,而不是“彳二丨”。
實施例6,“國”字應拆分成“王丶一”,編碼為KWDH,而不是“口王丶”。
實施例7,“義”字應拆分為“丶ㄨ”,編碼為DY,而不是“ㄨ丶”。
實施例8,“南”字應拆分為“
丷
”編碼為SKDG,而不是
實施例9,“亡”字應拆分為“亠
”,編碼為WZ,而不是“丶
”。
實施例10,用本發(fā)明的字典碼作為索引編輯字典,將傳統(tǒng)字典的檢字表或正文部分按字典碼的升序(A-Z)排列即可,例如“我”字編碼為PHSD,在PHSD處便可查到“我”字。
漢字部件編碼表(1)
注1折()包括除豎鉤(亅)之外的各種折筆筆劃。注2本表中,漢字成字的編碼為該漢字拼音的首字母;非成字部件的編碼,應取部件名稱中反映該部件主要特征的那個漢字的拼音首字母作為該部件的編碼。例如“亻”的名稱為“單人旁”,其特征字為“人”,而“人”字的拼音首字母為r,那么“亻”的編碼為r。注3圓括號內的部件為同類異體部件,它們具有相同的編碼。
漢字部件編碼表(2)(部件的右邊依次為部件的名稱和部件的編碼)
權利要求
1.一種字典碼漢字輸入法,其步驟為a、按照書寫漢字時規(guī)范的筆畫順序,依次按下第1、2、3與最后一個部件的編碼鍵,b、對于部件編碼不足四碼的漢字,再按下該漢字拼音的第一個字母鍵或V鍵,鍵入后仍不足四碼時,再按空格鍵,c、出現重碼時,按數碼鍵。
2.按照權利要求1所述的字典碼漢字輸入法,輸入詞組的步驟為雙字詞按下第一字第一碼的字母鍵,按下第一字第二碼的字母鍵,按下第二字第一碼的字母鍵,按下第二字第二碼的字母鍵,三字詞按下第一字第一碼的字母鍵,按下第二字第一碼的字母鍵,按下第三字第一碼的字母鍵,按下第三字第二碼的字母鍵,四字詞按下第一字的第一碼的字母鍵,按下第二字的第一碼的字母鍵,按下第三字的第一碼的字母鍵,按下第四字的第一碼的字母鍵,多字詞按下第一字第一碼的字母鍵,按下第二字第一碼的字母鍵,按下第三字第一碼的字母鍵,按下最末一字第一碼的字母鍵。
全文摘要
字典碼漢字輸入法,同時也是一種漢字的檢索方法。先將漢字分解成構字部件,然后對漢字部件進行編碼,最后取漢字部件的編碼作為該字的編碼,最長為四碼。其標準依據是國家語委的語言文字規(guī)范,分解無倒筆順,部件設置與拆分符合規(guī)范要求,其編碼規(guī)律與中、小學生學習漢字的規(guī)律相同,可使中、小學生在掌握這種漢字輸入方法的同時,鞏固對漢字結構的記憶與掌握,可減輕學生的學習負擔。
文檔編號G06F3/023GK1268690SQ00112270
公開日2000年10月4日 申請日期2000年5月11日 優(yōu)先權日2000年5月11日
發(fā)明者劉愈 申請人:劉愈