專利名稱:筆劃編碼漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入法,特別涉及一種筆劃編碼漢字輸入法。
自七十年代末開始,我國就進(jìn)行了漢字計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤輸入的研究,時(shí)至今日已有二十多年的歷史,二十多年來從未間斷,產(chǎn)生了近千種編碼方案。很多方案都有自己的獨(dú)到之處,同時(shí)也有其缺點(diǎn),所以絕大部分專家學(xué)者,甚至計(jì)算機(jī)專業(yè)人員,都一直使用“全拼”作為其首選輸入法,連簡拼都不常使用,其主要原因在于他(她)們并不需要經(jīng)常輸入漢字,不愿意化時(shí)間和精力去學(xué)習(xí)并掌握一種輸入法,一種好的輸入法應(yīng)該同時(shí)具備易學(xué)、易記、碼短、規(guī)范、易掌握、重碼率低六個(gè)要素。這六個(gè)要素往往互相矛盾,致使一直沒有一種大眾公認(rèn)的理想漢字輸入法出現(xiàn)。
本發(fā)明的目的是推出一種易學(xué)、易掌握、適合于不同文化層次的人的漢字標(biāo)準(zhǔn)鍵盤輸入法,能夠不記字根、不拆字、易學(xué)、規(guī)范。
本發(fā)明的技術(shù)方案如下按常規(guī)把漢字的所有筆劃歸納為橫(一)、豎(|)、撇(丿)、折(乙)、點(diǎn)(丶)五種,分別賦予1、2、3、4、5五個(gè)不同編號,任意兩個(gè)筆劃的編號相加之和只可能為2、3、4、5、6、7、8、9、10九個(gè)值中的一個(gè)。
若某一筆劃明顯穿過別的筆劃,稱這樣的筆劃為交筆。由此,任意兩個(gè)筆劃中交筆的組合狀態(tài)只可能為0交筆(即兩筆都不是交筆)。
1交筆(即兩筆中一筆是交筆,另一筆不是交筆)。
2交筆(即兩筆都是交筆)。
把計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤上的英文字母看作一張3行×9列的表,正好同任意兩個(gè)筆劃的編號之和及交筆組合狀態(tài)建立一一對應(yīng)的關(guān)系,也就是說任意兩個(gè)筆劃的編碼可以通過查表得到,構(gòu)成漢字的基本單位是筆劃,能夠?qū)P劃編碼,也就能夠?qū)h字編碼,但由于每個(gè)漢字的筆劃數(shù)有多有少,在本發(fā)明中,任何漢字只取它的前四筆和末兩筆參與編碼,中間的筆劃都予以省略,而引入漢語拼音的第一個(gè)字母來區(qū)別重碼,即任何漢字取第1、2筆+第3、4筆+最末兩筆+該字漢語拼音的第一個(gè)字母作編碼,不足不取,除第1碼外,單筆劃都不參與編碼。任何偏旁取第1、2筆+第3、4筆+偏旁的讀音作編碼,同樣地,不足不取,除第1碼外,單筆劃都不參與編碼。
詞組和短語的編碼。本發(fā)明中收入詞組和短語近四萬條,每條最多取四碼,規(guī)則為二字,首字第1碼+末字第1碼+首字拼音第1個(gè)字母+末字拼音第1個(gè)字母。
三字,首字第1碼+次字第1碼+末字第1碼+末字拼音第1個(gè)字母。
四字或四字以上,首字第1碼+次字第1碼+第三字第1碼+第四字第1碼。
本發(fā)明只要理解五種筆劃編號和交筆的概念即可,不記字根、不拆字,連鍵盤都必記,最長不超過4碼,而且詞組種短語與單字一樣可以用簡碼輸入,大大縮短了平均碼長。
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步詳細(xì)的說明
圖1為漢字筆劃分類編號表;圖2為鍵位圖;圖3為標(biāo)準(zhǔn)鍵盤漢字輸入法編碼集表。
按常規(guī)把漢字的所有筆劃歸納為橫(一)、豎(丨)、撇(丿)、折(乙)、點(diǎn)(丶)五種,分別賦予1、2、3、4、5五個(gè)不同編號,任意兩個(gè)筆劃的編號相加之和只可能為2、3、4、5、6、7、8、9、10九個(gè)值中的一個(gè),如“一”+“一”=1+1=2、“一”+“丨”=1+2=3、“丿”+“丶=3+5=8;“丶”+“丶”=5+5=10、“乙”+“丶”=4+5=“丶”+“乙”=5+4=9。
這樣給筆劃編號可減少重碼的出現(xiàn)。
若某一筆劃明顯穿過別的筆劃,稱這樣的筆劃為交筆。如“王”字第2筆的“一”和第3筆的“丨”都稱為交筆,而第1、4筆的“一”不是交筆。至于一些似交非交的筆劃都不算交筆,如“存”字第3筆的“1”就不算交筆。
由此,任意兩個(gè)筆劃中交筆的組合狀態(tài)只可能為0交筆(即兩筆都不是交筆),如“元”字前兩筆。
1交筆(即兩筆中一筆是交筆,另一筆不是交筆),如“干”字前兩筆。
2交筆(即兩筆都是交筆),如“夫”字前兩筆。
把計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤上的英文字母看作一張3行×9列的表,正好同任意兩個(gè)筆劃的編號之和及交筆組合狀態(tài)建立一一對應(yīng)的關(guān)系,也就是說任意兩個(gè)筆劃的編碼可以通過查表得到,為方便起見,我們把10的0去掉即為1,如“元”、“干”、“夫”三字前兩筆編號之和都為“一”+“一”=1+1=2,由上表可以查到“元”字前兩筆的編碼為W、“干”字前兩筆的編碼為S、“夫”字前兩筆的編碼為X。查表時(shí)請注意Z、P兩鍵位置的變化。
構(gòu)成漢字的基本單位是筆劃,能夠?qū)P劃編碼,也就能夠?qū)h字編碼,但由于每個(gè)漢字的筆劃數(shù)有多有少,所以在本發(fā)明中,任何漢字只取它的前四筆和末兩筆參與編碼,中間的筆劃都予以省略,而引入漢語拼音的第一個(gè)字母來區(qū)別重碼,即任何漢字取第1、2筆+第3、4筆+最末兩筆+該字漢語拼音的第一個(gè)字母作編碼,不足不取,除第1碼外,單筆劃都不參與編碼。任何偏旁取第1、2筆+第3、4筆+偏旁的讀音作編碼,同樣地,不足不取,除第1碼外,單筆劃都不參與編碼。
單字的編碼實(shí)例,如“二”字前兩筆編號之和為“一”+“一”=1+1=2、兩筆都不是交筆,1、2筆的編碼為W,沒有第3、4筆,“二”的讀音為“Er”,所以“二”的編碼為WE。
“于”字前兩筆編號之和為“一”+“一”=1+1=2、有1交筆,1、2筆的編碼為S,余下第3筆為單筆劃,不參與編碼,“于”的讀音為“Yi”,故“于”的編碼為S+Y=SY。
“一”字只有1筆,編號為1,非交筆,編碼為Q,“一”的讀音為“Yi”,故“一”的編碼為Q+Y=QY。
“類”字前兩筆編號之和為“丶”+“丿”=5+3=8、兩筆都不是交筆,1、2筆的編碼為I,3、4筆編號之和為“一”+“丨”=1+2=3、兩筆都是交筆,3、4筆編碼為C,末兩筆之和為“丿”+“丶”=3+5=8,有1交筆,末兩筆編碼為K,“類”的讀音為“Lei”,故“類”的編碼為ICKL。
以此類推,“?!钡木幋a為F+C+N=FCN、“電”的編碼為H+X+D=HXD、“傻”的編碼為T+T+P+S=TTPS、“乙”的編碼為R+Y=RY、“打”的編碼為BSD。
偏旁的編碼實(shí)例,如“丨”-WPP、“氵”-QPP、“钅”-RSPP、“--EUPP。
詞組和短語的編碼。本發(fā)明中收入詞組和短語近四萬條,每條最多取四碼,規(guī)則為
二字,首字第1碼+末字第1碼+首字拼音第1個(gè)字母+末字拼音第1個(gè)字。如“如果”-MYRG;“所以”-YOSY;“我國”-FYWG。
三字,首字第1碼+次字第1碼+末字第1碼+末字拼音第1個(gè)字母。如“如果說”-MYOS;“所以然”-YOUR;“千斤頂”-FYTD。
四字或四字以上,首字第1碼+次字第1碼+第三字第1碼+第四字第1碼。如“持之以恒”-BOOU;“民意測驗(yàn)”-TYQI;“沒事找事”-QDBD;“具有特別重要的意義”-YVFY;“造成直接經(jīng)濟(jì)損失”-FFCB;“為人民服務(wù)”-KITU;“由于種種原因”-HSFF。
簡碼。本發(fā)明中,簡碼已不局限于單個(gè)字,對于詞組和短語同樣有簡碼。
一級簡碼只需輸入第1碼+空格,如“的”、“地”、“不”、“為”、“以”、“也”、“如”、“一”……等共25個(gè);二級簡碼只需輸入前兩碼+空格,如“五”、“往”、“等等”、“由于”、“如果”、“所以”、“可以”、“其實(shí)”、“由此可見”、“現(xiàn)在”……;三級簡碼輸入前三碼+空格,如“熟”、“并肩戰(zhàn)斗”、“獨(dú)領(lǐng)風(fēng)騷”……。
在Windows95中,如果選用“逐級提示”,簡碼不需要記憶。采用簡碼字詞輸入,對提高輸入速度非常有幫助。
查找。本發(fā)明嚴(yán)格依照上海辭書出版社出版的《漢字寫法規(guī)范字典》進(jìn)行編碼,為了維護(hù)漢字書寫規(guī)范化,一律不采用容錯技術(shù),但用戶可以用“?”代替不知筆順和不知讀音的編碼。由于編碼時(shí),兩筆不分先后,如“一”+“丨”=1+2=“丨”+“一”=2+1=3,對第1碼和第3碼幾乎不影響,同時(shí),僅有的漢語拼音的第一個(gè)字母都處于編碼的末尾,一般打完第3碼時(shí),提示行中會出現(xiàn)所要的字,所以懂不懂拼音,知不知筆順,影響不大。
權(quán)利要求
1.一種筆劃編碼漢字輸入法,其特征在于第一步,按常規(guī)把漢字的所有筆劃歸納為橫(一)、豎(丨)、撇(丿)、折(乙)、點(diǎn)(丶)五種,分別賦予1、2、3、4、5五個(gè)不同編號,任意兩個(gè)筆劃的編號相加之和只可能為2、3、4、5、6、7、8、9、10九個(gè)值中的一個(gè);第二步,若某一筆劃明顯穿過別的筆劃,稱這樣的筆劃為交筆,至于一些似交非交的筆劃都不算交筆,由此,任意兩個(gè)筆劃中交筆的組合狀態(tài)只可能為0交筆(即兩筆都不是交筆),1交筆(即兩筆中一筆是交筆,另一筆不是交筆),2交筆(即兩筆都是交筆);第三步;把標(biāo)準(zhǔn)鍵盤上的英文字母看作一張3行×9列的表,正好同任意兩個(gè)筆劃的編號之和及交筆組合狀態(tài)建立一一對應(yīng)的關(guān)系,也就是說任意兩個(gè)筆劃的編碼可以通過查表得到;第四步,構(gòu)成漢字的基本單位是筆劃,能夠?qū)P劃編碼,也就能夠?qū)h字編碼,但由于每個(gè)漢字的筆劃數(shù)有多有少,任何漢字只取它的前四筆和末兩筆參與編碼,中間的筆劃都予以省略,而引入漢語拼音的第一個(gè)字母來區(qū)別重碼,即任何漢字取第1、2筆+第3、4筆+最末兩筆+該字漢語拼音的第一個(gè)字母作編碼,不足不取,除第1碼外,單筆劃都不參與編碼。
2.根據(jù)權(quán)利要求1所述的筆劃編碼漢字輸入法,其特征是任何偏旁取第1、2筆+第3、4筆+偏旁的讀音作編碼,同樣地,不足不取,除第1碼外,單筆劃都不參與編碼。
3.根據(jù)權(quán)利要求1所述的筆劃編碼漢字輸入法,其特征是本發(fā)明中收入詞組和短語近四萬條,每條最多取四碼,規(guī)則為二字,首字第1碼+末字第1碼+首字拼音第1個(gè)字母+末字拼音第1個(gè)字母;三字,首字第1碼+次字第1碼+末字第1碼+末字拼音第1個(gè)字母;四字或四字以上,首字第1碼+次字第1碼+第三字第1碼+第四字第1碼。
全文摘要
筆劃編碼漢字輸入法把漢字的所有筆劃歸納為橫(一)、豎(丨)、撇(丿)、折(乙)、點(diǎn)(、)五種,分別賦予1、2、3、4、5五個(gè)不同編號;任何兩筆可能出現(xiàn)三種交筆狀態(tài);把計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤上的英文字母看作一張3行×9列的表,正好同任意兩個(gè)筆劃的編號之和及交筆組合狀態(tài)建立一一對應(yīng)的關(guān)系。本發(fā)明只要理解五種筆劃編號和交筆的概念即可,不記字根、不拆字,連鍵盤都必記,最長不超過4碼,而且詞組種短語與單字一樣可以用簡碼輸入,大大縮短了平均碼長。
文檔編號G06F3/023GK1224188SQ9810025
公開日1999年7月28日 申請日期1998年1月19日 優(yōu)先權(quán)日1998年1月19日
發(fā)明者宋忠誼 申請人:宋忠誼