專利名稱:計算機漢通編碼輸入法的制作方法
自一九四六年第一臺電子計算機的誕生,到現(xiàn)在已有五十個春秋了,隨著計算機的普及,電腦進入尋常百姓家的潮流勢不可擋,計算機取代筆墨將是人類文明發(fā)展史上的新紀元。
漢字是我國五千年文化藝術(shù)的結(jié)晶,它以型狀美觀、音義結(jié)合、書寫方便的特點,使中華民族成為歷史上的文明古國。漢字輸入法是我國計算機發(fā)展的關(guān)鍵,電子計算機漢字處理是漢字發(fā)展的第二進程,它將使中華民族文化走向輝煌。
漢字系統(tǒng)的發(fā)展雖然只有十幾年的歷史,但漢字編碼確以萬“碼”奔騰之勢向前發(fā)展,由于漢字字型的復(fù)雜,目前,我國漢字處理基本都是以發(fā)明人其獨特的目光來審視漢字,沒有統(tǒng)一的漢字輸入工具系統(tǒng),目前流行的編碼主要有純形碼、純音碼、音形碼、數(shù)字碼。純形碼必須經(jīng)過正規(guī)學習培訓,學習后如果不進行練習或操作,時間長了還容易忘記,音碼和音形碼雖然較純形碼學習容易,但由于人們認識漢字是有限度的,如果漢字不認識就無法輸入;最易掌握的是全拼輸入法,有漢語拼音知識的人不用培訓就可以操作使用,但是重碼率太高,速度達不到現(xiàn)代文字處理的要求。數(shù)字碼只適用個別專業(yè)應(yīng)用,如電報碼。概括起來說就是輸入速度快的方法,不易被人掌握,易被人掌握的,輸入速度又不快,這是我國普及計算機技術(shù)的障礙。
漢通編碼,是漢字音與形通用的意思,是根據(jù)我國漢字的特點與現(xiàn)在流行的各種較先進的漢字輸入方法基礎(chǔ)之上創(chuàng)造的,既符合我國漢字結(jié)構(gòu)規(guī)律,又適合計算機快速處理漢字技術(shù)的需求。由于我國南北方語音不同,音碼推廣將不如形碼有普遍意義。但字音與鍵盤上的字母有一定的對應(yīng)關(guān)系,對現(xiàn)在與將來的教學發(fā)展有積極及推廣作用。利用字音進行編碼,可以大大的減少字根的記憶量,因此,漢通編碼采用了字形與字音通用的方法,使不會拼音的人可以利用字形來學習,只需要掌握簡單的口訣,會拼音的人可以更快的掌握此方法,只需掌握八個基本筆畫和十四個偏旁部首的記憶代碼,使學習漢通編碼就象人們學習查字典一樣方便。
漢通編碼方案,根據(jù)漢字結(jié)構(gòu)特點,不背離中、小學生識字,科學的對漢字進行拆分、歸類,使筆畫代碼順序與書寫順序相同,以相連接筆畫不拆、兼顧手寫體與印刷體的中略有不同的特點,從而解決了拆字難的問題、對各種不成字的組合筆畫以首筆筆面定義,即首筆為橫的都定義為U、首筆為豎的都定義為I等,解決了代碼多難記憶的問題,用最先進、最科學的記憶方法,編排字根與鍵盤字母對應(yīng)口訣,漢通編碼方案將我國目前標準的GB-2312(80)漢字信息的一、二級漢字進行編碼,使重碼率只占百分之一。規(guī)定了四碼為一個漢字,適合漢字漢字體系的擴充。
漢通編碼方案,適合中、小學識字教學,適合作家、記者、科技人員、專業(yè)打字人員及各類進行漢字錄入人員使用。漢通編碼易記憶、易操作、重碼少、輸入速度快。
漢通編碼的具體內(nèi)容1、基本筆畫漢字的基本筆畫有橫、豎、撇、捺、點、提、折、勾八種,漢通編碼方案,就是把這八種基本筆畫定義在鍵盤上,其代碼是以易記憶、易操作為目的、定義在鍵盤的八個鍵位上。
橫、豎、撇、捺、點、提、折(包括橫折、撇折、豎折、豎提等)、勾(橫勾、豎勾、橫折勾、豎彎勾、彎勾等)的對應(yīng)代碼是U、I、P、O、D、T、A、J,其中撇P、點D、提T利用了筆畫的音與鍵盤上字母的音相似而定義的,橫U、豎I、捺O、折A是以筆畫出現(xiàn)的頻率與人們擊鍵的方便性而定義的,勾J是以我國傳統(tǒng)的撲克牌的J的讀音相同而定義的,有利于記憶。
2、二筆畫以上的組合筆畫字根的定義二筆畫以上的組合筆畫字根,其中有字音,有字義的字根叫獨體字根,如立、刀、口等,漢通方案其選用138個獨體字做編碼字根,其編碼規(guī)則是以獨體字拼音的第一個拼音字母,見
圖1無字音,無字義的組合筆畫叫組合筆畫字根,如,漢通方案共選用186個組合筆畫做編碼字根,見圖3;有字音,無字義的部分偏旁部首,如三點水(氵)、提手旁(扌)等,叫做部首字根,漢通方案共選用14偏旁部首個做編碼字根,見圖2。即漢通方案共選用338個編碼字根。
3、漢字的末筆畫代碼漢字的末筆畫代碼與其基本筆畫代碼相同,即是橫、豎、撇、捺、點、提、折(包括橫折、撇折、豎折、豎提等)、勾(橫勾、豎勾、橫折勾、豎彎勾、彎勾等)的對應(yīng)代碼如是U、I、P、O、D、T、A、J。
4、漢字的結(jié)構(gòu)代碼漢字的結(jié)構(gòu)代碼是左右結(jié)構(gòu)代碼用Z表示,上下結(jié)構(gòu)代碼用S表示,獨體字結(jié)構(gòu)代碼用D表示,包圍字與半包圍字結(jié)構(gòu)代碼都用B表示,(即代碼都是結(jié)構(gòu)類型第一個字的發(fā)音聲母。)5、漢通編碼標準代碼一律是用四個代碼表示,其規(guī)律是對少于四碼的漢字,增加補碼來補充,如果是二碼字,要加二個補碼,第一補碼是末筆筆畫的代碼,第二補碼是字的結(jié)構(gòu)的代碼。如果是三碼字,只加一個補碼,即末筆筆畫的代碼。
6、為提高漢字輸入速度,降低重碼率又定義了一鍵字、二鍵字、三鍵字共1167個。
(1)、一鍵字漢字在使用過程中,出現(xiàn)的頻率高,為了方便漢字輸入,提高輸入漢字的速度,漢通編碼定義了二十五個一鍵字,只要擊一鍵加上一個空格就能顯示出來的字。
(2)、二鍵字、三鍵字為了提高漢字輸入速度,共定義512個二鍵字,三鍵字655個,并有一定的記憶規(guī)律。只要二鍵加上空格或三鍵加上空格就能顯示出來的漢字。
7、定義一定量的詞組,有利于提高漢字的輸入速度。其編碼方案是(1)、二字詞編碼方案是第一個字的首碼+第一個字的尾碼+第二個字的首碼+每二個字的尾碼。即四個鍵碼組成。
(2)、三字詞編碼方案是第一個字的首碼+第二個字的首碼+第三個字的首碼+第三個字母的末碼組成,即四個鍵碼組成。
(3)、四字詞編碼方案是第一個字的首碼+第二個字的首碼+第三個字的首碼+第四個字的首碼,即四個鍵碼組成。
(4)、多字詞編碼方案是第一個字的首碼+第二個字的首碼+第三個字的首碼+第末個字的首碼,即四個鍵碼組成。
8、字根的編碼方法字根本身代碼+第一筆畫代碼+每二筆畫代碼+第末筆畫代碼。如果少于四碼,用最末的筆畫代碼補齊。
9、學習鍵,此方案中把字母、V定為學習鍵,它可以代替字的任何編碼,供學習、操作選字用。
10、方位框筆畫的編碼規(guī)則方位框定義在鍵盤的左側(cè)即標準指法左手打字部位。上框和下框定義在小指(Q、Z鍵)、左框和右框定義在食指(T、B鍵)。見圖3??谧挚?qū)儆诳?,編碼定義在K中,見圖1。
11、兩點、三點、四點、兩撇、三撇等不相連組合筆畫字根的編碼規(guī)則根據(jù)冫、氵部首代碼的位置,兩點筆畫字根定義在F中、三點筆畫字根定義在G中,四點筆畫字根定義在代碼H中,見圖3F、G、H鍵的代碼。
12、耳的最后一筆定義為提。
13、×的筆畫與字母X相似,定義在字母X中,見圖3。
14、對稱筆畫的編碼規(guī)則對稱筆的編碼規(guī)則是根據(jù)“稱”字字音第一個拼音字母C而定義,所以把對稱筆畫都定義在字母C中,見圖3。
15、拆分規(guī)則有撇必分(垂、夕、毛、爪之外),例如處丿
卜,白丿日,自丿目,缶丿干凵,牛丿
,生丿,夭丿大,失丿夫,矢丿天,午丿干,禹丿
,禾丿木,斤
,選丿土兒辶,攵乂等。上點必分(廣除外),例如亥亠
人,主丶王,文亠乂,夜亠亻丿叉等。相連不分,相聯(lián)系的組合筆畫不分。例如
16、對獨體多音字進行折分,只有兩個漢字樂、重。
17、漢字編碼舉例(1)、基本筆畫橫豎撇點的編碼舉例只有一個筆畫,按照末碼補齊的方案為四碼相同即一(UUUU)丨(IIII)丿(PPPP)丶(DDDD)(2)、編碼字根的編碼舉例刀(DJPP)、口(KIAU)、扌(UUJT)、艸(QUII)、來(LUDO)、毛(MPUJ)。
(3)、二碼字的編碼舉例打(UDJZ)、字(DZUS)、漢(GYOZ)、對(YCDZ)、仙(XSIZ)、軍(PCIS)、(4)、三碼字的編碼舉例法(GTAD)、任(XPSU)、標(MEXO)、制(PULJ)、按(UDNU)、砬(UKLU)。
(5)、四碼字的編碼舉例原(CPRX)、能(AYBB)、鎖(UGZR)。
(6)、多碼字的編碼舉例編(ADSQ)、排(USFS)、欷(XUJR)。
(7)、二字詞的編碼舉例漢字(GYDZ)、編劇(AQSL)(8)、三字詞的編碼舉例計算機(OZMJ)、辦公室(LBDT)。
(9)、多字詞的編碼舉例中國人民解放軍(ZKRP)
18、較難拆字拆分舉例(1)、一般較難字拆分乎丿丷
緣纟
豕養(yǎng)丷
乍丿丨二互一
一丑折十一甘艸二且冂二一具冂三一八巫一丨人一久丿
辰廠二
而
冂
辦力(對稱)卯
丿卩予
虧二
考
(2)、馬魚米門的拆分馬的拆分方法馬拆分成
和一,做部首時折分成
和提。魚的拆分方法魚拆分成
和一,做部首時折分成
和提。米的拆分方法米拆分成丷和木。門的拆分方法門拆分成
和。石的拆分方法石拆分成
丆和口。
權(quán)利要求
1.一種以漢字的字音與字形通用的計算機漢通編碼輸入法。
2.定義漢字的基本筆畫橫、豎、撇、捺、點、提、折、勾八種的鍵盤位置是U、I、P、O、D、T、A、J。
3.對二筆畫以上組合筆畫字根的定義,共選用二筆筆畫以上的字根定義了338個,其中138個獨體字做編碼字根,見圖1;定義了14個部首編碼字根,見圖2;定義了186個組合筆畫字根編碼字根,見圖3;是漢通編碼形成的依據(jù)。
4.對組合筆畫字根的首筆進行定義,按照字根首筆的起筆筆畫,定義八種筆畫,即橫、豎、撇、捺、點、提、折、勾八種筆畫,鍵盤位置是U、I、P、O、D、T、A、J。
5.對漢字的末筆畫代碼的定義,漢字的末筆畫代碼與基本筆畫代碼相同,即是橫、豎、撇、捺、點、提、折、勾的對應(yīng)代碼如是U、I、P、O、D、T、A、J。
6.對漢字的結(jié)構(gòu)代碼的定義,漢字的結(jié)構(gòu)代碼定義左右結(jié)構(gòu)代碼用Z表示,上下結(jié)構(gòu)代碼用S表示,獨體字結(jié)構(gòu)代碼用D表示,包圍字與半包圍字結(jié)構(gòu)代碼都用B表示。
7.漢通編碼標準代碼一律是用四個代碼表示,其規(guī)律是對少于四碼的漢字,增加補碼來補充,如果是二碼字,要加二個補碼,第一補碼是末筆筆畫的代碼,第二補碼是字的結(jié)構(gòu)的代碼。如果是三碼字,只加一個補碼,即是末筆筆面的代碼。
8.對CB--2312(80)中全部漢字依漢通方案進行編碼,形成一套漢通編碼碼表。
9.執(zhí)行漢通編碼的各種軟件的開發(fā)與制作。
10.可以應(yīng)用在一切大、中、小型微機、中文信息處理的電腦系統(tǒng)、漢字電傳機、漢字電腦打字機、電腦學習機、漢字終端及通迅系統(tǒng)中。
全文摘要
計算機漢通編碼輸入法(簡稱漢通編碼)是字音與字形通用的意思,其特點是以八個基本筆畫和十四個偏旁部首為最小記憶量;以百分之一為最小重碼率;以漢字相連交部分不拆分為拆分原則,其編碼順序又與漢字的書寫順序相同,解決了目前漢字輸入方法中存在的易學習的方法輸入速度慢,輸入速度快的方法不易學的矛盾,碼長為四鍵,適應(yīng)于漢字及詞組的擴充。適用于專業(yè)與非專業(yè)漢字信息處理,學習起來就象學習查字典一樣方便。
文檔編號G06F3/00GK1159026SQ9610486
公開日1997年9月10日 申請日期1996年5月7日 優(yōu)先權(quán)日1996年5月7日
發(fā)明者李波 申請人:李波