專利名稱:結(jié)構(gòu)型漢字編碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼輸入技術(shù),特別涉及在計(jì)算機(jī)、打字機(jī)及類似裝置上使用的漢字編碼輸入方式的文字處理系統(tǒng)。
隨著微型計(jì)算機(jī)在各個(gè)領(lǐng)域的廣泛使用,國(guó)內(nèi)外的研究人員通過(guò)對(duì)微型計(jì)算機(jī)上流行的行編輯程序以及字處理系統(tǒng)進(jìn)行改造,已將其用于對(duì)漢字的輸入與編輯。在漢字輸入方法上應(yīng)用面較廣泛的幾種漢字操作系統(tǒng)中,主要配備了拼音、聯(lián)系、區(qū)位、國(guó)標(biāo)、電報(bào)、首尾、五筆字型等漢字輸入方案。其中“五筆字型”是目前國(guó)內(nèi)影響較大,應(yīng)用面較廣,公認(rèn)使用較為方便合理的一種漢字輸入法。雖然“五筆字型”漢字輸入方法比較直觀易學(xué),輸入速度也較快,但由于其必須使用二十五個(gè)字母鍵來(lái)表示125個(gè)字根,在每個(gè)鍵位上一般安排有2至6種字根,鍵入字根時(shí),需要查找各基本字根所在的鍵位,操作者在指法上必須經(jīng)過(guò)較長(zhǎng)時(shí)間的專門訓(xùn)練、熟練記憶并掌握各字根所在的鍵位,才能達(dá)到一定的操作速度和實(shí)現(xiàn)盲打,訓(xùn)練時(shí)間較長(zhǎng),記憶量較大,不便于迅速普及推廣。
本發(fā)明的目的在于提供一種操作更為簡(jiǎn)便迅度的漢字編碼輸入方法。
當(dāng)我們對(duì)漢字字形加以分析,就能得出這樣的結(jié)論,有的漢字可以分析出幾個(gè)具有獨(dú)立意義的漢字,有的漢字卻不能再行分析,那些不能再行分析的具有完整形體和獨(dú)立造字意圖的漢字,我們稱之為獨(dú)體字。而那些由兩個(gè)或兩個(gè)以上的獨(dú)體字按一定的組合規(guī)律組合而成的,有一定造字意圖的漢字,稱之為合體字。部首是指不具有獨(dú)立造字意圖的,但具有完整的形體,與獨(dú)體字能夠構(gòu)成合體字的單位,部首中有的是獨(dú)體字的變形,更多的則是純粹的結(jié)構(gòu)符號(hào)。當(dāng)我們把部首和獨(dú)體字稱為字根時(shí),也可以說(shuō)漢字是以字根為單位,采用積木方式拼合起來(lái)的,而字根又由筆形構(gòu)成。也就是說(shuō)把每個(gè)字根機(jī)械地進(jìn)行分析,就可得到若干的筆形,每個(gè)字根都具有一定數(shù)目的筆形,筆形的數(shù)量我們稱之為筆畫。
本發(fā)明就是利用了漢字組合的這一特征,設(shè)計(jì)出結(jié)構(gòu)型漢字編碼方案的。
本發(fā)明是這樣實(shí)現(xiàn)的。
本發(fā)明涉及一種在計(jì)算機(jī)、打字機(jī)及類似裝置上使用漢字編碼輸入方式的文書處理系統(tǒng),在該文書處理系統(tǒng)中的操作鍵盤上至少包括下列操作鍵功能鍵,即用于決定操作時(shí)編碼的輸入方式的鍵;
數(shù)字鍵,即用于輸入漢字編碼的鍵;
選字鍵,即用于對(duì)提示行上的字進(jìn)行選擇的鍵;
空格鍵,即用于要求繼續(xù)提示的鍵;
清除鍵,即用于作廢某一次字碼輸入的鍵;
對(duì)于錯(cuò)誤碼或不存在的字碼的輸入,系統(tǒng)會(huì)自動(dòng)作廢該次輸入,并發(fā)出信號(hào),等待新的輸入,本發(fā)明特征在于在對(duì)上述數(shù)字鍵進(jìn)行操作時(shí),所采用的漢字編碼輸入方法為一、將獨(dú)體字的編碼按照第一碼取該字的筆畫,即字碼,第二碼補(bǔ)零,第三碼取該字的起筆筆形代碼,第四碼取該字的收筆筆形代碼。
上述編碼中所提到的筆形是指構(gòu)成現(xiàn)代漢字的各種點(diǎn)和線的形狀。為了適合漢字編碼技術(shù)的需要,我們將各種筆形概括為五種筆形,即橫、豎、捺、撇、勾。依其使用頻度,設(shè)立相應(yīng)的代碼為0、9、8、7、6。即下列筆形配上下列相應(yīng)的筆形為0-橫-一ㄥ
9-豎-丨
亅8-捺-
丶ㄑ7-撇-丿フ
6-勾-乙乚乛了
由上述規(guī)則可見(jiàn),下列獨(dú)體字的編碼為手4079,筆畫4,補(bǔ)0,起筆筆形代碼7,收筆筆形代碼9。
良7088,筆畫7,補(bǔ)0,起筆筆形代碼8,收筆筆形代碼8。
二、將合體字的編碼按照筆形的書寫順序“讀”出組成合體字的各個(gè)部件(包括獨(dú)體字、部首或筆形)的筆畫數(shù)(即字碼或代碼,一般為0-9)的一組四位碼作為該合體字的編碼。
a、如果一個(gè)合體字的部件超過(guò)四部時(shí),按漢字的結(jié)構(gòu)取前四部筆畫編碼,例如嘲3242口-3,十-2,日-4,十-2橙4513木-4,癶-5,一-1,口-3滾3222氵-3,亠-2,八-2,厶-2b、如果一個(gè)合體字的部件剛好四部時(shí)按漢字的結(jié)構(gòu)順序依次取四部筆畫,構(gòu)成漢字的四位編碼,例如路3433口-3,止-4,夂-3,口-3統(tǒng)3222纟-3,亠-2,厶-2,兒-2常3233-3,冖-2,口-3,巾-3c、如果一個(gè)合體字的部件為三部時(shí)按漢字的結(jié)構(gòu)順序依次取三部筆畫,第四碼取該字末部的收筆筆形代碼,如程5340禾-5,口-3,王-4,收筆“一”的筆形代碼為0,黃4528-4,由-5,八-2,收筆“丶”的筆形代碼為8,d、如果一個(gè)合體字的部件為二部時(shí)按漢字的結(jié)構(gòu)順序依次取二部筆畫,第三、四碼取末部的起筆及收筆筆形代碼,如取6278 耳-6,又-2,又的起筆筆形“
”代碼為7,收筆筆形“
”代碼為8,三、詞匯編碼,在中文中,由單字可以組成成千上萬(wàn)條的詞匯,且字和詞是混合在一起使用的,為了體現(xiàn)中文漢字的這一特點(diǎn),在以單字編碼為基礎(chǔ)上,結(jié)構(gòu)型設(shè)立了詞匯編碼,使系統(tǒng)既能準(zhǔn)確地處理盡可能多的單字,又能有效地處理常用詞匯。為了相應(yīng)地提高輸入速度,所有詞匯編碼一律為等長(zhǎng)四碼,其碼型與單字碼完全相同。詞匯編碼按組成詞匯的單字?jǐn)?shù),分為雙字詞、三字詞、四字詞和多字詞四種情況,其輸入方式如下a、雙字詞取每個(gè)單字的前二碼,組成四位碼,如果詞匯中的字為獨(dú)體字,則按該獨(dú)體字的筆畫取兩個(gè)相同的重碼,如對(duì)待2332一定1135滋長(zhǎng)3344b、三字詞取前兩個(gè)字的第一碼,最后一個(gè)字的前兩碼,(若最后一個(gè)字為獨(dú)體字時(shí),取相同碼)組成四碼,如新技術(shù)2355計(jì)算機(jī)2642微型機(jī)3142c、四字詞每個(gè)字各取其第一碼,組成四碼,如中外合資4332家用電器3253自動(dòng)控制6232d、多字詞取前四個(gè)單字的第一碼,組成四碼,如中國(guó)科學(xué)院4353中華人民共和國(guó)4225本發(fā)明的結(jié)構(gòu)型漢字編碼輸入方法是將漢字分析為獨(dú)體字、部首和筆形三部分,由于只利用0~9十個(gè)數(shù)字鍵,因此不需要經(jīng)過(guò)專門的指法訓(xùn)練,就能實(shí)現(xiàn)對(duì)漢字及其詞匯進(jìn)行直觀快速的編碼輸入(即實(shí)現(xiàn)盲打),做到見(jiàn)字識(shí)碼,會(huì)寫就會(huì)輸入,且簡(jiǎn)明易學(xué),記憶量少,本編碼的輸入方法對(duì)簡(jiǎn)體字和繁體字均可適用。
采用本編碼法出現(xiàn)重碼字時(shí),可以采用按其實(shí)用頻度作分級(jí)處理的辦法。即較常用的字首先顯示在顯示行的正常編輯位置上,若正好是用這個(gè)常用字,可繼續(xù)輸入下文,此字會(huì)自動(dòng)顯示在正常編輯位置上,而不影響輸入速度。如果需要的是不常用的字,只需按與該字在提示行中的序號(hào)相同的數(shù)字鍵,所要的字即可顯示在現(xiàn)行編輯位置上。重碼時(shí)也可采用拼音字母進(jìn)行選字,即當(dāng)出現(xiàn)重碼時(shí),只需按與該字的第一個(gè)拼音字母相同的字母鍵,所要的字即可顯示在現(xiàn)行編輯位置上,從而大大地縮短了重碼的選擇。
參見(jiàn)附圖
,這是作為一個(gè)實(shí)施例的操作鍵盤,采用結(jié)構(gòu)型漢字編碼輸入法必須至少具有下述操作鍵并且按下述規(guī)程操作1、功能鍵(1),位于鍵盤的左邊,用于決定操作時(shí)編碼的輸入方法的鍵,因?yàn)橐粋€(gè)文字處理系統(tǒng)可以同時(shí)采用幾種漢字輸入方法進(jìn)行操作,所以必須通過(guò)功能鍵進(jìn)行轉(zhuǎn)換。
2、數(shù)字鍵(2),位于鍵盤的右邊,用于輸入漢字編碼的鍵,鍵入一經(jīng)開(kāi)始顯示器的正常編輯位置上立即顯示與鍵入的編碼相對(duì)應(yīng)的漢字。
3、數(shù)字選字鍵(3),位于鍵盤的頂部,用于對(duì)提示行按頻度順序出現(xiàn)的字進(jìn)行選擇的鍵,由于在做了上述操作后,所要的漢字按頻度順序停留在提示行上,故需按與所要字在提示行中的序號(hào)相同的數(shù)字選字鍵。(包括0-9,10個(gè)數(shù)字鍵)。
或采用字母選字鍵(4),位于鍵盤的中央,用于對(duì)提示行中按拼音的第一個(gè)字母出現(xiàn)的字進(jìn)行選擇的鍵(包括26個(gè)字母鍵)。
4、空格鍵(5),位于鍵盤的下部,用于要求繼續(xù)提示選字的鍵,若提示行所提示的五個(gè)或十個(gè)漢字中,沒(méi)有所要求的漢字,這時(shí)須按下空格鍵,要求繼續(xù)提示,然后用選字鍵輸入。
5、清除鍵(6),鍵盤中的ESC鍵被定義為清除鍵,是用于作廢其一次字碼輸入的鍵,即當(dāng)操作者誤打?yàn)榱硪唤M編碼時(shí),具有清除該編碼的功能。
至于錯(cuò)誤碼或不存在字碼的輸入,系統(tǒng)會(huì)自動(dòng)作廢該次輸入。
為了方便掌握漢字的部首及獨(dú)體字,充分有效地使用本編碼法,現(xiàn)列出《漢字部首及字例表》以及《獨(dú)體字及其檢碼表》。
彡3077
3077 凡3078 么3078 及3078久3078夕3078叉3078丸3078勺3078孓3078夂3078夊3078矢3078個(gè)3079千3079川3079彳3079女3080亡3080門3086宀3086廣3087之3088義3088巛3088丫3089口3090上3090馬3090囗3090彐3090己3096弓3096已3096巳3096尸3097小3098山3099巾3099弋3008四畫王4000 巨4000 廿4000
4000
4000無(wú)4006丐4006屯4006丏4006旡4006兂4006牙4007毋4007不4008木4008太4008犬4008專4008瓦4008歹4008尤4008 戈4008
4008 不4008 中4009車4009豐4009井4009韋4009卅4009爿4009幣4009母4009卐4009月4070鳥4070丘4070壬4070毛4076片4076氏4076 冘4076 今4077 勿4077
4077長(zhǎng)4078乏4078爪4078丹4078夭4078
4078 手4079 升4079 斤4079 牛4079予4079幣4079方4080方4087戶4087
心4088為4088火4088卞4088日4090止4090丑4090日4090市4090見(jiàn)4096巴4096少4097尹4097水4098書4098尺4098肀4099弔4099五畫本5000世5000甘5000玉5008東5008母5008術(shù)5008丙5008未5008末5008
5008 木5008
5008 玉5008 戔5008卌5009
5009 疋5068 白5070 生5070乍5070矛5077鳥5078禾5078令5078皮5078樂(lè)5078瓜5078斥5078氐5078癶5078乎5079主5080必5087永5088四5090目5090且5090田5090由5090業(yè)5090皿5090冉5090凹5090凸5090
5090
5090
5090 電5096 民5096
5096
5098 水5098 甲5099 申5099
5099六畫西6000 耳6000 臣6000 互6000
6000
6006 米6008 頁(yè)6008 而6009
6009
權(quán)利要求
1.一種結(jié)構(gòu)型漢字編碼輸入法,特別是在計(jì)算機(jī)、打字機(jī)及類似裝置上使用漢字編碼輸入法的文書處理系統(tǒng),在該文書處理系統(tǒng)中的鍵盤上至少包括下列操作鍵功能鍵,即用于決定操作時(shí)編碼的輸入方式的鍵;數(shù)字鍵,即用于輸入漢字編碼的鍵(一般只采用0-9,10個(gè)數(shù)字鍵);選字鍵,即用于對(duì)提示行上的字進(jìn)行選擇的鍵(包括0-9,10個(gè)數(shù)字鍵以及26個(gè)相對(duì)于漢字讀音的字母鍵);空格鍵,即用于要求繼續(xù)提示的鍵;清除鍵,即用于作廢某一次字碼輸入的鍵;對(duì)于錯(cuò)誤碼或不存在的字碼的輸入,系統(tǒng)會(huì)自動(dòng)作廢該次輸入,并發(fā)出信號(hào),等待新的輸入,本發(fā)明的特征在于,在對(duì)上述數(shù)字鍵進(jìn)行操作時(shí),所采用的漢字編碼輸入方法為A、將獨(dú)體字的編碼按照第一碼取該字的筆畫,即字碼,第二碼補(bǔ)零,第三碼取該字的起筆筆形代碼,第四碼取該字的收筆筆形代碼,這樣一種四位碼的方式輸入;或B、將合體字的編碼按照筆形的書寫順序“讀”出組成合體字的各個(gè)部件(包括獨(dú)體字、部首或筆形)的筆畫(即字碼)或筆形代碼組成的一組四位碼作為該合體字的編碼。a、當(dāng)一個(gè)合體字的部件超過(guò)四部時(shí)按漢字的結(jié)構(gòu)取前四部筆畫編碼,b、當(dāng)一個(gè)合體字的部件剛好四部時(shí)按漢字的結(jié)構(gòu)順序依次取四部筆畫,構(gòu)成漢字的四位編碼,c、當(dāng)合體字的部件為三部時(shí)按漢字的結(jié)構(gòu)順序依次取三部筆畫,第四碼取該字末部的收筆筆形代碼,如d、當(dāng)合體字的部件為二部時(shí)按漢字的結(jié)構(gòu)順序依次取二部筆畫,第三、四碼取末部的起筆及收筆筆形代碼,或C、將詞匯編碼按照如下方式輸入a、雙字詞取每個(gè)單字的前二碼,組成四位碼,如果詞匯中的字為獨(dú)體字,則按該獨(dú)體字的筆畫取兩個(gè)相同的重碼,b、三字詞取前兩個(gè)字的第一碼,最后一個(gè)字的前兩碼,c、四字詞每個(gè)字各取其第一碼,組成四碼,d、多字詞取前四個(gè)單字的第一碼,組成四碼。
2.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)型漢字編碼輸入法,其特征在于上述代碼代表的筆形為0-一
レ9-丨
亅8-
丶く7-丿フ
6-乙乚乛了
3.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)型漢字編碼輸入法,其特征在于重碼的處理方法是在按本編碼法輸入編碼后,再輸入所需漢字的頭一個(gè)拼音字母,此字即首先顯示在屏幕正常的編輯位置上,不需作任何處理,即可正常繼續(xù)鍵入。
全文摘要
本發(fā)明涉及一種結(jié)構(gòu)型漢字編碼輸入技術(shù),特別涉及在計(jì)算機(jī)、打字機(jī)及類似裝置上使用的漢字編碼輸入方式的文字處理系統(tǒng)。本發(fā)明是將漢字分解為獨(dú)體字、部首和筆形三部分,利用0—9十個(gè)數(shù)字鍵對(duì)漢字進(jìn)行編碼。利用本發(fā)明方法不需經(jīng)過(guò)專門的指法訓(xùn)練,就能實(shí)現(xiàn)對(duì)漢字及其詞匯進(jìn)行直觀快速的編碼輸入,做到見(jiàn)字識(shí)碼,會(huì)寫就會(huì)輸入,且簡(jiǎn)明易學(xué),記憶量少,本編碼的輸入法對(duì)簡(jiǎn)體字和繁體字均可適用。
文檔編號(hào)G06F3/023GK1069350SQ9110405
公開(kāi)日1993年2月24日 申請(qǐng)日期1991年8月4日 優(yōu)先權(quán)日1991年8月4日
發(fā)明者黃文智 申請(qǐng)人:黃文智