專利名稱:漢字中華碼計算機鍵盤輸入法的制作方法
技術領域:
本發(fā)明屬于漢字編碼方法及漢字信息計算機鍵盤輸入方法領域。
迄今為止,漢字的計算機鍵盤輸入方案已逾七百種之多。中國大陸常用的編碼方法主要有國標區(qū)位、五筆字型、漢語拼音等方法。大陸以外的國家、地區(qū)常用倉頡中文輸入法。如此之多的漢字編碼方法,對于“容易學的輸不快,輸入快的不易學”(《計算機世界》1994年第43期余克艱、龐宣明著《漢字信息的計算機輸入與漢字文化》)這一矛盾,都沒有從根本上得到解決。國標區(qū)位碼無重碼,但難以記憶;五筆字型碼重碼率較低、輸入速度較快,但漢字書寫、部首拆分規(guī)范性差,操作者記憶量大(130個基本字根都需記憶),非專職操作員難于熟練掌握;拼音碼(全拼、雙拼等)重碼率高、輸入速度慢,全拼音法無記憶量,雙拼音法仍有漢語拼音韻母、聲母與計算機鍵盤鍵名轉(zhuǎn)換再定義的記憶量(35個韻母和3個聲母總計38個記憶量)。
由此可見,各種漢字編碼方法可謂“尺有所長,寸有所短”。但都在易學、快速、規(guī)范這三者的相互矛盾之中徘徊。
中華碼的漢字編碼信息,取自構成書寫漢字規(guī)范筆順的第一個、第二個和第三個中華碼部首名稱的讀音和該漢字的讀音。中華碼編碼方法遵循漢字讀音規(guī)范、漢字書寫筆順規(guī)范、漢字部首拆分規(guī)則和漢字部首的通常習慣命名方法。漢字應用中華碼編碼的計算機鍵盤代碼是26個英文字母,漢語拼音方案字母表中的漢語拼音字母都定義在與其一一對應的26英文字母鍵名上,計算機標準鍵盤則轉(zhuǎn)變成為中華碼的漢字輸入鍵盤。對于使用漢字(簡體或繁體)的國家、地區(qū)(日本、韓國、朝鮮、新加坡,臺灣、香港、澳門等)漢字的計算機鍵盤輸入或文字處理機鍵盤輸入,也可采用中華碼編碼方案(使用拼音字母、注音字母或其它標音符號標注簡體或繁體漢字,進行鍵盤鍵名字母名稱轉(zhuǎn)換的再定義即可實現(xiàn)漢字中華碼編碼方案)。
中華碼有音形碼和形音碼兩種編碼方案,音碼加形碼組成音形碼、形碼加音碼組成形音碼。中華碼共四碼,音碼由漢字的漢語拼音首字母1碼組成,構成該漢字書寫規(guī)范筆順的前三個中華碼部首名稱的漢語拼音首字母,分別作為中華碼形碼的第1碼、第2碼和第3碼,共3碼組成該漢字的形碼;漢語拼音方案字母表中的26個字母a b c de f g h i j k l m n o p q r s t u v w x y z分別定義在與計算機鍵盤26英文字母鍵名一一對應的英文字母鍵上;構成漢字的成字部首都是中華碼成字部首,中華碼成字部首的名稱為該成字部首這個漢字,中華碼成字部首構成漢字,其形碼為該中華碼成字部首名稱的漢語拼音首字母;中華碼非成字部首名稱按照中華碼非成字部首名稱的命名規(guī)則定義,中華碼非成字部首構成漢字,其形碼為該中華碼非成字部首名稱的漢語拼音首字母;中華碼部首(成字、非成字部首)構成漢字,其部首拆分規(guī)則按照漢字書寫規(guī)范筆順,只取該漢字的前三個中華碼部首,并按照書寫該漢字這三個部首的空間順序,取每一個部首均按照成字部首優(yōu)先、大部首(中華碼成字、非成字部首中筆畫較多的部首)優(yōu)先的規(guī)則組成該漢字的形碼;操作者不會書寫或?qū)h字規(guī)范筆順不清楚的漢字,中華碼形碼可用“字形模糊碼”代替編碼;漢字構件(本文指不組成漢字而在文本中輸出的漢字部首)和冷僻漢字(操作者不能正確讀音的漢字)中華碼的音碼可用“字音模糊碼”代替編碼;在使用漢字的國家、地區(qū)應用拼音字母(如日文假名和朝、韓文字母)、注音字母(如臺灣和港澳地區(qū)使用的漢語注音字母)或其它標音符號(如日文中應用的羅馬字母),用于標注簡體或繁體漢字的讀音,對計算機鍵盤鍵名英文字母再定義轉(zhuǎn)換為拼音字母、注音字母或其它標音符號,完全可以采用漢字中華碼的編碼方案及其規(guī)則。
下面從五個方面闡述本發(fā)明內(nèi)容。
一、中華碼部首及其名稱定義規(guī)則1、中華碼成字部首和名稱漢字作為構成漢字的成字部首,都是中華碼成字部首,其名稱為該成字部首的漢字。如“石”字可組成“碼”字,“石”則是中華碼成字部首,其名稱為“石”。
2、中華碼非成字部首和名稱從漢字非成字部首中選擇部分部首作為中華碼非成字部首,其名稱定義參照《新華字典》1992年重排本、《辭?!?b>1979年版、和中小學語文課本及語文教學中漢字部首的名稱,并依據(jù)國家教委、國家語委頒布的有關文件。
漢字非成字部首如(一)、( 丨)、(丿)、(丶)、(乙)、(宀)、(冖)、(讠)、(艸)、(阝)、(辶)……選作為中華碼非成字部首,其名稱分別為“橫”、“豎”、“撇”、“點”、“折”、“寶字蓋”、“禿寶蓋”、“言字旁”、“草字頭”、“耳刀”、“走之”……。
如“馬”字,按照書寫的規(guī)范筆順,由第一個非成字部首“乙”(讀音為“折”,下同)、第二個非成字部首“乙”和第三個非成字部首“一”(讀音為“橫”)這三個中華碼非成字部首組成。
二、漢字中華碼編碼公式1、中華碼全碼共4碼,由音碼(1碼)和形碼(共3碼)組成。漢字漢語拼音首字母為該漢字音碼,漢字規(guī)范筆順的前三個中華碼部首名稱的漢語拼音首字母按順序組成該漢字形碼。即中華音形碼=音碼+形碼;中華形音碼=形碼+音碼。
2、漢字構件(文本中輸出的非成字)或冷僻漢字(不能正確讀音),如“中”和“髟”,其音碼可用“字音模糊碼”鍵名和其形碼編碼。
3、字形模糊的漢字,其形碼可用“字形模糊碼”鍵名和其音碼編碼。
4、中華碼簡碼規(guī)則按照漢字中華碼全碼四碼的排列順序分別取前一碼、前二碼、前三碼,加“空格鍵”編成該漢字(部分高頻字)相對應的中華碼一、二、三級簡碼。
三、中華碼部首拆分規(guī)則按照組成漢字規(guī)范筆畫的空間先后順序,只取漢字的第一個、第二個和第三個中華碼部首,取每一個部首的規(guī)則都是成字部首優(yōu)先、大部首優(yōu)先。
1、成字且筆畫較多的部首最優(yōu)先組成中華碼部首;2、只有成字部首或只有非成字部首構成的漢字,取大部首優(yōu)先;3、成字部首和非成字部首構成的漢字,取成字部首優(yōu)先和大部首優(yōu)先;4、非成字部首和成字部首構成的漢字,取大部首優(yōu)先和成字部首優(yōu)先。
如“金”字取“人”、“干”和“丶”,“樽”字取“木”、“酋”和“寸”;如“縻”字取“麻”、“幺”和“小”,不取“廣”、“林”和“糸”;“宏”字取“宀”、“一”和“丿”,不取“丶”、“冖”和“一”;如“影”字取“景”、“丿”和“丿”,不取“日”、“京”和“丿”;如“寶”字取“宀”、“王”和“丶”。
四、中華碼形碼組成規(guī)則1、按中華碼部首拆分規(guī)則只取漢字的前三個中華碼部首組成該字的形碼。
如“碼”字由“石”、“乙”和“乙”三個中華碼部首組成其形碼為“szz”。
2、只有兩個中華碼組成的漢字,其形碼的第3碼與第2碼相同。
如“中”字由中華碼“口”和“丨”組成,其形碼為“kss”。
3、只有秘個中華碼組成的漢字,一筆畫漢字“一”和“乙”的形碼分別規(guī)定為“hhh”和“zzz”。
如繁體漢字“國”字,由中華碼部首“門”(中華碼非成字部首名稱“方框”)、“或”(中華碼成字部首名稱“或”)和“一”(中華碼非成字部首名稱“橫”)組成其形碼“fhh”。
如日文當用漢字“國”(日語讀音“くに”,羅馬字母拼音為“kuni”),由“口”(日語讀音“くち”,羅馬字母拼音為“kuchi”)、“王”(日語讀音“ぉぅ”,羅馬字母拼音為“oo”)和“丶”(日語讀音“てん”,其羅馬字母拼音“ten”)組成其形碼“くぉて”和“kot”。
五、中華碼音碼組成規(guī)則1、我國使用的漢字,其讀音以《新華字典》1992年重排本、《辭海》1979年版和國家教委、國家語委政令中標注的漢語拼音為標準。
2、取漢字漢語拼音的首字母作為音碼。
如“?。≈腥A”的漢語拼音為“ā、zhōng、huá”,三字的音碼分別為“a、z、h”。
如漢字繁體字“國”,漢語注音字母為“ㄍㄨㄜ”、漢語拼音為“gu ó”,其音碼為“ㄍ”和“g”。
如日文當用漢字“私”,(日語讀音“ゎたし”,其羅馬字母拼音為“watasi”)其音碼為“ゎ”和“w”。
六、中華碼詞碼編碼規(guī)則1、二字詞取組成詞的首字音碼和該字的形碼第1碼,再加上該詞的末字音碼和該末字的形碼第1碼。
“中華”二字詞的編碼“zkhh”。
2、三字詞取組成詞的第一個漢字的音碼和該字的形碼第1碼,再加上該詞第二個和第三個漢字的音碼。
“中華碼”三字詞的編碼“zkhm”。
3、四字詞分別取組成詞四個漢字的音碼。
“中華民族”四字詞的編碼“zhmz”。
4、多字詞分別取組成詞的前三個和最末一個漢字的音碼。
“中華人民共和國”七字詞的編碼“zhrg”。
綜上所述,本發(fā)明的漢字編碼方法是以漢字的字音和字形這二維漢字信息進行編碼,其規(guī)則簡單、易記。中華碼漢字輸入方法在漢字文化圈中是一種符合漢語語言規(guī)范性、易學習、輸入快的漢字鍵盤輸入方法。操作者只要掌握漢語拼音方法和中華碼部首名稱命名方法,便可進行無記憶量的漢字鍵盤輸入操作,基本上解決了“容易學的輸不快,輸入快的不易學”這一矛盾,實現(xiàn)了易學、快速、規(guī)范三者的有機結合。
如上所述,易知“??!中華碼”的漢字中華碼計算機鍵盤編碼為1、中華音形碼(1)、以字輸入為“akek zkss hhhs mszz”;(2)、以字和二字詞輸入為“akek zkhh mszz”;(3)、以字和三字詞輸入為“akek zkhm”。
2、中華形音碼(1)、以字輸入為“keka kssz hhsh szzm”;(2)、以字和二字詞輸入為“keka zkhh szzm”;(3)、以字和三字詞輸入為“keka zkhm”。
權利要求
1.一種漢字編碼計算機鍵盤輸入法—中華碼,其特征在于編碼信息取自構成漢字字形的部首名稱讀音和該漢字的讀音,組成漢字規(guī)范筆順的前三個中華碼部首名稱的漢語拼音首字母,按順序組成中華碼的形碼,漢字漢語拼音首字母作為中華碼的音碼,中華音形碼由音碼加形碼組成,中華形音碼由形碼加音碼組成;漢語拼音方案字母表中的26個字母a b c d e f g h i j k l mn o p q r s t u v w x y z,分別定義在與其一一對應的計算機或文字處理機鍵盤的26個英文字母鍵上。
2.根據(jù)權利要求1所述的中華碼,其特征在于構成漢字的成字部首都是中華碼成字部首,其名稱為該成字部首的漢字,中華碼成字部首構成漢字,其形碼為該中華碼成字部首名稱的漢語拼音首字母。
3.根據(jù)權利要求1所述的中華碼,其特征在于中華碼非成字部首構成漢字,其形碼為該中華碼非成字部首名稱(按照中華碼非成字部首名稱的命名規(guī)則定義)的漢語拼音首字母。
4.根據(jù)權利要求1、2、3所述的中華碼,其特征在于由中華碼部首構成漢字,其部首拆分規(guī)則按照漢字書寫規(guī)范筆順的先后,按順序取該漢字的前三個中華碼部首,取每一個部首均按照成字部首優(yōu)先、大部首(筆畫較多的中華碼成字、非成字部首)優(yōu)先的規(guī)則。
5.根據(jù)權利要求1、2、3、4所述的中華碼,其特征在于“字形模糊”(操作者不會書寫或不能按規(guī)范筆順書寫)的漢字,其形碼可用“字形模糊碼”代替編碼。
6.根據(jù)權利要求1、2、3、4、所述的中華碼,其特征在于漢字構件(不構成漢字而在文本中輸出的漢字部首)或冷僻漢字(操作者不能正確讀音),其音碼可用“字音模糊碼”代替編碼。
7.根據(jù)權利要求1、2、3、4所述的中華碼,其特征在于二字詞的編碼規(guī)則取組成該詞首字的音碼和其形碼的第1碼再加上末字的音碼和其形碼的第1碼,為該詞的計算機鍵盤代碼。
8.根據(jù)權利要求1、2、3、4所述的中華碼,其特征在于三字詞的編碼規(guī)則取組成該詞第一個漢字的音碼和該漢字形碼的第1碼再加上該詞的第二個和第三個漢字的音碼,為該詞的計算機鍵盤代碼。
9.根據(jù)權利要求1、2、3、4、5所述的中華碼,其特征在于四字詞和四字以上詞的編碼規(guī)則分別取組成該詞前三個漢字和最后一個漢字的音碼,為該詞的計算機鍵盤代碼。
10.根據(jù)權利要求1、2、3、4、5、6、7、8、9所述的中華碼,其特征在于使用漢字的國家、地區(qū)(日本、韓國、朝鮮、新加坡,臺灣、香港、澳門等),應用拼音字母、注音字母或其它標音符號標注漢字(簡體或繁體),對計算機鍵盤英文字母鍵名再定義轉(zhuǎn)換為拼音字母、注音字母或其它標音符號,而采用中華碼的編碼方案和編碼規(guī)則。
全文摘要
漢字中華碼計算機鍵盤輸入法,本發(fā)明屬于漢字信息鍵盤輸入方法領域。以漢字讀音和構成該漢字的部首讀音信息進行編碼。編碼規(guī)則遵循漢字讀音規(guī)范、汊字書寫規(guī)范和漢字部首的習慣命名方法。操作者只需掌握漢字讀音的拼音方法和中華碼部首名稱,即可在計算機或文字處理機的鍵盤上進行無記憶量的漢字編碼輸入。該編碼方法在漢字文化圈中是一種符合漢語規(guī)范、易學習、輸入快的漢字鍵盤輸入方法。
文檔編號G06F3/023GK1125336SQ9510786
公開日1996年6月26日 申請日期1995年7月24日 優(yōu)先權日1995年7月24日
發(fā)明者孟來來, 孟菀桐 申請人:孟菀桐