專利名稱:一種數碼漢字輸入法及其鍵盤的制作方法
技術領域:
本發(fā)明涉及一種數碼漢字輸入法及鍵盤,屬于計算機中文信息處理技術領域。
在現(xiàn)有技術中,利用數字鍵盤進行漢字輸入的方法主要有以下幾種①筆劃輸入法在5個或10個數字鍵上定義若干種筆劃,依照書寫筆順,依次按鍵輸入漢字的每一筆劃。這一方法顯而易見的優(yōu)點是“不用學習”,只要會寫字便會輸入,其缺點是按鍵次數多,輸入速度慢,效率不高。
②拼音輸入法這是參考英文字母的數字輸入方法,通過按1至4次數字鍵逐個輸入漢語拼音的字母。其優(yōu)點是可以直接在數字鍵盤上打拼音,簡單易學,其缺點是大量的同音字需要挑選,而且擊鍵次數多,同樣效率不高。
③九鍵六碼漢字輸入法這一輸入方法由五筆字型的發(fā)明人王永民先生提出,其中國發(fā)明專利申請為00103505.3號(公開號為CN1264859A)的《五筆數碼鍵盤漢字電腦輸入法及其鍵盤》,該輸入法利用1~9共九個數字鍵來輸入漢字,單字最大碼長為6碼。其優(yōu)點是重碼率低,缺點是單字編碼過長,影響了編碼方案的實用性。
另外,已有技術的各種漢字編碼方案,一直來都沿襲五筆字型輸入法的字詞編碼兼容技術,其缺陷在于,詞組的容量不能太多,否則將產生大量地字、詞重碼,影響輸入速度。
本發(fā)明解決上述技術問題所采用的技術方案為該數碼漢字輸入法的鍵盤包括有0、1、2……9共10個數字鍵,其特征在于各鍵所對應的漢字筆形及部件為“1”“橫”類,對應“一”、 及部件“艸、、 “2”“豎”類,對應“丨”、“亅”及部件“日”;“3”“撇”類,對應“丿”及部件“月”;“4”“捺”類,對應“丶”、“ㄟ”及部件“亠、讠”;“5”“折”類,對應“乙”及部件“幺、纟”;“6”“交”類,對應“十、ナ、七”、“乂、 ”及部件“木”;“7”“插”類,對應“、、“豐、 韋、 聿、 及部件“扌”;“8”“八”類,對應“八、 冫、丷、 ”、“人、亻、”;“9”“小”類,對應“小、、 ”及部件“氵、灬、辶、心、”;“0”“口”類,對應“口、囗、 并且,單個漢字按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個筆形的代碼,不足五碼按實際碼長。
對于可按左右、上下或內外分成首部和尾部二部分的漢字,取碼規(guī)則可以為首部或尾部只有一個或二個筆形的,則仍按所述的“前4末1”規(guī)則取碼;首部、尾部的筆形均在三個以上的,則按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼;尾部按書寫順序取第一、二、末共三個筆形的代碼,一共五碼。
或者,首部或尾部只有一個筆形的,則仍按前述的“前4末1”規(guī)則取碼;首部的筆形在二個及二個以上、尾部的筆形在三個及三個以上的,則按”首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、二、末共三個筆形的代碼,共五碼;首部的筆形在二個及二個以上、尾部的筆形為二個的,則按“首2尾2”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、第二共二個筆形的代碼,共四碼。
而漢字詞組的編碼方法可以為二字詞分別取第1字的一、二、末三個筆形和第2字的一、二、末三個筆形,共六碼,其中如有漢字不足三個筆形的,則以“0”補齊;三字及三字以上的多字詞分別取第1、第2和最后一個漢字的前兩個筆形的代碼,共六碼,其中如有漢字不足二個筆形的,則以“0”補齊。
由于單字和詞組的碼長不等,因此當漢字輸入系統(tǒng)有詞組編碼存在時,在輸完單字編碼后,可以鍵入數字鍵盤上的“非數字鍵”作為輸碼結束鍵。
與現(xiàn)有技術相比,本發(fā)明由于將漢字拆分筆形增加至10種,因而在單字碼長為5、詞組碼長為6的情形下,不僅可以適用于具有簡繁漢字的大字符集,而且重碼率低,并且由于各字形僅與10個數字鍵相關聯(lián),因而可以適用于手機、電話、電子字典、個人數字助理(PDA)、個人電腦(PC)等各種具有數字輸入設備的產品。
(一)筆形、部件及代碼本發(fā)明將構成漢字的基本筆形分為5種單筆形和5種復筆形。
5種單筆形的劃分采用國家統(tǒng)一標準,即分為“橫(含提)、豎(含左豎鉤)、撇、捺(含點)、折”,不再詳述。
5種復筆形為“交”——兩筆交叉且連續(xù)寫成,具體筆形為“十(ナ七)、乂( )”。
(括號前的筆形為代表性筆形,括號內為形似筆形,下同)“插”——所有連續(xù)寫成的若干筆劃被隨后寫成的一筆劃縱穿的筆形。具體筆形為“()、豐( 韋 聿 )”。
“八”——“八、人”及其變形。即“八( 冫丷 )、人(亻)”。
“小”——“小”及其變形。即“小( )”。
“口”——四角整齊的方形。具體筆形為”口囗 上述10種筆形的代碼分別為“橫1、豎2、撇3、捺4、折5、交6、插7、八8、小9、口0”代碼助記記詞為“1、2、3、4、5,橫豎撇捺折;6、7、8、9、0,交插八小口?!睘殡x散重碼,本發(fā)明還優(yōu)選了10余個高頻部件,按照易記、便于聯(lián)想的原則定義在數字鍵上,具體如下
(1)艸( )因其首筆為“一”,故定義在數字鍵“1”上。
(2)日因其首筆為“丨”,故定義在數字鍵“2”上。
(3)月因其首筆為“丿”,故定義在數字鍵“3”上。
(4)讠、亠因其首筆為“丶”,故定義在數字鍵“4”上。
(5)幺、纟因其首筆為“乙”,故定義在數字鍵“5”上。
(6)木因其首筆形為“十”,故定義在數字鍵“6”上。
(7)扌因其筆形與“插”筆形相似,故定義在數字鍵“7”上。
(8)氵灬辶心()因筆形中有多個點,故定義在最大的數字鍵“9”上。
以上十個基本筆形及10余個優(yōu)選部件構成了本發(fā)明的筆形體系,這是本發(fā)明的核心技術。需要說明的是上述筆形及部件是本發(fā)明人根據規(guī)范、易記、高效等原則優(yōu)選得到,在具體實施本發(fā)明時,允許作適當增減。如在“交”筆形中,可增加“又、力”等部件;可將“丈、 ”等部件也定義為“插”筆形。
(二)單字取碼規(guī)則(1)獨體字(含對稱結構、部分包圍結構的漢字)獨體字按“前4末1”規(guī)則取碼。即按規(guī)范的書寫順序,取一、二、三、四、末共五個筆形的代碼,共為五碼。不足五碼按實際碼長輸入。如獨體結構 我3764 重31261本61對稱結構 乘36288 坐8861 爽16668包圍結構 可102或10164匿11605(上述包圍結構的漢字,因其包圍部分不是連續(xù)寫成,故按筆順取碼。)(2)合體字合體字,先從結構上將其分成兩部分。具體是左右(左中右)結構的合體字分成左、右(左、中右)兩部分;上下(上中下)結構的合體字分成上、下(上、中下)兩部分;包圍結構的合體字分為內、外兩部分。
為便于敘述,下文中將合體字的第一部分稱為“首部”,第二部分稱為“尾部”。
合體字分成首、尾兩部分后,若首部、尾部只有一個或二個筆形,則該合體字仍按獨體字“前4末1”規(guī)則取碼。若首部、尾部的筆形均在三個以上,則按“首2尾3”規(guī)則取碼。即首部按書寫順序取一、二共兩個筆形的代碼;尾部按書寫順序取一、二、末共三個筆形的代碼,一共五碼。
合體字也可按如下規(guī)則取碼合體字分成首、尾兩部分后,若首部或尾部只有一個筆形,則該合體字仍按獨體字“前4末1”規(guī)則取碼。若首部、尾部的筆形均在二個以上,則按“首2尾3”規(guī)則取碼,尾部不足3碼按實際碼長輸入。
合體字結構的劃分,以現(xiàn)行的教科書及規(guī)范的寫字字典為依據。
由于漢字間架結構具有很強的直觀性,因此,只要略懂漢字結構知識,對合體字都能很容易地切分,不會產生“二義性”。對少數幾個結構不好切分的漢字,則可通過設置“容錯碼”加以解決。
合體字編碼舉例如下左右、左中右結構村664 撬73737 情82713 鮑35355 鞭11816 辮48546上下、上中下結構京409 贏45034 露14020 翼58068 登54101 英1274半包圍結構磨43660 著81011 左6121 虛21221匈35652 氧81817 司510 灰688毯37888 起61215 彪21333 邂35329闥42649 同2510 兇652 函52882全包圍結構國01614 圓00258本發(fā)明不僅可對國GB2312中的簡體字編碼,同樣可對GBK中的繁體字及其它漢字編碼,且簡、繁漢字編碼不同。如镕81440 詡41588 垚61611 頌85138 絞59486本發(fā)明還可對非成字部首、常用標點、字母進行編碼輸入。如一177 丨277 宀44577 卩5277 氵977 疒43877,188 。288 、388 ;488其中,“77”、“88”、“99”為特殊符號的編碼后綴。
(三)詞組的取碼規(guī)則詞組按“二字詞”與“多字詞”兩種方式取碼。
二字詞取每字的一、二、末三個筆形的代碼,一共六碼。若某字取不足三個筆形,則以“0”補齊。如詞語450410不是190218多字詞(三字及三字以上)取第1、第2和最后一個漢字的前兩個筆形的代碼,一共六碼。若某字取不足二個筆形,則以“0”補齊。如計算機468463精益求精868186教育委員會664581中華人民共和國028301本發(fā)明的特征是采用字、詞編碼分離技術。這一技術的進步性在于實現(xiàn)了文字錄入以詞組輸入為主這一錄入方式。并且將詞組的編碼空間擴大到一百萬,基本實現(xiàn)詞組輸入無重碼。從而極大地提高漢字的錄入速度。
由于采用字、詞編碼分離技術,因此當輸完單字編碼(或簡碼)后,可以鍵入數字鍵盤上的某一“非數字鍵”作為輸碼結束鍵。如果沒有重碼,則該字直接上屏,如果有重碼,則用數字鍵進行選擇。對于詞組,當輸完六碼后,如果無重碼,則該詞組直接上屏,如果有重碼,則用數字鍵進行選擇。
權利要求
1.一種數碼漢字輸入法及其鍵盤,其鍵盤包括有0、1、2……9共10個數字鍵,其特征在于各鍵所對應的漢字筆形及部件為“1”“橫”類,對應“一”、 及部件“艸、、 “2”“豎”類,對應“丨”、“亅”及部件“日”;“3”“撇”類,對應“丿”及部件“月”;“4”“捺”類,對應“丶”、“ㄟ”及部件“亠、讠”;“5”“折”類,對應“乙”及部件“幺、纟”;“6”“交”類,對應“十、ナ、七”、“乂、 ”及部件“木”;“7”“插”類,對應“、”、“豐、 韋、 聿、 及部件“扌”;“8”“八”類,對應“八、 冫、丷、 、”人、亻、”;“9”“小”類,對應“小、、 ”及部件“氵、灬、辶、心、”;“0”“口”類,對應“口、囗、 并且,單個漢字按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個筆形的代碼,不足五碼按實際碼長。
2.根據權利要求1所述的數碼漢字輸入法及其鍵盤,其特征在于對于可按左右、上下或內外分成首部和尾部二部分的漢字,取碼規(guī)則為首部或尾部只有一個或二個筆形的,則仍按所述的“前4末1”規(guī)則取碼;首部、尾部的筆形均在三個以上的,則按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼;尾部按書寫順序取第一、二、末共三個筆形的代碼,一共五碼。
3.根據權利要求1所述的數碼漢字輸入法及其鍵盤,其特征在于對于可按左右、上下或內外分成首部和尾部二部分的漢字,取碼規(guī)則為首部或尾部只有一個筆形的,則仍按前述的”前4末1”規(guī)則取碼;首部的筆形在二個及二個以上、尾部的筆形在三個及三個以上的,則按”首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、二、末共三個筆形的代碼,共五碼;首部的筆形在二個及二個以上、尾部的筆形為二個的,則按“首2尾2”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、第二共二個筆形的代碼,共四碼。
4.根據權利要求1、2或3所述的數碼漢字輸入法及其鍵盤,其特征在于,漢字詞組的編碼方法為二字詞分別取第1字的一、二、末三個筆形和第2字的一、二、末三個筆形,共六碼,其中如有漢字不足三個筆形的,則以“0”補齊;三字及三字以上的多字詞分別取第1、第2和最后一個漢字的前兩個筆形的代碼,共六碼,其中如有漢字不足二個筆形的,則以“0”補齊。
5.根據權利要求4所述的數碼漢字輸入法及其鍵盤,其特征在于,在輸完單個漢字編碼后,再鍵入數字鍵盤上的“非數字鍵”作為輸碼結束鍵。
全文摘要
一種數碼漢字輸入法及其鍵盤,其鍵盤包括有0、1、2……9共10個數字鍵,其特征在于各鍵所對應的漢字筆形及部件為“1”對應“橫”類;“2”對應“豎”類,“3”對應“撇”類;“4”對應“捺”類;“5”對應“折”類;“6”對應“交”類;“7”對應“插”類;“8”對應“八”類;“9”對應“小”類;“0”對應“口”類;并且,單個漢字按“前4末1”規(guī)則取碼,即;按規(guī)范的書寫順序,取第一、二、三、四、末共五個筆形的代碼,不足五碼按實際碼長。對于可按左右、上下或內外分成首部和尾部二部分的漢字,取碼規(guī)則還可以變更為“首2尾3”或“首2尾2”;漢字詞組的編碼則可以為六碼。與現(xiàn)有技術相比,本發(fā)明不僅可以適用于具有簡繁漢字的大字符集,而且重碼率低,并且由于各字形僅與10個數字鍵相關聯(lián),因而可以適用于手機、電話、電子字典、個人數字助理(PDA)、個人電腦(PC)等各種具有數字輸入設備的產品。
文檔編號G06F3/023GK1460914SQ0312931
公開日2003年12月10日 申請日期2003年6月14日 優(yōu)先權日2003年6月14日
發(fā)明者羅康寧 申請人:羅康寧