專利名稱:一碼二形快速中文數(shù)字編碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于數(shù)字鍵盤輸入漢字的方法,具體地說是涉及一種可用于在手機、計算機、PDA及特制鼠標(biāo)為主的可用數(shù)字鍵盤上進(jìn)行中文輸入和字詞典編排的一碼二形快速中文數(shù)字編碼輸入方法。
為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案包括a、在每個數(shù)字鍵盤上各自設(shè)定對應(yīng)的漢字筆形,其中數(shù)字鍵“1”對應(yīng)的漢字筆形為“—”和“艸”,數(shù)字鍵“2”對應(yīng)的漢字筆形為“ニ”和“丨”,數(shù)字鍵“3”對應(yīng)的漢字筆形為“氵”和拐兩個以上彎的單筆畫,數(shù)字鍵“4”對應(yīng)的漢字筆形為“钅”和其中至少一筆為斜狀的兩單筆相交的筆形,數(shù)字鍵“5”對應(yīng)的漢字筆形為“木”和一邊開口的框,數(shù)字鍵“6”對應(yīng)的漢字筆形為撇“丿”和向左下方斜的點 數(shù)字鍵“7”對應(yīng)的漢字筆形為捺“” 和向右下方斜的點“丶”,數(shù)字鍵“8”對應(yīng)的漢字筆形為“ハ”(含“丷、人”)和“亻”,數(shù)字鍵“9”對應(yīng)的漢字筆形為“扌”和只拐一個彎的折鉤,數(shù)字鍵“0”對應(yīng)的漢字筆形為“口”和“廣”;b、依據(jù)上述設(shè)定的各種筆形對漢字進(jìn)行拆分,并按照如下的規(guī)則對每個漢字取碼(1)按漢字的書寫順序拆分出上述設(shè)定的筆形,依次取該字中拆分出的第一、第二、第三和最后的筆形所對應(yīng)的數(shù)字鍵為代碼,作為該漢字的編碼,拆分不足四個筆形的字,其編碼與實際拆分所得的筆形相對應(yīng);(2)合體字第一部位限取兩個筆形,第三個筆形必須轉(zhuǎn)入下一個部位獲取,第四筆形還是與該字的最后一筆相關(guān)的筆形;(3)當(dāng)同時可取多種筆形時,在默認(rèn)多筆畫筆形優(yōu)先的前提下再按筆順優(yōu)先的原則,選取先寫出的筆形;(4)一邊開口的框和“口”這些筆形不受筆順影響,應(yīng)當(dāng)整取,但“口”筆形中所含的筆形不與其他筆形連取。
作為對本發(fā)明的進(jìn)一步改進(jìn),詞或詞組的取碼按如下規(guī)則(1)二字和三字詞語依次取前兩個字中各自的第一、第二筆形和最后一個字的與最后一筆相關(guān)的筆形編碼;(2)四字及四字以上的詞語取前四個字中的第一筆形和最后一個字中的與最后一筆相關(guān)的筆形進(jìn)行編碼;(3)按照上述詞或詞組的取碼規(guī)則,當(dāng)某部位已被前邊部位取過而無法取碼時,則該部位的代碼重復(fù)前一代碼,使詞碼的長度始終保持五位數(shù)。
本發(fā)明與現(xiàn)有技術(shù)相比具有以下的優(yōu)點第一,重碼率極低。雖然字碼長度僅4碼(與一般字母編碼長度相同)、詞碼長度僅5碼,重碼率卻低得出奇。本發(fā)明由于充分考慮了漢字筆形分布的規(guī)律及方便記憶、操作等因素,使得每一數(shù)字在字碼的四位數(shù)中的各個數(shù)位上出現(xiàn)的可能性比較均衡,從而克服了四角號碼及其他數(shù)字編碼的根本缺陷(如四角號碼“七角八八九是小”的規(guī)定,使7在第四位、8和9在第三位出現(xiàn)的可能性極?。欢骞P數(shù)碼“4點捺”的規(guī)定,又使得4在首尾兩部位出現(xiàn)的可能性太大),充分利用了編碼資源,大大降低了重碼率。從理論上講,四位數(shù)可編1萬個漢字;再考慮每屏6字的因素,則理論上可編6萬個字。而國家語委規(guī)定的通用漢字僅為7千個,所以只要方法得當(dāng),數(shù)字編碼重碼率過高的現(xiàn)象是可以克服的。本發(fā)明對7千通用字編碼后,大多數(shù)為一字一碼;按每屏6字計,需要翻頁(即超過6字重碼)的70多處,僅占編碼字的7%左右;最高重碼字是13、14個,各一處;對于國家語委頒布的3500個常用漢字來說,全部可以在首屏出現(xiàn)。這么低的重碼率,可以說是以往任何數(shù)字編碼都無法比擬的,甚至超過了許多字母編碼技術(shù)。字母編碼的碼長如果是四位的話,理論上可編漢字是45.7萬之巨,它與數(shù)字編碼是45.7∶1的關(guān)系,而且字母編碼一般是每屏待選字10個。
第二,學(xué)習(xí)掌握極易。雖然重碼極低,使用的漢字部件卻極少,僅20余個(五筆是200余個),使得學(xué)習(xí)和操作容易得出奇。由于一個數(shù)字僅表示兩種筆形,完全可以做到將兩種筆形標(biāo)識在數(shù)字鍵盤之上,初學(xué)者在讀懂非常簡單的編碼規(guī)則后,即可看著鍵盤進(jìn)行編碼輸入,不需記憶;如果把4句28個字的口訣記住了,則可不看鍵盤進(jìn)行編碼輸入(是最容易進(jìn)行“盲打”操作的輸入法),極大提高操作速度。
第三,容量極大。雖然僅用10個數(shù)字進(jìn)行編碼,但容量卻非常大,而且字詞不會重碼。字碼長1-4碼,詞碼長5碼,字詞不重,既極大地降低了重碼率,又極大地增大了編碼的容量(字約7千,詞超3萬),而且提高了編碼操作速度。
第四,誤編碼極少。雖然編碼規(guī)則簡單,但誤編碼的可能性極小。本發(fā)明為漢字筆形進(jìn)行了非??茖W(xué)的歸類,比如,將撇和向左下斜的點作為一類,將捺和向右下斜的點作為一類,將所有拐一個彎的筆畫都作為鉤處理等。另外,出于更完善的考慮,還作出了一些特殊規(guī)定,對極個別極易搞錯筆順的字用兩套編碼對應(yīng)同一個字(詞遇此情況也是同一個詞對應(yīng)兩套編碼)。
第五,完善程度極高。本發(fā)明對標(biāo)點、英文字母、常用符號的數(shù)字編碼并實行兼容操作,使本輸入法達(dá)到十分完善的地步。本發(fā)明用同一規(guī)則對中文標(biāo)點、英文字母和常用符號進(jìn)行數(shù)字編碼,讓用戶不用轉(zhuǎn)換功能鍵、啟用特設(shè)鍵即可實現(xiàn)標(biāo)點、字母、符號的輸入。
本發(fā)明在每個數(shù)字鍵盤上各自設(shè)定對應(yīng)的漢字筆形,用一個阿拉伯?dāng)?shù)字基本上代表兩種漢字筆形,具體情況如下數(shù)字鍵“1”對應(yīng)設(shè)定的筆形為“—”和“艸”,即橫和草頭,如“廿”字可拆分出筆形“艸”和“—”,其編碼是11;另外筆形提 可看作和筆形橫“—”相同;數(shù)字鍵“2”對應(yīng)設(shè)定的筆形為“ニ”和“丨”,即兩橫和豎,如“王”字可拆分出筆形“ニ”和“丨”,其編碼是221;另外筆形一橫一提“ ”可看作和筆形兩橫“ニ”相同,“北”字可拆分出筆形 和“丨”,其編碼是2263;數(shù)字鍵“3”對應(yīng)設(shè)定的筆形為“氵”和拐兩個以上彎的單筆畫,拐兩個以上彎的單筆畫包括“乙、乚、 ㄋ、 ”等,如“泔”字可拆分出筆形“氵”,其編碼是312、“也”字可拆分出筆形“ 乚”,其編碼是323;數(shù)字鍵“4”對應(yīng)設(shè)定的筆形為“钅”和其中至少一筆為斜狀的兩單筆相交的筆形(其中至少一筆為斜狀的兩單筆相交筆形包括“ㄨ、ナ、カ、ヌ”等),如“針”字可拆分出筆形“钅”,其編碼是412,“戲”字可拆分出筆形“ヌ”等,其編碼是4467;數(shù)字鍵“5”對應(yīng)設(shè)定的筆形為“木”和一邊開口的框,一邊開口的框包括“匚、凵、冂、コ”等,如“樞”字可拆分出筆形“木、匚”,其編碼是554,“岷”字可拆分出筆形“凵、コ”其編碼是2554;數(shù)字鍵“6”對應(yīng)設(shè)定的筆形為撇“丿”和向左下方斜的點 如“升”字可拆分出筆形“丿”,其編碼是642、“冗”字可拆分出筆形 和“丿”,其編碼是6963;數(shù)字鍵“7”上對應(yīng)設(shè)定的筆形為捺“ ”和向右下方斜的點“丶”,如“杖”字可拆分出筆形“”,其編碼是547,“飛”字可拆分出筆形“丶”,其編碼是367;數(shù)字鍵“8”對應(yīng)設(shè)定的筆形為“ハ”和“亻”,筆形“丷、人”可看作與如筆形“ハ”相同,如“傘”字可拆分出筆形“人、丷”,其編碼是8812,“倆”字可拆分出筆形“亻”和“人”,其編碼是8158;
數(shù)字鍵“9”對應(yīng)設(shè)定的筆形為“扌”和只拐一個彎的折鉤(只拐一個彎的折鉤包括“、∠、く、亅、乛”等),如“掐”字可拆分出筆形“扌”和“乛”,其編碼是9695,“可”字可拆分出筆形“亅”,其編碼是109;數(shù)字鍵“0”對應(yīng)設(shè)定的筆形為“口”和“廣”,如“咽”字可拆分出筆形“口、囗”,其編碼是0047,“病”字可拆分出筆形“廣”,其編碼是0718。
為方便記憶,將以上的筆形設(shè)定可形象地編為如下字碼口訣“一草二豎三水淌,四金斜交五木框,六撇七捺八人旁,九手一鉤零口廣。”通過上述每個數(shù)字鍵盤上的漢字筆形設(shè)定,依據(jù)設(shè)定的各種筆形對漢字進(jìn)行拆分,并按照如下的規(guī)則對每個漢字取碼(1)按漢字的書寫順序拆分出上述設(shè)定的筆形,依次取該字中拆分出的第一、第二、第三和最后的筆形所對應(yīng)的數(shù)字鍵為代碼,作為該漢字的編碼;拆分不足四個筆形的字,不足四個筆形的不須補足四碼,其編碼與實際拆分所得的筆形相對應(yīng)。如“乘”字可依次拆分出筆形“丿、—、丨……ハ”,編碼為6128,“庇”字可依次拆分出筆形“廣、—、……乚”,編碼為0193,“為”字可依次拆分出筆形“丶、カ、丶”,編碼是747。
(2)合體字第一部位限取兩個筆形,第三個筆形必須轉(zhuǎn)入下一個部位獲取,第四筆形還是與該字的最后一筆相關(guān)的筆形;合體字一般為上下、上中下、左右、左中右、外內(nèi)、半包圍等結(jié)構(gòu)的字體,當(dāng)?shù)谝徊课豢刹鸱殖龀^兩個筆形時,取第三筆形時必須轉(zhuǎn)入下一部位。如“轉(zhuǎn)”字的第一部位可拆分出“、丨、—”,此時第三筆形不取“—”,而是轉(zhuǎn)入下一部位取“ニ”,其編碼是4227而不是4217,“動”字的第一部位可拆分出“ニ、 ㄥ、丶”,此時第三筆形不取“丶”,而是轉(zhuǎn)入下一部位取“カ”,其編碼是294而不是2974。
(3)當(dāng)同時可取兩種以上筆形時,首先以“多筆畫筆形優(yōu)先”原則,如在取“二”、“木”筆形時不取“—”的代碼1,而取“二”的代碼2或“木”的代碼5。在此前提下遇多筆形交織在一起時,再以“筆順優(yōu)先”為原則選取筆形如“奉”字第一部位的筆畫順序是橫橫橫撇捺,則第一筆形取“二”而不能取“ナ”,第二筆形才取“ナ”,加上第二部位取“二”和“丨”,編碼為2422而不是4222;“未”的編碼是228,而不是51或15等;“女”的編碼是41不是46?!俺伞钡牡谝还P“橫”與“斜鉤”相交且不存在同時取兩種以上筆形的問題,故第一筆形取4,編碼為4637而不是1637;“身”的編碼是6242而不是6234。
(4)“匚、凵、冂、コ”等一邊開口的框和“口”這些筆形不受筆順影響,應(yīng)當(dāng)整取,但其中所含筆形不與其他筆形連取。如“樞”的編碼是554而不是5149,“但”的編碼是8011而不是8521或802,“果”的編碼是015而不是525或0228,“因”的編碼是047。
將以上內(nèi)容概括為如下編碼口訣“前三后一字碼取,首部兩筆要轉(zhuǎn)移;優(yōu)先多筆和筆序,框口整取莫分離?!绷硗猓凑丈鲜龉P形代碼和編碼規(guī)則即可對所有漢字進(jìn)行編碼,并且不會產(chǎn)生誤編碼。但問題在于一些人對部分漢字的規(guī)范書寫順序不是十分清楚,容易習(xí)慣性誤寫,影響編碼的正確性。為最大程度地減輕實際可能存在的誤編碼,對“火”字和豎心旁“忄”的代碼,特別規(guī)定為88和82;對“乃”、“及”等最難分清筆序的字,本發(fā)明用兩套編碼對應(yīng)同一個字,使用戶誤編也一樣打出字詞。如“奶”的正確編碼是4136,但編為4163也可;“笈”的正確編碼是6164,但編為6138也可。
本發(fā)明對詞語的取碼作了相應(yīng)的規(guī)定,將詞語編碼的長度一律定為5位數(shù),理論上可容納10萬個詞語;如允許每個碼重復(fù)3次,則可編30萬個詞語。實際上常用詞語3萬左右,本發(fā)明按照以下規(guī)則對這些詞語進(jìn)行編碼,重碼率更低。這里所說的詞語,既包括詞和詞組,也包括常用的習(xí)慣性用語。詞語編碼分為四字以下(不含四字)和四字以上(含四字)兩類。
(a)四字以下詞語,即二字詞和三字詞,依次取前兩個字中各自的第一、第二筆形和后一個字的與最后一筆相關(guān)的筆形編碼。如,“地圖”的編碼是12067,“就是說”的編碼是71013。
(b)四字及四字以上的詞語取前四個字中的第一筆形和最后一個字中的與最后一筆相關(guān)的筆形進(jìn)行編碼。如,“空前絕后”的編碼是78960,“中國人民銀行”的編碼是00859。
(c)按照上述詞或詞組的取碼規(guī)則,當(dāng)某部位已被前邊部位取過而無法取碼時,則該部位的代碼重復(fù)前一代碼,使詞碼的長度始終保持五位數(shù)。如,“廣大”的編碼是00477,“一路上”的編碼是11022,“表里如一”的編碼是20411。
另外當(dāng)詞語末筆筆形不與上一筆筆形關(guān)聯(lián)時,不必考慮字的編碼。比如,“妹”字的編碼是4128,但“妹妹”的編碼卻是41415,而不是41418;“國”字的編碼是0227,但“中華人民共和國”的編碼為08850,而不是08857。這樣將更有利于提高編碼速度。
以上主要內(nèi)容編為如下詞碼口訣“前二字前二筆,后一字后一筆;四字首筆加末筆,五碼有缺重復(fù)齊?!崩帽景l(fā)明數(shù)字鍵盤上設(shè)定的筆形和取碼規(guī)則,還可對常用標(biāo)點符號按形似進(jìn)行數(shù)字編碼,一看便知,極易記住。這樣,就不用專設(shè)標(biāo)點符號鍵,使編輯輸入速度更加快捷。
1.單筆標(biāo)點的代碼單筆(一筆可寫出)且只占一個漢字位置的標(biāo)點,用一個數(shù)字作代碼。具體說明如下句號、中位圓點的代碼是0,波浪號的代碼是3,前括號、前單引號和左斜杠的代碼是6,頓號的代碼是7,逗號、后括號和后單引號的代碼是9(見下表)。
2.其他標(biāo)點的代碼除省略號外(省略號的代碼特定為0000),其他標(biāo)點均用兩個數(shù)字作代碼。具體說明如下分號的代碼是09,破折號的代碼是11,感嘆號的代碼是20,問號的代碼是30,前雙引號和前書名號的代碼是66,后雙引號和后書名號的代碼是99,冒號的代碼是00(見下表)。
利用本發(fā)明數(shù)字鍵盤上設(shè)定的筆形和取碼規(guī)則,還可對常用符號按其起始形狀作為歸類根據(jù)進(jìn)行數(shù)字編碼,滿足更多的需要,并且簡捷方便。常用符號編碼基本上以符號的起始形狀作為歸類根據(jù),將60種常用符號分別用0-9作為代碼0代表圓圈、圓點起始的6種符號,1代表橫起始的6種符號,2代表豎和二起始的6種符號,3代表彎曲形狀的6種符號,4代表斜交形狀的6種符號,5代表框狀及方框、菱形狀的6種符號,6代表含左斜狀的6種符號,7代表含右斜狀的3種符號及3個羅馬數(shù)字,8代表“人”字狀起始的6種符號,9代表一折狀的6種符號。具體符號代碼見下表
另外,利用本發(fā)明數(shù)字鍵盤上設(shè)定的筆形和取碼規(guī)則,對英文字母也可進(jìn)行數(shù)字編碼,實現(xiàn)英文字母的快速輸入。
1.大寫字母的代碼大寫字母最多三筆可寫出,因而不用考慮編碼規(guī)則,只按習(xí)慣書寫順序編碼即可(圓形、半圓形分別用0、5作代碼,見下表);
2.小寫字母的代碼和輸入小寫字母的代碼是相應(yīng)大寫字母的編碼加0,并且在編碼的同時完成輸入。選定大寫字母后,這時如果需要小寫字母則按0鍵將大寫字母轉(zhuǎn)換成小寫字母并直接送屏。
權(quán)利要求
1.一種一碼二形快速中文數(shù)字編碼輸入方法,其特征在于a、在每個數(shù)字鍵盤上各自設(shè)定對應(yīng)的漢字筆形,其中數(shù)字鍵“1”對應(yīng)的漢字筆形為“—”和“艸”,數(shù)字鍵“2”對應(yīng)的漢字筆形為“ニ”和“丨”,數(shù)字鍵“3”對應(yīng)的漢字筆形為“氵”和拐兩個以上彎的單筆畫,數(shù)字鍵“4”對應(yīng)的漢字筆形為“钅”和其中至少一筆為斜狀的兩單筆相交的筆形,數(shù)字鍵“5”對應(yīng)的漢字筆形為“木”和一邊開口的框,數(shù)字鍵“6”對應(yīng)的漢字筆形為撇“丿”和向左下方斜的點 數(shù)字鍵“7”對應(yīng)的漢字筆形為捺“”和向右下方斜的點“丶”,數(shù)字鍵“8”對應(yīng)的漢字筆形為“ハ”(含“丷、人”)和“亻”,數(shù)字鍵“9”對應(yīng)的漢字筆形為“扌”和只拐一個彎的折鉤,數(shù)字鍵“0”對應(yīng)的漢字筆形為“口”和“廣”;b、依據(jù)上述設(shè)定的各種筆形對漢字進(jìn)行拆分,并按照如下的規(guī)則對每個漢字取碼(1)按漢字的書寫順序拆分出上述設(shè)定的筆形,依次取該字中拆分出的第一、第二、第三和最后的筆形所對應(yīng)的數(shù)字鍵為代碼,作為該漢字的編碼,拆分不足四個筆形的字,其編碼與實際拆分所得的筆形相對應(yīng);(2)合體字第一部位限取兩個筆形,第三個筆形必須轉(zhuǎn)入下一個部位獲取,第四筆形還是與該字的最后一筆相關(guān)的筆形;(3)當(dāng)同時可取多種筆形時,在默認(rèn)多筆畫筆形優(yōu)先的前提下再按筆順優(yōu)先的原則,選取先寫出的筆形;(4)一邊開口的框和“口”這些筆形不受筆順影響,應(yīng)當(dāng)整取,但“口”筆形中所含的筆形不與其他筆形連取。
2.根據(jù)權(quán)利要求1所述的一碼二形快速中文數(shù)字編碼輸入方法,其特征在于,詞或詞組的取碼按如下規(guī)則(1)二字和三字詞語依次取前兩個字中各自的第一、第二筆形和最后一個字的與最后一筆相關(guān)的筆形編碼;(2)四字及四字以上的詞語取前四個字中的第一筆形和最后一個字中的與最后一筆相關(guān)的筆形進(jìn)行編碼;(3)按照上述詞或詞組的取碼規(guī)則,當(dāng)某部位已被前邊部位取過而無法取碼時,則該部位的代碼重復(fù)前一代碼,使詞碼的長度始終保持五位數(shù)。
3.根據(jù)權(quán)利要求1所述的一碼二形快速中文數(shù)字編碼輸入方法,其特征在于,對常用標(biāo)點符號按上述數(shù)字鍵對應(yīng)筆形并兼顧形似取碼為(1)一筆可寫出且只占一個漢字位置的單筆標(biāo)點,用一個數(shù)字作代碼,其中句號、中位圓點的代碼是0,波浪號的代碼是3,前括號、前單引號和左斜杠的代碼是6,頓號的代碼是7,逗號、后括號和后單引號的代碼是9;(2)其他標(biāo)點均用兩個數(shù)字作代碼,其中分號的代碼是09,破折號的代碼是11,感嘆號的代碼是20,問號的代碼是30,前雙引號和前書名號的代碼是66,后雙引號和后書名號的代碼是99,冒號的代碼是00;特別規(guī)定省略號的代碼是0000。
4.根據(jù)權(quán)利要求1所述的一碼二形快速中文數(shù)字編碼輸入方法,其特征在于,對常用符號按其起始筆形作為歸類根據(jù),將六十種常用符號進(jìn)行取碼其中圓圈、圓點起始的“·÷?!稹瘛颉绷N符號取碼為0;橫起始的“-+-→”六種符號取碼為1;豎或二起始的“丨=≠#↓№”六種符號取碼為2;彎曲形狀的“@ &§≈∽∫”六種符號取碼為3;斜交形狀的“× $ ※ * ★ ∮”六種符號取碼為4;框狀及方框、菱形狀的“[ ]■□◆◇”六種符號取碼為5;含左斜狀的“%/∥‰ ”六種符號取碼為6;含右斜狀的“\” 三種符號及三個羅馬數(shù)字“I II III”取碼為7;“人”字狀起始的“∧¥↑▲△☆”六種符號取碼為8;橫折狀的“∨< >←≤ ≥”六種符號取碼為9。
全文摘要
本發(fā)明公開了一種一碼二形快速中文數(shù)字編碼輸入方法,基于數(shù)字鍵盤對每個數(shù)字代表規(guī)定的兩種漢字筆形,按前三后一的書寫順序?qū)γ總€漢字的筆形進(jìn)行編碼,每字最多編為四位數(shù)碼,詞語按簡單規(guī)則編成五位數(shù)碼;將這些筆形標(biāo)于計算機、手機、特制鼠標(biāo)等一切需要進(jìn)行中文輸入的數(shù)字鍵盤上,即可進(jìn)行中文輸入操作。本發(fā)明完全以數(shù)字為代碼,實現(xiàn)對中文字、詞語、常用標(biāo)點、常用符號和英文字母的編碼輸入,重碼極低,易學(xué)會,操作速度快,使其成為更具應(yīng)用的廣泛性和操作的便捷性的“快樂數(shù)碼”。
文檔編號G06F3/023GK1460913SQ0312675
公開日2003年12月10日 申請日期2003年6月4日 優(yōu)先權(quán)日2003年6月4日
發(fā)明者王仁法 申請人:王仁法