專利名稱:漢字的計算機模糊輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字的計算機輸入法,更確切地說是涉及一種漢字的計算機模糊輸入法,是一種不記拼音、不記字根、不用字型、無拆分且重碼率低地計算機漢字輸入法。
計算機的漢字輸入問題是中國人學習計算機的最大障礙之一,目前已有的輸入方法中,除了全拼輸入法外,其它的輸入法幾乎都要經(jīng)過一定時間的學習。概括地說,現(xiàn)有的各種拼音輸入法,基本上是好學不好用,輸入效率較低且難于提高;而形碼輸入法(包括音形結(jié)合輸入法),基本上是好用不好學,特別是純形碼,字根復(fù)雜難記且拆分規(guī)則多,由于形碼輸入與人的思維習慣相抵觸,因此一段時間不用就很容易忘記。以上種種,使現(xiàn)有的漢字計算機輸入處于難于兩全的境地。
本發(fā)明的目的是提供一種漢字的計算機模糊輸入法,通過模糊取碼(或稱混沌碼),以結(jié)束死記硬背大量漢字拆分規(guī)則和大量無任何規(guī)律可循字根的歷史,具有不記拼音、不記字根、不用字型、無拆分且重碼率低的特點。
本發(fā)明的目的是這樣實現(xiàn)的一種漢字的計算機模糊輸入法,包括取漢字拼音中的首字母、漢字的基本筆劃和漢字的字根作為碼元,并分配在計算機標準鍵盤的字母及符號鍵上,以所在鍵位的字母或符號為碼元的代碼,再按音碼與字根碼結(jié)合編碼規(guī)則輸入漢字,其特征在于所述字根碼元的書寫、外形特征與其所在的鍵位大小寫字母、符號的書寫、外形特征天然相似,或字根碼元拼音的首字母是所在鍵位的字母;漢字中一切字根與字根穿插絞合難分難解的部件統(tǒng)一采用一個代碼輸入。
所述的鍵位包括A至Z共26個英文字母鍵和“’"、/、.、;”共4個符號鍵;所述的字根碼元及基本筆劃碼元與所在鍵位的關(guān)系是字根碼元“
人、八、犭”和筆劃橫“一”分配在字母鍵位A上;字根碼元“日、目、曰、
白、自、
”分配在字母鍵位B上;字根碼元“匚、
、勹、
才、寸”分配在字母鍵位C上;字根碼元“夕、
夂、攵、大”分配在字母鍵位D上;字根碼元“彐、
山、屮、巾、
尹、
肀、聿、巴、巳、已、己、
艮”分配在字母鍵位E上;字根碼元“
下、
、手、
豐、
夫、
扌”分配在字母鍵位F上;字根碼元“丘、匃、囗、田、
馬、
鳥、烏、
”分配在字母鍵位G上;字根碼元“艸、廾、、
廿、甘、
”分配在字母鍵位H上;字根碼元“工、讠、言”與筆劃豎“丨”分配在字母鍵位I上;字根碼元“廠、
斤、丁、
、廣、疒、
”分配在字母鍵位J上;字根碼元“
長、
、
片、
礻、衤”分配在字母鍵位K上;字根碼元“乚、
、、
乛、力、立、六、
辛、忄”分配在字母鍵位L上;字根碼元“了、ㄋ、弓、乃、冂、門、用、內(nèi)、禸、
宀冖
分配在字母鍵位M上;字根碼元“月、刀、
舟、幾”及筆劃捺“”分配在字母鍵位N上;字根碼元“口、
分配在字母鍵位O上;字根碼元“卩、阝、
尸、
分配在字母鍵位P上;字根碼元“蟲、
中、
、甲、由”分配在字母鍵位Q上;字根碼元“又、貝、女、
卜”分配在字母鍵位R上;字根碼元“彳、丆、石、干、千、禾、
雨、
七、
分配在字母鍵位T上;字根碼元“凵、厶、
臼、
魚、羽、五”分配在字母鍵位U上;字根碼元“冫、丷、ㄑ、ㄍ、钅、刂、
二、兒”分配在字母鍵位V上;字根碼元“
幺、纟、未、心、
”分配在字母鍵位W上;字根碼元“乂、十、ナ、
火、米、
癶、
”分配在字母鍵位X上;字根碼元“丫、ㄐ、羊、
止、土、士、”分配在字母鍵位Y上;字根碼元“乙、
之、辶、廴、
九、王、子、孑”分配在字母鍵位Z上;字根碼元“三、氵、、小、
彡、川、
巛”分配在三散筆符號鍵位’″上;字根碼元“灬、、爫、
業(yè)、木、四、皿、
”分配在四散筆符號鍵位;上;字根碼元“亠、文、方、
”及筆劃點“、”分配在.符號鍵位上;字根碼元“、亻”及筆劃撇“丿”分配在符號鍵位/上;所述的字根與字根穿插絞合難分難解的部件統(tǒng)一采用S代碼輸入。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字單字,是用該字拼音首字母和順序取前兩字根及末字根碼元的代碼共4碼輸入;鍵面成字是用該字拼音首字母和該字所在鍵位及加末筆劃代碼共3碼輸入;絞合一體的單字用該字拼音首字母加代碼S再順序取該字的第一、第二筆劃的代碼輸入;對不足4碼但第三碼是單筆劃碼的漢字單字用3碼輸入,對不足4碼但第三碼不是單筆劃碼的漢字單字,補充末筆劃代碼輸入。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字單字,還包括用代碼O代替一切不會讀音的字的第一位音碼。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字單字,還包括按讀音定位高頻字,26個高頻字及其代碼是A一 B不 C產(chǎn) D的 E二 F發(fā) G國 H和 I以 J經(jīng) K可 L了 M民N年 O歐 P批 Q起 R人 S是 T同 U于 V為 W我 X小 Y有 Z在。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字疑難單字,還包括用代碼V加漢字單字總筆劃數(shù)的代碼再順序加該字第一、第二筆劃的代碼共4碼輸入。
所述的漢字單字總筆劃數(shù)與代碼間的關(guān)系是1Q、2W、3E、4R、5T、6Y、7U、8I、90、10P、11A、12S、13D、14F、15G、16H、17J、18K、19L、20,總筆劃數(shù)超過20的一律用代碼;。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字雙字詞,是取首字拼音的首字母及其第一個字根碼元和取末字拼音的首字母及其第一個字根碼元的代碼共4碼輸入。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字三字詞,是順序取每字拼音的首字母和’"代碼共4碼輸入。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字四字詞,是順序取每字拼音的首字母共4碼輸入。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字多字詞,是順序取前三字及末字的拼音首字母共4碼輸入。
所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字偏旁部首,是用PP兩代碼加該偏旁部首所在鍵代碼再加該偏旁部首的末筆劃代碼共4碼輸入。
本發(fā)明的漢字的計算機模糊輸入法,是在總結(jié)、精煉、提高、繼承現(xiàn)有各種漢字輸入法各自優(yōu)點、摒棄它們各自缺點的基礎(chǔ)上,通過優(yōu)秀的人性化設(shè)計并在很多方面進行了突破而作出的,如首創(chuàng)的模糊取碼。本發(fā)明輸入法中的音碼碼元只取首字母,因而不受操作者拼音水平的影響;本發(fā)明輸入法中的字根碼元,采取與鍵盤上各鍵位符號(包括大小寫)基本天然相似的方法定位,非常直觀、非常簡便,因而不必強行記憶字根及判斷字根;輸入漢字時基本以鍵盤符號為標準,即用鍵盤符號直接“寫”出漢字,使?jié)h字輸入變得幾乎與輸入英文一樣簡單,漢字編碼不再需要死記硬背;本發(fā)明輸入法中,對漢字中一切字根與字根穿插絞合難分難解的部件都不作拆分,而統(tǒng)一用一個代碼模糊取碼輸入,該獨創(chuàng)的無拆分編碼輸入法,大大簡化了漢字的輸入,在漢字輸入法中首次實現(xiàn)了無拆分輸入,在用鍵盤輸入漢字的技術(shù)領(lǐng)域中取得了革命性的飛躍,開創(chuàng)了真正意義上的漢字無拆分編碼輸入的全新時代;本發(fā)明輸入法的理論重碼率比目前流行的各種輸入法都低,為5%(五筆字形為6%),若用其它計算方法統(tǒng)計,則為千分之幾(號稱重碼率為千分之一的天然碼,僅是一種設(shè)計重碼率,其理論重碼率仍然為百分之幾,且有使用鍵位多、指法不好掌握,難于實現(xiàn)盲打的問題)。
下面結(jié)合實施例進一步說明本發(fā)明的技術(shù)。
本發(fā)明輸入法共取有30個代碼,包括26個字母,即A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、T、U、V、W、X、Y、Z,和4個符號,即稱為三散筆的’"、稱為四散筆的;、.和/,30個代碼均定位在計算機鍵盤的鍵位上,26個字母代碼分別定位在相應(yīng)的英文字母鍵位上,4個符號代碼分別定位在’"、;、.>和?/鍵位上,輸入漢字即敲擊其代碼所在的鍵位。
本發(fā)明輸入法共取有277個字根,其大部分采取與鍵盤符號外形天然相似的方法定位在相應(yīng)鍵位上,有些不但與鍵盤符號的字母外形相似,且字根拼音的第一個字母也恰好是該鍵位字母,只有極個別字根的外形雖不同于所在鍵位的字母,但也一定是在該字根拼音聲母所在的鍵位上,因此字根雖有277個之多,但因其分布極有規(guī)律,因而非常簡便、直觀,不用強記。
A字母字形的特點是“人下橫點”,作為
人、八”4個字根的代碼,又由于字根“犭”的輪廓與A相似,尤其在草書字根“犭”時更像字母A,因此又將A作為字根“犭”的代碼,還由于字母A在英文中是“一”的意思,A又恰好是26個英文字母中的第一個字母,因此還將字母A作為筆劃橫“一”的代碼,即字母A最終作為6個字根的代碼?!叭讼聶M點”的“橫”既表示人和一橫組成字母A,同時也表示漢字的基本筆劃。
B字母的字形與漢字中8個字根天然相似,包括“日、目、曰、
白、自、
”。
C字母的書寫特征是“半包圍”,與漢字中7個字根的特征相符合,包括“匚、
勹、
”;C字母還是2個漢字字根的聲母,包括“才、寸”,因此,將C字母作為以上9個字根的代碼。
D字母的字形特征是“開口朝左且封閉”,與漢字中4個字根的特征相似,包括“夕、
夂、攵”;D字母還是漢字字根“大”的聲母,因此,將D字母作為以上5個字根的代碼。
E(包括大、小寫)字母的書寫外形與漢字中17個字根的外形天然相似,包括“彐、
山、屮、巾、
尹、
肀、聿、巴、巳、已、己、
艮”,因此將E字母作為以上17個漢字字根的代碼。
大寫字母F的書寫外形與漢字中9個字根的外形天然相似,包括“
下、
、手、
”;小寫字母f的字形特征是上下豎通,與漢字中6個字根的外形相似,包括“豐、
夫、
”,且“豐、夫”的聲母也為F;漢字字根中的“扌”與手寫體的“f”相近,因此將F作為以上共16個字根的代碼。
大寫字母G的書寫特征是“框內(nèi)有物”,與漢字中5個字根的特征相似,包括“丘、匃、囗、田、
”;小寫字母g與漢字中6個字根象形,包括“
馬、
鳥、烏、
”,因此,因此將G作為以上共11個字根的代碼。
H字母的字形特征是左右橫通,漢字中11個字根也具有這種特征,包括“艸、廾、、
廿、甘、
”,因此,將H作為以上11個字根的代碼。
大寫字母I的外形與漢字中字根“工”的外形天然相似,與筆劃豎“丨”的外形天然相似,小寫字母i的外形與漢字中字根“讠”的外形相似,而“讠”又與漢字字根“言”同義,因此將I作為以上共4個字根的代碼。
大寫字母J的字形特征象“廠”,有5個漢字字根具有這種特征,包括“廠、
斤、丁、
”;筆劃豎勾“”也具有這種特征;小寫字母j的字形特征象“廣”,有4個漢字字根具有這種特征,包括“廣、疒、
”,因此將J作為以上共10個字根的代碼。
大小寫字母K的外形與漢字中16個字根的外形天然相似,包括“
長、
、
片、
礻、衤”,因此將K作為以上共16個字根的代碼。
大寫字母L的書寫特征是“豎折”,由豎折引伸出橫折,與6個漢字字根的書寫特征相似,包括“乚、
、、
乛”;有4個漢字字根發(fā)音的第一個字母是L,包括“力、立、六、
”;由“立”引伸的漢字字根”辛”;漢字字根“忄”在手寫時往往寫成“L加上一豎”,即大寫L加上小寫l,因此將L作為以上共12個漢字字根的代碼。
字母M的字形特征是具有“寬下框”,故將M作為具有同樣字形特點的18個漢字字根的代碼,包括“了、ㄋ、弓、乃、冂、門、用、內(nèi)、
宀、冖、
”。其中“、弓、ㄋ”可視為直立的M。
小寫字母n的字形特征是具有“窄下框”,故將n作為具有同樣字形特點的7個漢字字根的代碼,包括“月、刀、
舟、幾”;筆劃捺“”發(fā)音的首字母是N,因此將N作為以上8個漢字字根和捺筆劃的代碼。
字母O的書寫特征是“空空如0”,因此將O作為也具有上述書寫特征的3個漢字字根的代碼,包括“口、
”。
字母P的字形特征與6個漢字字根的字形特征天然相似,包括“卩、阝、
尸、
”。
大寫字母Q的字形特征是“框中出筆”,有8個漢字字根具有同樣的字形特征,包括“蟲、
中、
甲、由”,該8個漢字字根的代碼取為Q。
大寫字母R的字形輪廓與4個漢字字根的字形輪廓相似,包括“又、貝、女、
”;小寫字母r與2個漢字字根的輪廓天然相似,包括“
卜”,因此將字母R作為上述6個漢字字根的代碼。
本發(fā)明取字母S書寫時有絞合之意,而將S作為本發(fā)明中一切字根與字根穿插絞合難分難解部件的代碼。所謂字根與字根穿插絞合難分難解的部件是指多個字根互相交叉重疊在一起,彼此之間沒有明顯的或暗示的空隙、需要進行拆分的部件,是拆分起來比較困難的部件,如“曲、酉、垂、重、耳”及“諫”字的右部、“曹”字的上部等。還有的字根是由一個絞合成一體的部分和一個單獨的點組成,如“甫、戊”等,這些字根在作為漢字的一部分輸入時,本發(fā)明將其上面的一點忽略,在作為單字輸入時則應(yīng)視為一個“S”和一個“點”來輸入。
大寫字母T的字形特征是上擋下通,有8個漢字字根也具有相同的字形特征,包括“彳、丆、石、干、千、禾、
雨”;有5個漢字字根的書寫外形與小寫t的外形天然相似,包括“
七、
”,因此將T作為上述13個漢字字根的代碼。
字母U的字形特征是“框向上”,有5個漢字字根的字形也具有相似的特征,包括“凵、厶、
臼、
”;有3個漢字字根的發(fā)音是U,包括“魚、羽、五”,因此將U作為上述8個漢字字根的代碼。
字母V的字形特征是“尖底”,有5個漢字字根的字形具有相似的特征,包括“冫、丷、ㄑ、ㄍ、钅”;其中“冫、丷”等的兩點象V,有7個兩筆劃漢字字根的筆數(shù)與其一致,所以安排在同一鍵位上,包括“刂、
二、兒”,因此將字母V作為上述12個漢字字根的代碼。
與字母W字形天然相似的有3個漢字字根,包括“
幺、纟”;漢字字根“未”發(fā)音的首字母是W;漢字字根“心、
”的草書象w,因此將W作為上述6個漢字字根的代碼。
X的書寫字形與7個漢字字根的書寫字形天然相似,包括“乂、十、ナ、
火、米”;X的字形特征是左右對稱,有6個漢字字根具有這種特征,包括
癶、
因此將X作為上述共13個漢字字根的代碼。
大寫Y的書寫字形與4個漢字字根的書寫字形天然相似,包括“丫、ㄐ、羊、
”;小寫字母y的字形特征是上通下?lián)酰?個漢字字根也具有相似的字形特征,包括“
止、土、士、”,因此將字母Y作為上述共12個漢字字根的代碼。
字母Z的書寫外形與9個漢字字根的書寫外形相似,包括“乙、
之、辶、廴、
九”;手寫“王”字時住住先寫出Z再加上一橫,“子、孑”的讀音同Z,因此將Z作為上述12個漢字字根的代碼。
符號’"象征三個分散的筆劃,有9個漢字字根是由三個散筆劃組成的,包括“三、氵、、小、
彡、川、
巛”。
符號;象征四個分散的筆劃,有6個漢字字根是由四個散筆劃組成的,包括“灬、、爫、
業(yè)、木”;有4個漢字字根的字形與四相似,包括“四、皿、
”,因此將四散筆符號;作為上述10個漢字字根的代碼。
符號.作為筆劃點“、”及首筆筆劃是點的4個漢字字根的代碼,包括“亠、文、方、
”。
符號/作為筆劃撇“丿”及首筆筆劃是撇的2個漢字字根的代碼,包括“、亻”。
本發(fā)明對“橫豎撇捺點折”以外的單筆劃的處理是將筆劃“提”作為“橫”的變形,用代碼A;豎勾的代碼為J;橫折或豎折的代碼都用L;橫折橫折勾的代碼是M;橫折彎勾或豎折彎勾的代碼都是Z;在極少數(shù)不容易區(qū)分“捺”與“點”的情況下,可采用這樣的原則處理一般一個漢字沒有撇是不會有捺的,所以緊跟在撇后面寫的是捺,緊跟在橫豎折后面寫的是點。
本發(fā)明在編碼輸入漢字時主要包括以下規(guī)則
輸入單字共用4碼,包括該字拼音的首字母代碼和順序取該字的前兩個字根及最后一個字根的代碼,對于穿插絞合難分難解的部件都不用拆分,而一律用代碼S輸入。本發(fā)明在輸入單字時,有時輸入的代碼不足4碼,如“合”字的代碼是HAO,“印”的代碼是YEP,本發(fā)明規(guī)定當其第三代碼是單筆劃碼時,則該字的全碼就只有3碼,如“旦”字的代碼是DBA,“氣”字的代碼是QKZ,“幻”字的代碼是HWL;,而當其第三代碼不是單筆劃碼時,則需采用補碼技術(shù),即補充末筆劃代碼,如“印”字的代碼YEPI。本發(fā)明在一般情況下都不需要用補碼,只有在所要輸入的字沒有出來時才需要補碼。本發(fā)明在26個字母鍵位上也安排了26個高頻字,采用簡碼1碼輸入,基本以高頻字的讀音定位,如“為”與V同音,“一”就是橫,所以安排在A鍵上,也無需特別記憶。26個高頻字及其代碼如下所示A一 B不 C產(chǎn) D的 E二 F發(fā) G國 H和 I以 J經(jīng) K可 L了 M民 N年 O歐 P批 Q起 R人 S是 T同 U于 V為 W我 X小 Y有 Z在。另外,常用的漢字大多都有二級或三級簡碼;當一個字的前兩碼或前三碼在整個編碼體系中是唯一的時,一般情況下也都有簡碼。
輸入雙字詞共用4碼,包括首字拼音首字母的代碼及首字第一個字根的代碼和末字拼音首字母的代碼及末字第一個字根的代碼。
輸入三字詞共用4碼,包括每字拼音首字母和三散筆代碼符號’"(符號’"象征數(shù)字3)。
輸入四字詞共用4碼,包括每字拼音首字母的代碼。
輸入多字詞共用4碼,包括前3個字和最后1個字拼音首字母的代碼。
本發(fā)明對于絞合成一體的漢字用4碼輸入,包括該字拼音首字母的代碼,加S代碼,和加該字第一、第二筆劃的代碼,如“曲”的編碼為QSIL,“酉”的編碼為YSAI。
以上輸入法中,由于在漢語拼音方案中yi、yu兩個音的聲母沒有起任何作用,所以本發(fā)明對這兩個音規(guī)定不用聲母而直接用韻母i、u輸入。
以上輸入法中,代碼S僅用于輸入穿插絞合難分難解的部件,對于字根之間雖然沒有明顯空隙,但僅僅是挨在一起并沒有穿插絞合的部件,則不能用代碼S來輸入,而應(yīng)該視作幾個字根來輸入。如“直”的編碼是“ZXNA”(發(fā)音首字母Z,十的代碼為X,下框的代碼為N,底下一橫的代碼為A。而“真”的編碼是“ZXNK”(發(fā)音首字母Z,十的代碼為X,下框的代碼為N,底下“”的代碼為K)。又如“巨”的編碼是JCC(發(fā)音首字母J,字形由一個右框和一個左框組成,即兩個C)。而“詎”的編碼則為JiCC(多了一個字根“讠”的代碼i)。由于這些字根的取碼并不存在困難,因此不能用S作代碼,而是用幾個字根的代碼來輸入。
本發(fā)明對鍵面成字的輸入共用3碼,包括該成字拼音的首字母代碼,再加該成字所在鍵代碼和該字的末筆劃代碼,本發(fā)明的鍵面成字包括277個字根中可獨立成字的字,在實際使用時,只有C、F、L、M、T、U、V七個鍵位上的個別成字需要加末筆劃代碼,如聲母相同的成字“千、七”,其它絕大多數(shù)成字僅需2碼輸入。
本發(fā)明對于不認識漢字的輸入,由于不知道它的讀音,統(tǒng)一用代碼O作為其第一個代碼輸入,表示它沒有讀音,意即“零音”。
本發(fā)明對于既不認識又難以用部件取碼的漢字,采用“筆劃查詢輸入”法,以4碼輸入,為“V+總筆劃數(shù)的字母代碼+第一筆劃代碼+第二筆劃代碼”,以確保任一個單字都能準確地輸入。總筆劃數(shù)的字母代碼基本安排在鍵盤各字母鍵位上,為避免特別記憶,而將第一排上的十個字母從左至右依次表示1-10,第二排上的9個字母及一個;鍵從左至右依次表示11-20。即左手上為1-5,左手中為11-15;右手上為6-10,右手中為16-20,非常有規(guī)律,無需特別記憶。由于超過20個筆劃的漢字很少,所以對于超過20筆劃的漢字可一律用20筆劃,即用“;”鍵輸入。如“矛”字的代碼為VTL.(總筆劃數(shù)為5,第1筆劃是橫折,第二筆劃是點)。
本發(fā)明對于偏旁部首的輸入同鍵面成字的輸入方法基本相同,但將其讀音部分的代碼統(tǒng)一采用PP(PP是“偏旁”兩字的拼音首字母),再加上該偏旁部首所在鍵的代碼,最后是該偏旁部首的末筆劃代碼。若輸入的是單筆劃,因不存在末筆劃,因此只有三碼;若是雙碼偏旁,則在輸入PP后再依次取碼,如“殳”的編碼為PPnR。
本發(fā)明的漢字模糊輸入法,主要采用將字根與鍵盤符號天然相似的方法定位,和統(tǒng)一采用S作為一切穿插絞合難分難解字根的代碼,從而首次實現(xiàn)了無拆分的編碼輸入,大大簡化了漢字的計算機輸入。如“屬”的代碼是SPS,“曹”的代碼是CSB。又如“命”的代碼是MAOP,“打”的代碼是DFJ,“擴”的代碼是KFJ,“編”的代碼是BW.M,“它”的代碼是TMT,“宅”的代碼是ZM/T。
權(quán)利要求
1.一種漢字的計算機模糊輸入法,包括取漢字拼音中的首字母、漢字的基本筆劃和漢字的字根作為碼元,并分配在計算機標準鍵盤的字母及符號鍵上,以所在鍵位的字母或符號為碼元的代碼,再按音碼與字根碼結(jié)合編碼規(guī)則輸入漢字,其特征在于所述字根碼元的書寫、外形特征與其所在的鍵位大小寫字母、符號的書寫、外形特征天然相似,或字根碼元拼音的首字母是所在鍵位的字母;漢字中一切字根與字根穿插絞合難分難解的部件統(tǒng)一采用一個代碼輸入。
2.根據(jù)權(quán)利要求1所述的漢字的計算機模糊輸入法,其特征在于所述的鍵位包括A至Z共26個英文字母鍵和“’″、/、.、:;”共4個符號鍵;所述的字根碼元及基本筆劃碼元與所在鍵位的關(guān)系是字根碼元“
人、八、犭”和筆劃橫“一”分配在字母鍵位A上;字根碼元“日、目、日、
白、自、
”分配在字母鍵位B上;字根碼元“匚、
勹、
才、寸”分配在字母鍵位c上;字根碼元“夕、
夊、攵、大”分配在字母鍵位D上;字根碼元“彐、
山、
、巾、
尹、
肀、聿、巴、巳、已、己、
艮”分配在字母鍵位E上;字根碼元“
下、
、手、
豐、
夫、
扌”分配在字母鍵位F上字根碼元“丘、匃、口、田、
馬、
鳥、烏、
”分配在字母鍵位G上;字根碼元“艸、升、、
廿、甘、
分配在字母鍵位H上;字根碼元“工、讠、言”與筆劃豎“丨”分配在字母鍵位I上;字根碼元“廠、
斤、丁、
亅、廣、疒、
廣”分配在字母鍵位J上;字根碼元“
長、
、
片、
礻、衤”分配在字母鍵位K上;字根碼元“乚、
、、
乛、力、立、六、
辛、忄”分配在字母鍵位L上;字根碼元“了、ㄋ、弓、乃、門、門、用、內(nèi)、禸、
宀冖
分配在字母鍵位M上;字根碼元“月、刀、
舟、幾”及筆劃捺“”分配在字母鍵位N上;字根碼元“口、
”分配在字母鍵位O上;字根碼元“卩、阝、
、尸、
”分配在字母鍵位P上;字根碼元“蟲、
中、
甲、由”分配在字母鍵位Q上;字根碼元“又、貝、女、
卜”分配在字母鍵位R上;字根碼元“彳、丆、石、干、千、禾、
雨、
七、
匕”分配在字母鍵位T上;字根碼元“凵、厶、
臼、
魚、羽、五”分配在字母鍵位U上;字根碼元“冫、丷、ㄑ、巜、钅、刂、
二、兒”分配在字母鍵位V上;字根碼元
幺、纟、未、心、
”分配在字母鍵位W上;字根碼元“ㄨ、十、ナ、
火、米、
癶、
分配在字母鍵位X上;字根碼元“丫、丩、羊、
止、土、士、”分配在字母鍵位Y上;字根碼元“乙、
之、辶、廴、
九、王、子、孑”分配在字母鍵位Z上;字根碼元“三、氵、、小、
彡、川、
“巛”分配在三散筆符號鍵位’″上;字根碼元“灬、、爫、
業(yè)、木、四、皿、
”分配在四散筆符號鍵位;上;字根碼元“亠、文、方、
”及筆劃點“丶”分配在.符號鍵位上;字根碼元“、亻”及筆劃撇“丿”分配在符號鍵位/上;所述的字根與字根穿插絞合難分難解的部件統(tǒng)一采用S代碼輸入。
3.根據(jù)權(quán)利要求1所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字單字,是用該字拼音首字母和順序取前兩字根及末字根碼元的代碼共4碼輸入;鍵面成字是用該字拼音首字母和該字所在鍵位及加末筆劃代碼共3碼輸入;絞合一體的單字用該字拼音首字母加代碼S再順序取該字的第一、第二筆劃的代碼輸入;對不足4碼但第三碼是單筆劃碼的漢字單字用3碼輸入,對不足4碼但第三碼不是單筆劃碼的漢字單字,補充末筆劃代碼輸入。
4.根據(jù)權(quán)利要求3所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字單字,還包括用代碼O代替一切不會讀音的字的第一位音碼。
5.根據(jù)權(quán)利要求3所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字單字,還包括按讀音定位高頻字,26個高頻字及其代碼是A一 B不 C產(chǎn) D的 E二 F發(fā) G國 H和 I以 J經(jīng) K可 L了 M民 N年 O歐 P批 Q起 R人 S是 T同 U于 V為 W我 X小 Y有 Z在。
6.根據(jù)權(quán)利要求3所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字疑難單字,還包括用代碼V加漢字單字總筆劃數(shù)的代碼再順序加該字第一、第二筆劃的代碼共4碼輸入;所述的漢字單字總筆劃數(shù)與代碼間的關(guān)系是1Q、2W、3E、4R、5T、6Y、7U、8I、90、10P、11A、12S、13D、14F、15G、16H、17J、18K、19L、20,總筆劃數(shù)超過20的一律用代碼。
7.根據(jù)權(quán)利要求1所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字雙字詞,是取首字拼音的首字母及其第一個字根碼元的代碼和取末字拼音的首字母及其第一個字根碼元的代碼共4碼輸入。
8.根據(jù)權(quán)利要求1所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字三字詞,是順序取每字拼音的首字母和三散筆’"代碼共4碼輸入。
9.根據(jù)權(quán)利要求1所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字四字詞,是順序取每字拼音的首字母共4碼輸入;所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字多字詞,是順序取前三字及末字的拼音首字母共4碼輸入。
10.根據(jù)權(quán)利要求1所述的漢字的計算機模糊輸入法,其特征在于所述的按音碼與字根結(jié)合編碼規(guī)則輸入漢字偏旁部首,是用PP兩代碼加該偏旁部首所在鍵再加該偏旁部首的末筆劃代碼共4碼輸入。
全文摘要
本發(fā)明涉及一種漢字的計算機模糊輸入法,包括取漢字拼音中的首字母、漢字的基本筆劃和字根作為碼元,并分配在鍵盤的30個字母及符號鍵上,以所在鍵位的字母或符號為碼元的代碼,再按音碼與字根結(jié)合編碼輸入漢字。其中的字根碼元在書寫、外形特征等方面與其所在的鍵位字母、符號天然相似,或字根碼元拼音的首字母就是所在鍵位的字母;漢字中一切字根與字根穿插絞合難分難解的部件統(tǒng)一采用一個代碼輸入。首創(chuàng)模糊取碼,具有不記拼音、不記字根、不用字型、無拆分且重碼率低的特點。
文檔編號G06F3/023GK1227364SQ99103388
公開日1999年9月1日 申請日期1999年3月17日 優(yōu)先權(quán)日1999年3月17日
發(fā)明者陶良球 申請人:陶良球