專(zhuān)利名稱(chēng):一根碼計(jì)算機(jī)漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明為“一根碼計(jì)算機(jī)漢字輸入法”,以取聲為主,取形為輔,系一種聲形碼漢字輸入法。國(guó)內(nèi)現(xiàn)有輸入法可分為“聲碼”、“形碼”和“聲形碼”幾大類(lèi),其一般特點(diǎn)是“聲碼好學(xué)不好用,形碼好用不好學(xué)”。它們連同試圖綜合二者優(yōu)點(diǎn)的“聲形碼”在內(nèi),在如何處理好“難度”與“速度”的矛盾方面,還留下了較大的改進(jìn)余地。本發(fā)明以“字取聲母,形取首筆”的聲形編碼原理,通過(guò)對(duì)單字構(gòu)件的精當(dāng)分解和精巧的鍵盤(pán)布局,實(shí)現(xiàn)了“大詞匯量,多簡(jiǎn)碼字,高容錯(cuò)度,零重碼率”的超高性能,這些其它漢字輸入法所難以達(dá)到的性能指標(biāo),加上極為簡(jiǎn)捷的拆分方式和編碼方法,使本方案“簡(jiǎn)單易學(xué),快捷實(shí)用”,妥善地解決了漢字輸入法“難度”與“速度”的矛盾。
本輸入法為聲形碼,最大碼長(zhǎng)4碼,揉合了拼音碼易學(xué)與筆形碼快捷的顯著特點(diǎn),通過(guò)“字取聲母,形取首筆” 的編碼原理,實(shí)現(xiàn)了“大詞匯量,多簡(jiǎn)碼字,高容錯(cuò)度,零重碼率”的超高性能,使編碼自然流暢,最大限度地縮短學(xué)習(xí)的時(shí)間,減輕學(xué)習(xí)的負(fù)擔(dān)。
目前國(guó)內(nèi)已有大量的各式漢字輸入法的存在,呈現(xiàn)出所謂的“萬(wàn)碼奔騰”的局面。方案不少,大體可分為以下三類(lèi)①聲碼。代表為全拼碼。
漢語(yǔ)拼音是指我國(guó)法定的標(biāo)準(zhǔn)漢語(yǔ)拼音方案,采用標(biāo)準(zhǔn)西文鍵盤(pán)上除“V”以外的25個(gè)英文字母。在全拼拼音狀態(tài)下輸入漢字,要求逐個(gè)打入漢字拼音,從所顯示的同音字中選取所需要的漢字。這種方案建立在漢語(yǔ)拼音的基礎(chǔ)上,因此,有一定漢語(yǔ)拼音基礎(chǔ)者學(xué)起來(lái)很容易,但因其重碼太多,選碼費(fèi)時(shí)費(fèi)力,速度很慢,使用頗為不便。
②形碼。代表為五筆字型。
五筆字型是王永民研究出來(lái)的漢字輸入法,是我國(guó)目前應(yīng)用較廣、影響較大的漢字輸入技術(shù)。雖然在開(kāi)始學(xué)習(xí)需要記憶的字根較多,上手較慢,但是由于它具有重碼率較低等特點(diǎn),經(jīng)過(guò)一定時(shí)間的學(xué)習(xí)與實(shí)踐后會(huì)逐漸適應(yīng),輸入速度也會(huì)逐步提高。
③聲形碼代表為自然碼。
自然碼是周志農(nóng)完成的一個(gè)以音為主,以形為輔,嘗試集各種輸入方案的優(yōu)秀功能為一體的漢字輸入法。自然碼的核心是拼音輸入,吸收了雙拼輸入法的鍵盤(pán)布局,輸入詞為主,單字的輸入引入了形碼的部分技巧。但雙拼鍵盤(pán)布局以及形碼部分記憶量較大,體系較繁雜,熟練掌握仍需花費(fèi)不少時(shí)間和精力。
本發(fā)明的目的,是突破電腦的學(xué)習(xí)和使用中漢字輸入這個(gè)“瓶頸”,使?jié)h字輸入法更為簡(jiǎn)單實(shí)用,妥善解決漢字輸入中“好學(xué)”與“好用”的矛盾。
本發(fā)明技術(shù)方案如下①單字構(gòu)件一是字元,指構(gòu)成單個(gè)漢字的最小漢字,如“桂”字由字元“木土土”構(gòu)成;二是筆形,指單筆或由單筆組合而成的非字元的字塊,如“漢”字由字塊“氵”和字元“又”構(gòu)成;②編碼原理概括為兩條,一是“字取聲母”,即所有單字一律取其聲母為首碼;單字中的所有字元也取其聲母為代碼,如“桂”字,第1碼取其本字的聲母G,第2碼取字元“木”字的聲母M,第3碼取字元“土”字的聲母T,那么“桂”字的代碼即為GMT。各聲母碼與鍵盤(pán)字母的對(duì)應(yīng)關(guān)系為 其中,聲母“zh、ch、sh、n”分別并入聲母“z、c、s、l”中;“V”用作查詢(xún)鍵,用以查詢(xún)不明編碼;“N”為難字的借代聲母。
二是“形取首筆”,即所有構(gòu)成漢字的“筆形”按其首筆分成“橫豎撇捺折”5類(lèi)進(jìn)行取碼,代碼分別為與它們有相同首筆的5個(gè)字母“橫E、豎I、撇A、捺U、折O”,如“漢”字第1碼取單字聲母H,第2碼取形“氵”的代碼“U”,第3碼取“又”的聲母Y,這樣“漢”字代碼為HUY。
③拆分原則,有以下三點(diǎn)一是“按級(jí)拆取”全部構(gòu)件按級(jí)別高低依序分成3級(jí)“字元→筆形→單筆”。單筆只有首筆,是筆形中的最簡(jiǎn)形式,為敘述方便,列為單獨(dú)的一級(jí),而實(shí)際上屬于“筆形”構(gòu)件。拆分時(shí),級(jí)別高的構(gòu)件優(yōu)先拆分,但字元不能單純地以筆劃數(shù)最少來(lái)確定,而是從筆順?lè)较蚓唧w來(lái)確定是否字元。如“換”拆成“扌奐th”。
二是“字小優(yōu)先”對(duì)于構(gòu)成漢字的更小漢字,除后面另有規(guī)定的除外,應(yīng)盡量把筆劃取小。如“鋅”取碼為“xals”右邊取“立十”而不取“辛”。
三是“下拆一層”筆劃之間關(guān)系分為四層“散→連→交→單”。散是指構(gòu)件筆劃間有空間距離,如“權(quán)”字;連是指構(gòu)件筆劃間無(wú)空間距離,如“辛”字;交是指構(gòu)件筆劃間相互交叉,如“豐”字;單是指構(gòu)成構(gòu)件的單筆劃,如“一”。下拆一層,即按四層關(guān)系順序往下拆一層,有散拆散,無(wú)散拆連,無(wú)連拆交,交拆單筆,如“人”拆成單筆撇和捺,“貝”拆成下框和“人”,“財(cái)”拆成“貝才”。
四是“兼顧習(xí)慣”當(dāng)字元與單筆組合而成的漢字作為單字的構(gòu)件時(shí),該漢字可不按“字小優(yōu)先”進(jìn)行拆小,以兼顧習(xí)慣,便于理解。如“圣”不拆成“又十一”而拆成“又土”④編碼方法一是單字編碼,全碼碼長(zhǎng)4碼,首碼取漢字聲母碼,其余3碼依筆序按拆分原則取“首件,次件,末件”代碼。不足4碼加取最后部的字元,如無(wú),則加取末筆碼。如“樹(shù)”字取“木又寸”全碼為“smyc”;“漢”字“氵又”加取末筆后全碼為“huyu”;再如“頂”字加取最末字元后部字元為“丁頁(yè)貝”,編碼為“ddyr”。
二是詞組編碼,即由一個(gè)以上單字組成的字串的編碼,方法為二字詞組各取前兩碼,三字詞組取各字首碼及末字第二碼,三字以上詞組取前三字及最未字首碼。如“一根”取碼“yegm′;“一根碼”取碼“ygmw”;“一根碼輸入法”取碼“ygmf”。
三是簡(jiǎn)碼編碼簡(jiǎn)碼分一級(jí),二級(jí),三級(jí)簡(jiǎn)碼,方法是先輸入相應(yīng)個(gè)數(shù)編碼,再加空格斷碼鍵。如一級(jí)簡(jiǎn)碼“的”,鍵入“d”加空格即可;二級(jí)簡(jiǎn)碼“大”,鍵入“de”加空格即可。
⑤容錯(cuò)處理。所謂容錯(cuò)處理,即當(dāng)單字輸入時(shí),對(duì)有可能出現(xiàn)的錯(cuò)誤作出相應(yīng)的包容處理。內(nèi)容有聲母容錯(cuò)zh,ch,sh,n分別與z,c,s,l聲母合并使用。
識(shí)讀容錯(cuò)當(dāng)不知道單字或字元發(fā)音而不能確定其聲母碼時(shí),可以根據(jù)該字的起筆取相應(yīng)單筆碼“EIAUO”來(lái)作替代聲碼,也可用“N”來(lái)作難字的替代聲母;
多音容錯(cuò)多音字給出全部不同讀音的不同編碼。
發(fā)明與
背景技術(shù):
相比所具有的有益的效果①單字構(gòu)件更為簡(jiǎn)明實(shí)用現(xiàn)有的形碼技術(shù)中,其構(gòu)件往往只有一種,即字根,字根因劃分過(guò)細(xì),一般數(shù)量較大,編碼及拆分沒(méi)有優(yōu)化的余地,也增大了記憶量和學(xué)習(xí)的難度。
本發(fā)明把單字構(gòu)件分成字元和筆形兩種,既簡(jiǎn)明又極易掌握,擺脫了字根表的束縛,將機(jī)械的記憶變?yōu)樵硇缘膽?yīng)用,使拆分和編碼自然流暢。
②編碼原理更加科學(xué)合理現(xiàn)有的技術(shù)中,聲碼如拼音碼,只取其聲母韻母,而導(dǎo)致重碼過(guò)多;形碼如五筆字型,只取其字根碼,且各個(gè)字根形狀各異,學(xué)習(xí)量過(guò)大,掌握不易。聲形碼如自然碼,雖然力圖揉合前者好學(xué)和后者好用的特點(diǎn),但因?yàn)樵诰幋a的原理上沒(méi)有突破,因而,只能作有限的改進(jìn)。
本發(fā)明采用的聲形編碼原理,只用“字取聲母,形取首筆”八個(gè)字,就概括出方案的主要內(nèi)容,突破了原有輸入法中各種繁瑣的東西,使本法既能很容易地取出聲碼,又可以很容易地取出形碼。其突破之處在于對(duì)于取聲部分,提供了難字聲母“N”,使不能認(rèn)識(shí)的字也能方便地編出代碼;對(duì)于取形部分,按五類(lèi)首筆取具有同樣首筆的“EIAUO”為代碼,既使所有取形構(gòu)件得到了全面覆蓋,又極大地簡(jiǎn)化了編碼方法,使方案易學(xué)實(shí)用。
③拆分原則更為自然直觀現(xiàn)有的聲形碼技術(shù)中,由于構(gòu)件沒(méi)有級(jí)別之分,故無(wú)按級(jí)拆取的方法。拆取字根時(shí),正因?yàn)闆](méi)有級(jí)別的概念,拆分一律從不變的字根拆起,字根形狀各異,給拆分帶來(lái)困難。而由于采取取大優(yōu)先,還易造成代碼位數(shù)過(guò)少,形成重碼。
本發(fā)明由于建立了構(gòu)件的級(jí)別概念,按級(jí)拆取,不從相交筆劃中拆出非單筆劃構(gòu)件,因此極為直觀,易于快速拆取,保證了拆分和編碼的唯一正確性。由于采取了取小優(yōu)先的原則,加上改進(jìn)了取碼方法,因此每個(gè)單字都能取出4位代碼的全碼,這就為科學(xué)合理地分配和調(diào)整各級(jí)簡(jiǎn)碼、離散重碼提供了極大的自由空間。
④編碼方法整齊劃一現(xiàn)有的聲形碼技術(shù)中,必須根據(jù)不同情況使用不同的編碼方法,如五筆中的鍵名漢字、成字字根、單個(gè)漢字都有各自不同的編碼方法,增大了方案的內(nèi)容和復(fù)雜的程度,也增加了學(xué)習(xí)者的學(xué)習(xí)負(fù)擔(dān)。
本發(fā)明編碼不用區(qū)別編碼對(duì)象的不同情況,只用同一種方法進(jìn)行編碼,精簡(jiǎn)了方案的內(nèi)容,減輕了學(xué)習(xí)的負(fù)擔(dān),使本方案簡(jiǎn)單易學(xué),快捷實(shí)用。
⑤容錯(cuò)技術(shù)得到了系統(tǒng)應(yīng)用現(xiàn)有的聲形碼技術(shù)中,也會(huì)有一些容錯(cuò)碼,但量極少,作用甚微。
本發(fā)明中提供了系統(tǒng)的容錯(cuò)方法,有聲母容錯(cuò)、識(shí)讀容錯(cuò)、多音容錯(cuò)。這些容錯(cuò)技術(shù)的系統(tǒng)采用,為錄入提供極大的便利。特別是識(shí)讀容錯(cuò),更是本發(fā)明之獨(dú)創(chuàng)。
實(shí)施例1(單字編碼)李lmz、好hlz、比bbb;體tab、漢huy、提t(yī)er;全qa、下xe、次cu、登do。
實(shí)施例2(詞組編碼)原理yclw、聲碼ssms;輸入法srfu、一根碼ygms;中國(guó)人民zgrm、揚(yáng)眉吐氣ymtq。
實(shí)施例3(句子編碼)過(guò)去人們努力研究科學(xué)的普遍目的是了解自然,現(xiàn)在的人們Gcqt rama llla ysjx khxu d pbbh midb s lojj zara,xwze d rama則試圖找出控制自然的方法和手段來(lái)保護(hù)人類(lèi)和改善生活。zb sutk zeg co keza zara d fufu h sada le bahe ralm h gjsy slhd.但是,科學(xué)如果使用不當(dāng),它的破壞力將會(huì)是無(wú)法控制,因而Dasr,khxu rlgi saya bedi,tudb phla juha s wefu keza,ykee是極為可怕的??茖W(xué)本身是無(wú)辜的,而問(wèn)題主要在于人類(lèi)s jmwu kdpx d.khxu besa s wegs d,e wmtr zuyx zeye ralm過(guò)度濫用了科學(xué)。gcdg luya l khxu.
權(quán)利要求
1.一根碼計(jì)算機(jī)漢字輸入法,與現(xiàn)有漢字鍵盤(pán)輸入法的共同之處,在于以英文字母鍵為碼元,最大碼長(zhǎng)4碼;本法取碼以聲為主,以形為輔,其特征在于以“字元”和“筆形”為構(gòu)成全部漢字的兩類(lèi)構(gòu)件,其中,“字元”是指構(gòu)成單個(gè)漢字的最小漢字,如“桂”字由字元“木土土”構(gòu)成;所謂“筆形”是單筆劃或由單筆劃組合而成的非字元的字塊,如“漢”字由字塊“氵”和字元“又”構(gòu)成;本法的取碼方法為①字取聲母即所有單字一律取其聲母為首碼;單字中的所有字元也取其聲母為代碼,如“桂”字,第一碼取其本字的聲母G,第二碼取字元“木”字的聲母M,第三碼取字元“土”字的聲母T,那么“桂”字的代碼即為GMT;②形取首筆所有構(gòu)成漢字的“筆形”按其首筆分成“橫豎撇捺折”5類(lèi)進(jìn)行取碼,代碼分別為與它們有相同首筆的5個(gè)字母“橫E、豎I、撇A、捺U、折O”,如“漢”字第一碼取單字聲母H,第二碼取形“氵”的代碼“U”,第三碼取“又”的聲母Y,這樣“漢”字代碼為HUY。
2.根據(jù)權(quán)利要求1所述的輸入法,其特征在于“字取聲母”中所取聲母與鍵盤(pán)的對(duì)應(yīng)為鍵位Q對(duì)應(yīng)聲母q、W對(duì)應(yīng)w、E對(duì)應(yīng)e、R對(duì)應(yīng)r、T對(duì)應(yīng)t、Y對(duì)應(yīng)y、0對(duì)應(yīng)o、P對(duì)應(yīng)p、A對(duì)應(yīng)a、S對(duì)應(yīng)s和sh、D對(duì)應(yīng)d、F對(duì)應(yīng)f、G對(duì)應(yīng)g、H對(duì)應(yīng)h、J對(duì)應(yīng)j、K對(duì)應(yīng)k、L對(duì)應(yīng)l、N對(duì)應(yīng)“難字聲母”、Z對(duì)應(yīng)z和zh、X對(duì)應(yīng)x、C對(duì)應(yīng)c和ch、V對(duì)應(yīng)“查詢(xún)鍵”、B對(duì)應(yīng)b、M對(duì)應(yīng)m。其中,聲母“zh、ch、sh、n”分別并入聲母“z、c、s、l”中;“V”用作查詢(xún)鍵,用以查詢(xún)不明編碼;“N”為難字的借代聲母。
3.根據(jù)權(quán)利要求1所述的輸入法,其特征在于以“點(diǎn)”為首筆的“筆形”可視作以“捺”筆為首筆的“筆形”進(jìn)行取碼。
4.根據(jù)權(quán)利要求1所述的輸入法,其特征在于在對(duì)漢字進(jìn)行編碼時(shí),聲母zh,ch,sh,n分別以z,c,s,l為借代聲母,稱(chēng)之為“聲母容錯(cuò)”,例如“女”編碼為“l(fā)o”。
5.根據(jù)權(quán)利要求1所述的輸入法,其特征在于在對(duì)漢字進(jìn)行編碼時(shí),對(duì)不知道讀音的漢字或字元根據(jù)其“橫、豎、撇、捺、折”不同起筆,分別用“E、I、A、U、O”字母作借代聲母,也可用“N”字母作借代聲母,稱(chēng)之為“識(shí)讀容錯(cuò)”,例如“彗”正確編碼為“HFF”,識(shí)讀容錯(cuò)碼為“EFF”或“NFF”。
6.根據(jù)權(quán)利要求1所述的輸入法,其特征在于當(dāng)漢字存在一字多音的情況時(shí),給出各種不同讀音的全部正確編碼,稱(chēng)之為“多音容錯(cuò)”,例如“行”讀hang時(shí)編碼為hcc,讀xing時(shí)編碼為xc。
全文摘要
一根碼計(jì)算機(jī)漢字輸入法,是一種高效的聲形碼輸入法。它以字元和筆形為漢字的構(gòu)件,字元指構(gòu)成單個(gè)漢字的最小漢字,筆形是單筆劃或由單筆劃組合而成的非字元的字塊。主要內(nèi)容概括為8個(gè)字:“字取聲母”,即所有單字一律取其聲母為首碼,單字中的所有字元也取其聲母為代碼,如“桂”字的代碼為gmt;“形取首筆”即所有構(gòu)成漢字的“筆形”按其首筆分成“橫豎撇捺折”5類(lèi)進(jìn)行取碼,代碼分別為與它們有相同首筆的5個(gè)字母“橫E、豎I、撇A、捺U、折O”,如“漢”字代碼為huy。一根碼以至簡(jiǎn)化的方案,實(shí)現(xiàn)了“大詞匯量、多簡(jiǎn)碼字、高容錯(cuò)度、零重碼率、易學(xué)難忘”的超高性能指標(biāo),完美地解決了漢字輸入中“好學(xué)與好用”的矛盾。
文檔編號(hào)G06F3/023GK1373408SQ02104850
公開(kāi)日2002年10月9日 申請(qǐng)日期2002年2月11日 優(yōu)先權(quán)日2002年2月11日
發(fā)明者黃桂清 申請(qǐng)人:黃桂清