專利名稱:計(jì)算機(jī)漢字部首音標(biāo)輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)使用的漢字編碼輸入方法,特別是計(jì)算機(jī)漢字部首音標(biāo)輸入方法。
隨著計(jì)算機(jī)在我國(guó)各行各業(yè)的廣泛應(yīng)用,漢字輸入技術(shù)也在日新月異地發(fā)展,僅漢字編碼就已達(dá)千余種,其中有些編碼的速度已大大超過(guò)西文而達(dá)到了較高的水平,為進(jìn)一步提高計(jì)算機(jī)漢字編碼技術(shù)水平打下了良好的基礎(chǔ)。盡管如此,這些各有千秋的編碼都還存在著一個(gè)共同的缺陷——不能與語(yǔ)文教學(xué)同步。其原因在于背棄了漢字“部首構(gòu)字”的傳統(tǒng)習(xí)慣。部首首創(chuàng)于許慎的《說(shuō)文解字》,始為540部、明代梅膺祚在《字匯》中將其減為214部,《新華字典》等現(xiàn)代字(詞)典均設(shè)定為188 191部。長(zhǎng)期以來(lái),不管漢字經(jīng)歷了怎樣的變革和發(fā)展,也不管部首的數(shù)量發(fā)生了什么樣的變化,部首作為漢字的零部件,其整體的構(gòu)字能力卻有增無(wú)減。任何人要想學(xué)習(xí)漢字,都得從部首開(kāi)始。由幾個(gè)單筆部首到一百多個(gè)復(fù)筆部首,再到成千上萬(wàn)、千姿百態(tài)的漢字,部首是最基本的。在計(jì)算機(jī)漢字編碼中,部首同樣是最完整、最規(guī)范和最穩(wěn)定的部件體系。遺憾的是,在如此眾多的漢字編碼中,幾乎都因取碼不足,不得不大肆增減部首,改換字根字元或設(shè)置一些古怪離奇的輔助取碼方法,而將這完整的部件體系攪得支離破碎,面目全非,其結(jié)果使得漢字編碼無(wú)一例外地偏離了漢語(yǔ)語(yǔ)文教學(xué)的軌道。
本發(fā)明的目的在于提供一種簡(jiǎn)單易學(xué)、準(zhǔn)確高效、與漢語(yǔ)語(yǔ)文教學(xué)嚴(yán)格同步,既可以用于計(jì)算機(jī)漢字輸入,又可用于漢字檢索的編碼與計(jì)算機(jī)輸入方法。
“部首音標(biāo)法”選用鄧家智《漢語(yǔ)字典新編》(湖南出版社93年版)部中首系列做漢字構(gòu)件,不設(shè)任何補(bǔ)碼。它遵循“部首構(gòu)字”的基本原理漢字由部首構(gòu)成,較大的部首由較小的部首構(gòu)成。它一反漢字一次拆分慣常作法,按需要可對(duì)部首進(jìn)行多次再拆分?!笆撞恳魳?biāo)法”是根據(jù)每個(gè)部首名稱中第一個(gè)漢字的讀音為它們確定了一個(gè)漢語(yǔ)拼音字母作為各自的音標(biāo),將不同形態(tài)而具有同一音標(biāo)的部首歸附在同一鍵位,使操作者能夠迅速準(zhǔn)確地“見(jiàn)部定鍵”,順利輸入。
以下詳細(xì)敘述計(jì)算機(jī)漢字部首音標(biāo)輸入方法。
附錄1為本發(fā)明的漢字部首名稱音標(biāo)編碼表,表中給出190個(gè)部首歸屬于25個(gè)音標(biāo),并給出全名稱,簡(jiǎn)名音節(jié),拆分和編碼。
附錄2為本發(fā)明的漢字難拆件(字)容錯(cuò)拆分表。
本發(fā)明的實(shí)施方案一、部首系列選用鄧家智《漢語(yǔ)字典新編》湖南出版社93年版)中的部首系列(共190個(gè)正部、左、右雙耳合為一個(gè)),并做以下規(guī)定1、將14個(gè)與正部形態(tài)相似的漢字部件附列在相應(yīng)的正部下冫( )——棗、家 彐 ——隸乙( )——氏 ——民、樂(lè)、舜氵(三 )——應(yīng)、學(xué)、杰 刂 ——喬、面刀 ——萬(wàn) 厶(マ)——甬2、下面8個(gè)成字附列部首的讀音與對(duì)應(yīng)的正部不同,在它們單獨(dú)成字時(shí)按一般字處理(自動(dòng)失去音標(biāo))尢(y)部下的兀(wu), 鳥(niǎo)(N)部下的烏(wu),己(j)部下的巳(shl),肀(s)部下的聿(yu),子(z)部下的孑(jie),王(w)部下的玉(yu),毋(w)部下的母(mu), 日(R)部下的曰(yue)。
全部部首見(jiàn)附錄1,(注“_”作“丨”, 作“丶”, 作“一”)。
二、部首名稱與音標(biāo)給部首規(guī)定一個(gè)名稱是為了讓這個(gè)部首取得一個(gè)確定的音標(biāo),以便“按音定鍵”,具有唯一性。因此,本輸入法規(guī)定,所有部首的音標(biāo)必須取自該部首名稱的第一個(gè)音節(jié)(簡(jiǎn)名音節(jié)),并且,還必須是這個(gè)音節(jié)中聲母或韻母的第一個(gè)字母。凡選用聲母做音標(biāo)的叫聲標(biāo),選用韻母作音標(biāo)的叫韻標(biāo),其中音標(biāo)186個(gè),韻標(biāo)只有6個(gè)。為了離散重碼,選作韻標(biāo)的部首都是構(gòu)字能力極強(qiáng)部首以及具有某種相同特征的部首。它們分別是氵—三點(diǎn)水—三—san—A扌—提手旁—提—Ti—I彡—三撇兒—三—san—A巛—三拐兒—三—san—A口—口—kou—o木—木—mu—u所有部首名稱和音標(biāo)分別按以下三種情況規(guī)定1、成字部首的名稱均取《漢語(yǔ)字典新編》中該字字名,其音標(biāo)為該字音節(jié)聲母(木、口為韻母),例如殳—su—s麻—ma-M,乂—x—yi—y采—bian—B豸—zhi—z,豕—si—s2、非成字部首的名稱取《漢語(yǔ)字典新編》中所列之通用名稱,其音標(biāo)為該部首名稱首字音節(jié)的聲母(氵、扌為韻母),例如
纟—絞絲旁—絞—jiao—J夂—冬字頭—冬—dong—D肀—肅字頭—肅—su—S勹—勾字頭—勾—gou—G3、對(duì)以下部首進(jìn)行歸類(lèi)定名,其音標(biāo)為該類(lèi)部首名稱首字音節(jié)的聲母宀冖蓋部—蓋—gai—G火灬火部—火—huo—H口凵冂匚框部—框—kuang—K人亻彳人部—人—ren—R犬犬部—犬—quan—Q全部部首名稱、音標(biāo)見(jiàn)附錄1三、漢字拆分部首構(gòu)成漢字,較小的部首構(gòu)成較大的部首。為了取得足夠的編碼信息,需要對(duì)漢字和部首進(jìn)行拆分取部(西文單詞拆分后取字母,十分簡(jiǎn)易),而有些漢字和部首的構(gòu)成比較復(fù)雜,因此,在對(duì)漢字進(jìn)行拆分“一次拆分”和對(duì)部首進(jìn)行“再拆分”時(shí)必須遵循“一依三先”的基本原則。
1、依照筆順。象手寫(xiě)漢字一樣,按照先左后右,先上后下,先外后內(nèi)及先中間后兩邊的順序拆出部首。例如拉—扌、立, 按—扌、宀、女,卡—_、一、卜, 豎— 、又、立回—口、口, 有—一、丿、月,兆—兒、冫、 ,連—車(chē)、辶。
2、先緊后松。所謂松緊即構(gòu)字(部)過(guò)程中,各個(gè)部首離連交錯(cuò)的程度。部首音標(biāo)法規(guī)定,當(dāng)一個(gè)部首(主要是單筆部首)往前、往后都可能屬于另一個(gè)更大的部首時(shí),應(yīng)根據(jù)其松緊程度,按先交(交串),次連(粘連),后離(離開(kāi))的原則,將這個(gè)部首劃屬另一個(gè)較大的部首,但必須是部首,否則無(wú)條件歸屬部首,當(dāng)與前后兩個(gè)部首的松緊程度一樣,且這兩個(gè)部首又能自成另一部首時(shí),便自成部首。否則,先起先行。例如成—戈、丿、 (“一”與“戈”交,與廠連,屬“戈”), —牛、巾(“丨”與 交,與“巾”交,與“一”交均成部,按“先起先行”,“先取為大”,屬“牛”)夫—二,人(“人”與兩個(gè)“一”均相交成部,都不屬,兩個(gè)“一”成“二”,“人”屬“人”),?!猒、十(“丨”與“_”、“一”均交,前不成部,后成部,屬“十”)。
3、先起先成。根據(jù)“先緊后松”的原則,首先確定每次取部時(shí)的第一筆(始筆)屬于哪一個(gè)部首,我們就認(rèn)為這個(gè)部首先被構(gòu)成,于是就先把這個(gè)部首取出來(lái)。這樣依次取下去,直到取足。例如國(guó)—囗、玉、(起筆“丨”屬“囗”,先取“囗”),眉—尸、丨、目(起筆 屬“尸”,先“尸”)。
4、先取為大。結(jié)構(gòu)不清楚的漢字和部首,往往存在多種拆法,為了得到一種統(tǒng)一的拆法,每一次取用的部首都必須是最大的,即取到不管再增加幾個(gè)部首,都不能構(gòu)成部首時(shí)為止。例如且— 、一( 中再增加“一”,便還源成“且”),
食—人、艮(“人”和“艮”再增加“丶”都不成部),忽—勹、丿、丿、心(各增一至幾筆,均不成部),呼—口、丿、丷、十(各增幾筆,均不成部)。
(部首拆分時(shí),只取首末兩部,先將首部取到最大,后將末部取到最大)四、漢字取碼弄清了漢字和部首的拆分,取碼便是水到渠成的事,只要根據(jù)已取出部首的音標(biāo)順次編碼即可。我們先約定,將漢字作第一次拆分所取出來(lái)的部首(碼)叫本部(本碼),將部首作“再拆分”所取出來(lái)的部首(碼)叫分部(分碼)。現(xiàn)根據(jù)漢字中所含本部的個(gè)數(shù)分別說(shuō)明1、部首編碼,所有部首均取三碼,其方法是先取這個(gè)部首的本碼;再將這個(gè)部首作“再拆分”,依次取出首末兩分碼,即本碼+首分碼+末分碼,例如音—音、立、日—YLR,耳—耳、一、三—EHA,口—口、冂、一—KKH,瓜—瓜、丿、丶—GPD。
全部部首編碼見(jiàn)附錄12、二部漢字。先取二個(gè)本碼,然后將后一個(gè)部首“再拆分”,依次取出首末兩個(gè)分碼,即1本碼+2本碼+首分碼+末分碼。例如拉—扌、立、亠、一、—ILWH(拆分“立”部),刮—舌、刂、丨、_、—SLSS(拆分“刂”部),
竺—_、二、一、一、—ZEHH(拆分“二”部),觚—角、瓜、丿、丶、—JGPO(拆分“瓜”部)。
3、三部漢字。先取三個(gè)本碼,然后將最后一個(gè)部首“再拆分”,取出首分碼,即1本碼+2本碼+3本碼+首分碼。例如貌—豸、臼、兒、丿—ZBEP(拆分“兒”部),踝-足、日、木、十—ZRUS(拆分“木”部)罷—罒、土、厶、厶—STSW(拆分“厶”部),載—十、戈、車(chē)、一—SGCH(拆分“車(chē)”部)。
4、四部漢字。依次取完四個(gè)本部,不對(duì)部首作“再拆分”。例如戥—日、牛、一、戈—RRTG踖—_、艸、一、日—ZCHR慘 忄、厶、大、彡 XSDA匐—勹、一、口、田—GHOT5、五部及五部以上漢字。依次取1本碼+2本碼+3本碼+末本碼。例如兼—丷、一、_、八—BHLB禽—人、文、凵、厶—RWKS輾—車(chē)、尸、卄、丶—CSCD察—宀、夕、丶、示—GXDS(注意最后一個(gè)部首一定要取得最大)6、詞語(yǔ)編碼兩字詞語(yǔ)均取每字前兩碼,例如漢字—氵、又、宀、子—AYGZ部首—立、口、丷、一—LOBH
科學(xué)—禾、 、冖—HLAG排列—扌、 、歹、刂—ILDL三字詞語(yǔ)分別取每字第一碼。例如計(jì)算機(jī)—讠、_、木—YZU,活生生—氵、牛、?!狝RR,消防隊(duì)一氵、阝、阝—AEE,北京市—丬、亠、亠—JWW。
四字詞語(yǔ)(含成語(yǔ)、熟語(yǔ))分別取每字第一碼,例如兵不血刃—斤、一、血、刀—JHXD現(xiàn)代漢語(yǔ)—王、亻、氵、讠—WRWA分崩離析一八、山、文、木—RSWU信息資源一亻、自、冫、氵—RZLA五字及五字以上詞、短語(yǔ)分別取一、二、三、末字的第一碼。例如打腫臉沖胖子—扌、月、月、子—IYYZ開(kāi)門(mén)七件事—一、門(mén)、一、一—HMHH吃力不討好—口、力、一、女—OLHN曾經(jīng)淪海難為水,除卻巫山不是云— 、纟、氵、二—BJAE7、常用符號(hào)編碼。部首音標(biāo)碼可以對(duì)任何有形有名符號(hào)進(jìn)行編碼。其方法是先給符號(hào)定名(形態(tài)相似的符號(hào)采用歸類(lèi)定名,重碼輸入)然后將名稱前兩字的第一碼取出編成二級(jí)簡(jiǎn)碼。例如∽—相似號(hào)—相似—木、亻—UR∫—積分號(hào)—積分—禾、八—HB口( 、■)正方塊—正方—一、二—HW
○(●、◎)圓形號(hào)—圓形—口、一—KH五、漢字輸入部首音標(biāo)輸入法是一種以輸入詞語(yǔ)為主的方法,共設(shè)置一至四級(jí)及準(zhǔn)四級(jí)編碼,其輸入內(nèi)容分別如下一級(jí)簡(jiǎn)碼。25個(gè)聲母或韻母與鍵名相同的高頻字用一級(jí)簡(jiǎn)碼輸入,同時(shí)也可以象其他漢字一樣用準(zhǔn)四級(jí)碼輸入A B C D E F G H I J K L M大 本 產(chǎn) 的 這 分 個(gè) 和 地 級(jí) 可 了 們N O P Q R S T U W X Y Z年 我 批 前 人 是 他 不 為 學(xué) 一 在二級(jí)簡(jiǎn)碼。重碼字中的最常用詞,方位、數(shù)、量、代詞及虛詞中的單音詞、常用符號(hào)作二級(jí)簡(jiǎn)碼輸入,除常用符號(hào)外,取漢字的前兩碼。例如往 彳、丶 RD趁 土、 TZ于—一、十—HS用— 、丨-RY三級(jí)簡(jiǎn)碼輸入部首和三字詞語(yǔ)。
四級(jí)簡(jiǎn)碼輸入二、四字及四字以上詞語(yǔ)、短語(yǔ)。
一、二、三級(jí)簡(jiǎn)碼均需按空格鍵才能提前結(jié)束,四級(jí)全碼自動(dòng)結(jié)束。
準(zhǔn)四級(jí)全碼除部首外所有漢字用準(zhǔn)四碼輸入。輸入準(zhǔn)四碼前需按一次“V”鍵,此時(shí)計(jì)算機(jī)進(jìn)入準(zhǔn)四碼狀態(tài),輸入結(jié)束后,自動(dòng)返回到“四碼”準(zhǔn)態(tài)。(由于以輸入詞語(yǔ)為主,“準(zhǔn)四碼”極少用到)。
自定義碼用戶可以根據(jù)需要自已建立起自定義詞庫(kù),其編碼同前或仿照其他碼自編。
容錯(cuò)碼對(duì)于結(jié)構(gòu)模糊、拆法很難統(tǒng)一的極少數(shù)漢字采取容錯(cuò)碼輸入(如“夫”、“來(lái)”、“末”、“末”)。
六、部首音標(biāo)碼檢字法,將全部需檢漢字的編碼排序、排版、分頁(yè)、按西文檢索方法檢索。編排結(jié)果與《漢語(yǔ)字典新編》中漢字排列差不多,不同的是所有居前部首相同的漢字排到了一起。例如部首檢字時(shí),“朱,乖,秉”排在“丿”部,編碼檢字時(shí),則分屬“?!?朱),“丿”乖,“禾”(秉)部,但并不影響字典的各種功能。
本發(fā)明與已有技術(shù)相比具有下列優(yōu)點(diǎn)1、與漢語(yǔ)語(yǔ)文教學(xué)嚴(yán)格同步,簡(jiǎn)單易學(xué),準(zhǔn)確高效。它整體地使用了現(xiàn)代字典詞典中通用的部首系列做漢字構(gòu)件并歸類(lèi)為25個(gè)音標(biāo),不設(shè)任何補(bǔ)碼方法,只要學(xué)會(huì)了查字典,就能準(zhǔn)確地識(shí)別這些部首和25個(gè)音標(biāo),無(wú)需重新學(xué)習(xí)專門(mén)記憶。
2、采用以輸入詞語(yǔ)為主方式,改漢字三級(jí)簡(jiǎn)碼為三字詞語(yǔ)三級(jí)簡(jiǎn)碼輸入(部首仍作三級(jí)簡(jiǎn)碼輸入),二字、四字或以上詞語(yǔ)、成語(yǔ)和短語(yǔ)均可作四級(jí)全碼輸入,重碼中常用字、構(gòu)詞能力較差的單音虛詞及常用符號(hào)作二級(jí)簡(jiǎn)碼輸入,而其余漢字改為“準(zhǔn)四碼”輸入,這比“詞中選字”更方便和更符合習(xí)慣,并提高了輸入效率。整個(gè)系統(tǒng)可容納《現(xiàn)代漢語(yǔ)詞典》中的全部字詞,滿足一般輸入需要。
3、部首多次“再拆分”減少了重碼,重碼率5%。解決了取碼不足問(wèn)題,同時(shí)極大地利用和擴(kuò)充了漢字編碼資源。
4、建立了“部首音標(biāo)碼檢字系統(tǒng)”,擴(kuò)展了編碼的功能。
附錄1漢字部首名稱、音標(biāo)、編碼表
附圖
2漢字難拆件(字)容錯(cuò)拆分表
權(quán)利要求
1.一種計(jì)算機(jī)漢字部首音標(biāo)輸入方法,包括部首系列選用規(guī)定,部首名稱與音標(biāo)規(guī)定,漢字拆分原則,漢字取碼規(guī)則,漢字輸入方法,其特征在于①部首系列選用鄧家智《漢語(yǔ)字典新編》(湖南出版社93年版)中的部首系列,190個(gè)正部(左、右雙耳合為一個(gè)),并作以下規(guī)定a)將14個(gè)與正部形態(tài)相似的漢字部件附列在相應(yīng)的正部下如冫 ——棗、家彐——隸乙 ——氏、民匚——尸、樂(lè)、舜氵(三 )——應(yīng)、學(xué)、杰 ——喬、面刀 ——萬(wàn) 厶(マ)——令b)下面8個(gè)成字附列部首的讀音與對(duì)應(yīng)的正部不同,在它們單獨(dú)成字時(shí)按一般字處理并自動(dòng)失去音標(biāo)如尢(y)部下的兀(wu), 鳥(niǎo)(N)部下的烏(wu),己(j)部下的巳(shl),肀(s)部下的聿(yu),子(z)部下的孑(jie),王(w)部下的玉(yu),毋(w)部下的母(mu), 日(R)部下的曰(yue)。②、部首名稱與音標(biāo)的規(guī)定給各個(gè)漢字部首定一個(gè)名稱和一個(gè)音標(biāo),該音標(biāo)取自該部首名稱的第一個(gè)音節(jié)(簡(jiǎn)名音節(jié))中聲母或韻母的第一個(gè)字母成字部首名稱取其字名。其音標(biāo)為該字音節(jié)聲母(木、口為韻母u,o);非成字部首名稱字典中所列之通用名稱,其音標(biāo)為首字音節(jié)的聲母(三、彡、巛、扌為韻母A、I);其余歸類(lèi)定名部首,其音標(biāo)為該類(lèi)部首名稱首字音節(jié)的聲母;③漢字拆分基本原則對(duì)漢字“一次拆分”,部首“再拆分”時(shí)依照“一依三先”即a)依照筆順先左后右,先上后下,先外后內(nèi),先中間后兩邊;b)先緊后松先交(交串),次連(粘連),后離(離開(kāi));c)先起先成確定每次取部的第一筆后,按先緊后松原則,依次拆取,直至取足;d)先取為大每次取部都取到最大,即取到再增加部首也不能構(gòu)成部首時(shí)為止,部首拆分時(shí),只將首末兩部取到最大;④漢字取碼部首編碼,取三碼方式是本碼+首分碼+末分碼;二部漢字取碼,方式是1本碼+2本碼+首分碼+末分碼;三部漢字取碼,方式是1本碼+2本碼+3本碼+首分碼;四部漢字取碼,依次取完四個(gè)本部,不對(duì)部首作“再拆分”;五部及以上漢字取碼,方式是依次取1本碼+2本碼+3本碼+末本碼;詞語(yǔ)編碼兩字詞語(yǔ),均取每字前兩碼,三字詞語(yǔ)分別取每字第一碼,四字詞語(yǔ),分別取每字第一碼,五字及以上詞語(yǔ)分別取一、二、三、末字的第一碼;常用符號(hào)編碼定名符號(hào)前兩字的第一碼編成二級(jí)簡(jiǎn)碼;⑤漢字輸入以輸入詞語(yǔ)為主的方法,共設(shè)置一至四級(jí)及準(zhǔn)四級(jí)編碼除V外的25個(gè)聲、韻母與鍵名相同的高頻字適用一級(jí)簡(jiǎn)碼或準(zhǔn)四級(jí)簡(jiǎn)碼輸入,二級(jí)簡(jiǎn)碼適用重碼字中的常用字,方位數(shù)量代詞及虛詞中的單音字、常用符號(hào);三級(jí)簡(jiǎn)碼輸入部首和三字詞語(yǔ);四級(jí)全碼適用輸入二、四字及四字詞語(yǔ);準(zhǔn)四級(jí)全碼適用于除部首外所有漢字輸入,輸入前按一次“V”鍵,進(jìn)入準(zhǔn)四碼狀態(tài),輸入結(jié)束后,自動(dòng)返回到“四碼”準(zhǔn)態(tài)。
2.如權(quán)利要求1所述的計(jì)算機(jī)漢字部首音標(biāo)輸入方法,其特征在于對(duì)結(jié)構(gòu)模糊、拆分法很難統(tǒng)一的極少數(shù)漢字采取容錯(cuò)碼輸入。
3.如權(quán)利要求1所述的計(jì)算機(jī)漢字部首音標(biāo)輸入方法,其特征在于設(shè)有為用戶建立自己的自定義詞庫(kù)用的自定義碼。
4.如權(quán)利要求1所述的計(jì)算機(jī)漢字部首音標(biāo)輸入方法,其特征在于采取三字詞語(yǔ)三級(jí)簡(jiǎn)碼輸入,提高了輸入效率。
5.如權(quán)利要求1所述的計(jì)算機(jī)漢字部首音標(biāo)輸入方法,其特征在于利用“部首音標(biāo)碼”建立了“部首音標(biāo)碼檢字系統(tǒng)。
全文摘要
計(jì)算機(jī)漢字部首音標(biāo)輸入方法,它利用傳統(tǒng)漢字部首的構(gòu)字功能用音標(biāo)的定鍵作用,將190個(gè)漢字部首轉(zhuǎn)化為25個(gè)西文字母或漢語(yǔ)拼音字母來(lái)進(jìn)行漢字的計(jì)算機(jī)輸入,簡(jiǎn)單易學(xué),準(zhǔn)確快速,且與漢語(yǔ)語(yǔ)文教學(xué)完全同步,適合于任何年齡的使用者,特別適合于各級(jí)各類(lèi)學(xué)校的計(jì)算機(jī)教學(xué)。
文檔編號(hào)G06F3/023GK1139776SQ9611801
公開(kāi)日1997年1月8日 申請(qǐng)日期1996年1月12日 優(yōu)先權(quán)日1996年1月12日
發(fā)明者伍道金 申請(qǐng)人:伍道金