專利名稱:漢字基因碼的制作方法
技術(shù)領(lǐng)域:
漢字編碼輸入二、現(xiàn)有技術(shù)答1、手寫識(shí)別輸入指揮方式模擬人們用筆寫漢字的習(xí)慣將字寫在識(shí)別板上通過計(jì)算機(jī)識(shí)別進(jìn)行輸入。
優(yōu)點(diǎn)符合人們用筆書寫習(xí)慣。會(huì)寫漢字就會(huì)輸入。
缺點(diǎn)輸入速度慢,平均每字約定10畫而且這種輸入方式要求書寫漢字時(shí)相當(dāng)規(guī)范否則會(huì)造成識(shí)別困難。
2、語(yǔ)音輸入計(jì)算機(jī)獲得語(yǔ)音信息后語(yǔ)音信息轉(zhuǎn)換成文字說(shuō)明信息來(lái)完成漢字輸入。
優(yōu)點(diǎn)不需要對(duì)漢字進(jìn)行編碼。
缺點(diǎn)輸入環(huán)境要求高,輸入者讀音標(biāo)準(zhǔn),漢字的同音字多且難以區(qū)分,輸入錯(cuò)誤率高。目前此項(xiàng)技術(shù)還很不成熟,尚處于發(fā)展期。
3、電子掃描識(shí)別技術(shù)對(duì)文本通過電子掃描識(shí)別后讀入計(jì)算機(jī)。
優(yōu)點(diǎn)方法簡(jiǎn)單。
缺點(diǎn)必須有原稿,對(duì)文稿印刷質(zhì)量要求很高,否則計(jì)算機(jī)難以識(shí)別。
4、機(jī)器翻譯即直接由外文翻譯為中文,也屬于被動(dòng)翻譯,翻譯成功率不高。
5、鍵盤輸入用鍵盤進(jìn)行輸入。
計(jì)算機(jī)漢字輸入方法,一直是在中國(guó)普及計(jì)算機(jī)的“瓶頸”問題。國(guó)內(nèi)外許多專家進(jìn)行了大量的研究,提出了近1000多種漢字輸入方法。
按編碼方法可分為音碼、形碼、音形碼、數(shù)碼。
(1)音碼即根據(jù)漢字的讀音來(lái)編碼。山東省唐樊寬的“中文聲數(shù)碼”,北京市劉衛(wèi)民的“雙音碼”,微軟全拼。音碼的優(yōu)點(diǎn)是容易學(xué),直觀。
缺點(diǎn)是碼長(zhǎng)較長(zhǎng),重碼率高,不會(huì)讀的字無(wú)法輸入。
(2)形碼即根據(jù)漢字的字形來(lái)編碼。如河南省王永民的“五筆字型”,形碼的優(yōu)點(diǎn)是重碼率低,碼長(zhǎng)較短,不會(huì)讀的字的字也能輸入。缺點(diǎn)是要有一套拆分漢字進(jìn)行編碼的規(guī)則,要記憶字根在鍵盤上的分布位置,較難學(xué)。
(3)音形碼即同時(shí)根據(jù)漢字的讀音和字型來(lái)編碼。如四川省陳代于的“大眾碼”,周志農(nóng)的“自然碼”等。根據(jù)漢字“同音不同形,同形不同音”的規(guī)律,音形碼的重碼率大為降低。但是仍然存在較難學(xué),不會(huì)念或念不準(zhǔn)的字難輸入的問題。且需要由形到音,由音到形的頻繁轉(zhuǎn)換,加重了人腦的負(fù)擔(dān)。
(4)數(shù)碼即用數(shù)字進(jìn)行編碼如區(qū)位碼,電報(bào)碼。
優(yōu)點(diǎn)是只用10個(gè)數(shù)字編碼,容易操作,無(wú)重碼。缺點(diǎn)是極難記憶。
三、發(fā)明的目的答利用鍵盤進(jìn)行漢字輸入是目前漢字輸入計(jì)算機(jī)的主流方法,它對(duì)環(huán)境,設(shè)備和操作人員的素質(zhì)要求最低,這種方式將會(huì)隨著計(jì)算機(jī)的進(jìn)一步普及而處于漢字輸入法的統(tǒng)治地位。目前的漢字輸入法大都存在這樣或那樣的缺陷,容易學(xué)的音碼輸入速度太慢,稍微快一點(diǎn)的形碼又太難學(xué),音形結(jié)合碼介于二者之間,形音,音形轉(zhuǎn)換又令人腦在輸入過程中負(fù)擔(dān)過重。
如果解決了音形碼中形音、音形二維轉(zhuǎn)換令人腦在輸入過程中負(fù)擔(dān)過重的這一點(diǎn),那么這種輸入方法就會(huì)比現(xiàn)有的輸入方法更容易讓人接受。
具體方法是1、降低重碼率,重碼字詞按使用頻率予以優(yōu)化。
2、簡(jiǎn)化編碼規(guī)則、優(yōu)化字根映射鍵元的規(guī)律、減少字根數(shù)量、從而達(dá)到易學(xué)易記的目的。
3、解決漢字中不會(huì)念或念不準(zhǔn)的字難輸入的問題。
4、縮短碼長(zhǎng)提高擊鍵速度,提高編碼效率。
5、規(guī)范化、標(biāo)準(zhǔn)化。編碼規(guī)則嚴(yán)謹(jǐn)規(guī)范,與漢語(yǔ)語(yǔ)言文字教育全面接軌6、提高軟件智能。
四
發(fā)明內(nèi)容
1、漢字基因碼中“基因”兩字如何理解。即名稱的由來(lái)基因是生物體基本信息因子,不同的基因控制不同的功能區(qū)。漢字中聲母“音信息”、部首和部件“形信息”是漢字的基因特征代碼,1、聲母信息控制漢字的讀音。
2、部首信息區(qū)分漢字的字義。
如漢字“汽、波”含有部首“氵”表達(dá)了與水有關(guān)的信息。
漢字“吃、喝”含有部首“口”表達(dá)了與口有關(guān)的動(dòng)作信息。
3、部件與部首形成漢字的結(jié)構(gòu)。
組詞時(shí)先把這些信息元從漢字中分解、克隆并提取出來(lái),根據(jù)權(quán)限大小重新加以組合,這樣新的詞組編碼就形成了。
其中,聲母在組詞時(shí)權(quán)限最高其次是部首、部件和筆畫。
(1)二個(gè)字組詞時(shí)首先將兩個(gè)漢字解體保留權(quán)限最高的兩個(gè)信息元聲母“音信息’和部首“形信息”而權(quán)限較低的部件和筆畫信息元被權(quán)限高的信息元取代。
(2)三、四個(gè)字組詞時(shí)將每個(gè)漢字解體保留權(quán)限最高的聲母“音信息”而權(quán)限低的字根“形信息”被權(quán)限高的音信息所取代。
我把這一過程形象的比喻為“信息基因”復(fù)制和遺傳的過程。
這一過程猶如生物體基因的克隆和遺傳。
這就是漢字基因碼名稱的由來(lái)。
一、編碼思想漢字編碼首先需要解決的問題1、編碼規(guī)則要力求簡(jiǎn)單,節(jié)省腦力負(fù)擔(dān)。
(1)字根表與鍵盤對(duì)應(yīng)規(guī)則要求簡(jiǎn)單。為了優(yōu)化字根映射鍵元的規(guī)律、減少字根數(shù)量、從而達(dá)到易學(xué)易記的目的。漢字基因碼采用“無(wú)編碼的編碼技術(shù)”用于編碼的部首和部件以音托形式歸類,少部分部件以象形方式歸類。所采用的字根共200個(gè)左右,其中大部分字根是漢語(yǔ)大辭典中的部首。這種方式的優(yōu)點(diǎn)是字根與鍵盤映射的規(guī)律性強(qiáng),在所有鍵盤輸入法中漢字基因碼字根數(shù)量是最少的,部首是我們平時(shí)最常見、最熟悉的。因此見字得碼無(wú)需記憶,省去了背字根表的煩惱。
(2)漢字編碼拆分規(guī)則要力求簡(jiǎn)單,降低大腦疲憊。
漢字基因碼吸收了音碼易學(xué),形碼速度快的特點(diǎn),不用拆分字根,沒有背字根表的煩惱。編碼方法基于漢字的造字原理,將難記的形信息轉(zhuǎn)換為易記的音信息。徹底解決了音形碼中音形與形音二維轉(zhuǎn)換令輸入者大腦疲憊的煩惱。實(shí)現(xiàn)了編碼輸入理論中的多項(xiàng)重大突破。即適合于抄入人員“看打”又適合于寫作人員“想打”和“聽打”。幾分鐘內(nèi)學(xué)會(huì)便可終生難忘。輸入時(shí)字為三碼,詞為四碼。平均碼長(zhǎng)短,重碼率低,輸入速度快。
2、降低重碼率,重碼字詞按使用頻率予以優(yōu)化。漢字基因碼根據(jù)漢字“同音不同形,同形不同音”的規(guī)律,音形碼的重碼率大為降低,輸入速度快。所有的重碼字、詞按使用頻率不同經(jīng)過加權(quán)算法全都予以優(yōu)化。使用頻率最高的字、詞、句、最先上屏。
3、解決漢字中不會(huì)念或念不準(zhǔn)的字難輸入的問題。漢字中不會(huì)念或念不準(zhǔn)的字我采用的方法是以形碼輸入為主前面加上“’”。“’’的含義是省略聲母。即’+字根1+字根2+末尾字根或’+字根1+字根2+空格鍵例給’ark(纟人口)準(zhǔn)’li(冫隹)即’ge(艮卩)會(huì)’res(人二厶)4、規(guī)范化、標(biāo)準(zhǔn)化。編碼規(guī)則嚴(yán)謹(jǐn)規(guī)范,與漢語(yǔ)語(yǔ)言文字教育全面接軌。字、詞、句編碼規(guī)則科學(xué)規(guī)范,大部分字根是漢語(yǔ)大辭典中的部首。符合當(dāng)前學(xué)校漢語(yǔ)語(yǔ)言文字教育。
5、縮短碼長(zhǎng)提高擊鍵速度,提高編碼效率。輸入時(shí)字為三碼,詞和句為四碼,對(duì)常用的高頻字作一級(jí)簡(jiǎn)碼二級(jí)簡(jiǎn)碼和三級(jí)簡(jiǎn)碼處理,對(duì)高頻二字詞語(yǔ)也作了簡(jiǎn)碼處理??s短了平均碼長(zhǎng)。
6、使用標(biāo)準(zhǔn)鍵盤,使用的碼元集合要求合理。漢字基因碼只使用27個(gè)碼元符號(hào),其中26個(gè)碼元是26個(gè)英文字母,另外一個(gè)是功能鍵“’”。所使用的碼元數(shù)量科學(xué)合理。
7、輸入對(duì)象以詞語(yǔ)為主,提高輸入效率。漢語(yǔ)的表達(dá)方式主要是詞語(yǔ),以詞語(yǔ)為主的輸入比以字為主的輸入具有以下優(yōu)點(diǎn)(1)縮短碼長(zhǎng),提高輸入效率一倍多。字輸入下碼長(zhǎng)為四鍵詞為二鍵。
(2)簡(jiǎn)化編碼規(guī)則,二字詞輸入時(shí)每個(gè)字只需輸入一個(gè)形碼,而四個(gè)字的詞輸入時(shí)就成了拼音輸入法,這樣就能減輕腦力負(fù)擔(dān)降低出錯(cuò)率。
(3)根據(jù)漢字“同音不同形,同形不同音”的規(guī)律,降低了音形碼的重碼率。
(4)從信息論的角度來(lái)看,漢字的零階熵為9.71 bit/字,詞為11.46 bit/字英文字母的零階熵為4.03 bit/字,英語(yǔ)詞的零階熵為10 bit/字,很顯然使用詞語(yǔ)輸入這種方法提高了漢字鍵盤輸入效率。
(5)漢字基因碼共收集的詞匯量有40000條左右。
其中包括《常用術(shù)語(yǔ)詞典》《古代名句詞典》《俗語(yǔ)諺語(yǔ)詞典》《成語(yǔ)詞典》《漢語(yǔ)大辭典》、世界各國(guó)及其首都名稱和國(guó)際大城市名稱。因此詞匯量非常豐富。
二、編碼方案字輸入法共取三碼最后加上空格鍵結(jié)束,獨(dú)體字的部首和部件均為筆畫。字取三碼的優(yōu)勢(shì)漢字可分為詞語(yǔ)和詞素兩種,詞素是沒有意義的。比如“我”是第一人稱代詞,可以單獨(dú)使用?!皞儭笔窃~素,不可以單獨(dú)使用,必須和“我”一起使用才能合成詞組。在7000個(gè)的單字中詞語(yǔ)有1000多個(gè),詞素5000多個(gè)。漢字取三碼的編碼空間為26*26*26=17576,17576個(gè)編碼空間對(duì)應(yīng)1000多個(gè)單字詞語(yǔ),171的編碼空間理論上是足夠了。如果一條代碼對(duì)應(yīng)一組漢字重碼,通過加權(quán)處理的詞語(yǔ)權(quán)限比詞素高,詞語(yǔ)首先上屏即可。例“人、入、壤”對(duì)應(yīng)的代碼是“rty”這對(duì)重碼中“人”是詞語(yǔ),“入、壤”是詞素,加權(quán)處理后的詞語(yǔ)權(quán)限比詞素高,所以“人”排在重碼隊(duì)列的前列首先上屏。
1、(1)獨(dú)體字不可被拆分成部件的字體。
聲母碼+首筆筆畫碼+末筆畫碼例末mgy、鳥nng、我wty、農(nóng)nyy、發(fā)fny、長(zhǎng)uty、電dhn(2)準(zhǔn)獨(dú)體字一個(gè)筆畫和一個(gè)部件組成。
聲母碼+首筆筆畫碼碼+部件碼或聲母碼+部首碼+末筆筆畫碼例舊jho旦dog幣btj玉ywy犬qdy刃rdy太tdy主iyw干ggv
2、合體字編碼方案合體字由若干個(gè)部件或一個(gè)部首和若干個(gè)部件組合而成的方塊字漢字從結(jié)構(gòu)上可分為左右型、上下型、全包圍、半包圍。根據(jù)部首所取方位不同又可分為以下八種,所取的部首和部件成對(duì)稱關(guān)系。
(1)部首取左聲母碼+左部首碼+末尾部件碼例但drg、咬ykf、腦nou、駐imw、隨sez、浪lsg、除uep若末尾部件不存在則聲母碼+左部首碼+末尾連續(xù)兩筆筆畫代碼例鞭bgw、排pfg、餓evw、提t(yī)fw(2)部首取右聲母碼+右部首碼+首部件碼例部bel、歌gqk若首部件不存在則聲母碼+右部首碼+第一第二連續(xù)兩筆筆畫代碼例比bba、鵝ent(3)部首取上聲母碼+上部首碼+末尾部件碼例急jdx、真ivb、善vyk、茴hck、索sva條tfp鳧fnj若末尾部件不存在則聲母碼+上部首碼+末尾連續(xù)兩筆筆畫代碼例年nrf、喪svw、嗇svk、曷hop(4)部首取下聲母碼+下部首碼+首部件碼例望www、碧bdw、罵mmk、哭kqk、變bye若首部件不存在則聲母碼+下部首碼+第一第二連續(xù)兩筆筆畫代碼例后hke、典dbm、兵bbr、在zyd、盾dme、左zgd、右ykd、熏xst、黑hsm(5)部首取外聲母碼+外殼部首碼+末尾部件碼例威wwn、或hgg、戴dgb、栽zgp、國(guó)gky若末尾部件不存在則聲母碼+外殼部首碼+末尾連續(xù)兩筆筆畫代碼例越y(tǒng)zw、建jzf、(6)部首取里聲母碼+內(nèi)部首碼+第一第二連續(xù)兩筆筆畫代碼例囪cxr
(7)對(duì)于“田”字型的字體聲母碼+左上角部件碼+右下角部件碼例能nsb、器xkk、疑ybp、馨xvo若右下角部件不存在則聲母碼+左上角部件碼+末尾連續(xù)兩筆筆畫代碼或聲母碼+右下角部件碼+左上角部件碼或聲母碼+右下角部件碼+第一第二連續(xù)兩筆筆畫代碼(8)對(duì)于沒有部首和部件的合體字取碼規(guī)則與獨(dú)體字的取碼規(guī)則相同聲母碼+首筆筆畫碼+末筆筆畫碼例拜bth甭bgh3、要點(diǎn)說(shuō)明(1)第一第二連續(xù)兩筆筆畫代碼(見圖二)指按照漢字筆順的第一筆畫和第二筆畫合起來(lái)所對(duì)應(yīng)的鍵盤代碼。若首筆是“丿”次筆畫為“、”鍵盤代碼是“W”。
(2)末尾連續(xù)兩筆筆畫代碼指按照漢字筆順的倒數(shù)第二筆畫和最末一筆畫合起來(lái)所對(duì)應(yīng)的鍵盤代碼。(見圖二)若倒數(shù)第二筆畫是“丿”最末筆畫為“、”鍵盤代碼是“W”。
(3)對(duì)于零聲母,即只有韻母沒有聲母的漢字取韻母的第一個(gè)字母作為聲母碼。
(4)首部件該字體的第一第二兩筆筆畫也是該部件的第一第二兩筆筆畫(部首“辶廴”的半包圍字體除外)(5)末尾部件該字體的倒數(shù)第一第二兩筆筆畫也是該部件的倒數(shù)第一第二兩筆筆畫。(全包圍、半包圍字體除外)應(yīng)該指出的是a、“發(fā)、潑、拔、撥”的末尾連續(xù)兩筆畫是“捺”和“點(diǎn)”所以部件“又”不是該字的末尾部件該字的末尾筆順代碼是“o”b、“隨、腿”等字的末尾部件是“辶”而不是“月、艮”因?yàn)楦鶕?jù)筆順規(guī)則該字體的倒數(shù)第一第二兩筆筆畫對(duì)應(yīng)的部件是“辶”同理“健、鍵”的末尾部件是“廴”。
(6)有些漢字具有兩個(gè)部首信息元?jiǎng)t按照這兩個(gè)部首位置的先后,取上優(yōu)先、取左優(yōu)先、取外優(yōu)先的原則。
例鄧dye“又”在左為部首,“阝”在右為部件、同理雞jyn觀gyj敵dvf刮gvl劃hgl的部首分別是“又舌戈”部件分別是“鳥見攵刂 刂”尊zlc“丷”在上為部首,“寸”在下為部件、同理曾clo尊zlc剪jld嗇svk島dnv息xzx的部首分別是“丷十鳥自”部件分別是“日寸刀大口山心”(7)首尾部件必需按照取大優(yōu)先的原則。
例“恬、括”末尾部件取“舌”不取“口”。
“辮、辨、辯”末尾部件取“辛”不取“十”。
“較、咬”末尾部件取“父”不取“乂”。
(8)對(duì)于“捆、菌、蛔、悃”去掉部首“于、艸、蟲、忄”剩于部件都是全包圍字體則這些字體的末尾部件就取剩于部件的末尾部件。即被包圍部分的字體。分別是“木、禾、口、木”。
(9)“我、成、戈、戔”等字的末尾筆畫取點(diǎn)“、”。
二、詞組輸入法1、二字詞取碼規(guī)則分別取第一個(gè)字和第二個(gè)字的前兩碼。
聲母碼+部首碼+聲母碼+部首碼第一個(gè)字第二個(gè)字例知識(shí)ivvi、指揮ifhf、財(cái)富cbfb、信息xrxz2、三字詞取碼規(guī)則分別取這三個(gè)字的聲母碼+詞匯鍵“’”。
聲母碼+聲母碼+聲母碼+’第一個(gè)字第二個(gè)字第三個(gè)字例計(jì)算機(jī)jsj’、共和國(guó)ghg’、共產(chǎn)黨gud’、中國(guó)人igr’、工程師guv’3、四字詞及短語(yǔ)輸入法取碼規(guī)則分別取第一個(gè)字的聲母碼+第二個(gè)的字聲母碼+第三個(gè)字聲母碼+最后一字聲母碼即可。
聲母碼+聲母碼+聲母碼+聲母碼第一個(gè)字第二個(gè)字第三個(gè)字最后一個(gè)字例新華書店xhvd、郵政編碼yibm、中華人民共和國(guó)ihrg、三天打魚,兩天曬網(wǎng)stdw4、模糊輸入法查詢鍵是“?”用于代替不會(huì)輸入的代碼。例學(xué)習(xí)xsx?如果“習(xí)”字的部首不知道怎樣輸入,可用“?”代替。此時(shí)會(huì)出現(xiàn)一串詞組,再用數(shù)字鍵選擇即可。
5、高頻詞組輸入法只需輸入第一第二兩個(gè)字的聲母即可。高頻字和高頻詞組這類常用語(yǔ)是我特別為電子商務(wù)而設(shè)計(jì),輸入速度更快,省時(shí)省力便于商務(wù)交流。例我們wm完成wu今天jt同意ty先生xv小姐xj三、語(yǔ)句輸入法采用“語(yǔ)感”斷句方法輸入。
語(yǔ)音的特點(diǎn)是節(jié)奏感強(qiáng),有韻律,聲音高低起伏,語(yǔ)句錯(cuò)落有致這樣可以把一句話根據(jù)語(yǔ)音音節(jié)有節(jié)點(diǎn)的規(guī)律可以分割成幾小段語(yǔ)句,詞條或若干個(gè)詞組。這可以按個(gè)人語(yǔ)感習(xí)慣而論。
例鄧小平同志關(guān)于建設(shè)有中國(guó)特色的社會(huì)主義。可以分割成(1)鄧小平同志關(guān)于建設(shè)有中國(guó)特色的社會(huì)主義。
(2)鄧小平同志關(guān)于建設(shè)有中國(guó)特色的社會(huì)主義。第一句可拆成十個(gè)詞組,第二句拆成三個(gè)短語(yǔ)。還可以整段輸入。
四、漢字的簡(jiǎn)碼處理
一級(jí)高頻簡(jiǎn)碼字(加空格鍵結(jié)束)
二級(jí)高頻簡(jiǎn)碼字(在聲母后加詞匯鍵“’”再加上空格鍵結(jié)束)
三級(jí)高頻簡(jiǎn)碼字(在聲母后面加上字母“o”再加上空格鍵結(jié)束)五、發(fā)明效果漢字基因碼采用“無(wú)編碼的編碼技術(shù)”編碼規(guī)則極其簡(jiǎn)單,直觀。用于編碼的部首和部件以音托形式歸類,少部分部件以象形方式歸類(見圖一)。見字得碼無(wú)需記憶,又吸收了音碼易學(xué),形碼速度快的特點(diǎn),不用拆分字根,沒有背字根表的煩惱。編碼方法基于漢字的造字原理,將難記的字根形信息轉(zhuǎn)換為易記的音信息。徹底解決了音形碼中音形與形音二維轉(zhuǎn)換令輸入者大腦疲憊的煩惱,節(jié)省腦力負(fù)擔(dān)。實(shí)現(xiàn)了編碼輸入理論中的多項(xiàng)重大突破。不破壞寫作構(gòu)思和不影響思維連貫性。即適合于抄入人員“看打”和“聽打”又適合于寫作人員“想打”。幾分鐘內(nèi)學(xué)會(huì)便可終生難忘(見以下各表)。輸入時(shí)字為三碼,詞為四碼。平均碼長(zhǎng)短,重碼率低,輸入速度快。并以詞為基本輸入單元,快捷、流暢。詞庫(kù)容量大,且具有句處理功能。編碼規(guī)則嚴(yán)謹(jǐn)規(guī)范,與漢語(yǔ)語(yǔ)言文字教育全面接軌。
為此我整整花了四年的時(shí)間,參閱眾多漢字編碼理論的書籍?;趯?duì)漢字的理解,集各家編碼之所長(zhǎng),綜合計(jì)算機(jī)科學(xué),生物基因遺傳學(xué),認(rèn)知心理學(xué),人體工程學(xué),漢語(yǔ)語(yǔ)言文字信息處理學(xué)。取碼的過程與人腦感知和識(shí)別圖形漢字的思維過程同步。
表一漢字基因碼一般人員學(xué)習(xí)進(jìn)度
表二漢字基因碼專業(yè)人員學(xué)習(xí)進(jìn)度
表三漢字基因碼輸入法與其他輸入法指標(biāo)對(duì)照表
權(quán)利要求
要求保護(hù)的權(quán)利有1、編碼方案一、字輸入法共取三碼最后加上空格鍵結(jié)束,獨(dú)體字的部首和部件均為筆畫。1、(1)獨(dú)體字不可被拆分成部件的字體。聲母碼+首筆筆畫碼+末筆畫碼例末mgy、鳥nng、我wty、農(nóng)nyy、發(fā)fny、長(zhǎng)uty、電dhn(2)準(zhǔn)獨(dú)體字一個(gè)筆畫和一個(gè)部件組成。聲母碼+首筆筆畫碼碼+部件碼或聲母碼+部首碼+末筆筆畫碼例舊jho旦dog幣btj玉ywy犬qdy刃rdy太tdy主iyw干ggv2、合體字編碼方案合體字由若干個(gè)部件或一個(gè)部首和若干個(gè)部件組合而成的方塊字漢字從結(jié)構(gòu)上可分為左右型、上下型、全包圍、半包圍。根據(jù)部首所取方位不同又可分為以下八種,所取的部首和部件成對(duì)稱關(guān)系。(1)部首取左聲母碼+左部首碼+末尾部件碼例但drg、咬ykf、腦nou、駐imw、隨sez、浪lsg、除uep若末尾部件不存在則聲母碼+左部首碼+末尾連續(xù)兩筆筆畫代碼例鞭bgw、排pfg、餓evw、提t(yī)fw(2)部首取右聲母碼+右部首碼+首部件碼例部bel、歌gqk若首部件不存在則聲母碼+右部首碼+第一第二連續(xù)兩筆筆畫代碼例比bba、鵝ent(3)部首取上聲母碼+上部首碼+末尾部件碼例急jdx、真ivb、善vyk、茴hck、索sva條tfp鳧fnj若末尾部件不存在則聲母碼+上部首碼+末尾連續(xù)兩筆筆畫代碼例年nrf、喪svw、嗇svk、曷hop(4)部首取下聲母碼+下部首碼+首部件碼例望www、碧bdw、罵mmk、哭kqk、變bye若首部件不存在則聲母碼+下部首碼+第一第二連續(xù)兩筆筆畫代碼例后hke、典dbm、兵bbr、在zyd、盾dme、左zgd、右ykd、熏xst、黑hsm(5)部首取外聲母碼+外殼部首碼+末尾部件碼例威wwn、或hgg、戴dgb、栽zgp、國(guó)gky若末尾部件不存在則聲母碼+外殼部首碼+末尾連續(xù)兩筆筆畫代碼例越y(tǒng)zw、建jzf、(6)部首取里聲母碼+內(nèi)部首碼+第一第二連續(xù)兩筆筆畫代碼例囪cxr(7)對(duì)于“田”字型的字體聲母碼+左上角部件碼+右下角部件碼例能nsb、器xkk、疑ybp、馨xvo若右下角部件不存在則聲母碼+左上角部件碼+末尾連續(xù)兩筆筆畫代碼或聲母碼+右下角部件碼+左上角部件碼或聲母碼+右下角部件碼+第一第二連續(xù)兩筆筆畫代碼(8)對(duì)于沒有部首和部件的合體字取碼規(guī)則與獨(dú)體字的取碼規(guī)則相同聲母碼+首筆筆畫碼+末筆筆畫碼例拜bth甭bgh3、漢字中不會(huì)念或念不準(zhǔn)的字我采用的方法是以形碼輸入為主前面加上“’”?!啊钡暮x是省略聲母。即’+字根1+字根2+末尾字根或’+字根1+字根2+空格鍵例給’ark(纟人口)準(zhǔn)’li(冫隹)即’ge(艮卩)會(huì)’res(人二厶)四、漢字的簡(jiǎn)碼處理
一級(jí)高頻簡(jiǎn)碼字(加空格鍵結(jié)束)
二級(jí)高頻簡(jiǎn)碼字(在聲母后加詞匯鍵“.”再加上空格鍵結(jié)束)
三級(jí)高頻簡(jiǎn)碼字(在聲母后面加上字母“o”再加上空格鍵結(jié)束)
2.漢字基因碼部首表
3.連續(xù)兩筆筆順字根表
全文摘要
漢字基因碼采用“無(wú)編碼的編碼技術(shù)”吸收了音碼易學(xué),形碼速度快的特點(diǎn),見字得碼無(wú)需記憶編碼方法基于漢字的造字原理,將難記的字根形信息轉(zhuǎn)換為易記的音信息。節(jié)省腦力負(fù)擔(dān)。簡(jiǎn)化編碼規(guī)則、優(yōu)化字根映射鍵元的規(guī)律、減少字根數(shù)量、從而達(dá)到易學(xué)易記的目的。降低重碼率,重碼字詞按使用頻率予以優(yōu)化??s短碼長(zhǎng)提高擊鍵速度,提高編碼效率。實(shí)現(xiàn)了編碼輸入理論中的多項(xiàng)重大突破。
文檔編號(hào)G06F3/023GK1327185SQ0011634
公開日2001年12月19日 申請(qǐng)日期2000年6月5日 優(yōu)先權(quán)日2000年6月5日
發(fā)明者董杰 申請(qǐng)人:董杰