專利名稱:漢字結(jié)構(gòu)化編碼法的制作方法
漢字結(jié)構(gòu)化編碼法(簡(jiǎn)稱結(jié)構(gòu)碼)屬于計(jì)算機(jī)應(yīng)用方面的漢字輸入領(lǐng)域。
對(duì)此項(xiàng)發(fā)明起到一定參考作用的有《微機(jī)操作實(shí)用教程》一書中所介紹的拼音輸入法和五筆字型輸入法。另外,92年2月11日中國(guó)計(jì)算機(jī)報(bào)中,北京語(yǔ)言學(xué)院語(yǔ)言信息處理研究所所長(zhǎng)張普教授所寫的“走出漢字鍵盤輸入的三個(gè)誤區(qū)”一文對(duì)我發(fā)明漢字結(jié)構(gòu)化編碼法的啟發(fā)較大。
發(fā)明漢字結(jié)構(gòu)化編碼法的目的在于,為廣大計(jì)算機(jī)用戶提供一種真正具有規(guī)范性強(qiáng)、易學(xué)性好、性能極完備、輸入速度又快的漢字輸入手段,為計(jì)算機(jī)的迅速普及和發(fā)展提供一個(gè)良好的環(huán)境。(一)結(jié)構(gòu)碼的鍵位
圖1、結(jié)構(gòu)碼中音碼部分的鍵盤對(duì)照表如下 說(shuō)明(1)表中的#1、#2、#3、#4分別表示1、2、3、4聲。
(2)輕聲按1聲處理。
(3)不用拼的后面補(bǔ)“V”。如en應(yīng)打fv;ou應(yīng)打rv。
(4)er改打“ZZ”。
(5)在結(jié)構(gòu)碼中,很多壓縮碼延用了大家很熟悉的CCDOS拼音壓縮碼,但個(gè)別有所改動(dòng)(“sh”改在“E”上,“ch”改在“C”上),這主要是為了留出V、U、I、O四個(gè)位置,使代表2、3、4聲的三個(gè)鍵U、I、O相聯(lián),便于記憶和使用。韻母除CCDOS已定義的拼音壓縮碼外,其它雙字母的韻母也全部定義在不同的鍵位上,從而使所有的聲母、韻母均用一個(gè)壓縮碼來(lái)代替,有效地降低了碼長(zhǎng)。
(6)在合并聲母或韻母時(shí),只有“c”與“ch”合并造成重碼較多些,其余所造成的重碼均極少,可忽略,由于“c”與“ch”合并可使聲母騰出一個(gè)非常寶貴的位置來(lái)存放聲調(diào),為以后的分區(qū)編碼奠定了基礎(chǔ)。
2、結(jié)構(gòu)碼中型碼部分的鍵盤對(duì)照表如下 說(shuō)明(1)有偏旁的先按偏旁取碼,無(wú)偏旁的按筆畫取碼。
(這里提到的偏旁是指結(jié)構(gòu)碼中所列到的偏旁,沒(méi)列到的偏旁將不認(rèn)為是偏旁。)(2)[木、山、月、馬、土、火、足、女]如在字的底部或右側(cè)出現(xiàn),將不認(rèn)為是偏旁。(供參考)(3)[鳥、魚、蟲]無(wú)論在字的什么部位,將都認(rèn)為是偏旁。如鶉、鷲、虺。(供參考)(4)如一個(gè)字有兩個(gè)偏旁,則按筆順先寫的放在第一位,后寫的放在第二位。
(5)偏旁所對(duì)應(yīng)的字母與偏旁之間都有著某種便于記憶和使用的關(guān)系如V、U、I、O代表1、2、3、4聲的同時(shí)還對(duì)應(yīng)著“金、木、水、火、土”偏旁;口字旁對(duì)應(yīng)著“G”可記為“口技”;耳刀旁的型狀與“F”的型較相似等。筆畫則是利用鍵位來(lái)方便記憶和使用的,如“D”、“S”、“A”三鍵相連,第一筆均為點(diǎn);“E”、“W”“Q”三鍵相連,第一筆均為撇等。
(6)[豎]是指以豎起筆的筆畫(豎、豎勾、豎折勾、豎彎勾),[橫]是指以橫起筆的筆畫(橫、橫勾、橫折、橫折勾)。
(二)編碼規(guī)則(1)主字區(qū)每個(gè)漢字均由四碼組成,第一碼為字的聲母;第二碼為字的韻母;第三碼為字的聲調(diào);第四碼為字的偏旁或頭兩筆所對(duì)應(yīng)的型碼。(如字中無(wú)聲母,則第一碼為字的韻母;第二碼補(bǔ)“V”;三、四碼同上。)(2)型碼輔助字區(qū)第一碼為字母“V”;然后盡量將字分為三部分,每部分對(duì)應(yīng)一個(gè)型碼,按筆順?lè)謩e作為二、三、四碼。(詳見(jiàn)型碼輔助字區(qū)拆字規(guī)則)(3)二字詞區(qū)第一個(gè)字的聲母、韻母分別作為一、二碼;第二個(gè)字的聲母、韻母分別作為三、四碼。
(4)三字詞區(qū)三個(gè)字的聲母分別作為一、二、三碼;第四碼為“V”。
(5)四字及四字以上詞區(qū)前兩個(gè)字和最后一個(gè)字的聲母分別作為一、二、三碼;第四碼為“Z”。
(6)專用詞區(qū)1第一碼為字母“I”;二字詞時(shí)取第一個(gè)字的聲母、韻母分別作為二、三碼;第二個(gè)字的聲母作為第四碼。三字詞時(shí)取三個(gè)字的聲母分別作為二、三、四碼。四字及四字以上詞時(shí)取前兩個(gè)字和最后一個(gè)字的聲母分別作為二、三、四碼。
(7)專用詞區(qū)2第一碼為字母“O”;后三碼與專用詞區(qū)1取碼規(guī)則相同。
(8)自造詞區(qū)第一碼為字母“U”;后三碼自行規(guī)定。
#(9)符號(hào)區(qū)第一、二碼為拼音或拼音縮寫,三、四碼為“ZZ”用于與其它編碼區(qū)區(qū)分。如“,”可用“DRZZ”;“《》”可用“EAZZ” 作為編碼。(供參考)#(10)簡(jiǎn)碼(共參考)一級(jí)簡(jiǎn)碼的取碼原則為字的“聲母”加“空格健”??啥x在文章中極易以單字方式出現(xiàn)的字。
二級(jí)簡(jiǎn)碼的取碼原則為字的“聲母”“韻母”加“空格鍵”。可將人的“姓”定義在這一區(qū)域。
#可以用區(qū)別符(V、U、I、O)加“字的聲母”加“空格鍵”來(lái)作為該字的簡(jiǎn)碼??蓪⒃谖恼轮袠O易以單字方式出現(xiàn)的字規(guī)類,每類或幾類用區(qū)別符(V、U、I、O)加以區(qū)分。
(三)結(jié)構(gòu)化分區(qū)編碼原理與空間的分配由于主字區(qū)、二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)的第一碼均是聲母(不包含“V”、“U”、“I”、“O”四個(gè)字母),而型碼輔助字區(qū)、專用詞區(qū)1、專用詞區(qū)2、自造詞區(qū)的第一碼分別為“V”、“U”、“I”、“O”,所以主字區(qū)、二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)與型碼輔助字區(qū)、專用詞區(qū)1、專用詞區(qū)2、自造詞區(qū)之間是嚴(yán)格區(qū)分的,且型碼輔助字區(qū)、專用詞區(qū)1、專用詞區(qū)2、自造詞區(qū)之間也是嚴(yán)格區(qū)分的,不會(huì)造成任何重碼。又因?yàn)橹髯謪^(qū)的第三碼為聲調(diào)“V”、“U”、“I”、“O”四個(gè)字母,而二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)的第三碼為聲母(不包含“V”、“U”、“I”、“O”四個(gè)字母),所以主字區(qū)與二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)之間又是嚴(yán)格區(qū)分的,不會(huì)造成任何重碼。另外二字詞的第四碼為韻母(不包括“V”、“Z”),而三字詞第四碼為“V”,四字及四字以上詞第四碼為“Z”,所以,二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)之間又是嚴(yán)格區(qū)分的,不會(huì)造成重碼。
綜上所述,結(jié)構(gòu)碼將整個(gè)編碼空間合理的分為主字區(qū)、型碼輔助字區(qū)、二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)、專用詞區(qū)1、專用詞區(qū)2、自造詞區(qū)、符號(hào)區(qū)等若干個(gè)相對(duì)獨(dú)立的編碼小區(qū),各編碼小區(qū)之間互不干擾,不會(huì)造成重碼。各編碼小區(qū)之間又是統(tǒng)一的,不須任何功能開關(guān)就能實(shí)現(xiàn)各區(qū)之間的字、詞混合輸入。
結(jié)構(gòu)碼的空間分配表如下
由于結(jié)構(gòu)碼的空間分配較為合理,使整個(gè)編碼空間都得到了有效利用,所以可帶詞匯量很大,操作者可大膽的運(yùn)用詞匯碼輸入漢字,以加快輸入速度,一般不會(huì)“上當(dāng)”。
可造多個(gè)專用詞庫(kù)如動(dòng)物名、植物名、地名、農(nóng)業(yè)用語(yǔ)、工業(yè)用語(yǔ)、醫(yī)藥名、物理化學(xué)的專業(yè)用語(yǔ)等等,這些詞庫(kù)可用外掛的形式掛入專用詞區(qū)1、專用詞區(qū)2,結(jié)構(gòu)碼可同時(shí)協(xié)帶兩個(gè)專用詞庫(kù)進(jìn)行混合輸入,這樣做既能滿足不同用戶的要求,又不增加更多的重碼。
(四)型碼輔助字區(qū)的拆字規(guī)則型碼輔助字區(qū)的拆字規(guī)則是1、第一碼均為“V”。
2、采用特殊偏旁優(yōu)先、大優(yōu)先的原則,按層次盡量將單字分解為三部分,每部分取其對(duì)應(yīng)的型碼分別作為二、三、四碼。
3、如有的字只能分解為兩部分,則把第一部分對(duì)應(yīng)的型碼作為第二碼,把第二部分的一二筆和三四筆筆畫所對(duì)應(yīng)的型碼分別作為三、四碼。
4、如該字為獨(dú)體字不能分解,則取該字的一二筆和三四筆筆畫所對(duì)應(yīng)的型碼分別作為二、三碼,第四碼補(bǔ)“V”。說(shuō)明(1)、特殊偏旁優(yōu)先是指如果該字有結(jié)構(gòu)碼中所列到的特殊偏旁,則把特殊偏旁提出作為第一部分,然后再去分解剩余部分。
(2)、大優(yōu)先是指在拆字時(shí),應(yīng)先將其拆為較大的部分,如已拆成了三個(gè)部分,將不再往下細(xì)分。如“堡”已拆成了“亻”“呆”“土”三部分,則不再將“呆”再細(xì)分為“口”“木”。
(3)、按層次分解是指首先將字按大優(yōu)先的原則分解為上下或左右兩部分,然后看“上”或“左”能否再分,如不能再看“下”或“右”能否再分,如還不能分再把“下”或“右”分解為一二筆和三四筆筆畫。
(4)、在取筆畫時(shí),如只有第一筆無(wú)第二筆或只有第三筆無(wú)第四筆,則認(rèn)為第二筆與第一筆相同,第四筆與第三筆相同;如只有一二筆,沒(méi)有三四筆,則用“V”補(bǔ)位。如“一”字取碼應(yīng)為“VJVV”;“丁”字取碼應(yīng)為“VLVV”;“上”字取碼應(yīng)為“VHJV”。
(6)、“能分”是指能夠很明顯的看出是由兩部分組成的。如“但”字可分為“亻”和“旦”左右兩部分,而左部“旦”又可分“日”和“一”(7)、特殊偏旁和獨(dú)體字認(rèn)為是不能再分的。
(8)、極個(gè)別的字介于“能分”于“不能分”之間,這樣的字可采用定義多個(gè)編碼的方法,使用戶怎樣取碼都對(duì)。
(五)簡(jiǎn)碼(供參考)在文章中常以單字或單音節(jié)詞出現(xiàn)的大至有以下種類(供參考)(1)數(shù)詞如一、二、三、九、十、百、千、萬(wàn)、億、兆等。
(2)量詞如只、輛、臺(tái)、個(gè)、頭等。
(3)常用的單音節(jié)形容詞如好、壞、胖、瘦等。(較多,如設(shè)不下可略去)(4)常用的單音節(jié)動(dòng)詞如打、跳、跑、走等。(較多,如設(shè)不下可略去)(5)計(jì)量單位如斤、兩、噸、克、畝、米等。
(6)時(shí)間如天、年、月、日、秒、春、旬、晝、夜、周等。
(7)性別有男、女。
(8)代詞如你、我、他、它、她、誰(shuí)、這、那等。
(9)方位如上、中、下、前、后、左、右等。
(10)顏色紅、黃、蘭、白、黑等。
(11)國(guó)家行政機(jī)關(guān)及地名常用字有國(guó)、省、市、縣、區(qū)、鎮(zhèn)、鄉(xiāng)、村、屯、隊(duì)、族、盟、旗、城、海、江、河、湖、洋、山、橋、路、街、委、棟、門、號(hào)、軍、師、團(tuán)、連、排、班、院、廳、部、局、處、科、司、所、廠、站、臺(tái)等。
(12)目錄中常用的字有第、篇、章、條、項(xiàng)、款、頁(yè)、節(jié)、回等。
(13)副詞如很、太、最、不、都等。
(14)介詞從、往、把、在、朝、向、為等。
(15)連詞和、而等。
(16)助詞的、地、得、著、了、過(guò)等。
(17)人的姓如張、王、李、趙等。
上述這些種類的字要么不設(shè),要設(shè)就設(shè)全,以免用戶“上當(dāng)”。
把有簡(jiǎn)碼的單字規(guī)類,可使操作者很容易記住哪些單字有簡(jiǎn)碼,哪些單字無(wú)簡(jiǎn)碼。避免了象有些編碼方案那樣雖對(duì)大量單字規(guī)定了簡(jiǎn)碼,但由于有簡(jiǎn)碼的字較雜亂,操作者很難記住哪些單字有簡(jiǎn)碼,哪些單字無(wú)簡(jiǎn)碼,在輸入時(shí)往往“上當(dāng)”,倒影響了輸入速度。
(六)漢字結(jié)構(gòu)化編碼法的特性及其優(yōu)點(diǎn)漢字結(jié)構(gòu)化編碼法也是一種音、型結(jié)合編碼法,但與其它音、型結(jié)合碼不同的是它采用了結(jié)構(gòu)化設(shè)計(jì)思想,針對(duì)影響規(guī)范性、易學(xué)性、完備性、輸入速度的眾多因素進(jìn)行剖析,經(jīng)過(guò)大量的統(tǒng)計(jì)、測(cè)試,反復(fù)篩選而發(fā)明的一種具有科學(xué)結(jié)構(gòu)的漢字編碼方案。它將整個(gè)編碼空間合理的分為若干個(gè)相對(duì)獨(dú)立的編碼小區(qū),各區(qū)之間既對(duì)立又統(tǒng)一,對(duì)立的是各區(qū)之間互不干擾,無(wú)重碼,統(tǒng)一的是各區(qū)的碼長(zhǎng)均為四,不須任何功能開關(guān)就能實(shí)現(xiàn)各區(qū)之間的混合輸入。各區(qū)內(nèi)的重碼率也很低,有重碼的也為低重,均不須翻頁(yè)。
漢字結(jié)構(gòu)化編碼法提供了兩套互補(bǔ)的字輸入手段,既可輸入不知讀音的字,又可輸入不知字型的詞,是一種真正具有規(guī)范性強(qiáng)、易學(xué)性好、性能完備、輸入速度快的漢字編碼方案。祥述如下(一)規(guī)范性因?yàn)榻Y(jié)構(gòu)碼的音碼部分與我們拼讀習(xí)慣相一致,型碼部分與我們的書寫習(xí)慣相一致,規(guī)則統(tǒng)一,所以規(guī)范性較強(qiáng)。
(二)易學(xué)性大家知道,拼音碼的單字重碼率很高,然而拼音碼能夠穩(wěn)穩(wěn)的站住漢字輸入的一席之地而未被陶汰,其原因就是它利用了人們極易接受的漢語(yǔ)拼音作為編碼元素,記憶量小,取碼直觀,易學(xué)性極強(qiáng)。結(jié)構(gòu)碼也是用漢語(yǔ)拼音為主要編碼元素,取碼順序和我們的拼讀習(xí)慣一致,為降低主字區(qū)中單字重碼率,在拼音的基礎(chǔ)上,加一位型碼,這位型碼是經(jīng)過(guò)大量的統(tǒng)計(jì)、測(cè)試,反復(fù)篩選而得來(lái)的,從字面上極易得到,取碼非常直觀,記憶量很小(一般在十分鐘內(nèi)便可記住)。作為主輸字手段的補(bǔ)充------型碼輔助輸字手段也是利用這位型碼,只是先將字分為三部分,每部分取一型碼,不增加更多的記憶,所以易學(xué)性很好。
(三)完備性運(yùn)用音碼(包括自然碼)輸字的人都知道,如遇到不認(rèn)識(shí)的字就毫無(wú)辦法,只有借助查字典,這大大影響了輸入速度。結(jié)構(gòu)碼提供了一種型碼輔助輸字手段,從而解決了這一難題。拼型碼也遇到了類似問(wèn)題,若在聽打或想打時(shí)遇到不知字型的詞,也毫無(wú)辦法,影響輸入速度。而在結(jié)構(gòu)碼中,詞是由拼音組成的(不包括型碼部分),所以對(duì)只知讀音不知字型的詞是很容易輸入的。結(jié)構(gòu)碼雖對(duì)只知讀音不知字型的單字也毫無(wú)辦法,但由于只知讀音不知字型的單字是一個(gè)不完整的信息,在輸入過(guò)程中一般不會(huì)出現(xiàn)。如只發(fā)一個(gè)“Ji”的音,任何人都確定不了是哪個(gè)字,任何方法都不能正常輸入。而對(duì)于一個(gè)多音節(jié)詞來(lái)說(shuō)只知讀音確是一個(gè)較完整的信息,如發(fā)“Jicha”這個(gè)音,很多人都能確定是“稽查”這兩個(gè)字。
由于結(jié)構(gòu)碼采用了結(jié)構(gòu)化設(shè)計(jì)思想,將整個(gè)編碼空間合理的分為主字區(qū)、型碼輔助字區(qū)、二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)、專用詞區(qū)(1)、專用詞區(qū)(2)、自造詞區(qū)、符號(hào)區(qū),可帶大量詞匯,使用者可大膽的用詞匯碼進(jìn)行輸入,來(lái)提高輸入速度,而不象有些編碼那樣所帶的詞匯量較小,人們?cè)谑褂脮r(shí)常?!吧袭?dāng)”。結(jié)構(gòu)碼各區(qū)內(nèi)的重碼率也很低,均不須翻頁(yè)。
綜上所述,結(jié)構(gòu)碼既可輸入不知讀音的字,又可輸入不知字型的詞,可帶詞匯量大,重碼率又很低,不須任何功能開關(guān)切換就能實(shí)現(xiàn)各區(qū)之間的混合輸入,為聽打、想打、盲打均提供了極大方便,真可為全能。所以說(shuō),結(jié)構(gòu)碼具有極強(qiáng)的完備性,為實(shí)現(xiàn)快速輸入提供了有利保證。
(四)輸入速度影響輸入速度的因素很多,對(duì)于大眾來(lái)說(shuō),主要有易學(xué)性、完備性、重碼率、單字平均擊鍵次數(shù)四大方面。各方面因素之間是相互排斥的,一種因素性能提高了,將會(huì)導(dǎo)致與之對(duì)應(yīng)因素的性能下降。真是有一得,必有一失。想讓各因素都達(dá)到最理想的編碼方案是沒(méi)有的,這就要求我們要綜合的、全面的看待各方面因素,使其達(dá)到一個(gè)相對(duì)平衡,得到一個(gè)相對(duì)好的編碼方案。
結(jié)構(gòu)碼的易學(xué)性好、完備性極強(qiáng),對(duì)提高輸入速度極為有力,這些前面已經(jīng)講到,這里不再重述。下面就結(jié)構(gòu)碼的重碼率和單字平均擊鍵次數(shù)進(jìn)一步說(shuō)明一下。
1、重碼率大家都知到,漢字的重音字較多,但重音詞卻很少,結(jié)構(gòu)碼用拼音或拼音縮寫作為詞的編碼,既符合一般的語(yǔ)音與聽想習(xí)慣,又較其它拼型碼重碼率低,極容易掌握。這一點(diǎn)與自然碼基本相同,與之不同的是結(jié)構(gòu)碼在不增加鍵源和功能鍵的前題下,可使主字區(qū)、輔助字區(qū)、二字詞區(qū)、三字詞區(qū)、四字及四字以上詞區(qū)、專用詞區(qū)(1)、專用詞區(qū)(2)、自造詞區(qū)、符號(hào)區(qū)之間無(wú)重碼,從而進(jìn)一步降低了詞的重碼率。
在主字區(qū)中,為降低其單字重碼率,在拼音的基礎(chǔ)上,加了一位型碼,從而使主字區(qū)中單字的重碼率大幅度下降,單碼率達(dá)62.3%,二字重的達(dá)24.6%,三字重的達(dá)8.2%,其余的為5%,重碼最多的也只有8個(gè),均不須翻頁(yè)。這表面上比“五筆型”的重碼率要高些,但“五筆型”中字、詞之間還有重碼,雖增加一個(gè)功能開關(guān),但也很不實(shí)用,因?yàn)樵诮^大多數(shù)情況下,需要字、詞混合輸入,在字、詞混合輸入時(shí),字的重碼率將大為增加,詞量越大,字與詞的重碼越多,而在結(jié)構(gòu)碼中,字與詞嚴(yán)格區(qū)分,字的重碼是多少就是多少,不會(huì)因詞量的增加而增加一個(gè)字的重碼。可以預(yù)測(cè),在詞量較大,字和詞混合輸入時(shí),結(jié)構(gòu)碼中的單字重碼率將會(huì)低于“五筆型”中的單字重碼率。
2、單字平均擊鍵次數(shù)單字平均擊鍵次數(shù)是指在輸入大量文字時(shí),總的擊鍵次數(shù)與所輸入的總字?jǐn)?shù)之間的比值,在結(jié)構(gòu)碼中字的碼長(zhǎng)為四,但由于運(yùn)用了很實(shí)用的簡(jiǎn)碼和大量詞匯等手段,使單字平均擊鍵次數(shù)大為降低。還有結(jié)構(gòu)碼的重碼率很低,完備性極強(qiáng),在字、詞混合輸入時(shí)不須擊翻頁(yè)鍵和切換鍵,選字鍵也很少用,使單字平均擊鍵次數(shù)進(jìn)一步降低。單字平均擊鍵次數(shù)比“五筆型”還要低些。
總之,結(jié)構(gòu)碼的易學(xué)性好、完備性極強(qiáng)、重碼率低、單字平均擊鍵次數(shù)又少,所以可達(dá)到很高的輸入速度。
(七)實(shí)現(xiàn)此發(fā)明的最好方式漢字結(jié)構(gòu)化編碼法是經(jīng)過(guò)大量的統(tǒng)計(jì)、測(cè)試,反復(fù)篩選而總結(jié)出來(lái)的一個(gè)非常完善而又龐大的編碼方案,要想讓此編碼法能在計(jì)算機(jī)上得以實(shí)現(xiàn),還需要進(jìn)行編程序、收集選取大量詞匯、為單字和詞匯定義外碼等大量工作。由于本人的精力和水平有限,完全由本人完成全部工作是有較大困難的,既使能夠完成也將需較長(zhǎng)時(shí)間。為使這一發(fā)明能盡早的為我國(guó)的現(xiàn)代化建設(shè)服務(wù),我認(rèn)為實(shí)現(xiàn)此發(fā)明的最好方式是先就漢字結(jié)構(gòu)化編碼法這一方案申請(qǐng)專利,取得專利后,可與實(shí)力、技術(shù)較強(qiáng)的計(jì)算機(jī)軟件公司合作開發(fā)或轉(zhuǎn)讓該專利。這樣做既可使?jié)h字結(jié)構(gòu)化編碼法能早日問(wèn)世,為廣大使用者服務(wù),又可使發(fā)明者的辛勤勞動(dòng)能得以回報(bào)。
權(quán)利要求
本發(fā)明的名稱為漢字結(jié)構(gòu)化編碼法(簡(jiǎn)稱結(jié)構(gòu)碼),它屬于計(jì)算機(jī)應(yīng)用方面的漢字輸入領(lǐng)域。目前,我國(guó)流行的漢字輸入編碼方案很多,從大體上看,可規(guī)納為三類,即以全拼、簡(jiǎn)拼、雙拼為代表的拼音碼;以五筆字型、表型碼、鄭碼為代表的拼型碼和以自然碼為代表的音型結(jié)合碼。它們各有所長(zhǎng),但又都存在著個(gè)自的不足。拼音碼的優(yōu)點(diǎn)是規(guī)范性和易學(xué)性好,不足是重碼率高,輸入速度慢,對(duì)不認(rèn)識(shí)的字無(wú)法輸入。拼型碼的優(yōu)點(diǎn)是重碼率較低,能見(jiàn)字識(shí)碼,熟練掌握后,能達(dá)到較高的輸入速度,不足是字根太多,難記憶;拆字不規(guī)范;拆字方法十分復(fù)雜,難以掌握;對(duì)不會(huì)寫的字也無(wú)法輸入。現(xiàn)有的音型結(jié)合碼雖對(duì)上述兩類編碼方法有所改進(jìn),但還存在的不足是部首太多,難以記憶;字、詞之間還存在重碼,會(huì)導(dǎo)致單字重碼率高或詞庫(kù)較??;完備性不夠強(qiáng)(有的對(duì)不認(rèn)識(shí)的字無(wú)法輸入、有的詞庫(kù)較小、有的單字重碼率高)。本發(fā)明的技術(shù)特征在于1、利用不同的編碼元素在編碼中的不同位置所代表的意義不同來(lái)實(shí)現(xiàn)分區(qū)編碼,將整個(gè)編碼空間合理的分為若干個(gè)相對(duì)獨(dú)立的編碼小區(qū),各區(qū)之間互不干擾,無(wú)重碼,不須任何功能開關(guān)就能實(shí)現(xiàn)各區(qū)之間字、詞的無(wú)重碼混合輸入。
2.以兩筆筆畫為單位構(gòu)成型碼,并與常用偏旁部首所構(gòu)成的型碼共同組成26個(gè)型碼,避免了以往型碼中存在的字根或部首太多難以記憶的問(wèn)題,消除了在拆字中的二義性,既好記又好用。
3.對(duì)在文字處理中常以單字的形式出現(xiàn)的字進(jìn)行規(guī)類,并把每類單字加上一個(gè)區(qū)別符進(jìn)行分區(qū)定義簡(jiǎn)碼。
全文摘要
首先介紹的是漢字結(jié)構(gòu)化編碼法所屬的技術(shù)領(lǐng)域、起到參考作用的現(xiàn)有技術(shù)以及發(fā)明漢字結(jié)構(gòu)化編碼法的目的,然后是漢字結(jié)構(gòu)化編碼法的具體內(nèi)容(包括結(jié)構(gòu)碼中音碼部分和型碼部分的鍵盤對(duì)照表、結(jié)構(gòu)碼的編碼規(guī)則、結(jié)構(gòu)化分區(qū)編碼的原理、結(jié)構(gòu)碼的空間分配表、型碼輔助字區(qū)的拆字規(guī)則和簡(jiǎn)碼幾方面)。再后介紹的是漢字結(jié)構(gòu)化編碼法的特性及其優(yōu)點(diǎn),主要從規(guī)范性、易學(xué)性、完備性、輸入速度、重碼率、單字平均擊鍵次數(shù)等幾方面進(jìn)行闡述。最后是發(fā)明人認(rèn)為實(shí)現(xiàn)這一技術(shù)的最好方式。
文檔編號(hào)G06F3/023GK1140850SQ95107568
公開日1997年1月22日 申請(qǐng)日期1995年7月15日 優(yōu)先權(quán)日1995年7月15日
發(fā)明者周志宏 申請(qǐng)人:周志宏