專利名稱:一種漢字編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼方法。
目前,公諸于世的漢字編碼有數(shù)百種,但廣大用戶樂(lè)于使用的卻寥寥無(wú)幾其原因不是死記硬背過(guò)多、編碼方法不易掌握,就是字的重碼率過(guò)高。如漢語(yǔ)拼音同音(同碼)字太多,每個(gè)字無(wú)確定編碼,尤其對(duì)普通話音不準(zhǔn)的人來(lái)說(shuō)易出差錯(cuò),效率不高;
五筆字型碼其三至四位英文碼或六至八位表示“區(qū)位”的數(shù)字碼均不夠直觀,且有180多種字根也不便記憶;
漢字全息碼需要記憶的更多,其英文、數(shù)字兩種代碼方案的部首各有230多種。
本發(fā)明的目的,是要提供一種編碼直觀、方法簡(jiǎn)單、記憶容易、使用方便的漢字編碼。
本發(fā)明是這樣實(shí)現(xiàn)的一、以單字的第一個(gè)拼音字母作為“聲碼”。
二、在“聲碼”之后的就是四個(gè)“角碼”。
“角碼”就是編碼單字四個(gè)角部筆形的代碼,其排列以單字的左上、右上(簡(jiǎn)稱上角),左下、右下(簡(jiǎn)稱下角)角為①、②、③、④為順序。
角部筆形代碼是這樣規(guī)定的
以《印刷通用漢字字形表》為標(biāo)準(zhǔn),根據(jù)漢字四個(gè)角部形狀特征,分別選出10種“基本筆形”和25種“偏旁”,“基本筆形”以1至9、0十個(gè)數(shù)字(或置換成十個(gè)漢語(yǔ)拼音字母)為代號(hào)(表一),“偏旁”以二十五個(gè)漢語(yǔ)拼音字母為代號(hào)(表二),余下的一個(gè)字母V作為缺角代號(hào)。
編碼時(shí),只要根據(jù)單字四個(gè)角部筆形相應(yīng)套取代碼,進(jìn)行編排。如踏=T6SZR
三、編碼單字的“聲碼”、“角碼”全同時(shí),在“角碼”之后增加“附碼”加以區(qū)別。
“附碼”的采取有“數(shù)畫(huà)”和“余首”二種方式。
“數(shù)畫(huà)”者,以編碼單字的筆畫(huà)數(shù)作為“附碼”。
“余首”者,系“脫形”之法?!懊撔巍敝O(shè)乃同中求異,擴(kuò)大差別,以減少帶附碼的單字?!懊撔巍闭呔褪乔耙粋€(gè)角碼一經(jīng)采定,其所在的全部筆形即視為自行脫落,后一角碼再于殘形之中按規(guī)定采碼?!坝嗍赘酱a”,就是四個(gè)角碼脫形以后,殘
字之左上角或依書(shū)寫順序殘字之起始筆形,對(duì)照(表一)或(表二)所取的代碼。
以下結(jié)合實(shí)例對(duì)編碼方法的編碼原則作詳細(xì)的說(shuō)明。
聲碼聲碼是編碼單字的聲母,本編碼采用漢語(yǔ)拼音的第一個(gè)字母,居于本編碼三大部分(聲、角、附碼)之首。
單字編碼的聲碼只有一碼,排在編碼的最前面。如祖=ZIP11萬(wàn)=1132民=M9922帶有著重號(hào)的就是“聲碼”。
角碼角碼是本編碼的主體部分,各種采編方法多集于此,故作重點(diǎn)介紹。
本部分雖然分為采碼和編碼兩類,但其實(shí),采中有編,編中有采,二者很難截然劃分,不過(guò)大體有所側(cè)重。
Ⅰ、采碼采碼中有八條基本規(guī)則和六條特別規(guī)則?;九c特別的區(qū)分,在于前者適于一般而后者針對(duì)個(gè)別而設(shè)。
為了行文簡(jiǎn)便,本部分舉例只涉及“角碼”,至于“聲碼”和“附碼”,未涉及時(shí)一概省略。
一、基本規(guī)則
〔一〕復(fù)不再取基本筆形、代號(hào)(表一)中的“復(fù)筆”筆形,如果同時(shí)占據(jù)相鄰的兩個(gè)角部時(shí),按先上后下,先左后右的順序,只許前角采碼一次,后角不再使用。如龍=54V2在=5V2T東=5VMV華=835V“龍”的①、③角,“在”的①、②角,“東”的①、②角,“華”的③、④角都屬于“復(fù)筆”占據(jù)兩個(gè)角部,只能前面的角采碼一次,后面的角用缺角代號(hào)V補(bǔ)上。
〔二〕單截兩端基本筆形、代號(hào)(表一)中的“單筆”筆形,如果同時(shí)占據(jù)兩個(gè)角部時(shí),“截取”兩端分別使用。如入=4V34不=1184亂=3262“入”的①、④角(②角缺),“不”的①、②角,“亂”的②、④角均屬于一單筆筆形占兩角,故“截取”分別取碼。
〔三〕以“V”補(bǔ)缺編碼單字之角部被它占用或缺角時(shí),就用缺角代號(hào)V來(lái)補(bǔ)其空位。如人= 8VVV才=5V3V易=RWVV飛=13V2或缺角或角被它占,均以V來(lái)補(bǔ)缺。
〔四〕局部代全編碼單字之一個(gè)或相鄰的兩個(gè)角部,如果被“復(fù)筆”或“偏旁”之筆形占據(jù),其角部雖然只有一點(diǎn)筆形,要取其“復(fù)筆”或“偏旁”之全形。如福=I1TV澤=S95V參=4DVA政=1ZVW“?!暗蘑?、③角不取“點(diǎn)”和“直”,“澤”的①、③角不取“點(diǎn)”和“挑”(即“橫碼”),“參”的③、④角不取一“撇”,“政”的③、④角不取“
”和“乂”,而要取其“偏旁”,這里除了“局部代全”,還有下節(jié)就要講到的“取大優(yōu)先”和“優(yōu)先偏旁”,三條規(guī)定互有聯(lián)系。
〔五〕取大優(yōu)先“取大”要從“形”與“碼”兩方面著眼。
“形大”、“碼大”之規(guī)定,乃是因?yàn)閮尚喂步菚r(shí)容易產(chǎn)生邊界模糊,采碼時(shí)猶疑難定,所以,本編碼首先規(guī)定采碼的優(yōu)先順序,是獨(dú)擋一面〔簡(jiǎn)稱“獨(dú)”,見(jiàn)編碼類第三章〕、偏旁、復(fù)筆和單筆基本筆形(見(jiàn)表一),且大偏優(yōu)于小偏,(表一)之?dāng)?shù)字大少者謂之大小。如拜=GU5V俱=8B8V喜=T66V“拜”的①、③角不取“撇”和“”,第②角取“王”不取“一”,“俱”的②角取“目”不取“日”、“月”,“喜”的①、②角取“土”不取“十”等等,都是體現(xiàn)采取大形。又如
北=2312幬=9555“北”的①、②角,“幬”的第①角都是兩形共角,以采取大碼為優(yōu)先。
〔六〕能拆不斷截取部分筆形謂“斷”,兩筆相遇而未交叉謂之“粘連”,“粘連”可以拆開(kāi)而不必“斷”。
編碼單字筆形之分解,首先根據(jù)書(shū)寫順序來(lái)確定,既使是取大,也必遵循此原則。如叔=2908新=73M2“叔”的第③角根據(jù)書(shū)寫順序是“小”,不能因?yàn)椤叭〈蟆倍踩ソ厝 澳尽?,“新”的第③角剛好相反,根?jù)書(shū)寫順序是“木”,不要違背“取大”和“能拆不斷”二原則而去截取“小”。
〔七〕“角”有特點(diǎn)基本筆形(表一)中的“角”,有以下幾個(gè)特點(diǎn)1、“角”不包含其夾邊的端碼,且可以借助其它筆形作一夾近而形成“角”,如了=192V承=1934肅=5932“了”、“承”的①角均需另取“角碼”,故“角”形不適用于局部代全?!懊C”的②角本來(lái)是角,但卻是由“十”(或“”)之“復(fù)筆”與“角”的一個(gè)夾邊組成。
2、編碼單字之第①角,如系“撇”與“橫”或“撇”與“方”交接,則取“撇”碼3;如系“撇”與“直”或“撇”與“直撇”交接,則取“角”碼為9。如牟=345V向=3922白=3RVV包=3992卯=9932印=9922殷=9938所=9332〔八〕左“撇”作3本節(jié)規(guī)定是針對(duì)編碼單字之第③角而設(shè)。凡是“橫”之左端起筆的“撇”且其下端又在單字之第③角部者,可取“撇”碼3。如咫=9634尉=953V成=9432對(duì)于不是“橫”之左端起筆的“撇”,其下又有它形承托者,③角要在下形取碼。如老=5592袁=T624羞=8G11考=55V2“撇”下如果沒(méi)有承托的它形,雖然不是左端起筆于“橫”,不在此列。如壽=5V55尤=54V2及=1938以上是八條基本規(guī)則。
二、特別規(guī)則〔一〕穿“方”不取對(duì)于基本筆形(表一)中的“復(fù)筆”“方”,以及偏旁(表二)中的“日”、“田”方形單字,凡是有一筆畫(huà)從其“圍”或“形”中穿出,都不可取其本碼,只能于各個(gè)角部作“角”取碼。如中=9999侶=8999史=998V上例為穿“口”的,還有穿“日”的。如艮=9924衰=7924還有穿“田”的,其編碼規(guī)定如下對(duì)于“甲”、“由”、“申”之類的單字采碼,“申”與穿“口”類的“中”字角碼相同;“甲”、“由”之類采碼,原則是“甲”上摘,“由”下采,且兩分用凈。如甲=TV2V鉀=JT2V由=2VTV油=S2TV還有單=8T5V笛=Z2TV里=TVTV果=TVMV“甲”、“由”屬于“偏旁”與“單筆”筆形之兩分,“單”則屬于“偏旁”與“復(fù)筆”筆形之兩分,而“里”、“果”則屬于“偏旁”與“偏旁”之兩分。且亦在“兩全”之列。
下列情況不能兩分或未能用凈者,不能采取“田”碼,如屆=9399聘=E9V2黌=0998申=9999“屆”的編碼見(jiàn)《二圍》,“聘”的編碼見(jiàn)《獨(dú)》和本章“四角分連”,“黌”屬于“獨(dú)”的編碼。
與=2112喬=3332還有一種情況,就是下角只有一種筆形,可按其密集區(qū)域(或謂重心之所在)取碼。如今=84VV3虧=11V2〔三〕原形半露編碼單字如果字形中含有(表一)中的“復(fù)筆”“十”或(表二)中的“偏旁”(“日”、“土”、“王”三部及“工”字除外),只要其“形”或其“鋒”外露一半,就可采取該“偏旁”或“復(fù)筆”之代碼。
下面分三種情況加以說(shuō)明。
1、露鋒“十”有四鋒,“艸”有六鋒,視其露鋒是否過(guò)半而決定取舍,如書(shū)=5452生=35TV事=5V5V爭(zhēng)=L95V沈=S952世=5C91上例是關(guān)于“十“和“艸”的,還有“連體”的。
2、連體偏旁與其它筆形相連或相交叉的謂“連體”。如央=99DV毛=UV92“大“有五鋒,上例均露過(guò)半。
3、多形“偏旁”之內(nèi)多形且不能成為入獨(dú)(見(jiàn)編碼第三章第<三>節(jié))的,如玉=UVVV釜=88UV刃=LVVV弱=KKVV梁=SLMV疆=K1V1“疆”、“弱”之第③角以取大碼為優(yōu)先,因其“偏旁”已經(jīng)用過(guò)不能再取,故為缺角。
〔四〕切分兩全編碼單字之部分筆形占據(jù)相鄰兩個(gè)角部,需要分成兩個(gè)部分時(shí),必須遵循下列原則在能兼顧的情況下,要按照偏、偏,偏、復(fù),復(fù)、復(fù),偏、單和復(fù)、單五種筆形之優(yōu)先順序進(jìn)行切分。
1、偏、偏,就是分割成兩個(gè)偏旁。如冀=3TT8糞=0TT8里=TVTV果=TVMV“冀”、“糞”屬于編碼單字之下部有“共”字頭的雙土并聯(lián),應(yīng)予兼顧;“里”、“果”則屬于方、偏兩全。還有“圭”字之類,不能違背習(xí)慣而求取大,若分成“十”、“王”就顧此失彼。如洼=STTV涯=S13T堊=111T圭=TTVV2、偏、復(fù),就是分割偏旁和復(fù)筆兩部分。如
素=5TVN未=5VMV揚(yáng)=G9WV友=5VWV“素”上之“”不能分“直”、“王”,因?yàn)榘磧?yōu)先順序“偏、單”在“偏、復(fù)”之后,“揚(yáng)”之右半不能分成“一”、“勿”,因其②角如果不分筆形應(yīng)取“角”碼;“友”不能分成“”、“又”,因其下半偏旁優(yōu)先。
3、復(fù)、復(fù),就是分割成復(fù)筆和復(fù)筆兩部分。如壽=5V55牛=355V壽=3G45是因?yàn)椤捌?、單”之順序在“?fù)、復(fù)”之后。
4、偏、單,就是分割成偏旁和單筆兩部分。如,穿“田”形之“甲”、“由”,即屬此類,如羊=8U2V,邦=3GVE5、復(fù)、單,就是分割為復(fù)筆和單筆兩部分。如七=5V92也=5992以上是指“斷”,不是拆開(kāi)粘連,如往=348U。
“穿方”、“半露”和“兩全”的偏旁均不得作“獨(dú)”使用。
〔五〕“王”、“土”現(xiàn)側(cè)本節(jié)可以說(shuō)是原形半露之特例。當(dāng)偏碼單字之某一角部露出“王”或“土”形時(shí),限制其必露側(cè)鋒或脫形之后現(xiàn)側(cè),才可取該“偏旁”代碼。如
理=UTTV煒=HT52姓=F5TV耕=T5M5〔六〕“脫形”采編“脫形”就是前一個(gè)角碼一經(jīng)采定,其所在的筆形即視為自行脫落,如堆=T78U稚=37M1“堆”的編碼方法屬于“獨(dú)”,(見(jiàn)本說(shuō)明角碼部分之第三章)暫且不去管它,然而何以“堆”、“稚”之第④角碼同形異碼,這正是“脫形”法應(yīng)用之所在。且看“堆”之角碼如何脫形,角碼①之代碼T所包含的筆形是“土”,故采定之后編碼單字“堆”脫去“土”以后就剩下“隹”了,角碼②再接著采取“亠”,角碼③再采取“亻”,②、③角碼脫形以后其殘字就只剩下“”了,第④角碼根據(jù)本說(shuō)明角碼部分第二章特別規(guī)定之第(五)節(jié)“王”、“土”必露側(cè)鋒,就可采取“王”的代碼U了?!爸伞弊忠舶凑毡痉撊ト齻€(gè)角碼,其第④角碼之“王”、“土”未露側(cè)鋒,故只能采取“一”之代碼1了。
四個(gè)“角碼”脫形以后,殘字之左上角或依書(shū)寫順序殘字之起始筆形,對(duì)照(表一)或(表二)所取的代碼就作“余首附碼”。
脫形時(shí),(表一)中的基本筆形要依照每畫(huà)書(shū)寫時(shí)的起筆至終筆,而“角”形則包括兩個(gè)夾邊,至于其它的筆形,如“獨(dú)”、“偏旁”、“圍”和(表一)中的基本筆形,都要按將角碼所在的全部筆形盡行脫去。以上是六條特別規(guī)則。
Ⅱ、編碼采碼和編碼幾乎是同時(shí)進(jìn)行,雖然采中有編,編中有采,但本篇卻著重于編碼。
關(guān)于編碼方法,除了前面所講按照順序以外,還有三獨(dú)、六圍的方法。
三、三獨(dú)組成編碼單字的“偏旁”以及“復(fù)筆”中的“方、頭、人”具有獨(dú)擋一面乃至二面之勢(shì)者,簡(jiǎn)稱為“獨(dú)”。
獨(dú)者,既不能多形,也不能連體(與其它筆形相連之意),否則只能作“偏旁”或“復(fù)筆”使用。另外,“獨(dú)”必三面缺圍。
“獨(dú)”的編碼方法可分為“四獨(dú)”、“孤獨(dú)”和“入獨(dú)”三種方式,分述如下。
<一>四獨(dú)編碼單字之上、下、左、右某一方或某相對(duì)之兩方具有“偏旁”或“復(fù)筆”中的“方、頭、人”時(shí),則稱此類單字為“四獨(dú)”之編碼單字。如憑=U8VE俱=8B8V敖=T32W衷=7624蘇=CL34逆=Z83V梟=9V2M翅=W922“獨(dú)”的編碼方法是”獨(dú)”占一個(gè)角碼,編碼單字除去“獨(dú)”所代表的筆形后之剩余部分的第②、③、④角各占一個(gè)角碼;“獨(dú)”在編碼單字之左或上方,“獨(dú)”碼居前,“獨(dú)”在編碼單字之右或下方,則“獨(dú)”碼居后。
還有一種情況,就是編碼單字相對(duì)之兩方〔也就是上與下或左與右〕同時(shí)存在獨(dú)類,則優(yōu)先偏旁,如果同屬偏旁,則按書(shū)寫順序以先入為主即選取左或上方之偏旁為“獨(dú)”。如吳=611D榮=C9MV涮=SL3V前例中的“翅”之“羽”與第二章第(二)節(jié)“四角分連”例中之“羽”取碼不同,正象“北”與“邶”之“北”相異,是因?yàn)樽中斡袆e,當(dāng)宜仔細(xì)分辨。
前面提到多形的或連體的偏旁不能作“獨(dú)”使用,如自=3BVV血=3MVV反=93WV首=81BV夾=5VDV釜=88UV里=TVTV果=TVMV耒=TVMV米=OVMV本=MV5V永=4VSV上例第一行屬于多形,第二、三行屬于連體,其中“釜”的上半屬于連體下半屬于多形,只能作偏旁使用。
還有一個(gè)問(wèn)題需提請(qǐng)注意,就是編碼單字原來(lái)的第②角與取“獨(dú)”以后其殘余部分的第②角有時(shí)是有區(qū)別的,關(guān)于“原②”和“余②”的選取角碼之不同可見(jiàn)下例,如站=7216沾=S16V禮=IV92亂=3262
補(bǔ)=I42V卦=T2T4上例三行,每組兩字可相互對(duì)照帶著重號(hào)的角碼之差異。
<二>孤獨(dú)孤獨(dú)者,編碼單字除“獨(dú)”以后之余形不足三角者,假想余形之外有形〔用虛線或虛點(diǎn)表示〕,以湊足四個(gè)角,然后再按“四獨(dú)”的編碼方法進(jìn)行編碼。如舊=2V2R旦=RIVV滅=V11H義=VV48天=V11D冗=V39E術(shù)=VV4M太=D4VV上例帶著重號(hào)的“角碼”屬于獨(dú),凡是V的角碼都是假想角。
本法之要點(diǎn),以視獨(dú)旁之余形為最近,在其外再虛補(bǔ)成四角,然后按“四獨(dú)”方法編碼。
<三>入獨(dú)入獨(dú),就是以“獨(dú)”為骨架,有其它筆形充塞其內(nèi),如巫=G88V噩=U666鳳=E98V風(fēng)=E8VV贏=C85V凡=E4VV本編碼只取“工、王、幾”和“贏”四種偏旁為入獨(dú)。
四、六圍<一>全圍“囗”形內(nèi)有筆形的編碼單字稱為“全圍”。編碼方法與“四獨(dú)”相似,即“口”形占第①角碼,“口”內(nèi)之形除去左上角,其余各角分占第②、③、④角碼。如團(tuán)=653V圓=66BV圍=6T52<二>三圍全圍缺一圍謂之三圍。編碼方法外取上二角,內(nèi)取下二角。如同=996V用=995V區(qū)=918V匹=91EV凼=22SV兇=228V閑=49MV甩=9992上例“匹”根據(jù)書(shū)寫順序應(yīng)作“三圍”而不應(yīng)該分取偏旁“幾”和“L”兩部分;“甩”的第③角碼根據(jù)編碼定義應(yīng)該取內(nèi)下角而不要誤取左“撇”。
<三>獨(dú)圍獨(dú)圍,就是帶有獨(dú)旁的單字除去“獨(dú)”旁后余下部分成“全圍”或“三圍”。編碼方法是“獨(dú)”占一角碼,全圍或三圍的第二角占一角碼,全圍或三圍之內(nèi)的筆形其下角占二個(gè)角碼。如姻=F6DV恩=6DVX洞=S96V擱=G96V但“幾”和“
”之內(nèi)必有其它筆形。
<四>二圍
“二圍”只有下列五種情形,其外碼如下戶=43 尸(或"
")=93 疒=71 廣=73 廠=13編碼方法是外取前二碼,內(nèi)取下二碼。如扈=4392屋=93TV病=7122庚=738V辰=1324≠9124眉=93BV上例“辰”優(yōu)先采“圍”,優(yōu)先順序是獨(dú)偏、圍、復(fù)、單。
<五>對(duì)稱圍對(duì)稱圍有左右對(duì)稱和上下對(duì)稱兩種。如辦=34LV辨=773V瓣=GGLV粥=KKMV器=66QV囂=66BV上例中前4個(gè)字屬于左右對(duì)稱,后2個(gè)字屬于上下對(duì)稱。
編碼方法是外取上二碼,內(nèi)取下二碼。
<六>半對(duì)稱圍半對(duì)稱圍乃對(duì)稱圍之變形,只有“行”形內(nèi)有筆形一類,編碼方法與對(duì)稱圍相同,即外上①、②碼,內(nèi)下③、④碼。如街=31TV衙=316V衡=31DV附碼附碼,乃本編碼三大部分之尾,當(dāng)編碼單字之聲碼、角碼完全相同時(shí),就要增加附碼加以區(qū)分,附碼綴于角碼之后。
本編碼之附碼,主要采取“數(shù)畫(huà)”和“脫形余首”兩種方式。
一、數(shù)畫(huà)附碼數(shù)畫(huà)附碼,就是將編碼單字的筆畫(huà)數(shù)作為附碼,是為“一級(jí)附碼”。如果一附仍然相同,則再采取“二級(jí)附碼”,二附之確定,是根據(jù)同碼單字之音序,命之為1、2、3……,使用時(shí)只要以1、2、3……試取,隔加于一附之后即可。如睹=DB5RV13賭=DB5RV12噸=D65927-1囤=D65927-2上例前二個(gè)字屬于一附,后二個(gè)字屬于二附。
二、脫形余首附碼脫形,就是前一個(gè)角碼一經(jīng)采定,其所在的全部筆形即視為自行脫落,后一角碼再于殘形之中按規(guī)定采碼。四個(gè)角碼所在筆形全脫去后,其殘字之左上角或按書(shū)寫順序其殘字之起始筆形,對(duì)照(表一)、(表二)所采取的“附碼”就叫做“脫形余首附碼”,此為“一級(jí)附碼”,如果一附相同,則“二級(jí)附碼”采用與數(shù)畫(huà)二附相同的方法,只是一、二附之間不加隔號(hào)。如舒=S8962G伺=S89621霽=J113231戛=J113232
上例第一行屬于一附,第二行屬于二附。
速碼詞匯碼或詞語(yǔ)文獻(xiàn)快速碼,本編稱之為“速碼”。
速碼需四碼,就可組成各類語(yǔ)匯。
速碼可分為二字詞語(yǔ)、三字詞語(yǔ)和四字以上詞語(yǔ)三類編碼方法,介紹如下一、二字詞語(yǔ)編碼方法取第一字聲碼、第④角碼和第二字聲碼、第④角碼合成四碼。如設(shè)計(jì)=S8J5射擊=S5JS波及=SVJ8社稷=STJW二、三字詞語(yǔ)編碼方法取各字聲碼及第三字第④角碼。如北極星=BJXT背光性=BGXT并發(fā)癥=BFZZ三、四字以上詞語(yǔ)編碼方法取第一、二、三字及未字聲碼。如風(fēng)土人情=FTRQ欲窮千里目=Y(jié)QQM更上一層樓=GSYL野火燒不盡=Y(jié)HSJ巴陵石化公司=BLSS中華人民共和國(guó)=ZHRG
權(quán)利要求
1.一種漢字編碼方法,適用于中文電腦打字,字典、辭書(shū)之檢索或明碼電報(bào),其特征是a、單字的編碼,由聲碼、角碼二部分或由聲碼、角碼和附碼三部分組成b、二字以上的詞語(yǔ)編碼,由聲碼和第④角碼或僅由聲碼組成。
2.根據(jù)權(quán)利要求1所述的編碼方法,其特征是聲碼為單字之漢語(yǔ)拼音的第一個(gè)字母,作為編碼的第一部分。
3.根據(jù)權(quán)利要求1所述的編碼方法,其特征是角碼系以《印刷通用漢字字形表》為準(zhǔn),根據(jù)漢字四個(gè)角形特征,分別以1至9、0十個(gè)數(shù)字(或?qū)?shù)字置換成漢語(yǔ)拼音字母)和26個(gè)漢語(yǔ)拼音字母代表基本筆形和偏旁,按字之左上、右上、左下、右下的順序套取的編碼,作為編碼的第二部分。
4.根據(jù)權(quán)利要求1所述的編碼方法,其特征是附碼以編碼單字的筆畫(huà)數(shù)或脫形余首兩種方式用以區(qū)分聲碼和角碼完全相同的編碼之單字,作為編碼的第三部分。
5.根據(jù)權(quán)利要求1所述的編碼方法,其特征是二字詞語(yǔ)編碼,由第一個(gè)字的聲碼、第④角碼及第二個(gè)字的聲碼、第④角碼組成。
6.根據(jù)權(quán)利要求1所述的編碼方法,其特征是三字詞語(yǔ)編碼,由第一、二、三字的聲碼及第三個(gè)字的第④角碼組成。
7.根據(jù)權(quán)利要求1所述的編碼方法,其特征是四字以上詞語(yǔ)編碼,由第一、二、三字的聲碼和最后一個(gè)字的聲碼組成。
全文摘要
一種漢字編碼方法根據(jù)漢字四個(gè)角形特征,分別以1至9、0十個(gè)數(shù)字和26個(gè)漢語(yǔ)拼音字母,代表漢字“基本筆形”和“偏旁”。按照單字之左上、右上、左下、右下順序套取的編碼是“角碼”;冠于“角碼”之前的單字拼音第一個(gè)字母是“聲碼”,“聲”、“角”碼全同的單字,以該單字之筆畫(huà)數(shù)或“脫形余首碼”綴于角碼之后是“附碼”。本漢字編碼方法既可用在電腦上存取打印資料,也可用于字典檢索。
文檔編號(hào)G06F3/023GK1073274SQ9110687
公開(kāi)日1993年6月16日 申請(qǐng)日期1991年12月12日 優(yōu)先權(quán)日1991年12月12日
發(fā)明者王紹臣 申請(qǐng)人:王紹臣