專利名稱:拆聲漢字編碼的制作方法
拆聲漢字編碼(簡稱拆聲碼)是一種音形漢字輸入技術(shù)及其鍵盤設(shè)計(jì)。
現(xiàn)有的漢字編碼已有上千種,而且新的編碼方案還在不斷涌現(xiàn)。雖然每個(gè)方案都有各自的特點(diǎn),但迄今為止,還沒有一種編碼方案能真正實(shí)現(xiàn)易學(xué)易用。所謂‘易學(xué)’,是指在半天(三小時(shí))之內(nèi)能基本學(xué)會(不看說明能獨(dú)立輸入漢字);所謂‘易用’,是指在字碼的最大碼長不超過3且使用的鍵位不超過30的條件下,動態(tài)重碼率低于1%。
拆聲碼是迄今為止最接近這個(gè)目標(biāo)的一種漢字輸入法,詳細(xì)說明如下。
(一)拆聲碼的基本概念及單字的第一碼所謂拆聲碼,主要是根據(jù)單字的韻母或聲調(diào),將使用頻率較高的聲母分成兩個(gè)碼元。具體規(guī)則如下第一方案當(dāng)韻母的第一個(gè)字母為a(ia=a)或u時(shí),如聲母為j、q、x、z(zh)、c(ch)、s(sh)或y,則j→u、q→e、x→o、z→,、c→v、s→a、y→i。
第二方案當(dāng)韻母的聲調(diào)為第一或第二聲時(shí),如聲母為j、q、.x、z(zh)、c(ch)、s(sh)或y,則j→u、q→e、x→o、z→,、c→v、s→a、y→i。
其他情況,聲母一律按原漢語拼音的聲母取。(在拆聲碼中,聲母zh、ch、sh分別與z、c、s合并)。
鍵盤設(shè)計(jì)如下
碼元共27個(gè)(26個(gè)拉丁字母鍵加‘,’鍵),‘;’、‘.’、‘/’為功能鍵,作用如下‘;’為詞碼轉(zhuǎn)換鍵,‘.’為斷碼鍵及第一重碼上屏,‘/’為斷碼鍵及第二重碼上屏(重碼最多三個(gè),第三重碼用‘\’鍵上屏)。
中文數(shù)碼字不按以上規(guī)則,無論其聲母是什么,一律依次擊第一排的十個(gè)鍵位一→q、二→w、三→e、四→r、五→l、六→y、七→u、八→i、九→o、十→p。
單字的第一碼一律取其聲母,并按以上規(guī)則與鍵位對應(yīng)。
(二)漢字的基本結(jié)構(gòu)為了掌握拆聲碼的第二碼和第三碼,首先要對漢字的結(jié)構(gòu)作一些說明。
(1)筆形結(jié)構(gòu)筆形結(jié)構(gòu)就是兩筆之間的各種組合方式,主要有以下四種1.離 即兩筆之間無公共點(diǎn),如‘二’。
2.接 即一筆的端點(diǎn)與另一筆的端點(diǎn)相重,如‘廠’。
3.連 即一筆的端點(diǎn)與另一筆的中點(diǎn)相重,如‘丆’。
4.交 即一筆的中點(diǎn)與另一筆的中點(diǎn)相重,如‘十’。
(2)字體字體就是由一些筆形通過以上四種方式所組成的結(jié)構(gòu)。
除去少數(shù)漢字中含有的單獨(dú)一橫、一豎、一撇、或一折(如‘旦、舊、引、氕、禮)作為一個(gè)字體外,一般說,字體至少要由兩筆構(gòu)成(單獨(dú)的點(diǎn)絕對不能作為字體)。
有些字體是由分離的兩筆、三筆或四筆組成,如‘二、
亠、丷、八、
、冫、
、氵、纟、巛、小、、灬’等。
(3)字體的分類
A.按音義分類1.可表義可讀字體,例如‘十、中、又、八、小、事’等單字。
2.可表義不可讀字體,這就是一些能表義的偏旁部首,如‘扌、氵’。
3.不表義不可讀字體,這就是一些不能表義的偏旁部首和其他一些字體,如‘
、、
、、夬’等。
B.按結(jié)構(gòu)分類1.可拆字體如一個(gè)字體可將相連的部分分成幾個(gè)字體,則稱為可拆字體。
如‘古’可分成‘十’與‘口’兩個(gè)字體,‘
’可分成‘亠、丷、
’三個(gè)字體。
2.不可拆字體如一個(gè)字體僅由筆形的接和交兩種方式構(gòu)成,或一些單筆通過離的方式構(gòu)成,則稱為不可拆字體。由于單獨(dú)的一筆不能拆出形成一個(gè)字體,因此如字體中僅有一筆相連,也認(rèn)為是不可拆字體。
如‘十、屯.山、我、事、千、王’等都是不可拆字體。注意其中‘千’與‘王’都是只有一筆相連,因此也不可拆。
以后我們將不可拆字體簡稱為字塊。因此可拆字體也可看作是由幾個(gè)字塊拼接成的字體。
(4)獨(dú)體字由一個(gè)字體構(gòu)成的單字稱為獨(dú)體字,獨(dú)體字分可拆獨(dú)體字與不可拆獨(dú)體字兩種。按以上定義,不可拆獨(dú)體字就由一個(gè)字塊構(gòu)成的單字,可拆獨(dú)體字就是由兩個(gè)或兩個(gè)以上字塊相連拼成的單字。例如‘辛’可拆成‘立’與‘十’?!?、也、事、我、垂、甲’等單字都是不可拆獨(dú)體字。
(5)不可拆獨(dú)體字的內(nèi)含字在拆聲碼中,不可拆獨(dú)體字的內(nèi)含字是掌握獨(dú)體字第二碼與雙體字第三碼的關(guān)鍵,也是這個(gè)漢字編碼的主要特征。
不可拆獨(dú)體字的內(nèi)含字可按以下順序確定1.如不可拆獨(dú)體字的第一筆僅與字體相連或相離,且去掉這一筆后仍是可讀字,則將這個(gè)可讀字定義為原獨(dú)體字的內(nèi)含字。例如‘王’的內(nèi)含字為‘土’,‘失’的內(nèi)含字為‘夫’,‘良’的內(nèi)含字為‘艮’。
2.如不可拆獨(dú)體字的最后一筆僅與字體相連或相離,且去掉這一筆后仍是可讀字,則將這個(gè)可讀字定義為原獨(dú)字的內(nèi)含字。例如‘生’的內(nèi)舍字為‘?!畤?yán)’的內(nèi)含字是‘亞’,‘產(chǎn)’的內(nèi)含字是‘立’,‘玉’的內(nèi)含字是‘王’,‘太’的內(nèi)含字是‘大’。
3.如以上兩種方式均不能構(gòu)成可讀字,或不可拆獨(dú)體的首筆與末筆均和字體相交,則內(nèi)含字定義為去掉最少筆形所形成的最大可讀字體。
例如‘大’的內(nèi)含字是‘人’,‘末’的內(nèi)含字‘木’,‘為’的內(nèi)含字是‘力’,‘吏’的內(nèi)含字是‘史’,‘也’的內(nèi)含字是‘乜’,‘甘’的內(nèi)含字是‘廿’,‘申’的內(nèi)含字為‘中’,‘我’的內(nèi)含字是‘戈’。
所謂去掉最少筆形也可能只去掉半筆。例如‘由、甲’的內(nèi)含字是‘田’‘電’的內(nèi)含字是‘由’,‘樂’的內(nèi)含字是‘禾’。
所謂形成的最大字體,并不是指留下字體的筆數(shù)最多,而是指是留下字體的框架最大。
例如‘來’的內(nèi)含字是‘未’而不是‘米’?!着c由’的內(nèi)含字都是‘田’,但‘申’的內(nèi)含字既不是‘甲’也不是‘由’,而是‘中’。由此可見,去掉的筆形應(yīng)盡量在單字的中間。
(6)可表義不可讀字塊的相關(guān)字所謂‘相關(guān)’是指字義相關(guān),這主要指一些能表義的偏旁部首可以按字義對應(yīng)于相應(yīng)的單字。如‘扌’的相關(guān)字為‘手’,‘氵’的相關(guān)字為‘水’。
僅由兩筆相交構(gòu)成的字塊,如‘、乂’的相關(guān)字一律為‘叉’(橫豎交對應(yīng)于數(shù)碼十)。
(7)不表義不可讀字的相似字所謂‘相似’是指形狀相似,大多數(shù)相似字也就是內(nèi)含字如‘
’的相似字為‘夫’,‘癶、
、’的相似字為‘火’。少數(shù)相似字是由其中一筆延長或變形所形成的可讀字。如‘、
’的相似字為‘豐’。
有些不表義不可讀字的相似字按字形與某個(gè)部首合并。
例如‘勞、學(xué)、索’等字的上體與‘宀’合并,‘旁、商’等字的上體與‘立’合并。
現(xiàn)將漢字結(jié)構(gòu)小結(jié)如下
注其他結(jié)構(gòu)一律轉(zhuǎn)化為左右或上下結(jié)構(gòu)。
(三)單字的第二碼(以下例子均以第一套方案為準(zhǔn))(1)不可拆獨(dú)體字的第二碼不可拆獨(dú)體字的第二碼一律由其內(nèi)含字確定。
1.如其內(nèi)含字可讀,則取此內(nèi)含字的聲母作為原獨(dú)體字的第二碼(規(guī)則同第一碼)。
例如‘夫’字的的內(nèi)含字為‘大’,因此第二碼為‘d’(第一碼為f)。
2.如無可讀內(nèi)含字且取掉一筆后能成為某個(gè)偏旁部首,則取此偏旁部首的相關(guān)字的聲母作為原獨(dú)體字的第二碼。
例如‘井’的第二碼為‘v’,這是因?yàn)槿サ粢粰M即成為部首‘廾’,其相關(guān)字為‘草’。
3.如找不到合適的內(nèi)含字且取掉一筆后也不是偏旁部首,但單字的上方為十字相交,則第二碼取‘十’的對應(yīng)碼‘p’。
例如‘韋、才、寸’等單字的第二碼都是‘p’(木字例外)。
4.其他情況一律取單字起筆的聲母,分以下幾種類型‘豎’(SHU)→‘a(chǎn)’,‘撇’(PIE)→‘p’。
‘點(diǎn)’(DIAN)→‘d’,‘橫’(數(shù)碼一)→‘q’。
‘折’分兩類90°的折(如‘
’)對應(yīng)于‘z’,45°的折(如‘乛’)對應(yīng)于‘u’(取‘角’字的聲母)。
例如‘長’的第二碼是‘p’,‘書’的第二碼是‘z’,‘了’的第二碼是‘u’(角)。
由一筆或兩筆構(gòu)成的獨(dú)體字,第二碼一律由起筆的聲母定。
(2)可拆獨(dú)體字的第二碼1.將可拆獨(dú)體字按書寫順序拆成兩部分,使第一部分為盡可能大的可讀字,則此可讀字的聲母即為原獨(dú)體字的第二碼。
例如‘交’應(yīng)拆成‘六’與‘乂’,而不能拆成‘亠’與‘父’,因?yàn)樯喜俊铩豢勺x。因此按規(guī)則‘交’的第二碼為‘y’(數(shù)碼六)而不是‘d’。又如‘克’的上部不能取‘十’,因?yàn)樗皇亲畲罂勺x字,而應(yīng)取‘古’,因此按規(guī)則‘克’的第二碼為‘g’(不是p)。
2.如可拆獨(dú)體字的上部拆不出可讀獨(dú)體字,則取上部字塊的相關(guān)字或相似字的聲母作為原獨(dú)體字的第二碼。
例如‘共’的上部只能拆出‘艸’,其相關(guān)字為‘草’,因此‘共’的第二碼為‘v’。
又如‘表’的上部只能拆出‘’,其相似字為‘豐’,因此‘表’的第二碼為‘f’。
3.如上部只能拆出由兩筆構(gòu)成的筆形結(jié)構(gòu),可分以下六種情況取第二碼。
a.橫撇相交‘’,第二碼一律取‘v’,(相關(guān)字‘叉’的聲母)。
例如‘在、右、有’等字的第二碼都是‘v’。
b.橫豎相交‘十’,第二碼一律取‘p’(數(shù)碼十的對應(yīng)碼)。
例如‘直、賣’的第二碼為‘p’。
c.帶角的結(jié)構(gòu),如‘、’,第二碼一律取‘u’(取‘角’字的聲母)。
例如‘爭、魚、欠、爾、矛、甬’等字的第二碼都是‘u’。
d.帶點(diǎn)的結(jié)構(gòu),如‘亠、丷’,第二碼一律取‘d’(取‘點(diǎn)’字的聲母)。
例如‘文、立、半、米、興’等字的第二碼都是‘d’。
注意‘主’與‘卞’視為不可拆獨(dú)體字比較直觀,內(nèi)含字分別為‘王’與‘下’。
e.豎橫相連‘
’,第二碼一律取‘a(chǎn)’(取‘豎’字的聲母)。
例如‘上、卓、貞、占’等字的第二碼都是‘a(chǎn)’。
f.橫撇相連‘丆’,第二碼一律取‘q’(取數(shù)碼‘一’的對應(yīng)碼)。
例如‘石、頁、面、互’等字的第二碼都是‘q’。
(3)雙體或多體字的第二碼第二碼一律為單字左上角字塊的聲母,如此字塊不可讀,則取其對應(yīng)的相關(guān)字或相似字的聲母(對應(yīng)規(guī)則同第一碼)。
注意一些雙體部首不能分開。例如‘翼’字的第二碼為‘i’(部首‘羽’的聲母)不是‘x’(‘習(xí)’的聲母)。雙體字或多體字的第二碼多數(shù)為偏旁部首的對應(yīng)碼,其相關(guān)字大多數(shù)為人所共知。
例如艸→草(v),疒→病(b),饣→食(s),宀→寶(b),礻→示(s),衤→衣(y),犭→犬(e),攵→文(w),讠→言(i),丬→
(p),钅→金(j),忄→心(x),氵→水(a),灬→火(h)。
但有些偏旁部首的相關(guān)字并不很直觀,因此還要作進(jìn)一步說明。
1.‘阝、卩’讀作‘耳朵旁’,故對應(yīng)碼為‘e’。
2.‘匚’讀作‘區(qū)字旁’,故對應(yīng)碼為‘e’。
3.‘冂、ㄇ’讀作‘同字頭’,故對應(yīng)碼為‘l’。
4.‘凵’讀作‘山字底’,故對應(yīng)碼為‘a(chǎn)’。
5.‘亻’讀作‘立人’,故對應(yīng)碼為‘l’(不是‘r’)。
6.‘纟、糸、幺’都讀作‘絞絲’,故對應(yīng)碼為‘u’(不是‘s’)。
7.‘冖’讀作‘平寶蓋’,故對應(yīng)碼為‘p’。
8.‘廴’讀作‘建字旁’,故對應(yīng)碼為‘u’。
9.‘夂’讀作‘務(wù)字頭’,故對應(yīng)碼為‘w’。
10.‘辶’讀作‘走之’,故對應(yīng)碼為‘z’。
11.大口‘囗’讀作‘方塊’,故對應(yīng)碼為‘f’(不是‘k’)。
13.‘刂’讀作‘側(cè)刀’,故對應(yīng)碼為‘c’(不是‘d’)。
14.‘巛’讀作‘拐’,故對應(yīng)碼為‘g’。
15.‘罒’讀作‘四’,故對應(yīng)碼為‘s’(注意僅取其音,不作數(shù)碼)。
幾個(gè)特例1.‘手、扌、尢’的對應(yīng)碼為‘o’(取‘手’和‘尤’字的韻母)。
2.‘月’作部首時(shí),對應(yīng)碼取‘f’。
3.‘木’作部首時(shí),對應(yīng)碼取‘q’(取起筆橫)。
4.‘穴’作部首時(shí)(包括‘罕’字的上體),對應(yīng)碼取‘x’。
以下部首按起筆聲母定對應(yīng)碼
‘、、彡、
、勹、
’的對應(yīng)碼為‘p’(撇)。
‘亠、
、冫、丷’的對應(yīng)碼為‘d’(點(diǎn))。
’的對應(yīng)碼為‘a(chǎn)’(豎)。
‘丆’的對應(yīng)碼為‘q’(起筆橫作為數(shù)碼一)。
、乚、彐、
、、’的對應(yīng)碼為‘z’(折)。
‘、
、、厶’的對應(yīng)碼為‘u’(角)。
‘巛’的對應(yīng)碼為‘g’(拐)。
在單字中的所有數(shù)碼字一律按順序取第一排字母鍵的相應(yīng)鍵位。
例如‘交’的上塊為數(shù)碼字‘六’,故第二碼為‘y’(不是l),同樣,‘吾’字的第二碼為‘l’(不是w)。
(四)單字的第三碼(1)獨(dú)體字的第三碼1.不可拆獨(dú)體字或可拆獨(dú)體字的下塊不可讀,則無第三碼,一般用空格鍵補(bǔ)位,僅以下情況用‘.’號鍵補(bǔ)位a.數(shù)字如‘一、二、…九、十、百、千、萬’等等。
b.動物如‘牛、馬、羊、龍、兔、鳥’等等。
c.人物如‘父、母、兄、弟、夫’等等。
d.重量長度方向如‘東、西、上、下、斤、兩、尺、寸、丈’等等。(有些獨(dú)體字同時(shí)有兩種補(bǔ)位法,其中可能有一個(gè)是重碼)例如‘王’字取碼為‘wt空’(內(nèi)含字為‘土’),‘羊’取碼為‘if.’(下塊‘
’不可讀)。
2.可拆獨(dú)體字如下塊可讀,則第三碼取下塊聲母鍵,如有幾個(gè)可讀字塊,則第三碼取最下面一個(gè)可讀字塊的聲母鍵。
例如‘另’取碼為‘lkl’,‘辛’取碼為‘xlp’。
(2)左右雙體字的第三碼
1.如第二體為可拆獨(dú)體字,則第三碼取第二體上塊的聲母鍵。如此塊不可讀,則取整個(gè)第二體的聲母。
例如‘?!〈a為‘blk’,其中第三碼‘k’為第二體‘呆’的上塊‘口’的聲母?!畤[’取碼為‘oka’,因其第二體‘肅’的上塊‘
’不可讀,故第三碼取‘肅’字的聲母‘a(chǎn)’。
2.如第二體為不可拆字塊,則第三碼按以下三種方式取a.如第二體為偏旁部首,則第三碼取其聲母。例如‘汪’取碼為‘waw’,其中第三碼‘w’為第二體‘王’(部首)的聲母。
b.如第二體不是偏旁部首,且有可讀內(nèi)含字或相似字,則第三碼取此內(nèi)含字或相似字的聲母(注意按規(guī)則不取第二體本身的聲母)。
例如‘油’取碼為‘yal’,其中第三碼為第二體‘由’(非部首)的內(nèi)含字‘田’的聲母鍵(注意;按規(guī)則不取‘由’的聲母‘y’)。又如‘決’取碼為‘ulf’,其中第三碼為第二體‘
’的相似字‘夫’的聲母。
c.如第二體為不可拆獨(dú)體字,但無內(nèi)含字,則第三碼取此獨(dú)體字的聲母。
例如‘張’取碼為‘,gv’其中第三碼為第二體‘長’的聲母。
必須著重指出,在多體字中,只要是偏旁部首(無論是否獨(dú)體,也無論是否可拆),一律看成一個(gè)整體,絕對不能拆開。但雙體字的第二體如是獨(dú)體字,按規(guī)則必須拆開。特別當(dāng)?shù)诙w為不可拆獨(dú)體字時(shí),按規(guī)則不能取此字本身的聲母,而要取其內(nèi)含字的聲母(除非內(nèi)含字不可讀)。
由于有的獨(dú)體字的內(nèi)含字并不很直觀,所以對于大多數(shù)常用字,都有兩個(gè)輸入碼一個(gè)第三碼取獨(dú)體字本身的聲母,另一個(gè)第三碼取其內(nèi)含字的聲母。例如‘使’字,按規(guī)則取碼為‘sls’(‘吏’內(nèi)含字‘史’的聲母)。但為了使初學(xué)者不致因?qū)ふ覂?nèi)含字而耽誤時(shí)間,因此也配有輸入碼‘sll’(第三碼為‘吏’字的聲母)。
(3)上下雙體字的第三碼1.如下體可拆,且下體的下塊可讀,則第三碼取下體最下塊的聲母鍵。如下塊不可讀,則第三碼取整個(gè)下體的聲母。
例如‘居’的取碼為‘usk’,其第三碼是下體下塊‘口’字的聲母。
又如‘罷’的取碼為‘bse’,因其下體的下塊‘厶’不可讀,故取整個(gè)下體‘去’的聲母‘e’。
2.如下體不可拆(只有一塊),但不是偏旁部首,則第三碼取下體的內(nèi)含字或相關(guān)字或相似字的聲母鍵。如下體可讀,但無內(nèi)含字,則第三碼取下體的聲母。
例如‘英’的取碼為‘yvf’,其第三碼是下體‘央’的內(nèi)含字‘夫’的聲母。
又如‘奉’的取碼為‘ffv’,其第三碼是下體‘
’的相似字‘艸’(草)的聲母。
3.如下體是偏旁部首,則第三碼一律取其對應(yīng)碼。
例如‘鴦’的取碼為‘iin’,‘芡’的取碼為‘eve’。
(4)多體字的第三碼1.左右多體字的第三碼一律取第二體左上體的聲母(可讀)或其相關(guān)字、相似字(不可讀)的聲母。
例如‘樹’取碼為‘a(chǎn)qy’,第三碼為第二體‘又’的聲母。
‘隨’取碼為‘a(chǎn)ez’,第三碼為第二體‘辶’的相關(guān)字‘走’的聲母。
‘傲’取碼為‘a(chǎn)lf’,第三碼為第二體上塊‘’的相似字‘豐’的聲母。
‘濫’取碼為‘laa’,第三碼為第二體左上體‘
’(豎)的對應(yīng)碼。
2.上下多體字的第三碼一律取左下角字體的聲母(可讀)或其相關(guān)字、相似字(不可讀)的聲母。例如‘命’取碼為‘mrk’,第三碼為左下角字體‘口’的聲母。
‘獲’取碼為‘hve’,第三碼為左下角字體‘犭’的相關(guān)字‘犬’的聲母。
‘暴’取碼為‘bra’,第三碼為左下角字體‘
’的相似字‘水’的聲母。
(5)其他漢字結(jié)構(gòu)一律轉(zhuǎn)化為左右或上下結(jié)構(gòu)1.內(nèi)外結(jié)構(gòu)轉(zhuǎn)化為左右結(jié)構(gòu)如‘國’=‘囗玉’(雙體),取碼為‘gfw’(第三碼為‘玉’內(nèi)含字‘王’聲母)。
2.帶區(qū)字框‘匚’的轉(zhuǎn)化為左右結(jié)構(gòu)如‘匾’=‘匚扁’(多體),取碼為‘beh’(第三碼為‘戶’的聲母)。
3.其余結(jié)構(gòu)一律轉(zhuǎn)化為上下結(jié)構(gòu)處理如‘瘤’=疒(多體),取碼為‘lbt’(第三碼為‘田’的聲母)。
留‘載’=
(雙體),取碼為‘,gc’(第三碼為‘車’的聲母)。
車‘乘’=禾(多體),取碼為‘chb’(第三碼為‘北’的聲母)。
北‘褒’=衣(多體),取碼為‘byl’(第三碼為左下體‘亻’的對應(yīng)碼)。
權(quán)利要求
1.拆聲漢字編碼(簡稱拆聲碼)的主要特征是按照單字的韻母或聲調(diào)的不同,將使用頻率較高的聲母拆成兩個(gè)鍵位。凡根據(jù)這個(gè)原理設(shè)計(jì)的漢字編碼及其漢字輸入鍵盤均涉及此項(xiàng)專利。
2.根據(jù)原理(1)所設(shè)計(jì)的第一套拆聲碼方案如下當(dāng)韻母為a(ia=a)或u時(shí),聲母j→u、q→e、x→o、y→i、z(zh)→,、c(ch)→v、s(sh)→a。其他情況聲母對應(yīng)的鍵位與漢語拼音完全相同。
3.根據(jù)原理(1)所設(shè)計(jì)的第二套拆聲碼方案如下當(dāng)聲調(diào)為第一或第二聲時(shí),聲母j→u、q→e、x→o、y→i、z(zh)→,、c(ch)→v、s(sh)→a。其他情況聲母對應(yīng)的鍵位與漢語拼音完全相同。
4.這兩套方案的鍵盤設(shè)計(jì)如下
碼元共27個(gè)(26個(gè)拉丁字母加‘,’號鍵)?!?’與‘/’號鍵為重碼上屏?!?’號鍵為詞碼轉(zhuǎn)換。
5.單字的第一碼一律取其聲母并按(2)或(3)所規(guī)定的法則與鍵盤上的鍵位對應(yīng)。
6.獨(dú)體字分可拆與不可拆兩種。不可拆獨(dú)體字最多取兩碼(用空格鍵或‘.’號鍵斷碼),其第二碼為內(nèi)含字的聲母n不可拆獨(dú)體字的內(nèi)含字可按以下順序確定A.如不可拆獨(dú)體字的第一筆僅與字體相連或相離,且去掉這一筆后仍是可讀字,則將這個(gè)可讀字定義為原獨(dú)體字的內(nèi)含字。B.如不可拆獨(dú)體字的最后一筆僅與字體相連或相離,且去掉這一筆后仍是可讀字,則將這個(gè)可讀字定義為原獨(dú)體字的內(nèi)含字。C.如以上兩種方式均不能構(gòu)成可讀字,或不可拆獨(dú)體的首筆與末筆均與字體相交,則內(nèi)含字定義為去掉最少筆形所形成的最大可讀字體。D.如獨(dú)體字無內(nèi)含字,則第二碼取起筆的聲母。獨(dú)體字的內(nèi)含字也是此專利的另一項(xiàng)重要特征。
7.其他單字最多取三碼,第二碼一律取第一體的聲母,可拆獨(dú)體字的第三碼為下體的聲母,左右結(jié)構(gòu)的第三碼為第二體的聲母,上下結(jié)構(gòu)的第三碼為左下角字體的聲母。如字體不可讀,則取其相關(guān)字或相似字的聲母。雙體結(jié)構(gòu)的第二體如不是偏旁部首,則第三碼取其內(nèi)含字的聲母(如無內(nèi)含字,則取整個(gè)字體的聲母)。所有這些聲母均按(2)或(3)所規(guī)定的法則與鍵位對應(yīng)。
全文摘要
拆聲漢字編碼(簡稱拆聲碼)主要是根據(jù)單字的韻母或聲調(diào),將使用頻率較高的聲母分成兩個(gè)碼元。
文檔編號G06F3/023GK1057345SQ9010414
公開日1991年12月25日 申請日期1990年6月13日 優(yōu)先權(quán)日1990年6月13日
發(fā)明者石嘯生 申請人:石嘯生