插,而四個插的字形漢字編碼是9, 一個插的字形漢字編碼是3,而一個 倒"匚"的字形漢字編碼為4,因此聿字的字形漢字編碼為934。
[0038]凹,按其筆畫順序,該字具有八個折,此時,將八個折拆分為兩個四折,而四折的字 形漢字編碼是8,因此凹字的字形漢字編碼為88。
[0039] 當漢字的折、插在一筆里面時,兩者相加。
[0040] 例如,也,按其筆畫順序,該字具有兩個一插(十),兩個二折(〈〈),然而因為這兩個 一插和兩個二折都是由同一筆的一豎彎鉤和同一筆的一豎形成的,因此每個一插均可以和 每一個二折相加,即3+4=7,因此也字的字形漢字編碼為77。
[0041] 當漢字具有彎折鉤時,用"彎"所對應的字形數(shù)字編碼補注,且補注在該漢字的字 形數(shù)字編碼的最后一位。
[0042] 例如,乙,按其筆畫順序,該字分為三折(〈〈〈),且具有彎折鉤,則補注0. 2,因此乙 字的字形數(shù)字編碼為6. 2。
[0043]此處額外需要說明的是:由于單體字的字形復雜,可能會拆解成五個或五個以上 的部分,但由于五個數(shù)字足矣代表一個單體字,因此一般取五位數(shù)字即可,剩余的部分省 去。例如,兼字還具有一撇一捺的點位對稱取〇,其字形數(shù)字編碼應為017740,但01774已 經(jīng)構(gòu)成五位,因此點位對稱所對應的0略去。
[0044] 當漢字的字形數(shù)字編碼出現(xiàn)重碼時,通過補位的方法可進行有效處理。一般而言, 出現(xiàn)重碼的漢字大都是以成對的形式出現(xiàn),例如"土"和"士"、"未"和"末"、"凹"和"凸"、 "日"和"曰"等。為了區(qū)分以成對的形式出現(xiàn)的兩個重碼漢字,在編碼時,可采用"正、負" 的概念,約定其中一個漢字為其原本的字形數(shù)字編碼,而另一個漢字,在其原本的字形數(shù)字 編碼后補注0. 1,從而區(qū)分重碼的兩個漢字。
[0045] 以"土"和"士"為例,就筆畫順序以及字形編碼規(guī)則而言,兩者的字形數(shù)字編碼均 為31,無法區(qū)分。因此在編碼時,可以約定"土"為正,即保留其原本的字形數(shù)字編碼31,同 時約定"士"為負,而后在"士"原本的字形數(shù)字編碼31后補注0. 1,使"士"的字形數(shù)字編碼 改變?yōu)?1. 1 ;這樣一來"土"與"士"的重碼問題便得到解決。此處額外需要說明的是,在編 碼時,同樣可以約定"士"為正,其字形數(shù)字編碼為31,"土"為負,其字形數(shù)字編碼為31. 1 ; 也就是說,所謂正負是兩個重碼的漢字之間的相對關(guān)系,約定重碼的兩個漢字中的任意一 個為正,那么就保留該漢字原本的字形數(shù)字編碼,而另一個即為負,則在該漢字原本的字形 數(shù)字編碼后補注0. 1,就可有效處理重碼的情況。
[0046]以上述的方法進行類推,下表為若干單體字的舉例說明:
按漢字的筆畫順序,其第一筆為撇時,漢字的字形數(shù)字編碼第一個數(shù)取6。
[0047] 例如,人,按其筆畫順序,該字分為一撇、一捺,且一撇為人字的第一筆,則一撇為 第一筆時取6, 一捺取0. 3,因此人的字形數(shù)字編碼為6. 3。
[0048] 么,按其筆畫順序,該字分為一撇、一個"厶",一撇為么字的第一筆取6,一個"厶" 取2. 1,因此么字的字形數(shù)字編碼為62. 1。
[0049] 以撇字為第一筆的若干漢字的字形數(shù)字編碼以及首位字形數(shù)字編碼為6的漢字, 如下表舉例所示:
(3)當漢字為包含兩個單體部分的多體字時,先取其部首的字形數(shù)字編碼中的第一個 數(shù),然后在該數(shù)之后進位加入一個空格,接著按筆畫順序再取該漢字的另一單體部分的字 形漢字編碼進行收尾。
[0050] 當漢字為上、下結(jié)構(gòu)的多體字且其上、下兩部分均為部首時,取其上部為部首;若 漢字為左、右結(jié)構(gòu)的多字體且其左、右部分均為部首時,取其左部為部首。
[0051] 例如,郯,按其字形結(jié)構(gòu),其右半部分為部首卩,部首卩的字形數(shù)字編碼為41,之 后郯字的左半部分"炎"為剩余部分,而炎由于具有四組點位對稱,因此其字形數(shù)字編碼為 0000,此時郯字的字形編碼即為4 (空格)0000。
[0052]阿,按其字形結(jié)構(gòu),其左半部分為部首卩,部首卩的字形數(shù)字編碼為41,之后阿字 的右半部分"可"為剩余部分,而可為一橫、一豎彎鉤和一 "口"字結(jié)構(gòu),三者分別取1、2、8, 因此阿字的字形數(shù)字編碼為4 (空格)128。
[0053] 以上述的方法進行類推,下表為若干多體字的舉例說明: 表10
此處額外需要說明的是:由于多體字的字形復雜,可能會拆解成六個或六個以上的單 體部分,但由于六個數(shù)字足矣代表一個多體的漢字,因此一般取六位數(shù)字即可,剩余的部分 省去。例如,鄗字還具有位于"高"字頂部的一點,其字形數(shù)字編碼應該為4 1868. 1,但4 (空格)1868已經(jīng)有六位,因此0. 1的小數(shù)部分略去。
[0054] (4)當漢字包括兩個單體部分以上的多體字時,先取其部首的字形數(shù)字編碼中的 第一個數(shù),然后在該數(shù)之后進位加入一個空格,接著按筆畫順序再 取該漢字其余單體部分的第一個數(shù),之后再以最后一個單體部分的剩余字形數(shù)字編碼 進行收尾。
[0055] 其中,"再以最后一個單體部分的剩余字形數(shù)字編碼進行收尾"指的是,當某一多 體字的部首加空格以及先前各單體部分的首位所組成的字形數(shù)字編碼不足六位時,采用該 多體字最后一個單體部分的剩余字形數(shù)字編碼進行收尾,以使該多體字的字形數(shù)字編碼構(gòu) 成六位,從而降低重碼率。
[0056] 例如,鄭,按筆畫順序分為部首"卩"和"先"、"先"、"貝"這四個部分,以字形數(shù)字 編碼規(guī)則,部首"卩"取首位4, "先"取首位6, "先"取首位6, "貝"先取首位4,此時"鄭"字 的部首加空格以及各單體部分的首位所組成的字形數(shù)字編碼為4 (空格)664,共有五位,不 足六位,因此按"鄭"字的筆畫順序,取其最后一個單體部分,即"貝"的剩余字形數(shù)字編碼進 行收尾,以使"鄭"字的字形數(shù)字編碼構(gòu)成六位,"貝"字剩余部分為點位對稱的"人"取〇, 那么"鄭"字的字形數(shù)字編碼為4 (空格)6640。
[0057] 但,包含兩個部分以上的多體字也遵循于字形數(shù)字編碼超過六位時,超過六位的 部分省去這一規(guī)則。
[0058] 例如,"瀛",按筆畫順序分為部首"、? "、"亡"、" 口"、"月"、"女"、"凡",這六個部分, 以字形數(shù)字編碼規(guī)則"取首位〇, "亡"取首位1," 口"取首位8, "月"取首位6, "凡"取 首位6,那么"瀛"字的字形數(shù)字編碼為0 (空格)18656,為七位編碼,超過六位,此時最后 "凡"這一單體部分所取的6就應省去,所以這樣一來,"瀛"字的字形數(shù)字編碼為0 (空格) 1865〇
[0059] 也就是說,當某一多體字的部首加空格以及各單體部分的首位所組成的字形數(shù)字 編碼正好為六位時,就不再以該多體字最后一個單體部分的剩余字形數(shù)字編碼進行收尾。 而當某一多體字的部首加空格以及各單體部分的首位所組成的字形數(shù)字編碼超過六位時, 省去其超過六位的部分的字形數(shù)字編碼。
【主權(quán)項】
1. 一種漢字形定數(shù)輸入法,其特征在于:所述漢字形定數(shù)輸入法將漢字的字形與數(shù)字 建立如下對應關(guān)系:2. 根據(jù)權(quán)利要求1所述的一種漢字形定數(shù)輸入法,其特征在于:若所述漢字為單體字, 根據(jù)所述漢字的字形結(jié)合其筆畫數(shù)順序并按所述對應關(guān)系進行數(shù)字編碼。3. 根據(jù)權(quán)利要求2所述的一種漢字形定數(shù)輸入法,其特征在于:若按所述漢字的筆畫 順序,其第一筆為撇時,所述漢字的字形數(shù)字編碼第一個數(shù)取6。4. 根據(jù)權(quán)利要求1所述的一種漢字形定數(shù)輸入法,其特征在于:若所述漢字為包含兩 個單體部分或兩個以上單體部分的多體字時,先取其部首的字形數(shù)字編碼中的第一個數(shù), 然后在該數(shù)之后進位加入一個空格,接著按筆畫順序再取其余單體部分字形漢字編碼的首 位,之后再以最后一個單體部分的剩余字形漢字編碼進行收尾。5. 根據(jù)權(quán)利要求4所述的一種漢字形定數(shù)輸入法,其特征在于:若所述漢字為上、下結(jié) 構(gòu)的多體字且其上、下兩部分均為部首時,取其上部為部首;若所述漢字為左、右結(jié)構(gòu)的多 字體且其左、右部分均為部首時,取其左部為部首。6. 根據(jù)權(quán)利要求1所述的一種漢字形定數(shù)輸入法,其特征在于:若所述漢字具有若干 點、若干彎、若干撇或若干捺時,相同類型的筆畫所對應的小數(shù)相加;然后按所述漢字的筆 畫順序擺放各小數(shù)在字形漢字編碼中的次序,即筆畫在先,小數(shù)靠前,筆畫在后,小數(shù)靠后。7. 根據(jù)權(quán)利要求1所述的一種漢字形定數(shù)輸入法,其特征在于:若所述折或所述插的 數(shù)量超過四時,將大于四的部分拆分并構(gòu)成兩位字形漢字編碼,其中前一位是所述折或所 述插的數(shù)量為四時所對應的字形漢字編碼,后一位是所述折或所述插超過四的部分所對應 的字形漢字編碼。8. 根據(jù)權(quán)利要求1所述的一種漢字形定數(shù)輸入法,其特征在于:若所述折、插在一筆里 面時,兩者相加。9. 根據(jù)權(quán)利要求1所述的一種漢字形定數(shù)輸入法,其特征在于:當所述漢字具有彎折 鉤時,用所述彎所對應的字形數(shù)字編碼補注,且補注在該漢字的字形數(shù)字編碼的最后一位。
【專利摘要】本發(fā)明涉及輸入法領(lǐng)域,尤其是漢字形定數(shù)輸入法,其特征在于:該編碼輸入法將漢字字形與數(shù)字建立對應關(guān)系,若漢字為單體字,則由漢字字形直接進行數(shù)字編碼;若漢字為多體字,先取部首字形數(shù)字編碼中的第一個數(shù),再取字的字形進行數(shù)字編碼。本發(fā)明的優(yōu)點是:動用空格、空心、省去多余信息,明確關(guān)系,簡單操作。如參與文字改革可打造無重碼精確形定數(shù)碼。使可直接應用到漢字、詞、語、文、典庫;還能運用于一切軟件包括密碼。用于檢索、寫作、編纂、組織網(wǎng)絡(luò)、組織社會活動、構(gòu)建社會防護,為在大數(shù)據(jù)領(lǐng)域起中流砥柱作用作出貢獻。
【IPC分類】G06F3/023
【公開號】CN105068674
【申請?zhí)枴緾N201510469392
【發(fā)明人】桂有恒, 桂佳
【申請人】桂有恒, 桂佳
【公開日】2015年11月18日
【申請日】2015年8月4日