專利名稱:雙聯(lián)碼免拆高效漢字輸入技術的制作方法
技術領域:
本發(fā)明的名稱為“雙聯(lián)碼免拆高效漢字輸入技術”,屬于漢字信息處理技術和現(xiàn)代漢字應用研究領域。
漢字輸入的應用主要有三種,都未能很好地解決效率低下、難學易忘、不合規(guī)范的問題①字母鍵盤輸入,在計算機漢字輸入中字母鍵盤輸入一直處于主導地位,但由于沒有好的形碼,大多數(shù)用戶只能使用漢語拼音輸入法,效率低,對不認識的字要先查字典才能輸入;②在手機等數(shù)字鍵盤的漢字輸入中,由漢語拼音字母轉換成數(shù)字碼重碼更多,效率更低;用于數(shù)字鍵盤的形碼在計算機漢字輸入中效率太低;如果用戶要對兩種鍵盤學習兩種不同的形碼,則要耗費太多的時間和精力;③漢字字典檢字無論用部首檢字法或筆畫法都不能直接翻頁檢字,效率很低;四角號碼重碼多、取碼錯誤多;漢字排序檢索不能與漢字信息處理技術相銜接。
“雙聯(lián)碼免拆高效漢字輸入技術”能使用戶只學字母編碼便可以掌握字母鍵盤和數(shù)字鍵盤兩種高效的輸入法,是計算機、手機、字典檢字等各項漢字輸入問題的全面解決方案,其特征在于用戶在計算機漢字輸入中學會字母編碼的形碼輸入法后,即可按照最簡便的規(guī)則轉換成數(shù)字碼進行手機漢字輸入,該字母編碼又適合為漢字排序,可用以實現(xiàn)漢字字典直接翻頁檢字,于是各種場合的漢字輸入問題通過使用雙聯(lián)碼能夠全部得到解決。
雙聯(lián)碼-字母編碼采用已由本人獲得國家發(fā)明專利的《漢字免拆分快速輸入法》之部件式形碼(專利號ZL01105222.8),遵守國家語委頒布的《信息處理用GB 13000.1字符集漢字部件規(guī)范》,用26個字母對全部編碼部件進行有理據(jù)的表達,不需要背口訣記憶;實行漢字直接編碼不學拆分規(guī)則;輸入效率比拼音輸入法提高1-3倍,同時有利于引導用戶規(guī)范化使用漢字。
漢字形碼必須全面具備規(guī)范性、快速性和易學性,才能滿足社會各層次用戶的需求,因為快速輸入是使用形碼的目的,快速性不佳則與拼音輸入法相比沒有長處可言,不能吸引人們學用;符合漢字規(guī)范是設計形碼、推廣使用漢字形碼輸入法的前提條件;而難學易忘的形碼會使很多學習者半途而廢,令人們望而卻步。
雙聯(lián)碼—字母編碼之技術特征如下(1)適用于各種漢字集適用于GB2312-80基本集漢字,也適用于GBK大字庫和GB18030-2000,最大碼長皆為四碼,對GBK字庫,重碼字不需翻頁尋找。
(2)符合各種規(guī)范符合漢字內(nèi)碼規(guī)范、筆順規(guī)范、筆形規(guī)范、漢字部件規(guī)范、漢字結構規(guī)則等各種有關漢字規(guī)范以及漢字使用習慣,與語文教學一致。
(3)保持漢字基礎部件完整編碼部件根據(jù)《信息處理用GB 13000.1字符集漢字部件規(guī)范》選定,不進行過度拆分保持漢字基礎部件完整,有利于迅速識別,編碼快,為實行免拆分直接編碼創(chuàng)造了條件。
(4)理據(jù)性表達之一表音法單碼成字部件和常用部首,用其拼音首碼或讀音信息表示,易學易記,如貝疒-B,寸艸-C,大刂-D,兒阝-E,方口-F,戈宀-G,火一-H,子辶-Z。(5)理據(jù)性表達之二雙碼部件整體表達法例如重=ZT(T-土),成=CG(G-戈),其中首碼是這個成字部件漢語拼音第一個字母,第二碼是部件下部、右部結構特征或末筆筆畫的音形信息。
其他形碼中需要作復雜拆分的獨體字如成、重、牙、柬、更、黑、夾、兩、年、曲、垂、秉、非等字,雙聯(lián)碼都取為雙碼部件作整體表達,不用拆分,兩個碼都有記憶依據(jù),并能做到重碼最少,化解了漢字編碼中最大的難點。
試比較重、成兩字的編碼雙聯(lián)碼重 =ZT, 成 =CG認知碼重 =Z81, 成=戊=W9王碼 重=丿一日土=TGJF,成=廠乚丿=DNNT鄭碼 重=千日二 =MEKB,成=戈丿 =HMY(鄭碼用雙碼,千=ME)由上述的比較可知,對重、成這樣的獨體字,不作拆分,直接取其為雙碼編碼部件,作有記憶依據(jù)的整體表達,最容易學習和記憶,可以方便地給包含這些部件的漢字直接編碼,如踵=KZZT,誠=YCG,等等。(口-K,止-Z,讠-Y)如果木和馬都用M表示,則有以下重碼字駒驅(qū)騎駝騍駭驕騏驗驊駿駱……,枸樞椅柁棵核橋棋檢樺梭格……,取雙碼部件馬=MH,保證了部件的理據(jù)性表達,同時解決了重碼問題。
除此以外,整體表達成字部件還有以下好處一是編碼速度快。對于熟練使用漢字的人,識別獨體字、常用部首是極快的,但對漢字的筆畫構成,則不能記住,要根據(jù)漢字字形一筆一筆拆出,速度慢得多。
其次,雙碼部件的代碼即是這些漢字的編碼,不加任何補碼,輸入兩字詞時編碼不改變,使用非常方便。
現(xiàn)有形碼中采用雙碼部件者,對雙碼部件何時取第一碼、何時取第二碼、何時取雙碼,要用七條規(guī)則確定,大大地增加了學習難度。雙聯(lián)碼采用雙碼部件仍只需遵照前三后一的規(guī)定直接編碼,不需增加任何新規(guī)則,保持了易學易記的特點。
(6)理據(jù)性表達之三非字部件同形對應法對非字部件直接由與其形狀相似的字母來表示,如匚-C,凵-U,ㄒ丆-T,彐-E,乂-X,丩-Y,等等。(這里所說的字與非字是以基本集漢字為準,匚、乂、丆在GBK字庫中都是字。)對漢字折筆規(guī)范中25種筆形也用同形對應法表示。
同形對應法與表形碼不同只表達形狀相近的部件,不作過多的同組歸并,“同形對應”名符其實;只表達非字部件,不表達成字部件,符合人們的認知習慣。
(7)實行漢字免拆直接編碼不學拆分規(guī)則組合字按照各構成部分之間的自然界限實現(xiàn)免拆分直接編碼,沒有任何拆分規(guī)則,只有一條編碼規(guī)定依照筆順按前三后一的規(guī)定編碼。
對各類例字直接編碼如下由單碼成字部件構成的漢字權≡MY,對≡YC,村≡MC,樹≡MYC,(木-M,又-Y,寸-C)嗓=KYYM,噪=KKKM(口-K),燮=YHHY,躞=KZYY(言-Y,火-H,止-ZOH)。
包含有慣用名稱的部首亻-R(單人旁),阝-E(雙耳旁),辶-Z(走之兒),一-H(筆畫橫),休=RM,付=RC,叢=RRH,僵=RHTH(木-M,寸-C,人-R,田-T),附=ERC,陪=ELK,部=LKE(立-L,口-K),過=CZ,逼=HKTZ。
含有同形對應部件匚-C,凵-U,丆-T,彐-E,乂-X尋=EC,慧=FFEX(寸-C,豐-F,心-X),頁=TB,囂=KKTK(貝-B,口-K),區(qū)=CX,框=MCW(木-M,王-W)。
含有雙碼部件重=ZT,馬=MH,力=LL,車-CS,夫=FR,禾=HM,矢=SD,董=CZT,懂=XCZT,驅(qū)=MHCX,駕=LLKH(前三后一,駕字中馬只取第二碼),輪=CSRB,輦=FRFS(前三后一,輦字中車只取第二碼),委=HMN,矮=SDHN(按順序,矮字中禾只取第一碼)。
(8)代碼借用優(yōu)于無理表達在用漢語拼音第一個字母表達部件時,字母I、O、U和V無法使用,A的用處很小。為有效減少重碼,必須設法使它們充分發(fā)揮作用。
①代碼S不勝負擔,石、十等部件都已用S表達,雙聯(lián)碼借用O和V代表S借用O表達水氵沽=OSK,泉=BO(白-B),借用V表達手扌批=VBB,拿=RHKV(人-R,一-H,口-K)。
②代碼A的作用太小,而B要表示八、貝、匕、白、疒、勹等等,重碼很多,故借用A代B,表達八例如貧=ADB,總=AKX(刀-D,口-K,心-X)。
③為防止用Y表示的部件過多,采用了零聲母處理法(去掉I、U前面的聲母Y),即弋、尹、亠(衣字頭)用I表示,如,代=RI;月、元、羽、聿、禺、禹等用U表示,如,玩=WU。
代碼借用和零聲母處理在各種拼音輸入法中皆用,學習不困難,優(yōu)于無理表達。
(9)單碼部件字為三碼單碼部件字編碼規(guī)定在單碼部件的代碼后按首筆和末筆筆形補加兩個代碼。
目前常將漢字筆畫歸并為五類,橫提合一,點捺合一,所有折筆合一,用到具體的筆畫形狀再用筆形去區(qū)分。五筆劃方法用于統(tǒng)計筆畫數(shù)和研究筆順比較方便,但是降低了區(qū)別字形的能力。雙聯(lián)碼根據(jù)需要和非字部件同形對應表達的特點,將折筆按形狀分為六類,簡捷易行,另外區(qū)分提和橫也有必要和可能。
①對于橫、豎、撇、捺、提五種筆畫,按讀音表達一-H,丨-O,丿-P,丶-N,/-T,(丨的讀音接近水,以O表達之)例字木=MHN,千=QPO,寸=CHN,廠=CHP,或=GKT。
②對漢字折筆規(guī)范中25種筆形分為六類,用同形對應法表達L形折乚ㄥㄑ-L,包括規(guī)范中5.4-5.8,5.11和5.19,例字匕=BPL;Z形折乙乁-Z,包括規(guī)范中5.12-5.14,5.16和5.22,例字幾=JPZ;半Z形折乛-Z,包括規(guī)范中5.1-5.3和5.15,例字丑=CZH,又=YZN;S形折ㄅ-S,包括規(guī)范中5.17,5.18,5.24,例字弓=GZS;撇鉤折包括規(guī)范中5.9,表達為P,即乄=PN(GBK字庫中);3形折不在編碼中獨立出現(xiàn)(5.20,5.21,5.23,5.25)。
(10)重碼識別簡單易行雙聯(lián)碼對三碼字不加補碼,只對兩碼組合字按照部件末筆筆形補加兩碼,例如全碼 找=VGTN,扛=VGTH,(扌-V,戈-G,工-G,/-T,一-H)簡碼 找=VG。
(11)平均碼長最小漢字的使用頻度是極不平衡的。根據(jù)“現(xiàn)代漢語通用字數(shù)據(jù)統(tǒng)計表”中的使用度數(shù)據(jù),可以計算出現(xiàn)代漢語通用字的使用度總和為940萬(這也是國標基本集漢字或全部漢字的使用度總和近似值)。按使用度大小由高到低排列漢字,可以計算出以下數(shù)據(jù)(此數(shù)據(jù)與蘇培成教授所著《現(xiàn)代漢字學綱要》中數(shù)據(jù)一致)使用度排列前1500個漢字的使用度之和,占漢字使用度總和的95%使用度排列前1000個漢字的使用度之和,占漢字使用度總和的90%使用度排列前500個漢字的使用度之和,占漢字使用度總和的78%使用度排列前100個漢字的使用度之和,占漢字使用度總和的42%使用度排列前50個漢字的使用度之和,占漢字使用度總和的30%使用度排列前10個漢字的使用度之和,占漢字使用度總和的14%使用度排列第一位“的”字的使用度,占漢字使用度總和的4.3%
由此可知,要減少平均碼長,最重要的是要減少高頻漢字的碼元數(shù);同時,高頻漢字不要有重碼。
雙聯(lián)碼精心配置26個一碼字,全部是超高頻字且25個有記憶依據(jù),如分-A,不-B,出-C,大-D,工-G,一-H,是-I,和-K,了-L,人-R,上-S,有-U,這-W,要-X,用-Y,中-Z,等等,的字特別按排于右手基準位置,的-J。
兩碼字位置共有676個,是重要的編碼資源。雙聯(lián)碼由于輸入兩碼組合字要補加兩個代碼構成全碼,給有計劃地按排兩碼字留出了位置。
易記兩碼字主要有三個來源雙碼部件字成于發(fā)里來力長電兩本年制重正,等等;兩碼組合字原碼作簡碼時對可主過產(chǎn)進如化休安現(xiàn)當去好字,等等;首尾簡碼前作會問動界種得行經(jīng)都自度子部法小業(yè)開方等。
通過對雙聯(lián)碼一碼字和兩碼字使用度的統(tǒng)計,可以給出以下數(shù)據(jù)一碼字使用度之和,占漢字使用度總和的20.6%(王碼19.7%,鄭碼17.4%),兩碼字使用度之和,占漢字使用度總和的48.6%(王碼35.3%,鄭碼41.2%),兩項合計,簡碼字使用度占漢字使用度總和的69.2%(王碼55%,鄭碼58.6%),即簡碼字的動態(tài)復蓋率達到69.2%,無重碼,易學易記,使用非常方便,并由此可知,在單個漢字輸入時,雙聯(lián)碼的平均碼長最小。
(12)單字輸入動態(tài)重碼率最低對基本集漢字,字庫重碼率(靜態(tài))為5.9%(王碼8%,鄭碼7.4%)。
經(jīng)計算,重碼字使用度之和為51178,重碼字使用度比率為0.54%,此即重碼字出現(xiàn)頻度亦即動態(tài)重碼率。(86王碼動態(tài)重碼率為1.3-1.8%,是雙聯(lián)碼的3倍;鄭碼——3.8%,是雙聯(lián)碼的7倍。)(13)常用詞組多重碼率低只編入常用詞組,保持輸入法低重碼率又要達到較高的覆蓋率,是一種兩全的選擇。雙聯(lián)碼-字母編碼在GB2312-80字庫中加入了21000條詞組,以通用書面用語兩字詞為主,另有三字詞、四字詞和多字詞,與一級漢字不重碼,具有較高的復蓋率,詞組重碼率為4.1%(86王碼5000詞組版,重碼率6.4%)。
用雙聯(lián)碼-字母編碼輸入漢字的速度比用拼音輸入法要快1-3倍。
雙聯(lián)碼-數(shù)字碼將雙聯(lián)碼-字母編碼按照以下的順序?qū)P系進行字母與數(shù)字的轉換,即得到數(shù)字碼A、B、C-1,D、E、F -2,G、H-3,I、J -4,K、L-5,M、N-6,O、P、Q-7,R、S、T -8,U、V、W -9,X、Y、Z-0;
轉換得到的數(shù)字碼符合GB/T18031信息技術數(shù)字鍵盤漢字輸入通用要求》,由于對雙聯(lián)碼-字母編碼進行了精心調(diào)整,轉換后的數(shù)字碼各組重碼字小于9,操作時輸入1-4個數(shù)字后即可直接選擇所需漢字,不用翻頁尋找,簡捷高效,例如漢字 編碼轉換成數(shù)字碼數(shù)字碼輸入后提示給LRHK58351給2啥3哈4喂5嗦啥KRGK5835哈KRHK5835喂KTHK5835嗦KSGL5835果GM 36 1安2果3委4禾禾HM 36安GN 36委HN 36雙聯(lián)碼直接翻頁檢字字典雙聯(lián)碼-字母編碼在以下三個方面與部首檢字法有較好的銜接①國家語委推薦的《漢字統(tǒng)一部首表(草案)》中有80%被選為編碼部件;②在編碼部件的歸并上與部首檢字法一致,如灬歸入火,歸入刀, 歸入卩,蘭字頭歸入八,反字邊歸入廠,肀歸入聿,等等;③在雙聯(lián)碼檢字法字典中,部首位于左側和上側的同部首字靠近排列,雙碼部首的字更加集中,對常用部首依據(jù)其音、形信息表達,雙聯(lián)碼檢字法可與部首檢字法對應比照。
用雙聯(lián)碼檢字法實現(xiàn)漢字字典直接翻頁檢字,速度要比用部首檢字法或筆畫法快幾倍,可以超過用英文字典查單字的速度。
在雙聯(lián)碼檢字法目錄中,雙碼部件類似于子目錄,具有如下形式(G組)G——工弓干瓜戈巛宀冖GG-艮GP-廣GU-骨GV-鬼GX-更可以從中找到部首檢字法中的宀部、弓部、戈部、艮部、廣部、骨部、鬼部、等等。字典的形式,漢字前為雙聯(lián)碼字母編碼,漢字后為漢語拼音(未注四聲)。每一個漢字,前有由拉丁字母組成的形碼表達字形信息,后有由拉丁字母組成的漢語拼音表示讀音,使?jié)h字在形、音信息的表達方面都具備科學性,適合信息社會的需要,對漢字走向世界也極其有利。這本字典的片斷如下(略去解釋)
GGT 墾kenGGWE 既jiGGWH 暨jiGGX 懇kenGGZ 退tuiGKCC 強qiangGKCN 犟jiangGKK 宮gongGKT 或huoGKTX 惑huoGP 廣guangGPAJ 廉lianGPAP 序xuGPB 庀piGPB 庳beiGU 骨guGUAN 髏louGUB 髀biGUC 冠guanGUCK 骺houGV 鬼guiGVES 魁kuiGVFN 魃baGVLR 魎liangGVLV 魑chiGX 更gengGXE 宛wanGXED 剜wanGXU 宵xiao
權利要求
1.《雙聯(lián)碼免拆高效漢字輸入技術》能使用戶只學漢字字母編碼便可以掌握字母鍵盤和數(shù)字鍵盤兩種高效的形碼輸入法,是計算機、手機、字典檢字三種漢字輸入問題的全面解決方案,其特征在于用戶在計算機漢字輸入中學會字母編碼后,即可按照最簡便的規(guī)則轉換成數(shù)字碼進行手機漢字輸入,該字母編碼又適合為漢字排序,可用以實現(xiàn)漢字字典直接翻頁檢字,于是三種漢字輸入問題通過使用雙聯(lián)碼能夠全部得到解決,分述如下(1)雙聯(lián)碼-字母編碼采用已由本人獲得國家發(fā)明專利的《漢字免拆分快速輸入法》之部件式形碼;遵守國家語委頒布的《信息處理用GB13000.1字符集漢字部件規(guī)范》,用26個字母對全部編碼部件進行有理據(jù)的表達,不需要背口訣記憶;實行漢字免拆直接編碼不學拆分規(guī)則;輸入速度高于現(xiàn)有形碼,比拼音輸入法提高1-3倍,具備規(guī)范性、快速性和易學性,能滿足學生和社會大多數(shù)用戶對漢字輸入法的需求;(2)雙聯(lián)碼-數(shù)字碼將雙聯(lián)碼-字母編碼按照下面的順序?qū)P系進行字母與數(shù)字的轉換即得A、B、C-1,D、E、F-2,G、H-3,I、J-4, K、L-5, M、N-6,0、P、Q-7,R、S、T-8,U、V、W-9,X、Y、Z-0;轉換得到的數(shù)字碼符合GB/T18031《信息技術數(shù)字鍵盤漢字輸入通用要求》,借助于對字母編碼的精心調(diào)整,數(shù)字碼各組重碼字小于9,操作中用1-4個數(shù)字進行輸入,即可直接選擇所需漢字,不用翻頁尋找,便捷、快速;(3)雙聯(lián)碼直接翻頁檢字字典雙聯(lián)碼-字母編碼在以下三個方面與部首檢字法有較好的銜接①國家語委推薦的《漢字統(tǒng)一部首表(草案)》中有80%被選為編碼部件;②在編碼部件的歸并上與部首檢字法一致,如灬歸入火,歸入刀, 歸入卩,蘭字頭歸入八,反字邊歸入廠,等等;③在雙聯(lián)碼檢字法字典中,部首位于左側和上側的同部首字靠近排列,雙碼部首的字更加集中,對常用部首依據(jù)其音、形信息表達,雙聯(lián)碼檢字法可與部首檢字法對應比照;用雙聯(lián)碼檢字法實現(xiàn)漢字字典直接翻頁檢字,速度要比用部首檢字法或筆畫法快幾倍,超過用英文字典查單字的速度;根據(jù)本發(fā)明編制的漢字輸入法軟件有三種雙聯(lián)碼-字母編碼形碼輸入法,即《漢字免拆分快速輸入法》,雙聯(lián)碼-數(shù)字碼輸入法,雙聯(lián)碼并列輸入法,將字母編碼和數(shù)字碼并列編成輸入法,供演示和學習用;雙聯(lián)碼-字母編碼中編碼部件與代碼的表達關系如下(1)用于GB2312-80基本集漢字字庫的編碼部件表-A-八卜 AA=巴 凹=AO -B-貝匕白卑勹疒 BA=不 BH=本 BP=必BT=鼻 BW=敝BX=秉匚-C_-艸-廠出川寸丑臣冊 CC=蟲 CG=成 CH=垂CN=斥 CO=串 CP=才 CS=車 CU=齒CV=長镸-D-大刀刂丁丹癶 DD=東DA=典 DH=豆DL=電 -E-阝卩兒二冫EE=耳戔=EG EX=爾=E…E -F-方豐飛缶父口 市 FF=甫 FO=弗 FR=夫FS=非 FY=發(fā)-G-工弓干瓜戈巛宀冖 GG=艮 GE=甘 GM=果GP=廣 GU=骨GV=鬼 GX=更 -H-火灬一回戶乎 HH=黑 HA=黃 HM=禾HQ=虍-I-日弋尹亠II=衣衤 IL=已 IR=夷-J-金钅及井見甲幾臼廴 乑 JJ=斤 JA=具 JD=夾JF=巨 JL-己JO=巾 JP=九 JR=久 JX=柬 -K-口開乚-L-立了林鹿纟糸幺 LL=力 LA=令 LB=龍LD=劉 LM=來LR=兩 LS=吏耒 LT=里LV=離 LX=樂冂-M-木母皿民 MM=門 MF=目 M4=馬ML=麻 MP=矛 MQ=毛 MX=末 -N-女廿農(nóng)廾 丶NN=牛牜NE=那 NP=乃NR=內(nèi) NS=年-O-水氵丨束士 OA=肅 ON=書 -P-丿 彡片爿丬 PP=皮 PR=彳 PS=平 -Q-七犬犭千丘且 QQ=僉 QA=其 OH=曲 ON=妻 QO=求QR=欠 QZ=氣-R-人亻刃冉肉 RN=入勹-S-石十世豕上三卅SS=示礻 SD=矢 SE=事 SF=罒 SL=食饣SN=SP=尸 SQ=氏 SU=山 SX=史丅-T-土田天/ TG= TQ=屯 TU=凸凵-U-月元羽聿禺禹 UU=與 UF=曰 UG=戉 UH=魚 UO=雨UO=雨 UR=臾 US=于厶-V-手扌 VV=申 VP=身 -W-王亡文夂攵瓦韋丸烏毋兀 WW=五 WE=無 WG=戊 WN=為 WP=萬WX=未乂-X-心忄小辛夕西習卌鄉(xiāng) XH=熏 XZ= 丩 -Y-言讠尢又用也業(yè)曳 YY=羊 YD=央 YH=亞 YI=酉 YO=由YP=牙 YW=堯乙 -Z-子州之中爪爫止丈辶 ZA=專 ZD=制 ZE=舟 ZO=兆 ZP= ZQ=豸 ZT=重另有歸類部件67個,代碼表達和歸類關系是A-丷(八)B- (匕)C- (廠)C- (川)C-卝(艸) C- (冊) C- (屮) C- (匚)D- リ (刂) DL- (電)E- (卩)E- (冫) E-彐F-F-(囗) F-ナ(豐)G-巜(巛) GG- H-戶(戶)I- (日)K- L- (了)L- (纟)M- N-(廿)O-氺(水)Q- () Q- S- (豕) S- (卅)T- (丅)U- (月)U- 肀(聿)UU- (與)V-(手) V- (厶)W-毌(毋) WE- (無)X-(心) X-覀(西)X-※(乂)X- (小)Y- (又) Y- (用) Y- (丩) YY- (羊)Z- (止)(2)擴展至GB13000.1字符集全部漢字,即用于GBK漢字字庫,需要增加新的編碼部件和繁簡對應編碼部件B-C- G- I-L- L- N- N-卄 S-U- U- W-攵 W- Y-帇BF-畢DD- EE- GL- HF-華ML- WE- WX-卍 WX- YM- YY-丱ZD-夨糹-纟 飠-饣-冊曱-甲甴-由襾-西貝-貝見-見 車-車長-長東-東門-門亞-亞 馬-馬烏-烏魚-魚爲為-為 飛-飛 龍-龍另有非G列漢字專用編碼部件未列出;利用上述編碼部件與代碼之間的表達關系實現(xiàn)計算機漢字編碼輸入,其規(guī)則和步驟分別是單個漢字按以下規(guī)則編碼輸入①組合字按照各構成部分之間的自然界限進行免拆直接編碼,依照筆順取前三后一四碼②單碼部件字,在單碼部件的代碼后按照首筆和末筆筆形補加兩個代碼;③雙碼部件字,兩個代碼即是其編碼;④對兩碼組合字進行補碼避重,按照編碼部件的末筆筆形補加兩個代碼;最大碼長四碼,不足四碼者在輸入時加一個空格鍵結束,輸入后如有重碼,在提示欄中挑選所需漢字;高頻漢字另有易記、無重碼的一碼簡碼或兩碼簡碼;在GB2312-80基本集漢字字庫中編有21000條詞組,按以下規(guī)則編碼輸入①兩字詞[第一字首碼][第一字末碼][第二字首碼][第二字末碼]②三字詞[第一字首碼][第二字首碼][第三字首碼][第三字末碼]⑧四字詞[第一字首碼][第二字首碼][第三字首碼][第四字首碼]④多字詞[第一字首碼][第二字首碼][第三字首碼][最末字首碼]輸入后如有重碼,在提示欄中挑選所需詞組。
全文摘要
本發(fā)明能使用戶在計算機漢字輸入中學會字母編碼后,即可方便地轉換成數(shù)字碼進行手機漢字輸入,輸入1-4個數(shù)字后直接選擇所要的漢字,不需翻頁尋找;又可編制直接翻頁檢字的漢字字典,做到只學字母編碼即可使三種漢字輸入問題全部得到解決。該字母編碼采用發(fā)明專利《漢字免拆分快速輸入法》之部件式形碼,實行免拆分直接編碼,不學拆分規(guī)則;編碼部件的表達全部有記憶依據(jù),不需要背口訣記憶;單字輸入動態(tài)重碼率僅0.54%,一碼字和兩碼字的動態(tài)覆蓋率達69.2%,輸入速度高于現(xiàn)有形碼,比拼音輸入法提高1-3倍。雙聯(lián)碼提供了規(guī)范、高效、易學的漢字輸入全面解決方案。
文檔編號G06F3/023GK1841278SQ20051002480
公開日2006年10月4日 申請日期2005年3月31日 優(yōu)先權日2005年3月31日
發(fā)明者敬永權 申請人:敬永權