專利名稱:一種新的形碼漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種新的形碼漢字輸入方法。
五筆字型在我國(guó)是一種家喻戶曉的漢字輸入方法,由于其編碼的直觀性比較好,受到用戶歡迎。但實(shí)踐證明,五筆字型存在不少問題,特別是在拆分、筆順和編碼的規(guī)范性上表現(xiàn)尤為突出。例如它將漢字拆分得過于零碎就是一個(gè)典型例子。在五筆字型中,像“犭、礻、衤、 豸”等基本偏旁部首,都要被拆成兩部分(犭 丿、礻 丶、衤 丿扌、 丿土、豸 );像“鳥、面、甫、戊”這樣一些組字部件都要被拆成四部分(鳥勹 一、面丆冂‖三、甫一月丨丶、戊廠 丶丿)。這一問題的直接后果是(1)與“語言文字規(guī)范”之間存在著尖銳矛盾;(2)漢字的拆分成為用戶學(xué)習(xí)使用的一大難點(diǎn);(3)字根的信息量減小,因而重碼率增大。
五筆字型還在字型分類、簡(jiǎn)碼選取及拆分方法等方面存在問題。
五筆字型的問題影響了它的易學(xué)性和易用性,對(duì)于普及十分不利。
98年軟件業(yè)又推出了98王碼,98王碼是為了解決“字根和筆畫順序不符合國(guó)家語言文字規(guī)范”的問題而提出的,但它自98年推向社會(huì)以來,一直沒有受到用戶青睞,這是因?yàn)樗嬖谙铝袉栴}第一、98王碼并沒有很好地解決漢字拆分過碎等不符合語言文字規(guī)范的問題,像“ 馬、豕、曲、 等組字部件,在98王碼中不但仍要被拆分,有的甚至比五筆字型拆得更零碎(例如部件“ ”,在五筆字型中被拆成三部分 一,在98王碼中被拆成四部分_一 一)第二、98王碼在增刪字根時(shí),沒有兼顧到重碼率的降低問題,所以98王碼系統(tǒng)的重碼幾率較高,容納的詞組量較少,許多常用詞組(如;“真理、贊成”等)不能用詞組碼輸入;第三、98王碼中的漢字拆分和編碼方法(即所謂“無拆分編碼法”和“補(bǔ)碼碼元”法)的規(guī)律性和規(guī)范性很差,有很大的主觀人為性,反而不如五筆字型容易學(xué)習(xí)和使用;第四、98王碼不兼容五筆字型,在98王碼中去掉的字根、新增的字根及調(diào)換位置的字根共60個(gè),凡與這些字根有關(guān)的字詞,在98王碼中均不能用五筆字型的編碼輸入,這是廣大五筆字型的老用戶向98王碼過渡的一個(gè)難以逾越的鴻溝。
總之,98王碼雖然在字根和筆順的規(guī)范性上有所改進(jìn),但并不理想。由于沒有顧及到兼容性和易學(xué)性等問題,使它很難得到用戶認(rèn)可。
本發(fā)明的目的是針對(duì)五筆字型和98王碼存在的上述問題,在兼顧了“規(guī)范性、兼容性、易學(xué)性、高效性”的原則下而提出的一種能夠使形碼輸入方法與傳統(tǒng)漢字文化緊密結(jié)合起來,真正做到易學(xué)、易用、易推廣的新的形碼漢字輸入方法。
本發(fā)明的目的是通過以下方式實(shí)現(xiàn)的本發(fā)明采用標(biāo)準(zhǔn)鍵盤,將26個(gè)英文字母全部用來進(jìn)行編碼,其特征是本發(fā)明將26個(gè)編碼鍵劃分成六個(gè)區(qū),分別稱為1區(qū)、2區(qū)、3區(qū)、4區(qū)、5區(qū)和0區(qū),前五個(gè)區(qū)每區(qū)包括五個(gè)鍵,分別命以鍵位號(hào)1、2、3、4、5,0區(qū)只有一個(gè)鍵,鍵位號(hào)為0,一個(gè)編碼鍵的區(qū)號(hào)和位號(hào)的連寫便是該鍵的區(qū)位號(hào),區(qū)位號(hào)與編碼鍵的對(duì)應(yīng)關(guān)系是1區(qū)11-G、12-F、13-D、14-S、15-A2區(qū)21-H、22-J、23-K、24-L、25-M3區(qū)31-T、32-R、33-E、34-W、35-Q4區(qū)41-Y、42-U、43-I、44-O、45-P5區(qū)51-N、52-B、53-V、54-C、55-X0區(qū)00-Z1區(qū)、2區(qū)、3區(qū)、4區(qū)和5區(qū)的25個(gè)鍵對(duì)應(yīng)著本發(fā)明的全部字根,故稱為字根鍵盤,其對(duì)應(yīng)關(guān)系是G王( )、一( )、_、戔、五F土(_)、二、(=、 )、十( )、寸、雨、 干、士、 D大、三、廠、石、戊、羊、古、犬、_、ナ、 S木( )、丁( )、西(覀)、 A工、匚( )、七( )、戈、 犭、艸、廿、 H目、丨(亅)、上、止( )、卜、 J日、‖、刂、 曰、 早、蟲K口、 川L田、甲、口、四 皿、力、車、 M山、冂 由、貝、曲、 幾 T禾( )、丿、_、毛、_、 攵、夂 彳;
R白、 手、_( )、扌、丘、斤、 E月、彡、乃、用、 豸、豕、 W人、八、亻、 Q金、勹(ク、 钅、夕、 兒 Y言、_(丶)、讠、文、方、廣、亠、 U立、冫( 丬( 辛、疒、六( )、門I水、氵、 小( O火、灬、米、 業(yè)、 ※;P之、冖、辶、礻、衤、宀、廴;N已、乙、_( )、己( )、巳( )、尸、 羽、 心、忄、 B子、 了、凵、卩、阝、孑、也、耳;V女、巛、九、刀、 彐( )、 臼C又、厶、 巴、馬、 X幺、纟、 母、 毋、 、艮、 弓、匕 每個(gè)字母所對(duì)應(yīng)的第一個(gè)字根是該字母鍵的中文鍵名,0區(qū)對(duì)應(yīng)著本發(fā)明的擴(kuò)展碼,稱為擴(kuò)展鍵,擴(kuò)展鍵的中文鍵名是漢字“零”;每個(gè)字根所對(duì)應(yīng)的編碼鍵的區(qū)位號(hào)稱為該字根的字根碼,一個(gè)筆畫所對(duì)應(yīng)的單筆字根的字根碼叫做該筆畫的筆畫碼在漢字的結(jié)構(gòu)分類上,本發(fā)明將漢字分為單體字與散體字,單體字包括單根字和字根之間交連成一體的復(fù)根字,散體字是以字根或單體字作為組字單元、并且它們之間是以離散的關(guān)系組合而成的漢字,散體字包括左右結(jié)構(gòu)、上下結(jié)構(gòu)、半包圍結(jié)構(gòu)和全包圍結(jié)構(gòu)四種結(jié)構(gòu)類型;在漢字的拆分上,本發(fā)明根據(jù)其是單體字還是散體字,采用以下原則進(jìn)行拆分單體字(指復(fù)根單體字)的拆分原則a.若字的首筆與次筆可構(gòu)成一個(gè)字根,其余部分也是一個(gè)字根,且這兩個(gè)字根連而不交,則將它的前兩筆拆為第一字根,剩余的部分作為第二字根;b.要拆分的單體字若不具備上述特點(diǎn),但其首筆與其它筆畫連而不交,且去掉首筆后剩余的部分是一個(gè)字根,則將它的首筆畫拆為第一字根,剩余部分作為第二字根;c.要拆分的單體字不具備上述兩個(gè)特點(diǎn),則依據(jù)筆畫的書寫順序,以每次取一個(gè)盡可能大的字根(即筆畫盡可能多的字根)為原則進(jìn)行拆分;散體字的拆分原則散體字拆分時(shí),如果字中含有離散的字根,首先將它拆出來,然后再將剩下的單體字進(jìn)行拆分,最后將拆分的所有字根按它們的首筆畫的書寫順序排序即得拆分結(jié)果;本發(fā)明在編碼規(guī)則上,針對(duì)鍵名字、單根字、復(fù)根字和詞組設(shè)定了不同的規(guī)則a.鍵名的編碼規(guī)則將鍵名的字根碼重復(fù)取四次;b.單根字的編碼規(guī)則(鍵名除外)(1)筆畫在三筆以上的單根字,其編碼是
字根碼+首筆筆畫碼+次筆筆畫碼+末筆筆畫碼(2)筆畫為兩筆的單根字,其編碼是字根碼+首筆筆畫碼+末筆筆畫碼(3)以下五種單筆畫要在字根碼和筆畫碼之后加兩個(gè)L,即為一11 11 24 24/GGLL丨21 21 24 24/HHLL丿31 31 24 24/TTLL丶41 41 24 24/YYLL乙51 51 24 24/NNLLc.復(fù)根字的編碼規(guī)則本發(fā)明將漢字的筆畫分為五種橫、豎、撇、捺、折,并分別命以筆畫代號(hào)1、2、3、4、5,同時(shí)將復(fù)根字分為三種字型左右型、上下型、雜合型,分別命以字型代號(hào)1、2、3,由復(fù)根字的末根的末筆筆畫代號(hào)與其字型代號(hào)組成的兩位數(shù)編碼稱為識(shí)別碼,對(duì)復(fù)根字采取以下編碼規(guī)則(1)雙根字的編碼規(guī)則是第一字根碼+第二字根碼+識(shí)別碼(2)三根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+識(shí)別碼(3)多根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+末根碼;d.詞組的編碼規(guī)則
(1)雙字詞的輸入碼是由其每個(gè)字的前兩個(gè)碼組成(2)三字詞的輸入碼是前兩個(gè)字各取第一碼,最后一個(gè)字取其前兩個(gè)碼組成(3)多字詞的輸入碼是由第一、第二、第三及最末一個(gè)字的第一字根碼組成;本發(fā)明為單字設(shè)定了二級(jí)簡(jiǎn)碼和三級(jí)簡(jiǎn)碼,二級(jí)簡(jiǎn)碼由其全碼的前兩個(gè)碼組成,三級(jí)簡(jiǎn)碼由其全碼的前三個(gè)碼組成;本發(fā)明在設(shè)定簡(jiǎn)碼時(shí)遵循以下原則a.簡(jiǎn)碼優(yōu)先常用字,即在前兩碼或前三碼相同的字中,選擇使用頻度最高的字享受二級(jí)簡(jiǎn)碼或三級(jí)簡(jiǎn)碼;b.在使用頻度相同的情況下,二級(jí)簡(jiǎn)碼優(yōu)先雙根字,三級(jí)簡(jiǎn)碼優(yōu)先三根字;c.一個(gè)字如果享受了二級(jí)簡(jiǎn)碼就不再享受三級(jí)簡(jiǎn)碼;本發(fā)明通過擴(kuò)展碼Z的參與編碼,構(gòu)成了一整套的擴(kuò)展簡(jiǎn)碼,擴(kuò)展簡(jiǎn)碼分為一級(jí)擴(kuò)展簡(jiǎn)碼、二級(jí)擴(kuò)展簡(jiǎn)碼和三級(jí)擴(kuò)展簡(jiǎn)碼,其編碼規(guī)則是a.一級(jí)擴(kuò)展簡(jiǎn)碼選定的高頻漢字為78個(gè),并分為三級(jí)一級(jí)擴(kuò)展簡(jiǎn)碼、二級(jí)擴(kuò)展簡(jiǎn)碼、三級(jí)擴(kuò)展簡(jiǎn)碼,每一級(jí)包含26個(gè)字,一級(jí)高頻字是指那些最常用的漢字,包括有五筆字型中的25個(gè)高頻字和一個(gè)“特”字,“特”的一級(jí)簡(jiǎn)碼是“Z”;二級(jí)高頻字主要是指一些沒有簡(jiǎn)碼的常用雙根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和一個(gè)與該字無關(guān)的擴(kuò)展碼“Z”組成;三級(jí)高頻字主要是一些沒有簡(jiǎn)碼的常用三根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和2個(gè)擴(kuò)展碼“Z”組成;b.二級(jí)擴(kuò)展簡(jiǎn)碼二級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的雙根字的字根碼再加擴(kuò)展碼組成,其編碼規(guī)則是國(guó)標(biāo)一級(jí)漢字第一字根碼+第二字根碼+Z國(guó)標(biāo)二級(jí)漢字第一字根碼+第二字根碼+Z+Z;c.三級(jí)擴(kuò)展簡(jiǎn)碼三級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的三根字的三個(gè)字根再加一個(gè)擴(kuò)展碼“Z”組成;在重碼序的處理上,本發(fā)明采取以下原則a.將使用頻度高的字或詞放在第一位置b.重碼字中有簡(jiǎn)碼的字將第一位置讓位給沒有簡(jiǎn)碼的常用字c.常用字與詞組重碼時(shí),常用字放第一位置d.不常用字與詞組重碼時(shí),詞組放第一位置;本發(fā)明為20個(gè)生僻字設(shè)立了反常末尾碼,這20個(gè)生僻字的正常編碼與常用詞組重碼,反常末尾碼是將該字編碼的最后一個(gè)碼用“L”替換,這20個(gè)字是嗇揄洹綞綹瑾韙榫樗殮罅舴趔跗鳘毹旌罹窨窳;本發(fā)明為單字和詞組設(shè)定了混編容錯(cuò)碼,混編容錯(cuò)碼由部分本發(fā)明的字根碼和部分五筆字型的字根碼組成;在本發(fā)明中26個(gè)英文字母全部用來進(jìn)行編碼,而用“/”鍵作為查詢鍵。由于本發(fā)明對(duì)字根、拆分、筆順、字型、簡(jiǎn)碼及重碼序等進(jìn)行了全面規(guī)范和優(yōu)化,并增加了擴(kuò)展簡(jiǎn)碼和混編容錯(cuò)碼等功能,故它具有以下主要特點(diǎn)
1.規(guī)范性好本發(fā)明規(guī)范化的字根與漢字構(gòu)字部件相一致,較好地解決了漢字拆分與“語言文字規(guī)范”之間的矛盾,像“犭、礻、衤、 母、 羊、戊、 曲、 等組字部件都是字根,不再拆分,基本上消除了漢字拆分過碎的問題。從下面的對(duì)比例子可見一斑漢字五筆拆分結(jié)果本發(fā)明拆分結(jié)果狠 丿彐 犭艮祥 礻羊襤 ‖ _丶皿 衤‖ 皿每 _ 一 _母敝 冂小攵攵 茂 艸廠丶丿艸戊甫 一丨丶 寒 宀二‖一八宀 八 告 丿土口口典 冂 八八面 丆冂‖三 丆 段 亻三幾又 幾又假 亻_丨二 又亻 又那 刀二阝 阝堯 七丿一兒 一兒舞一夕匚丨夕匚丨2.輸入速度快在本發(fā)明中,由于字根的信息量增大,加之對(duì)增刪的字根嚴(yán)格按低重碼率原則加以篩選定位,使得重碼率明顯降低。下面的幾個(gè)統(tǒng)計(jì)實(shí)例可說明這一點(diǎn)(1)將“P”鍵上的字根“ ”用“衤礻”替代后,在相關(guān)的260個(gè)字詞中,重碼數(shù)由44降為24;(2)去掉“Q”鍵上的字根“ ”,并在“A”鍵上增加字根“犭”,在相關(guān)的162個(gè)字詞中,重碼數(shù)由36降為15;(3)在“F”鍵上增加字根“ ”,在相關(guān)的75個(gè)字詞中,重碼數(shù)由原來的15降為3;(4)在“E”鍵上增加字根“ ”,在相關(guān)的152個(gè)字詞中,重碼數(shù)由原來的42降為4。
本發(fā)明的低重碼率的特點(diǎn),使它可以容納更多的詞組。所以本發(fā)明提供給用戶三萬多條詞組,比五筆字型和98王碼都要多得多,幾乎覆蓋了全部常用詞匯和成語。
極低的重碼率、大數(shù)量的詞組、科學(xué)的重碼序、以及新增的擴(kuò)展簡(jiǎn)碼和反常碼等功能,都使本發(fā)明的輸入速度進(jìn)一步得到提高。下面四個(gè)例子可以說明這一點(diǎn)(1)輸入詞組“贊成”,98王碼沒有這個(gè)詞組,須用單字的編碼分兩次輸入;用五筆輸入,鍵入詞組的編碼“tfdn”后,“贊成”并不出現(xiàn)在屏幕上,而是在提示行中列出三個(gè)重碼詞組
1.造成2.贊成3.千萬這時(shí)須按選擇數(shù)字鍵2才能完成輸入;若用本發(fā)明的方法輸入,鍵入編碼“eqdn”后,“贊成”立即出現(xiàn)在屏幕上。
(2)輸入“猬”字,用五筆或98王碼輸入,鍵入編碼“qtle”后,在提示行上出現(xiàn)兩個(gè)重碼字1.猥2.猬須再按數(shù)字鍵2完成輸入;若用本發(fā)明的方法輸入,鍵入編碼“ale”后,“猬”立即出現(xiàn)在屏幕上。
(3)輸入詞組“真理”,98王碼中沒有這個(gè)詞組,須用單字的編碼分兩次輸入;用五筆輸入,鍵入編碼“fhgj”后,在提示行中列出重碼字詞1.趔2.真理須再按選擇數(shù)字鍵2才能完成輸入;若用本發(fā)明的方法輸入,鍵入編碼“fhgj”后,“真理”立即出現(xiàn)在屏幕上。
(4)輸入“運(yùn)轉(zhuǎn)”,98王碼中沒有這個(gè)詞組,須用單字的編碼分兩次輸入;用五筆輸入,鍵入編碼“fclf”后,出現(xiàn)兩個(gè)重碼字詞1.盍2.運(yùn)轉(zhuǎn)須再按數(shù)字鍵2完成輸入;若用本發(fā)明的方法輸入,鍵入編碼“fclf”后,在提示行上也出現(xiàn)二個(gè)重碼詞字1.運(yùn)轉(zhuǎn)2.盍但“運(yùn)轉(zhuǎn)”在第一位置上,不用敲選擇數(shù)字鍵,當(dāng)輸入下文時(shí),它自動(dòng)出現(xiàn)在屏幕上。
3.易學(xué)易用易推廣本發(fā)明的輸入法由于解決了字根、拆分、筆順、字型等的規(guī)范化問題,因而大大降低了漢字拆分與編碼的難度,使得漢字拆分不再成為學(xué)習(xí)的難點(diǎn),使得編碼完全符合人們對(duì)漢字的直觀認(rèn)識(shí)和書寫習(xí)慣,這些都十分便于用戶學(xué)習(xí)和使用。
很多字,在五筆下拆分很困難,而在本發(fā)明的方法下,它們的字根組成非常明顯直觀,拆分起來十分簡(jiǎn)單。如單字五筆拆分結(jié)果本發(fā)明的拆分結(jié)果博十一 丨丶寸十 丶寸島勹丶 山 山咸廠一口 丶丿 戊一口面丆冂‖三丆 狠 丿彐 犭艮舞 一夕匚丨 夕匚丨由于本發(fā)明具有混編容錯(cuò)功能,這使廣大熟悉五筆字型的用戶可以“自然流暢”地過渡到本發(fā)明。他們?cè)谙虮景l(fā)明過渡時(shí),很可能部分編碼是本發(fā)明的,部分編碼是五筆字型的,例如,當(dāng)輸入“狠”時(shí),記住了本發(fā)明的字根“犭”但還沒有記住本發(fā)明的字根“艮”,編碼就是avey,或者記住了“艮”而沒有記住“犭”,編碼就是qtxy,本發(fā)明的混編容錯(cuò)功能使這些混合編碼都能正常輸入。這樣,五筆字型的用戶可以在不影響使用的情況下,通過邊用邊學(xué),逐步地、自然而然地掌握本發(fā)明的方法。所以本發(fā)明不僅容易在初學(xué)者中推廣,也容易在五筆字型的用戶中推廣。
本發(fā)明的新拆分方法更進(jìn)一步地為初學(xué)者解決了漢字拆分難的問題。五筆字型的拆分方法是“取大優(yōu)先,兼顧直觀,能連不交,能散不連”。這種拆分方法顯然很不嚴(yán)謹(jǐn),有主觀人為性。98王碼“創(chuàng)造”了一個(gè)所謂“無拆分編碼法”的新原則,即在編碼時(shí)“利用漢字作為平面圖形文字在認(rèn)知中的視覺優(yōu)勢(shì),直接為碼元編碼”。這實(shí)際上也是一種拆分方法。按照這個(gè)方法,98王碼將“萬、束、耒、豐”四個(gè)字拆分成萬一勹束木口耒二木豐三丨這種拆分顯然具有很大的主觀人為性,不同的人完全可以有不同的認(rèn)知。例如,既然“束”可以認(rèn)知成“木口”,那么將“耒”認(rèn)知成“木二”豈不更合理,為什么要認(rèn)知成“二木” 又如,按照“耒”認(rèn)知成“二木”的道理,“豐”不是應(yīng)該認(rèn)知成“二十”,而為什么又認(rèn)知成“三丨”呢 所以,這種主觀“認(rèn)知”的“無拆分編碼法”既不科學(xué),又不嚴(yán)密,只能給編碼造成混亂,給學(xué)習(xí)帶來困難。
根據(jù)本發(fā)明的新拆分方法,上面四個(gè)字只要按照筆畫的書寫順序依次寫出筆畫盡可能多的字根即完成拆分萬丆 束一口小耒三小豐三丨這里沒有任何含糊和二異的問題。
附圖
圖1為本發(fā)明的字根鍵位示意圖;圖2為本發(fā)明的漢字拆分流程圖;圖3為本發(fā)明的一級(jí)擴(kuò)展簡(jiǎn)碼的一級(jí)高頻字鍵位示意圖;圖4為本發(fā)明的一級(jí)擴(kuò)展簡(jiǎn)碼的二級(jí)高頻字鍵位示意圖;圖5為本發(fā)明的一級(jí)擴(kuò)展簡(jiǎn)碼的三級(jí)高頻字鍵位示意圖。
權(quán)利要求
1.一種新的形碼漢字輸入方法,它采用標(biāo)準(zhǔn)鍵盤,將26個(gè)英文字母全部用來進(jìn)行編碼,其特征是本發(fā)明將26個(gè)編碼鍵劃分成六個(gè)區(qū),分別稱為1區(qū)、2區(qū)、3區(qū)、4區(qū)、5區(qū)和0區(qū),前五個(gè)區(qū)每區(qū)包括五個(gè)鍵,分別命以鍵位號(hào)1、2、3、4、5,0區(qū)只有一個(gè)鍵,鍵位號(hào)為0,一個(gè)編碼鍵的區(qū)號(hào)和位號(hào)的連寫便是該鍵的區(qū)位號(hào),區(qū)位號(hào)與編碼鍵的對(duì)應(yīng)關(guān)系是1區(qū)11-G、12-F、13-D、14-S、15-A2區(qū)2l-H、22-J、23-K、24-L、25-M3區(qū)31-T、32-R、33-E、34-W、35-04區(qū)41-Y、42-U、43-I、44-0、45-P5區(qū)51-N、52-B、53-V、54-C、55-XO區(qū)00-Z1區(qū)、2區(qū)、3區(qū)、4區(qū)和5區(qū)的25個(gè)鍵對(duì)應(yīng)著本發(fā)明的全部字根,故稱為字根鍵盤,其對(duì)應(yīng)關(guān)系是G王(王)、一( )、_、戔、五;F土(_)、二、(=、 )、十( )、寸、雨、 干、士、 D大、三、廠、石、戊、羊、古、犬、丆、ナ、 S木( )、丁( )、西(覀)、 A工、匸( )、七( )、戈、 犭、艸、廿、 H目、丨(_)、上、止( )、卜、 _;J日、‖、刂、 曰、 早、蟲;K口、 川L田、甲、口、四( )、 皿、力、車、 M山、冂 由、貝、曲、 幾 T禾( )、丿、_、毛、_、 攵、夂( )、 彳;R白、 手、_( )、扌、丘、斤、 E月、彡、乃、用、 豸、豕、 W人、八、亻、 Q金、勹(ク、 )、钅、夕、 兒( )、 Y言、_(丶)、讠、文、方、廣、亠、 U立、冫( 冫)、 丬( )、 辛、疒、六( )、門;I水、氵、 小( )、 O火、灬、米、 業(yè)、 ※;P之、冖、辶、礻、衤、宀、廴;N已、乙、_( )、己( )、巳( )、尸、 羽、 心、忄、 B子、 了、凵、卩、阝、孑、也、耳;V女、巛、九、刀、 彐( )、 C又、厶、 巴、馬、 X幺、纟、 母、 毋、 艮、 弓、匕 每個(gè)字母所對(duì)應(yīng)的第一個(gè)字根是該字母鍵的中文鍵名,0區(qū)對(duì)應(yīng)著本發(fā)明的擴(kuò)展碼,稱為擴(kuò)展鍵,擴(kuò)展鍵的中文鍵名是漢字“零”;每個(gè)字根所對(duì)應(yīng)的編碼鍵的區(qū)位號(hào)稱為該字根的字根碼,一個(gè)筆畫所對(duì)應(yīng)的單筆字根的字根碼叫做該筆畫的筆畫碼;在漢字的結(jié)構(gòu)分類上,本發(fā)明將漢字分為單體字與散體字,單體字包括單根字和字根之間交連成一體的復(fù)根字,散體字是以字根或單體字作為組字單元、并且它們之間是以離散的關(guān)系組合而成的漢字,散體字包括左右結(jié)構(gòu)、上下結(jié)構(gòu)、半包圍結(jié)構(gòu)和全包圍結(jié)構(gòu)四種結(jié)構(gòu)類型;在漢字的拆分上,本發(fā)明根據(jù)其是單體字還是散體字,采用以下原則進(jìn)行拆分單體字(指復(fù)根單體字)的拆分原則a.若字的首筆與次筆可構(gòu)成一個(gè)字根,其余部分也是一個(gè)字根,且這兩個(gè)字根連而不交,則將它的前兩筆拆為第一字根,剩余的部分作為第二字根;b.要拆分的單體字若不具備上述特點(diǎn),但其首筆與其它筆畫連而不交,且去掉首筆后剩余的部分是一個(gè)字根,則將它的首筆畫拆為第一字根,剩余部分作為第二字根;c.要拆分的單體字不具備上述兩個(gè)特點(diǎn),則依據(jù)筆畫的書寫順序,以每次取一個(gè)盡可能大的字根(即筆畫盡可能多的字根)為原則進(jìn)行拆分;散體字的拆分原則散體字拆分時(shí),如果字中含有離散的字根,首先將它拆出來,然后再將剩下的單體字進(jìn)行拆分,最后將拆分的所有字根按它們的首筆畫的書寫順序排序即得拆分結(jié)果;本發(fā)明在編碼規(guī)則上;針對(duì)鍵名字、單根字、復(fù)根字和詞組設(shè)定了不同的規(guī)則a.鍵名的編碼規(guī)則將鍵名的字根碼重復(fù)取四次;b.單根字的編碼規(guī)則(鍵名除外)(1)筆畫在三筆以上的單根字,其編碼是字根碼+首筆筆畫碼+次筆筆畫碼+末筆筆畫碼(2)筆畫為兩筆的單根字,其編碼是字根碼+首筆筆畫碼+末筆筆畫碼(3)以下五種單筆畫要在字根碼和筆畫碼之后加兩個(gè)L,即為一11 11 24 24/GGLL丨21 21 24 24/HHLL丿31 31 24 24/TTLL、41 41 24 24/YYLL乙51 51 24 24/NNLLc.復(fù)根字的編碼規(guī)則本發(fā)明將漢字的筆畫分為五種橫、豎、撇、捺、折,并分別命以筆畫代號(hào)1、2、3、4、5,同時(shí)將復(fù)根字分為三種字型左右型、上下型、雜合型,分別命以字型代號(hào)1、2、3,由復(fù)根字的末根的末筆筆畫代號(hào)與其字型代號(hào)組成的兩位數(shù)編碼稱為識(shí)別碼,對(duì)復(fù)根字采取以下編碼規(guī)則(1)雙根字的編碼規(guī)則是第一字根碼+第二字根碼+識(shí)別碼(2)三根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+識(shí)別碼(3)多根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+末根碼;d.詞組的編碼規(guī)則(4)雙字詞的輸入碼是由其每個(gè)字的前兩個(gè)碼組成(5)三字詞的輸入碼是前兩個(gè)字各取第一碼,最后一個(gè)字取其前兩個(gè)碼組成(6)多字詞的輸入碼是由第一、第二、第三及最末一個(gè)字的第一字根碼組成;本發(fā)明為單字設(shè)定了二級(jí)簡(jiǎn)碼和三級(jí)簡(jiǎn)碼,二級(jí)簡(jiǎn)碼由其全碼的前兩個(gè)碼組成,三級(jí)簡(jiǎn)碼由其全碼的前三個(gè)碼組成;本發(fā)明在設(shè)定簡(jiǎn)碼時(shí)遵循以下原則a.簡(jiǎn)碼優(yōu)先常用字,即在前兩碼或前三碼相同的字中,選擇使用頻度最高的字享受二級(jí)簡(jiǎn)碼或三級(jí)簡(jiǎn)碼;b.在使用頻度相同的情況下,二級(jí)簡(jiǎn)碼優(yōu)先雙根字,三級(jí)簡(jiǎn)碼優(yōu)先三根字;c.一個(gè)字如果享受了二級(jí)簡(jiǎn)碼就不再享受三級(jí)簡(jiǎn)碼;本發(fā)明通過擴(kuò)展碼Z的參與編碼,構(gòu)成了一整套的擴(kuò)展簡(jiǎn)碼,擴(kuò)展簡(jiǎn)碼分為一級(jí)擴(kuò)展簡(jiǎn)碼、二級(jí)擴(kuò)展簡(jiǎn)碼和三級(jí)擴(kuò)展簡(jiǎn)碼,其編碼規(guī)則是a.一級(jí)擴(kuò)展簡(jiǎn)碼選定的高頻漢字為78個(gè),并分為三級(jí)一級(jí)擴(kuò)展簡(jiǎn)碼、二級(jí)擴(kuò)展簡(jiǎn)碼、三級(jí)擴(kuò)展簡(jiǎn)碼,每一級(jí)包含26個(gè)字,一級(jí)高頻字是指那些最常用的漢字,包括有五筆字型中的25個(gè)高頻字和一個(gè)“特”字,“特”的一級(jí)簡(jiǎn)碼是“Z”;二級(jí)高頻字主要是指一些沒有簡(jiǎn)碼的常用雙根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和一個(gè)與該字無關(guān)的擴(kuò)展碼“Z”組成;三級(jí)高頻字主要是一些沒有簡(jiǎn)碼的常用三根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和2個(gè)擴(kuò)展碼“Z”組成;b.二級(jí)擴(kuò)展簡(jiǎn)碼二級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的雙根字的字根碼再加擴(kuò)展碼組成,其編碼規(guī)則是國(guó)標(biāo)一級(jí)漢字第一字根碼+第二字根碼+Z國(guó)標(biāo)二級(jí)漢字第一字根碼+第二字根碼+Z+Z;c.三級(jí)擴(kuò)展簡(jiǎn)碼三級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的三根字的三個(gè)字根再加一個(gè)擴(kuò)展碼“Z”組成;在重碼序的處理上,本發(fā)明采取以下原則a.將使用頻度高的字或詞放在第一位置b.重碼字中有簡(jiǎn)碼的字將第一位置讓位給沒有簡(jiǎn)碼的常用字c.常用字與詞組重碼時(shí),常用字放第一位置d.不常用字與詞組重碼時(shí),詞組放第一位置。
2.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是本發(fā)明為20個(gè)生僻字設(shè)立了反常末尾碼,反常末尾碼是將該字編碼的最后一個(gè)碼用“L”替換,這20個(gè)字是嗇揄洹綞綹瑾韙榫樗殮罅舴趔跗鳘毹旌罹窨窳。
3.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是本發(fā)明為單字和詞組設(shè)定了混編容錯(cuò)碼,混編容錯(cuò)碼由部分本發(fā)明的字根碼和部分五筆字型的字根碼組成。
4.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是用“/”鍵作為查詢鍵。
全文摘要
本發(fā)明涉及一種新的形碼漢字輸入方法,它采用標(biāo)準(zhǔn)鍵盤,將26個(gè)英文字母鍵全部用來進(jìn)行編碼,而用“/”作為查詢鍵,本發(fā)明對(duì)字根、拆分、筆順、字型、簡(jiǎn)碼及重碼序等進(jìn)行了全面地規(guī)范和優(yōu)化,并增加了擴(kuò)展簡(jiǎn)碼、反常碼和混編容錯(cuò)碼等功能,大大提高了漢字的輸入速度,真正做到了易學(xué)、易用、易推廣,十分便于用戶的學(xué)習(xí)和使用。
文檔編號(hào)G06F3/023GK1306237SQ0011918
公開日2001年8月1日 申請(qǐng)日期2000年7月6日 優(yōu)先權(quán)日2000年7月6日
發(fā)明者劉春榮 申請(qǐng)人:劉春榮