專利名稱:元根碼漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種新的、利用規(guī)范的漢字部件進(jìn)行編碼的元根碼漢字輸入方法,屬于形碼漢字輸入方法的范疇。
在過去的二十多年里,我國(guó)漢字輸入技術(shù)雖然有了長(zhǎng)足進(jìn)步,但還有些根本性的問題亟待解決,其中最主要的是以下兩大難題1.將“規(guī)范、易學(xué)、高效、兼容”集于一種輸入方法20世紀(jì)八十年代以來,我國(guó)出現(xiàn)了萬“碼”奔騰的局面,涌現(xiàn)出眾多的漢字輸入方法,其中與漢字文化相聯(lián)系的形碼輸入方法主要有兩種五筆字型和鄭碼。五筆字型雖然比較容易學(xué)習(xí),并且擁有很多用戶,卻存在著不規(guī)范問題,即它在拆分和筆順方面與國(guó)家語言文字規(guī)范之間存在尖銳矛盾,因而受到學(xué)術(shù)界和教育界的批評(píng)和排斥;鄭碼雖然規(guī)范性比較好,但不易學(xué)習(xí)掌握,故難以推廣。針對(duì)這一問題,人們也曾推出新的形碼方案(如“98王碼”),但由于在易學(xué)、效率、兼容等方面存在諸多問題,很少有人問津。所以,漢字輸入方法進(jìn)入中小學(xué)課堂的問題一直沒能解決,這表明漢字鍵盤文化尚未建立。對(duì)我們中華民族的文化事業(yè),這不能不說是一個(gè)十分嚴(yán)峻的問題。
建立民族鍵盤文化,關(guān)系到漢字的現(xiàn)代化,也是一百多年來中國(guó)人夢(mèng)寐以求的事。計(jì)算機(jī)的出現(xiàn)為實(shí)現(xiàn)這一夢(mèng)想提供了可能,而二十多年的實(shí)踐證明,要真正在我國(guó)建立起漢字鍵盤文化,關(guān)鍵是要根據(jù)漢字的構(gòu)字理論和認(rèn)知規(guī)律,按照信息化原則開發(fā)出一種集“規(guī)范、易學(xué)、高效、兼容”于一身的形碼漢字輸入方法。這是漢字編碼領(lǐng)域中第一個(gè)亟待解決的重大課題。
2.特殊字符快速盲打所謂特殊字符,是指國(guó)標(biāo)第一區(qū)至國(guó)標(biāo)第九區(qū)中常用的數(shù)學(xué)符號(hào)、單位符號(hào)、數(shù)字序號(hào)、拉丁字母、日文假名、漢語拼音的四聲韻母等。在漢字輸入中,這些特殊字符經(jīng)常遇到。例如,在文稿中遇到下列文字今天的氣溫是12℃①R1≈100Ω,R2≠1KΩ,R3≥1KΩ∵ΔABC∽ΔDEF∴∠α=∠β就涉及到℃①≈≠≥Ω∵∴Δ∽∠αβ等特殊字符,它們跟漢字一樣,都是鍵盤上沒有的圖形符號(hào),但它們又與漢字不同,不能像漢字那樣直接根據(jù)其形或音進(jìn)行編碼輸入。特殊字符可以用區(qū)位碼輸入,但區(qū)位碼是一種死記硬背的序號(hào)碼,很難學(xué)習(xí)和使用。為了方便特殊符號(hào)的輸入,人們?cè)诳招乃嫉叵肓瞬簧俎k法,例如Windows提供的“軟鍵盤”功能和Word提供的“插入特殊符號(hào)”功能,都為輸入它們提供了方便。但這些辦法終究都是通過查表的方法來實(shí)現(xiàn)輸入的,沒有從快速盲打這一根本角度上解決問題,所以,特殊字符的輸入,一直是十分麻煩和費(fèi)時(shí)的事,它是進(jìn)一步提高漢字輸入速度的瓶頸。要實(shí)現(xiàn)特殊字符的快速盲打,就要為它們提供一種特殊編碼,這種特殊編碼必須是不用死記、人們很容易接受和掌握的。在過去的二十多年里,多少人試圖建立特殊字符的這種編碼,但都未能成功。所以,特殊字符的快速盲打是漢字輸入技術(shù)中的一個(gè)一直未能解決、而又亟待解決的歷史難題。
本發(fā)明正是基于建立漢字鍵盤文化的宗旨,為解決漢字編碼領(lǐng)域的這兩大難題,提出了一種稱為元根碼的漢字輸入方法。
本發(fā)明的目的是通過以下方式實(shí)現(xiàn)的本發(fā)明采用標(biāo)準(zhǔn)鍵盤,將26個(gè)英文字母全部用來進(jìn)行編碼,其特征是本發(fā)明將26個(gè)編碼鍵劃分成六個(gè)區(qū),分別稱為1區(qū)、2區(qū)、3區(qū)、4區(qū)、5區(qū)和0區(qū),前五個(gè)區(qū)每區(qū)包括五個(gè)鍵,每區(qū)的五個(gè)鍵分別命以鍵位號(hào)1、2、3、4、5,0區(qū)是元根碼的編碼“特區(qū)”,只有一個(gè)鍵,鍵位號(hào)為0,一個(gè)編碼鍵的區(qū)號(hào)和位號(hào)的連寫便是該鍵的區(qū)位號(hào),區(qū)位號(hào)與編碼鍵的對(duì)應(yīng)關(guān)系是1區(qū)11-G、12-F、13-D、14-S、15-A2區(qū)21-H、22-J、23-K、24-L、25-M3區(qū)31-T、32-R、33-E、34-W、35-Q4區(qū)41-Y、42-U、43-I、44-O、45-P5區(qū)51-N、52-B、53-V、54-C、55-X0區(qū)00-Z;本發(fā)明將漢字部件分為字根和字元,字根是具有編碼信息特征的部件,其特點(diǎn)是構(gòu)字能力強(qiáng),使用頻度高,是漢字編碼的基本單位,其余的部件稱為字元,它不作為漢字編碼的基本單位;標(biāo)準(zhǔn)鍵盤的26個(gè)鍵對(duì)應(yīng)著本發(fā)明的全部字根,其對(duì)應(yīng)關(guān)系是
G王、一、、戔、五;F土、二、十、寸、雨、 干、未、士、 D大、三、廠、石、戊、羊、 古、犬、丆、ナ、镸;S木、丁、西、 A工、匚、七、戈、犭、艸、弋、 廿、 廾、 H目、丨、上、止、 、卜、、 饣;J日、 刂、 曰、 早、蟲、 K口、川、卅、 L田、甲、囗、四、 皿、力、車;M山、冂、由、貝、曲、 幾;T禾、丿、、 、毛、攵、夂、 彳;R白、 手、 扌、丘、斤、 E月、彡、乃、用、 豸、豕、 W人、八、亻、癶、 Q金、钅、勹、夕、 兒、 乂;Y言、丶、讠、文、方、廣、 亠 U立、冫、 丷、、丬、辛、疒、六、門;I水、氵、氺、 小、 、 O火、灬、米、 兆、革、業(yè)、 P之、冖、辶、礻、衤、宀、廴;N已、乙、、 己、巳、尸、 羽、 心、忄、;B子、ㄍ、 了、凵、卩、阝、孑、也、皮、耳;V女、巛、 九、飛、刀、 彐、、臼;C又、厶、マ、 巴、馬、牛;X幺、纟、 母、 毋、 艮、 弓、匕;Z○、、舟、酉、夫、 每個(gè)字母所對(duì)應(yīng)的第一個(gè)字根是該字母鍵的中文鍵名,0區(qū)的Z鍵不僅用來對(duì)應(yīng)字根,而且還對(duì)應(yīng)著本發(fā)明的擴(kuò)展碼,稱為擴(kuò)展鍵,擴(kuò)展鍵的中文鍵名是特殊字符“○”;
每個(gè)字根所對(duì)應(yīng)的編碼鍵的區(qū)位號(hào)稱為該字根的字根碼,擴(kuò)展鍵的區(qū)位號(hào)也稱擴(kuò)展碼,單字中某一個(gè)筆畫所對(duì)應(yīng)的單筆字根的字根碼叫做該筆畫的筆畫碼;在漢字的結(jié)構(gòu)分類上,本發(fā)明將漢字分為獨(dú)體字與合體字,獨(dú)體字包括單根字(成字字根)和單體字(成字字元),合體字是部件之間以離散的關(guān)系組成的漢字,合體字包括左右結(jié)構(gòu)、上下結(jié)構(gòu)、半包圍結(jié)構(gòu)和全包圍結(jié)構(gòu)四種結(jié)構(gòu)類型;為了漢字編碼,需要將漢字中的字元變通為幾個(gè)字根,按某種規(guī)則將字元變通為字根的過程,叫做漢字拆分;本發(fā)明是采用以下方法對(duì)字元進(jìn)行拆分a.若字元的首筆與次筆可構(gòu)成一個(gè)字根,其余部分也是一個(gè)字根,且這兩個(gè)字根連而不交,則將它的前兩筆拆為第一字根,剩余的部分作為第二字根;b.若字元不具備上述特點(diǎn),但其首筆與其它筆畫連而不交,且去掉首筆后剩余的部分是一個(gè)字根,則將它的首筆畫拆為第一字根,剩余部分作為第二字根;c.若字元不具備上述兩個(gè)特點(diǎn),則依據(jù)筆畫的書寫順序,以每次取一個(gè)盡可能大的字根(即筆畫盡可能多的字根)為原則進(jìn)行拆分;本發(fā)明在編碼規(guī)則上,針對(duì)鍵名字、單根字、復(fù)根字和詞語設(shè)定了不同的規(guī)則a.鍵名的編碼規(guī)則將鍵名的字根碼重復(fù)取四次;b.單根字的編碼規(guī)則(鍵名除外)(1)筆畫在三筆以上的單根字,其編碼是字根碼+首筆筆畫碼+次筆筆畫碼+末筆筆畫碼(2)筆畫為兩筆的單根字,其編碼是字根碼+首筆筆畫碼+末筆筆畫碼(3)以下五種單筆畫要在字根碼和筆畫碼之后加一個(gè)L,即為一11 11 24/GGL丨21 21 24/HHL
丿31 31 24/TTL丶41 41 24/YYL乙51 51 24/NNLc.復(fù)根字的編碼規(guī)則本發(fā)明將漢字的筆畫分為六種橫、豎、撇、點(diǎn)、彎、拐,前四種筆畫分別命以筆畫代號(hào)1、2、3、4,彎和拐的筆畫代號(hào)均為5,同時(shí)將復(fù)根字分為三種字型左右型、上下型、雜合型,分別命以字型代號(hào)1、2、3,由復(fù)根字的末根的末筆筆畫代號(hào)與其字型代號(hào)組成的兩位數(shù)字稱為識(shí)別碼,對(duì)復(fù)根字采取以下編碼規(guī)則(1)雙根字的編碼規(guī)則是第一字根碼+第二字根碼+識(shí)別碼(2)三根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+識(shí)別碼(3)多根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+末根碼;d.詞語的編碼規(guī)則(1)雙字詞的輸入碼是由其每個(gè)字的前兩個(gè)碼組成(2)三字詞的輸入碼是前兩個(gè)字各取第一碼,最后一個(gè)字取其前兩個(gè)碼組成(3)多字詞的輸入碼是由第一、第二、第三及最末一個(gè)字的第一字根碼組成;本發(fā)明對(duì)于含特殊字符的詞設(shè)定了編碼,含特殊字符的詞指含“○”的公元年號(hào)、含“·”的外國(guó)人名及含西文字母(看作特殊字符)的詞匯,其編碼規(guī)則是將其特殊字符一律當(dāng)作擴(kuò)展鍵上的鍵名字來對(duì)待,按詞語的編碼規(guī)則進(jìn)行編碼;本發(fā)明對(duì)于國(guó)標(biāo)第1區(qū)至國(guó)標(biāo)第9區(qū)的圖形符號(hào)(特殊字符)設(shè)定了編碼,在編碼規(guī)則上,針對(duì)表義字符、希臘字母、四聲韻母和日文假名設(shè)定了不同的規(guī)則a.表義字符的編碼規(guī)則本發(fā)明將表義字符的稱謂前加“○”構(gòu)成的詞語,稱為該字符的“相當(dāng)詞語”,表義字符的編碼規(guī)則是對(duì)其相當(dāng)詞語按含特殊字符的詞語的編碼規(guī)則進(jìn)行編碼;b.希臘字母的編碼規(guī)則(1)小寫希臘字母的編碼是擴(kuò)展碼+讀音的第1個(gè)拼音字母+擴(kuò)展碼(2)大寫希臘字母的編碼是擴(kuò)展碼+讀音的第1個(gè)拼音字母+擴(kuò)展碼+擴(kuò)展碼c.四聲韻母的編碼規(guī)則本發(fā)明將漢字的四種聲調(diào)(陰平、陽平、上聲、去聲)分別命以聲調(diào)代號(hào)“一”、“二”、“三”、“四”,四聲韻母的編碼規(guī)則是擴(kuò)展碼+<韻母>+聲調(diào)代號(hào)的字根碼d.日文假名的編碼規(guī)則本發(fā)明將日文假名的5個(gè)元音分別命以元音符a、i、u、e、o,將假名各行分別命以行符a、k、g、s、z、t、d、n、h、b、p、m、y、l、w,日文假名的編碼規(guī)則是(1)平假名的編碼規(guī)則擴(kuò)展碼+行符+元音符(2)片假名的編碼規(guī)則擴(kuò)展碼+行符+元音符+擴(kuò)展碼本發(fā)明為單字設(shè)定了一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼和三級(jí)簡(jiǎn)碼,一級(jí)簡(jiǎn)碼由一個(gè)字根碼組成,二級(jí)簡(jiǎn)碼由其全碼的前兩個(gè)碼組成,三級(jí)簡(jiǎn)碼由其全碼的前三個(gè)碼組成;本發(fā)明在設(shè)定簡(jiǎn)碼時(shí)遵循以下方法a.一級(jí)簡(jiǎn)碼由使用頻度最高的26個(gè)一級(jí)高頻字享受;b.二級(jí)簡(jiǎn)碼和三級(jí)簡(jiǎn)碼優(yōu)先常用字,即在前兩碼或前三碼相同的字中,選擇使用頻度高的字享受二級(jí)簡(jiǎn)碼或三級(jí)簡(jiǎn)碼;c.在使用頻度相同的情況下,二級(jí)簡(jiǎn)碼優(yōu)先雙根字,三級(jí)簡(jiǎn)碼優(yōu)先三根字;
d.一個(gè)字如果享受了一級(jí)簡(jiǎn)碼就不再享受二級(jí)簡(jiǎn)碼或三級(jí)簡(jiǎn)碼,享受了二級(jí)簡(jiǎn)碼就不再享受三級(jí)簡(jiǎn)碼;本發(fā)明通過擴(kuò)展碼Z的參與編碼,構(gòu)成了一整套的擴(kuò)展簡(jiǎn)碼,擴(kuò)展簡(jiǎn)碼分為一級(jí)擴(kuò)展簡(jiǎn)碼、二級(jí)擴(kuò)展簡(jiǎn)碼和三級(jí)擴(kuò)展簡(jiǎn)碼,其編碼規(guī)則是a.一級(jí)擴(kuò)展簡(jiǎn)碼由二級(jí)高頻字和三級(jí)高頻字來享受,每一級(jí)包含26個(gè)字,二級(jí)高頻字主要是一些常用雙根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和一個(gè)擴(kuò)展碼組成;三級(jí)高頻字主要是一些常用三根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和2個(gè)擴(kuò)展碼組成;b.二級(jí)擴(kuò)展簡(jiǎn)碼二級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的常用雙根字的字根碼再加兩個(gè)擴(kuò)展碼組成;c.三級(jí)擴(kuò)展簡(jiǎn)碼三級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的常用三根字的三個(gè)字根碼再加一個(gè)擴(kuò)展碼組成;在重碼序的處理上,本發(fā)明采取以下原則a.將使用頻度高的字或詞放在第一位置b.重碼字中有簡(jiǎn)碼的字將第一位置讓位給沒有簡(jiǎn)碼的常用字c.常用字與詞語重碼時(shí),常用字放第一位置d.不常用字與詞語重碼時(shí),詞語放第一位置;本發(fā)明為單字和詞語設(shè)定了混編容錯(cuò)碼,混編容錯(cuò)碼由部分本發(fā)明的字根碼和部分五筆字型的字根碼組成;在本發(fā)明中26個(gè)英文字母全部用來進(jìn)行編碼,而用“/”鍵作為查詢鍵。
本發(fā)明解決了漢字編碼領(lǐng)域亟待解決的兩大難題一是將“規(guī)范、易學(xué)、高效、兼容”集于了一種輸入方法,解決了建立漢字鍵盤文化的關(guān)鍵問題;二是提出了擴(kuò)展編碼的思想,解決了特殊字符快速盲打這一歷史難題。其主要特點(diǎn)是1.規(guī)范易學(xué)與五筆相比,本發(fā)明在字根的規(guī)范性上主要體現(xiàn)在以下三點(diǎn)(1)沒有不規(guī)范的字根像“ 、、 、 ”這樣一些五筆中的不規(guī)范字根,本發(fā)明中均沒有。
(2)擁有完整的規(guī)范性字根 像下面的50個(gè)組字部件,都是一些基本的、具有很強(qiáng)的信息特征的漢字部件,在本發(fā)明中都被選為字根,在五筆字型中均不是字根未 戊羊 犭 饣 曲 毛 丘 豸兆業(yè) 革礻衤 皮 飛 牛母 毋艮 舟酉 夫(3)本發(fā)明的字根分布在26個(gè)英文字母鍵上,而不是五筆字型的25個(gè)鍵上。
本發(fā)明的字根與漢字構(gòu)字部件相一致,不存在漢字拆分過碎等不規(guī)范問題,直觀易學(xué),符合中小學(xué)語文教學(xué)規(guī)律,宜納入中小學(xué)基礎(chǔ)教育。從下面的例字拆分對(duì)比可見一斑漢字 本發(fā)明拆分結(jié)果 五筆字型拆分結(jié)果狠 犭艮丿彐 祥 礻羊丶丷 襤 衤 皿 丶皿酶 酉母 一 一 敝攵 丷冂小攵茂 艸戊 艸廠 丶丿甫、一 丨丶靠 宀 八 一八 酷酉 口 一丿土口典八 八舞夕 一夕匚丨段幾又亻三幾又假 亻 又 亻丨二又牦 牜毛 丿扌 二乚饒 饣 一兒勹 七丿一兒島山 勹、 山躇艸 日口止艸土丿日鹿 匕 廣一 匕2.低重碼、高效率本發(fā)明由于字根的選擇定位符合信息化原則,使得重碼率明顯低于五筆字型。下面的幾個(gè)編碼實(shí)例可說明這一問題所輸字詞 輸入碼 出現(xiàn)字詞 五筆輸入碼 出現(xiàn)字詞飽hqnn飽qnqn 飽 饑餓 飯館 餛飩狡猾 auam狡猾 qtqt 狡猾 狼狽 猖狂 猖獗選擇 eqrc選擇 tfrc 選擇 造反跟蹤 zxzp跟蹤 khkh 跟蹤 踴躍 跳躍 蹂躪 踐踏 蹊蹺教師 zbjg教師 ftjg 才是 都是 老師 教師艦艇 zmzt艦艇 tete 艦艇 航船 船舶甲醛 lhza甲醛 lhsg 甲醛 甲酚 甲醇 甲酸下面的幾個(gè)統(tǒng)計(jì)實(shí)例可說明這一點(diǎn)(1)將“P”鍵上的字根“ ”用“衤礻”替代后,在相關(guān)的260個(gè)字詞中,重碼數(shù)由44降為24;(2)去掉“Q”鍵上的字根“ ”,并在“A”鍵上增加字根“犭”,在相關(guān)的162個(gè)字詞中,重碼數(shù)由36降為15;(3)在“F”鍵上增加字根“ ”,在相關(guān)的75個(gè)字詞中,重碼數(shù)由原來的15降為3;(4)在“E”鍵上增加字根“ ”,在相關(guān)的152個(gè)字詞中,重碼數(shù)由原來的42降為4。
本發(fā)明的低重碼率特點(diǎn),適合配置大容量詞庫及對(duì)漢字大字符集編碼,它提供4萬余條詞語編碼,實(shí)現(xiàn)了“以詞為取碼對(duì)象的漢字輸入”原則,平均每輸入一個(gè)漢字只需敲1.8鍵。例如輸入下面一段文字在計(jì)算機(jī)應(yīng)用領(lǐng)域,文字處理涉及的用戶最廣。磁盤是信息時(shí)代的文字載體,而鍵盤則是現(xiàn)代化的書寫工具。電腦打字已成為當(dāng)今大多數(shù)人的主要“書寫”方式。這段文字共64個(gè)漢字,由以下29個(gè)詞組成
在/計(jì)算機(jī)/應(yīng)用/領(lǐng)域/文字處理/涉及/的/用戶/最廣/磁盤/是/信息時(shí)代/的/文字載體/而/鍵盤/則是/現(xiàn)代化/的/書寫/工具/電腦打字/已成為/當(dāng)今/大多數(shù)人/的/主要/書寫/方式在這29個(gè)詞中,單字詞只有7個(gè),并且?guī)缀醵际且患?jí)高頻字,均可用一級(jí)簡(jiǎn)碼輸入,所以輸入這段文字(不包括標(biāo)點(diǎn)輸入)總共只需敲104鍵,平均每個(gè)字敲1.625個(gè)鍵。若將這段文字翻譯成英文則為In the application of computer,word-processing is most widely used.Disk is the riting carrier of IT time,while key board is the writing tool.computer type-writing has become the normal writing way of most people.
要完成這段英文輸入,總共需敲215個(gè)鍵,去掉5個(gè)標(biāo)點(diǎn),光文字部分需敲210個(gè)鍵,擊鍵總數(shù)比用本發(fā)明輸入的104個(gè)鍵多一倍多。
3.人人可對(duì)特殊字符快速盲打本發(fā)明不僅提供了特殊字符的標(biāo)準(zhǔn)編碼,還提供了特殊字符的拼音編碼,也就是為各類用戶提供了特殊字符的快速盲打功能,用戶即使不會(huì)本發(fā)明的輸入法,只要會(huì)拼音,也可以利用本發(fā)明提供的簡(jiǎn)單編碼規(guī)則,快速地輸入特殊字符。
附圖
圖1為本發(fā)明的字根鍵位示意圖;圖2為本發(fā)明的漢字拆分流程圖;圖3為本發(fā)明的一級(jí)擴(kuò)展簡(jiǎn)碼的一級(jí)高頻字鍵位示意圖;圖4為本發(fā)明的一級(jí)擴(kuò)展簡(jiǎn)碼的二級(jí)高頻字鍵位示意圖;圖5為本發(fā)明的一級(jí)擴(kuò)展簡(jiǎn)碼的三級(jí)高頻字鍵位示意圖。
權(quán)利要求
1.一種元根碼漢字輸入方法,采用標(biāo)準(zhǔn)鍵盤,將26個(gè)英文字母全部用來進(jìn)行編碼,其特征是將26個(gè)編碼鍵劃分成六個(gè)區(qū),分別稱為1區(qū)、2區(qū)、3區(qū)、4區(qū)、5區(qū)和0區(qū),前五個(gè)區(qū)每區(qū)包括五個(gè)鍵,每區(qū)的五個(gè)鍵分別命以鍵位號(hào)1、2、3、4、5,0區(qū)只有一個(gè)鍵,鍵位號(hào)為0,一個(gè)編碼鍵的區(qū)號(hào)和位號(hào)的連寫便是該鍵的區(qū)位號(hào),區(qū)位號(hào)與編碼鍵的對(duì)應(yīng)關(guān)系是1區(qū)11-G、12-F、13-D、14-S、15-A2區(qū)21-H、22-J、23-K、24-L、25-M3區(qū)31-T、32-R、33-E、34-W、35-Q4區(qū)41-Y、42-U、43-I、44-O、45-P5區(qū)51-N、52-B、53-V、54-C、55-X0區(qū)00-Z;本發(fā)明將漢字部件分為字根和字元,字根是具有編碼信息特征的部件,是漢字編碼的基本單位,其余的部件稱為字元,它不作為漢字編碼的基本單位;標(biāo)準(zhǔn)鍵盤的26個(gè)鍵對(duì)應(yīng)著本發(fā)明的全部字根,其對(duì)應(yīng)關(guān)系是G王、一、、戔、五;F土、二、十、寸、雨、 、干、未、士、 D大、三、廠、石、戊、羊、 古、犬、丆、ナ、镸;S木、丁、西、 A工、匚、七、戈、犭、艸、弋、 廿、 廾、 H目、丨、上、止、 、卜、、 饣;J日、 刂、 曰、 早、蟲、 K口、川、卅、 L田、甲、囗、四、 皿、力、車;M山、冂、由、貝、曲、 幾;T禾、丿、、 、毛、攵、夂、 彳;R白、 手、 扌、丘、斤、 E月、彡、乃、用、 豸、豕、 W人、八、亻、癶、 Q金、钅、勹、夕、 兒、 乂;Y言、丶、讠、文、方、廣、亠、 U立、冫、 丷、、丬、辛、疒、六、門;I水、氵、氺、 小、 、 O火、灬、米、 兆、革、業(yè)、 P之、冖、辶、礻、衤、宀、廴;N已、乙、、 己、巳、尸、 羽、 心、忄、;B子、ㄍ、 了、凵、卩、阝、孑、也、皮、耳;V女、巛、 九、飛、刀、 彐、、臼;C又、厶、マ、 巴、馬、牛;X;幺、纟、 母、 毋、 艮、 弓、匕;Z、舟、酉、夫、 每個(gè)字母所對(duì)應(yīng)的第一個(gè)字根是該字母鍵的中文鍵名,0區(qū)的Z鍵不僅用來對(duì)應(yīng)字根,而且還對(duì)應(yīng)著本發(fā)明的擴(kuò)展碼,稱為擴(kuò)展鍵,擴(kuò)展鍵的中文鍵名是特殊字符“○”本發(fā)明是采用以下方法對(duì)字元進(jìn)行拆分a.若字元的首筆與次筆可構(gòu)成一個(gè)字根,其余部分也是一個(gè)字根,且這兩個(gè)字根連而不交,則將它的前兩筆拆為第一字根,剩余的部分作為第二字根;b.若字元不具備上述特點(diǎn),但其首筆與其它筆畫連而不交,且去掉首筆后剩余的部分是一個(gè)字根,則將它的首筆畫拆為第一字根,剩余部分作為第二字根;c.若字元不具備上述兩個(gè)特點(diǎn),則依據(jù)筆畫的書寫順序,以每次取一個(gè)盡可能大的字根(即筆畫盡可能多的字根)為原則進(jìn)行拆分;本發(fā)明在編碼規(guī)則上,針對(duì)鍵名字、單根字、復(fù)根字和詞語設(shè)定了不同的規(guī)則a.鍵名的編碼規(guī)則將鍵名的字根碼重復(fù)取四次;b.單根字的編碼規(guī)則(鍵名除外)(1)筆畫在三筆以上的單根字,其編碼是字根碼+首筆筆畫碼+次筆筆畫碼+末筆筆畫碼(2)筆畫為兩筆的單根字,其編碼是字根碼+首筆筆畫碼+末筆筆畫碼(3)以下五種單筆畫要在字根碼和筆畫碼之后加一個(gè)L,即為一11 11 24/GGL丨21 21 24/HHL丿31 31 24/TTL丶41 41 24/YYL乙51 51 24/NNLc.復(fù)根字的編碼規(guī)則本發(fā)明將漢字的筆畫分為六種橫、豎、撇、點(diǎn)、彎、拐,前四種筆畫分別命以筆畫代號(hào)1、2、3、4,彎和拐的筆畫代號(hào)均為5,同時(shí)將復(fù)根字分為三種字型左右型、上下型、雜合型,分別命以字型代號(hào)1、2、3,由復(fù)根字的末根的末筆筆畫代號(hào)與其字型代號(hào)組成的兩位數(shù)字稱為識(shí)別碼,對(duì)復(fù)根字采取以下編碼規(guī)則(1)雙根字的編碼規(guī)則是第一字根碼+第二字根碼+識(shí)別碼(2)三根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+識(shí)別碼(3)多根字的編碼規(guī)則是第一字根碼+第二字根碼+第三字根碼+末根碼;d.詞語的編碼規(guī)則(4)雙字詞的輸入碼是由其每個(gè)字的前兩個(gè)碼組成(5)三字詞的輸入碼是前兩個(gè)字各取第一碼,最后一個(gè)字取其前兩個(gè)碼組成(6)多字詞的輸入碼是由第一、第二、第三及最末一個(gè)字的第一字根碼組成;本發(fā)明對(duì)于含特殊字符的詞設(shè)定了編碼,含特殊字符的詞指含“○”的公元年號(hào)、含“·”的外國(guó)人名及含西文字母(看作特殊字符)的詞匯,其編碼規(guī)則是將其特殊字符一律當(dāng)作擴(kuò)展鍵上的鍵名字來對(duì)待,按詞語的編碼規(guī)則進(jìn)行編碼;本發(fā)明對(duì)于國(guó)標(biāo)第1區(qū)至國(guó)標(biāo)第9區(qū)的圖形符號(hào)(特殊字符)設(shè)定了編碼,在編碼規(guī)則上,針對(duì)表義字符、希臘字母、四聲韻母和日文假名設(shè)定了不同的規(guī)則a.表義字符的編碼規(guī)則本發(fā)明將表義字符的稱謂前加“○”構(gòu)成的詞語,稱為該字符的“相當(dāng)詞語”,表義字符的編碼規(guī)則是對(duì)其相當(dāng)詞語按含特殊字符的詞語的編碼規(guī)則進(jìn)行編碼;b.希臘字母的編碼規(guī)則(1)小寫希臘字母的編碼是擴(kuò)展碼+讀音的第1個(gè)拼音字母+擴(kuò)展碼(2)大寫希臘字母的編碼是擴(kuò)展碼+讀音的第1個(gè)拼音字母+擴(kuò)展碼+擴(kuò)展碼c.四聲韻母的編碼規(guī)則本發(fā)明將漢字的四種聲調(diào)(陰平、陽平、上聲、去聲)分別命以聲調(diào)代號(hào)“一”、“二”、“三”、“四”,四聲韻母的編碼規(guī)則是擴(kuò)展碼+<韻母>+聲調(diào)代號(hào)的字根碼d.日文假名的編碼規(guī)則本發(fā)明將日文假名的5個(gè)元音分別命以元音符a、i、u、e、o,將假名各行分別命以行符a、k、g、s、z、t、d、n、h、b、p、m、y、l、w,日文假名的編碼規(guī)則是(1)平假名的編碼規(guī)則擴(kuò)展碼+行符+元音符(2)片假名的編碼規(guī)則擴(kuò)展碼+行符+元音符+擴(kuò)展碼。
2.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是為單字設(shè)定了一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼和三級(jí)簡(jiǎn)碼,一級(jí)簡(jiǎn)碼由一個(gè)字根碼組成,二級(jí)簡(jiǎn)碼由其全碼的前兩個(gè)碼組成,三級(jí)簡(jiǎn)碼由其全碼的前三個(gè)碼組成,在設(shè)定簡(jiǎn)碼時(shí)遵循以下方法a.一級(jí)簡(jiǎn)碼由使用頻度最高的一級(jí)高頻字享受;b.二級(jí)和三級(jí)簡(jiǎn)碼優(yōu)先常用字,即在前兩碼或前三碼相同的字中,選擇使用頻度高的字享受二級(jí)簡(jiǎn)碼或三級(jí)簡(jiǎn)碼;c.在使用頻度相同的情況下,二級(jí)簡(jiǎn)碼優(yōu)先雙根字,三級(jí)簡(jiǎn)碼優(yōu)先三根字;d.一個(gè)字如果享受了一級(jí)簡(jiǎn)碼就不再享受二級(jí)簡(jiǎn)碼或三級(jí)簡(jiǎn)碼。
3.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是通過擴(kuò)展碼Z的參與編碼,構(gòu)成了一整套的擴(kuò)展簡(jiǎn)碼,擴(kuò)展簡(jiǎn)碼分為一級(jí)擴(kuò)展簡(jiǎn)碼、二級(jí)擴(kuò)展簡(jiǎn)碼和三級(jí)擴(kuò)展簡(jiǎn)碼,其編碼規(guī)則是a.一級(jí)擴(kuò)展簡(jiǎn)碼由二級(jí)高頻字和三級(jí)高頻字來享受,每一級(jí)包含26個(gè)字,二級(jí)高頻字主要是一些常用雙根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和一個(gè)擴(kuò)展碼組成;三級(jí)高頻字主要是一些常用三根字,其一級(jí)擴(kuò)展簡(jiǎn)碼由它的首根碼和2個(gè)擴(kuò)展碼組成;b.二級(jí)擴(kuò)展簡(jiǎn)碼二級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的常用雙根字的字根碼再加兩個(gè)擴(kuò)展碼組成;c.三級(jí)擴(kuò)展簡(jiǎn)碼三級(jí)擴(kuò)展簡(jiǎn)碼是由無簡(jiǎn)碼的常用三根字的三個(gè)字根碼再加一個(gè)擴(kuò)展碼組成。
4.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是在重碼序的處理上,采取以下方法a.將使用頻度高的字或詞放在第一位置b.重碼字中有簡(jiǎn)碼的字將第一位置讓位給沒有簡(jiǎn)碼的常用字c.常用字與詞語重碼時(shí),常用字放第一位置d.不常用字與詞語重碼時(shí),詞語放第一位置。
5.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征是用“/”鍵作為查詢鍵。
全文摘要
本發(fā)明涉及一種元根碼漢字輸入方法,它采用標(biāo)準(zhǔn)鍵盤,將26個(gè)英文字母全部用來進(jìn)行編碼,而用“/”作為查詢鍵;本發(fā)明依據(jù)國(guó)家語言文字規(guī)范選定238個(gè)具有信息化特征的組字部件作為字根,按照諧調(diào)性和規(guī)律性原則定位在26個(gè)英文字母鍵盤上,構(gòu)成中文鍵盤的“字母”體系,成功地解決了建立漢字鍵盤文化的關(guān)鍵問題;本發(fā)明創(chuàng)立了編碼特區(qū),提出了擴(kuò)展編碼的新思想,圓滿地解決了特殊字符快速盲打的歷史難題;本發(fā)明的基本特點(diǎn)是:規(guī)范、易學(xué)、高效、兼容,人人都可以用它對(duì)特殊字符快速盲打。
文檔編號(hào)G06F3/023GK1381778SQ01132758
公開日2002年11月27日 申請(qǐng)日期2001年9月6日 優(yōu)先權(quán)日2001年9月6日
發(fā)明者劉春榮 申請(qǐng)人:劉春榮