專利名稱:一種五行碼漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入法,特別是一種五行碼漢字輸入法,適用于手機(jī)、掌上電腦、PDA記事本、計算機(jī)數(shù)字小鍵盤、電話機(jī)等使用數(shù)字編碼輸入漢字的裝置,用于中文信息處理。
背景技術(shù):
手機(jī)、掌上電腦、PDA記事本、計算機(jī)數(shù)字小鍵盤、電話機(jī)等使用數(shù)字編碼輸入漢字的產(chǎn)品每年以千萬計的數(shù)量進(jìn)入使用漢語的用戶手中。用戶群覆蓋社會各個階層,從藍(lán)領(lǐng)到白領(lǐng),從賣菜大姐到公司老總,從少年兒童到白發(fā)老翁。目前,上述使用數(shù)字編碼輸入漢字的裝置,采用的漢字輸入方法一般為拼音輸入法和筆畫輸入法二種。拼音輸入法雖然簡單方便,但對于一些年長的、沒有學(xué)過漢語拼音或不會普通話的使用者而言,困難比較大,且同音字太多、重碼字多、輸入速度比較慢。而筆畫輸入法,現(xiàn)有的編碼設(shè)計選用漢字部件時多從部件的組字頻度出發(fā),選用的編碼碼元、編碼輸入規(guī)則使輸入法對一般的輸入者而言缺乏規(guī)律可循、容易出錯,影響輸入速度,同時在輸入兩字以上的詞語時平均碼長,輸入速度也要受限止。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是,克服現(xiàn)有技術(shù)存在的缺陷,提供易學(xué)性好、上手能用,平均碼長短,重碼字和詞鍵選率低,實(shí)現(xiàn)多層次編碼隨意混合使用,能進(jìn)一步提高漢字輸入速度的一種五行碼漢字輸入法。
本發(fā)明解決上述問題所采用的技術(shù)方案是該五行碼漢字輸入法,其特點(diǎn)是采用標(biāo)有漢字部件的漢字輸入數(shù)字鍵盤,所述的漢字輸入法包括以下步驟A、選擇確定數(shù)量的漢字部件作為編碼碼元的步驟,優(yōu)選含5個單筆畫部件和25個多筆畫部件的30個漢字筆畫部件作為編碼碼元,所述的筆畫部件為單筆畫部件 一(丿) 丨(亅) 丿 丶(乀) 乙多筆畫部件 大 王 日 立 禾 人 亻 彳 纟 艸 金 木 水 火上 氵 冫 扌 宀 讠 口 廣 女 寸 辶;B、將漢字部件指定到所述的數(shù)字鍵盤的相應(yīng)鍵位上的步驟,上述30個漢字部件在數(shù)字鍵盤上的設(shè)置分成單筆畫部件和多筆畫部件兩個區(qū),每區(qū)五個鍵位,一區(qū)的[1]~[5]的五個鍵位每個設(shè)置一個唯一的單筆畫部件,二區(qū)的[6]~
的五個鍵位每個設(shè)置五個多筆畫部件,構(gòu)成階梯形結(jié)構(gòu),“金、木、水、火、土”5個部首部件設(shè)置在同一鍵位上,各鍵位的筆畫部件設(shè)置為區(qū) 數(shù)字鍵位 部件一單1一(丿)筆2丨(亅)畫3丿部4丶(乀)件5乙二多6大 王 日 立 禾筆7人 亻 彳 纟 艸畫8金 木 水 火 土部9氵 冫 扌 宀 讠件0口 廣 女 寸 辶通過統(tǒng)計分析,五個設(shè)置多筆畫部件的鍵位[6]~
每個設(shè)置五個優(yōu)選部件能得到最小的綜合重碼率。
C、利用上述鍵盤上的特定鍵位輸入漢字的步驟,采用多層次編碼規(guī)則輸入漢字,第一層次以5個單筆畫部件按筆順輸入,用一區(qū)的[1]~[5]五個數(shù)字鍵編碼,其編碼規(guī)則為單字按筆順前4個筆畫和未筆畫;雙字詞 首字按筆順前4個筆畫,次字按筆順前3個筆畫;三字詞 首字按筆順前4個筆畫,次字按筆順前2個筆畫,未字首筆畫;多字詞 首字按筆順前4個筆畫,次字、第三字和未字的首筆畫;
第二層次延伸和擴(kuò)展第一層次的編碼碼元,以30個漢字部件作為編碼碼元,增加二區(qū)的編碼鍵位,用[1]~
十個數(shù)字鍵編碼,其編碼規(guī)則為單字按筆順前4個筆畫或部件和未筆畫或部件;雙字詞 首字按筆順前4個筆畫或部件,次字按筆順前3個筆畫或部件;三字詞 首字按筆順前4個筆畫或部件,次字按筆順前2個筆畫或部件,未字首筆畫或部件;多字詞 首字按筆順前4個筆畫或部件,次字、第三字和未字的首筆畫或部件。
將十個數(shù)字鍵分成兩個區(qū)的階梯型部件設(shè)置結(jié)構(gòu)和相對應(yīng)的編碼規(guī)則,實(shí)現(xiàn)了多層次編碼隨意混合使用的發(fā)明目的。從按筆順筆畫編碼切入,用戶上手會用后能無需切換地再使用提高輸入速度的高層次編碼。使用五行碼漢字輸入法在輸入漢字文本過程中,70%以上的漢字是通過兩字以上的詞語方式進(jìn)行的,大大縮短了平均碼長。
本發(fā)明五行碼漢字輸入法所述的步驟C中利用上述鍵盤上的特定鍵位輸入漢字的第二層次延伸和擴(kuò)展成第三層次,在單字輸入時以該字拼音的首字母作為尾碼,第三層次的編碼規(guī)則為單字按筆順前4個筆畫或部件和未筆畫或部件,再加一該字拼音的首字母鍵。
第三層次的編碼規(guī)則在單字輸入時增加一鍵,能減少約50%的重碼字,大大降低了重碼字、詞鍵選率,從而極大地提高了漢字輸入速度。
本發(fā)明五行碼漢字輸入法所述的步驟B中一區(qū)[1]~[5]設(shè)置的單筆畫部件是不可置換的,二區(qū)[6]~
設(shè)置的多筆畫部件可置換,[6]~
鍵位上設(shè)置的部件數(shù)均不超過5個。
本發(fā)明五行碼漢字輸入法所述的步驟A中選擇的作為編碼碼元的漢字部件,根據(jù)編碼字符集的大小和輸入軟件智能化程度,除“金、木、水、火、土”外的多筆畫部件可作調(diào)整。
本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn)和有益的效果1、本發(fā)明采用獨(dú)創(chuàng)的按部件在漢字中的不同位置,統(tǒng)計其在當(dāng)代漢字語料的出現(xiàn)頻度作為優(yōu)選依據(jù),選擇30個漢字部件作為編碼碼元,通過對數(shù)字鍵盤上相應(yīng)的鍵位設(shè)置和確定相對應(yīng)的編碼規(guī)則,實(shí)現(xiàn)了對國家標(biāo)準(zhǔn)GB18030-2000《信息技術(shù)信息交換用漢字編碼字符集基本集的擴(kuò)充》規(guī)定的27533個簡、繁體漢字的多層次數(shù)字編碼的技術(shù)和體系結(jié)構(gòu)。使?jié)h字輸入過程中重碼字、詞鍵選率和字平均碼長均優(yōu)于國家標(biāo)準(zhǔn)GB/T18031-2000《信息技術(shù)數(shù)字鍵盤漢字輸入通用要求》對數(shù)字編碼輸入的技術(shù)指標(biāo)要求。2、五行碼漢字輸入法覆蓋編碼字符集大,且符合以漢語為母語的人群的思維習(xí)慣,易學(xué)性好、上手能用,是適用人群寬的漢字?jǐn)?shù)字編碼輸入技術(shù)。以單筆畫部件或多筆畫部件編碼碼元編碼的多層次輸入法可以隨意混合使用,不需切換,實(shí)現(xiàn)從初學(xué)漢字輸入到快速輸入的平滑過渡,利于漢字輸入速度的進(jìn)一步提高。
具體實(shí)施例方式
實(shí)施例1該五行碼漢字輸入法采用標(biāo)有漢字部件的漢字輸入數(shù)字鍵盤,漢字輸入包括優(yōu)選30個漢字部件作為編碼碼元;將此30個筆畫部件指定到數(shù)字鍵盤的[1]~
十個相應(yīng)鍵位上;利用鍵盤上的特定鍵位、按照編碼規(guī)則輸入漢字三個步驟。
1、優(yōu)選30個漢字部件作為編碼碼元的步驟本發(fā)明不同于以往編碼設(shè)計選用筆畫部件時多從筆畫部件的組字頻度出發(fā),而是采用獨(dú)創(chuàng)的按部件在漢字中的不同位置統(tǒng)計其在當(dāng)代漢字語料的出現(xiàn)頻度作為優(yōu)選依據(jù)。這樣選擇的編碼碼元、編碼規(guī)則使輸入法收到易學(xué)、平均碼長短、重碼字少、詞鍵選率低的良好效果。實(shí)施例是用4500萬字的現(xiàn)代語料,對國家語委頒布的GF3001-1997《信息處理用GB 13000.1字符集漢字部件規(guī)范》規(guī)定的560個規(guī)范部件,在每個漢字中出現(xiàn)在不同位置的頻度作動態(tài)統(tǒng)計,將動態(tài)統(tǒng)計數(shù)據(jù)作為優(yōu)選部件的部件位置頻度數(shù)據(jù)。
依照設(shè)定的編碼規(guī)則,使用部件位置頻度數(shù)據(jù)原則是①考慮漢字中首部件的頻度,因?yàn)闊o論字輸入還是詞輸入,都要用到首部件。
②考慮漢字中未部件的頻度,因?yàn)樽州斎氡匦栌玫竭@個位置的部件。
③考慮次部件的頻度,因?yàn)樵谧趾腿忠韵碌脑~編碼時要用到這個位置的部件。
④在頻度相近時,優(yōu)先考慮查字典使用的部首部件和人們習(xí)慣的偏旁。
實(shí)施例根據(jù)以上原則,在優(yōu)選了以下筆畫部件作為五行碼漢字輸入法的編碼碼元一(丿) 丨(亅) 丿 丶(乀) 乙5個單筆畫;金、木、水、火、土、大、王、人、日、口、立、禾、女、廣、寸共15個部首成字部件;亻、彳、氵、冫、扌、纟、艸、宀、讠、辶共10個偏旁部首。
根據(jù)編碼字符集的大小和輸入軟件智能化程度,除“金、木、水、火、土”外的多筆畫部件可作調(diào)整。比如多筆畫部件選21個,將立、女、彳、宀去掉,只選金、木、水、火、土、大、王、人、日、口、禾、廣、寸共13個部首成字部件;亻、氵、冫、扌、纟、艸、讠、辶共8個偏旁部首。
2、將此30個筆畫部件指定到數(shù)字鍵盤的[1]~
十個相應(yīng)鍵位上的步驟為了實(shí)現(xiàn)多層次編碼隨意混合使用的發(fā)明目的,實(shí)施例是將十個數(shù)字鍵分成兩個區(qū)的階梯型部件設(shè)置結(jié)構(gòu)。將上述30個筆畫部件在數(shù)字鍵盤上設(shè)置分成單筆畫部件和多筆畫部件兩個區(qū),每區(qū)五個鍵位。
一區(qū)的[1]~[5]的五個鍵位每個設(shè)置一個唯一的單筆畫部件,具體設(shè)置為數(shù)字鍵位 部件1 一(丿)2 丨(亅)3 丿4 丶(乀)5 乙二區(qū)的[6]~
的五個鍵位每個設(shè)置五個多筆畫部件,構(gòu)成階梯形結(jié)構(gòu),“金、木、水、火、土”5個部首部件設(shè)置在同一鍵位上,具體設(shè)置為數(shù)字鍵位 部件6大 王 日 立 禾7人 亻 彳 纟 艸8金 木 水 火 土9氵 冫 扌 宀 讠0口 廣 女 寸 辶鍵盤上1區(qū)[1]~[5]設(shè)置的單筆畫部件是不可置換的,2區(qū)[6]~
設(shè)置的多筆畫部件是可以置換的,只要保持階梯形結(jié)構(gòu)。比如可以按照以下方案設(shè)置
數(shù)字鍵位 部件6 金 木 水 火 土7 大 王 人 女 日8 亻 彳 纟 艸 辶9 氵 冫 扌 宀 寸0 口 廣 讠 禾 立對應(yīng)于前面提到的多筆畫部件選21個的設(shè)置方案為數(shù)字鍵位 部件6 金 木 水 火 土7 大 王 日 禾8 氵 冫 讠 辶9 亻 纟 艸 寸0 口 廣 人 扌按照漢字特征信息編碼的重碼字來源于規(guī)則重碼和歸并重碼兩個方面。規(guī)則重碼的例子例字筆順 筆順筆畫編碼土 一丨一 121士 一丨一 121歸并重碼例子例字 筆畫部件順序 五行編碼體 亻一丨丿丶一 71231苯 艸一丨丿丶一 71231“體”、“苯”重碼是由于“亻”和“艸”歸并在一個鍵位[7]上輸入造成的。為減少規(guī)則重碼,需要增加編碼部件數(shù)量;為減少歸并重碼,需要減少同一鍵位的部件數(shù)量。經(jīng)過統(tǒng)計分析,五個設(shè)置多筆畫部件的鍵位[6]~
每個設(shè)置五個優(yōu)選部件能得到最小的綜合重碼率。
“金、木、水、火、土”經(jīng)常用在占現(xiàn)代常用漢字80%以上的形聲字的“義部”位置,由它們組成的漢字字義有“相克”即排斥的成份,這“五行”編碼碼元設(shè)置在同一個鍵位上輸入,可以較少產(chǎn)生歸并重碼。
3、利用鍵盤上的特定鍵位、按照編碼規(guī)則輸入漢字的步驟本實(shí)施例對應(yīng)于以上鍵盤輸入漢字制定了二個層次的漢字編碼規(guī)則。
第一層次利用5種基本筆畫即單筆畫部件按筆順輸入,用鍵盤上的1區(qū)[1]~[5]五個數(shù)字鍵編碼,其編碼規(guī)則是單字按筆順前4個筆畫和未筆畫;雙字詞 首字按筆順前4個筆畫,次字按筆順前3個筆畫;三字詞 首字按筆順前4個筆畫,次字按筆順前2個筆畫,未字首筆畫多字詞 首字按筆順前4個筆畫,次字、第三字和未字的首筆畫。
第二層次延伸和擴(kuò)展第一層次的編碼元素,增加鍵盤2區(qū)的編碼鍵位,用[1]~
十個數(shù)字鍵編碼,其編碼規(guī)則是單字按筆順前4個筆畫或部件和未筆畫或部件;雙字詞 首字按筆順前4個筆畫或部件,次字按筆順前3個筆畫或部件;三字詞 首字按筆順前4個筆畫或部件,次字按筆順前2個筆畫或部件,未字首筆畫或部件;多字詞 首字按筆順前4個筆畫或部件,次字、第三字和未字的首筆畫或部件。
實(shí)施例2該實(shí)施例在實(shí)施例1的第二層次的漢字編碼碼元和編碼規(guī)則基礎(chǔ)上延伸和擴(kuò)展成第三層次的編碼規(guī)則,在單字輸入時,增加了漢字拼音的首字母作為編碼碼元,其編碼規(guī)則是單字按筆順前4個筆畫或部件和未筆畫或部件,再加該字拼音的首字母鍵作尾碼。
雙字詞、三字詞和多字詞的編碼規(guī)則同第二層次。
本實(shí)施例的其它操作同實(shí)施例1。
本發(fā)明的三個層次編碼的第一層次是從按筆順筆畫編碼切入,用戶上手就會用,無需切換地再使用提高輸入速度的高層次編碼。
例“吐”字三個層次編碼如下第一層次丨乙一一丨一 輸入編碼為25111第二層次口土 輸入編碼為08第三層次口土t輸入編碼為088按照第一層次輸入按筆順,易學(xué);按照第二層次輸入快捷;按第三層次輸入能減少重碼。
以上數(shù)字鍵位上的漢字部件設(shè)置和相對應(yīng)的編碼規(guī)則表明,第一層次用5個基本筆畫,也是單筆畫部件在1區(qū)的[1]~[5]五個鍵位上編碼。第二層次編碼是第一層次編碼的延伸和擴(kuò)展,除了5個基本筆畫外,增加了設(shè)置在2區(qū)的[6]~
上的優(yōu)選的25個多筆畫部件,在[1]~
十個鍵位上編碼。漢字中出現(xiàn)優(yōu)選部件時用[6]~
編碼,沒有優(yōu)選部件時,或者不愿意用多筆畫部件編碼時,仍用[1]~[5]鍵位進(jìn)行筆順筆畫編碼,可實(shí)現(xiàn)無切換輸入,使用方便。第三層次編碼是第二層次編碼的延伸和擴(kuò)展,只在單字輸入時,尾碼加一待輸入漢字拼音的首字母鍵,此碼消除了約50%的重碼字,大大降低了重碼字、詞鍵選率,提高了輸入速度。
本發(fā)明五行碼漢字輸入法所說的“五行”引自“易經(jīng)五行”,在此的含義是,該輸入法優(yōu)選了“金、木、水、火、土”這五個經(jīng)常用的成字作為多筆畫部件編碼碼元,以及該輸入法將這五個編碼碼元設(shè)置在同一個鍵位上輸入的意思。
權(quán)利要求
1.一種五行碼漢字輸入法,其特征是采用標(biāo)有漢字部件的漢字輸入數(shù)字鍵盤,所述的漢字輸入法包括以下步驟A、選擇確定數(shù)量的漢字部件作為編碼碼元的步驟,優(yōu)選含5個單筆畫部件和25個多筆畫部件的30個漢字筆畫部件作為編碼碼元,所述的筆畫部件為單筆畫部件 一(丿)丨(亅)丿丶(乁)乙多筆畫部件 大王日立禾人亻彳纟艸金木水火土氵冫扌宀讠口廣女寸辶;B、將漢字部件指定到所述的數(shù)字鍵盤的相應(yīng)鍵位上的步驟,上述30個漢字部件在數(shù)字鍵盤上的設(shè)置分成單筆畫部件和多筆畫部件兩個區(qū),每區(qū)五個鍵位,一區(qū)的[1]~[5]的五個鍵位每個設(shè)置一個唯一的單筆畫部件,二區(qū)的[6]~
的五個鍵位每個設(shè)置五個多筆畫部件,構(gòu)成階梯形結(jié)構(gòu),“金、木、水、火、土”5個部首部件設(shè)置在同一鍵位上,各鍵位的筆畫部件設(shè)置為區(qū) 數(shù)字鍵位 部件一單1一(丿)筆2丨(亅)畫3丿部4丶(乁)件5乙一多6大 王 日 立 禾筆7人 亻 彳 纟 艸畫8金 木 水 火 土部9氵 冫 扌 宀 讠件0口 廣 女 寸 辶C、利用上述鍵盤上的特定鍵位輸入漢字的步驟,采用多層次編碼規(guī)則輸入漢字,第一層次以5個單筆畫部件按筆順輸入,用一區(qū)的[1]~[5]五個數(shù)字鍵編碼,其編碼規(guī)則為單字按筆順前4個筆畫和未筆畫;雙字詞 首字按筆順前4個筆畫,次字按筆順前3個筆畫;三字詞 首字按筆順前4個筆畫,次字按筆順前2個筆畫,未字首筆畫;多字詞 首字按筆順前4個筆畫,次字、第三字和未字的首筆畫;第二層次延伸和擴(kuò)展第一層次的編碼碼元,以30個漢字部件作為編碼碼元,增加二區(qū)的編碼鍵位,用[1]~
十個數(shù)字鍵編碼,其編碼規(guī)則為單字按筆順前4個筆畫或部件和未筆畫或部件;雙字詞 首字按筆順前4個筆畫或部件,次字按筆順前3個筆畫或部件;三字詞 首字按筆順前4個筆畫或部件,次字按筆順前2個筆畫或部件,未字首筆畫或部件;多字詞 首字按筆順前4個筆畫或部件,次字、第三字和未字的首筆畫或部件。
2.根據(jù)權(quán)利要求1所述的一種五行碼漢字輸入法,其特征是所述的步驟C中利用上述鍵盤上的特定鍵位輸入漢字的第二層次延伸和擴(kuò)展成第三層次,第三層次的編碼規(guī)則為在單字輸入時以該字拼音的首字母作為尾碼,單字按筆順前4個筆畫或部件和未筆畫或部件,再加一該字拼音的首字母鍵。
3.根據(jù)權(quán)利要求1所述的一種五行碼漢字輸入法,其特征是所述的步驟B中一區(qū)[1]~[5]設(shè)置的單筆畫部件是不可置換的,二區(qū)[6]~
設(shè)置的多筆畫部件可置換,[6]~
鍵位上設(shè)置的部件數(shù)均不超過5個。
4.根據(jù)權(quán)利要求1所述的一種五行碼漢字輸入法,其特征是所述的步驟A中選擇作為編碼碼元的漢字部件,根據(jù)編碼字符集的大小和輸入軟件智能化程度,除“金、木、水、火、土”外的多筆畫部件可作調(diào)整。
全文摘要
本發(fā)明公開了一種五行碼漢字輸入法,適用于手機(jī)、掌上電腦、PDA記事本等使用數(shù)字編碼輸入漢字的裝置用于中文信息處理。該輸入法采用標(biāo)有漢字部件的漢字輸入數(shù)字鍵盤,包括優(yōu)選含單筆畫部件和多筆畫部件的漢字筆畫部件作為編碼碼元;將上述筆畫部件在數(shù)字鍵盤上設(shè)置成單筆畫部件和多筆畫部件兩個區(qū),每區(qū)五個鍵位,構(gòu)成階梯形結(jié)構(gòu),“金、木、水、火、土”5個部首部件設(shè)置在同一鍵位上;以編碼碼元編碼的多層次編碼規(guī)則,利用鍵盤上的特定鍵位輸入漢字三個步驟。該輸入法覆蓋編碼字符集大,易學(xué)性好、上手能用,平均碼長短,重碼字和詞鍵選率低,實(shí)現(xiàn)多層次編碼隨意混合使用,能進(jìn)一步提高漢字輸入速度,是適用人群寬的漢字?jǐn)?shù)字編碼輸入技術(shù)。
文檔編號G06F3/023GK1632731SQ20041009351
公開日2005年6月29日 申請日期2004年12月24日 優(yōu)先權(quán)日2004年12月24日
發(fā)明者陳一凡 申請人:何鏗