專利名稱:一種漢字編碼法及其輸入鍵盤的制作方法
所屬領(lǐng)域本發(fā)明涉及漢字編碼法,以及漢字輸入鍵盤。屬于計(jì)算機(jī)文字處理技術(shù)。
背景技術(shù):
漢字編碼排序是現(xiàn)代漢字學(xué)中一個重要的研究課題。1997年全國語言文字工作會議指出2010年前,漢字的社會應(yīng)用基本規(guī)范,用字將達(dá)較高的規(guī)范水平。漢字定序是漢字規(guī)范化的一個重要方面。目前整個民族進(jìn)一步開發(fā)智力和科技興國的堅(jiān)實(shí)步伐把促進(jìn)漢字的規(guī)范化提到了比以往任何時期都更為重要的地位。當(dāng)今市場上具有類似功能產(chǎn)品所使用的漢字處理方法,大致有以下兩種一、編號方法以分解漢字至簡單的筆形為至,這樣做既不符合漢字的成字規(guī)律,又使每個編號的實(shí)際位數(shù)增加,較繁瑣,不易掌握,不利于記憶,也不利于使用。二、應(yīng)用電腦的英文鍵盤處理漢字,占用26個字母鍵和10個數(shù)字鍵作文字輸入。鍵盤大,因此,不易用普通電話、計(jì)算器和手機(jī)數(shù)字鍵盤作文字輸入。
技術(shù)內(nèi)容本發(fā)明目的是公開一種漢字編碼法及其輸入鍵盤,涉及一種一分為二漢字號碼排序法,以構(gòu)成漢字的筆形及其組合體謂之字源為基礎(chǔ),將漢字的左右結(jié)構(gòu)形態(tài)視作標(biāo)準(zhǔn)狀態(tài)結(jié)構(gòu),而將其它非標(biāo)態(tài)的每個漢字一分為二化為標(biāo)準(zhǔn)態(tài),即視作由兩部分組成,每個漢字都是由字源組成的。每個字源又可由上下兩端特征所對應(yīng)的二位數(shù)字表示,兩個字源共有四位,然后依據(jù)四位代碼由小到大依次排列,就構(gòu)成了有序的漢字集合。具有即編即用,快速準(zhǔn)確、簡便易學(xué)的優(yōu)點(diǎn),特別適宜用于擴(kuò)展手機(jī)計(jì)算器、電話機(jī)等小型電子裝置的數(shù)字鍵盤作文字輸入。如發(fā)送短信息,增加漢語字、詞典軟件,促進(jìn)人們相互交流和學(xué)習(xí)知識的需求等。也可用于電腦中文信息處理,以及人名、地名、圖書編錄等需用字序之場合,是一種通用的漢字形序法。本發(fā)明輸入鍵盤可用10個數(shù)字鍵和一個輔助鍵的小鍵盤。
本發(fā)明的目的是這樣實(shí)現(xiàn)的將漢字分為兩類。。一類是無法轉(zhuǎn)換成標(biāo)準(zhǔn)形態(tài)的獨(dú)體字,這類字不必分解,本身就是一個字源;二類是左右結(jié)構(gòu)形態(tài)漢字,即標(biāo)準(zhǔn)形態(tài)。對非標(biāo)準(zhǔn)形態(tài)的漢字,一律應(yīng)用一分為二的方法予以轉(zhuǎn)換變成標(biāo)態(tài)部分例型,轉(zhuǎn)換的規(guī)則為以下轉(zhuǎn)換規(guī)則中1為左字源,2為右字源。 精選56種筆畫代表56字源,將56個字源分為10組,每組用0-9阿拉伯?dāng)?shù)字表示,如下所示;0-口、幾;1-宀、冖、一、 ;2-纟、 丨、 3-彳、亻、 勹、丿、;4-氵、冫、 5-扌、 匚、6- 兒、 勹、7- 乂;8-人、癶、丷、、 女、 9-忄、九、 巛、戊 小、 獨(dú)體字的編號為一個一位數(shù)或二位數(shù),分別用編號為0-9的10個相應(yīng)的數(shù)碼表示,標(biāo)態(tài)字兩字源中的第一字源和第二字源均按上下端字源數(shù)碼表示,每字最多有四位。再用數(shù)字鍵選擇同碼字。
本發(fā)明輸入鍵盤是10個數(shù)字鍵和一個輔助鍵的小鍵盤。10個數(shù)字鍵各鍵表示10組56字源。
實(shí)施方案由上述可知,漢字的排序號碼最高由一個五位碼組成,其中第一位或第一、二位碼是該字所在的左字源編碼;第二位、第二、三位或第三、四位數(shù)是該字右字源編碼;如果同號有重字。則以第五位數(shù)字區(qū)分。一分為二漢字號碼排序法同號重字率低,同號重字的絕對數(shù)量很少,同號重6-9字的百分率為3.3%,重復(fù)沒有超過9個字的,常用漢字完全可以用一個最高為五位的數(shù)字編碼表示。
本發(fā)明目的是公開一種漢字編碼法對漢字只經(jīng)過簡單有效的一分為二處理,其順序周期性就得以顯現(xiàn),極具實(shí)用意義,任何的再分解都顯得蒼白無力與畫蛇添足了。它免除了其它方法分解漢字時那種判斷是橫是豎,孰先孰后之苦,它的基本字源數(shù)量不多,代號簡單明白,一目了然。本發(fā)明目的是公開一種漢字編碼法,編號唯一,一步到位,位置準(zhǔn)確,即編即用。如用小型電子裝置擴(kuò)展功能時,再增加一個功能鍵,效果將會更加出色。功能鍵的作用有二減少擊鍵次數(shù),如磊字,正常應(yīng)擊鍵四次才可輸入,有了功能鍵擊三次鍵就能輸入了;本發(fā)明目的是公開一種漢字編碼法還可以用于漢語字、詞典、漢譯外詞典、電腦漢字處理系統(tǒng),以及其它需用漢字排序的場合。
本發(fā)明漢字編碼法結(jié)構(gòu)嚴(yán)謹(jǐn)、科學(xué)合理、簡單實(shí)用面向大眾、用途廣泛是一種更為有效、更為簡單的漢字排序方案。
下面舉例說明編號過程1、“清”字,此字是標(biāo)態(tài)字不必轉(zhuǎn)換,左字源為“”,故編碼為4、右字源上下端最具代表的特征是“一”,故編碼為51,清字最終編碼是451。“風(fēng)”字為三包圍結(jié)構(gòu)轉(zhuǎn)換后為幾、排序編號即為07。“文”字為上下結(jié)構(gòu),轉(zhuǎn)換為“”,編號為417?!靶颉弊譃閮擅姘鼑Y(jié)構(gòu),轉(zhuǎn)換后為“廣”、字源,排序編號為43;62。
2、0-9編碼中編號為0的有口、幾字,編號最大的字是憾、懈、編號9、95。00-99雙號編碼中“噩”字編號最小,是0011,編號最大字是“咎”字,編號為9990。
下面再舉幾個實(shí)例乙 6 葉 07上 211x司 610筆 8435春 5801 國 014 唱 001芋 612 林 79x 連 7549趙 787x注x為功能鍵。
可以看出,非標(biāo)態(tài)漢字一分為二轉(zhuǎn)換成標(biāo)態(tài),都是以人們熟知的偏旁部首,或在明顯的分界點(diǎn)轉(zhuǎn)換和遵從書寫習(xí)慣來劃分的,一般都是在心中完成這道工序的。字源與代碼之間也頗多聯(lián)系,并具有一定的規(guī)律可循。如以國家語委規(guī)范的“札”字筆形作基礎(chǔ),口為0,形似漢字八的皆作8,九作9等,存在廣闊的聯(lián)想空間,這對增強(qiáng)記憶創(chuàng)造了條件,最大限度地避免了死記硬背之苦。
本發(fā)明利用漢字所固有的順序信息,兼容了快與準(zhǔn)的矛盾,實(shí)現(xiàn)漢字輸入一步到位。本發(fā)明克服已有技術(shù)的不足,依據(jù)科學(xué)合理、簡單實(shí)用的原則,對漢字作整體考察、分析、統(tǒng)一編號排序。該法經(jīng)檢驗(yàn)表明,四鍵字(包括一、二、三鍵)可達(dá)到61%。重2-5字的重字率為35.7%,重6字以上的百分?jǐn)?shù)僅3.3%,且最多同號重字?jǐn)?shù)量為9字,所以每個常用字都可用一個不重號的五位數(shù)表示。本發(fā)明漢字編碼法是開發(fā)新產(chǎn)品,擴(kuò)展小型電子裝置功能的首選技術(shù)方案,生產(chǎn)電子型漢語字詞典的最佳科學(xué)方法。還適用于電腦漢字處理系統(tǒng),人名、國名的排序以及需要用漢子排序的其它領(lǐng)域。
權(quán)利要求
1.一種漢字編碼法及其輸入鍵盤,將漢字分為兩類。。一類是無法轉(zhuǎn)換成標(biāo)準(zhǔn)形態(tài)的獨(dú)體字,這類字不必分解,本身就是一個字源;二類是左右結(jié)構(gòu)形態(tài)漢字,即標(biāo)準(zhǔn)形態(tài)。對非標(biāo)準(zhǔn)形態(tài)的漢字,一律應(yīng)用一分為二的方法予以轉(zhuǎn)換變成標(biāo)準(zhǔn)形態(tài),轉(zhuǎn)換的規(guī)則為其中1為左字源,2為右字源。 精選56種筆畫代表56字源,將56個字源分為10組,每組用0-9阿拉伯?dāng)?shù)字表示,如下所示;0-口、幾;1-宀、冖、一、 ;2-纟、 冂、丨、 3-彳、亻、 勹、丿、;4-氵、冫、 5-扌、 匚、6- 兒、 勹、7- 乂;8-人、癶、丷、、 女、 9-忄、九、 巛、戊、 小、 獨(dú)體字的編號為一個一位數(shù)或二位數(shù),分別用編號為0-9的10個相應(yīng)的數(shù)碼表示,標(biāo)態(tài)字兩字源中的第一字源和第二字源均按上下端字源數(shù)碼表示,每字最多有四位。再用數(shù)字鍵選擇同碼字。本發(fā)明輸入鍵盤是10個數(shù)字鍵和一個輔助鍵的小鍵盤。10個數(shù)字鍵各鍵表示10組56字源。
全文摘要
本發(fā)明目的是公開一種漢字編碼法及其輸入鍵盤,以構(gòu)成漢字的筆形及其組合體謂之字源為基礎(chǔ),每個漢字都是由字源組成的。每個字源又可由上下兩端特征所對應(yīng)二位數(shù)字表示,將漢字的左右結(jié)構(gòu)形態(tài)視作標(biāo)準(zhǔn)狀態(tài)結(jié)構(gòu),而將其它非標(biāo)態(tài)的每個漢字一分為二化為標(biāo)準(zhǔn)態(tài),就構(gòu)成了有序的漢字集合。具有即編即用,快速準(zhǔn)確、簡便易學(xué)的優(yōu)點(diǎn),特別適宜用于擴(kuò)展手機(jī)、計(jì)算器、電話機(jī)等小型電子裝置的數(shù)字鍵盤作文字輸入。如發(fā)送短信息,增加漢語字詞典軟件,促進(jìn)人們相互交流和學(xué)習(xí)知識的需求等。也可用于電腦中文信息處理,以及人名、地名、圖書編錄等需用字序之場合,是一種通用的漢字形序法。本發(fā)明輸入鍵盤可用10個數(shù)字鍵和一個輔助鍵的小鍵盤。
文檔編號G06F3/023GK1399186SQ02132488
公開日2003年2月26日 申請日期2002年6月25日 優(yōu)先權(quán)日2002年6月25日
發(fā)明者林海波, 林麟 申請人:林海波