專利名稱:一種漢字?jǐn)?shù)碼鍵盤輸入方法
技術(shù)領(lǐng)域:
本發(fā)明屬于漢字信息處理技術(shù),是一種漢字的數(shù)字鍵盤輸入方法,特別適用于手機(jī)、電子記事本、收款機(jī)等小型電子設(shè)備的數(shù)字小鍵盤的漢字輸入方法,當(dāng)然也適用計(jì)算機(jī)上數(shù)字鍵盤的漢字輸入。
背景技術(shù):
隨著手機(jī)、收款機(jī)等小型電子設(shè)備的迅速發(fā)展,必須配以數(shù)字小鍵盤為操作工具的漢字?jǐn)?shù)碼輸入方法?,F(xiàn)有的此類數(shù)字鍵盤輸入方法有兩種,一是漢語拼音法,二是漢字筆畫法,這兩種數(shù)碼輸入法都存在按鍵次數(shù)太多,重碼率太高,速度慢的缺點(diǎn)。本發(fā)明的目的在于提供一種按鍵次數(shù)更少,重碼更低,速度更快些的漢字?jǐn)?shù)碼鍵盤輸入方法。
發(fā)明內(nèi)容
本發(fā)明構(gòu)思源自漢字字典的傳統(tǒng)檢字方法的偏旁部首和四角號碼法,將各有利弊的部首法和四角號碼法加以改造,取其所長融合而成的,即選擇少于100個部首和筆畫作為組成漢字的構(gòu)件,并對這些構(gòu)件依照他們的特征予以歸納分類,以1、2、3……9、0等10個數(shù)碼代表這些構(gòu)件。然后在配以若干條取碼規(guī)則,組成完整的漢字編碼方法。有了該編碼方法,就可依此使用電子設(shè)備的數(shù)碼鍵盤將漢字存入或取出。下面對本發(fā)明一種漢字?jǐn)?shù)碼鍵盤輸入方法的具體內(nèi)容做詳細(xì)說明。本發(fā)明方法包括如下步驟第一步、選定漢字組字構(gòu)件。
首先深入分析漢字部首檢字法,研究如何將漢字二次查找變成一次查找。漢字部首檢索法就是先查部首再查這個部首中的漢字,我們叫二次查找法,而不能象查英文字典那樣一次查找,如果我們要實(shí)現(xiàn)漢字的一次查找就要研究二個問題。一是漢字部首的數(shù)量問題,現(xiàn)在新華字典的部首為189個,權(quán)威的康熙字典為214個,古老的《說文解字》有540個部首。這說明隨著文明的發(fā)展,漢字的部首是在減少的,但減少的速度是非常緩慢的,正如有些專家說的,要使部首減少到100個以內(nèi)就是很大的成功。二是漢字部首的位置問題。人們在經(jīng)常查字典中發(fā)現(xiàn),絕大部分的部首都在字的左邊、上方、左上方或外框上,這類字要占九成以上,同時有少數(shù)字其部首所在位置不定,上下、左右、內(nèi)外都有,因此有些字是很難查到的。能否對這些字的部首也限制在字的左方、上方、左上方或外框上,這就是我們所說的部首統(tǒng)一原則。以上兩個問題統(tǒng)一起來,就是如何選擇部首了。研究表明,部首個數(shù)多少,與重碼率密切相關(guān),部首個數(shù)少,重碼率會上升。依照上述幾個原則,一個最佳方案是選用88個部首,使重碼字最多不超過8個字。
為了與傳統(tǒng)漢字部首相區(qū)別,我們把篩選確定的88個筆形不叫部首而是統(tǒng)一稱為構(gòu)件。這些構(gòu)件既要符合傳統(tǒng)部首的要求,能夠?qū)⑺械臐h字包括繁體字都能夠表達(dá)出來,又要符合漢字簡化后的要求,如簡化后引進(jìn)的多折筆形都是一筆畫;這些構(gòu)件既是標(biāo)準(zhǔn)漢字的科學(xué)拆分,如要求對所有漢字的部首唯一,沒有二義性;更要貫徹漢字交重筆畫不能拆分的原則。為此在88個構(gòu)件中,引進(jìn)“叉”和“串”兩類筆形,可以表達(dá)所有含有交重筆畫的交重字。這88個構(gòu)件可以分為三類筆形,一是基本筆畫,包括橫(一)、提 撇(丿)、豎(丨)、鉤(亅)、點(diǎn)(丶)和捺()共7個,可以看出,與原有的傳統(tǒng)基本筆畫相比,只是去掉折(乙、 乚)而加進(jìn)了鉤(亅)。二是簡碼字26個,原為部首字有一、水、巾、田、十、口、目、皿、日、曰、廠、又、八、人(入)、卜、小、心、幾、月、金共20個,另有七、豐、丈、卅、匕、的共6個,這是新華字典上部首字中所沒有的。我們之所以把“的”字定為簡碼,是因?yàn)樵跐h字應(yīng)用中出現(xiàn)“的”字頻率最大。三是余下的55個為復(fù)合筆畫,有的是作為簡碼字的變形,有的是作為數(shù)字碼的象形而引進(jìn)的。這88個漢字構(gòu)件的筆形與代碼如下表所示。
這些漢字構(gòu)件及其代碼的主要內(nèi)容可以用四句口訣來表述一橫二垂三點(diǎn)水,四叉五串六方框,七角八八九頭小,零幾雙角月皿金。而這四句口訣中的核心內(nèi)容又是“一橫、二垂、三點(diǎn)、四叉、五串、六方、七角、八八、九小、零雙角”。從這88個構(gòu)件在漢字中出現(xiàn)的頻率來看,這一核心內(nèi)容(即“一橫、二垂、三點(diǎn)、四叉、五串、六方、七角、八八、九小、零雙角”)已占絕大部分。顯然這一核心內(nèi)容是十分便于學(xué)習(xí)和記憶的。
第二步、按照下述的一定取碼規(guī)則,對國家標(biāo)準(zhǔn)GB/T18031-2000《信息技術(shù)數(shù)字鍵盤漢字輸入通用要求》的《信息交換用漢字編碼字符的基本集》的6763個漢字(其中部首46個)逐一進(jìn)行編碼,每個漢字有一組唯一由1-4位數(shù)組成的數(shù)碼。結(jié)果顯示這6763個漢字的數(shù)碼完全不同的占39%,重碼最多不超過8個字,從而做到在手機(jī)顯示屏上不必翻頁。
第三步、依照上述每個漢字的編定的數(shù)碼,對電腦漢字庫內(nèi)的漢字進(jìn)行編碼,即對每個漢字的編碼數(shù)字在電腦鍵盤上的1、2、3……9、0等10個數(shù)字鍵的對應(yīng)鍵上擊鍵一次,將每個漢字的數(shù)字編碼存入電腦內(nèi),建立漢字?jǐn)?shù)碼信息庫,如需檢索漢字時,只需在電腦漢字操作系統(tǒng)下,將該漢字的數(shù)碼鍵入,就可取出所查的漢字。這就是本發(fā)明方法的全過程。
前面所說的取碼規(guī)則包括1、取碼總則。它可用四句口訣表述左上取碼順時轉(zhuǎn),最多只取四個碼,筆畫交重不拆分,連離可分要取大。即每個字都從左上角開始取第一碼,然后按順時針方向旋轉(zhuǎn)依次取第二、第三、第四碼,而且最多只取四個碼。至于第二、三、四碼具體在何處取,要依不同字體結(jié)構(gòu)而定。取碼遇到交重筆畫時,不能把他們拆分開來,要看成整體來進(jìn)行取碼。例如“弋”取43,“戈”取53,是對號入座。對于那些表面分離的而內(nèi)在有聯(lián)系的筆畫,要盡可能把它看成整體進(jìn)行取碼,例如“尸”取62而不能取別的碼,“尺”應(yīng)取為68而不能取632。
2、取碼“序位”規(guī)則。漢字是方塊字,依其不同結(jié)構(gòu)可以分為左右結(jié)構(gòu);左中右結(jié)構(gòu);上下和上中下結(jié)構(gòu);包圍結(jié)構(gòu);混合結(jié)構(gòu)。不同結(jié)構(gòu)類型的字,雖然其第一碼都必須從左上角取碼,而且按順時針方向轉(zhuǎn)位,但其具體“序位”卻是不同的,其規(guī)則是(1)左右結(jié)構(gòu)的取碼序位是左上角→右上角→右下角→左下角。例如“旋”取9887;“轉(zhuǎn)”取4535;“但”取861;“明”取60。
必須強(qiáng)調(diào),當(dāng)左右結(jié)構(gòu)漢字中含有“冂、門、 戊”時,對“冂、門、 戊”內(nèi)的部件都要優(yōu)先取碼。例如;“禍”應(yīng)取3608不能取3602;“燜”取9309不能取9308;“颯”取9041;“城”取4537。
(2)左中右結(jié)構(gòu)的取碼序位是左上→中上→右上→右下,例如“鴻”取3123;“衍”取2312;“班”取1211;“收”取7284;“師”取214。
左右(包括左中右)結(jié)構(gòu)約占漢字總數(shù)的80%,可見以上兩種序位規(guī)則占大多數(shù)情況。
(3)上下或上中下結(jié)構(gòu)的取碼序位是上方→下方→再自下而上(必要輔以自左至右)取足四碼。例如“節(jié)”取59;“支”取47;“善”取8619;“兔”取2043;“五”取1147;“美”取8841;“羅”取6723。
必須特別指出,當(dāng)上下結(jié)構(gòu)或上中下結(jié)構(gòu)漢字中含有“八、大、人、乂、又”時,如“叁”取0118;“參”取0228;“冬”取2373;“祭”取2791;“薟”取5198;“爸”取8062;“蠶”取1315;“賽”取3808;“驀”取5317;“譽(yù)”取9611等字,從下方自下而上取碼時,在“八、大、人、乂、又”下最多只涵蓋一個基本筆畫,其他筆畫都要依次先取。
(4)冂、門、 戊、囗等包圍結(jié)構(gòu)字形的取碼序位是先取上方和外框碼→再進(jìn)入框內(nèi),在框內(nèi)右下部取碼→再按順時針方向自右至左或者自下至上,取足四碼。例如“閂”取301;“闊”取3063;“閩”取3031;“閫”取3069;“圃”取6053;“園”取6021;“四”取672;“岡”取04;“網(wǎng)”044;“凰”取0141;“夙”0723;“咸”取5362;“成”取5372。
3、在字的上方或下方取碼時,若有數(shù)個獨(dú)立筆畫可取,則要比高低而定上部高者優(yōu)先,下部低者優(yōu)先。字上部的點(diǎn)“丶”畫也屬優(yōu)先取碼之列。例如字上部的“ 夊、 夕、勹、山”都應(yīng)當(dāng)取“2”。又如“義”取34;“為”取3473;“書”取5377。再如字中有如“石、 勿、者”構(gòu)成的字“柘”取4169;碭取1326;“竣”取9071;“履”取6782;“忽”取2927;“堵”取4461。
4、對字上下部難以區(qū)分高低的獨(dú)立部件都要取。如朱、監(jiān)、彖、羋、長、叟、兜、盥等字的上部的獨(dú)立部件都是要取的。字下部如“乖”取2043;“弟”取8352;“姊”取4532;“韓”取4574;“岈”2142;“財(cái)”取0428。
5、交重筆畫取碼規(guī)則。對于交重筆畫的取碼,除了在總則中所講的“不拆分”以外,還應(yīng)當(dāng)遵從如下細(xì)則(1)由橫、提、撇、豎、鉤、點(diǎn)、捺等基本筆畫組成交重筆畫時,可以多次“取碼”,即可看成某一長筆畫由若干段連接而成的。例如“夫、未、末、來、夾”等字其上部都要取串5,其下部就只能分別以“八、個、個、個、八”來取碼了。中間還可對 取碼,這里把“丿”、“丨”看成上、下二段,或上中下三段,上段構(gòu)成“串”的組成筆畫,下段構(gòu)成“八、個”的組成筆畫,中段組成 的筆畫。簡而言之,就是上、下取了二次或上中下三次。
(2)如果被交重的筆畫不是基本筆畫,則只能取一次而不得取二次。例如“沛、芾、肺、制”等字中,直“丨”的被串筆畫中含有“冂”,這是非基本筆畫,因而對這些字取碼時“丨”不能分為上、下二段,即不能取上、下二次,所以當(dāng)上部取了“串5”以后下部留下的是“冂”,而不是“巾”。又如“央、英”只能取580、5850。再如“冉”字拆為“、艸、冂”取550。
(3)若字中插串的筆畫不是基本筆畫,那么它所形成的“角”是應(yīng)當(dāng)被取碼的。例如“戔、東”字中,插串的筆畫是 它不是基本筆畫,依前條規(guī)則,它不能折成二段,只能取一次碼。但本條又規(guī)定,它自身形成的“角”將被取碼。可見在這些字中的筆畫 在取碼過程中,實(shí)際上被用了二次。故“戔”取537;“東”取4947。
本發(fā)明方法具有下述優(yōu)點(diǎn)構(gòu)件數(shù)量少,特征明確,不易混淆,分布均勻;遵從漢字傳統(tǒng)習(xí)慣,符合國家標(biāo)準(zhǔn),尤其引入叉和串兩類構(gòu)件,實(shí)行“交重不拆”原則,確保首碼唯一;每個漢字的碼數(shù)有多有少,最多4碼,這就是充分利用漢字信息,而且減少了重碼,一碼一字占39%,重碼字最多的也不超過8個,因而在手機(jī)顯示屏上不必翻頁;全部內(nèi)容集中反映在8句口訣中,易學(xué)易記,易于推廣應(yīng)用。
本發(fā)明方法對更多數(shù)量的漢字集如中日韓國際標(biāo)準(zhǔn)字集共有20902個漢字(GB13000),同樣可以使用,只是重碼字會略有增多。
權(quán)利要求
1.一種漢字?jǐn)?shù)碼鍵盤輸入方法,其特征是有如下步驟(1)篩選確定如下表所列的88個筆形作為組成漢字的構(gòu)件,并按照這些構(gòu)件的特征,歸納分為10類,分別以1、2、3、4……9、0等10個數(shù)字予以代表,漢字構(gòu)件及其代碼的主要內(nèi)容可以用四句口訣來表述一橫二垂三點(diǎn)水、四叉五串六方框、七角八八九頭小、零幾雙角月皿金;漢字?jǐn)?shù)碼的筆形與代碼表 (2)依照下述取碼規(guī)則,遵循國家標(biāo)準(zhǔn)GB/T18031-2000《信息技術(shù)數(shù)字鍵盤漢字輸入通用要求》,對《信息交換用漢字編碼字符的基本集》(GB2312-80)的6763個漢字(其中部首46個)逐一進(jìn)行編碼,每個漢字有一組唯一的由1-4位數(shù)組成的數(shù)碼;(3)依照上述每個漢字的編定的數(shù)碼,對電腦漢字庫內(nèi)的漢字進(jìn)行編碼,即對每個漢字的編碼數(shù)字在電腦鍵盤上的1、2、3……9、0等10個數(shù)字鍵的對應(yīng)鍵上擊鍵一次,將每個漢字的數(shù)字編碼存入電腦內(nèi),建立漢字?jǐn)?shù)碼信息庫,如需檢索漢字時,只需在電腦漢字操作系統(tǒng)下,將該漢字的數(shù)碼鍵入,就可取出所查的漢字;所說的取碼規(guī)則,有以下幾條(1)取碼總則也可以用四句口訣表述——左上取碼順時轉(zhuǎn)、最多只取四個碼、筆畫交重不拆分、連離可分要取大;(2)取碼“序位”規(guī)則,依漢字結(jié)構(gòu)而定,即左右結(jié)構(gòu)字為左上角→右上角→右下角→左下角;左中右結(jié)構(gòu)漢字為左上→中上→右上→右下;上下或上中下結(jié)構(gòu)漢字為上方→下方→再自下至上(必要時再輔以自左至右)取足四碼;門、冂、 戊、口等包圍或半包圍結(jié)構(gòu)漢字為先取上方和外框→再從右下角進(jìn)入框內(nèi)依順時針方向自右至左或自下至上取足四碼;(3)對交重筆畫的取碼,除總則“不拆分”以外,還應(yīng)遵從以下細(xì)則由橫、提、撇、豎、鉤、點(diǎn)、捺等基本筆畫組成的交重筆畫,可以多次取碼;如果被交重的筆畫不屬于基本筆畫,則不得多次取碼;如果字中交重的筆畫不是基本筆畫,那么它形成的“角”應(yīng)當(dāng)按順序取碼;(4)在字上方或下方取碼時,若有數(shù)個獨(dú)立筆畫可取時,要比高低而定,上方時取最高者,下方時取最低者;字上下方難以區(qū)分高低的獨(dú)立筆畫都要取碼;字上方、左、右角的點(diǎn)畫“、”應(yīng)當(dāng)優(yōu)先取碼。
全文摘要
本發(fā)明提供一種以10個數(shù)字鍵盤為操作工具的漢字輸入方法,特別適用于手機(jī)、收款機(jī)等小型電子設(shè)備的漢字信息處理,當(dāng)然也適用于一般電腦。該方法的核心內(nèi)容,可以用8句口訣來表達(dá)“一橫二垂三點(diǎn)水,四叉五串六方框,七角八八九頭小,零幾雙角月皿金”;“左上取碼順時轉(zhuǎn),最多只取四個碼,筆畫交重不拆分,連離可分要取大?!北痉椒ň哂袠?gòu)件數(shù)量少、擊鍵次數(shù)少、重碼率低;構(gòu)件特征明顯、不易混淆、首碼唯一、分布均勻;遵從漢字傳統(tǒng)習(xí)慣,符合國家標(biāo)準(zhǔn),取碼規(guī)則簡單,易學(xué)易記,便于推廣等優(yōu)點(diǎn)。
文檔編號H04M1/23GK1525296SQ20041001658
公開日2004年9月1日 申請日期2004年2月24日 優(yōu)先權(quán)日2003年3月1日
發(fā)明者譚國政 申請人:譚國政, 譚文武