專利名稱:直觀碼漢字輸入方法及鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼方法及其鍵盤,特別是一種直觀碼漢字輸入方法及其鍵盤。
隨著信息時代的到來,計算機(jī)技術(shù)在我國日益普及和推廣,中文信息處理現(xiàn)代化的進(jìn)程不斷加快,對漢字信息處理技術(shù)提出的要求越來越高。
幾十年來,為了解決漢字輸入計算機(jī)難的問題,海內(nèi)外炎黃子孫進(jìn)行了堅持不懈的努力,創(chuàng)造出近千種漢字輸入方法,在實(shí)現(xiàn)四個現(xiàn)代化的進(jìn)程中,譜寫了具有劃時代意義的篇章。
已取得的成果,使我們歡欣鼓舞。同時,我們也看到,漢字輸入難的問題尚未得到根本上地解決易學(xué)的輸入方法輸入速度慢,輸入速度快的又不好學(xué),形成漢字輸入的“瓶頸”問題。拼音碼簡單,或者不用重學(xué)(如“全拼”),或者學(xué)習(xí)難度不大(如“雙拼”),但重碼率太高;現(xiàn)行拼形碼重碼率低(如“王碼”、“鄭碼”),可以實(shí)現(xiàn)“盲打”,但拆分規(guī)則繁雜,記憶量大,難學(xué)易忘。
今天我們提供的“直觀碼漢字輸入法”,是在對幾千個漢字從形、音、義幾個角度進(jìn)行全方位的分析、對比、歸納、整理的基礎(chǔ)上,對十多種典型漢字編碼方法分析研究,取長補(bǔ)短,設(shè)計出的新型漢字輸入方案。方案的核心在于用直觀象形的方法描述漢字結(jié)構(gòu)。
現(xiàn)行以形為主的漢字編碼方法,或者采用形音形轉(zhuǎn)換確定鍵位法,或者采用劃區(qū)定位確定鍵位法。形音形轉(zhuǎn)換確定鍵位法,如“大眾音形碼”,將漢字的構(gòu)件(形)先轉(zhuǎn)換成音,再根據(jù)音確定輸入鍵位。例如,“樓”字由“木”、“米”、“女”三個構(gòu)件組成。它們的漢字拼音分別是MU、MI、NU。據(jù)此依次取每個構(gòu)件的聲母MMN作“樓”字的編碼。這種方法的缺點(diǎn)是一、很多構(gòu)件并不獨(dú)立成字,所以只能靠人為定音,增加記憶量;二、錄入時,大腦不斷進(jìn)行形音形轉(zhuǎn)換判斷,容易造成疲勞。
劃區(qū)定位法,如“五筆字形”,將漢字的構(gòu)件,根據(jù)起筆確定該構(gòu)件所屬區(qū),再根據(jù)其它特征確定區(qū)中的位,區(qū)位結(jié)合判斷對應(yīng)鍵位。這種方法規(guī)律性強(qiáng),經(jīng)過長時間學(xué)習(xí)和訓(xùn)練,能夠熟練掌握。但其最大缺點(diǎn)是,學(xué)習(xí)難度大。主要表現(xiàn)在初始入門記憶量大,且區(qū)位判斷容易造成大腦疲勞,所以正常使用范圍一般不超出專業(yè)錄入人員。而一般人員往往是望而卻步。“鄭碼”也屬于劃區(qū)定位形碼,同時使用主輔雙碼制,體系嚴(yán)密。但同樣難記易忘,而且判斷難度還大于“五筆字型”。
本發(fā)明的目的是要提供一種比學(xué)拼音還容易得多,只要會寫漢字就能輸入漢字,命中率高,記憶量小的直觀碼漢字輸入方法及鍵盤,使?jié)h字輸入成為人人都會的大眾化常識,從而基本解決漢字輸入的“瓶頸”問題。
本發(fā)明的目的是這樣實(shí)現(xiàn)的該直觀碼漢字輸入方法是采用直觀形托輔以字型碼幾何描述的形式,用拉丁字母(A-Z)對漢字進(jìn)行編碼,實(shí)現(xiàn)用計算機(jī)鍵盤輸入漢字及詞組。直觀碼漢字輸入方法根據(jù)漢字基本構(gòu)件的形狀與鍵盤字母形狀相同或相似的關(guān)系直接確定鍵位,不需要任何形音形轉(zhuǎn)換或劃區(qū)定位的過程。取碼順序,除極個別情況,符合漢字傳統(tǒng)書寫筆順。如日--B、卯--GP、丁--J、吆--OW、藝--HZ。直觀碼自始至終遵循了用同形或近形字母鍵描述漢字構(gòu)件的原則,同時盡量保持了高頻構(gòu)件及一些難拆構(gòu)件的完整性,避免了對漢字獨(dú)立部分的過細(xì)拆分。尤其對常用傳統(tǒng)漢字部首,一律用單碼或雙碼表示。
直觀碼用固定的四個字形碼對漢字構(gòu)件間的位置關(guān)系進(jìn)行粗略的描述,使一維編碼的實(shí)際效果相當(dāng)于二維編碼,同時保證了字形碼與同形件碼重合的幾率極小。
漢字編碼方法具體說明如下
直觀碼碼長為4。
(一)、基礎(chǔ)構(gòu)件
直觀碼選如下二十六個組字構(gòu)件為基礎(chǔ)構(gòu)件。它們的共同特點(diǎn)是,同對應(yīng)鍵盤字母的象形程度極高小 日 匚 目 彐
艸 丨 丁 丬 爪ABC D E F G HI J K L M冂 口 卩 又 尺 丂 凵 人 幺 乂 丫 乙NOP Q R S T UV W X Y Z示例
唱--OBB 卯--GP 盯--DJ 雙--QQ
內(nèi)--NV 從--VV 舊--IB 岡--NX
(二)、同鍵構(gòu)件
直觀碼在確定二十六個基礎(chǔ)構(gòu)件的基礎(chǔ)上,通過形狀上的近似關(guān)系,將其余組字構(gòu)件分成26類,分別與26個基礎(chǔ)構(gòu)件一起歸為26個同鍵構(gòu)件組(詳見圖一)A 小 忄 水
G
斤
立B 日 曰 白 H 廾 艸 廿
丌C 匚 刀 力 冖 宀 I 丨 氵D 目 自 罒 田 由 J 丁 廠 丿E 彐 王 三 豐 也 K 丬 扌 大 兀 F
工 土 千L 乚 讠 M爪 爫 巾
竹T 十
N(n) 冂 門 幾
U 凵 一 亠O口 囗 V 人 八 亻 冫P 卩 阝 尸 戶
W
纟幺Q又 厶 文 女 夕X乂
犭
R尺 艮 足 蟲 貝Y 丫 入 兒 彳S丂
己 巳Z 乙 廴 辶乛
示例學(xué) 冖 子----A C Z 農(nóng)冖
----C G范艸 氵
----H I P 新立 木 斤 ---G T G站立 口----G L O 基艸 三 八 土----H E V F用冂 ----N F國口 王 丶 ----O E L簡 門 日--M N B冊
一 ----N N U
(三)、字型碼
直觀碼將漢字構(gòu)件間位置關(guān)系確定為四種上下關(guān)系、左右關(guān)系、包圍關(guān)系及交叉關(guān)系。構(gòu)件之間可以是分離的,亦可以是連接的。包圍關(guān)系可以是全包圍,亦可以是半包圍。交叉關(guān)系可以是直接交叉,亦可以是嵌套交叉。直觀碼分別用I、W、Y表示上下、左右及包圍或交叉關(guān)系。字型碼加在二件字和三件字后,滿件字不加字型碼。
另外,直觀碼將左右型三件字中■〓型字(左邊一件,右邊上下兩件),如″按″、″彷″,定義為標(biāo)準(zhǔn)三件字,并用字型碼H表示。示例
朵上下分離關(guān)系 幾木----N T I
不上下連接關(guān)系 一
----U A I
組左右分離關(guān)系 纟且----W D W
生左右連接關(guān)系 丿----J E W
囚全包圍分離關(guān)系 囗人----O V Y
勿半包圍連接關(guān)系 勹
----C J Y
農(nóng)直接交叉關(guān)系 冖
----C G Y
鄭非標(biāo)準(zhǔn)三件左右關(guān)系 大阝 ----K K P W
聊非標(biāo)準(zhǔn)三件左右關(guān)系 耳
卩 ----G G P W
茄三件上下關(guān)系 艸力口 ----H C O I
喜三件上下關(guān)系 士
口 ----F R O I
摟標(biāo)準(zhǔn)三件左右關(guān)系 扌米女 ----K M Q H
杯標(biāo)準(zhǔn)三件左右關(guān)系 木一
----T U A H園三件包圍關(guān)系囗二兒----O U Y Y迢三件包圍關(guān)系辶刀口----Z C O Y巫三件嵌套關(guān)系工人人----F V V Y垂三件交叉關(guān)系千艸二----F H F Y
需要注意的是,直觀碼將包圍或嵌套件與習(xí)慣筆順無關(guān)地作為該字的首件處理,達(dá)到了包圍或嵌套型字取碼順序統(tǒng)一。例如囤 OUMY 延 ZJHY 建 ZEFY
(四)、補(bǔ)足碼
直觀碼為了使碼長一致,設(shè)定了補(bǔ)足碼(G)。補(bǔ)足碼只出現(xiàn)在兩件字編碼中,用在第四位,即在字型碼后。例如
如QOWG 雞QSWG
(五)、獨(dú)立構(gòu)件字
直觀碼將獨(dú)立構(gòu)件成字分為兩類對形狀與鍵盤字母形狀近似程度較高的25個字,用″件碼+YYY″的模式編碼。它們是小日刀目王工斤廿廠AYYY BYYY CYYY DYYY EYYY FYYY GYYY HYYY JYYY大言爪幾口尸又尺己KYYY LYYY MYYY NYYY OYYY PYYY QYYY RYYY SYYY十一人幺七丫 乙TYYY UYYY VYYY WYYY XYYY YYYY ZYYY其余統(tǒng)一用″構(gòu)件整碼+Y+細(xì)分首碼+細(xì)分尾碼″的模式編碼。如力 CYZJ牙 GYGJ女QYXU子 ZYZU
(六)、詞組編碼
為了提高輸入效率,直觀碼采用了詞組縮合編碼方式,碼長同單字碼長,為四碼。詞組編碼模式如下
二字詞依次取首次兩字的首次碼。如
建設(shè)ZE(FY)+LN(QH)-->ZELN
祖國UD(WH)+OE(LY)-->UDOE
三字詞依次取首次二字的首碼和末字的首次碼。如
計算機(jī)L(TWG)+M(DHI)+TN(WG)-->LMTN
電視臺B(LYG)+U(RWG)+QO(IG)-->NUQO
多字詞四字及四字以上的詞為多字詞。編碼依次取首次三末字的首碼。如
精益求精M(ENH)+K(VDI)+U(ALY)+M(ENH)---->MKUM
國民經(jīng)濟(jì)O(ELY)+P(XYH)+W(QFH)+I(QJH)---->OPWI
中國共產(chǎn)黨O(IYG)+O(ELY)+H(VIG)+A(COY)---->OOHA
(七)、簡碼字
一級簡碼字
直觀碼對使用頻率最高的26個單字詞,設(shè)置了一級簡碼輸入法。它們的對應(yīng)碼,有的是取了全碼的首碼,有的需聯(lián)想記憶。
取了部首碼的
是、地、大、說、一、人、在、這、也、到;
B F K L U V X Z E Q
根據(jù)漢字局部形狀聯(lián)想確定的
個、能、要、把、的、上、我、了、還、有、
A C D S G H I J M N
和、都、就、不、來、著。
O P R T W Y
二、三級簡碼字
直觀碼并未特設(shè)二、三級簡碼字。但因?yàn)橹庇^碼中所有漢字出現(xiàn)在提示行中的順序由如下三個因素共同決定①、漢字用作單字詞的頻度;②、漢字用作單字詞和詞組成素的總頻度;③、漢字在直觀碼方案中的編碼順序。所以擊兩鍵后出現(xiàn)在提示行第一位的就相當(dāng)于二級簡碼字,擊三鍵后出現(xiàn)在提示行第一位的就相當(dāng)于三級簡碼字。
(八)、兩件字細(xì)分
為了提高編碼命中率,直觀碼對幾百個兩件字設(shè)置了第二種細(xì)分編碼方案。其原則是
1、對典型漢字部首件不再細(xì)分。它們是
忄 日 冖 宀 目
钅 艸 氵 廠 廣 扌
讠 月 口 阝 女 蟲 石 木 礻 衤 亻
纟 犭 火 辶 廴
2、對一些構(gòu)件按標(biāo)定規(guī)則細(xì)分,將兩件字改為三件字或四件字(上面指出的作典型部首的情況除外)。例如
白丿日亡丶匚且
一 壬丿士 土十一
J B L C N U J F T U
牙
丿
八 良丶艮 寸
丶 子了一
G J J VL R T L Z U需要注意的是,詞組中構(gòu)件不再細(xì)分。細(xì)分規(guī)則詳見圖2A、B。
(九)、非字字符編碼
國標(biāo)二級漢字中的36個非字字符編碼如下
1、單碼字符II+字根碼+G
如忄--IIAG 刂--IIJG 纟--IIWG
2、雙碼字符II+首碼+尾碼
如饣--IICL 肀--IIEI
--IIUI
(十)、非基本構(gòu)件拆分
非基本構(gòu)件的拆分請參見圖4A、B。
(十一)、常用符號輸入方法
為了方便用戶,直觀碼提供在半角狀態(tài)下直接輸入常用符號的編碼方式
最常用漢語書寫符號用“聯(lián)想記憶碼+W”的模式確定,如
。----OW ,-----QW其它符號(包括幾種常用文字)可用相應(yīng)特定符號區(qū)的對應(yīng)碼輸入。
本發(fā)明與現(xiàn)有漢字輸入技術(shù)相比,具有以下明顯優(yōu)(特)點(diǎn)
1、采用直觀形托的方法,根據(jù)漢字基本構(gòu)件的形狀與鍵盤字母形狀相同或相似關(guān)系直接確定鍵位,不需要任何形音形轉(zhuǎn)換或劃區(qū)定位的過程。初學(xué)者,經(jīng)過幾個小時的學(xué)習(xí),就可以不看說明書輸入漢字;
2、安排在相同鍵位上的漢字構(gòu)件之間形狀上的共同點(diǎn)十分明顯,便于聯(lián)想,易記不忘;
3、盡量不破壞高頻構(gòu)件的完整性,降低難拆構(gòu)件造成的取碼難度;
4、遵循以傳統(tǒng)漢字部首為中心的原則,常用漢字部首一律用單碼或雙碼標(biāo)定;
5、根據(jù)構(gòu)件之間的相對位置,確定漢字的字型,并用固定的四個字型碼表示,同時設(shè)置了一個補(bǔ)足碼。字型碼和補(bǔ)足碼同件碼重合的幾率極?。?br>
6、采取了漢字的詞頻字頻與碼序共同決定漢字顯示順序的模糊查找方式,方便了用戶;
7、對幾百個字設(shè)置了粗分與細(xì)分兩種方案,以適合用戶的不同熟練程度;
8、本發(fā)明提供的漢字輸入方法,不僅簡單易學(xué),同時達(dá)到很高的命中率全形方案中國標(biāo)一級漢字重碼率為2.6%,而總動態(tài)重碼率為萬分之四。所以,在記住一、二級(等)簡碼字以后,用戶能夠達(dá)到很高的錄入速度;
9、常用符號劃區(qū)明確,輸入方法簡單,便于使用。
圖1 為本發(fā)明直觀碼鍵位(基本)分布2 A、B為本發(fā)明直觀碼字根編碼3 為本發(fā)明直觀碼部首編碼4 A、B為本發(fā)明直觀碼非基本件編碼圖
權(quán)利要求
1、一種計算機(jī)漢字輸入方法,特別是一種直觀碼漢字輸入方法,其特征在于,①通過組成漢字的基本構(gòu)件形狀與鍵盤字母形狀相同或相似關(guān)系直接確定鍵位,不需要進(jìn)行形音形轉(zhuǎn)換或劃區(qū)定位;②根據(jù)構(gòu)件之間的相對位置,確定漢字的上下、左右、包圍(含交叉)、標(biāo)準(zhǔn)三件字型,分別用固定的四個字型碼I、W、Y、H表示,采用直觀形托輔以字型碼幾何描述的方法,用鍵盤字母(A--Z)對漢語字、詞進(jìn)行編碼,實(shí)現(xiàn)用直觀碼鍵盤輸入漢字。
2、根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征在于,直觀碼選如下二十六個與鍵盤字母的象形程度極高的組字構(gòu)件為基礎(chǔ)構(gòu)件。小 日 匚 目 彐
艸 丨 丁 丬 爪AB C D E F G H I J K L M冂 口 卩 又 尺 丂 凵 人 幺 乂 丫 乙NO P Q R S T U V W X Y Z
3、根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征在于,直觀碼在確定二十六個基礎(chǔ)構(gòu)件的基礎(chǔ)上,通過形狀上的近似關(guān)系,將其余組字構(gòu)件分別與26個基礎(chǔ)構(gòu)件一起歸為如下26個同鍵構(gòu)件組。A 小 忄 水
彡B 日 曰 白
C 匚 刀 力 冖 宀
亡
勹 匈 九D 目 自 罒 田 由 且
皿
四
回血
曲E 彐 王 三 豐
壬 手 毛 也 世F
干 工 二
土 士
千 乇 禾G
斤 立
毋 母 牙 耳 身 車
氏
辛 钅金H 廾 艸
廿 丌 卅
止I 丨 氵J 丁
廠 廣 疒
丿リ
刂
K 丬 扌 爿 片
大
尢 兀
L 匕 七 丶
卜 讠言 M 爪 瓜 爫 巾 山
皿
米
心 灬 竹N 冂 門
幾 月
舟O 口 囗 凸 凹P 卩
阝
尸 戶Q 又
厶
文 攵
女 夕
父R 尺 艮 良
豆 蟲
足 貝 見 頁S 丂
與
馬 烏 鳥 己 已 巳 巴 弓
石T 丅 十
寸 木U 凵
一 亠 二 衣 示 衤礻V 人 八 丷 亻
W
纟 幺X 乂 犭
七
戈 戔 戊
Y 丫 入 兒 火 彳Z 乙
之 廴 辶 乛 疋
了 子
習(xí)
4、根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征在于,直觀碼將漢字構(gòu)件間位置關(guān)系確定為四種上下關(guān)系、左右關(guān)系、包圍關(guān)系及交叉關(guān)系,分別用I、W、Y表示上下.左右及包圍或交叉關(guān)系。
5、根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征在于,直觀碼將左右型三件字中■〓型字(左邊一件,右邊上下兩件),定義為標(biāo)準(zhǔn)三件字,用字型碼H表示。
6、一種計算機(jī)漢字輸入鍵盤---直觀碼鍵盤,其特征是,安排在每個鍵位上的代表構(gòu)件形狀同鍵盤字母形狀近似程度極高,而且同鍵構(gòu)件之間形狀上的近似特點(diǎn)亦十分明顯,輸入鍵盤(基本)如下
全文摘要
本發(fā)明提供一種計算機(jī)漢字輸入方法。該方法采用直觀形托輔以字型碼幾何描述的形式,用拉丁字母(A-Z)對漢字進(jìn)行編碼。該方法通過組成漢字的基本構(gòu)件形狀與鍵盤字母(大寫)形狀相同或相似的關(guān)系直接確定鍵位,不需要任何形音形轉(zhuǎn)換或劃區(qū)定位的過程。該方法用幾個固定的字型碼對漢字構(gòu)件間的位置關(guān)系進(jìn)行描述,使一維編碼的效果相當(dāng)于二維編碼,同時避免了二維交叉判斷思維。該漢字輸入法在易學(xué)性方面明顯優(yōu)越于現(xiàn)有輸入技術(shù),具有簡單易學(xué)、一記不忘、重碼率低、輸入速度快等特點(diǎn),具有良好的應(yīng)用前景。
文檔編號G06F3/023GK1194395SQ9710472
公開日1998年9月30日 申請日期1997年3月20日 優(yōu)先權(quán)日1997年3月20日
發(fā)明者金浩鏈, 劉寶祥 申請人:四平師范學(xué)院科技開發(fā)中心