專利名稱:漢字四筆融合碼的計(jì)算機(jī)輸入方法
隨著半導(dǎo)體技術(shù)的發(fā)展,電腦已滲透到各個(gè)領(lǐng)域。得到了廣泛的應(yīng)用。漢字是東方文明的象征,有十幾億人使用漢字,漢字輸入方法也就成了華人使用電腦的首要問題,成了大家關(guān)注的焦點(diǎn)。目前,漢字編碼已經(jīng)有近千種輸入方法,比較流行的方法也有十幾種,主要有區(qū)位碼、首尾碼、自然碼、三鍵聲形碼、拼音、五筆字形、表形碼等,這些輸入方法大致可以分為下面三種類型拼音型、形聲型、字形結(jié)構(gòu)型。在這些輸入法中,非專業(yè)人員喜歡用拼音碼,專業(yè)人員喜歡用五筆字形碼。前者易學(xué),但輸入速度慢;后者要進(jìn)行專業(yè)訓(xùn)練,輸入速度較快。但是,五筆字形輸入方法還有不少缺點(diǎn)。
1、記憶量不算少,有一級簡碼25個(gè),二級簡碼588個(gè),三級簡碼則更多,難于記憶,這也是未被非專業(yè)人員所采用的原因。
2、五筆字形碼采用25個(gè)字符進(jìn)行編碼,三鍵容量為15625個(gè),顯然非四鍵不能滿足漢字編碼的需要。形成了三鍵資源不足,四鍵資源浪費(fèi)的兩難境地,所以包括大多數(shù)編碼方法都采用四鍵編碼格局。
3、五筆字形碼編碼四碼空間雖有390625個(gè),由于編碼方法過于機(jī)械,根碼過于集中,缺少靈活性,分布又不盡合理,在擊滿四鍵的情況下,仍有246組重碼,共504個(gè)重碼字,去掉簡碼,還有106組,共220個(gè)漢字。也就是說,尚有約220個(gè)漢字需要擊鍵五次,浪費(fèi)了寶貴的資源。
4、五筆字形碼為減少資源的浪費(fèi),增加了詞條編碼,但受總?cè)萘康南拗?,只有?shù)千條,難于增加更多的內(nèi)容;如果以增加重碼為代價(jià),將犧牲速度,此為下策。
5、五筆對字的拆分缺少直觀感,而且層次較多,既難學(xué),更不利于詞碼的拓展。
本發(fā)明的目的是研究出一種記憶量少,輸入擊鍵數(shù)少,輸入速度快且重碼少的計(jì)算機(jī)漢字輸入編碼方法。
本發(fā)明的漢字編碼方法主要分為相互關(guān)連的兩個(gè)部分,其一是字碼輸入部分,是編碼的基礎(chǔ);其二是詞碼輸入部分,是字碼輸入的延伸和拓展,也是本輸入方法的主體,具有巨大的潛力。
字的編碼方法漢字是象形文字,它的豐富內(nèi)涵集中體現(xiàn)在字的形體之中,在常用的字典詞典中,都習(xí)慣于用偏旁部首對漢字進(jìn)行分類,本發(fā)明順應(yīng)傳統(tǒng)的使用習(xí)慣,順應(yīng)漢字的成字特點(diǎn),仍以字根的形式作為編碼的依據(jù),延用大家所熟悉的部首作為字根的主體,將編碼字根順其自然排序,按點(diǎn)、橫、撇、豎四筆,依次分配在計(jì)算機(jī)主鍵盤的四行中,點(diǎn)筆字根分配在數(shù)字行,并融入了數(shù)字自身的音形特點(diǎn),以下依次是橫筆、撇筆、豎筆三行,五筆字形中的折筆字根則融進(jìn)了四行之中,此外“融合”還包含將相關(guān)字根進(jìn)行分類、定位,將字、詞、詞組分類并行輸入的含義。由于字根符比五筆字形碼增加了十個(gè)數(shù)字鍵和一個(gè)字母鍵,增加到36個(gè),三碼容量上升到46656個(gè),為三鍵無重碼輸入,提高鍵入速度創(chuàng)造了條件。
所謂字根就是由點(diǎn)橫撇豎等基本筆劃組成的固定組合,字根有大小之分,小的字根可以是一點(diǎn)、一橫、一撇、一豎、一折;大的字根可以是一個(gè)字,甚至是一個(gè)較復(fù)雜的字,例如“隹”和“解”字、關(guān)鍵是在漢字的構(gòu)成中是否反復(fù)使用,重復(fù)次數(shù)越多,作為字根使用的效率就越高,當(dāng)然,如果重復(fù)次數(shù)太多,就會(huì)出現(xiàn)重碼,也不利于輸入速度的提高,在本系統(tǒng)中則將其分類,例如“艸”以減少重碼率。
本編碼字根的選擇,非常符合中國人的傳統(tǒng)習(xí)慣,將漢語字典中的絕大部分部首都引作字根使用,約180個(gè),還有一些自定義字根,兩部分字根之和約有300多個(gè),分別定義在計(jì)算機(jī)主鍵盤的36個(gè)字母和數(shù)字鍵上。
下面分四行簡單介紹如下第一行以點(diǎn)根為主,并融合了數(shù)字鍵的特點(diǎn)。
例如一二三四五六七八九就用相應(yīng)的數(shù)字鍵表示,并兼作字根,還利用了阿拉伯?dāng)?shù)字的字形特點(diǎn)如2、3、4、5、6、7等,給編碼帶來了眾多方便。
下面是數(shù)字鍵的一些主要字根表1 23 4567890礻 衤 辶門 忄 讠 羊 戶 廣 疒夭 立 了馬 午 文 云 亡 火 辛宀 穴 山方 半 古 寸 甫 卜 心一 二 三四 五 六 七 八 九 令歸納一下這一行的字根編排,記住下面的口訣很有好處,就能基本上掌握數(shù)字符所代表的字根,也能體驗(yàn)到編碼的巧妙。
一[弋]要[夭]祈[示、礻]頭寶[宀],二[兩]求[酋]立衣[衤]勾[戈],三[3]山[了]斗[豆]之[辶]帝,四[4]馬方門牙,
五星[忄]小舞[午]伴[半],六鹿學(xué)[
]古文,七羊革寸云,八水甫入亡,九火高撲[卜]消[肖],稟[
]心[辛]令病[疒]回。即一要祈頭寶,二求立衣勾,三山斗之帝,四馬方門牙,五星小舞伴,六鹿學(xué)古文,七羊革寸云,八水甫入亡,九火高撲消,稟心令病回。第二行為橫根,部分根碼如下q w e r t y u i op艸 王 耳 木 土 石 扌 彐 肀 卩又 子 已 下 雨 乙 瓦 豐 西 車巴 巳 己 萬 士 業(yè) 才 不 韋 大其中字根王、土、乙、業(yè)、頁、朋與字音有關(guān)耳、工、卩與字形有關(guān)。充分利用了“音形義”的特點(diǎn)。第三行為撇根,部分根碼如下as d f g h j k l米 身 生 夕 千 人 斤 毛 舟食 纟 犭 彳 亻 禾 金 女 烏自 白 巛 爪 個(gè) 人 攵 幾 氣反 川
兒 丿
彡 片和上面一樣,其中字根纟、身、分、各、禾、金、今,斤與字音有關(guān);還利用字根的相關(guān)性進(jìn)行了巧妙的編排,將包、
勹、勺、勻、勾、句等八個(gè)根有序地排成一行,都按序排列第三行。實(shí)際上在字根表中,隨處可見,讓人一目了然,十分方便記憶。
第四行為豎根。部分根碼如下z x c v b n m齒 告 臣 冉 巾 且 田足 月 蟲 口 日 目 魚止 上 攴 占 口 非 貝比 匕
中 丨 刂
此行的字根可以周上口、下口、穿口、中口、兩口、三口、四口來記憶;所謂上口,有兩種含義,一是指字根上面有口,二是說字根向上開口,所謂下口,亦大同小異,余類推,內(nèi)涵十分豐富。
本發(fā)明的計(jì)算機(jī)輸入的基本步驟和方法。
漢字的輸入大致有三個(gè)層次最簡單的辦法就是按字逐個(gè)字進(jìn)行輸入;其次是字詞同時(shí)輸入;第三個(gè)層次是以詞、詞組輸入為主快捷輸入方法。下面簡單介紹一下字碼輸入要輸入一個(gè)漢字,首先要知道這個(gè)字的代碼。在本系統(tǒng)中就是要找到字的真實(shí)字根碼,也就是說,不僅要知道漢字如何拆分,如何取根,而且要知道字根定義在哪一個(gè)字符上。
下面是36個(gè)字符鍵主字根的安排口訣寶衣山門小,言冷水火??;草王耳木土,石手工廠車;食絲犬牛人和金女鳥;足月蟲口日目魚。
根據(jù)上面的介紹,如要鍵入“明”字,字根編碼顯然是“bx”,當(dāng)鍵入“bx”這兩個(gè)字根符,窗口就會(huì)出現(xiàn)明字,再加左右識(shí)別鍵即可鍵入明這個(gè)字,在特定情況下,也可用空格鍵鍵入。和上例一樣,“如”的編碼自然是“kv”加識(shí)別符?!捌鳌钡木幋a則更加干脆,用“四口”和“犬”進(jìn)行編碼,屬交錯(cuò)結(jié)構(gòu),字根碼顯然是“md”。
本發(fā)明規(guī)定,標(biāo)點(diǎn)符號鍵作首鍵使用時(shí),仍作符號鍵使用,其第二、第三鍵則分別作為終止鍵、字詞轉(zhuǎn)換鍵和功能定義鍵使用。有了這十一個(gè)符號鍵的新的功能。猶如讓猛虎添翼,插上了騰飛的翅膀,使系統(tǒng)具備了巨大的機(jī)動(dòng)能力,得以處理重碼,得以建立龐大的詞碼空間,得以提高鍵入速度,從而使本編碼方案既內(nèi)容豐富,又條塊分明,直觀易學(xué),操作極其簡便。
本編碼將識(shí)別鍵的第二鍵定義為終止鍵,利用這一空間,作為字根、字根字顯示,加上重碼鍵的輔助功能,基本上做到了字根的窗口顯示,讓初學(xué)者丟掉了死記硬背字根的負(fù)擔(dān)。這給本編碼的學(xué)習(xí)使用提供了極為有利的條件。例如當(dāng)擊下字符“t”時(shí),屏幕顯示有“地、羽、士、雨、者”,加重碼鍵后顯示“亍、丁、匚”;可見“t”代表的字根除“土”外,還有“羽、雨、士、亍、丁、匚”,學(xué)起來非常方便。參見下面窗口顯示圖。
在本發(fā)明的總體框架中,采用四個(gè)符號鍵為字碼服務(wù),六個(gè)符號鍵用作詞碼的特殊功能定義鍵,剩余一個(gè)鍵則作為漢英轉(zhuǎn)換鍵使用。在字碼的四個(gè)鍵中,三個(gè)作為上下、左右、交錯(cuò)識(shí)別鍵,一個(gè)作為重碼區(qū)別鍵使用,作識(shí)別鍵使用時(shí),通常都用在第三鍵上,加上重碼鍵,在系統(tǒng)軟件的支持下,鍵入兩個(gè)字根符的情況下,最多可以標(biāo)識(shí)五個(gè)漢字。當(dāng)鍵入兩個(gè)字根符時(shí),在系統(tǒng)窗口中就會(huì)顯示其二級簡碼,當(dāng)鍵入“js”這兩個(gè)字符時(shí),窗口就出現(xiàn)了“鉑、錘-、袁=、釧]”四個(gè)字,此時(shí)欲輸入鉑字,擊空格鍵即可,欲輸入錘字擊“-”就行,擊下“=”就輸出“袁”字。
本發(fā)明結(jié)合字根的音形義等特點(diǎn)進(jìn)行定位。例如將“午、半”定位在數(shù)字鍵“5”上,將“金、斤”定位在“j”上,將“山、了、辶、廴”定位在“3”上等;其中以午、半為例,‘午’和‘5’同音,‘半’正好是‘10’個(gè)數(shù)字鍵之半,‘午半’又和‘舞伴’同音,此類甚多;本發(fā)明將字形相近的字根按橫向有序排列,象上表中的“巴、巳、己”“竹、個(gè)、人”和“反、川、
、兒、丿、
、彡,
等,非常便于記憶。
詞碼輸入本系統(tǒng)用六個(gè)標(biāo)點(diǎn)符號鍵作為詞碼的功能定義鍵,共12個(gè)狀態(tài),根據(jù)已收集的詞條分類,兩字詞的數(shù)量占了一半以上,四字詞次之,為追求輸入速度,針對資源豐富的特點(diǎn),讓兩字詞占用六種定義狀態(tài),以保證詞輸入的快捷方便。下面,為敘述方便,不妨設(shè)X為36個(gè)字根符之一,標(biāo)點(diǎn)符號符分別用數(shù)字符1、2、3、4、5、6等代替,下表表明本發(fā)明的詞和詞組編碼的排序分類方法。
兩字詞分六種編碼結(jié)構(gòu)雙根詞 X1X左右三根詞 X4XX上下三根詞 X5XX單錯(cuò)三根詞 X6XX前三根詞XX2X四根詞 XX1XX三字詞 XX3XX四字詞 XX4XX兩詞詞組XX5XX三詞詞組XX6XX大詞詞組X3XXX縮寫類 X2XXX上述十二種類型,編碼的結(jié)構(gòu)是相對固定的,容量大得驚人,僅兩字詞的容量就近兩百萬,以下的每一類都有近一百七十萬的詞條空間,總共在一千萬以上,即使百分之一的利用率,也有十萬詞條的容量,十分有利于詞條的擴(kuò)展,特別是有了詞組的分類,使輸入更加簡明快捷。
要輸入一組詞或詞組,首先要分辨其屬于哪一種類型,并按上述規(guī)定的次序取根編碼;
如要輸入“明天我要去北京買電腦。”這句話,假定“我、要、去、買”作字碼輸入,“明天、北京、電腦”作兩字詞詞碼輸入,編碼是“x[l、g、ok、tz-、b/95、71=、z/xz?!惫?2個(gè)字碼符,輸入這句有十個(gè)字一個(gè)標(biāo)點(diǎn)的一句話,平均單字擊鍵約2.2個(gè)鍵符。
如要輸入“中國共產(chǎn)黨是中國人民的領(lǐng)導(dǎo)核心。”這句話,其中“是、的”作字碼輸入,“中國共產(chǎn)黨、中國人民、領(lǐng)導(dǎo)、核心”作詞碼輸入,包括符號鍵的編碼是“vn.w7”、“bz”、“vn,hw”、“d”、“0/w7”、“0
m”和“8]k”。
本編碼方法尤如我們用“日月明”、“口天吳”、“木子李”、“口木困”、“龍共龔”等介紹某一個(gè)漢字,非常貼近漢字的自身特點(diǎn),具有通俗、簡單、易學(xué)的特點(diǎn)。
詞的編碼方法本系統(tǒng)所說的詞是指兩字以上的詞,單字詞作為字進(jìn)行編碼處理,詞的編碼,定義符是不可缺少的,也就是說,不用定義符,就不能輸入詞條。定義符有三個(gè)功能,一是表示字詞的分類,是指詞碼輸入;二是表示詞的字?jǐn)?shù)或詞組的詞組數(shù);三是表示詞碼的定義長度。在十一個(gè)符號鍵中,用六個(gè)鍵作為詞條的功能定義鍵使用,共十二種定義狀態(tài),為詞條輸入建立了龐大的詞碼空間,從而保證了詞條輸入成為本系統(tǒng)的主要輸入方式,大大提高了輸入速度。在一般情況下,詞碼長度取三到五鍵,這是追求速度和充份利用體系資源的折衷選擇。
在詞庫中,兩字詞所占比例最大,為了貫徹將詞條輸入作為輸入主體的構(gòu)想,根據(jù)詞碼容量大的特點(diǎn),為減少重碼,實(shí)現(xiàn)快捷輸入的目標(biāo),編碼時(shí)根據(jù)兩個(gè)字字根的具體情況(分別是一根、二根、三根及三根以上),將所有的九種組合分為三種類型六種狀態(tài)進(jìn)行編碼1、二字根符,一字用一個(gè)根符,適用單根字、一級簡碼字和用單根特殊定義的常用詞;2、三字根符,且前一個(gè)字為左右型雙根并且后一個(gè)字為非單根字,則前一個(gè)字取單根,后一個(gè)字取雙根;3、三字根符,且前一個(gè)字為上下型雙根且后一個(gè)字為非單根字,則前一個(gè)字取單根,后一個(gè)字取雙根;4、三字根符,且前一個(gè)字為單根或交錯(cuò)型雙根且后一個(gè)字為非單根字,則前一個(gè)字取單根,后一個(gè)字取雙根;5、三字根符,且前一個(gè)字為非單根字,后一個(gè)字為單根字,則前一個(gè)字取雙根,后一個(gè)字取單根;6、四字根符,前一個(gè)字為三根及三根以上取雙根,后一個(gè)字兩根及兩根以上取雙根;三字詞取四根,一字最少取一根,單根字只能取一根,取兩根的字前者優(yōu)先,若都是單根字加空格鍵。
四字詞的取根,每字取一主根。
在詞的編碼中,最終還是要對字進(jìn)行取根,以確定字根及字根符;一個(gè)字取一根時(shí),要以主根、大根為主,無法決定取舍的,則以前為先進(jìn)行取舍,一字取兩根時(shí),限于兩根以上字,取字的首尾兩個(gè)字根。
取字的主根是指取字的主要部分作字根,如村的寸,字的子等,在詞的編碼中所指的主根包括下述的大根。
取字的大根是在字沒有明顯的邊旁部首的情況下,取筆劃多的作為字根。
詞組的編碼方法隨著詞的字?jǐn)?shù)的增加,詞就變成了詞組,通常五字詞以上的詞條,都可看成是詞組,為減少占用電腦的存儲(chǔ)空間,本系統(tǒng)用詞的簡碼再對詞組進(jìn)行編碼,主要分為兩詞詞組象“人民解放軍”,勤勞的人民、好好地學(xué)習(xí)、解放軍代表隊(duì),都可看成是由兩個(gè)詞組成的詞組,則從每一個(gè)詞中取出兩個(gè)字并取其主根,中間有助詞的,可省略助詞,在字的取舍時(shí)要注意詞的概括和縮寫,盡量不要引起誤會(huì)。
三詞詞組象“政治協(xié)商會(huì)議”、“中華人民共和國”都可看成由三組詞組成的詞組,編碼時(shí)前面兩個(gè)詞各取前一個(gè)字的主根,后一個(gè)詞取二個(gè)能概括詞意的兩個(gè)字的兩個(gè)主根;大詞詞組如“中國人民政治協(xié)商會(huì)議”、“中華人民共和國外交部”,可以把詞條中的“政治協(xié)商會(huì)議”、“中華人民共和國”這類由兩詞詞組以上的詞組看成是一個(gè)大詞,并取這個(gè)大詞的兩個(gè)縮寫字的主根碼作為其編碼的代碼,其余部分,不管是詞還是大詞,都取兩個(gè)字根碼,方法雷同。
縮寫詞組[特殊定義類]主要包括常用詞組縮寫的全稱、短語和句子等的簡碼,碼長一般不超過五個(gè),用空格鍵即行終止。
本發(fā)明是根據(jù)字的字形、結(jié)構(gòu),用漢字的字根進(jìn)行編碼的方法,不管字有多么復(fù)雜,字根碼都不超過三個(gè),而且包括定義鍵和空格鍵在內(nèi);為了減少重碼,充份利用字碼的有限組合空間,采用了大小字根相結(jié)合的編碼方法,字繁用大根,字簡用小根,獨(dú)體字可拆分的二三優(yōu)先原則,即根據(jù)漢字的結(jié)構(gòu),盡量把字分成兩個(gè)或三個(gè)部分進(jìn)行取根編碼。
綜上所述,本編碼充分利用了數(shù)字,字母及漢字本身的特點(diǎn),融合了音形義之所長,試行了全方位的聯(lián)想,具有條塊分明,通俗易學(xué),簡中有繁,繁中有簡,快捷方便的特點(diǎn)。
本發(fā)明取得了下列積極效果一、本發(fā)明實(shí)現(xiàn)了三鍵無重碼輸入,而五筆字形輸入,一般要用三到四鍵,有時(shí)要多達(dá)五鍵,比當(dāng)今盛行的五筆字形輸入速度提高了一大步。
二、本發(fā)明以大字根編碼為特點(diǎn),設(shè)定了數(shù)千條雙根字字碼空間,用識(shí)別碼加以區(qū)別,取得了簡潔明了、易學(xué)易用的效果。也有利于了解漢字的構(gòu)造特點(diǎn)。對漢字中的細(xì)微差別,常常定位在相近的字符上,鍵錯(cuò)了就輸不進(jìn)去,特別對中小學(xué)生學(xué)習(xí)漢字很有幫助。
三、字根的設(shè)置順其自然,利用音、形、義等特點(diǎn),強(qiáng)調(diào)聯(lián)想和編碼的規(guī)律性,巧妙地解決了,好記重碼多和重碼少難記憶的矛盾。例如“山、廴、辶、了、三”等字根定位在“3”上;“雨、羽、土、丁、亍、士”等定位在字母“t”上;“十”、 才、扌”、“豐”分別定義在“y”、“u”、“i”上;非常便于記憶。
四、本編碼字根總數(shù)略多,由于設(shè)置了字符字根顯示功能,及雙根字和部分三根字在窗口的直接顯示。其記憶量非但沒有增加,反而有大幅度的減少。在前面,這類例子很多,這里就不再重復(fù)了。象“龍、共”--“龔”,只要在兩個(gè)字符后加一個(gè)上下識(shí)別鍵就可以鍵入,不需要死記硬背煩鎖的編碼口決,非常簡便。
五、本編碼將詞條輸入作為輸入的重點(diǎn)。龐大的詞庫使輸入速度從每字三鍵以下減少到兩鍵左右。而西文與漢字譯文的比例大于二,故用本編碼輸入,速度將會(huì)輕松地超越西文,將給漢字帶來新生。
六、從用本編碼方法對GB5007-85的一二級漢字進(jìn)行的編碼結(jié)果看,發(fā)現(xiàn)仍具有很大的潛力,可以大幅度地?cái)U(kuò)充字庫。在下面的系統(tǒng)窗口圖中,顯示了在鍵入字根符di時(shí),窗口顯示的狀況,只顯示了一個(gè)“愛”字,尚有四個(gè)編碼空間未能充份利用,表明二級簡碼尚有很大的剩余空間。
七、本編碼除包括國標(biāo)6763個(gè)字和字符以外,還增加了少量的字符和標(biāo)點(diǎn),以適應(yīng)漢字書寫習(xí)慣的需要,使用更加方便。
八、本編碼充分地利用了鍵盤資源,主鍵盤的48個(gè)字符(包括空格)都得到了充分的應(yīng)用,數(shù)字則由小鍵盤鍵入??梢钥隙ǎ捎阪I盤資源有限,而漢字多到數(shù)千乃至數(shù)萬,絕對不會(huì)出現(xiàn)漢字的兩鍵無重碼輸入方法,三鍵無重碼輸入無疑是漢字輸入的極限,本編碼可算是漢字編碼史上的一次徹底的編碼革命。
實(shí)施舉例要輸入一個(gè)漢字,首先要看字的繁簡,由幾個(gè)字根構(gòu)成,根據(jù)字形結(jié)構(gòu)編碼。并采取二根、三根優(yōu)先的原則。選擇適當(dāng)?shù)木幋a字根,在學(xué)習(xí)階段,輸入時(shí)要注意編碼窗口的顯示,以熟悉字的編碼規(guī)律,現(xiàn)舉例說明。
不妨先以“例如”為例,其字根分別由“亻、歹、刂”和“女、口”組成,前一個(gè)字是三根字,正好組成一組編碼,編碼是“gon”,后一個(gè)字是兩根字,要加一個(gè)識(shí)別碼,在本例中,因使用頻度較高,故作為二級簡碼使用,編碼是“kv”,前一個(gè)字按編碼輸入,后一個(gè)字除鍵入兩個(gè)根碼外,還要加空格才能輸入。
獨(dú)體字的輸入如“山”是鍵名字,編碼是“333”,按編碼輸入;如“之”是字根字,編碼是“3\”,按編碼輸入;如“事”雖是獨(dú)體字,但不是字根字,編碼為“qo”按編碼輸入;雙根字的輸入如“根”是雙根字,左右結(jié)構(gòu),編碼為“ru”,按編碼輸入;如“是”也是雙根字,系上下結(jié)構(gòu),編碼為“bz”,按編碼輸入;如“為”系交錯(cuò)型雙根字,編碼是“o7”,按編碼輸入;如“這”也系交錯(cuò)型雙根字,編碼是“36”,按編碼輸入,次序特殊;以下五例都是常用字,定義為兩級簡碼。
如“請”系三根字,編碼是“6ex”,按編碼輸入;如“富”字,由“宀、
、田”組成,當(dāng)鍵入“l(fā)q”兩個(gè)根符時(shí),在窗口的簡碼部位,出現(xiàn)了富字,此時(shí)不必鍵入第三個(gè)字根符,只須擊打空格鍵即可輸入;如果鍵入三根,發(fā)現(xiàn)輸入的不是“富”字而是“?!弊?;原來‘富’和‘?!且粚χ卮a,在編碼時(shí),由于“富”字使用頻度較高,故將它作為二級簡碼處理,編碼為“l(fā)q”。
多根字的輸入
字根多于三個(gè),字型結(jié)構(gòu)比較復(fù)雜,編碼規(guī)則也較為復(fù)雜,這在前面巳有較多的介紹?,F(xiàn)再舉一例,再體驗(yàn)一下編碼的規(guī)律。象“懈”字,比前面已經(jīng)提到的“解”字多了個(gè)“忄”,這個(gè)根符不可省,剩下的部分,可以看成是一個(gè)根,也可以看著多根,在本編碼體系中,這個(gè)“懈”字的編碼是“5j\”,如果作多根字處理,則應(yīng)該取“解”字的首尾碼,編碼是“5lf”,用兩種編碼都能輸入懈字?!靶贰钡木幋a是“jc=”或“l(fā)fc”,按兩種編碼之一輸入即可。象“譬”字,“言”是不可省字根,剩下的取首尾字根碼,編碼是“w06”按編碼輸入。
在五筆字形碼中,有兩組特殊重碼,即“微、微、徽”和“嬴、贏、羸、蠃”,其主要矛盾是“幾、王、糸”和“女、貝、羊、蟲”,本系統(tǒng)中則抓住這一主要矛質(zhì),將其作為字根編碼,編碼分別為“fkj”、“fwj”、“fsj”和“8\k”、“8\m”、“8\7”、“8\C”。鍵入任一組編碼,就可輸入相應(yīng)的字,消滅了重碼。
本系統(tǒng)的一二級簡碼,主要依據(jù)頻度和重碼兩條準(zhǔn)則進(jìn)行安排。因重碼而編入簡碼的極少,一級簡碼有“寶、埋”;二級簡碼有鍵、構(gòu)、登等,絕大部分空間暫時(shí)還空閑著,都可以作為高頻字的簡碼使用,給編碼創(chuàng)造了寬松優(yōu)越的環(huán)境。
詞的輸入如上所述b、x依次表示“日、月”的兩個(gè)字根符,鍵入字符“bx”,加字碼的左右識(shí)別鍵就表示輸入“明”字;在字根碼中間,加詞碼的詞條簡碼定義鍵就表示輸入兩字以上的詞,即“日月”兩個(gè)字。
又如“vb”兩個(gè)字根符的編碼,除加空格鍵輸入“咀”字,加左右識(shí)別鍵輸入“啡”字外,加詞條定義鍵就表示輸入“中國”這個(gè)兩字詞,換成特殊定義符則表示詞組“中華人民共和國”。使用十分靈活方便,這也充份體現(xiàn)了詞條定義符的定義功能。
要輸入“中國人民”這個(gè)詞,一字取一個(gè)主根,另加四字詞定義符,鍵入其編碼就可輸入中國人民這四字詞。
詞組的輸入通常將五字詞以上的詞看成是詞組,要輸入“政治協(xié)商會(huì)議”這樣的六字詞,可以看成由“政治”、“協(xié)商”、“會(huì)議”三個(gè)詞組成,前兩個(gè)詞取一個(gè)字,后一個(gè)詞取兩個(gè)字,即政協(xié)會(huì)議,編碼的字根符和四字詞‘政協(xié)會(huì)議’的字根符相同,但所用的定義符不同,可見選擇不同的定義符,就能分別輸入‘政協(xié)會(huì)議’和‘政治協(xié)商會(huì)議’這兩組詞。
要輸入“中國人民政治協(xié)商會(huì)議”,可看成“中國人民”和“政治協(xié)商會(huì)議”兩部分組成,取“中人政協(xié)”這四個(gè)字的主根碼,加“大詞詞組”定義符,按編碼輸入即可。
要輸入“中華人民共和國外交部”,可把“中華人民共和國”看成一組“大詞”,并取其縮寫“中國”,取“中國外部”四個(gè)字的主根符,另加“大詞詞組”定義符形成編碼,再按編碼輸入即可。本系統(tǒng)將詞碼碼長定義為三到五鍵,定義三鍵的,用三鍵就可以輸入一組詞,定義五鍵的就用五鍵輸入,這樣就能兼顧速度(較少的擊鍵數(shù))和容量(擊鍵數(shù)多)的矛盾,大大減少了重碼。
權(quán)利要求
1.一種漢字四筆融合碼的計(jì)算機(jī)輸入方法,將漢字的組字字根和字詞的定義符分配在計(jì)算機(jī)主鍵盤的47個(gè)字符鍵上,其特征在于各鍵符的分配是(1)漢字字根分配在四行26個(gè)英文字母和10個(gè)數(shù)字鍵上,各行字根分別以起筆分類為主,四行自上而下分別是以點(diǎn)筆為主,以橫筆為主,以撇筆為主,以豎筆為主;(2)十一個(gè)符號鍵的分配是四個(gè)字碼鍵,其中三個(gè)是兩根字的左右、上下、交錯(cuò)識(shí)別鍵,一個(gè)重碼定義鍵;六個(gè)詞碼鍵,分別將詞碼分成詞和詞組的十二個(gè)狀態(tài),分別進(jìn)行編碼結(jié)構(gòu)的定義;一個(gè)作為漢英轉(zhuǎn)換鍵使用。
2.根據(jù)權(quán)利要求1所述的漢字四筆融合碼的計(jì)算機(jī)輸入方法,其特征在于四行36個(gè)字根符分別以字根起筆為主的前提下,再以相同字音或諧音,相關(guān)字形規(guī)則地分配在各行上。
3.根據(jù)權(quán)利要求1所述的漢字四筆融合碼的計(jì)算機(jī)輸入方法,其特征在于六個(gè)標(biāo)點(diǎn)符號詞碼鍵的十二個(gè)狀態(tài)定義如下兩字詞二字根符類一字用一個(gè)根符,適用單根字、一級簡碼字和用單根特殊定義的常用詞;三字根符分為四類(1)前一個(gè)字為左右型雙根,且后一個(gè)字為非單根字,則前一個(gè)字取單根,后一個(gè)字取雙根;(2)前一個(gè)字為上下型雙根,且后一個(gè)字為非單根字,則前一個(gè)字取單根,后一個(gè)字取雙根;(3)前一個(gè)字為單根或交錯(cuò)型雙根,且后一個(gè)字為非單根字,則前一個(gè)字取單根,后一個(gè)字取雙根;(4)前一個(gè)字為非單根,且后一個(gè)字為單根,則前一個(gè)字取雙根,后一個(gè)字取單根;四字根符類,前一個(gè)字為三根及三根以上取雙根,后一個(gè)字兩根及兩根以上取雙根;三字詞取四根符;四字詞取四根符;兩詞詞組取四根符;三詞詞組取四根符;大詞詞組取四根符;縮寫類取四根符,提前用空格鍵。
4.根據(jù)權(quán)利要求1所述的漢字四筆融合碼的計(jì)算機(jī)輸入方法,其特征在于用標(biāo)點(diǎn)符號鍵作漢英輸入切換鍵使用。
5.計(jì)算機(jī)漢字輸入四筆融合碼的編碼方法,主要依據(jù)漢字的字形、結(jié)構(gòu)選取適當(dāng)?shù)淖指M(jìn)行編碼,其特征在于(1)字的編碼方法是單根字根據(jù)編碼需要分成不必拆分的和可拆也可不拆分的字根字兩種,拆分時(shí)作兩根字編碼;雙根字根據(jù)漢字兩個(gè)編碼字根的相互關(guān)系分成左右型、上下型、交錯(cuò)型等三種分類;三根字直接用三個(gè)字根組成編碼符;多根字注重字的條塊結(jié)構(gòu),首先取明顯的部首字根碼,再取剩余部分的首尾字根碼,編碼排序除“辶”外都按書寫次序?yàn)闇?zhǔn);重碼字本編碼方法根據(jù)字的使用頻度,可定義為簡碼和原定義編碼,還增設(shè)了重碼符,作為輔助編碼。(2)詞的編碼方法兩字詞的編碼分四種類型1、一個(gè)字各取一個(gè)根符;2、第一字取一個(gè)根符、第二字取兩個(gè)根符;3、第一字取兩個(gè)根符、第二字取一根符;4、每個(gè)字分別取兩根符;其中第二類又分左右、上下、交錯(cuò)及單根三類;共六種狀態(tài)。三字詞取四個(gè)根符,每個(gè)字最少取一根,單根字只取一根,取雙根的字按三個(gè)字的先后次序,前者優(yōu)先,若三個(gè)字都是單根字,加空格鍵。四字詞每一個(gè)字取一個(gè)主根符。(3)詞組的編碼方法兩詞詞組分別取兩個(gè)詞的兩個(gè)字的主根符;三詞詞組取前兩個(gè)詞的前一個(gè)字的主根,取后一個(gè)詞的首尾兩個(gè)字的主根,也取四個(gè)根符;大詞詞組如果詞組本身就包括上述詞組之一,其組成詞組也取兩個(gè)根符,剩余的詞或詞組取兩個(gè)根符;縮寫詞組有些常用詞,詞組乃至句子,作為特殊類型編碼,最多取四個(gè)根編碼,也可用空格鍵終止。
6.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)漢字輸入四筆融合碼的編碼方法,其特征在于采用了二三優(yōu)光即字型復(fù)雜用大根,字型簡單用小根,獨(dú)體字可拆分,盡量用兩個(gè)或三個(gè)字根進(jìn)行編碼的原則,使字的根碼不超過三個(gè)。
全文摘要
本發(fā)明是漢字四筆融合碼計(jì)算機(jī)輸入方法,是根據(jù)漢字的字形、構(gòu)成的特點(diǎn)用字根進(jìn)行編碼,將數(shù)字鍵擴(kuò)充為字根鍵使用,使字根符擴(kuò)大到36個(gè),并將相關(guān)相近的字根規(guī)則有序地定位在主鍵盤四行36個(gè)字符鍵上,同時(shí)將標(biāo)點(diǎn)符號鍵兼作字詞定義鍵和字詞轉(zhuǎn)換鍵使用,采用了字、詞、詞組分層次編碼的方式,使字詞輸入分塊同時(shí)進(jìn)行,實(shí)現(xiàn)了字碼三鍵無重碼輸入,詞碼可任意拓展的計(jì)算機(jī)漢字輸入方法。
文檔編號G06F3/023GK1164702SQ9710628
公開日1997年11月12日 申請日期1997年2月17日 優(yōu)先權(quán)日1997年2月17日
發(fā)明者韓恒瑞, 韓正陽 申請人:韓恒瑞