專利名稱:五三音碼及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,是本發(fā)明人前一項發(fā)明五三筆碼的延伸和重大改進,它是一種組合五三筆碼與音碼的發(fā)明,所以稱之為五三音碼,順便指出,稱“五三”而不稱“三五”是為了避商業(yè)性宣傳之嫌。
在鍵盤上用音碼輸入漢字時只要掌握漢字拼音便可輸入,人們大都能使用,但由于漢字同音字眾多,造成重碼多,有時甚至不得不從數(shù)十個甚至上百個同音字中挑選一個,故輸速較低。
為免去同音字選擇煩惱,目前所有問世的優(yōu)秀漢字輸入法都主要向三個方向發(fā)展。一是智能語句語音輸入法,可仍然免不了同音字選擇;二是各種組字單元碼,特點是將眾多的組字單元按筆畫或拼音或象形等方式歸類,重碼低、輸速高。由于筆畫是一項足以與字母相提并論的有史以來最偉大發(fā)明之一,筆畫的發(fā)明使?jié)h字由象形文字飛躍成為符號文字,所以按筆畫歸類的組字單元碼相對略勝一籌,較為流行,可各種組字單元碼有個通病,那就是組字單元數(shù)大大多于西文字母數(shù),記不勝記,讓一般人望而生畏,無法全民普及;三是各種組字單元與拼音結(jié)合的編碼,特點是要記憶的組字單元較少,有一定的區(qū)分同音字能力,輸速較快,但因為組字單元數(shù)較少,丟失的信息過多,重碼率相對較高,并不能真正有效地免去同音字選擇。
這樣,目前所有問世的編碼都未能同時克服兩種主要缺陷或重碼率過高,人工干預(yù)過多,無法提高輸速;或規(guī)則繁雜,難學(xué)難記,不宜推廣。僅僅依據(jù)漢字的音、形特征編碼似乎已山窮水盡,不可能發(fā)明出能同時克服兩種主要缺陷的理想的完善的編碼了,事實并不如此,五三筆碼的問世為漢字輸入法最終解決打下了基礎(chǔ)。
本發(fā)明的目的是提供一種組合五三筆碼和音碼的電腦漢字編碼輸入方法,它具有幾分鐘學(xué)會、大部分漢字不必選擇同音字、輸速快的優(yōu)點。采用調(diào)整方案的,也就是采用以碼長最多為2碼的五三筆碼為基礎(chǔ),組字單元為配合,漢字結(jié)構(gòu)為補充并結(jié)合拼音的,甚至可以幾乎不選同音字,從而實現(xiàn)高速脫稿輸入,而學(xué)成時間僅需10分鐘。同時克服了上述兩種主要缺陷。
由于本發(fā)明為五三筆碼和音碼的組合發(fā)明,所以最好先掌握五三筆碼的核心部分將漢字的各種筆畫歸類為橫、豎、撇、捺、折五種基本筆畫,其中點作捺,提作橫,但點提相連時,提作點,因撇捺由上向下傾斜,故歸類為斜筆畫,而折根據(jù)其沒折、彎、鉤前的運筆方向可分別并入上述三類筆畫中,這三類筆畫,本發(fā)明人稱之為根本筆畫,它與漢字各種筆畫的對應(yīng)關(guān)系見圖1所示,順便指出,所有圖中的1、2、3都為橫、豎、斜的代號,接著編碼,規(guī)則是一、對1至4筆的漢字將筆畫歸類,按書寫順序根據(jù)筆畫的相交情況編碼;二、對5筆及以上漢字按書寫順序根據(jù)根本筆畫橫豎斜的排列組合次序?qū)γ咳P進行編碼,在依次出現(xiàn)的三個筆畫中,橫豎斜的排列組合不外乎27種,可一一對應(yīng)地排列在26個英文字母及某個特定符號鍵上,一般為標點符號鍵,如果系統(tǒng)允許的話也可以排列在空格鍵、回車鍵上,甚至可以在標準鍵盤上新增一個鍵,但這會增加系統(tǒng)成本,為便于輸入漢字,本發(fā)明人利用26個字母的鍵位及“;”編碼,見圖2。
應(yīng)當(dāng)指出某幾種橫豎斜排列組合方式組字頻率很低,可將之合并排列在同一鍵上,這樣27種橫豎斜排列組合可排列在不足27個字母或符號鍵上,但這記憶不甚方便,所以一般還是以一一對應(yīng)地排列好。上述規(guī)則是以4筆為界編碼的,其實也可以以N筆為界,還可以規(guī)定碼長最多為L,超過規(guī)定時改取最后一碼,N、L均為自然數(shù),當(dāng)碼長較短時,補上該漢字的拼音,構(gòu)成五三音碼,音碼可前可后,一經(jīng)選定不得改變,下面是規(guī)定碼長最多為2碼或3碼時的五三音碼的形部編碼具體規(guī)則(1)對只有1筆的漢字,橫、豎、撇、捺、折的編碼分別為1、2、3、4、5;(2)對2至5筆的漢字取其首一筆和末一筆,橫、豎、撇、捺、折當(dāng)沒與上一筆相交時,其編碼分別為1、2、3、4、5;當(dāng)只與上一筆相交時其編碼分別為6、7、8、9、0;當(dāng)不止與上一筆相交時,其編碼分別為位于鍵盤左上角的5個字母Q、W、E、R、T;(3)對6筆及以上的漢字取其首三筆和末三筆,對首三筆和末三筆只須根據(jù)其橫、豎、斜的排列組合情況輸入對應(yīng)的字母或符號鍵即可;
(4)對1至5筆的漢字或者按書寫順序?qū)γ咳P進行編碼,對每三筆只需根據(jù)其橫豎斜的排列組合情況輸入對應(yīng)的字母或符號鍵即可。若還剩一筆,最末筆為橫或豎或撇或捺或折,其編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折,其編碼分別為6或7或8或9或0;當(dāng)然也可將最末筆改為剩下的第一筆,也可不考慮剩下的筆畫數(shù)。
(5)對6筆及以上的漢字或者按書寫順序先對頭三筆和次三筆編碼,若還剩一筆,最末筆為橫或豎或撇或捺或折,編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折,編碼分別為6或7或8或9或0;若還剩三筆及以上,改取末三筆。對頭三筆、次三筆、末三筆只需根據(jù)其橫豎斜的排列組合情況輸入一一對應(yīng)的字母或符號即可。
規(guī)則(1)~(4)都以6筆為界,其實也可以以3筆及以上的任意筆畫數(shù)為界。比如規(guī)定對4筆及以上的漢字取其首三筆和末三筆,對1至2筆的漢字可直接輸入其雙拼碼,這樣完全舍棄了數(shù)字鍵,但會增加點重碼。
音碼可以為全拼或簡拼或混拼或雙拼或不完整拼音。采用不完整拼音,因與全拼不一致,會增加重碼,一般不采用。為縮短碼長提高輸速,一般用雙拼法,在實施例中選用微軟雙拼,還約定音碼在后,因規(guī)則(4)包含規(guī)則(1),規(guī)則(2)要區(qū)分筆畫數(shù),規(guī)則(5)碼長稍長,所以在實施例中按規(guī)則(3)、(4)編碼。
為提高漢字輸入速度還設(shè)置了簡碼、詞組、語句輸入法。
一、簡碼數(shù)字一至九只需擊一次相應(yīng)的數(shù)字健,字母簡碼見圖3,該圖的特點是除A、O、E、I、U按拼音末字母,V按象形,“;”按筆畫定位外,其余都按拼音首字母定位。冒號前為一級簡碼,冒號后為與它在句子中用法類似的同類高頻字。對同類高頻字只需按該圖的左右順序在一級簡碼后擊相應(yīng)的數(shù)字鍵1、2、3、4、5即可。
按規(guī)則(4)編碼時,由于全碼輸入時擊數(shù)字鍵不甚方便,一般大部分1至5筆的漢字都可舍去數(shù)字鍵,擊其簡碼。具體講對1至2筆的漢字可直接輸入其雙拼碼,對4至5筆的漢字可在輸入首三筆所對應(yīng)的字母或符號后再接著輸入其雙拼音碼。用簡碼輸入時利用數(shù)字鍵會大大增加簡碼數(shù)量,二級簡碼按五三音碼形部編碼從理論上講有700多個,若利用數(shù)字鍵可擴充至1000個左右,這會明顯提高輸速。三級簡碼從理論上講可舍棄五三音碼4位編碼中的任意1位,考慮思維習(xí)慣一般舍棄形部編碼第二位碼或韻母。
二、詞組詞組輸入法有兩種一是聲韻雙拼法;二是按五三音碼形部編碼,雙字詞只需直接輸入每個漢字的形部編碼;三字詞輸入第一第二個漢字的形部第一位碼,再輸入第三個漢字的形部編碼;四字及以上的多字詞只需輸入第一、二、三和最后一個漢字形部第一位碼。形部編碼不足二碼,補上“,”鍵。
三、語句語句輸入時只需接連輸入句子中每個漢字的聲、韻母即可。
實施例一種電腦漢字編碼方法五三音碼1 JAVS DMNK HJZI BMMA FHFA WSYM若按規(guī)則(2)編碼,五的編碼為11WU,三的編碼為11SJ,若按規(guī)則(5)編碼,種的編碼為JLAVS,該實施例在詞組輸入時采用微軟雙拼輸入法。為盡可能消除重碼和避免編碼的二義性,單字輸入時不支持多音字輸入,詞組輸入時仍支持多音字輸入。
有些經(jīng)常出現(xiàn)在字首或字尾的漢字組字單元組字頻率高,若完全按規(guī)則(3)、(4)編碼,容易集中排列在某一字母或符號鍵上,這會造成一定數(shù)量的重碼,因此有必要作適當(dāng)調(diào)整。調(diào)整的方法是將這些組字單元從組字頻率高的某幾種橫豎斜排列組合鍵上抽出,排列到組字頻率低的橫豎斜排列組合鍵上,避免容易出現(xiàn)在編碼同一位置的組字頻率高的組字單元及橫豎斜某種排列組合排在同一鍵上,排列時還考慮了同音字因素,還可酌情參考組字單元和橫豎斜27種排列組合的實用頻率、鍵位壓縮、指法規(guī)則。本發(fā)明人綜合比較,反復(fù)優(yōu)選后調(diào)整方案見圖4,圖4還調(diào)整了橫、豎、斜三類筆畫的排列次序,該圖也即優(yōu)化五三音碼形部編碼鍵盤排列圖。下面作具體解說(1)目含且、罒、皿、臼,钅含金,日含 ,足含走,貝含見,扌含キ,讠含言, 含 、已、巳、己、巴、尸、 ,土含士、 、牛,氵含水, 含 ,含心,阝含耳,饣含食字頭 ,亻含 ,ㄨ含 ,特別指出廣不含疒,麻部,木不含未、口不得與其它筆畫相交,貝在字首時,按其末三筆編碼,也就是為C,這些被含的組字單元與基本組字單元或互為繁簡,或互相同源,或音、形、義基本相同,可視為同種組字單元,就象字母有大小手寫體一樣。
(2)以上組字單元嚴格按書寫順序出現(xiàn)在字首或字尾,才排列在相應(yīng)的字母上,心的前三筆為豎斜斜時,編碼為聲母X。艸下面為氵時慣常與去氵后的字發(fā)生重碼,編碼非改不可,編碼為改的聲母G,艸下面為扌,犭前為氵、讠,日、口上面與十相連時編碼改為G,口上面為八、冂,編碼也為G,一橫與二豎相交或相連,一般為H,但艸下面連一到二橫時以廿代表,編碼為聲母N。連三橫時編碼作為組合組字單元,編碼也為G,例如萍的編碼為“GJP;”,“故”的編碼為GKGU,車、禾應(yīng)位于字首,亻應(yīng)在字的左部,ㄨ應(yīng)該在字尾。不在規(guī)定位置時,編碼不作調(diào)整。女的書寫順序為橫折撇,忄的書寫順序點豎點,力刀的書寫順序因人而異,約定在下部時為撇折,其余都為折撇。離散的筆畫“乙”形似豎的代號2,約定作豎,己上面為山時不作調(diào)整。
(3)木根據(jù)其首三筆編碼;目、禾分別根據(jù)末三筆編碼;饣為食的簡體,其末三筆為N,日的左部,足的中部象E,亻變形后似W,貝象R,ㄨ形似X,讠象I、口象O, 象P,扌形似F,艸象H,犭的形似反K,反文低象K, 象2個L連成;王形似手寫體Z,大有撇有捺象倒立V,钅字頭形似V,所以將它們排列在相應(yīng)的字母鍵上; 的前三筆出現(xiàn)在字首時,形如U, 出現(xiàn)在字尾時,為倒立的 ,編碼為U,土、月、氵、廣按聲母編碼,竹按韻母編碼。車的第二筆視為撇折的話,將它橫倒看,其首三筆就為豎斜豎,所以編碼為B,巾將其橫倒看,其筆畫為橫豎橫,所以排列在A上, 起筆形似L,且其三筆從右向左看為斜斜豎,所以將其排列在L上,小的第一三筆為豎斜,兼容在Y鍵上,小的第一三筆為豎斜,兼容在H鍵上, 的第一二筆為斜橫,下面又有二點,所以排列在J上,米的上半部從左至右點豎點、所以排列在P鍵上,是一線連三橫,所以排在Q上,特別規(guī)定馬、彳、忄、田、耳、魚、雨出現(xiàn)在字首時,第二碼取依書寫順序出現(xiàn)在其后的次三筆。門、口部取其內(nèi)次三筆。如其后不足三筆時,仍按原來規(guī)則編碼。在對首三筆、其后次三筆、末三筆編碼時,遇到調(diào)整后的組字單元,則要優(yōu)先按最大的組字單元編碼,木、馬、蟲在字下部時移至字首后編碼。另外,阝象B。例如驥的編碼為ARJI,固的編碼為RGGU,日的編碼為E1RI。
(4)由于每個鍵上最多只有2個基本組字單元,總共才30余個基本組字單元,與俄文字母相當(dāng),且主要按筆畫或拼音或象形(與西文字母或號相似)等方式排列在鍵上,極便于記憶,當(dāng)然個別似乎有點聯(lián)想、無理。
(5)有的組字單元組字頻率高,但因不足3筆,信息含量低,被舍棄,有的組字單元在6筆以上,但組字頻率低,實際信息含量不足,也被舍棄。
(6)可以將某幾種橫豎斜排列組合方式排在同一鍵上,按規(guī)則(4)編碼時也可將剩下的筆畫歸類為另外幾種筆畫,比如將折分為順折、逆折等等,這些都屬于該領(lǐng)域普通專業(yè)技術(shù)人員的變形,不影響本發(fā)明實質(zhì)。
有的漢字為左中右結(jié)構(gòu)或上中下結(jié)構(gòu),兩頭組字單元又完全相同,形似夾著一個組字單元,本發(fā)明人稱之為夾字架。對夾字架可去掉其字首或字尾的組字單元,然后編碼,在實施例中去掉字尾的組字單元后編碼。
左中右結(jié)構(gòu),中間在三筆及以上,右邊為刂,上中下結(jié)構(gòu),上面為立,下面為兒也屬于廣義上的夾字架,對這些夾字架可同樣去掉字尾的組字單元后編碼。
赤部不屬于土部,齒、步部不屬于止部,所以應(yīng)按下半部的首三筆編碼。與載類似結(jié)構(gòu)重心在車處,與贏類似結(jié)構(gòu)重心在貝處,所以應(yīng)按重心所在編碼。另外約定組字單元玉、甫、戔右角的點忽略不計。
有的漢字為上下結(jié)構(gòu),并且至少有2個相同的組字單元依次出現(xiàn)在字尾,本發(fā)明人稱之為疊字架,對疊字架若有2個相同的組字單元,則形部第2碼取英文第一個字母A,若有3相同的組字單元,則取英文第二個字母B。左右結(jié)構(gòu),右面又為上下結(jié)構(gòu),并且至少有2個相同的組字單元依次出現(xiàn)在字尾,也屬于廣義上的疊字架,編碼為B。
實施例弼WEBI 贏JRY;輔BFFU 荔HBLI一種電腦漢字編碼方法五三音碼1 NWVS E0DM YONK S9HJ KZZI LHBMXAMA M5FH SCFA 5 3 JEYN XAMA其中電的簡碼EDM 漢的簡碼SHJ 方的簡碼MFH
作為五三音碼的一種變形,對6筆及以上的漢字形部編碼或者按筆畫或拼音或象形等方式先對義部編碼,一般當(dāng)義部在字首時,第二碼取字尾三筆,在字尾時取字首三筆,在字中時約定取字首或字尾三筆。由于部首數(shù)量劃分不一,位置不易確定,相比之下以前一個方案為優(yōu)選。
本編碼字詞兼容,不必進行換檔等附相操作,重碼字極少,重碼選擇方法和其它輸入法相同,另外還設(shè)置了去重鍵“。”也就是將形部編碼第二位碼改為“?!保@樣不影響指法,又可消除重碼,利于專職追求高速,“?”鍵為萬能查詢鍵,當(dāng)某一位碼難以確定時,可用“?”代替,再利用提示行選擇,不足規(guī)定碼長的均以空格鍵結(jié)尾。
本編碼還提供了一種新的漢字修改方法,它使得漢字修改與西文差不多容易,方法是將光標移至所需要修改的字下,若該字與改后的字同音,雙擊改后的字的五三音碼形部編碼,改后的字即上屏,當(dāng)然這需要強大的軟件支持。本方法顯然適用于語音語句輸入后的修改,軟件允許的話,只需念形部編碼的讀音。
本發(fā)明適用于一切大、中、小、微型計算機中文信息處理系統(tǒng)和通訊系統(tǒng),可廣泛應(yīng)用于中文終端、中文電傳、電腦打字和計算機排版印刷等各個方面,可在互聯(lián)網(wǎng)環(huán)境下運行。
本發(fā)明可以適用于繁體字的港、澳、臺地區(qū),也可以用于日文、韓文,只是日文、韓文漢字與普通話讀音不同,組字單元的排列不完全相同,排列方法仍然相同。
五三音碼編碼規(guī)則極為簡單、客觀,音碼部份以雙拼法為最快,對于已經(jīng)掌握雙拼法的人來說,不出短短十分鐘就能學(xué)會,而且學(xué)會后就能牢記不忘,沒掌握雙拼法的人可在練習(xí)雙拼法時同步學(xué)會。單字碼長最長不過四碼,重碼率幾乎為0,免去了同音字選擇煩惱,音碼部分選用南方模糊音幾乎不會增加重碼,南方模糊音的特點是c、s、z與ch、sh、zh,及in與ing不分,en、eng與清輔音b、p、m、f相拼時區(qū)分。支持語句輸入,不易疲勞。容量大,從理論上講可以容納全部6萬多個漢字,做到高速脫稿輸入,也就是說不僅適合于盲打,還適合于聽打、想打,使得漢字無論是輸入速度還是調(diào)出速度都要快于西文。
圖1、橫豎斜三類根本筆畫與漢字各種筆畫對應(yīng)關(guān)系表。圖2、三個筆畫中橫豎斜的27種排列組合形式在鍵盤上的一種優(yōu)選排列圖。圖3、一級簡碼和同類高頻字。圖4、優(yōu)化五三音碼形部編碼鍵盤排列圖。圖2、圖4中1、2、3分別為橫、豎、斜的代號。
權(quán)利要求
1.一種五三音碼,其特征是組合五三筆碼和音碼,并允許以橫豎斜的排列組合不外乎27種,一一對應(yīng)或大致一一對應(yīng)地排列在27個或不足27個互不相同的鍵上為基礎(chǔ),調(diào)整某些組字單元包括筆畫、若干特定結(jié)構(gòu)漢字的歸類編排取碼方法的編碼。
2.一種五三音碼形部編碼鍵盤排列圖,其特征是橫豎斜的排列組合不外乎27種,一對應(yīng)或大致一一對應(yīng)地排列在27個或不足27個互不相同的鍵上,并允許把某些組字單元排列在鍵上。
3.根據(jù)權(quán)利要求1所述的五三音碼,其特征是當(dāng)超過五三筆碼規(guī)定的最多碼長時,改取最后一碼,當(dāng)規(guī)定碼長較短時,補上該漢字音碼,音碼可以為全拼或簡拼或混拼或雙拼或該漢字拼音前2個字母。
4.根據(jù)權(quán)利要求2所述的優(yōu)化五三音碼形部編碼鍵盤排列圖,其特征是橫豎斜的排列組合不外乎27種,一一對應(yīng)地排列在標準鍵盤的鍵上,排列組字單元時,一般要考慮兩點(1)避免容易出現(xiàn)在編碼同一位置的組字頻率高的組字單元及橫豎斜某種排列組合排列在同一鍵上,(2)漢字同音字因素,另外還可以參考鍵位壓縮或組字單元及橫豎斜排列組合的實用頻率或指法規(guī)則。
5.根據(jù)權(quán)利要求4所述的優(yōu)化五三音碼形部編碼鍵盤排列圖,其特征是將基本組字單元主要按筆畫或拼音或象形方式排在鍵上,基本組字單元數(shù)與西文字母數(shù)大體接近,基本組字單元數(shù)還可以包含要么互為繁簡,要么互相同源,要么音或形或義基本相近的組字單元,有的組字單元甚至還可以規(guī)定必須位于漢字的特定位置,或者規(guī)定與某些近似的組字單元相區(qū)別。
6.根據(jù)權(quán)利要求3或5所述的優(yōu)化五三音碼,其特征是形部編碼為(1)、對1至5筆的漢字按書寫順序根據(jù)每三筆的橫豎斜排列組合情況編碼,當(dāng)剩下的筆畫不足三筆時歸類為幾種筆畫,用數(shù)字鍵編碼,一般歸類為橫豎撇捺折五類筆畫,當(dāng)剩下一筆時,若為橫或豎或撇或捺或折,編碼分別為五個互不相同的數(shù)字,當(dāng)剩下二筆時,可約定按剩下第一筆或第二筆編碼,第一筆或第二筆為橫或豎或撇或捺或折,編碼分別為另外5個互不相同的數(shù)字;(2)、對六筆及以上的漢字根據(jù)首三筆和末三筆的橫豎斜排列組合情況編碼;(3)、遇到排列在鍵上的組字單元可以規(guī)定優(yōu)先按該組字單元編碼,有的組字單元還可以規(guī)定移動其在漢字中的位置后編碼或取其次三筆;(4)、遇到特定結(jié)構(gòu)的漢字可以規(guī)定另行處理。
7.根據(jù)權(quán)利要求6所述的五三音碼,其特征是特定結(jié)構(gòu)的漢字的形部編碼規(guī)則主要為(1)、對重心在漢字中某一位置的漢字要優(yōu)先按重心所在編碼;(2)、對左中右結(jié)構(gòu)或上中下結(jié)構(gòu),兩頭組字單元又完全相同的漢字可約定去掉某一頭后編碼;(3)、對上下結(jié)構(gòu)并且至少有2個相同的組字單元依次出現(xiàn)在字尾的漢字可用一個或幾個優(yōu)選的字母代替。
8.根據(jù)權(quán)利要求6所述的五三音碼,其特征是對6筆以上的漢字或者先對義部主要按筆畫或拼音或象形方式編碼,形部編碼第二碼一般當(dāng)義部在字首時取其字尾的三筆,義部在字尾時取其字首的三筆,義部在字中時可約定取字首或字尾的三筆,對字首或字尾的三筆根據(jù)其橫豎斜的排列組合情況編碼。
全文摘要
本發(fā)明五三音碼提供一種組合五三筆碼和音碼的電腦漢字編碼輸入方法,它具有幾分鐘學(xué)會、大部分漢字不必選擇同音字、輸速快的優(yōu)點。采用調(diào)整方案的,也就是采用以碼長最多為2碼的五三筆碼為基礎(chǔ),組字單元為配合,漢字結(jié)構(gòu)為補充并結(jié)合拼音的,甚至可以幾乎不選同音字,從而實現(xiàn)高速脫稿輸入,而學(xué)成時間僅需10多分鐘。
文檔編號G06F3/023GK1325052SQ0111140
公開日2001年12月5日 申請日期2001年3月5日 優(yōu)先權(quán)日2000年3月8日
發(fā)明者王治陽 申請人:王治陽