專利名稱:優(yōu)化賦音形碼中文系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及到一種優(yōu)化賦音形碼中文系統(tǒng)。目前,在此技術(shù)領(lǐng)域中,筆寫法、語音讀入法技術(shù)都不算成熟,主要還要靠鍵盤輸入漢字。計算機鍵盤輸入漢字的技術(shù)方案大體上又可分為聲碼、聲形碼和形碼三種。聲碼法與聲形碼法要求會正確讀出所要錄入的漢字,且重碼多,錄入速度低;對根本就不認識的漢字不好錄入,可是,謹就GB2312_80中所列的6763個漢字而言,一般人至少就有3000個左右不認得的字。形碼就不然,它對不認得的漢字也能錄入。
在當(dāng)前很長一段時間里,發(fā)明專利<優(yōu)化五筆字型編碼法及其鍵盤>(申請?zhí)?5100837,以下簡稱‘五碼’,引用號[2])的實施方案,在諸多的形碼方案中,在市場上占有著統(tǒng)治地位。但‘五碼’字根難記、無編碼唯一性、規(guī)則繁雜零亂、不規(guī)范、重碼較多,不好學(xué)、不好掌握。
本發(fā)明人針對‘五碼’的嚴(yán)重缺點,曾提出了“賦音形碼漢字輸入系統(tǒng)”(以下引用時簡稱“賦碼系統(tǒng)“)發(fā)明專利,1996年4月13日獲得專利權(quán),專利號ZL93114933.9(以下做引用時用[1])。
本發(fā)明目的在于,針對[1]作進一步的改進,使《賦碼系統(tǒng)》升級為《優(yōu)化賦音形碼中文系統(tǒng)》(以下簡稱‘優(yōu)碼系統(tǒng)’),使‘優(yōu)碼系統(tǒng)’對漢字的錄入方法極簡捷、流暢而快速,處處規(guī)范、根本沒有重碼和特例,易學(xué)、易鍵,易普及推廣,徹底解決漢字錄入難的問題。
一種優(yōu)碼系統(tǒng),是用鍵盤向計算機輸入漢字的系統(tǒng),該系統(tǒng)給出漢字的根碼和補碼錄入方法、詞組錄入方法、字典功能及能提示簡碼和不同碼長功能的提示行技術(shù),并以下述最低限成分構(gòu)成作為中央處理機的主機、監(jiān)視器和中英文鍵盤。
圖1是字根總表及字根在鍵盤上的分布圖;圖2是鍵盤區(qū)位定義圖及示出的本發(fā)明確定補碼的機理;圖3是一張矩形扁條式樣的賦音形碼字根鍵位圖。
圖1表明本發(fā)明選定的所有字根及其在鍵盤上的分布。圖中小方框并在其中寫上大寫的英文字母,用來標(biāo)明鍵盤上的鍵位標(biāo)志。例如, 就表示‘Q’鍵位。一個鍵位標(biāo)志在上,含有該鍵位標(biāo)志的較小的方框,其中列寫著一些該鍵位中所包含的字根。英文字母分別當(dāng)做在該一鍵位上的所有字根的代碼,在鍵入時要在小寫狀態(tài)下進行;
在圖1所示的字根總表中,“折”是包括被現(xiàn)代漢語定義的一切折筆劃,如“> ㄋ乙ㄑ∠乚レ ”等,也含有‘(’、‘)’及‘0’。
圖2是為得到非字根漢字補碼的機理示意圖。
在圖2中,英文字母示意鍵盤的鍵位,為得到非字根漢字的補碼,而將整張英文鍵盤分成。橫區(qū)’、‘撇區(qū)’、‘棍區(qū)’、‘捺區(qū)’和‘折區(qū)’五個區(qū);并在每個區(qū)中又在不同的鍵位,標(biāo)上‘橫、撇、棍、捺、折’字樣,用以表示每個鍵位的鍵盤分位名;圖2示意出用非字根漢字的‘尋區(qū)筆劃的筆型’來‘尋區(qū)’,然后在所尋到的區(qū)中,用非字根漢字的‘尋位筆劃的筆型’來‘尋位’而確定一般漢字補碼的過程。箭頭就是示意了這個過程。
圖3這張矩形扁條式樣的賦音形碼字根鍵位圖,是供錄入者在錄入漢字時使用參考的,可參考關(guān)于圖1的說明。
本發(fā)明的目的是通過下述中文系統(tǒng)的功能和方法實現(xiàn)的,分幾方面說明如下1.漢字的筆順是‘優(yōu)碼系統(tǒng)’漢字錄入的基本依據(jù)之一;對筆順的特殊規(guī)定,不利于純潔漢字文化,只能引起混亂。本發(fā)明沒有自己杜撰的特殊規(guī)定而是依據(jù)國家有關(guān)的規(guī)范標(biāo)準(zhǔn)——《印刷通用漢字字形表》[3]、《第一批異體字整理表》[4]、《簡化字總表》[5]、《關(guān)于部分計量單位名稱統(tǒng)一用字的通知》[6],并參考《漢字屬性字典》[7]認定的。
2.‘優(yōu)碼系統(tǒng)’參考到現(xiàn)有的文獻和漢語文字學(xué)的通例,并考慮到錄入的方便,也將漢字的筆劃歸類為‘橫、撇、豎、捺、折’五種基本類型,且橫與提不分而歸為‘橫’,‘豎’與‘豎左鉤’不分而歸為‘豎’,點與捺不分而歸為‘捺’。
漢字筆劃的基本類型稱為‘筆型’。
將漢字筆劃分為‘橫、撇、豎、捺、折’五類。漢語言文字學(xué)和中國人久已習(xí)慣于如此的分類了。久遠的不說,1980年再版的《辭?!穂8]、《新華字典》[9]就是這樣分類,且也是‘橫、提’不分、‘點、捺’不分,只是將‘捺’歸為‘點’。
優(yōu)碼系統(tǒng)糾正了[2]的‘按筆劃的走向’不規(guī)范而可能引起混亂的筆劃分類方法,對漢字筆劃的分類,是就規(guī)范的印刷楷體而言,詳細說明如下橫含長的與短的。橫’和‘提’,即“—、-、 ”;撇含長的與短的‘撇’,即“丿、'”;其特點是走向是右上而向左下,且由粗而細或粗細基本一致;尤其是對于短‘撇’,不能由細而粗。
豎含長的與短的‘豎’和‘豎左鉤’,即“丨、ㄧ、亅”;特點是筆劃骨干部分的走向是由上而鉛垂向下,且粗細基本一致;在保持由上而向下粗細基本一致的大趨勢前提下,允許稍稍地有所‘個垂直’。例如‘丑’字的一豎,為使寫出來好看,就要求在保持由上而向下且輕重、粗細基本一致的前提下而略向左下斜一點。
優(yōu)碼將‘豎’的讀音‘從古讀’定義為[棍、GUN]。(參考《康熙字典》[10])捺含漢語文字學(xué)中長的與短的‘捺’和‘點’,即“丶
”;對‘短捺’而言筆劃的走向是左上而向右下;對于‘點’而言,不是看其走向而是看其筆劃的骨干部分輕細在先重粗在后,且筆劃不舒展,幾乎緊縮成一個‘點’之勢,幾乎談不上‘走向’,它不是‘走’而是‘頓’。
例如‘灬’字的四個筆劃都是‘點’。‘冖’、‘軍’等字的第一筆劃,雖其‘走向’是由右上而左下,但它不是‘撇’,而是一個‘由細到粗的點’。不能像‘五碼’所言,因其‘走向’是‘由右上而向左下’劃歸到‘撇’中去。
折它是漢語文字學(xué)上概念上的‘折’,也含有‘(’、‘)’及‘0’;筆劃的代碼是其漢語拼音的第一符號,筆劃的簡符、讀音與代碼如表1所示
表13.為了幫助錄入者記憶字根在鍵盤上的分布和方便錄入,采取下述四種措施措施之一是將字根或選有代表性的字根,印制到鍵帽的水平表面和位于操作員側(cè)的斜立表面上,與鍵盤上原有的英文字母一起而實際地將標(biāo)準(zhǔn)英文鍵盤改制成一個‘中英文鍵盤’。這樣,就可以參考鍵帽上對字根的標(biāo)志而直接“敲字根”錄入根碼,例如,錄入‘疆’的‘根碼’,直接“敲字根”‘弓一一’,是很便當(dāng)?shù)摹?br>
措施之二是按鍵盤上鍵位的實際位置關(guān)系,將字根按讀音相同的緊靠在一起,參考著圖1,繪制一張矩形扁條式樣的賦音形碼字根鍵位圖,如圖3所示。這張圖可方便地貼在錄入者眼前的某個位置——例如貼在顯示器的下(或上)沿,以便于參考。
措施之三是“優(yōu)碼系統(tǒng)”對字根定義讀音;英文鍵盤上的字母看作是漢語拼音符號;“字根分在與其首音相同的鍵位上”。這樣當(dāng)需要鍵入一個漢字時,根據(jù)字根的首音便可立即找到鍵位,錄入特別方便。如‘李’字,當(dāng)鍵字根‘木’、‘子’時,可立即找到鍵位‘M’與‘Z’。
1)英文鍵盤上的字母看作是漢語拼音符號中英文鍵盤上各鍵被看作是漢語拼音符號,需要用兩個字母表示的聲母[ZH][CH][SH],分別用AIU表示,各鍵代表的音素,總括的開列如下鍵位B P M F D T N L G K H J Q X A I U R Z C S E Y W O V漢拼B P M F D T N L G K H J Q X ZH CH SH R Z C S E Y W W(O)Y (u)注音ㄅㄆㄇㄈ ㄉㄊㄋㄌ ㄍㄎㄏ ㄐㄑㄒ ㄓ ㄔ ㄕ ㄖㄗㄘㄙ ㄜㄧ ㄨㄨㄛㄧ(ㄩ)注音波坡摸佛 得特訥勒 哥科喝 基欺希 知 吃 詩 日資雌思 鵝衣 烏烏窩衣(迂)
(1)漢語拼音符號‘O’的讀音與[WO]的讀音很相像,就用‘O’鍵位表示[W]音素,并將以[W]音素開頭的字根——‘我、扌、、
囗’置于‘O’鍵位。
(2)‘V’并不是漢語拼音符號,本發(fā)明用‘V’來表示‘ü’音素。而按漢語拼音方案‘ü’音素在首位時,要拼成‘YU’。據(jù)此,我們將發(fā)音的前面含有[YU](自然,首音是[Y])的所有字根‘于
俞肀
雨予月
’置于‘V’鍵位上。
(3)其余的字根也都被分配到與其首音相同的鍵位上。如此,字根在鍵位上的分布,可概括為字根被分配到與其首音相同的鍵位上。
2)“優(yōu)碼系統(tǒng)”用下述用戶容易接受和記憶的五種方法對字根定義讀音(1)‘從古讀’法賦音(參考《康熙字典》[10])將有古讀的字根,盡量‘從古讀’,這些字根是一[橫]、丿[撇]、丨[棍]、[捺]、亠[頭]、ナ[有]、彡[杉]、厶[私]、冫[冰]、冖[冪]。
(2)‘參考習(xí)慣稱呼取讀音’,詳見表2。
表2(3)‘視為某字的一部分而取該字的讀音’的方法賦音,詳見表3。
表3(4)“粘著”用形或意相近似的關(guān)系而‘粘著‘的方法定義讀音,用戶容易接受和記憶。例如,據(jù)形意與‘犭’相近的關(guān)系,將‘
’“粘著”到‘犭’上,其讀音也定義為[犬]。‘犭、
’按其首音都分在‘Q鍵上;屬于“粘著”的,詳見表4。
表4中,被“粘著”其上用以作為讀音依據(jù)的字根或漢字,我們稱作“樣板”。 表4(5)襲用除此之外的字根,本來就是一個漢字的,就襲用該漢字的讀音。例如犬[QUAN]、田[TIAN]、囗[WEI]、兀[WU]、弋[YI]、幺[YAO]、彳[CHI]、番爿[PAN]、圭[GUI]、戔[JIAN]、隹[CUI]、肀[YU]、辟[BI]、廿[NIAN]、皿[MIN]、……等。說明①‘曰’與‘日’形相似,將字根‘曰’的讀音,字義為‘日’,這是為提高鍵入速度,而采取的措施。類似地還有如土、士;子、孑;巳、己;七、匕……等。
②“開口念佛不取‘匚’[七]”的口訣是指‘凵冂門 幾都讀[佛,F(xiàn)O],其特點,有開口形狀——但不含‘匚’[QI];字根“匚”本是舊漢語注音的符號,讀作[FO、佛],今借用其讀音和有“開口形狀”的特點而有此條。又為消滅重碼,借用“匚”與“七”相似的特點,又將“匚”的讀音字義為“七”并從而將“匚”歸到“Q”鍵位。
③“橫”與“提”不分,都讀“橫”;“豎”與“豎左釣”不分,都讀“棍”;“點”( )與“捺”(丶)不分,都讀[NA]。
④并沒有“長、爪、死”字根;4.關(guān)于優(yōu)碼系統(tǒng)漢字與詞組的鍵盤錄入方法幾點一般性的說明1)‘優(yōu)碼系統(tǒng)’是用鍵盤敲擊編碼向計算機錄入漢字或詞組的,漢字的優(yōu)碼是由在前的‘根碼’和在后的‘補碼’合起構(gòu)成的,正式編碼的碼長為2、3、4,是采用不等長編碼制的,最大碼長為4;優(yōu)碼對單個漢字或詞組的錄入是通過在小寫狀態(tài)下敲擊中英文鍵盤上的26個英文鍵和空格鍵實現(xiàn)的。有26個漢字有一級簡碼。有些碼長為2的漢字同時還兼有碼長為3的編碼或(和)碼長為4的編碼;有些碼長為3的漢字同時還兼有碼長為4的編碼——優(yōu)碼系統(tǒng)將這些本有碼長較小的編碼漢字,還制有碼長較大的編碼是將這較長的編碼當(dāng)成“容錯碼”看待,是為取得更大的靈活性。
2)用鍵盤向計算機錄入漢字的時候,首先要依次敲入‘根碼’——在敲入‘根碼’的過程中,一旦提示行出現(xiàn)了所要的漢字時,及時地敲一下空格鍵,該漢字就上到了編輯位,這時,自然不必再考慮補碼了;當(dāng)‘根碼’不足四,且將‘根碼’全部敲完后,提示行還不出現(xiàn)所要的漢字時,就還要接著敲入‘補碼’;若在敲入補碼的過程中,一旦在提示行出現(xiàn)了所要的漢字時,及時地敲入空格鍵,該漢字就上到了編輯位,否則就繼續(xù)敲入下面的補碼。
3)用“余部首筆鄰鍵(建)根,碼少劃多筆順分”的鍵入(或建立)字根方法,能建立起根碼中各位的字根,順次排列形成‘根碼’;——但當(dāng)這些字根多于4個時,只取前三個和最末一個,其余忽略(取前三末一的字根成根碼);“余部首筆鄰鍵(建)根,碼少劃多筆順分”也是鍵根的方法。‘建根’是建起一個字根;‘鍵根’是鍵入一個字根。若把“取前三末一的字根成根碼”當(dāng)成常識性的因素,因而不必在“根碼錄入方法的口訣”中出現(xiàn)。這樣,“根碼的鍵入(和建立)方法的口訣”就可說成是“余部首筆鄰鍵(建)根,碼少劃多筆順分”。
4)‘優(yōu)碼系統(tǒng)’監(jiān)視器的提示行具有下列功能和用途當(dāng)用戶向計算機輸入漢字的優(yōu)化賦音形碼編碼(以下簡稱‘優(yōu)碼’)的第一位代碼時,它顯示所敲入代表一級簡碼的一個英文字符及與之對應(yīng)的一級簡碼漢字,當(dāng)繼而再輸入第二位代碼時,它顯示所鍵入的兩個英文字符表示編碼及與之對應(yīng)的碼長為二的漢字,……當(dāng)繼而再輸入第N(N=3或N=4)個代碼時,它顯示所鍵入的所有英文字符表示編碼及與之對應(yīng)的碼長為N的漢字。當(dāng)所顯示的即是所要的漢字時及時地敲擊空格鍵,所要的漢字就上到了編輯位,——若不是所要的漢字,就繼續(xù)敲擊余下的編碼。系統(tǒng)以此來提醒用戶及時地敲擊空格鍵來鍵入所顯示的即是所要的漢字,并幫助用戶記憶哪些漢字有簡碼或漢字的碼長是多大;提示行也作為編輯器的監(jiān)視器,優(yōu)碼系統(tǒng)允許用敲擊‘退格符Backspace)回抹掉提示行上所鍵入的字符,每打一下退格符回抹掉一個,還允許重新編輯鍵入新的字符;5.關(guān)于“根碼錄入方法”的進一步說明根碼的鍵入(和建立)方法“余部首筆鄰鍵(建)根,碼少劃多筆順分”例如,‘夾’,要鍵(建)的根為 和‘大’。
①余部漢字鍵去一些字根后,余下的部分。在未鍵之前,整個一個漢字就是‘余部’——此例就是‘夾’;‘夾’字鍵去 后,‘余部’就是‘大’;②余部首筆‘余部’的第一筆劃。如‘夾’的首筆是‘一,‘大’首筆是‘一’③‘余部首筆鄰鍵(建)根’——與‘余部首筆’相鄰或依次相鄰的筆劃都可以用來組成字根而鍵入。如與‘夾’的首筆‘一’相鄰或依次相鄰的筆劃既可以組成 ,也可以組成‘ナ’或‘大’。
④‘余部首筆鄰鍵(建)根,碼少劃多筆順分’——在做‘余部首筆鄰鍵(建)根’的時候,要依‘碼少劃多筆順分’的原則進行碼少(第一優(yōu)先級)鍵入的字根數(shù)目要最少。如‘夾’可鍵‘ 大’或‘大’,字根的數(shù)目都是二——數(shù)目最少;劃多(第二優(yōu)先級)在第一優(yōu)先級的前提下,當(dāng)前這次鍵(建)根‘劃數(shù)要最多’如‘夾’的第二(位)次鍵入,‘大’是三筆劃,若鍵‘ナ,是二筆劃,自然是取‘大’才是‘劃多’;筆順分(第三優(yōu)先級)若滿足‘碼少劃多’的方案不止一個,最后用‘筆順分’選一種“最合乎筆順”的。該方法保證了優(yōu)碼有編碼唯一性。⑤字根的筆劃序列將一個漢字的某個字根中的各個筆劃依其在該漢字中的書寫序號,由小到大的排列起來而組成一個數(shù)碼,定義為該漢字中該字根的‘筆劃序列’。‘字根的筆劃序列’是一個數(shù)碼,是隸屬于特定的漢字的。例如,‘寧’字中的字根‘丁’的‘筆劃序列’是45;而‘可’字中的字根‘丁’的‘筆劃序列’卻是15。
假如有一個漢字有兩種拆分方案需用‘筆順分’的規(guī)則加以選擇。我們就先比較兩種拆分方案的第一個‘字根的筆劃序列’,看哪個方案的‘字根的筆劃序列’小,就選哪個拆分方案;如兩方案的第一個‘字根的筆劃序列’相等,再依法比較第二個、第三個、第四個,取最早發(fā)生‘字根的筆劃序列’較小者的方案。例如‘夾’的兩種拆分方案①夾 大wd——②夾大dc。詳見表5的分析。
‘筆順分’的數(shù)學(xué)描述在對一個漢字進行拆分時,假如符合‘碼少劃多’的方案有兩個,先比較兩方案的第一個字根的筆劃序列,再比較第二第三第四個,當(dāng)?shù)谝淮纬霈F(xiàn)不等式的關(guān)系時,就取筆劃序列較小的方案,舍棄筆劃序列較大的方案。
若只有一(或二、三)個字根,已經(jīng)全部敲完,提示行還不出現(xiàn)所要的漢字,應(yīng)繼而去敲‘補碼’。
這里,我們所說的‘敲字根’和“敲字根的代碼”都是指敲我們的“中英文鍵盤”上同樣的一個鍵?!獙︿浫霛h字來說,“敲字根”比“敲字根的代碼”來得“更直接”!同樣的,當(dāng)需要“敲根碼”時,若把“根碼”理解成“實際上是一個字根的序列”,也是來得“更直接”!我們將“把字根序列形式的根碼中的字根,以其代碼代之,并依序排列形成的小寫英文字母序列”也稱之謂“根碼”——這才是機器從鍵盤上得到的真正的信息。例如‘疆’的‘根碼’是‘弓一一’,也是‘gthh’,在不同的場合所指有所不同而已。 表56.‘補碼’的錄入方法當(dāng)需要對一個漢字加入補碼時,要據(jù)漢字是‘字根漢字’或是‘非字根漢字’兩種情況分別對待‘字根漢字’當(dāng)該漢字就是一個字根時,這個漢字稱‘字根漢字’;‘非字根漢字’不是字根的漢字,稱為‘非字根漢字’;(也稱‘一般漢字’,這是絕大多數(shù)的情況)(1)‘字根漢字’的補碼錄入方法是“依次擊入該漢字的前三個筆劃”,實在不出再補‘l’;例如‘石’字,它本身就是一個字根,只有一個根碼‘u’,其前三筆劃是‘一丿丨’,補碼是‘hpg’?!值木幋a就是它的根碼加上它的補碼‘石一丿丨’,或‘uhpg’。
以下為便于表達,這層意思我們記為石石一丿丨uhpg、又如八人丿丶rpn廿廿一丨丨nhgg;犭犭丿 qpzp口口丨 一kgzh;當(dāng)字根漢字的筆劃數(shù)目很小,且當(dāng)將所有的筆劃都敲完后,所要的漢字還沒有出來時,就要補打‘l’例如對‘一‘字,要打‘hhl’。例子如下
一一一hhl 丨丨丨ggl 乙乙乙zzl 乙一fzhl丿丿丿ppl 丶丶丶nnl 冫冫丶一bnhl リリ丨丿lgpl(2)‘非字根漢字’補碼的錄入是在與末字根的末筆劃的筆型同名的‘區(qū)’中,敲擊與首字根的首筆劃的筆型同名的鍵盤分位的鍵位。或簡言之‘非字根漢字’補碼的錄入方法是“末根末筆尋區(qū),首根首筆尋鍵位”。
如‘導(dǎo)’字的補碼。參考圖2的‘鍵盤區(qū)位圖’,由‘導(dǎo)’的末根‘寸’的末筆劃‘捺’作為尋區(qū)的筆劃,尋到了捺區(qū),首根‘巳’的首筆劃‘折’作為尋位的筆劃,我們就在‘捺區(qū)’中的‘折’位上而確定出p鍵——‘導(dǎo)’的補碼‘p’。
對于‘根碼’只有兩個的情形,當(dāng)打完一個‘補碼’后,在提示行沒有出現(xiàn)所要的漢字時,需要再擊一下‘補碼’。
關(guān)于‘非字根漢字’補碼錄入的實施例如下員口貝。當(dāng)鍵入‘口貝’(kb)后,提示行出的是‘員’,正是所要,再補打一個‘空格鍵’,‘員’字就上到了編輯位;就不必打補碼了;加力口。當(dāng)鍵入‘力口’(lk)后,提示行出現(xiàn)的是‘部’并不是‘加’,就要補打一個‘補碼’‘a(chǎn)’;提示行出‘加’,是所要,擊空格,‘加’上到編輯位;呷口甲。當(dāng)鍵入‘口甲’(kj)后提示行出‘嚷’,不是‘呷’,就要補打一個‘補碼’‘e’;提示行出‘哩’,不是所要,再打一個‘補碼’‘e’,提示行才出現(xiàn)‘呷’,打入空格鍵,‘呷’就上到編輯位了。
注意‘每敲一鍵都有字,如是所要,擊空格’的規(guī)律,例如口口丨一KGZH,但當(dāng)敲入‘kg’后,‘口’在提示行上出現(xiàn),敲空格鍵,‘口’就上到編輯位。
7.關(guān)于簡碼漢字與不同碼長漢字的確定與錄入在漢字編碼最前一個字母相同的那些漢字中,選擇統(tǒng)計頻度最高的一個漢字作為以該最前的一個字母為其‘一級簡碼’的漢字,優(yōu)碼的一級簡碼漢字及與之對應(yīng)的鍵位(一級簡碼)如下
對有一級簡碼的漢字,只要鍵入其第一個字根,提示行便有所鍵的一個英文字母與其所代表的漢字,鍵一下空格鍵,該漢字就錄入完成。
在漢字編碼的前兩(或三)個字母排列相同的那些漢字中,選擇統(tǒng)計頻度最高的一個漢字作為以該兩(或三)個字母為其正式編碼,這樣的漢字的正式碼長就是二(或三)。
對于碼長為二的漢字,多數(shù)情況下還有碼長為三和(或)碼長為四的編碼存在,用作‘容錯碼’,它們都是依據(jù)同樣的錄入根碼和補碼的方法產(chǎn)生的,對這樣的漢字,當(dāng)敲入前兩個碼的時候,提示行便有所敲入的兩個英文字母和該漢字出現(xiàn),打入空格鍵,該漢字就上到了編輯位;若不打入空格鍵且若該漢字還有碼長為3的編碼,還允許繼續(xù)敲入第三位編碼,提示行照樣有所敲入的三個英文字母和該漢字提示出來,此時仍可鍵入空格鍵使該漢字上到編輯位;此時,若不打入空格鍵且若該漢字還有碼長為4的編碼,還允許繼續(xù)敲入第四位編碼,提示行照樣有所敲入的四個英文字母和該漢字提示出來,此時仍可鍵入空格鍵使該漢字上到編輯位;對于碼長為三的漢字,多數(shù)情況下還有碼長為四的編碼存在,作為‘容錯碼’。它們都是依據(jù)同樣的錄入根碼和補碼的方法產(chǎn)生的,對這樣的漢字,當(dāng)敲入前三個碼的時候,提示行便有所敲入的三個英文字母和該漢字出現(xiàn),打入空格鍵,該漢字就上到了編輯位;若不打入空格鍵,還允許繼續(xù)敲入第四位編碼,提示行照樣有所敲入的四個英文字母和該漢字提示出來,此時仍可鍵入空格鍵使該漢字上到編輯位;綜上所述,輸入單個漢字的方法,亦可說是“鍵了根碼鍵補碼,每鍵一鍵都有字,如是所要擊空格,不是所要繼續(xù)鍵”8.詞組的編碼與鍵入方法詞組的編碼碼長總為4;它是以漢字編碼為基礎(chǔ)的,鍵入方法是(1)二字詞取每個漢字編碼的前兩位碼敲入(簡記為‘22敲入’);如,中國口丨囗王(kgow)、紅旗纟工方(sgfp);(2)三字詞取第一個漢字編碼的前兩位碼和第二、第三個漢字編碼的第一個字根依次敲入(簡記為‘211敲入’);如國務(wù)院囗王夂阝owwe;數(shù)理化米女王亻mnwl;(3)四字及多于四字詞,取第一、二、三及最末一個漢字的第一個字根依次敲入(簡記為‘111末敲入’);如工作人員工亻人口glrk;中華人民共和國口亻人囗klro。
詞組之間或詞組與單個漢字之間允許有少量的重碼,當(dāng)出現(xiàn)重碼時,在提示行作提示,通過鍵入英文大鍵盤上與提示行提示的數(shù)字相同的數(shù)字鍵作出選擇;9.字典功能在ASCII狀態(tài)下,用‘功能鍵’ALT+N可進入或退出‘字典功能’,進入‘字典功能’后,可以切換到另一種漢字錄入方法輸入所要的漢字,然后在提示行上提示該漢字優(yōu)碼的‘編碼’;也可再用‘功能鍵’ALT+N退出‘字典功能’。
10.關(guān)于繁體漢字系統(tǒng)的字根調(diào)整本發(fā)明的漢字的編碼錄入方法,完全適合繁體漢字,——但要對字根進行必要的調(diào)整和補充
(1)對單純的繁體漢字系統(tǒng)而言,將圖1所示的成字字根,替換成相應(yīng)的繁體的;而對繁簡混合的漢字系統(tǒng)而言,將圖1所示的成字字根的相應(yīng)的繁體的形式,補充進來即可。原來賦音和鍵位分配的思想仍要保持下來。例如,下列幾個字根“礻 辶執(zhí)纟門 钅艸 貝鳥馬 ”就可進行這種替換或補充。
(2)可在單純的繁體漢字系統(tǒng),去掉那些根本就沒有用處的字根。例如,在繁體漢字中根本沒有“戔”這個結(jié)構(gòu)成分,應(yīng)從字根表中去掉“戔”。
(3)考慮到繁體的特點,還可補充進少數(shù)的字根。例如補充進繁體的‘長’字等。
11.‘優(yōu)碼’較現(xiàn)有技術(shù)相比所具有的有益的效果1)‘優(yōu)碼’較‘拼音法’一類和‘聲形法’一類都具有有益的效果‘拼音法’一類和‘聲形法’一類重碼都很嚴(yán)重、不能盲打、對于不認得的漢字錄入困難(而國家標(biāo)準(zhǔn)規(guī)定的6763個漢字中,一般人都有三、四千字不認得。)、因而錄入速度不能高;而‘優(yōu)碼’根本沒有重碼,能盲打,對于不認得的漢字‘優(yōu)碼’照打無誤,錄入速度極大的高于它們;2)‘優(yōu)碼’較‘五筆字型’,具有的有益的效果,列表比較說明見表6。
3)‘優(yōu)碼’較‘賦碼’有重大改進并會產(chǎn)生有益的效果如下(1)‘優(yōu)碼’對字根的分布,重又過細地研究,作了部分調(diào)整①取消的字根有 豕五戊 已言也 齒片丬 攴 爪主 竹卅 ス 豐 甫開 責(zé)少下辛 希 ②增加的字根有 欠尹衤 矢乂車 執(zhí) 豆門 圭亽黑足耂 隹俞 辟鳥內(nèi)馬;③從一鍵位調(diào)到另一鍵位的有 巳己→S,匚→Q,→P,肀、 →V,亻 刂 リ→l(2)對字根分布的部分調(diào)整所產(chǎn)生的有益的效果是①字根的總數(shù)減少了9個,減輕了用戶的記憶負擔(dān);②并為最終消滅重碼提供了主要的依據(jù);③更符合人們的習(xí)慣。如,取消了‘’,增加了‘衤’、‘礻’;④進一步降低了碼長——使單個漢字的動態(tài)平均碼長降到了2.15,使高頻字和次高頻字的碼長都小于1;考慮了詞組后,對有12343個詞組的優(yōu)碼系統(tǒng),漢字的動態(tài)平均碼長降到了1.646;優(yōu)碼系統(tǒng)有5萬余條詞組的版本,其漢字的動態(tài)平均碼長更進一步降低;⑤并因而使字根更便于記憶,尋找和錄入,也加快了錄入速度。
表6.優(yōu)化賦音形碼比較五筆字型所具有的有益的效果
(3)‘賦碼’是首先看一個漢字的首筆劃,再看漢字的末筆劃,并以此來確定一般漢字的補碼而‘優(yōu)碼’則是首先看一個漢字的最末一個字根的末筆劃,再看漢字首字根的首筆劃,并以此來確定一般漢字的補碼。這樣改進帶來的有益的效果是①最末的字根是剛剛打完的,其末筆劃記憶猶新,馬上就可確定了‘區(qū)’,而回過頭來看首字根的首筆則是很輕易而方便的,隨即定了鍵位,——加快了鍵入的速度;②便于實施專利技術(shù)時的制作——有利于‘自動編碼’;③末根末筆與首根首筆確定補碼,為達到無重碼的最高境界,作出了有益的貢獻。
(4)與‘賦碼’對比,‘優(yōu)碼’進一步將根碼的錄入方法減化到只剩一句話“余部首筆鄰鍵(建)根,碼少劃多筆順分”,省去了‘對獨體部分要能散不連、能連不交’的規(guī)則——方法更簡練、更方便錄入了。
(5)‘優(yōu)碼’去掉了‘鍵長字根’和‘鍵副字根’的規(guī)定,不但進一步減化了編碼鍵入方法,而且大大地降低了用戶的記憶負擔(dān);(6)‘優(yōu)碼’進一步發(fā)揮‘提示行技術(shù)’的功能,加補碼時,完全不用去看‘字型’,進一步減化了編碼鍵入方法,使其十分靈活。降低了用戶的記憶負擔(dān);(7)‘優(yōu)碼’將‘賦碼’的‘橫,棍,撇,捺,彎,拐’的六個區(qū),簡化成‘橫,撇,棍,捺,折’五個區(qū);并將每個區(qū)中對應(yīng)鍵盤鍵位名的鍵位排列順序,亦由‘橫,棍,撇,捺,折’調(diào)成‘橫,撇,棍,捺,折’,使錄入更加簡化;分區(qū)分位的調(diào)整也為字根的減少和無重碼作出了貢獻,下列幾個漢字的‘賦碼’編碼和‘優(yōu)碼’編碼作為例子就可說明問題(見表7)從表7可以看出,賦碼的字根分布與加補碼的方法不如優(yōu)碼——賦碼有重碼(‘仕’與‘儡’),而優(yōu)碼則沒有。
4)優(yōu)碼必將引起好多相關(guān)領(lǐng)域的重大技術(shù)變革,并將波及社會生活的某些領(lǐng)域。
表7
‘優(yōu)碼’字根按首音分布易記易鍵,不易忘,拆分規(guī)則簡煉科學(xué),完全規(guī)范無任何特例,編碼唯一,碼長小,根本無重碼,鍵入速度快——這樣的‘優(yōu)碼’是現(xiàn)今不曾見到的。近日1996年5月6日,在《光明日報》第六版,張九成的《漢字輸入不該是特殊技能》一文中竟說“漢字的特點決定了形碼的繁雜規(guī)則必不可少,所以‘不好學(xué)’是形碼不可克服的固有矛盾”。然而‘優(yōu)碼’就是形碼,它的規(guī)則并不繁雜,也不是‘不好學(xué)’,小學(xué)一二年級的學(xué)生半小時左右就可以學(xué)會?!畠?yōu)碼’必將引起好多相關(guān)領(lǐng)域的重大的技術(shù)變革,并將波及社會生活的某些領(lǐng)域。
(1)在通訊技術(shù)領(lǐng)域就是如此。
我們知道,現(xiàn)行的明碼電報,由于它要求沒有重碼,其編碼完全是靠死記的,,且要用經(jīng)過訓(xùn)練有素的電報員去做?!妶蟠a要求無重碼——而‘優(yōu)碼’就是無重碼。于是,拿‘優(yōu)碼’完全可以當(dāng)成一種‘電報碼’,(2)必將促進軟件漢化工作的大力開展(3)可能將促使?jié)h化微機的大量生產(chǎn)(4)‘優(yōu)碼系統(tǒng)’完全規(guī)范、沒有特例,碼長小,無重碼,詞組容量大,易學(xué)易錄,錄入快速,對漢字的錄入變得十分容易,使得‘漢字是普及計算機的瓶頸’問題迎刃而解。這將對我國計算機的普及起到十分積極的作用。
11.能在很多技術(shù)領(lǐng)域來實現(xiàn)本發(fā)明1)用萬能掛接的技術(shù)方法,制成‘優(yōu)化賦音形碼中文系統(tǒng)[掛接版]’2)制成獨立的中文系統(tǒng)3)能應(yīng)用于中文處理系統(tǒng)、印刷系統(tǒng)、照排系統(tǒng)、中英文打字機、中英文學(xué)習(xí)機、中英文通訊設(shè)備、電傳機、中英文終端機、電子字詞典等。
1.全文引用簡符一覽表賦碼=賦音形碼賦碼系統(tǒng)=賦音形碼漢字輸入系統(tǒng)優(yōu)碼=優(yōu)化賦音形碼優(yōu)碼系統(tǒng)=優(yōu)化賦音形碼中文系統(tǒng)五碼=五筆字型2.全文引用的著作、規(guī)范與文獻一覽表[1]=《賦音形碼漢字輸入系統(tǒng)》 專利號ZL93114933.9[2]=《優(yōu)化五筆字型編碼法及其鍵盤》申請?zhí)?5100837[3]=《印刷通用漢字字形表》[4]=《第一批異體字整理表》[5]=《簡化字總表》[6]=《關(guān)于部分計量單位名稱統(tǒng)一用字的通知》[7]=《漢字屬性字典》[8]=《辭?!穂9]=《新華字典》[10]=《康煕字典》
權(quán)利要求
1.一種優(yōu)化賦音形碼中文系統(tǒng),利用中央處理器、監(jiān)視器和用標(biāo)準(zhǔn)的英文鍵盤改進的中英文鍵盤三種設(shè)備向計算機輸入漢字,其特征在于1)將字根賦以讀音,并將標(biāo)準(zhǔn)西文鍵盤上的英文字母視為漢語拼音的符號,用‘A’表示[ZH]、用‘I’表示[CH]、用‘U’表示[SH];并用‘O’表示[W]音素、用‘V’來表示[ü]音素,其它鍵位上的英文字母直接視為漢語拼音符號,并將有[W]音素的下列字根‘我、囗、扌、、 ’置于‘O’鍵位上,將發(fā)音的前面含有[YU]的所有字根‘于 俞肀 雨予月 ’置于‘V’鍵位上,其它選定的字根分在與其首音相同的鍵位上,所有字根及字根在各鍵位上的分布如下Q七匕 匚 D大豆代刀丁旦B白巴宀勹 P番爿 丿 犬犭 千欠 F方彐 卜冫貝辟氵 W午兀丌 王 冂門幾 N丶乃廿 H一禾 火黑 未文夊攵G戈 亽工弓廣女鳥內(nèi) 合E二幾 耳卩阝圭丨亅 Y尹衤弋 讠J金钅甲戔九臼R人八癶 Z“折”巛乙又由 幺用吉 灬日曰 子孑自早足U山 彡水氺 K口 T土士步田亠X小耂 十矢石尸礻上 L力立刂 リA之廴辶止 執(zhí) 西夕習(xí)心忄 手 亻 六 疒林且爫 C艸廾 寸 隹 I廠镸乂車車彳 M目木 馬 米S巳己 四 V于 予俞肀 雨川 蟲 皿冖矛;纟 厶 三 月O我囗扌 2)把上述鍵盤劃歸成橫、撇、棍、捺、折五個鍵盤分區(qū),每區(qū)各鍵分別定義成橫、撇、棍、捺、折五個鍵盤分位名稱。鍵盤分區(qū)和定義鍵盤分位名稱如下橫區(qū)ASDFG、撇區(qū)HJKLM、棍區(qū)QWERT、撩區(qū)YUIOP、折區(qū)XCVBN,橫位GHTYN、撇位FJRUB、棍位DKEIV、捺位$LWOC、折位AMQPX,漢字的‘橫’與‘提’不分,‘提’歸為‘橫’,‘點’與‘捺’不分,‘點’歸為‘捺’,‘豎’與‘豎左鉤’不分,‘豎左鉤’歸為“豎’,且‘豎’定義讀作‘棍’;從而將將漢字的筆劃分為‘橫、撇、豎、捺、折’五種筆型;3)系統(tǒng)取用不等長編碼制,下式碼長為2、3、4,最大碼K為4,還有26個漢字有1級簡碼,漢字與其1級簡碼對應(yīng)如下漢字之的過是動到工一行就中他機為國后生人經(jīng)主上于不要在了1級簡碼a b c d e f g h i j k l m n o p q r s t u v w x y z;4)用改制的中英文鍵盤上的26個英文字母鍵和空格鍵向計算機錄入漢字的方法是余部首筆鄰鍵(建)根,碼少劃多筆順分,取漢字前三末一的字根組成的根碼輸入,當(dāng)根碼不足4,且全部錄完還沒達到目的,再錄入補碼;非字根漢字的補碼錄入方法是由末字根末筆劃尋同名的鍵盤分區(qū),在此區(qū)中敲擊與首字根的首筆劃的筆型同名的鍵盤分位;對根碼只有兩個的情形,當(dāng)打完一個補碼后,在提示行沒有出現(xiàn)所要的漢字時,要再加打一個相同的補碼;字根漢字的補碼錄入方法是依次擊入該漢字的前三個筆劃,對只有一個或兩個筆劃的字根漢字,當(dāng)所有筆劃全鍵完,所要漢字還不在提示行出來時,要再補鍵‘l’;5)在按照上述的4)所述,錄入單個漢字的方法向計算機錄入漢字時,當(dāng)打入欲錄漢字的第一位碼時,監(jiān)視器上提示行顯示該第一位代碼及其對應(yīng)的一級簡碼漢字,如該漢字即是所要錄入的漢字,接著擊一下空格鍵,該漢字上到編輯位,若該漢字不是所要,再接著打入欲錄漢字的第二、第三及第四位碼,提示行會依次顯示打入的前兩位、三位與四位代碼及其分別對應(yīng)的碼長為二、三或四的漢字,當(dāng)在此過程輸入到某個碼長時,當(dāng)時顯示的正是所要的漢字,擊一下空格鍵,該漢字上到編輯位,如果該漢字不是所要,碼長又不到4,再接著打入欲錄漢字的下一位碼;6)詞組的碼長總為4,輸入方法是(1)二字詞取每個漢字優(yōu)化賦音形碼編碼的前兩位碼敲入;(2)三字詞取第一漢字編碼的前兩位碼和第二、三漢字的第一個根碼依次敲入;(3)四字及多于四字詞,取第一、二、三及最末漢字的第一個根碼依次敲入;(4)在詞組之間或詞組與單個漢字之間允許有少量的重碼,當(dāng)出現(xiàn)重碼時,在提示行作提示,通過鍵入英文大鍵盤上的與提示行上提示的數(shù)字相同的數(shù)字鍵作出選擇;7)在ASCII狀態(tài)下,壓住‘功能鍵’ALT并同時擊一下N,可進入(或退出)‘字典功能’,進入字典功能后,可以切換到另一種漢字錄入方法,輸入所要的漢字,然后,在提示行上,便提示該漢字的優(yōu)化賦音形碼的編碼,再壓住‘功能鍵’ALT并擊一下N,便退出字典功能;
2.根據(jù)權(quán)利要求1所述的優(yōu)化賦音形碼中文系統(tǒng),為了幫助錄入者方便錄入漢字,采用如下幾個措施措施之一是在原有的標(biāo)準(zhǔn)英文鍵盤上,保持原有鍵盤鍵位不變,將每個鍵位上的所有字根或有代表性的字根和原有的英文字母,印制到鍵帽的水平表面和位于操作員眼前的斜立的表面上,并在鍵帽的面向操作者一側(cè)的斜立的表面,印制上各鍵的鍵盤分位名以及在P鍵的右側(cè)的鍵(‘[’鍵)印上“捺區(qū)”、在L鍵的右側(cè)的鍵(‘;’鍵)和M鍵右側(cè)的鍵(‘,’鍵)印上“撇區(qū)”、在Q鍵的左側(cè)的鍵(‘Tab’鍵)印上“棍區(qū)”、在A鍵的左側(cè)的鍵(‘Caps lock’鍵)印上“橫區(qū)”、在B鍵的下方的空格鍵面上,印上“折區(qū)”,并對鍵帽染色,使不同鍵盤分區(qū)所染的顏色不同,將同一鍵盤分區(qū)的鍵帽,染上相同的柔和的顏色,從而將原有的標(biāo)準(zhǔn)的英文鍵盤改制成一個中英文鍵盤;措施之二是按鍵盤上鍵位的實際位置關(guān)系,將字根按讀音相同的緊靠在一起,將字根總表繪制成一張矩形窄條的,可方便地貼在錄入者眼前某個位置上的賦音形碼字根鍵位圖表,其式樣是 措施之三是根據(jù)權(quán)利要求1所述的優(yōu)化賦音形碼中文系統(tǒng),將標(biāo)準(zhǔn)西文鍵盤上的英文字母視為漢語拼音的符號,字根賦以讀音,并將字根分在與其首音相同的鍵位上。
全文摘要
本發(fā)明屬計算機漢字輸入技術(shù)領(lǐng)域,是一輸入漢字的中文系統(tǒng)。字根定義讀音并按首音分布在視為漢語拼音符號的鍵盤上,易記易鍵;字根碼錄入規(guī)則是“余部首筆鄰鍵(建)根,碼少劃多筆順分”,不等長碼制,最長碼長4;每鍵一碼都有編碼及對應(yīng)一漢字提示,根碼鍵完漢字不出時再擊補碼,字根漢字的補碼是其前3筆劃,非字根漢字的補碼是由末字根的末筆和首字根首筆交叉確定,有編碼唯一性,平均碼長2.16,無特例、無重碼;并有豐富詞組錄入和字典功能。
文檔編號G06F3/023GK1146574SQ9610649
公開日1997年4月2日 申請日期1996年8月19日 優(yōu)先權(quán)日1996年8月19日
發(fā)明者趙樹森 申請人:趙樹森