專(zhuān)利名稱(chēng):漢字形音編碼法的制作方法
本發(fā)明是一種較為簡(jiǎn)便的易于接受的形碼為主碼,音碼為輔的漢字形音編碼方法。
由七十年代末至今,國(guó)內(nèi)外眾多的漢字編碼專(zhuān)家,已從數(shù)以萬(wàn)計(jì)的浩瀚的漢字海洋中,探索出了公布于眾的400多種漢字編碼法及在計(jì)算機(jī)領(lǐng)域中實(shí)現(xiàn)漢字輸入的40多種各有所長(zhǎng)的漢字輸入法。如CN85100837-“優(yōu)化五筆字型編碼法及其鍵盤(pán)”;CN85102777-“漢字字形輸入法”等。這些是目前比較具有代表性的二種字形編碼法。它以字根、字元為碼源,但字根,字元的各自人為定義的諸多規(guī)則與人們公認(rèn)且已習(xí)慣接受的漢字基本筆劃規(guī)則、構(gòu)字規(guī)則是截然不同的,所需重新記憶的因素太多,加之重碼率也較高,故使初學(xué)者或非專(zhuān)職操作人員,往往感到難于靈活掌握。
本發(fā)明是從人們已習(xí)慣的或公認(rèn)的漢字基本筆劃定義出發(fā),提出一種易于接受且簡(jiǎn)便的,降低重碼率的漢字形音編碼法。
本發(fā)明的要點(diǎn)是,長(zhǎng)期以來(lái),人們已自然習(xí)慣、公認(rèn)的漢字基本筆劃為點(diǎn)、橫、豎、撇、捺、折六類(lèi),按此,首先將其個(gè)別類(lèi)調(diào)整,并分別予以代碼,同時(shí),取漢字的單首筆劃,筆劃總數(shù)、單末筆劃組合形成三位編碼體系,輔助以音碼。
調(diào)整撇、捺二類(lèi)為斜類(lèi),依照所定義的點(diǎn)、橫、豎、斜、折五類(lèi)基本筆劃,依次用阿拉伯?dāng)?shù)字1、2、3、4、5命以代碼。(圖1筆劃順序襲用人們公認(rèn)的標(biāo)準(zhǔn)書(shū)寫(xiě)順序,即先橫后豎,先撇后捺,先上后下,從左到右,從外到里,先里頭后封口,先中間后兩邊分別取漢字單筆劃,總筆劃數(shù)、單末筆劃為三位數(shù)進(jìn)行編碼。單首筆劃與單末筆劃均用上述同一定義,分別取碼。所取單首筆劃的數(shù)碼作為三位編碼體系中的第一位數(shù)碼,其數(shù)值變化量受上述五類(lèi)筆劃定義編碼體系中的第二位數(shù)碼,例如,“慧”的總筆劃數(shù)為15,依上規(guī)則,取個(gè)位數(shù)“5”作為數(shù)碼;所取單末筆劃的數(shù)碼作為三位編碼體系中的第三位數(shù)碼,同樣,所取數(shù)值也將受到五類(lèi)基本筆劃定義的限定,但因?qū)μ囟ǖ牟糠譂h字的末碼還加上了一個(gè)數(shù)字為“5”的特定均衡系數(shù),所謂之特定的部分漢字是指筆劃總數(shù)超過(guò)10筆劃以上的漢字(包括10筆劃在內(nèi)的10筆劃以下的漢字均不予加之),故此類(lèi)漢字的末筆劃數(shù)碼值必然在0-9的10個(gè)數(shù)字間變化。
以三位編碼體系作為主碼,而以音碼作為輔助碼,主碼定在標(biāo)準(zhǔn)鍵盤(pán)的數(shù)字鍵上,而音碼定位在標(biāo)準(zhǔn)鍵盤(pán)上的英文字母鍵上,所稱(chēng)之的音碼是用該漢字的拼音中首字母作為提示區(qū)別鍵碼。
圖1,漢字五類(lèi)基本筆劃的名稱(chēng),相對(duì)應(yīng)的代碼,筆劃形類(lèi)。
圖2,本發(fā)明33鍵輸入法鍵位圖。
參照?qǐng)D1,對(duì)本發(fā)明的編碼規(guī)則做如下示例示例1+=>“223”,單首筆劃為“一”,代碼為“2”;總筆劃數(shù)為2,代碼為“2”;單末筆劃為“丨”,代碼為“3”。依次取碼組合成該漢字的三位數(shù)編碼為“223”。
示例2歡=>“564”,單首筆劃為“
”,代碼為“5”;總筆劃數(shù)為6,代碼為“6”;單末筆劃為“乀”,代碼為“4”。得碼為“564”。
示例3慧=>“256”單首筆劃為“一”,代碼為“2”;總筆劃數(shù)為15,根據(jù)本發(fā)明規(guī)則僅取個(gè)位數(shù)為代碼,而得代碼“5”;單末筆劃“丶”,代碼為“1”,但因該字屬筆劃數(shù)10筆劃以上的區(qū)域字,所以,還需將此碼加上個(gè)均衡系數(shù)“5”,結(jié)果,末代碼為1+5=“6”。得編碼“256”。
示例4懿=>“226”取碼法同上。
示例5鱓=>“438”繁體字同法取碼。
示例6馬=>“201”取碼法同上。
現(xiàn)就王維的《渭城曲》做形音碼編碼示范“渭城朝雨邑輕塵,客舍青青柳色新。
勸君更盡一杯酒,西出陽(yáng)關(guān)無(wú)故人。”示范表
示范驗(yàn)證結(jié)果以上共輸入“27”個(gè)漢字。盲打字?jǐn)?shù)達(dá)19個(gè),占總數(shù)的70.37%;同碼最高4個(gè)字的重碼占11.1%;同碼3個(gè)字的重碼占7.4%;同碼2個(gè)字的重碼占11.1%。因本法出現(xiàn)的重碼僅占小部分,且最高重顯4個(gè)字,用當(dāng)前顯示10個(gè)字的容量是富富有余的,因而輸入快捷。
本發(fā)明與現(xiàn)有編碼法相比,乃是一種新穎的形音碼法,由于本編碼規(guī)則是根據(jù)歷來(lái)人們已自然習(xí)慣且公認(rèn)的漢字最基本的筆劃定義,故,易于接受掌握,編碼規(guī)則簡(jiǎn)捷,方便。對(duì)國(guó)家(二級(jí)字庫(kù))標(biāo)準(zhǔn)信息交換用漢字編碼字符集基本集(GB2312-80)中的6763個(gè)漢字,完全可以使用本法進(jìn)行處理,并且可以一碼一次性當(dāng)前提示行顯示有余,其70.37%的漢字實(shí)現(xiàn)盲打。對(duì)10筆劃以上的漢字末筆劃代碼附加特定的均衡系數(shù)“5”及引入拼音中首字母,以英文鍵代之輸入做當(dāng)前提示行區(qū)分輔助鍵碼,故重碼率降低至了相當(dāng)?shù)偷某潭?。使得?dāng)前顯示行(10個(gè)字)的容量富富有余,提高了輸入速度。
本發(fā)明用于計(jì)算機(jī)領(lǐng)域可用標(biāo)準(zhǔn)西文鍵盤(pán)作為輸入工具。如表2-本發(fā)明33鍵輸入法鍵位圖。如用于IBM-PC/XT/AT等微機(jī)上,配一個(gè)中文操作系統(tǒng)支持即可實(shí)現(xiàn)。
此編碼法是建立在合乎羅輯的基礎(chǔ)上,根據(jù)淺顯的漢字結(jié)構(gòu)的簡(jiǎn)便統(tǒng)一的認(rèn)識(shí),避免了以字根、字元、象形等各異規(guī)則取碼法而造成的因人為的理解能力的差異而對(duì)字形結(jié)構(gòu)復(fù)雜的漢字切分而各持己見(jiàn)造成的取碼誤差。
權(quán)利要求
1.一種漢字形音編碼法,其特征在于按人們已習(xí)慣的公認(rèn)的漢字基本筆劃調(diào)整定義。分別予以代碼,用漢字的單首筆劃、筆劃總數(shù)、單末筆劃組合形成三位編碼體系,并輔以音碼。
2.根據(jù)權(quán)利要求
1所述的編碼法,其特征在于把漢字基本筆劃撇、捺類(lèi)并為斜類(lèi),按所定義的點(diǎn)、橫、豎、斜、折五類(lèi),依次命以代號(hào)1、2、3、4、5。
3.根據(jù)權(quán)利要求
1和2所述的編碼法,其特征在于三位編碼體系是依照書(shū)寫(xiě)順序,以首、末筆劃按同一定義,分別代碼,作為首、末位數(shù)碼,以筆劃總數(shù)值的個(gè)位數(shù)作為中間位數(shù)碼。
4.根據(jù)權(quán)利要求
3所述的編碼法,其特征在于對(duì)特定的部分漢字的末碼加上一個(gè)數(shù)字“5”的特定均衡系數(shù)。
5.根據(jù)權(quán)利要求
1所述的編碼法,其特征在于把漢語(yǔ)拼音頭一個(gè)字母作為提示區(qū)別鍵碼,定義在標(biāo)準(zhǔn)鍵盤(pán)的英文字母鍵上。
6.根據(jù)權(quán)利要求
1和3所述的編碼法,其特征在于三位編碼體系作為主碼,定位在標(biāo)準(zhǔn)鍵盤(pán)上的一組數(shù)字鍵上。
專(zhuān)利摘要
本發(fā)明是一種新穎的形音漢字編碼方法。發(fā)明以人們長(zhǎng)期以來(lái)自然習(xí)慣、公認(rèn)的標(biāo)準(zhǔn)識(shí)字規(guī)則,按漢字字型的特點(diǎn)及五類(lèi)最基本的筆劃、筆劃數(shù)、漢語(yǔ)拼音相關(guān)的原理,用1至5的阿拉伯?dāng)?shù)字及拼音字母首字母碼對(duì)漢字依形簡(jiǎn)便的進(jìn)行編碼。因此編碼規(guī)則簡(jiǎn)捷,邏輯性強(qiáng),重碼率低。適用于非專(zhuān)職輸入人員,便于普及推廣。該法對(duì)簡(jiǎn)體字和繁體字均適用,在漢字電腦處理系統(tǒng)中及徒手檢索漢字的領(lǐng)域均可廣泛的應(yīng)用。
文檔編號(hào)G06F3/023GK87105289SQ87105289
公開(kāi)日1988年5月18日 申請(qǐng)日期1987年7月31日
發(fā)明者奚宇 申請(qǐng)人:奚宇導(dǎo)出引文BiBTeX, EndNote, RefMan