專利名稱::優(yōu)先用于手機(jī)的英文字母及漢字的數(shù)字編碼的制作方法優(yōu)先用于手機(jī)的英文字母及漢字的數(shù)字編碼所屬發(fā)明領(lǐng)域本發(fā)明涉及一種優(yōu)先用于手機(jī)的中、英文字輸入的方法一個(gè)能夠抵消用手機(jī)鍵盤輸入中英文的先天性劣勢(shì)的英文字母的數(shù)字編碼。一組髙效易學(xué)的手機(jī)及電腦兼用的漢字的音碼、形碼及音形碼。
背景技術(shù):
:目前公認(rèn)的以T9為代表的文字輸入法將十個(gè)數(shù)字轉(zhuǎn)換成26個(gè)英文字母,是一種粥少僧多的轉(zhuǎn)換方法,而不是真正意義上的英文字母數(shù)字編碼。在此基礎(chǔ)上的漢字音碼輸入,自然笨拙不堪。即使具有以3G為后盾的智能化支持,而使煩惱有所減少,但問(wèn)題未見(jiàn)根本性的解決。因此也沒(méi)有很好克服用手機(jī)鍵盤輸入中英文的明顯劣勢(shì)。例如,在英文輸入中,對(duì)于較長(zhǎng)的單詞,對(duì)于一些半年內(nèi)新流行的英文字母縮寫詞,特別是用到大寫字母時(shí),是麻煩,也常有無(wú)奈。如今,隨著P鵬hMaa等手機(jī)業(yè)務(wù)的逐步普及力手機(jī)文字輸入的要求也愈來(lái)愈高,市場(chǎng)上越來(lái)越需要新的、具有創(chuàng)新性的解決方案。不少帶有qwert鍵盤的手機(jī)已經(jīng)問(wèn)世,就是在這樣的背景下產(chǎn)生的。但是,qwert鍵盤的引進(jìn),與手機(jī)的概念,存在著不小的矛盾。另外,在手機(jī)數(shù)字鍵盤上,對(duì)漢字進(jìn)行數(shù)字編碼,離不開(kāi)對(duì)音碼、形碼或音形碼的選取。而現(xiàn)有的音形碼有著各自的瓶頸問(wèn)題,隨著本碼對(duì)這些瓶頸問(wèn)題的克服,將是qwert鍵盤的制勝對(duì)手。由于它的高效易學(xué),果然是為手機(jī)采用的首選,也將為電腦的漢字輸入的盲打,甚至于單手盲打做出貢獻(xiàn)。本發(fā)明解決其技術(shù)問(wèn)題所采用的三個(gè)技術(shù)方案是英文字母的數(shù)字編碼、極三、極五漢字音、數(shù)碼及S+1形碼三個(gè)編碼方案。另有拼音碼在QWERT鍵盤上增加聲調(diào)而不增碼長(zhǎng)的附加方法,5+l形碼在QWERT鍵盤上實(shí)現(xiàn)時(shí),第二形碼的分步完成的附加方法。一,兩組英文字母的數(shù)字編碼方案。分別供專門輸送英文及兼有輸送中英文之用。見(jiàn)下表。1一1,ttil用于英文的字符的數(shù)字編碼方案的表<table>tableseeoriginaldocumentpage3</column></row><table><table>tableseeoriginaldocumentpage4</column></row><table>數(shù)字每個(gè)數(shù)字前添恥,例如062表2本方案在手機(jī)英文輸入中的有益效果是,以不超過(guò)兩個(gè)數(shù)字對(duì)字母及常用符號(hào)進(jìn)行唯一性編碼,換得了一學(xué)就會(huì)的單手盲打。其便捷程度抵消了用手機(jī)鍵盤輸入英文文本的先天性劣勢(shì)。并以超過(guò)qwert鍵盤的流暢性來(lái)與其抗衡。2.1極三碼的組成。本碼取碼的極大個(gè)數(shù)為三個(gè)。聲母碼一個(gè),韻母碼最多兩個(gè)?,F(xiàn)有的拼音輸入法各存在著不同的問(wèn)題。全拼輸入因其強(qiáng)大的智能化組詞功能,(例如兩鍵三鍵成兩字詞,多宇詞的輸入),克服了重碼太多的劣勢(shì),在易學(xué)的北方地區(qū)得到了較好的推廣。但是,其韻母字母數(shù)最多可達(dá)4個(gè),一個(gè)漢字的字母輸入數(shù)最多可達(dá)6個(gè),畢竟影響了輸入速度,同時(shí)也為其轉(zhuǎn)換成數(shù)字的漢字編碼增加了困難。有一種雙拼法用一個(gè)字母為韻母編碼,正在淡出使用。究其原因,記憶有一定難度是一個(gè)因素。另一個(gè)因素是,由于它缺乏區(qū)分聲母、韻母的功能,上述強(qiáng)大的智能化組詞功能如用在雙拼法中,將會(huì)重碼太多,因而不可能做大。有鑒于此,提出拼音漢字的編碼及其數(shù)字編碼方法。2丄1巻舌聲母的簡(jiǎn)化對(duì)雙字母聲母zh、ch、sh,有兩種簡(jiǎn)化辦法。一種是簡(jiǎn)化為i、o置于、u;—種是簡(jiǎn)化為z、c、s,而用大寫Z、C、S相應(yīng)的替換非巻舌聲母(或者反過(guò)來(lái)用)。2丄2韻母的簡(jiǎn)化我們把復(fù)合韻母分成前、尾兩部。尾部有7種情況a、e、i、o、u、n、ng,ng取碼為v。去了尾部就成前部。對(duì)前部的取碼也很簡(jiǎn)單。ia取碼為e,ua取碼為o。其它為兩種省略-n表en,v表eng:—種兼用ev既表iang,也表uang;一種個(gè)案eu表示韻母迂。2.丄3拼音碼在QW1RT鍵盤上增加聲調(diào)而不增碼長(zhǎng)的方法。不加聲調(diào)的拼音是不完整的。當(dāng)前大部分的全拼拼音輸入碼卻沒(méi)有聲調(diào)。究其原因,是受到增加碼長(zhǎng)的壓力。這里提供一個(gè)增加聲調(diào)而不增碼長(zhǎng)的方法。以極三碼為例,其第二碼有aevniou7個(gè)字母。它們所在位置的列有4個(gè)字符,分屬于四行。屬于Q療的是第一聲,數(shù)字行的是第二聲,A行的是第三聲,Z行的是第四聲。例如省字是第三聲,取v所在的列,在A行上的字母f為碼。即省字的碼是sf。2..2極五碼(數(shù)字)的組成本碼取碼的極大個(gè)數(shù)為五個(gè)。將上述的對(duì)拼音字母的數(shù)字編碼,用于極三碼,并將依次代表四聲的聲調(diào)碼O、1、2、9作為可選擇的尾鍵,就成了極五碼。另外,對(duì)于單韻母字如俄阿噢等,在輸入時(shí)前面要加o。本方案中的漢字音碼的有益效果是,1,對(duì)韻母的前部、尾部分解方法,是符合發(fā)聲規(guī)律的方法,自然地縮短碼長(zhǎng),其可讀性可與全拼碼等同,能對(duì)當(dāng)前的全iMft秀輸入法,起到更優(yōu)化的作用。也有利于南方人在使用中學(xué)習(xí)推廣漢字拼音。2,增加聲調(diào)而不增碼長(zhǎng)的方法,大大提高輸入效率,本方案在用數(shù)字輸入漢字的有益效果,體現(xiàn)在手機(jī)上做到了使用流暢。由于其完全的可讀性,在適當(dāng)?shù)嘏湟钥崭穸禾?hào)等間隔符后,有著巨大的手機(jī)拼音通訊開(kāi)發(fā)前景。三,5+l數(shù)字形碼評(píng)定漢字編碼優(yōu)劣有三個(gè)標(biāo)準(zhǔn),易學(xué)、易用和重碼少。其中有三大瓶頸問(wèn)題。第一,為了使重碼減少,選入碼中的部件數(shù)應(yīng)該多取。但是部件數(shù)多取了,就出現(xiàn)了不易學(xué)不易記的問(wèn)題。第二,為了使重碼減少,定出一些易學(xué)但不易用的、或者易用但不易記的取碼規(guī)則。第三是漢字的拆分問(wèn)題。由于不少漢字的筆畫(huà),處于犬牙交錯(cuò)的狀態(tài),根本無(wú)法提出一個(gè)規(guī)則。例如,果、串、申、吏、耕這五字的拆分,就會(huì)難倒眾多的碼家軍師。本碼在易學(xué)易用的前提及計(jì)算機(jī)軟件的支持下,經(jīng)反復(fù)篩選,在保留傳統(tǒng)筆形入碼的同時(shí),對(duì)所有相交、相接及錢筆形定義為粘連筆形,并采用了新創(chuàng)的宏觀分^^對(duì)其編定數(shù)碼;還將易學(xué)的漢字中fi^性指標(biāo),橫筆艦字型雜引入碼中??梢哉f(shuō)SH大瓶頸問(wèn)題得到了克服。本碼在一級(jí)國(guó)標(biāo)漢字(375S個(gè))中重碼只有l(wèi)22個(gè)。重碼率為3.12%。。而且三字重碼只有三組。(一、二級(jí)國(guó)標(biāo)漢字6763個(gè)的重碼率為7.0%)在繁體中重碼字為l40個(gè),加以本碼取碼基本上是首尾格局,而繁體字的繁復(fù)難取部分大多位于內(nèi)部,取碼時(shí)較少涉及,取碼的流暢性不在簡(jiǎn)體字之下。所以本碼是簡(jiǎn)繁通用。3.05+1形碼部件及其編碼漢字由五類單筆劃組成。這些單筆劃還組成了各種筆形。那些被賦予了碼的筆形稱之為部件。首先對(duì)十?dāng)?shù)碼部件表進(jìn)行說(shuō)明。3.01本碼取10個(gè)數(shù)字進(jìn)行編碼.。表中漢字聯(lián)想一欄,對(duì)漢字?jǐn)?shù)字賦予了相應(yīng)的數(shù)字碼。本欄的聯(lián)想數(shù)字所含筆形有著幫助記憶的作用。例如,立字去橫是六的聯(lián)想,其碼也為六等等o3.02單筆畫(huà)一欄,是五種筆劃中橫豎撇點(diǎn)折(彎)的編碼,但把逆時(shí)針折拿出來(lái)另定碼為73.3復(fù)筆畫(huà)粘連形之角框形一欄,定義了一類部件,是由兩筆畫(huà)、多筆畫(huà)的端相接而構(gòu)成的筆形。其碼以首筆劃的碼為準(zhǔn)。也可以說(shuō)這是"碼"首是瞻法。其各種筆形列于其所屬碼的行中。3.04復(fù)筆畫(huà)粘連形之簡(jiǎn)單交形一欄,將交形分成三類,斜交、帶折交和十形交。九字本應(yīng)屬于帶折交類,因?yàn)閿?shù)字聯(lián)想已取碼為9,只能與十形交同處。3.0S復(fù)筆畫(huà)離散形一欄,對(duì)小字形、三點(diǎn)水、立刀及點(diǎn)下橫、雙折、八字形、點(diǎn)下折六種離散筆形各賦予碼3、4、6、7、8、0。各類離散筆形還有其本身的近似聯(lián)想筆形列于表中。在表中的約90個(gè)部件,除小字形的碼是3,斜交形的碼是6、雙逆折形的碼是7,需要略作記憶外,其它均有聯(lián)想可依。例如在碼6這一行中,由漢字六聯(lián)想到立,由此可以聯(lián)想到立刀的碼是6。即使是點(diǎn)下折的碼是O,也可以從零字中含有它而得到聯(lián)想,而點(diǎn)下角是點(diǎn)下折的聯(lián)想。在介紹完表一中的部件以后,還要介紹至關(guān)重要的一類部件。3.06衍生筆形,由角框形及簡(jiǎn)單交形交重而成??煞殖啥嘟恍?、交角框形、角框交形三類。帶交帶角框且首碼成交的稱為交角框形,帶交帶角框且首碼成角框的稱為角框交形。、這類筆形的碼以首筆劃的碼為準(zhǔn),下面將其各種筆形列于其所屬的數(shù)碼下。2巾中由甲申史曲,里字的首碼,更字的尾碼,離、禹等字中含。3叟字首碼。5子。6丈井升吏,舂夫丹在等字的首碼,匆孝姊等字的尾碼。7女尹車弗毋,母戈貫東等字的首碼,毛字的尾碼,淺字中含。9凈豐韋丸世,甫曹青等字的首碼,肺年等字的尾碼,我舞垂重等字的第二碼。以上所列51個(gè)幾乎已經(jīng)窮盡了所有的衍生筆形.,無(wú)論筆畫(huà)如何的犬牙交錯(cuò),也只是一個(gè)部件。交接筆形不拆分,這就為漢字拆分掃清了一大障礙。況兼毫無(wú)記憶其碼為何之苦,唯'碼,首是瞻可也。3.0.7漢字的橫挑筆數(shù)特征碼,簡(jiǎn)稱橫+1碼。取字的橫筆、挑筆數(shù)為碼。若是左右形的字,則加1。取該碼時(shí)得數(shù)若超過(guò)8,取碼為8。橫+1碼為0時(shí)改取8。由于橫筆數(shù)為7、8的字,在一級(jí)碼中約占10%,所以記憶負(fù)擔(dān)不大。表一十?dāng)?shù)碼部件表<table>tableseeoriginaldocumentpage6</column></row><table>本方案在用數(shù)字輸入漢字的有益效果是,由于形碼的易學(xué)易用重碼又少,在有利于組詞功能的強(qiáng)大性的同時(shí),不需要專門的學(xué)習(xí),越打越熟,極大地滿足了單手盲打的需求。3.l定長(zhǎng)6碼的編碼方法。首先,第六碼是固定的橫數(shù)碼。所以正好5碼的字,不必說(shuō)編碼方法了。3.11超過(guò)S碼的字。選定S碼的規(guī)則,分為兩種情況。先將字分成兩大類型。1,左右型;2,非左右型,凡不屬于l類就是非左右型的。A,非左右型字的取碼規(guī)則很簡(jiǎn)單,首三末二即可。即對(duì)一個(gè)字從頭按筆顢連取三碼后,最后兩碼來(lái)自最后兩部件。B,左右型字的取碼規(guī)則。首先要提出部件單元的概念。不超過(guò)7筆畫(huà)的部首及不超過(guò)5筆畫(huà)的字,稱為部件單元。右部若僅由一個(gè)部件單元構(gòu)成,稱為簡(jiǎn)單右部;否則稱為復(fù)雜部件。左右型字的取碼規(guī)則分兩種取碼情況1,簡(jiǎn)單右部情況,左部連取三碼,右部取其首尾兩碼。簡(jiǎn)稱為左三右首尾。2,復(fù)雜右部情況,左部取二碼,右部取首M三部件為碼。簡(jiǎn)稱為左二右三。3.12四碼字,下面提出補(bǔ)成五碼的規(guī)則。第五碼的補(bǔ)碼稱為過(guò)濾筆畫(huà)數(shù)碼,簡(jiǎn)稱筆數(shù)碼。取字的筆畫(huà)數(shù)為碼;當(dāng)字的筆畫(huà)數(shù)大于9,把位于前列的筆畫(huà)'過(guò)濾'掉,找出該字所含的一個(gè)留有末部件的筆形。這個(gè)筆形可以是字,可以是部首,也可以是末部件本身,但是筆畫(huà)數(shù)仍不能大于9。用其中的最大的筆畫(huà)數(shù)為碼。另外筆畫(huà)數(shù)等于8時(shí),取0為碼。一般提到字的筆畫(huà)數(shù)就頭痛,因?yàn)樗讓W(xué)但不易記。但在本編碼的一級(jí)GB字符集中,第五碼需要補(bǔ)碼的只有1506個(gè)左右,而其中約l柳個(gè)字的筆畫(huà)數(shù)不超過(guò)7,約2柳個(gè)字的筆畫(huà)數(shù)是8,是易記的。而筆畫(huà)太多的字約l抑個(gè),經(jīng)<過(guò)濾'后也好記??傆洃涁?fù)擔(dān)不大。3.13三碼字,第五碼的補(bǔ)碼同上.下面提出補(bǔ)第四碼的方法。第四碼的補(bǔ)碼稱為字型碼。先將字分成左右型及非左右型。字型碼的真體規(guī)定如表二。對(duì)于1碼的字,取字的末筆劃為第二碼,第三碼一律取0。例如九950世970。無(wú)第二筆劃的,重復(fù)第一筆劃取碼,例如乙5鄰。對(duì)于兩碼的字,可取末筆劃為第三碼。例如牛392。再按照上述第四第五碼的補(bǔ)碼取法,就完成了該字的編碼。表二字型碼表<table>tableseeoriginaldocumentpage7</column></row><table>3.2本碼在QWERT鍵盤上的實(shí)現(xiàn)~"三鍵半碼鍵盤的行列命名。鍵盤由四行、十列組成,行分別命名為z行、a行、q行及數(shù)字行,列分別命名為l列、2列、"*0列。用行列組合法將原來(lái)每字6碼分成三對(duì)組合,即第一、二碼,第三、四碼及第五、六碼三對(duì)。第一、三、五碼取的數(shù)對(duì)應(yīng)著鍵盤上1至9、0十個(gè)列,另外的碼對(duì)應(yīng)著三個(gè)或四個(gè)行,這樣,一對(duì)碼對(duì)應(yīng)著一個(gè)鍵,就可壓縮成三鍵。具體對(duì)每對(duì)取碼方法說(shuō)明如下。第一、二碼對(duì),這里的行列化方法有一個(gè)新穎特征是對(duì)第二個(gè)形碼作分步處理。第一步,第一形碼對(duì)應(yīng)著1至9、0十個(gè)列,當(dāng)?shù)诙未a取數(shù)為1、2、i時(shí),它對(duì)應(yīng)著的是z、a、q列。其中x表示2以上的數(shù)及0。第二步將第二形碼作為可選的第四鍵。這可選的第四鍵可簡(jiǎn)稱為半鍵,三鍵半碼由此得名。第三、四碼對(duì),還是第三形碼對(duì)應(yīng)著1至0十個(gè)列,當(dāng)?shù)谒男未a取數(shù)為l、2、3、4(含9)時(shí),它對(duì)應(yīng)著的是z、a、q列及數(shù)字列;取數(shù)為S、6、7、8(含0)時(shí),它對(duì)應(yīng)著的是Z、A、Q列及數(shù)字列(按Sh敏〉。第五、六碼對(duì),第三形碼對(duì)應(yīng)著1至0十個(gè)列,當(dāng)?shù)诹未a取數(shù)為l、2、3、4時(shí),它對(duì)應(yīng)著的是z、a、q列及數(shù)字列;取數(shù)為S、6、7、8時(shí),它對(duì)應(yīng)著的是Z、A、Q列及數(shù)字列(按SWft)。四,系列漢字?jǐn)?shù)字音形碼。拼音輸入法的強(qiáng)大的智能化功能實(shí)際并未解決重碼問(wèn)題。音形碼是解決重碼問(wèn)題而又不影響音碼強(qiáng)大智能化功能的理想選擇。當(dāng)前音形碼大多還沒(méi)有專門面向手機(jī),在前面音、形碼的基礎(chǔ)上,這里提供的系列漢字?jǐn)?shù)字音形碼,有許多的搭配方式,其碼數(shù)最多為六。(括號(hào)內(nèi)為可選擇碼,沒(méi)有計(jì)入碼數(shù)。)每行后面列出的是其在G'B2312—級(jí)字符集的重碼數(shù)。3.1Y3+X1H,重碼數(shù)9963.2Y4+X1(H),(重碼數(shù)350)3.3Y3+X12(H),重碼數(shù)l155(322)3.4Y2+X12H,重碼數(shù)5153.5Y2+X12H(W),重碼數(shù)l053.6Y1+X12WH,重碼數(shù)313首數(shù)字表示音碼的個(gè)數(shù)。3是全取,4是全取加聲調(diào),2是取聲母及韻母的尾碼,l是取聲母。X之后的數(shù)字,表示取形碼的哪個(gè)碼,1、2表示取其第一第二碼,H表示取橫數(shù)碼,W表示取尾碼。本方案在用數(shù)字輸入漢字的有益效果是,在手機(jī)上基本上做到單手盲打。權(quán)利要求1,一種主要用于手機(jī)的數(shù)字編碼,包括對(duì)英文字母及漢字的數(shù)字編碼。前者與目前T9在手機(jī)數(shù)字鍵盤上,將十個(gè)數(shù)字轉(zhuǎn)換成26個(gè)英文字母不同的是,本發(fā)明的技術(shù)特征是兩位數(shù)字對(duì)英文字母的唯一性編碼。2,—種漢字音碼,其技術(shù)特征是將韻母分為首尾兩部取碼,從而自然地縮短碼長(zhǎng),其可讀性可與全拼碼等同。一種基于權(quán)利要求2的增加聲調(diào)而不增碼長(zhǎng)的方法。,征是取,字韻#^鍵盤上同列的4個(gè)字符分別g該字的四聲。3,—種基于權(quán)利要求1及權(quán)利要求2的漢字?jǐn)?shù)字音碼。其特ffiji最大,為S,且聲調(diào)碼可選擇。4,一種漢m字6鍵形碼。其,選取特征是,在保留傳統(tǒng)筆形的同時(shí),對(duì)所有相交、相接及交重筆形定義為粘連筆形加以弓戰(zhàn);對(duì)此細(xì)了易記的分筋法編定數(shù)碼。并且將易學(xué)的漢字的《#性指標(biāo),橫筆數(shù)特征引入碼中。一種基于權(quán)利要求4的將漢字?jǐn)?shù)字形碼轉(zhuǎn)變?yōu)樵赒WERT鍵盤上實(shí)現(xiàn)的行列化方法。其所含的一個(gè)新穎特征是對(duì)第二個(gè)形碼作分步處理。第一步第一形碼就對(duì)應(yīng)著1至9、0十個(gè)列,當(dāng)?shù)诙未a取數(shù)為1、2、X時(shí),它對(duì)應(yīng)著的是z、a、q行。其中x表示2以上的數(shù)及0。第二步將第二形碼作為可選的第四鍵。5.一種基于權(quán)利要求2、權(quán)利要求3及權(quán)利要求4的漢字音,MC字音形碼。全文摘要本發(fā)明涉及一種優(yōu)先用于手機(jī)的中、英文字輸入的方法。一個(gè)能夠抵消用手機(jī)鍵盤輸入中英文的先天性劣勢(shì)的中、英文字編碼。諸如一種輸入英文字母等的數(shù)字編碼;一種完全符合韻部發(fā)音規(guī)律的最大碼長(zhǎng)為三的漢字音碼;一種有可選擇的聲調(diào)碼的最大碼長(zhǎng)為五的數(shù)字音碼;一種簡(jiǎn)繁通用的數(shù)字形碼,篩選了約140個(gè)筆形成為部件,對(duì)所有交重筆形定義為粘連筆形,用易記性的分類方法對(duì)其編碼。在GB2312一級(jí)漢字中重碼數(shù)是120個(gè)。(繁體為150個(gè))另有拼音碼在QWERT鍵盤上增加聲調(diào)而不增碼長(zhǎng)的及數(shù)字形碼轉(zhuǎn)換成QWERT鍵盤上的三鍵半碼的附加方法。文檔編號(hào)H04M1/23GK101122823SQ20071005567公開(kāi)日2008年2月13日申請(qǐng)日期2007年5月23日優(yōu)先權(quán)日2007年5月23日發(fā)明者胡錫全申請(qǐng)人:胡錫全