專利名稱:移動(dòng)通信中英文數(shù)字化輸入集成系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于微電子設(shè)備信息處理的中、英文數(shù)字化編碼技術(shù),特別是使用數(shù)字鍵盤將漢字、英文字母、標(biāo)點(diǎn)符號(hào)以編碼方式輸入到某種電子設(shè)備進(jìn)行中、英文信息處理和通訊的漢字?jǐn)?shù)字化編碼輸入方法。
移動(dòng)通信和計(jì)算機(jī)技術(shù)的迅速發(fā)展,具有漢字信息處理功能的數(shù)字鍵盤產(chǎn)品以及可用數(shù)字鍵盤操作控制的電子設(shè)備不斷涌現(xiàn)。其中體積小、重量輕、攜帶方便的數(shù)字鍵盤起著不可替代的作用,然而,現(xiàn)有的漢字?jǐn)?shù)字輸入技術(shù)遠(yuǎn)不能適應(yīng)移動(dòng)通信中要求快節(jié)驟發(fā)送短信息的需求。因而,無論是移動(dòng)通信領(lǐng)域或軍事指揮、偵察、控制等軍用設(shè)備,還是電視、因特網(wǎng)、機(jī)頂盒等遙控器乃至使用數(shù)字鍵盤的學(xué)習(xí)設(shè)備、信息點(diǎn)播設(shè)備、信息家電、數(shù)據(jù)存儲(chǔ)設(shè)備等都亟待開發(fā)既方便、又容易掌握的漢字?jǐn)?shù)字化輸入技術(shù)。為促進(jìn)中文信息技術(shù)和民族軟件產(chǎn)業(yè)的發(fā)展,信息產(chǎn)業(yè)部和國(guó)家質(zhì)量技術(shù)監(jiān)督局于2000年3月聯(lián)合發(fā)布了兩項(xiàng)中文信息技術(shù)標(biāo)準(zhǔn),其中《信息技術(shù)和信息交換用漢字編碼字符集、基本集的擴(kuò)充》為國(guó)家強(qiáng)制性標(biāo)準(zhǔn),《信息技術(shù)和數(shù)字鍵盤漢字輸入通用要求》為國(guó)家推薦性標(biāo)準(zhǔn)。新標(biāo)準(zhǔn)的頒布對(duì)信息技術(shù)在微電子通訊領(lǐng)域健康、正常、有序地發(fā)展,對(duì)中文數(shù)字輸入技術(shù)走向規(guī)范化、標(biāo)準(zhǔn)化具有重要意義。目前,現(xiàn)行的漢字?jǐn)?shù)字編碼有筆劃輸入和拼音輸入等方法,如愛立信公司的手機(jī)采用“字能輸入”,飛利浦、摩托羅拉公司以及海爾集團(tuán)的新型手機(jī)安裝了“T9智能漢字輸入”以及拼音輸入,此外也有獲得國(guó)家專利采用計(jì)算機(jī)數(shù)字小鍵盤輸入漢字的“筆順碼”和“五筆數(shù)碼”輸入法。其不足之處是重碼率高,使用起來比較繁瑣、規(guī)則太多、難于記憶,輸入一個(gè)漢字的擊鍵次數(shù)較多,掌握它們?nèi)杂幸欢ǖ碾y度?,F(xiàn)行的漢字?jǐn)?shù)字輸入方法,難以適應(yīng)移動(dòng)通信領(lǐng)域手機(jī)中文信息頻繁交換的要求。
目前,漢字?jǐn)?shù)字編碼方案多以漢字的筆劃和筆順進(jìn)行編碼,一般的使用者要熟練地掌握漢字的筆順并不容易,要把一個(gè)漢字拆成兩半再分別按筆順取碼就更困難了。雖然有的數(shù)字輸入法改進(jìn)后增加了聯(lián)想和智能處理功能,對(duì)提高漢字的整體錄入速度是有利的,但單個(gè)漢字仍需一筆一鍵地輸入,不僅每字的平均擊鍵次數(shù)較多、重碼率高,而且難于學(xué)習(xí)和掌握。
本發(fā)明的目的是要提供一種僅用0-9的十個(gè)數(shù)字鍵將漢字進(jìn)行編碼的漢字?jǐn)?shù)字化輸入集成系統(tǒng)。該系統(tǒng)除具有漢字、英文、標(biāo)點(diǎn)符號(hào)的數(shù)字化輸入功能之外,同時(shí)還具有免撥號(hào)直接檢索、查詢、自動(dòng)接通用戶電話的功能,以解決移動(dòng)通信手機(jī)、電話號(hào)碼難于記憶的問題。編碼基于一般人均已具有的知識(shí)儲(chǔ)備,通過科學(xué)地選取漢字的基本碼元和引入漢字字首成字偏旁與字末成字偏旁的概念,將聲形輸入、形聲輸入、全形碼三種輸入法合為一體,解決了不認(rèn)識(shí)或讀音不準(zhǔn)的漢字的輸入問題,使所需的記憶量降到最低限度,減輕漢字輸入的勞動(dòng)強(qiáng)度,較好地解決計(jì)算機(jī)漢字輸入與移動(dòng)通信手機(jī)的漢字?jǐn)?shù)字化輸入相互兼容和統(tǒng)一一致的問題。因此,本發(fā)明的漢字?jǐn)?shù)字化編碼輸入技術(shù)不僅用于移動(dòng)通信手機(jī)的漢字輸入,同樣也用于計(jì)算機(jī)數(shù)字小鍵盤的漢字輸入,實(shí)現(xiàn)計(jì)算機(jī)漢字輸入的單手操作,給人們提供一種可用于各種信息技術(shù)產(chǎn)品數(shù)字鍵盤的既規(guī)范、又簡(jiǎn)易便捷,能即學(xué)即用的漢字?jǐn)?shù)字化編碼輸入技術(shù)。
本發(fā)明的漢字?jǐn)?shù)字化編碼集成輸入技術(shù)是這樣實(shí)現(xiàn)的依據(jù)目前通用的手機(jī)數(shù)字鍵盤,以0-9個(gè)數(shù)字對(duì)漢字及中文標(biāo)點(diǎn)符號(hào)、英文字母及英文標(biāo)點(diǎn)符號(hào)進(jìn)行數(shù)字編碼。其編碼思想是漢字的編碼由聲碼和形碼兩部分組成,聲碼部分取漢字的聲母編碼,形碼部分取漢字字形的首、尾、補(bǔ)編碼。漢字的聲母編碼用與鍵盤上的英文字母相對(duì)應(yīng)的1-2位數(shù)字代碼輸入(無聲母的漢字取韻母的首字母為編碼)。漢字形碼對(duì)首、尾、補(bǔ)編碼的約定意義是以漢字左上角的起筆為首形碼,右下角末筆為尾形碼,最后以漢字右上角最高的筆形為補(bǔ)形碼。漢字聲母及字形的編碼元素均以一位數(shù)字或兩位數(shù)字進(jìn)行編碼。因此一個(gè)漢字的數(shù)字編碼最多可由五位數(shù)字構(gòu)成,即最多五鍵輸入一個(gè)漢字。
以下分別將漢字聲母的編碼方法和形碼的編碼方法具體說明如下一、漢字聲母的編碼漢字漢語拼音字母與數(shù)字鍵盤上附帶標(biāo)示的英文字母是一致的,漢字聲母的編碼是指選取漢字漢語拼音的首字母轉(zhuǎn)換成數(shù)字后進(jìn)行輸入的編碼。一般情況下,漢字拼音的首字母即是該漢字的聲母,若遇卷舌音如ZH、CH、SH或無聲母的漢字則取其聲母或韻母的第一個(gè)首字母編碼。在輸入漢字漢語拼音的首字母時(shí),為了盡可能減少擊鍵次數(shù),以便快速輸入,需要對(duì)現(xiàn)行的手機(jī)數(shù)字鍵盤上英文字母所在鍵位稍作調(diào)整,即將S、Z調(diào)整至鍵位1上(原數(shù)字鍵盤未在鍵位1上安排有字母)。此種“調(diào)整”可以是一種實(shí)質(zhì)上的調(diào)整,如附圖所示;也可以是一種邏輯性調(diào)整,即保持手機(jī)數(shù)字鍵盤的原貌不作任何改動(dòng),但在輸入時(shí)應(yīng)牢記S、Z已調(diào)整至鍵位1上。其次規(guī)定根據(jù)字母在鍵位上前后的排列順序確定該字母的數(shù)字編碼。即左起的首位字母以其所在鍵位的數(shù)字為編碼;左起的第二位字母于其所在鍵位上連按兩次為該字母的編碼;左起的第三位字母以其所在鍵位上的數(shù)字加零為編碼。如此調(diào)整后,既符合數(shù)字鍵盤傳統(tǒng)的輸入習(xí)慣,又保證每個(gè)字母最多兩鍵便可輸入,并且無需記憶每個(gè)字母的編碼,只要按鍵盤上字母標(biāo)示的位置即可快速鍵入。根據(jù)手機(jī)數(shù)字鍵盤(如附圖)標(biāo)示的字母位置,其字母編碼表如下。
1、字母編碼表(共26個(gè))字母 數(shù)字代碼字母 數(shù)字代碼字母 數(shù)字代碼S 1 Z 11A 2 B 22 C 20D 3 E 33 F 30
G 4 H 44 I 40J 5 K 55 L 50M 6 N 66 O 60P 7 Q 77 R 70T 8 U 88 V 80W 9 X 99 Y 902、功能引導(dǎo)識(shí)別符編碼 (共十一個(gè))00 阿拉伯?dāng)?shù)字識(shí)別符000大寫數(shù)字識(shí)別符01 標(biāo)點(diǎn)符號(hào)識(shí)別符02 特殊符號(hào)識(shí)別符03 小寫英文字母識(shí)別符04 大寫英文字母識(shí)別符05 希臘字母識(shí)別符06 自動(dòng)菜單選擇識(shí)別符07 短信息點(diǎn)播識(shí)別符08 我的文件包09 電話查詢與自動(dòng)撥號(hào)識(shí)別符這種將字母按位置順序、有規(guī)律的分組進(jìn)行編碼的方法,使人一目了然、便于記憶。如數(shù)字鍵盤的2、3、4鍵位分別表示聲母A、D、G,若要輸入其后第三位的字母C、E、I,根據(jù)編碼規(guī)則可知其編碼分別為20、30、40,按本位鍵后只需補(bǔ)零即可,減輕了記憶負(fù)擔(dān),達(dá)到了使人過目不忘的效果。通過設(shè)置功能引導(dǎo)識(shí)別符,可以在漢字輸入法狀態(tài)下擴(kuò)展新的功能,實(shí)現(xiàn)數(shù)字、英文字母、標(biāo)點(diǎn)符號(hào)輸入以及具有資料檢索與自動(dòng)撥號(hào)等功能。
二、漢字字形的編碼形碼部分的基本字形編碼元素分為十種,分別用十個(gè)數(shù)字鍵表示1—一乚橫、右彎鉤 (含橫上鉤和斜右鉤)2—丨丿亅 豎、撇 (含豎左鉤)3—丶ㄟ點(diǎn)、捺4—乂ナ十 叉 (兩筆交叉)5—扌插 (一筆縱向穿兩筆或兩筆以上)6—口 方框(四角整齊的方形)7— 乛角 (一筆向下轉(zhuǎn)折或兩筆筆頭相接所形成的角形)8—八丷 八 (八字形和八字形的變形)9—小忄 小 (小字和小字的變形)0—亠 點(diǎn)下有一橫 (點(diǎn)與橫筆組成的復(fù)筆)
編碼元素按國(guó)家現(xiàn)行出版的《新華字典》、《辭?!穼?duì)漢字筆形的分類進(jìn)行了取舍。
漢字字形的基本碼元可以如附圖所示,直接標(biāo)示在其對(duì)應(yīng)的數(shù)字鍵位上,以方便使用者鍵入形碼,也可以不對(duì)數(shù)字鍵盤作標(biāo)識(shí),而依靠記憶輸入漢字的形碼。
三、漢字?jǐn)?shù)字化編碼示例漢字?jǐn)?shù)字化編碼有聲形輸入和形聲輸入兩種輸入方法,可由使用者根據(jù)自身的具體情況任選其一,其編碼流程如下1、單字的聲形輸入方式單字的聲形輸入方式是按照人們書寫漢字的習(xí)慣思維過程,首先根據(jù)字的讀音考慮寫首筆劃,最后以末筆劃結(jié)束的過程。因此編碼的規(guī)則是先輸入漢字讀音的聲母,然后是首形碼、尾形碼,最后加補(bǔ)形碼,也就是聲碼+首形碼+尾形碼+補(bǔ)形碼例如“金”字的編碼5818,簡(jiǎn)碼為581;“石”字的編碼1161,簡(jiǎn)碼為116;“教”字的編碼5448,簡(jiǎn)碼為544;“新”字的編碼99022,該字無簡(jiǎn)碼。
2、單字的形聲輸入方式為適應(yīng)文化層次不同的人員,允許對(duì)那些不會(huì)讀或不會(huì)寫的漢字采用下述形聲方式輸入漢字。
在一般的聲形輸入方式下,應(yīng)當(dāng)先輸入漢字的聲碼,然后再輸入該字的三個(gè)形碼。對(duì)于不認(rèn)識(shí)的字,難以確定聲母的編碼,也可以采用形聲方式輸入,即先輸入該字的首形碼,尾形碼、補(bǔ)形碼,然后取組成該漢字的字首成字偏旁或字末成字偏旁的聲母編碼,也就是首形碼+尾形碼+補(bǔ)形碼+偏旁聲碼(若無偏旁聲碼則加零)此處的偏旁聲碼與以下生僻字編碼中偏旁聲碼的約定意義相同。
由此可見,一個(gè)漢字可以同時(shí)具有“聲形碼”和“形聲碼”兩個(gè)編碼,二者相互兼容,互不干擾,使用人員勿需按轉(zhuǎn)換鍵,就可以隨意交替使用另一種輸入法錄入漢字,解決了對(duì)不認(rèn)識(shí)的漢字的錄入問題。
例如輸入漢字“襲” 先敲入形碼433,該字有字末成字偏旁“衣”,繼續(xù)敲入聲碼90即43390,便可輸入“襲”字。
輸入漢字“儇”。先敲入形碼236,因該字首、末均無成字偏旁,應(yīng)敲入0,編碼為2360,若無重碼,則自動(dòng)輸入漢字“儇”,有重碼可用數(shù)字鍵選擇輸入。
由于同聲母的一些漢字可能具有相似的首尾結(jié)構(gòu),會(huì)出現(xiàn)多個(gè)漢字編碼相同的重碼問題,為了在僅有十個(gè)基本碼元的情況下降低重碼率,分散較為集中的重碼字,達(dá)到易學(xué)好用的目的,數(shù)字編碼采用了“路徑”的編碼方法,即將全碼相同的多個(gè)不同漢字,按其使用的頻度分散到全碼所路經(jīng)的上級(jí)簡(jiǎn)碼任何一個(gè)全碼漢字,均可根據(jù)編碼需要占用其路經(jīng)上的一級(jí)、二級(jí)、三級(jí)乃至四級(jí)簡(jiǎn)碼資源。例如有四個(gè)漢字的編碼均為31879,則按使用頻度以318為一個(gè)高頻字簡(jiǎn)碼,3187為一個(gè)常用字簡(jiǎn)碼,31879為兩個(gè)非常用字的編碼。只要知道一個(gè)字的全碼,就可以在鍵入全碼的路徑上找到該漢字,從而使重碼率大為降低,實(shí)現(xiàn)了同一編碼最多不超過三個(gè)漢字,進(jìn)一步降低了單個(gè)漢字的平均擊鍵次數(shù)。
四、生僻字的編碼漢字?jǐn)?shù)字化編碼中的國(guó)標(biāo)GB2312-80的一、二級(jí)字庫漢字占據(jù)了1-5位的編碼空間,基本上滿足了一般中文信息處理的要求。為最后徹底解決用漢字輸入人名、地名以及典籍中一些生僻字的問題,國(guó)家新頒布GB18030-2000《信息交換漢字編碼字符集》的漢字27000多個(gè),本發(fā)明對(duì)其中一些使用頻率很低的生僻字以五位或六位數(shù)字編碼,具體方法是與常用字一樣仍按聲形法或形聲法對(duì)生僻字取碼,然后繼續(xù)補(bǔ)零至六位數(shù)字。通過這種補(bǔ)零的技術(shù)處理,劃定了生僻字的編碼空間,使生僻字的編碼僅占用第五位與第六位數(shù)字為零的編碼空間,因此,在不需要生僻字時(shí),生僻字僅處于藏而不露的備用狀態(tài),不會(huì)干擾常用漢字的輸入。
(一)聲形法輸入生僻字的取碼流程聲碼+首形碼+尾形碼+補(bǔ)形碼+零例如用聲形法輸入生僻字“ ”,其編碼為77210。
用聲形法輸入生僻字“俬”,其編碼為12320。
(二)形聲法輸入生僻字的取碼流程所謂生僻字是指不常見、不熟悉、而且極少用到的字。對(duì)于不認(rèn)識(shí)的生僻漢字,難以確定聲母的編碼時(shí),可采用下述的形聲方式輸入。即先輸入該字的首形碼,尾形碼、補(bǔ)形碼,然后取組成該漢字的偏旁聲碼,即字首成字偏旁或字末成字偏旁的聲母編碼,同時(shí)補(bǔ)零到五位數(shù)或六位數(shù),也就是首形碼+尾形碼+補(bǔ)形碼+偏旁聲碼+零 (若無偏旁聲碼則加零)例如用形聲法輸入生僻字“ ”,其編碼為72160。
用形聲法輸入生僻字“俬”,其編碼為23210。
形聲輸入法解決了不知道讀音的漢字的輸入問題,只要按漢字的字形輸入其形碼后再輸入該字的偏旁聲碼即可。
在這里需要注意所謂偏旁聲碼是指字首成字偏旁或是字末成字偏旁的聲母編碼,偏旁聲碼應(yīng)優(yōu)先取字末成字偏旁的聲碼,無論是字首成字偏旁或是字末成字偏旁,均須取最大成字偏旁的聲母編碼。具體規(guī)定如下1、本發(fā)明所指的“成字偏旁”是指組成該字的偏旁有明確的讀音,而且不需要修正筆形即可獨(dú)立作為漢字使用的偏旁。例如蟲、石、貝、牛、又、皮、俞、扁等均為有讀音、可獨(dú)立成字的偏旁;而纟、亻、攵、钅、、扌、宀等則不作成字偏旁處理。
2、本發(fā)明所指的“字首成字偏旁”是由漢字首筆與其后續(xù)筆劃組成的最大成字偏旁。
例如“彰”有字首成字偏旁“章”,而無字末成字偏旁。
“郇”郇有字首成字偏旁“旬”,而無字末成字偏旁。
3、本發(fā)明所指的“字末成字偏旁”是由漢字末筆與其前續(xù)筆劃組成的最大成字偏旁。
例如“讀”有字末成字偏旁“賣”,而無字首成字偏旁。
“鞭”既有字首成字偏旁“革”,也有字末成字偏旁“便”。
4、漢字偏旁的取碼按位置優(yōu)先取字末成字偏旁的聲母編碼,如沒有字末成字偏旁則改取字首成字偏旁的聲母編碼。
例如“彬”的聲碼取字末成字偏旁“杉”的聲母S。
“統(tǒng)”的聲碼取字末成字偏旁“充”的聲母C。
“謐”的聲碼取字末成字偏旁“皿”的聲母M。
“邡”的聲碼取字首成字偏旁“方”的聲母F。
5、沒有字首、字末成字偏旁的漢字,聲碼-律取0(零)。
例如單、事、卮、其聲碼均取0。
以下是用形聲輸入方式輸入漢字的例子例1、輸入漢字“盛”。
假如不認(rèn)識(shí)“盛”字,難以確定其聲母的編碼,可敲入形碼713后再敲入“皿”字聲母M的數(shù)字編碼,即可輸入“盛”字。
例2、輸入漢字“襲”先敲入形碼433,該字有字末成字偏旁“衣”,繼續(xù)敲入聲母Y的數(shù)字編碼即可輸入“襲”字。
例3、輸入漢字“?!?。
先敲入形碼343,因該字首、末均無成字偏旁,應(yīng)敲入0,若無重碼,則自動(dòng)輸入漢字“浚”,有重碼可用數(shù)字鍵選擇輸入。
五、詞匯與整句的編碼詞匯的編碼輸入方式分為聲形、全形兩種。聲形輸入方式的詞匯編碼按“聲母優(yōu)先、一聲一鍵、形碼后補(bǔ)”的模糊編碼原則。所謂模糊編碼,是指在按順序鍵入詞匯中每個(gè)漢字聲母(無聲母的漢字取韻母的首字母)的編碼時(shí),每個(gè)聲母只需按聲母所在的鍵一次即可,詞匯的碼長(zhǎng)為六位數(shù)字,不必再雙擊或補(bǔ)0對(duì)同一鍵位上的聲母加以仔細(xì)區(qū)分。詞匯編碼最多可取六個(gè)聲母,取完詞匯中每個(gè)字的聲母后仍不足六位數(shù)字可繼續(xù)取形碼補(bǔ)足。詞匯的全形碼輸入方式是一種見字識(shí)碼的輸入方法,只需按規(guī)定的編碼流程鍵入詞匯的形碼,就可以正確的輸入不認(rèn)識(shí)或讀音不準(zhǔn)的詞語。兩種輸入方式根據(jù)詞匯的字?jǐn)?shù)不同有以下五種編碼方法。
1、二字詞編碼(1)聲形輸入方式,依序輸入二字詞每個(gè)字的聲碼和首字首形碼、末字尾形碼、末字補(bǔ)形碼、首字尾形碼。
即首字聲碼+末字聲碼+首字首形碼+末字尾形碼+末字補(bǔ)形碼+首字尾形碼(2)全形碼輸入方式,依序輸入二字詞每個(gè)字的形碼,具體規(guī)則是首形碼1+尾形碼1+補(bǔ)形碼1+首形碼2+尾形碼2+補(bǔ)形碼22、三字詞編碼(1)聲形輸入方式,依序輸入三字詞每個(gè)字的聲碼和首字首形碼、末字尾形碼、末字補(bǔ)形碼。
即聲碼1+聲碼2+聲碼3+首字首形碼+末字尾形碼+末字補(bǔ)形碼(2)全形碼輸入方式,依序輸入三字詞每個(gè)字的首形碼和尾形碼,其規(guī)則是首形碼1+尾形碼1+首形碼2+尾形碼2+首形碼3+尾形碼33、四字詞編碼(1)聲形輸入方式,依序輸入四字詞每個(gè)字的聲碼和首字首形碼、末字尾形碼。
即聲碼1+聲碼2+聲碼3+聲碼4+首字首形碼+末字尾形碼(2)全形碼輸入方式,依序輸入四字詞每個(gè)字的形碼,具體規(guī)則是首形碼1+尾形碼1+首形碼2+首形碼3+首形碼4+尾形碼44、五字詞編碼(1)聲形輸入方式,依序輸入五字詞每個(gè)字的聲碼和首字首形碼。
即聲碼1+聲碼2+聲碼3+聲碼4+聲碼5+首字首形碼(2)全形碼輸入方式,依序輸入五字詞每個(gè)字的首形碼以及末字尾形碼,具體規(guī)則是首形碼1+首形碼2+首形碼3+首形碼4+首形碼5+尾形碼55、多字詞與整句編碼(1)聲形輸入方式,依序輸入多字詞前五個(gè)字的聲碼和末字的聲碼。
即聲碼1+聲碼2+聲碼3+聲碼4+聲碼5+末字聲碼(2)全形碼輸入方式,依序輸入多字詞前五個(gè)字的首形碼和末字的首形碼。
即首形碼1+首形碼2+首形碼3+首形碼4+首形碼5+末字首形碼基于快速輸入的思想,詞匯的編碼與漢字的編碼一樣,采用了“路徑”的編碼方法,全碼詞可以占用“路徑”上的二級(jí)、三級(jí)、四級(jí)等各級(jí)簡(jiǎn)碼資源。如“北京”的簡(jiǎn)碼為2519;“計(jì)算機(jī)”的簡(jiǎn)碼為5153;“滿園春色”的全碼為692131,“中華人民共和國(guó)”的全碼為147644,凡六字以上的詞匯均無需輸入形碼。漢字的數(shù)字化編碼收集了國(guó)標(biāo)GB2312-80的一、二級(jí)漢字和國(guó)家新頒布的GB18030《信息交換漢字編碼字符集》的漢字以及五萬余條常用詞匯。此外,囊括了商務(wù)印書館1996年版《漢語成語小詞典》中的全部成語,大多敲入聲母的編碼就可將成語錄入而不會(huì)與漢字發(fā)生重碼。經(jīng)過以上技術(shù)處理的詞匯重碼率僅為千分之一。
以下是實(shí)際應(yīng)用中的部分常用字、詞匯的數(shù)字化編碼示例編碼字詞匯編碼字詞匯編碼字詞匯14122 上海市715 妻子 95011新疆19132 沈陽市7284 人才 9509 音樂19636 思想 7415 青海省 95109新技術(shù)2140長(zhǎng)沙 7422 任何 95117已經(jīng)21420 城市 7531 漂亮 9523 優(yōu)良215 表示 7703 親熱 955 未來2239冰8365 突飛猛進(jìn) 9612 云南2242愛8452 提高 96288優(yōu)美22812 從此 8511 天津市 9638 完美2511北京市85155天津 964 姓名2519北京 860 童年 96913心滿意足253914 北京大學(xué) 8735 通情達(dá)理 9719 要求25443 博覽會(huì)89220臺(tái)灣 972 以前2579巴黎 8949 太原 974 尤其272 愛人 897 同意 9741 喜氣2722愛情 9048 英 9745 有錢273 必然 9063 眼 9756 星期六29186 創(chuàng)業(yè)者9118 于是 978 笑容29423 奧委會(huì)9149 薪水 97868星期天3084父9158 銷售量 979 興趣3255電車 9161 晚上 988 舞臺(tái)35122 俄羅斯9214 西安 989 因特網(wǎng)3644婦女 9231 為此 990 效3652豐滿 9235 完成 9901 效益36523 發(fā)明家92447喜報(bào) 991 現(xiàn)38210 兒童 9251 擁抱 9914 需要42136 湖北省9261 因此 99283優(yōu)越4332活動(dòng) 9282 銀川 99413亞運(yùn)會(huì)4591互聯(lián)網(wǎng)9283 午餐 99417希望510 就是 9341 現(xiàn)代化 994241 希望工程5731況且 93433運(yùn)動(dòng)會(huì) 9946 喜5785金錢 9346幸福9946杏5888今天 9350意大利 99528 優(yōu)秀獎(jiǎng)5951科學(xué)技術(shù) 94 娃 9954由于6481美國(guó) 940 應(yīng)該99593 業(yè)務(wù)聯(lián)系6748女人 9401文化9978原因6794女朋友 94147 武漢99911 興旺6796男朋友 94416 英國(guó)9992優(yōu)越性68 美 94487 喜歡99927 學(xué)習(xí)6855摩托羅拉 95 為了99940 學(xué)校六、數(shù)字編碼數(shù)字0-9已用作漢字的編碼元素,在漢字?jǐn)?shù)字輸入法狀態(tài)下是不能直接輸入阿拉伯?dāng)?shù)字的,只有退出或者關(guān)閉漢字?jǐn)?shù)字輸入法,在窗口狀態(tài)下才能直接輸入數(shù)字。為了在漢字?jǐn)?shù)字輸入狀態(tài)下輸入阿拉伯?dāng)?shù)字,系統(tǒng)定義了“00”為數(shù)字編碼的識(shí)別字符,即要輸入0-9的數(shù)字時(shí)先鍵入“00”的識(shí)別字符,接著再鍵入要輸入的的數(shù)字。例如要輸入數(shù)字9,應(yīng)鍵入009,便可將9直接輸入上屏。若要輸入數(shù)字8189,應(yīng)鍵入008189,則8189直接上屏。數(shù)字編碼可直接輸入集成系統(tǒng)所存儲(chǔ)0-9999的四位任意數(shù),五位以上的數(shù)字可分兩次輸入。以下是0-9的數(shù)字及大寫數(shù)字編碼示例。
1、數(shù)字編碼示例編碼阿拉伯?dāng)?shù)字編碼阿拉伯?dāng)?shù)字00 0 00550011 00660022 00770033 00880044 009900819 819008129 8129如果在漢字編輯狀態(tài)下關(guān)閉數(shù)字輸入法,此時(shí)可用數(shù)字鍵盤直接輸入任何阿拉伯?dāng)?shù)字,但這些數(shù)字僅用作文字編輯,并不具備撥號(hào)功能。
2、大寫數(shù)字編碼大寫數(shù)字也可以在大寫數(shù)字引導(dǎo)識(shí)別符“000”后加大寫數(shù)字編碼輸入。
大寫數(shù)字編碼示例編碼 大寫數(shù)字編碼 大寫數(shù)字000 零0006陸0001壹0007柒
0002貳 0008捌0003叁 0009玖0004肆 00011 拾0005伍 00012 百編碼中第四位數(shù)字代表大寫數(shù)字,第五位數(shù)字代表零的個(gè)數(shù),例如11表示10,即大寫“拾”;12表示100,即大寫“百”;13表示1000,即大寫“仟”;其余可類推。
七、中英文標(biāo)點(diǎn)符號(hào)的編碼漢字?jǐn)?shù)字化編碼可以直接用數(shù)碼輸入各種中、英文標(biāo)點(diǎn)符號(hào),為此需要有識(shí)別符引導(dǎo)進(jìn)入標(biāo)點(diǎn)符號(hào)編碼模塊,數(shù)字化編碼以“01”為中、英文標(biāo)點(diǎn)符號(hào)的引導(dǎo)識(shí)別符,即在輸入標(biāo)點(diǎn)符號(hào)編碼前,先輸入“01”作為識(shí)別符,然后按符號(hào)編碼規(guī)則輸入標(biāo)點(diǎn)符號(hào)的編碼。中英文標(biāo)點(diǎn)符號(hào)沒有聲碼,只需按照形碼的編碼規(guī)則對(duì)要輸入的符號(hào)取形碼即可。標(biāo)點(diǎn)符號(hào)取形碼有兩種情況當(dāng)符號(hào)為一個(gè)整體不能分割時(shí),其取碼規(guī)則與單字取形碼的規(guī)則一樣,取符號(hào)的首形碼、尾形碼和補(bǔ)形碼。
即01+首形碼+尾形碼+補(bǔ)形碼例如加法符號(hào)“+”為01444;減法符號(hào)“-”為01111;井形符號(hào)“#”為01555。
如果符號(hào)是由多個(gè)獨(dú)立并分隔開的符號(hào)組成時(shí),則分別按順序取組成該符號(hào)的各部分的首形碼。
即01+首形碼1+首形碼2+首形碼3+首形碼4例如分號(hào)“;”由點(diǎn)和撇組成,編碼為0132;冒號(hào)“”由點(diǎn)和點(diǎn)組成,編碼為0133;感嘆號(hào)“!”由豎和點(diǎn)組成,編碼為0123;除法符號(hào)“÷” 由點(diǎn)、橫、點(diǎn)組成,編碼為01313;省略號(hào)“…”由三個(gè)點(diǎn)組成,編碼為01333;百分號(hào)“%”由園、斜杠(類似一撇)和園所組成,故編碼為01626。為了提高輸入速度和效率,符號(hào)編碼與單個(gè)漢字一樣也有簡(jiǎn)碼,以下是部分常用中、英文標(biāo)點(diǎn)符號(hào)編碼示及特殊符號(hào)編碼示例。
1、中英文常用標(biāo)點(diǎn)符號(hào)編碼示例0 . 0154 £01。
0155 $011 - 01555 #0111 —016 @01111 = 0167 ℃012 , 0162 %0122 / 01626 ‰0122 ‘ 0164 ♀01222“017 ()
0123 ! 0171 ∑013 、 0173 ?0131 ÷ 0176 ♂0132 ; 01761№0133 0177 <>01333 … 0177 <>
014 +01777 《》0141 ± 018 &
0144 × 0184 ¥015 *0185 由此可見,中西文符號(hào)是按符形編碼的,只要在符形碼之前附上“01”的識(shí)別符即可,使用簡(jiǎn)便明了,無需強(qiáng)記。
2、特殊符號(hào)是指常用標(biāo)點(diǎn)符號(hào)之外的各種特殊符號(hào)。如果要輸入特殊符號(hào),只需輸入特殊符號(hào)引導(dǎo)識(shí)別符“02”,然后從分類的特殊符號(hào)集中選出所需要的符號(hào)輸入。
八、英文字母編碼英文字母輸入方式有漢字?jǐn)?shù)字化編碼輸入和純英文輸入狀態(tài)下英文字母直接編碼輸入兩種,其編碼方法分述如下。
1、英文字母在漢字?jǐn)?shù)字輸入法狀態(tài)下是以編碼形式輸入的。因此,需要輸入小寫英文字母時(shí)應(yīng)先鍵入小寫英文字母識(shí)別符“03”再加英文字母編碼;需要輸入大寫英文字母時(shí)應(yīng)先鍵入大寫英文字母識(shí)別符“04”再加英文字母編碼。大寫、小寫英文字母的編碼與數(shù)字鍵盤上的字母編碼是一致的。當(dāng)鍵入小寫英文字母識(shí)別符“03”再加英文字母編碼即可輸入小寫英文字母。如小寫字母“w”在數(shù)字9鍵上的左數(shù)第一位,鍵入其編碼039即可上屏;小寫字母“f”在數(shù)字3鍵上的上左數(shù)第三位,鍵入其編碼0330,字母f即可上屏;大寫字母“V”位于數(shù)字8鍵上左數(shù)第三位,鍵入其編碼0480,大寫字母V即可上屏。以下分別是漢字?jǐn)?shù)字輸入法狀態(tài)下大寫、小寫英文字母編碼表。
小寫英文字母編碼表編碼英文字母編碼英文字母編碼英文字母031s0311 z032a0322 b0320c033d0333 e0330f034g0344 h0340i035j0355 k0350l036m0366 n0360o
037 p 0377 q 0370r038 t 0388 u 0380v039 w 0399 x 0390y大寫英文字母編碼表編碼英文字母編碼英文字母編碼英文字母041S0411 Z042A0422 B0420 C043D0433 E0430 F044G0444 H0440 I045J0455 K0450 L046M0466 N0460 O047P0477 Q0470 R048T0488 U0480 V049W0499 X0490 Y2、退出漢字?jǐn)?shù)字輸入法進(jìn)入純英文字母輸入法狀態(tài)下,英文字母可以更為簡(jiǎn)便地直接輸入。此時(shí)無需輸入英文字母引導(dǎo)識(shí)別符,只需按照英文字母所在的對(duì)應(yīng)鍵位輸入其相應(yīng)的編碼,每個(gè)字母最多按兩次即可上屏顯示,由于其編碼的唯一性,系統(tǒng)可以按偶位識(shí)別原理進(jìn)行兩兩劃分并自行識(shí)別,無需預(yù)先顯示,從而可只看鍵盤實(shí)現(xiàn)快速盲打輸入英文字母及其標(biāo)點(diǎn)符號(hào)。以下是純英文字母輸入狀態(tài)下的字母編碼。
英文字母編碼表編碼英文字母 編碼 英文字母 編碼 英文字母1 S 11Z2 A 22B20C3 D 33E30F4 G 44H40I5 J 55K50L6 M 66N60O7 P 77Q70R8 T 88U80V9 W 99X90Y注 表示確認(rèn)鍵。
例如輸入英文單詞“HOLLO”可直接連續(xù)鍵入各個(gè)字母的數(shù)字編碼4460505060,系統(tǒng)識(shí)別時(shí)按偶位劃分原則將編碼劃分為44-60-50-50-60,屏幕便可顯示對(duì)應(yīng)的英文單詞“HOLLO”。較之現(xiàn)行的英文數(shù)字輸入法,可大幅度地減少擊鍵次數(shù),使英文字母的輸入更為簡(jiǎn)易快捷。
九、希臘字母編碼在漢字?jǐn)?shù)字輸入狀態(tài)下輸入希臘字母需要先鍵入希臘字母引導(dǎo)識(shí)別符“05”,然后鍵入希臘字母編碼。以下是希臘字母編碼表編碼希臘字母編碼希臘字母編碼希臘字母051α 0511β0510 γ052δ 0522ε0520 ζ053η 0533θ0530 ι054κ 0544λ0540 μ055ν 0555ξ0550 ο056π 0566ρ0560 σ057τ 0577υ0570 φ058χ 0588ψ0580 ω十、自動(dòng)菜單選擇功能一般說來,應(yīng)用程序的許多功能是靠菜單選擇來實(shí)現(xiàn)的,因而必需進(jìn)入層層菜單去查找所需要的最里層菜單,既費(fèi)勁又費(fèi)時(shí)間。菜單自動(dòng)選擇功能就是通過對(duì)菜單的編碼建立與其對(duì)應(yīng)菜單的鏈接以實(shí)現(xiàn)所需要的功能。例如計(jì)算機(jī)的“掃雷”游戲,必需通過“開始——程序——附件——游戲——掃雷”等五層菜單,最后點(diǎn)擊“掃雷”。而通過鍵入自動(dòng)菜單選擇識(shí)別符“06”加“掃雷”的二字詞編碼,如敲入“061556”即可經(jīng)內(nèi)部程序與“掃雷”游戲鏈接實(shí)現(xiàn)“掃雷”游戲功能。自動(dòng)菜單選擇功能的菜單編碼與詞匯的編碼是一致的,但最多只取四位數(shù)編碼。以下是幾個(gè)自動(dòng)菜單選擇功能的編碼示例菜單名稱 自動(dòng)菜單編碼計(jì)算器 065173錄音機(jī) 065951音量控制 069551記事本 065123備份 062322掃雷 061556紅心大戰(zhàn) 064931十一、短信息點(diǎn)播功能短信息點(diǎn)播功能是指通過鍵入短信息點(diǎn)播識(shí)別符“07”加短信息名稱編碼即可與短信息發(fā)布中心所對(duì)應(yīng)的短信息鏈接,從而獲取該條短信息的內(nèi)容。短信息名稱的編碼與詞匯的編碼是一致的,但最多只取四位數(shù)編碼。以下是幾個(gè)短信息點(diǎn)播的編碼示例短信息名稱 短信息點(diǎn)播編碼氣象信息 077999影視消息 079199股市動(dòng)態(tài) 074138十二、我的文件包我的文件包其作用是存放個(gè)人資料與查詢資料。資料內(nèi)容如姓名、重要記事等可隨時(shí)輸入保存,然后通過鍵入我的文件包引導(dǎo)識(shí)別符“08”加姓名或標(biāo)題編碼進(jìn)行檢索、查詢所需的內(nèi)容。姓名、重要記事標(biāo)題等的編碼與詞匯的編碼是一致的,但最多只取四位數(shù)編碼,與引導(dǎo)識(shí)別符“08”共同組成六位數(shù)的查詢碼。
十三、電話查詢與自動(dòng)撥號(hào)功能電話號(hào)碼的記憶是件費(fèi)心勞神的事,漢字?jǐn)?shù)字化編碼方法由于重碼率極低,為移動(dòng)通訊的電話號(hào)碼查詢和自動(dòng)撥號(hào)提供了簡(jiǎn)便實(shí)用的操作方案。本方案的實(shí)現(xiàn)是基于數(shù)據(jù)存儲(chǔ)模塊中已輸入了用戶的姓名及電話號(hào)碼等資料的情況下,通過輸入查找人的姓名編碼而從已有的數(shù)據(jù)庫中調(diào)出其對(duì)應(yīng)的電話號(hào)碼,經(jīng)確認(rèn)后自動(dòng)撥號(hào)接通對(duì)方的通信設(shè)備。實(shí)施該功能的過程是這樣的首先鍵入“09”的查詢和自動(dòng)撥號(hào)識(shí)別符,接著輸入被查詢?nèi)说男彰幋a,姓名的編碼方法與漢字?jǐn)?shù)字化編碼中的詞匯編碼方法完全相同,但系統(tǒng)規(guī)定只取姓名編碼的前四位數(shù)字編碼。例如“陸游”的編碼按照二字詞編碼規(guī)則為5974,要查詢其電話號(hào)碼和相關(guān)資料應(yīng)鍵入095974即可調(diào)出“陸游”的電話號(hào)碼,查看無誤,經(jīng)確認(rèn)后自動(dòng)撥號(hào)發(fā)出。
“辛棄疾”的編碼按照三字詞編碼規(guī)則為9750,要查詢其電話號(hào)碼和相關(guān)資料應(yīng)鍵入099750,顯示后,經(jīng)確認(rèn)即自動(dòng)撥號(hào)發(fā)出。
根據(jù)上述原理,也可建立專用的電話查詢與自動(dòng)撥號(hào)窗口界面,此時(shí)可取消引導(dǎo)識(shí)別符,用戶按系統(tǒng)設(shè)計(jì)好的格式輸入了相關(guān)人員的姓名、單位名稱及其相應(yīng)的電話號(hào)碼存儲(chǔ)于數(shù)據(jù)庫,需要撥號(hào)時(shí)只要輸入姓名或者單位名稱的編碼即可調(diào)出其對(duì)應(yīng)的電話號(hào)碼,經(jīng)確認(rèn)后便可自動(dòng)撥號(hào)發(fā)出。由于無需識(shí)別符,可以直接取姓名的六位數(shù)字編碼,因而可存儲(chǔ)數(shù)萬個(gè)通訊號(hào)碼以適應(yīng)大用戶的需要。
電話查詢與自動(dòng)撥號(hào)功能是基于所輸入的姓名編碼與數(shù)據(jù)庫中存儲(chǔ)的姓名編碼相同的關(guān)系實(shí)現(xiàn)的。只要知道被查詢?nèi)说男彰騿挝幻Q,便可按照數(shù)字編碼規(guī)則輸入其姓名或者單位名稱編碼,系統(tǒng)據(jù)此調(diào)出相對(duì)應(yīng)的電話號(hào)碼和相關(guān)資料,從而避免記憶那些抽象而難記的電話號(hào)碼,提高工作效率。
本發(fā)明的漢字?jǐn)?shù)字化編碼鍵盤的具體結(jié)構(gòu)由以下實(shí)施例及其附圖給出。
圖1是根據(jù)本發(fā)明提出的漢字?jǐn)?shù)字化編碼鍵盤的數(shù)字、英文字母的具體鍵位分布圖。
下面結(jié)合圖1詳細(xì)說明依據(jù)本發(fā)明的漢字?jǐn)?shù)字化編碼輸入技術(shù)提出的具體鍵盤的設(shè)置細(xì)節(jié)及漢字輸入過程。
附圖所示的鍵盤包括十個(gè)數(shù)字鍵,每個(gè)鍵位以0-9的阿拉伯?dāng)?shù)字標(biāo)識(shí),其中2-9的每個(gè)鍵位上分別有三個(gè)英文字母與其一一對(duì)應(yīng),在數(shù)字1的鍵位上僅安排有S和Z兩個(gè)英文字母與漢語拼音中的S和Z相對(duì)應(yīng)。0鍵位則是一個(gè)純數(shù)字鍵,它除了作為一個(gè)形碼鍵位之外,同時(shí)也是一個(gè)輔助的功能鍵,與其它數(shù)字鍵配合以區(qū)分出輸入的是哪一個(gè)字母。為了使用方便和操作簡(jiǎn)單,根據(jù)字母在數(shù)字鍵位上位置不同的提示作用,配合0鍵可輸入相應(yīng)的字母代碼。本發(fā)明的數(shù)字編碼鍵盤也可在計(jì)算機(jī)原有的數(shù)字鍵盤上加貼標(biāo)簽或帶上有字母標(biāo)識(shí)的鍵帽,使?jié)h字的輸入更為直觀簡(jiǎn)便。鍵位上英文字母從左、中、右排列的約定意義是左邊的第一個(gè)字母以按一次本鍵表示;中間的第二個(gè)字母以按兩次本鍵表示;從左至右的第三個(gè)字母以先按一次本鍵再接著按0鍵表示。這里的字母位序起到了提示數(shù)碼的作用,減輕了人們的記憶負(fù)擔(dān),有利于提高鍵入速度。例如要輸入字母G,因其在4鍵左邊第一位,表示“4”代表字母G,只要按數(shù)字鍵4即可;若要輸入字母K,因其在5鍵中間第二位,表示需連按5鍵兩次,即“55”代表字母K;如果要輸入字母Y,因其居9鍵左數(shù)第三位,則需先按本鍵然后接著按0鍵,即“90”代表字母Y。例如輸入一個(gè)“新”字,其聲母X是9鍵位上的第二個(gè)字母,需要連續(xù)鍵入99和其余的三個(gè)形碼022,“新”的編碼則為99022;又如輸入“寶石”一詞,其聲母為B和S均在2鍵和1鍵上,按照詞匯的編碼規(guī)則,每個(gè)聲母只按一次即可,鍵入21和形碼361,“寶石”一詞的編碼為21361;成語“馬到成功”的聲母為MDCG,按四字詞匯的編碼規(guī)則可知其編碼為63247。標(biāo)點(diǎn)符號(hào)則需先輸入引導(dǎo)識(shí)別符“01”再鍵入形碼,如逗號(hào)的編碼鍵入012即可。由此可見即使聲母的數(shù)字代碼記不住,按鍵位上字母標(biāo)示的位置也能迅速確定該字母的數(shù)字編碼,形碼則按數(shù)字代碼直接鍵入,操作是非常簡(jiǎn)便快捷的。
漢字?jǐn)?shù)字化輸入集成系統(tǒng)與現(xiàn)行漢字編碼方法相比,其特點(diǎn)是編碼的規(guī)范性和確定性。本發(fā)明是基于國(guó)家確定了的漢語拼音和對(duì)漢字筆形分類的確定性條件下構(gòu)建的規(guī)范編碼,其中任何一個(gè)漢字也都具有規(guī)范確定的編碼,因而最大限度地減少了漢字編碼的模糊性和二義性。
本發(fā)明首次實(shí)現(xiàn)了漢字的計(jì)算機(jī)西文字符編碼與移動(dòng)通信數(shù)字化編碼在基本碼元和編碼規(guī)則上的統(tǒng)一,這種通用性有利于減少重復(fù)學(xué)習(xí),降低社會(huì)勞動(dòng)成本,有利于推動(dòng)漢字輸入技術(shù)在電子與通信技術(shù)領(lǐng)域的應(yīng)用和普及,有利于提高漢字的國(guó)際地位。
本發(fā)明的漢字?jǐn)?shù)字化編碼輸入技術(shù),可廣泛適應(yīng)社會(huì)上各種人員的需求,特別是其重碼率和單字的平均擊鍵次數(shù)等各項(xiàng)性能技術(shù)指標(biāo)均已超過現(xiàn)行的優(yōu)秀字符型編碼,實(shí)現(xiàn)了詞匯的無重碼輸入。
漢字?jǐn)?shù)字化輸入系統(tǒng)兼容了聲形輸入和形聲輸入兩種漢字錄入方式。由于字首成字偏旁和字末成字偏旁概念的引入,本發(fā)明兼有音碼輸入法的簡(jiǎn)便和形碼輸入法的快捷等優(yōu)點(diǎn),解決了拼音和聲形輸入法用鍵盤不能輸入不認(rèn)識(shí)的漢字的問題。
編碼規(guī)則特別簡(jiǎn)單,充分利用了人們已有的知識(shí)儲(chǔ)備,沒有特殊要求記憶的附加內(nèi)容。漢字字母編碼由于用聲母作首碼,與鍵盤的英文字母完全一致;聲母的數(shù)字化編碼中詞匯的聲母采用模糊輸入,極大地提高了詞匯的輸入速度,達(dá)到易學(xué)好用的目的;在漢字輸入過程中,使用者取碼的視線只需集中在漢字的首、尾及右上角固定位置的筆劃上,操作規(guī)范,不存在對(duì)漢字進(jìn)行部件拆分的問題,只要知道漢字的大概輪廓便可錄入,不必細(xì)究漢字的內(nèi)部筆劃,因此學(xué)習(xí)掌握特別容易。一個(gè)具有小學(xué)文化程度的人,已經(jīng)初步學(xué)習(xí)了漢語拼音和查字典的基礎(chǔ)知識(shí),只要了解一下漢字編碼的基本規(guī)則就可以使用鍵盤進(jìn)行漢字輸入,容易做到即學(xué)即用。
漢字?jǐn)?shù)字化輸入集成系統(tǒng)以詞匯輸入為主,單字輸入為輔。詞匯和整句錄入是提高漢字整體輸入速度的關(guān)鍵,詞匯的編碼以聲母的連續(xù)編碼為主,形碼為輔,先“聲”后“形”,形碼則先首碼而后尾碼,符合人們書寫的思維過程,詞的簡(jiǎn)碼只需連續(xù)鍵入兩個(gè)或兩個(gè)以上的聲母,省去形碼后,進(jìn)一步提高了詞匯的輸入速度,大多數(shù)的詞匯只需根據(jù)聲母就可以快速錄入,無須考慮該詞匯具體怎么寫,因而給人一種親切自然的感受。
漢字聲母的ZH、CH、SH和Z、C、S不分,適應(yīng)南方方言分不清卷舌音的特點(diǎn),更易于輸入漢字。
本發(fā)明可以軟件的形式制作成中、英文信息處理的漢字輸入系統(tǒng),安裝于UCDOS、以及WINDOWS3.X、WINDOWS9X、WINDOWS NT、WINDWOS2000 WINDOWS XP等各種計(jì)算機(jī)操作平臺(tái)上,為計(jì)算機(jī)提供多種簡(jiǎn)便、快捷的漢字輸入方式;本發(fā)明由于采用可分可合、模塊化的結(jié)構(gòu)方式,也可固化于只讀存儲(chǔ)器嵌入各種信息技術(shù)產(chǎn)品作為中英文信息處理的漢字輸入技術(shù),供掌上型移動(dòng)通信特別是手機(jī)和具有短消息發(fā)送功能的家庭電話機(jī)輸入漢字和英文信息以進(jìn)行中、英文信息的傳輸和交換。
權(quán)利要求
1.移動(dòng)通信信息處理的中、英文數(shù)字化輸入集成系統(tǒng),一種用數(shù)字鍵盤將漢字、數(shù)字、英文字母、希臘字母以及標(biāo)點(diǎn)符號(hào)輸入到某種電子信息技術(shù)產(chǎn)品特別是移動(dòng)通信設(shè)備以進(jìn)行中、英文信息處理和通訊的漢字?jǐn)?shù)字化規(guī)范編碼輸入技術(shù)。采用該技術(shù)的集成系統(tǒng)軟件和嵌入式芯片具有漢字?jǐn)?shù)字化編碼輸入功能及其擴(kuò)展功能。漢字的數(shù)字編碼由聲碼和形碼兩部分組成,其特征在于(1)所述聲碼部分為漢字漢語拼音的聲母或韻母的首字母,其聲母或韻母與數(shù)字鍵盤上的英文字母是一一對(duì)應(yīng)的。首字母經(jīng)數(shù)字化編碼后以數(shù)字形式鍵入,其編碼規(guī)則是以字母在鍵位上的排列順序確定其編碼,左數(shù)第一位字母以所在鍵位的數(shù)字為編碼;左數(shù)第二位字母以所在鍵位的兩位數(shù)字為編碼;左數(shù)第三位字母以所在鍵位的數(shù)字補(bǔ)零為編碼。編碼表如下字母 數(shù)字代碼 字母 數(shù)字代碼 字母 數(shù)字代碼S 1 Z 11A 2 B 22 C 20D 3 E 33 F 30G 4 H 44 I 40J 5 K 55 L 50M 6 N 66 O 60P 7 Q 77 R 70T 8 U 88 V 80W 9 X 99 Y 90(2)所述形碼部分的漢字字形編碼元素是經(jīng)數(shù)字化編碼后以數(shù)字形式鍵入。為確保編碼的規(guī)范性要求,其數(shù)字編碼與《新華字典》以及《辭?!穼?duì)漢字筆形的分類順序保持一致。形碼部分的基本字形編碼元素分為十種,分別用十個(gè)數(shù)字鍵表示并可將其標(biāo)示在數(shù)字鍵盤上。其編碼表如下1—一乚橫、右彎鉤 (含橫上鉤和斜右鉤)2—丨丿亅 豎、撇 (含豎左鉤)3—丶ㄟ點(diǎn)、捺4—乂ナ十 叉 (兩筆交叉)5—扌插 (一筆縱向穿兩筆或兩筆以上)6—口 方框 (四角整齊的方形)7— 乛角(一筆向下轉(zhuǎn)折或兩筆筆頭相接所形成的角形)8—八丷 八 (八字形和八字形的變形)9—小忄 小 (小字和小字的變形)0—亠 點(diǎn)下有一橫 (點(diǎn)與橫筆組成的復(fù)筆)(3)所述的形碼部分由漢字的首形碼、尾形碼和補(bǔ)形碼組成,它們與聲碼共同組成一個(gè)漢字的完整編碼。其概念的意義是首形碼指漢字左上角首筆劃所對(duì)應(yīng)的編碼。尾形碼指漢字右下角末筆劃所對(duì)應(yīng)的編碼。補(bǔ)形碼指漢字右上角最高的筆劃所對(duì)應(yīng)的編碼。
2.根據(jù)權(quán)利要求1所述的漢字?jǐn)?shù)字編碼有聲形輸入方式和形聲輸入方式兩種,二者相互兼容、共同存在,從而構(gòu)成多輸入方式的漢字?jǐn)?shù)字化編碼輸入集成系統(tǒng)。通過采用生僻字編碼末位補(bǔ)零的技術(shù)措施,將其劃定在在五位或六位的零編碼上,以避免對(duì)常用字、詞造成干擾。其漢字編碼流程的特征是(1)、單字的聲形輸入方式聲碼+首形碼+尾形碼+補(bǔ)形碼(2)單字的形聲輸入方式首形碼+尾形碼+補(bǔ)形碼+偏旁聲碼(若無偏旁聲碼則加零)(3)生僻字的聲形輸入方式聲碼+首形碼+尾形碼+補(bǔ)形碼+零(4)生僻字的形聲輸入方式首形碼+尾形碼+補(bǔ)形碼+偏旁聲碼+零(5)所述的偏旁聲碼是指組成該漢字的字首成字偏旁或字末成字偏旁的聲母編碼,其特征意義是a、所述“成字偏旁”是指組成該字的偏旁有明確的讀音、而且不需要修正筆形即可獨(dú)立作為漢字使用的偏旁。b、所述“字首成字偏旁”是由漢字首筆劃與其后續(xù)筆劃組成的最大成字偏旁。c、所述“字末成字偏旁”是由漢字末筆劃與其前續(xù)筆劃組成的最大成字偏旁。d、漢字偏旁的取碼按位置優(yōu)先取字末成字偏旁的聲碼,如沒有字末成字偏旁則改取字首成字偏旁的聲碼。e、沒有字首、字末成字偏旁的漢字,偏旁聲碼一律取數(shù)字“0”。(6)所述的生僻字編碼末位補(bǔ)零技術(shù)是一種對(duì)漢字編碼區(qū)分的定位技術(shù)。通過對(duì)生僻字統(tǒng)一補(bǔ)零或其它標(biāo)識(shí)符號(hào),使之與同形同類的常用漢字分開,不干擾常用字的輸入。凡國(guó)標(biāo)GB2312-80的一、二級(jí)字庫以外的漢字均作生僻字處理,其編碼的第五位或第六位均帶零標(biāo)記。
3.根據(jù)權(quán)利要求1所述漢字?jǐn)?shù)字化編碼輸入是通過功能識(shí)別符區(qū)分、引導(dǎo)數(shù)字、英文字母、標(biāo)點(diǎn)符號(hào)等字符編碼進(jìn)入相應(yīng)的模塊而完成特殊字符的輸入以及其它擴(kuò)展功能,并以此解決不同功能之間的干擾和重碼問題。其特征是功能引導(dǎo)識(shí)別符編碼 (共十一個(gè))00阿拉伯?dāng)?shù)字識(shí)別符000 大寫數(shù)字識(shí)別符01標(biāo)點(diǎn)符號(hào)識(shí)別符02特殊符號(hào)識(shí)別符03小寫英文字母識(shí)別符04大寫英文字母識(shí)別符05希臘字母識(shí)別符06自動(dòng)菜單選擇識(shí)別符07短信息點(diǎn)播識(shí)別符08我的文件包09電話查詢與自動(dòng)撥號(hào)識(shí)別符
4.根據(jù)權(quán)利要求3所述阿拉伯?dāng)?shù)字識(shí)別符“00”是冠于數(shù)字編碼之前用以引導(dǎo)、識(shí)別阿拉伯?dāng)?shù)字編碼的識(shí)別符,在數(shù)字識(shí)別符“00”之后所輸入的數(shù)字即為需要輸入的數(shù)字?!?00”是大寫數(shù)字識(shí)別符,其編碼特征如下表所示(1)數(shù)字編碼示例編碼阿拉伯?dāng)?shù)字編碼阿拉伯?dāng)?shù)字00 0 0055001 1 0066002 2 0077003 3 0088004 4 009900819819 008129 8129(2)大寫數(shù)字編碼大寫數(shù)字也可以在大寫數(shù)字引導(dǎo)識(shí)別符“000”后加大寫數(shù)字編碼輸入。大寫數(shù)字編碼示例編碼大寫數(shù)字 編碼 大寫數(shù)字000 零 0006 陸0001 壹 0007 柒0002 貳 0008 捌0003 叁 0009 玖0004 肆 00011 拾0005 伍 00012 百
5.根據(jù)權(quán)利要求3所述英文字母識(shí)別符“03”與“04”是冠于英文字母編碼之前用分別以引導(dǎo)、識(shí)別小寫英文字母編碼與大寫英文字母編碼的識(shí)別符,在英文字母識(shí)別符“03”與“04”之后輸入英文字母編碼即可輸入小寫、大寫英文字母。其編碼特征如下表所示(1)小寫英文字母編碼表編碼 英文字母編碼 英文字母編碼 英文字母031 s 0311 z032 a 0322 b 0320 c033 d 0333 e 0330 f034 g 0344 h 0340 i035 j 0355 k 0350 l036 m 0366 n 0360 o037 p 0377 q 0370 r038 t 0388 u 0380 v039 w 0399 x 0390 y(2)大寫英文字母編碼表編碼 英文字母 編碼 英文字母 編碼 英文字母041 S 0411 Z042 A 0422 B 0420 C043 D 0433 E 0430 F044 G 0444 H 0440 I045 J 0455 K 0450 L046 M 0466 N 0460 O047 P 0477 Q 0470 R048 T 0488 U 0480 V049 W 0499 X 0490 Y(3)所述的英文字母在純英文輸入法狀態(tài)下無需引導(dǎo)識(shí)別符即可以兩鍵輸入,此時(shí),英文字母的編碼以其所在鍵位的位置確定。其編碼表如下英文字母編碼表編碼 英文字母 編碼 英文字母編碼 英文字母1 S 11 Z2 A 22 B 20C3 D 33 E 30F4 G 44 H 40I5 J 55 K 50L6 M66N60O7 P77Q70R8 T88U80V9 W99X90Y注 表示確認(rèn)鍵。英文字母編碼是等長(zhǎng)的兩位編碼,可以連續(xù)輸入,系統(tǒng)按照偶位劃分規(guī)則,進(jìn)行兩兩識(shí)別,實(shí)現(xiàn)英文字母自動(dòng)上屏顯示。
6.根據(jù)權(quán)利要求3所述中、英文標(biāo)點(diǎn)符號(hào)識(shí)別符“01”是冠于標(biāo)點(diǎn)符號(hào)編碼之前用以引導(dǎo)、識(shí)別標(biāo)點(diǎn)符號(hào)編碼的識(shí)別符,在標(biāo)點(diǎn)符號(hào)識(shí)別符“01”之后輸入標(biāo)點(diǎn)符號(hào)編碼即可輸入標(biāo)點(diǎn)符號(hào)。中、英文標(biāo)點(diǎn)符號(hào)的編碼是按形碼的取碼規(guī)則對(duì)符形編碼,其特征在于(1)中英文標(biāo)點(diǎn)符號(hào)沒有聲碼,只需按形碼的編碼規(guī)則對(duì)要輸入的標(biāo)點(diǎn)符號(hào)取形碼即可。標(biāo)點(diǎn)符號(hào)取形碼有兩種情況當(dāng)符號(hào)為一個(gè)整體不能分割時(shí),取符號(hào)的首形碼、尾形碼和補(bǔ)形碼。即01+首形碼+尾形碼+補(bǔ)形碼(2)當(dāng)標(biāo)點(diǎn)符號(hào)是由多個(gè)獨(dú)立并分隔開的幾個(gè)部分組成時(shí),則分別按順序取組成該符號(hào)的各部分的首形碼。即01+首形碼1+首形碼2+首形碼3+首形碼4(3)中、英文常用標(biāo)點(diǎn)符號(hào)編碼特征示例0 .0154 £01 。
0155 $011 -01555 #0111—016 @01111 = 0167 ℃012 , 0162 %0122/01626 ‰0122 ‘0164 ♀01222 “017 ( )0123! 0171 ∑013 、 0173 ?0131÷0176 ♂0132; 01761 №0133 0177 <>01333 … 0177 <>014 +01777《》0141± 018 &0144× 0184 ¥015 * 0185
7.根據(jù)權(quán)利要求3所述的自動(dòng)菜單選擇功能是中英文數(shù)字化輸入集成系統(tǒng)具有的擴(kuò)展功能,其特征是在自動(dòng)菜單選擇功能符“06”加菜單名編碼的引導(dǎo)下,通過菜單的編碼建立與其對(duì)應(yīng)菜單(可執(zhí)行程序文件名)編碼的鏈接以實(shí)現(xiàn)所需要的功能。(1)根據(jù)鍵入的菜單編碼與數(shù)據(jù)庫中存儲(chǔ)的菜單(可執(zhí)行程序文件名)編碼相同的關(guān)系建立鏈接以實(shí)現(xiàn)所需要調(diào)用的功能。通過容易記憶的菜單編碼替代進(jìn)入層層疊疊的菜單項(xiàng)目去盲目地查找子菜單。(2)另建專用的自動(dòng)菜單選擇功能窗口界面,可取消引導(dǎo)識(shí)別符,直接鍵入所要調(diào)用菜單的六位數(shù)字編碼,可以擴(kuò)充應(yīng)用范圍、使用更為方便快捷。
8.根據(jù)權(quán)利要求3所述的電話號(hào)碼查詢與自動(dòng)撥號(hào)識(shí)別符“09”冠于被查詢?nèi)诵彰蛘邌挝幻Q編碼之前以引導(dǎo)、檢索其電話號(hào)碼并完成自動(dòng)撥號(hào)。在電話號(hào)碼查詢與自動(dòng)撥號(hào)識(shí)別符“09”之后輸入被查詢?nèi)诵彰蛘邌挝幻Q編碼即可查詢其電話號(hào)碼。其特征在于(1)根據(jù)輸入的姓名編碼與數(shù)據(jù)庫中存儲(chǔ)的姓名編碼相同的關(guān)系實(shí)現(xiàn)電話號(hào)碼查詢與自動(dòng)撥號(hào),從而以形象的被查詢?nèi)说男彰蛘邌挝幻Q替代抽象、冗長(zhǎng)且難于記憶的電話號(hào)碼。(2)另建專用的電話號(hào)碼查詢與自動(dòng)撥號(hào)的窗口界面,可取消引導(dǎo)識(shí)別符,直接輸入姓名的六位數(shù)字編碼,擴(kuò)充通訊號(hào)碼庫以適應(yīng)大用戶的需要。
9.詞匯的編碼方式分為聲形輸入、全形輸入兩種。聲形輸入方式的詞匯編碼按“聲母優(yōu)先、一聲一鍵、形碼后補(bǔ)”的模糊編碼原則。按順序鍵入詞匯中每個(gè)漢字的聲母,不足六個(gè)聲母的可繼續(xù)取形碼補(bǔ)足;詞匯的全形碼輸入方式是一種見字識(shí)碼的輸入方法,只需按規(guī)定的編碼流程鍵入詞匯的形碼,就可以正確的輸入不認(rèn)識(shí)或讀音不準(zhǔn)的詞語。其編碼規(guī)則根據(jù)不同的輸入方式和詞匯的字?jǐn)?shù)不同有以下十種編碼方法,其編碼流程的特征是(1)所述的模糊編碼,是特指在詞匯輸入時(shí),按順序鍵入詞匯中每個(gè)漢字聲母或韻母的編碼,對(duì)同一鍵位上三個(gè)不同的字母其編碼與第一位字母的編碼相同,不必依照輸入單字聲母和韻母時(shí)的規(guī)定要雙擊或補(bǔ)零,只需對(duì)每個(gè)聲母的所在鍵位按一次即可。(2)二字詞編碼a、聲形輸入方式首字聲碼+末字聲碼+首字首形碼+末字尾形碼+末字補(bǔ)形碼+首字尾形碼b、全形碼輸入方式首形碼1+尾形碼1+補(bǔ)形碼1+首形碼2+尾形碼2+補(bǔ)形碼2(3)三字詞編碼a、聲形輸入方式聲碼1+聲碼2+聲碼3+首字首形碼+末字尾形碼+末字補(bǔ)形碼b、全形碼輸入方式首形碼1+尾形碼1+首形碼2+尾形碼2+首形碼3+尾形碼3(4)四字詞編碼a、聲形輸入方式聲碼1+聲碼2+聲碼3+聲碼4+首字首形碼+末字尾形碼b、全形碼輸入方式首形碼1+尾形碼1+首形碼2+首形碼3+首形碼4+尾形碼4(5)五字詞編碼a、聲形輸入方式聲碼1+聲碼2+聲碼3+聲碼4+聲碼5+首字首形碼b、全形碼輸入方式首形碼1+首形碼2+首形碼3+首形碼4+首形碼5+尾形碼55、多字詞與整句編碼a、聲形輸入方式聲碼1+聲碼2+聲碼3+聲碼4+聲碼5+末字聲碼b、全形碼輸入方式首形碼1+首形碼2+首形碼3+首形碼4+首形碼5+末字首形碼
10.根據(jù)權(quán)利要求1所述的數(shù)字鍵盤是以數(shù)字形式對(duì)掌上型電腦等信息技術(shù)產(chǎn)品,特別是小型移動(dòng)通訊設(shè)備輸入數(shù)字化中英文信息的裝置。該裝置面板上安排有0-9的十個(gè)數(shù)字鍵,其中在1-9的九個(gè)數(shù)字鍵上分別標(biāo)示有A-Z的26個(gè)英文字母。其特征在于(1)所述的十個(gè)數(shù)字鍵分別以0、1、2、3、4、5、6、7、8、9的十個(gè)阿拉伯?dāng)?shù)字進(jìn)行標(biāo)識(shí)。(2)面板上1-9的九個(gè)數(shù)字鍵按照英文字母的順序標(biāo)示A-Z的26個(gè)英文字母。除鍵位1僅安排S、Z兩個(gè)字母外,其余8個(gè)鍵位均只有3個(gè)字母。其鍵位分配如下表1—SZ 4—GHI 7—PQR2—ABC 5—JKL 8—TUV3—DEF 6—MNO 9—WXY(3)數(shù)字“0”鍵除作為數(shù)字輸入外,亦可視作功能鍵,用以配合其它九個(gè)數(shù)字鍵識(shí)別所輸入的數(shù)碼信息。(4)根據(jù)特征(2)所述的鍵位分配表并結(jié)合數(shù)字“0”鍵,中英文數(shù)字鍵盤對(duì)26個(gè)英文字母位置順序的約定意義是以英文字母在鍵位上的位序提示并確定字母的編碼。即從左至右位于第一列的九個(gè)字母S、A、D、G、J、M、P、T、W分別以其所對(duì)應(yīng)的數(shù)字鍵1、2、3、4、5、6、7、8、9表示;從左至右位于第二列的九個(gè)字母Z、B、E、H、K、N、Q、U、X分別以其所對(duì)應(yīng)的數(shù)字鍵的兩位數(shù)字11、22、33、44、55、66、77、88、99表示,即連按字母所在鍵兩次;從左至右位于第三列的八個(gè)字母C、F、I、L、O、R、V、Y分別以20、30、40、50、60、70、80、90表示;即先按字母所在的數(shù)字鍵,接著再按數(shù)字“0”鍵。中英文數(shù)字鍵盤據(jù)此實(shí)現(xiàn)每一個(gè)英文字母只按兩鍵即可輸入。
全文摘要
本發(fā)明屬于漢字信息處理技術(shù)領(lǐng)域。是一種具有廣泛適應(yīng)性的移動(dòng)通信漢字?jǐn)?shù)字化輸入技術(shù)。該技術(shù)是以數(shù)字鍵盤上0-9的十個(gè)數(shù)字鍵將漢字、數(shù)字、英文字母、希臘字母以及各種中、英文標(biāo)點(diǎn)符號(hào)以編碼方式輸入到某種信息技術(shù)產(chǎn)品中的多功能數(shù)字化輸入技術(shù)。其不同于現(xiàn)有的漢字輸入方法,為人們提供了一個(gè)全方位,具有聲形、形聲、全形碼三種輸入方式相互兼容的集成漢字信息處理解決方案。其擴(kuò)展功能具有新穎,獨(dú)到的資料檢索、查詢與免撥號(hào)的漢字編碼自動(dòng)聯(lián)通用戶電話號(hào)碼的功能,進(jìn)而給人們提供一種可用于各種信息技術(shù)產(chǎn)品數(shù)字鍵盤的既規(guī)范、又簡(jiǎn)易便捷、能即學(xué)即用的中英文數(shù)字化編碼輸入技術(shù)。
文檔編號(hào)G06F3/023GK1356625SQ0114554
公開日2002年7月3日 申請(qǐng)日期2001年12月29日 優(yōu)先權(quán)日2001年12月29日
發(fā)明者劉君度, 劉冰彬, 陳昌英 申請(qǐng)人:劉君度, 劉冰彬, 陳昌英