專利名稱:易象碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種漢字輸入和檢索的方法,主要應(yīng)用于電信領(lǐng)域中的信息處理技術(shù)和字典印刷。
至今為止,漢字編碼已有上千種,在電腦上實施的也有幾十種。這些漢字編碼方案,可以分為形碼、音碼、音形碼、數(shù)字碼等四種類型,本方案屬于形碼、數(shù)字碼的范疇。
目前,應(yīng)用比較廣泛的漢字編碼有“五筆字型輸入法”、“倉頡碼”輸入法,這些編碼的缺點是字元需要機械背誦記憶,因此學習和掌握這些編碼是有一定難度的,同時這些編碼也是很難進行詞組擴充的。
現(xiàn)行用于漢字檢索的方法有“漢語拼音查字法”、“四角號碼查字法”、“部首查字法”等幾種?!皾h字拼音查字法”比較易學,但不懂得字的讀音就不能查字;“四角號碼查字法”查字速度快,但規(guī)則較多,不容易掌握,因而未被人們普遍接受;“部首查字法”簡單易學,但查字花費時間長,因而大大影響了查字速度。
現(xiàn)有的漢字編碼方案所存在的問題是“易學的打不快,打得快的不易學”,現(xiàn)有的查字方法所存在的問題也是“易學的查得慢,查得快的不易學”。本發(fā)明的目的,就是揚長避短,既要易學易記,又要輸入、查字速度快,使讀者在學習知識的同時又學到漢字輸入方法,使中華民族的傳統(tǒng)文化成地跨越漢字編碼這一障礙,使?jié)h字輸入象英文輸入一樣容易,使中華民族的光輝燦爛文化迅速走向世界。
發(fā)明原理本發(fā)明設(shè)計是根據(jù)中國古代易學文化的原理設(shè)計而成的,祖國易學文化認為,無極而太極,太極生兩儀,兩儀生四象,四象生八卦,八卦相互重疊而成六十四卦,同時三才(即天地人三才)、五行、六爻、河圖洛書等也是構(gòu)建易學文化的重要內(nèi)容。
達到本發(fā)明的目的方法是將漢字的字元劃分為太極字元和兩儀字元,將漢字的太極字元劃分為四象、五行、六爻、河圖等四大類,并依據(jù)四大類的太極字元的相交或相關(guān)特征推衍出四象、五行、六爻、河圖等四大類兩儀字元,將26個鍵位的鍵盤分成四象(WXEYA)、五行(GMSFT)、六爻(DIPZLN)、河圖(RHKCUJVBQO)四個區(qū),分別將四大類的太極字元和兩儀字元歸入對應(yīng)的四個區(qū)中,形成拼形組字、拼形組詞的漢字輸入法及輸入鍵盤。
太極字元是從漢字的字元中優(yōu)選出的最常用的部首字元、與26個英文字母特征相關(guān)的字元和與26個最常用字元即“大小日月口、金木水火土、點豎撇捺鉤折、一二三四五六七八九十”的特征相關(guān)的字元。兩儀字元是由太極字元派生而得。所謂相關(guān)特征,是指與太極字元的形、音、義、理等方面有聯(lián)系的特征。
下面,我們對上述四大類的太極字元和兩儀字元作進一步說明四象類用“口”象征“無極”,用“日”、“月”象征“太極”,用“大”、“小”、“日”、“月”象征四象,這五個字元分別分布在常用英文鍵盤W、X、E、Y、A,其中A(a)與“口”的形狀相似,W、X、E、Y分別取“大”、“小”、日”、“月”的諧音。
圖1中的W、X、E、Y、A是四象類的字元集。
五行類用“金”、“木”、“水”、“火”、“土”象征五行,這五個字元分別分布在常用英文鍵盤G、M、S、F、T,這五個字元分別取“金”、“木”、“水”、“火”、“土”的諧音,因而記憶十分方便。圖1中的G、M、S、F、T是五行類的字元集。
六爻類(亦稱筆畫類)用“點”、“豎”、“撇”、“折”、“鉤”、“捺”象征六爻,這六個字元分別分布在常用英文鍵盤D、I、P、N、L、Z,其中D、I、P三個字母分別取“點”、“豎”、“撇”的諧音,而N、L、Z三個字母分別取“折”、“鉤”、“捺”的近似形狀,圖2中的D、I、P、Z、N、L是六爻類的字元集。
河圖類(亦稱數(shù)字類)用“一”,“二”、“三”、“四”、“五”、“六”、“七”、“八”、“九”、“十”象征河圖數(shù),這十個字元分別分布在常用英文鍵盤R、H、K、C、U、J、V、B、Q、O鍵上,其中R、C、U分別取“一”、“四”、“五”的諧音,H、K、J、V、B、Q、O分別取“二”(2)、“三”(3)、“六”(6)、“七”(7)、“八”(8)、“九”(9)、“十”(0)的近似形狀,圖3、4中的R、H、K、C、U、J、V、B、Q、O是河圖類的字元集。
上述中,四大類的兩儀字元是由太極字元的相交或相關(guān)特征優(yōu)選推衍而得。如圖1、2、3、4字元中的橫線表示字元之間是分離的而不是相連的,圖中的等號后的編碼是字元簡碼,如字元“羽l-h-l-h=ll”中的等號后的ll為簡碼,橫線表示字元是分離的。
易象碼輸入法將漢字分為字首和字身兩部分來分別進行編碼,然后再將兩部分的編碼“合而為一”來共同構(gòu)成易象碼輸入法。下面我們對字首和字身這兩個定義以及結(jié)構(gòu)碼這一定義分別加以說明。
字首字首可以分為狹義字首和廣義字首。所謂狹義字首,就是指構(gòu)成每個漢字前面的相連筆畫結(jié)構(gòu),同時把一些常用的部首如“彳、馬、酉、巛、彡、羽、門、川、氣、貝、‘癸’的上部、‘祭’的上部、‘妥’的上部、骨、舟”視為狹義字首。所謂廣義字首,是指漢字的左邊或上邊或外邊的筆畫結(jié)構(gòu),這些筆畫結(jié)構(gòu)有可能是成字或相似字。在取碼過程中,狹義字首應(yīng)用較多,比較適合兒童和外國人學習,廣義字首應(yīng)用也不少,比較適合于中文程度較高的人們。
字首的定義可分以下幾種情況來分別加以說明(1)對于內(nèi)外結(jié)構(gòu)的字,其外部字形即為字首。如“國”的字首為“口”。(2)對于上下結(jié)構(gòu)的字,其最上方的相連筆畫或字形即為字首。如“照”的廣義字首為“昭”,“照”的狹義字首為“日”。(3)對于左右結(jié)構(gòu)的字,其最左邊的相連筆畫或字形即為字首。如“融”的廣義字首為“鬲”,“融”的狹義字首為“一”。(4)我們把筆畫相交連、無法分離的字稱為連體字。對于連體字,按書寫順序取其首筆畫所在字元作為字首。如“禾”的字首為“丿”。
分體字和分體字元我們把筆畫相分離的即由相互分離的字元構(gòu)成的字稱為分體字,這些存在于分體字中的相互分離的字元稱為分體字元。
尾元所謂尾元,是指分體字的最末分體字元。尾元屬于字身的范疇,通常漢字的尾元只有一個分體。如“明”字的尾元為“月”,“梅”字為尾元為“母”。
中元所謂中元,是指分體字除去字首和尾元后所剩下的中間分體字元。中元屬于字身的范疇,通常漢字的中元一般不會超過5個。如“景”字的中元為“亠”。
本發(fā)明設(shè)計規(guī)定每個漢字或詞組最多只能取四碼,不足四碼的,加按一次空格鍵,取碼時必須遵循本發(fā)明設(shè)計的取碼順序、拆分原則和取碼方法。
本發(fā)明設(shè)計取碼順序是先左后右,先高后低,先外后內(nèi),按順序取碼。
本發(fā)明設(shè)計對漢字的拆分原則是兼顧左右字元,大元優(yōu)先,分體字元優(yōu)先,最末字元優(yōu)先。
本發(fā)明設(shè)計的單字取碼方法是“連體字按順序取碼,只有一碼的重新按連體字的筆畫順序順取筆畫碼”及“分體字字首取一二碼,每個中元取首碼,尾元視首中取碼”。
“連體字按順序取碼,只有一碼的重新按連體字的筆畫順序順取筆畫碼(筆畫碼是指‘點豎撇捺鉤折’的最基本筆畫字元)”這句話的意思是指連體字的取碼方法是按照取碼規(guī)則依次順取一、二、三及尾碼,只有一碼的漢字則重新逆取該字的筆畫碼。如“禾”的編碼為pm,又如“日”的編碼為y(inr),其中(inr)為重取“日”字的筆畫碼。
“分體字字首取一二碼”這句話的意思是指如果分體字的狹義字首是太極字元,那么取該字首的一碼,如果分體字的狹義字首是兩儀字元,那么取該字首的首尾兩碼;分體字的廣義字首是取廣義字首的第一分體字元的首碼及最末分體的首碼。如“稱”的編碼為pmnx,其中pm為字首“禾”的首尾碼,又如“融”的編碼為rayn,其中r為字首“一”的首碼,再如“融”的編碼可以為rhn,其中rh為字首“鬲”的第一分體字元的首碼r和最末分體的首碼h。
“每個中元取首碼”這句話的意思是指不論每個中元有多少碼只取首碼。如“鍍”的編碼為gdbc,中元“廣”的編碼為df而只取首碼d。
“尾元視首中取碼”這句話的意思是指如果分體字的字首和中元的取碼總和為一碼或二碼或三碼時,那么分別取尾元的首碼、次碼、尾碼或首碼、尾碼或首碼。
容錯碼(1)字元容錯如“豐”字的編碼可以是IK,也可以容錯為KI。(2)字首容錯為了適合于中文程度較高的人們使用,本法的字首可以取狹義字首也可以廣義字首,這種容錯有利于人們快速輸入字。如“警”的編碼可以是byaa(取狹義字首),“警”的編碼也可以是bcja(取廣義字首)。
本發(fā)明設(shè)計的詞組取碼方法如下(1)連體字和分體字在詞組中的取碼方法是按順序取連體字的第一、二碼或按順序取分體字的字首首碼、第一中元首碼,當連體字只有一碼碼時,則重取一碼。
(2)二字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字的第二碼),再取第二分體字(或連體字)的字首首碼、第一中元首碼(或連體字的第二碼)。
(3)三字詞先取第一、二字的字首首碼,再取第三分體字(或連體字)的字首首碼、第一中元首碼(或連體字的第二碼)。
(4)四字詞取第一、二、三、四字的字首首碼。
(5)四字以上的詞取第一、二、三及最末字的字首首碼。
(6)詞組輸入在單詞狀態(tài)下進行,不必切換。
本發(fā)明設(shè)計的重碼處理方法發(fā)生重碼時,常用字、詞優(yōu)先在前,既可以選擇數(shù)字鍵選擇重碼字,又可以用英文字母選擇重碼字(因為本方法字元形象直觀且按分體取碼,故可以按字母選擇重碼字即第二次取碼)。
為了能夠在數(shù)字小鍵盤進行漢字輸入,本發(fā)明設(shè)計把所有字元的代碼轉(zhuǎn)化為十個數(shù)字,我們把這種用數(shù)字來表示字元的方法稱為“易象碼數(shù)字輸入法”。
“易象碼數(shù)字輸入法”無論單字或詞組最大碼長不得超過6碼,不足6碼的,加小數(shù)字鍵盤的“del”鍵或大鍵盤的“—”鍵結(jié)束。
“易象碼數(shù)字輸入法”的取碼規(guī)則、拆分規(guī)則、取碼方法與易象碼輸入法大致相同。圖5、6是易象碼數(shù)字輸入法的太極字元(又稱太極數(shù)字字元)和兩儀字元(又稱兩儀數(shù)字字元)的字元集。
易象碼數(shù)字輸入法的取碼方法是遵循“連體字按順序取碼,只有一碼的重新按連體字的筆畫順序順取筆畫碼(筆畫碼是指‘點豎撇捺鉤折’的最基本筆畫字元)”及“分體字字首取一二碼,每個中元取首碼,尾元視首中取碼”的取碼原則。
“連體字按順序取碼,只有一碼的重新按連體字的筆畫順序順取筆畫碼”這句話的意思是指連體字的取碼方法是按照筆畫順序依次取一、二、三、四、五及尾碼,只有一碼的重新順取筆畫碼。
“分體字字首取一二碼”這句話的意思是指如果分體字的字首是太極字元,那么字首取一碼,如果字首是兩儀字元,那么字首取首尾二碼。
“每個中元取首碼”這句話的意思是指不論每個中元有多少碼都是只取首碼。
“尾元視首中取碼”這句話的意思是指如果字首和中元的取碼總和為一碼或二碼或三碼或四碼或五碼,那么尾元分別取五碼或四碼或三碼或二碼或一碼。
易象碼數(shù)字輸入法的詞組取碼方法如下(1)分體字在詞組中的取碼方法按順序取分體字的字首首碼、第一中元首碼、第二中元首碼,如果分體字沒有第二中元首碼的則順取第一中元次碼,如果分體字沒有第一中元次碼的,則取該字全碼。
(2)連體字在詞組中的取碼方法是按順序取連體字的一碼或兩碼或三碼,當連體字只有一碼時,則重新取該字兩碼。
(3)二字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)、第二中元首碼(或連體字第三碼),再取第二分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)、第二中元首碼(或連體字第三碼)。
(4)三字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),再取第二分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),然后取第三分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)。
(5)四字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),再取第二、三字的字首首碼,然后取第四分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)。
(7)四字以上的詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),再取第二、三、四、五字或最末字的字首首碼。
(8)詞組輸入在單詞狀態(tài)下進行,不必切換。
易象碼數(shù)字輸入法的重碼處理方法及容錯處理與易象碼輸入法大致相同。
本發(fā)明提出的字元體系及其輸入鍵盤對于繁體字同樣適用,這時只須把簡化字元一律改換成對應(yīng)的繁體字元,即可形成一個能夠處理繁體漢字的輸入法和鍵盤設(shè)計。
本發(fā)明的優(yōu)點是易學易記,力求做到見字識碼,見碼識字,輸入速度快,同時又能應(yīng)用于漢字輸入和字典檢索,因而有著廣泛的用途和發(fā)展前景。
以上說明了本發(fā)明的一個具體實施方案,必須指出,本發(fā)明不僅僅限于上述的方案,在本領(lǐng)域的技術(shù)人員根據(jù)本發(fā)明的構(gòu)思,可以做出不脫離本發(fā)明本質(zhì)的多種變形方案,因此本發(fā)明的提出為編碼技術(shù)提供了研究基礎(chǔ)的開發(fā)前景。
權(quán)利要求
1.一種易象碼輸入法及其輸入鍵盤,其特征是將漢字的字元劃分為太極字元和兩儀字元,將漢字的太極字元劃分為四象、五行、六爻、河圖等四大類,并依據(jù)四大類的太極字元的相交或相關(guān)特征推衍出四象、五行、六爻、河圖等四大類兩儀字元,將26個鍵位的鍵盤分成四象(WXEYA)、五行(GMSFT)、六爻(DIPZLN)、河圖(RHKCUJVBQO)四個區(qū),分別將四大類的太極字元和兩儀字元歸入對應(yīng)的四個區(qū)中,形成拼形組字、拼形組詞的漢字輸入法及輸入鍵盤。
2.一種易象碼數(shù)字輸入法,其特征是將一(橫、豎)、二、三、四、五、六(點)、七(鉤)、八(捺)、九(撇)、十和1、2、3、4、5、6、7、8、9、0作為太極數(shù)字字元,并依據(jù)太極數(shù)字字元的相交或相關(guān)特征推衍出兩儀數(shù)字字元,分別將太極數(shù)字字元和兩儀數(shù)字字元歸入對應(yīng)的數(shù)字鍵中,形成數(shù)字組字、數(shù)字組詞的漢字數(shù)字輸入法。
3.如權(quán)利要求書1所述,太極字元是從漢字中優(yōu)選出的最常用的部首字元、與26個英文字母的特征相關(guān)的字元以及與26個最常用字元即“大小日月口、金木水火土、點豎撇捺鉤折、一二三四五六七八九十”的特征相關(guān)的字元。
4.如權(quán)利要求書1所述,漢字輸入方法包括(1)單字輸入(A)若單字是連體字,依次取連體字一、二、三及尾碼,若連體字只有一碼時則重新按順序順取連體字的筆畫碼。(B)若單字是分體字,則其取碼方法是字首取一碼或二碼,每個中元取首碼,尾元的取碼視字首碼、中元碼之和而確定,字首、中元、尾元取碼碼長為四碼,不足四碼的加空格鍵結(jié)束。(2)詞組輸入(A)連體字和分體字在詞組中的取碼方法是按順序取分體字的字首首碼、第一中元首碼或按順序取連體字的兩碼,當連體字只有一碼時,則可以重取該碼一次。(B)二字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字的第二碼),再取第二分體字(或連體字)的字首首碼、第一中元首碼(或連體字的第二碼)。(C)三字詞先取第一、二字的字首首碼,再取第三分體字(或連體字)的字首首碼、第一中元首碼(或連體字的第二碼)。(D)四字詞取第一、二、三、四字的字首首碼。(E)四字以上的詞取第一、二、三及最末字的字首首碼。
5.如權(quán)利要求書2所述,漢字輸入方法包括(1)單字輸入(A)若單字是連體字,依次取連體字一、二、三、四、五及尾碼,若連體字只有一碼時則重新按順序順取連體字的筆畫碼。(B)若單字是分體字,則分體字的取碼方法是字首取一碼或二碼,每個中元取首碼,尾元的取碼視字首碼、中元碼之和而確定,字首、中元、尾元取碼碼長為六碼,不足六碼的加小數(shù)字鍵盤的“del”鍵或大鍵盤的“—”鍵結(jié)束。(2)詞組輸入(A)分體字在詞組中的取碼方法按順序取分體字的字首首碼、第一中元首碼、第二中元首碼,如果分體字沒有第二中元首碼的,則順取該分體字第一中元次碼。(B)連體字在詞組中的取碼方法是按順序取連體字兩碼或三碼,當連體字只有一碼時,則可以重取該碼一次或兩次。(C)二字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)、第二中元首碼(或連體字第三碼),再取第二分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)、第二中元首碼(或連體字第三碼)。(D)三字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),再取第二分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),然后取第三分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)。(E)四字詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),再取第二、三字的字首首碼,然后取第四分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼)。(F)四字以上的詞先取第一分體字(或連體字)的字首首碼、第一中元首碼(或連體字第二碼),再取第二、三、四、五字或最末字的字首首碼。
全文摘要
一種易象碼輸入法和一種易象碼數(shù)字輸入法,是將漢字的字元劃分為太極字元和兩儀字元,這種方法易學易記,輸入速度快,取碼方法獨特,做到見字識碼,見碼識字,因而適合廣大兒童和外國人學習中文。并能應(yīng)用于漢字字典檢索,因而有著廣泛的用途和發(fā)展前景。
文檔編號G06F3/023GK1258878SQ0010132
公開日2000年7月5日 申請日期2000年1月6日 優(yōu)先權(quán)日2000年1月6日
發(fā)明者黃景明 申請人:黃景明