專利名稱:一種漢字信息處理對稱碼字序方法
技術(shù)領(lǐng)域:
本發(fā)明是涉及漢字輸入終端的計算機、手機的漢字輸入問題及各種漢字的工具書的字序 問題。
技術(shù)背景目前在公安部門、戶籍管理、金融機構(gòu)、衛(wèi)生部門、郵政機構(gòu)、工商管理機構(gòu)、保險機 構(gòu)、交通部門、圖書館等單位,工作中即使其中文字庫已經(jīng)升級到GB18030-2000年版的標準, 含漢字27484個,仍然會因各種人名、地名所出現(xiàn)的生僻字遭遇尷尬。如果要進一步升級到 GB18030-2005年版,含漢字70195個,而新的矛盾又出現(xiàn)了,采用哪種漢字輸入法又成了新的 問題。對于要在含70195個漢字的計算機字庫去査找其中的任何一個漢字,無論是使用拼音 輸入法,還是筆畫輸入法,其方法固然簡單,但是其漢字的重碼率極高,常常要在數(shù)百個重碼漢 字中進行査找;如果要使用形碼輸入法進行漢字輸入,那就需要記憶上百個部件或字根,該輸 入方法也很難讓使用者接受。而恰恰我們獨辟蹊徑的發(fā)明的對稱碼字序法,比單純地使用漢 語拼音或筆畫輸入法可大大減少重碼率,其漢字的輸入速度也會有極大的提高。另外,在各類 詞典、字典、辭典等,以及圖書資料的索引,漢字信息的處理等都離不開對于利用漢字的字 序去査找所有找的漢字。目前在漢字的字序方面有三種"義序法"、"音序法"和"形序法"。 而其中"形序法"中的"部首法"、"筆畫法"在當前各類漢字的工具書中又最常使用。目前, 無論是"部首法"。還是"筆畫法"的漢字排檢法都存在著一些不盡人意的弊端,例如至今 "部首法"仍然是我們當前各種漢字工具書(包括各種辭書、詞典、辭典等)的主要査找漢字 的方法。即便如此,相當多的辭書、詞典、辭典等仍然有一部分漢字在確定部首的問題上不 能統(tǒng)一,存在分歧,致使許多工具書在檢字表的后面必須加以"難檢字的筆畫索引",為使用 人員在查閱漢字時增添了極大的困難。 發(fā)明內(nèi)容鑒于上述,本發(fā)明的目的是提供一種漢字信息處理對稱碼字序法,使人們在各類漢字信 息處理終端的設(shè)備中以及各類辭書和詞典中更方便、快捷的查找到所需求的漢字,它具有簡 單、易學、快捷的特點。本發(fā)明的目的是通過以下技術(shù)方案得以實現(xiàn)無論是在漢字信息終端中、手機中還是在各類辭書和字典中査找漢字,首先依據(jù)我們在 權(quán)利要求書2中所述,先確定所要查找的漢字的具體類別。如果是在計算機或著手機中進行 査找,那么就要先通過在數(shù)字鍵所設(shè)定的類別鍵,再通過計算機中的漢語拼音鍵或者是手機 中的數(shù)字鍵中的漢語拼音鍵或筆畫鍵來進一査找和確定。如果是査找辭書或字典中的漢字, 也需要先確定該漢字的具體類別,為了方便,可以將辭書或字典中的十個類別數(shù)字與手機中 的十個類別數(shù)字相同。而后再通過該漢字的前兩筆畫和最后兩筆畫,或者是前三筆畫和最后 一筆畫進一步確定該漢字在辭書或字典中的具體頁碼。所述漢字對稱類別分為中心結(jié)構(gòu)對稱類(簡稱"中心對")、結(jié)構(gòu)包圍類(簡稱"包圍")、 結(jié)構(gòu)雜獨類(簡稱"獨體")、上下型結(jié)構(gòu)上部件自身對稱類(簡稱"上對")、上下型結(jié)構(gòu)下 部件自身對稱類(簡稱"下對")、上下型結(jié)構(gòu)上下部件自身非對稱類(簡稱"上下非")、左 右型結(jié)構(gòu)左右部件自身對稱類'(簡稱"左右對")、左右型結(jié)構(gòu)左右部件非自身對稱類(簡稱 "左右非")、左右型結(jié)構(gòu)左部件自身對稱類(簡稱"左對")、左右型結(jié)構(gòu)右部件自身對稱類 (簡稱"右對")共十類。所述漢字的筆畫定義為"橫、豎、撇、點、折"五種。如將該五種筆畫定義在計算機或者是手機的數(shù)字鍵中,依據(jù)"1, 2, 3, 4, 5,"的順序排列為"1 (橫)、2 (豎)、3 (撇)、4 (點)、5 (折)"。如在手機鍵盤上的數(shù)字鍵設(shè)定漢語拼音字母,貝IJ:數(shù)字鍵2設(shè)定abc,數(shù)字 鍵3設(shè)定def,數(shù)字鍵4設(shè)定ghi,數(shù)字鍵5設(shè)定jkl,數(shù)字鍵6設(shè)定mno,數(shù)字鍵7設(shè)定pqrs, 數(shù)字鍵8設(shè)定tuv,數(shù)字鍵9設(shè)定wxyz。本發(fā)明對稱碼字序法的優(yōu)點是1. 只要掌握漢字的對稱碼分類和讀音,就可以將該漢字輸入;2. 該輸入方法簡單、易學,不需要記憶漢字大量的部首和字根等;3. 由于對稱碼字序法是在輸入漢語拼音之前,先將所輸漢字進行了分類,所以比直接進 行漢語拼音輸入漢字的方法速度快,重碼率低;尤其是應(yīng)用在手機中時,省去了人們翻頁査找 漢字的繁瑣過程;4. 根據(jù)漢字的對稱性和非對稱特征,將漢字分成十類的方法符合人們認識和理解漢字的 習慣,簡單,易掌握。尤其是在通過計算機查找超大規(guī)模(GB18030-2005)漢字字庫的漢字 時,本發(fā)明的優(yōu)勢更是突出;5. 由于對稱碼字序法不需要人們記憶數(shù)以百計的偏旁、部首,省去了人們?nèi)缭谵o書或字 典中先査部首目錄,再査檢部首頁碼。相對比較,本發(fā)明的對稱碼字序法尤其是在辭書或字 典等漢字工具書的使用上,更是突顯簡單、快捷。所以,對于擁有全世界四分之一人口的中 國人來說。在使用漢字進行學習、生活、工作和交流等時間中,將會節(jié)省大量的寶貴的時問, 無疑是一件好事、是一件舉足輕重的大事。傳統(tǒng)的漢字部首檢索漢字的方法總是有數(shù)百個漢 字不容易確定部首,于是在檢字表的后面都會增加"難檢字筆畫索引"等。而本發(fā)明解決了 査找"難檢字"的問題。使用本發(fā)明的詞典、辭典和字典等工具書查找任何漢字都不存在"難 檢字"。下面結(jié)合具體實例對本發(fā)明作出詳細說明 一.對漢字分類漢字是一種以方框型結(jié)構(gòu)為基礎(chǔ)的文字。從具體結(jié)構(gòu)上分析,漢字大致可以分成左右型 (左中右型歸左右型)、上下型(上中下型歸上下型)、雜體型(獨體型歸雜體型)和包圍型(二包圍、 三包圍和四包圍一律歸包圍型)。根據(jù)漢字結(jié)構(gòu)形狀的對稱性和非對稱性的特點,本發(fā)明將漢 字分成以下十類1中心對稱類(簡稱"中心類"),此類漢字是以假設(shè)中心線為該漢字的豎軸, 左右部分、上下部分對稱或相等。如京、王、口、.田、天、人、大、小、非、并、合、關(guān)、光、木、呆、平、 日、干、土、北、比、羽、常、黨、見、豐、川、出、克、殼、高、苗、苦、曼等。本發(fā)明對于一些個別的對稱性的規(guī)則加以特殊的規(guī)定。即,將"鄉(xiāng)'、"心"、 "火"、 "水"、"女"、"十"、"尤"、"月"、"門"、"白"、"臼"、"大"、"小"、 "人"、"八"、"幾"、"九"、"不"、"兒"、"禾"、"舟"、"母"、"竹"、 "穴"、"一"、"于"、"手"、"氺"、"爪"等規(guī)定為對稱偏旁。根據(jù)本發(fā)明的規(guī)定,下列字也屬于中心對稱類,如黑、杰、芯、熒、安、案、悲、悉、 恩、志、禿、萎、泉、'兜、寒、黍、宄、巢、黨、堂、霄等。根據(jù)"品"和"呂"字型的中心對稱性的特點,下列漢字也屬于中心對稱類。 如焱、爽、犇、淼、.森、眾、壘、矗、鑫、龜、毳、曼、多、哥、昌等。下列較為特殊的漢字也屬于中心對稱字,如冀、翌、巽、翠、疊、州、粥、弼、蠢、 昆等。2包圍類,該類漢字包括兩包圍,三包圍和四包圍類。兩面包圍類此類漢字包括以廠、廣、尸、戶、產(chǎn)、弋、毛、走、氣、廣、i_、 勺等為偏旁的漢字。如下列各字歷、厄、疚、病、局、屆、貳、式、氈、毯、魁、魅、魎、氧、 氖、遲、遷、還、近、莊、慶、延、廷、處、危、詹、趙、趁、趕、翹、左、勻、 句、旬、虜、虛、虎、M、擅、尬、爬、瓞、颶、甩、匙、題、勉、裁、等。三面包圍類此類漢字包括風等為偏旁的漢字。如下列各字區(qū)、E、匠,醫(yī)、函、巨、夙、閣、匹、閥等。 四面包圍類此類漢字包括以口為偏旁。如下列各字國、圈、圈、囹、圈、圖、團、園、囝、圄、圈、囤、困等。 3雜獨類此類漢字大多數(shù)以單一的部件為一個漢字,而且以該漢字的自身部 件假設(shè)中心線為豎軸或是橫軸,其左右部分或上下部分均為不對稱或為不相同。如萬、世、子、之、久、丘、止、才、長、乍、丐、歹、也、弓、鄉(xiāng)、幺等。4上下型結(jié)構(gòu),假設(shè)中心線為其上部件豎軸成橫軸,其上部件自身對稱或相同, 此類漢字稱"上部件自身對稱類"(簡稱"上對")。如亨、羨、著、巷、季、奪、爸、斧、裳、牽、楚、毫、豪、瞿、奇、纂、 輩、衷、岑等。5上下型結(jié)構(gòu),假設(shè)中心線為其下部件豎軸或橫軸,其下部件自身對稱或相同, 此類漢字稱"下部件自身對稱類"(簡稱"下對")。如華、架、督、岔、泵、壁、費、堅、獎、鑒、謦、警、監(jiān)、龔、齒、 灸、貨、盞、盟、告、岳、晝、柒、墾、靈、留、型、帚等。6上下型結(jié)構(gòu),假設(shè)中心線為其上部件或下部件豎軸或橫軸,其上下部件自身 都不對稱或不相同,此類漢字稱"上下部件自身非對稱類"(簡稱"上下非")。如駕、裂、襲、務(wù)、象、龜、劈、努、尋、導(dǎo)、璽、舞、弩、蛋、甓、巹、鴛、 饕、鶩、鶩、鴛等。7左右型結(jié)構(gòu),假設(shè)中心線為其左部件豎軸或橫軸,其左部件自身對稱或相同, 此類漢字稱"左部件自身對稱類"(簡稱"左對")。如封、鴨、雞、就、玲、羚、財、畸、極、瞳、哨、岣、略、吵、堵、朽、靶、 欲、域、暢、脆、脂、的、稚、秩、稽、鵬、舒、斜、爐、炬、忙、慌、妒、她等。8左右型結(jié)構(gòu),假設(shè)中心線為其右部件豎軸或橫軸,其右部件自身對稱或相同, 此類漢字稱"右部件自身對稱類"(簡稱"右對")。如力口、陪、隊、群、趴、牡、陌、蝻、蚌、蟬、硅、鮭、鮮、往、德、餅、較、 矯、餃、貓、猜、貓、借、值、針、鋅、段、活、結(jié)、沽、縝、駐、級、維、驪等。9左右型結(jié)構(gòu),假設(shè)中心線為其左部件和右部件豎軸或橫軸。其左部件或其右 部件自身對稱或相同,此類漢字稱"左右部件自身對稱類"(簡稱"左右對")。如辭、股、鼓、姑、.胡、豁、項、相、槽、栓、橋,樟、鞋、杉、燎、桔、熔、燈、 爛、坪、墳,理、峽、幟、穆、稅、程,船、艄、毀、翱、娃、奸、婷、姐、妹、如、情、 晴、憎、惜、酥、朔、股、膳、胖、姆、媲、姍、貯、賠等。IO左右型結(jié)構(gòu),假設(shè)中心線為其左部件和右部件豎軸或橫軸,其左部件和其右 部件均不自身對稱或不相同,此類漢字稱"左右部件自身非對稱類"(簡稱"左右非")。 如練、距、.歐、輪、跪、洗、錫、蹊、件、催、館、換、緩、幻、駿、郡、皸、 強、搶、孩、駭、騎、繞、緩、終、孤、既、張、飯、防、弘、匯、揮、詣、讓、指、殘、 解、鴉、戰(zhàn)、飾等。分類注意事項l若某漢字屬于上中下型,而其中上下部分部件都屬于自身對稱或相同,只有中 同部分的部件不對稱或相同,那么該漢字屬于"上對類"。如蒸、蔥、憲、器、晷、 藍、罩等。2若某漢字屬于左中右型,而其中左右部分部件或左中右部件都屬于自身對稱或 相同,那么該漢字屬于"左右對"。如糊、瑚、煳、等。 另外,其中"辯、辮、瓣、掰"因為其結(jié)構(gòu)中的中問部件都不屬于自身對稱部件,所以這些 字均屬于"左對類"。而"斑、粥、弼、搿、",各字其結(jié)構(gòu)中的中間部件部件都屬于自身對稱 部件,所以這些字均屬于"中心類"(既"中心對稱類")。
權(quán)利要求
1. 一種可以應(yīng)用于戶籍管理、人事檔案、金融、保險、醫(yī)療、民航、交通等進行終端漢字處理的計算機中、或者是應(yīng)用數(shù)字鍵進行漢字輸入的手機中等,同時也可以在各種辭書、詞典和字典的漢字檢索中使用的漢字信息處理對稱碼字序方法,其特征在于該對稱碼字序法是根據(jù)漢字結(jié)構(gòu)的對稱性和非對稱性規(guī)律而建立的漢字字序方法。根據(jù)漢字結(jié)構(gòu)的對稱性和非對稱性,無論是計算機、手機、稅控發(fā)票機、字典、辭典等工具書中所包含的漢字,都可以利用漢字結(jié)構(gòu)本身的對稱性和非對稱性規(guī)律被分成十類。在確定了要處理的漢字屬于哪一類的漢字之后,再去通過該漢字的漢語拼音、或者是筆畫順序去查找該漢字。
2. 如權(quán)利要求l所述的漢字對稱碼字序方法,其特征在于所述漢字對稱類別分為中心結(jié)構(gòu)對稱類(簡稱"中心對")、結(jié)構(gòu)包圍類(簡稱"包圍")、 結(jié)構(gòu)雜獨類(簡稱"獨體")、上下型結(jié)構(gòu)上部件自身對稱類(簡稱"上對")、上下型結(jié)構(gòu)下 部件自身對稱類(簡稱"下對")、上下型結(jié)構(gòu)上下部件自身非對稱類(簡稱"上下非")、左 右型結(jié)構(gòu)左右部件自身對稱類(簡稱"左右對")、左右型結(jié)構(gòu)左右部件非自身對稱類(簡稱"左右非")、左右型結(jié)構(gòu)左部件自身對稱類(簡稱"左對")、左右型結(jié)構(gòu)右部件自身對稱類(簡稱"右對")共十類。
3. —種使用權(quán)利要求1所述漢字信息處理對稱碼字序法,其特征在于包括以下步驟 先按照漢字結(jié)構(gòu)對稱分類方法,確定所要查找的漢字的類別。如果是在計算機或者是手機中可以將十類漢字分別設(shè)定在十個數(shù)字鍵上,輸入確定后的 分類鍵后,再輸入該漢字的漢語拼音或者是筆畫,即可得到該漢字。如果是在各種漢語的工 具書中使用本方法,可以在確定分類后的漢字中再通過該漢字的前兩筆畫和后兩筆畫;或者 是前三筆畫,最后一筆畫均可以查找到該漢字的具體位置。
全文摘要
本發(fā)明公開了一種根據(jù)漢字結(jié)構(gòu)的對稱性和非對稱性規(guī)律,而建立的一種漢字信息處理對稱碼字序方法。根據(jù)漢字結(jié)構(gòu)對稱性和非對稱性規(guī)律,所有的漢字都可以被包容在這十類中獨體、包圍、上對稱、下對稱、上下非對稱、左對稱、右對稱、左右對稱、左右非對稱、中心對稱。該漢字對稱碼定序法可以解決戶籍管理、人事檔案、金融、保險、醫(yī)療、民航、交通等進行終端漢字處理的計算機的快速漢字輸入、或者是應(yīng)用數(shù)字鍵進行漢字輸入的手機中等,同時也可以應(yīng)用于各種辭書、字典進行的漢字快速檢索。使用該漢字定序法的步驟是先按漢字結(jié)構(gòu)對稱分類法確定該漢字的類別,然后通過定義該漢字的筆畫或拼音確定該漢字的具體位置。
文檔編號H04M1/23GK101266524SQ200810105490
公開日2008年9月17日 申請日期2008年4月29日 優(yōu)先權(quán)日2008年4月29日
發(fā)明者穎 王, 王子善, 王淑蘭 申請人:北京善廬漢字對稱碼應(yīng)用技術(shù)開發(fā)有限公司