專利名稱:漢字簡易筆劃檢索方法
技術領域:
本發(fā)明涉及一種漢字檢索方法,尤其是涉及一種以漢字圖形特征為線索的漢字檢 索方法。
背景技術:
漢字屬于語言學的范疇,每個漢字都包含三方面語言學信息,S卩形、音、意。漢字 檢索方法是人們?yōu)椴檎覞h字而使用的方法,已發(fā)明的漢字檢索方法很多,大致可以分為三 類(1)以漢字圖形信息為線索的檢索方法和(2)以漢字發(fā)音信息為線索的檢索方法,還 有(3)以漢字圖形和發(fā)音信息為線索的檢索方法。漢字檢索方法的應用領域目前主要有漢 語辭書和電腦漢字處理,用戶以中國人為主,外國人也不少,并且正在不斷增加。目前在漢 字檢索方法上所面臨的挑戰(zhàn)主要來自于應用領域,例如易學好用、適合快速輸入的漢字編 碼,以及一種既可以用作漢語辭書的漢字索引又能夠用于電腦的漢字檢索方法。目前尚無 一種全能的漢字檢索方法能夠完美地解決所有應用領域中的所有問題。因此,根據(jù)具體應 用領域的特定條件和用戶的特殊需求開發(fā)一個適用性和使用性俱佳,并且有進一步發(fā)展可 行性的漢字檢索方法也不失為一個有效的策略。近年來,在來全球性的“漢語熱”中學習漢語的外國人越來越多,遇到生字查辭 典是最基本的和必要的學習手段之一。然而,對于大多數(shù)學習漢語的外國人來說,在查漢 語_外語辭典時如何確定漢字的偏旁部首和筆畫是一個難題,因為他們很難掌握按照漢字 的造字屬性所形成的大約兩百個偏旁部首,以及根據(jù)毛筆書寫漢字所習慣俗成的大約三十 種筆畫,而當今廣泛流行于世的漢語-外語辭典卻普遍地使用偏旁部首和筆畫作為漢字檢 索的第一級索引。其實不僅是外國人對此為難,即便是地道的中國人對于偏旁部首和筆畫 也未必都能輕而易舉,例如對于“前”、“電”等常用漢字應該查漢語辭典中哪個偏旁部首? 漢字究竟有多少個偏旁部首?有多少種筆畫?許多這類基本問題多數(shù)中國人一時也講不 清,那么又如何能有效地使用偏旁部首和筆畫去檢索漢字呢?而作為漢語辭典(包括電子 辭書)能否提供一種簡易的方法,使中外用戶都可以容易地檢索漢字呢?本發(fā)明之目的就是創(chuàng)造一個徹底脫離漢字偏旁部首和復雜筆畫、使中國人和外國 人都簡便易行的、并且可以既適用于印刷品的靜態(tài)索引又適用于電腦的動態(tài)搜索的漢字檢 索方法。
發(fā)明內容
本發(fā)明包括以下四個內容(1)六種簡易筆劃、(2)三條筆劃規(guī)則、(3)九個圖形特 征、(4)兩項應用成果。六種簡易筆劃用“橫”、“豎”、“撇”、“捺”、“點”和“彎”這六種簡易筆劃描述漢字的所有筆畫。前
五種筆劃是漢字固有的單一筆畫,本發(fā)明在此基礎上分別將它們的代表性延伸到其它筆畫 中相近的部分;并且定義了一個新筆劃——“彎”,用來代表前五種筆劃不能合理表示的筆畫部分。這樣,用這組六種簡易筆劃可以完全替代漢字所有的傳統(tǒng)筆畫,使?jié)h字筆畫中有折 點的復合筆畫分解成多個無折點的簡易筆劃。具體地歸納說明如下
(表 1)簡而言之就是去“折”,把復雜多變的筆畫簡化成簡便易行的筆劃。此舉大大地降 低了漢字筆劃的復雜性,使之可以容易地為中外人士所掌握和使用,同時還可以有效地避 免由于用戶在漢字筆畫知識水平上的差異而導致漢字筆畫計算上可能發(fā)生的錯誤。三條筆劃規(guī)則以下三條規(guī)則精辟地闡述了在使用本發(fā)明進行漢字檢索中的操作規(guī)范和原則,并 且以每條規(guī)則一句話、每句六個字,總共用十八個字來詮釋本發(fā)明的精髓,同時也容易為人 們所掌握和使用。 遇折點算一筆。為了容易地計算筆劃數(shù),本發(fā)明把一個有折點的復合筆畫分解成 多個無折點的簡易筆劃來統(tǒng)計其筆劃數(shù),此規(guī)則其實是對六種簡易筆劃的高度概括和實際 操作指南。典型實例如下漢字乙口隊
老筆畫 1
3
4
新筆劃 4 4 7
字
漢么與倉
老筆畫 3
3
4
新筆劃 4 6 8
4
紅68這79·先左邊后上邊。為了檢索更有效,本發(fā)明取漢字最左邊的筆劃為第一筆,如果該 字筆劃有兩筆或兩筆以上再取最上邊的筆劃為第二筆,用以對相同總筆劃數(shù)的不同漢字進 行分組。典型實例如下
漢字
讓 止 江 川
第橫橫橫點撇
-筆
第: 橫
占
IJS 、
占
IJS 、筆
第 橫 撇
IJS 、
橫 橫
-筆只計一次。為了取得盡可能多的不同圖形特征和避免同一筆劃被重復統(tǒng)計, 本發(fā)明對于那些最左邊和最上邊為同一筆劃的漢字采取這條規(guī)則,同時根據(jù)上述兩條規(guī)則 選取下一個合格的筆劃作為最上筆劃。典型實例如下
字
漢口和怕紅又
第豎橫點撇撇
-筆筆
漢字 卜
乙 么
第-
IJS 、
橫 撇
-筆
第點撇撇筆
字
漢下氣人
第橫撇撇
-筆
第:
IM 、
橫筆
九個圖形特征
所謂九個圖形特征是指構成漢字圖形的筆劃信息,它們是總筆劃數(shù)、最左筆劃、 最上筆劃、橫、豎、彎、點、撇、捺。其中,總筆劃數(shù)并非獨立數(shù)據(jù),其值等于其它六個筆劃數(shù)之 和(即橫+豎+彎+點+撇+捺)。之所以選取這九個信息作為漢字的圖形特征是因為 它們從根本上體現(xiàn)了每個漢字筆劃構成的組合特點;不僅如此,把根據(jù)六種簡易筆劃和三 條筆劃規(guī)則所述產生出來的數(shù)據(jù)用作漢字編碼(見圖1)。以這種松散的數(shù)據(jù)結構作為漢字 編碼形式盡管看上去不像傳統(tǒng)的漢字編碼那樣緊湊,然而其“編碼”(即筆劃數(shù))均來自 漢字本身的自然屬性,沒有人為定義的轉換代碼,根本就不需要死記硬背;又由于是電腦管 理,用戶使用電腦的圖形用戶界面(即⑶I,完全不同于DOS命令界面)進行操作,因此根 本無須關心這些圖形特征數(shù)據(jù)的存在及其編碼形式。而且在動態(tài)檢索的情況下還可以任意 選取,這樣不僅使初級用戶容易掌握和使用,也給高級用戶更大的余地選取漢字圖形特征 最佳的順序和組合,這在一定程度上可以提高漢字輸入的速度,同時也為進一步開發(fā)以便 更好地適應不同的需求預留了發(fā)展空間。兩項應用成果應用本發(fā)明,使用電腦設備成就了以程序軟件為載體的(動態(tài))漢字簡易筆劃檢 索系統(tǒng),其實踐適用于在電腦、網絡和移動通訊設備上再現(xiàn)本發(fā)明的漢字檢索功能。圖2展 示了以漢字“專利”的“?!睘閷嵗臋z索情況(見圖2)。應用本發(fā)明,選用漢字圖形特征中總筆劃數(shù)、最左筆劃和最上筆劃這一特定的順 序和組合,成就了以印刷品為載體的(靜態(tài))漢字簡易筆劃索引;同時將現(xiàn)行漢語辭典中漢 字檢索的三級索引(即偏旁部首一漢字一解釋)簡化為兩級索引(即漢字一解釋),使 之更易于掌握和使用,其實踐適用于漢語辭典和漢語-外語辭典的漢字索引。圖3展示了 以漢字“專利”的“?!睘閷嵗乃饕闆r(見圖3)。
圖1 漢字筆劃圖形特征數(shù)據(jù)示意2 漢字簡易筆劃檢索系統(tǒng)示范圖3 漢字簡易筆劃索引示范詳見文件《說明書附圖》
具體實施例方式本發(fā)明檢索漢字的一般步驟如下 (表 2)總之,本發(fā)明最突出的特點就是“零起點,容易學、方便用”。
權利要求
一種漢字檢索方法,其特征在于使用三條筆劃規(guī)則和六種簡易筆劃,并且通過對漢字九個圖形特征的任意順序和組合進行篩選,逐步求精檢索漢字的同類最小集合。(請注意在這里“筆劃”是指本發(fā)明所定義的漢字簡易筆劃;而“筆畫”是指漢字傳統(tǒng)的筆畫;后同。)
2.如權利要求1所述的方法,其特征在于所述三條筆劃規(guī)則是 遇折點算一筆把一個傳統(tǒng)的有折點的復合筆畫分解成多個無折點的簡易筆劃來統(tǒng) 計筆劃數(shù); 先左邊后上邊取漢字的最左筆劃為第一筆,如果該字筆劃有兩筆或兩筆以上再取其 最上筆劃為第二筆; 一筆只計一次對那些最左和最上為同一筆劃的漢字采取只計一次的規(guī)則,同時根據(jù) 上述兩條規(guī)則選取下一個合格的筆劃作為最上筆劃。
3.如權利要求1所述的方法,其特征在于所述六種簡易筆劃有“橫”、“豎”、“彎”、 “點”、“撇”和“捺”,它們分別采納了漢字傳統(tǒng)筆畫中相應的單一筆畫(“彎”除外),并且將 復合筆畫分解成為多個簡易筆劃加以歸納。 筆劃“橫”代表漢字單一筆畫“橫”和復合筆畫中“橫”的部分; 筆劃“豎”代表漢字單一筆畫“豎”和復合筆畫中“豎”的部分; 筆劃“彎”代表漢字復合筆畫“彎鉤”和“橫撇彎鉤”中“彎”的部分; 筆劃“點”代表漢字單一筆畫“點”和復合筆畫中“鉤”的部分,以及復合筆畫“撇點” 中“點”的部分; 筆劃“撇”代表漢字單一筆畫“撇”和“提”,以及復合筆畫中“撇”的部分,還有復合筆 畫“撇折”分解后“撇”的部分和“折”的部分; 筆劃“捺”代表漢字單一筆畫“捺”和復合筆畫“走之兒”、“健之兒”中“臥之兒”的部 分,以及復合筆畫“斜鉤”、“橫斜鉤”中“斜”的部分。
4.如權利要求1所述的方法,其特征在于漢字筆劃的九個圖形特征是對于每一個漢 字,如權利要求2所述的規(guī)則提取其最左筆劃和最上筆劃,共計兩個信息;如權利要求3述 的六種簡易筆劃提取其各筆劃的筆劃數(shù)和總筆劃數(shù),共計七個信息;如此合計九個信息作 為漢字筆劃的圖形特征,即總筆劃數(shù)、最左筆劃、最上筆劃、橫、豎、彎、點、撇、捺。
5.如權利要求1、2、3和4所述的方法,其特征在于以任意的順序和組合提取所求漢 字筆劃的圖形特征,逐步檢索包含該漢字在內的同類最小集合,包括含且僅含所求漢字的皇A朱口 ο
6.如權利要求1、2、3、4和5所述的方法,其特征在于使用包括電腦在內的設備,成就 了以程序軟件為載體的漢字簡易筆劃檢索系統(tǒng),其實踐適用于在電腦、網絡和移動通訊設 備上再現(xiàn)本發(fā)明的漢字檢索功能。
7.如權利要求1、2、3、4和5所述的方法,其特征在于選用漢字筆劃的圖形特征中總 筆劃數(shù)、最左筆劃和最上筆劃這一特定的順序和組合,成就了以印刷品為載體的漢字簡易 筆劃索引,其實踐適用于漢語辭典和漢語-外語辭典的漢字索引。
全文摘要
漢字簡易筆劃檢索方法適用于以漢字圖形特征為線索進行漢字檢索的領域,包括漢語辭書的漢字索引、電腦網絡和移動通訊設備等的漢字輸入。其主要特征是徹底脫離了以漢字傳統(tǒng)的偏旁部首和復雜的筆畫為線索進行分類檢索的基本思路,無需背記漢字字根和代碼以及碼鍵對應關系,僅使用6種簡易筆劃(橫、豎、撇、捺、點、彎)及其簡單的規(guī)則,通過對輸入的漢字圖形特征的任意順序和組合進行篩選,逐步求精檢索漢字。其最大的特點就是簡便易行、中外皆宜、人人能用。
文檔編號G06F17/30GK101930474SQ20101028078
公開日2010年12月29日 申請日期2010年9月14日 優(yōu)先權日2010年9月14日
發(fā)明者張海地, 閆衛(wèi) 申請人:閆衛(wèi);張海地