国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      漢字自然部件編碼的制作方法

      文檔序號:6407963閱讀:328來源:國知局
      專利名稱:漢字自然部件編碼的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明為漢字自然部件編碼,它是一個科學拼形的漢字編碼方案。
      漢字自然部件編碼,以漢字的自然部件為設(shè)碼基礎(chǔ),以共碼方法為編碼技巧,把上萬的全部漢字,拆分為數(shù)百種自然部件,再從20--40范圍內(nèi)任取一個數(shù),作為自然部件分族的總數(shù)。本方案把自然部件暫分成36個族,并把這些自然部件族組織在一個編碼用的部族表內(nèi)。編碼時,取族碼作為編碼的單碼,組成每個單字不多于四碼的編碼,表達出漢字的全部形體信息,解決了一個多信息體的編碼技術(shù)難題。
      漢字自然部件編碼可以應用于1、漢字電腦鍵盤輸入;2、各種漢字辭書排序檢字;3、漢字替代拼形和速記;4、漢字電傳通訊;5、漢字字形結(jié)構(gòu)教學;6、漢字文化娛樂等。
      漢字自然部件編碼方案的內(nèi)容包括漢字自然部件拆分規(guī)則,自然部件共碼方法,自然部件共碼形式,編碼通用的單碼形式,單字編碼規(guī)則,重碼處理規(guī)則,詞語編碼規(guī)則,簡縮碼編碼規(guī)則,電腦輸入鍵盤形式,單碼遺忘補救形式,漢字自然部件拆拼表等,形成一個完整的體系。
      1、漢字自然部件拆分規(guī)則漢字由筆畫構(gòu)成。筆畫有基本筆畫和復合筆畫。基本筆畫有點橫豎撇捺提等,它們是點或者直線。基本筆畫之間的差別只在于它們運筆的方向不同,它們都可以用線性方程y=kx+b表示。復合筆畫則是二種以上的基本筆畫連筆復合而成,《新編小學生字典》上列出了二十多種。如果繼續(xù)研究漢字筆畫構(gòu)成的規(guī)律,會發(fā)現(xiàn)漢字中有一些相對位置不發(fā)生變化的筆畫構(gòu)件,它們就是習慣稱呼的部首、偏旁、字頭、字底等,我們統(tǒng)稱它們?yōu)椴考?。因此,筆畫看作為漢字構(gòu)成的基本層次,部件就是漢字構(gòu)成的中間層次。
      在電腦編碼中,“五筆字型”把漢字拆分成“字根”,如“申”(日,丨)、“柬”(一,四,小)、“里”(日,土)、“敷”(一,月,丨,攵;、,方)、“果”(日,木)等。拆分時,一個筆畫不能割斷在兩個“字根”中;設(shè)碼時,形體相近使用通代,或丟掉一部分筆畫構(gòu)件;成字時,“字根”相互穿插套疊。因此,拆分難記憶難掌握,編碼難移植難通用,成字難直觀難想象。盡管人們認為,不同的應用目的,漢字可以拆分成不同的“字根”,“字根”就是部件。實際上,漢字存在一種真正的符合漢字結(jié)構(gòu)和成字規(guī)律的部件,它就是自然部件。自然部件的主要形式是部首和交連筆畫構(gòu)件,還有幾種特殊形式。漢字拆分成自然部件的方法就叫自然部件拆分法。自然部件拆分法有如下規(guī)則“兩不兩可取大件,每字不超四部件”。
      “兩不”即一不拆分部首,如“黽、音、青、麥、里”等復合部首完全予以保留,不論它所擁有的單字有多少。當然,以后發(fā)生漸變是不可避免的,全部保留是為了與現(xiàn)在的字典相統(tǒng)一。二不拆分交連筆畫構(gòu)件,如“本、未、末、束、束、柬”等都作為一個自然部件。
      “兩可”即一可拆分由幾個交連筆畫構(gòu)件相連而成的復合交連筆畫構(gòu)件,如“果”可拆分成“田、木”,“堇”可拆分成“廿、中、王”。這種拆分是自然部件基本拆分的一種延伸。二可把基本筆畫或復合筆畫,幾個部首或交連筆畫構(gòu)件組成的組件及成字等視作為自然部件,如“才”( ,丿),“瀛”(氵, ,女,凡)等字中的“丿”和“ ”都是自然部件。這是自然部件基本拆分另一個方向的延伸。自然部件的檢驗標準是,在部件成字過程中,形成字整體或部分的自然部件之間,只存在上下或左右、包圍相連的位置關(guān)系,而且互不穿插套疊。
      “取大件”要求當一個單字中包含有復合的自然部件時,應先拆分為較大的復合部件,以求得拆分的自然部件數(shù)量最少;如“隋”應拆分為“阝,左,月”,而不應拆分為“阝,ナ,工,月”。
      “每字不超四部件”,即每個單字拆分后的部件最多不能超過四個,因此要求對多筆畫或多筆畫構(gòu)件的單字,采用字形全部信息的原則,部首或交連筆畫構(gòu)件組合的方式,拆分成部族表內(nèi)存在的組件,如“嚼”和“襟”,“嚼”被拆分成“口, ,寸”,“襻”被拆分成“衤,樊,手”。
      根據(jù)自然部件拆分法,“五筆字型”中的“申”、“柬”(筆畫交連),“里”(部首)都被作為自然部件,“敷”被拆分為“甫,方,攵”三個自然部件,“果”被拆分成“田,木”兩個自然部件。它們直觀明了,用不著強記。
      2、自然部件共碼方法自然部件拆分法把全部漢字拆分成五百個左右的自然部件,若要用它們進行編碼,會令人瞠目!這是漢字編碼中一個期待解決的多信息體編碼技術(shù)難題。但一觀現(xiàn)代計數(shù)方法,比成千上萬更多的計數(shù)對象,只用十個數(shù)碼,加上數(shù)位和進位規(guī)則,其數(shù)量便表達得那樣簡單和明了。獲得這種成功,究其原因,主要是依靠了一種“數(shù)位共碼方法”。漢字多信息體編碼也應該存在這樣一種方法,它就是“不飽和共碼方法”。
      不飽和共碼方法先用一些符號分別表示這些自然部件,這些符號叫作“設(shè)碼”。用不多于四個的設(shè)碼組成編碼,這種編碼叫做“設(shè)碼編碼”。在設(shè)碼編碼中只有少量編碼與漢字對應。這種有漢字對應的設(shè)碼編碼叫“實編碼”,沒有漢字對應的設(shè)碼編碼叫“虛編碼”。由設(shè)碼組成的所有編碼叫做“設(shè)碼編碼集合”。自然部件的這個設(shè)碼編碼集合中,因為存在沒有漢字對應的虛編碼,所以它是一個“不飽和的編碼集合”。由于它具有不飽和的性質(zhì),我們可以指定其中的一部分自然部件設(shè)碼,并用這些指定之內(nèi)的自然部件設(shè)碼組成的沒有漢字對應的虛編碼,替代指定以外的自然部件設(shè)碼組成的有漢字對應的實編碼,同時保證替代后的設(shè)碼編碼與漢字對應的單一性,從而由指定的自然部件設(shè)碼形成一個實編碼占有率比原設(shè)碼編碼集合高得多的“設(shè)碼編碼子集合”。這個設(shè)碼編碼子集合就是自然部件編碼集合。這一替代過程叫做指定外的自然部件設(shè)碼與指定內(nèi)的自然部件設(shè)碼共碼。共碼的具體操作是多次的按程序的數(shù)學排列組合和選擇。它指定的自然部件設(shè)碼數(shù)量,可以從20--40這個范圍內(nèi)取任一數(shù)字。不過,“20”這個指定自然部件設(shè)碼數(shù)量的小限,還未作數(shù)學計算上的論證,只是一種粗略的估計。因為小限取得太小,使設(shè)碼編碼子集合太接近于飽和,它就會給操作帶來諸多不便,得不償失。指定自然部件設(shè)碼的大限,當然是設(shè)碼的總數(shù),取這樣的大限就轉(zhuǎn)變?yōu)閭鹘y(tǒng)的編碼方法,失去了共碼這一形式的意義。
      3、自然部件共碼的表達形式自然部件通過設(shè)碼進行共碼后,這些設(shè)碼所代表的自然部件便形成了“部件族”。一個部件族內(nèi)的自然部件拼形組合后不會相互產(chǎn)生實際存在的漢字。我們把設(shè)碼編碼子集合中各個指定之內(nèi)的自然部件設(shè)碼所形成的部件族,組織在一個具有直角坐標性質(zhì)的二維表格之中,這個表格就叫“部族表”,如

      圖1所示。部件族在部族表中形成固定的位置,部件在部族表的一個坐標方向形成排列順序,部件族在部族表的另一個坐標方向形成排列順序。部件的排列順序叫部序。由于各個部件族的各個自然部件設(shè)碼都不相同,在部族表中部件的排列順序,統(tǒng)一改用一套新的符號表示,這一套新的符號叫“部序碼”,簡稱“部碼”。部件族的排列順序在部族表中形成族序,原來指定的設(shè)碼符號便成為“族序碼”,簡稱“族碼”。由于這些自然部件設(shè)碼充當?shù)淖宕a沒有習慣的順序,再通過部件在各族中的入序排列,使部碼和族碼可以共碼。并且它們都統(tǒng)一使用一種數(shù)字循環(huán)符號,這就是部族表中部碼和族碼形式選擇的理由之一。進行漢字編碼時,就使用部族表中的族碼作為單碼進行編碼,有時也使用部碼作為單碼進行編碼。可以看出,族碼和部碼表示平面上的一個點,當編碼中使用部碼后,編碼中的部碼和相應的族碼便確定一個唯一的自然部件。
      部族表是自然部件編碼的基礎(chǔ),為了使它有利于操作和記憶,部族表中每個族的前幾個部件布置為常用字部件,而常用字部件的前面部分是高頻部件,常用字部件后面才是重碼字部件,低頻部件,古籍字部件等。在對編碼進行解碼時,如果把編碼中充當單碼的部碼當作為族碼,由于部件在部件族中進行了入序排列,與部碼對應的該族中的各個部件,不會與這個部碼對應的部件拼形組合成實際存在的漢字。
      圖1所給出的部族表,只是一個用于自然部件編碼舉例的部族表,并未經(jīng)編定的電腦程序甄別檢驗。真正的部族表,還需要按照設(shè)定的條件用電腦計算優(yōu)化,通過實踐修改后才能完善,設(shè)定條件也需要征求辭書文字,語文教育,電腦編碼各界的意見,最后將形成象漢語拼音“聲韻表”一樣的國家標準的漢語拼字“部族表”。
      圖1所給出的部族表,部碼的數(shù)字取二十一,族碼的數(shù)字取三十六,只是在形式上與漢語拼音聲母韻母數(shù)量一致,并無內(nèi)容上的必然聯(lián)系。部碼數(shù)字的多少取決于部件族中部件最多者的數(shù)量;族碼數(shù)字的多少取決于電腦鍵盤的容量,設(shè)碼編碼集合的不飽和程度等多種因素。
      4、編碼通用的單碼形式在圖1部族表中已經(jīng)看到,部碼是以1--7的數(shù)字加上點、圈區(qū)別標志進行循環(huán)所形成的數(shù)字循環(huán)符號,族碼是以1--9的數(shù)字加上點、圈、橫區(qū)別標志進行循環(huán)所形成的數(shù)字循環(huán)符號。為什么采用這樣一種符號?按傳統(tǒng)的方法,一個族的部件數(shù)量及部件族的數(shù)量都大于十,只能采用字母編碼和排序。用字母作為單碼進行編碼,其編碼就是一種字母碼。而用字母排序,字母的總數(shù)就相當于一種進位制的進位數(shù)。人們習慣于十進位制,字母排序的順序感不強。這對于簡單平面分布的電腦鍵盤并不產(chǎn)生困難,但作為字典檢字編碼最需要的是編碼的順序感,以加快搜索編碼目標的速度。所以族碼和部碼都不宜采用字母表示。如果我們先用字母表示,再轉(zhuǎn)換成數(shù)字碼,像幾種電腦碼一樣,四碼的字母編碼便變成了八碼的數(shù)字編碼,得不償失。所以采用一種既與數(shù)字相通,又能滿足單個符號超十要求的數(shù)字循環(huán)符號。
      從圖1可知,數(shù)字循環(huán)符號的結(jié)構(gòu)分兩個部分,符號的主體是數(shù)字,符號的區(qū)別標志是放在數(shù)字下的點、圈、橫等。漢語聲母,韻母,俄文字母,希臘字母,一年十二個月,它們都可以用數(shù)字循環(huán)符號表示。
      族碼部碼使用數(shù)字循環(huán)符號,能使?jié)h字編碼達到準數(shù)字化水平。這種漢字編碼,用電腦鍵盤輸入,只需要在原拉丁字母鍵帽上對應一個數(shù)字循環(huán)符號,數(shù)字循環(huán)符號便表現(xiàn)出字母功能。這種編碼用于字典排序檢字,只需要按數(shù)字從小到大,區(qū)別標志從無到點、到圈、到橫予以排列,數(shù)字循環(huán)符號便表現(xiàn)出數(shù)字功能;這種漢字編碼作為漢字的一種替代拼形,它便成為與漢字草書體脫離原字形一樣的漢字編碼體,但它形體并不草,而只是數(shù),它能最簡單地激起對漢字字形的想象,它又不會刺激民族情感,因為現(xiàn)代數(shù)字早已被世界各族人民視作一種世界文化。由此可見,數(shù)字循環(huán)符號是漢字編碼走向多個領(lǐng)域通用的基礎(chǔ)。
      5、單字編碼規(guī)則漢字自然部件編碼,單字編碼有四種情況(1)表內(nèi)成字單字。部族表內(nèi)所有成字作為單字的編碼,先取族碼作為編碼的單碼,再取它的部碼作為編碼的單碼,兩者聯(lián)合組成一個二碼編碼。如“言”(1,1)編碼為“11”,“禾”(1,1)編碼為“11”。小括號中前面的循環(huán)數(shù)字符號為族碼,后面的循環(huán)數(shù)字符號是部碼。一些部首與成字在筆形上有差別,成字直接采用部首編碼。如“”(4,1),“竹”被編為“41”,不應把“竹”拆分為(,丨,,)而編為“5152”。
      (2)、二部件單字。這種單字的編碼一般取其兩個部件的族碼作編碼的單碼,按兩個部件書寫成字的順序組成為一個二碼編碼。如“漢”[氵(1,1),又(9,3)]編碼為“19”。
      (3)、三部件單字。這種單字的編碼一般取其三個部件的族碼作編碼的單碼,再按三個部件書寫成字的順序組成一個三碼編碼,如“拼”[扌(4,1)、(5,7)、廾(8,4)]編碼為“458”。
      (4)、四部件單字。這種單字的編碼取其四個部件的族碼作為編碼單碼,按部件書寫成字的順序組成其編碼。如“縮”[纟(8,1)、宀(7,1)、亻(6,1)、百(6,3)]編碼為“8766”。
      對于詞語編碼,一般取單字編碼的第一個,或第一、二個單碼,簡縮成三個或四個單碼的編碼,和拼音文字的縮寫體一樣,但在設(shè)計時需要經(jīng)過統(tǒng)一的處理。
      漢字的編碼體就是單字的編碼。
      6、重碼處理規(guī)則漢字自然部件編碼有三種重碼字(1)、部件相同,部件書寫成字的順序相同的重碼字。這種重碼字在全部漢字中只有十幾對,如“邑”和“吧”,“只”和“叭”等。處理方法是統(tǒng)一在部件橫排字的編碼后面,再加上一個末筆部件的部碼作為編碼的單碼,構(gòu)成其區(qū)別編碼。如“邑”[口(3,1)、巴(8,5)]的編碼為“38”,“吧”[口(3,1)、巴(8,5)]的編碼為“385”,“只”的編碼為“37”,“叭”的編碼為“372”。規(guī)則易懂易記。
      (2)首筆部件不同但又共碼,其他部件又完全相同的二或三部件重碼字。這種重碼字,在首筆部件族碼后增加該部件的部碼作為編碼的單碼,構(gòu)成其區(qū)別編碼。如“匪”[(7,3)、非(4,1)]和“罪”[四(7,2)、非(4,1)],“匪”的編碼為“734”?!白铩钡木幋a為“724”。
      (3)首筆部件和其他部件都不相同,但它們又都共碼的重碼字。當這種重碼字是二部件字時,將其兩個部件的部碼分別加到自己的族碼后,作為編碼的單碼,構(gòu)成其區(qū)別編碼;當它是三部件字時,將首筆部件的部碼加在自己的族碼之后作為編碼單碼,構(gòu)成其區(qū)別編碼。例如“畝”[亠(1,2)、田(9,7)]和“汩”氵(1,1)、曰(9,6)],“畝”的編碼為“1297",“汩”的編碼為“1196”。
      7、電腦輸入鍵盤形式漢字自然部件編碼,應用于電腦鍵盤輸入,可利用現(xiàn)在電腦的標準鍵盤作為輸入工具。標準鍵盤的打字區(qū)有“0--9”及“A--Z”三十六個鍵,先保留“1--9”的鍵名不變,因為自然部件編碼中沒有“0”,再把“0”鍵和“A--Z”鍵的鍵帽分別標上“1--9”、“1--9”、“1--9”三組數(shù)字循環(huán)符號,正好二十七鍵,然后利用軟件對鍵盤加以定義,自然部件編碼就可以在標準鍵盤上使用。
      8、單碼遺忘補救形式漢字自然部件編碼,應用于電腦鍵盤輸入,操作者偶爾記不起部件的族碼,這是難以避免的,應該有一種補救措施。這種措施之一是,把部族表中前幾個常用字部件標在鍵帽上,其他未標出的部件,通過軟件和具體的操作命令把族碼表(圖2)中形體相近的自然部件段顯示在屏幕上。
      漢字自然部件編碼應用于字典排序檢字,操作者記不起部件的族碼,被查字的編碼就不能確定,檢字就無法進行。這和四角號碼檢字,音序檢字是一個道理,需要一個管用的補救措施。這種補救措施就是在自然部件編碼檢字表前,設(shè)置一個如圖2的族碼表。
      族碼表把部族表中各個自然部件,按“點起筆”、“橫起筆”、“豎起筆”、“撇起筆”分成四個大類,并作一次重新排列,下面再附上族碼。族碼表的“橫起筆”類里部件過多,又分為“橫不出頭”和“橫出頭”兩個部分。族碼表中各個自然部件,根據(jù)首筆、第二筆、第三筆等的筆形順序(、,一,丨,5),排定各個自然部件的位置順序,從而使得部件之間具有一種形體相近而又漸變的規(guī)律,最適宜于使用掃視獲得搜索目標,產(chǎn)生比部首檢字法中《難檢字筆畫索引》高得多的效率。
      權(quán)利要求
      1.一種漢字自然部件編碼,其特征在于先把漢字按自然部件拆分法拆分成自然部件,然后用一種虛設(shè)的符號分別表示這些自然部件,這些虛設(shè)的符號叫作“設(shè)碼”。用不多于四個的設(shè)碼組成編碼,形成一個只有少量設(shè)碼編碼與漢字對應的不飽和的設(shè)碼編碼集合。指定某一數(shù)量的自然部件,再用這些指定之內(nèi)的自然部件設(shè)碼組成的沒有漢字對應的“虛編碼”,替代指定之外的自然部件設(shè)碼組成的有漢字對應的“實編碼”,并保證這些替代后的設(shè)碼編碼與漢字之間的單一對應性,從而由指定的自然部件設(shè)碼形成一個實編碼占有率比原設(shè)碼編碼集合高得多的設(shè)碼編碼子集合,它就是漢字自然部件編碼集合。這一替代過程叫做指定外的自然部件設(shè)碼與指定內(nèi)的自然部件設(shè)碼共碼。共碼的具體操作是一種多次的按程序的數(shù)學排列組合和選擇。指定之內(nèi)的自然部件設(shè)碼與指定之外的能夠作上述替代的自然部件設(shè)碼共碼后,這些設(shè)碼所表示的自然部件便形成“部件族”,把設(shè)碼編碼子集合中各個指定之內(nèi)的自然部件設(shè)碼所形成的部件族,組織在一個具有直角坐標性質(zhì)的二維表格之中,這個表格叫作“部族表”。它就是自然部件進行編碼的基礎(chǔ)。部件族在部族表中占據(jù)固定的位置,部族表的一個坐標方向形成部件的排列順序,另一個坐標方向形成部件族的排列順序。由于各部件族的各個自然部件設(shè)碼都不相同,在部族表中部件的排列順序,統(tǒng)一改用一套新的符號表示,這套新的符號叫部序碼,簡稱“部碼”。部件族的排列順序在部族表中形成族序,在各族中,再通過部件的入序排列,使表示族序的族碼與部碼可以共碼,而且它們都改用從1至9的數(shù)字加上區(qū)別標志進行循環(huán)所形成的數(shù)字循環(huán)符號。進行漢字編碼時,使用部族表中與該自然部件對應的族碼,有時也用部碼進行編碼。這時的族碼和部碼便成為編碼中的單碼,從而使?jié)h字的編碼具有設(shè)碼--單碼-編碼三個層次。設(shè)碼是漢字編碼的基本層次,單碼是漢字編碼的中間層次。使用單碼進行編碼,對于部族表內(nèi)的成字單字,先取族碼作單碼,后取部碼作單碼,兩者組合成該字的編碼;對于二至四個部件構(gòu)成的單字,分別取各個部件的族碼作單碼,再依據(jù)部件書寫成字的順序構(gòu)成其編碼。
      2.根據(jù)權(quán)利要求1所述的漢字自然部件編碼,其特征在于自然部件拆分法為“兩不兩可取大件,每字不超四部件”?!皟刹弧奔床徊鸱植渴?,不拆分交連筆畫構(gòu)件?!皟煽伞奔纯刹鸱謴秃辖贿B筆畫構(gòu)件,可把筆畫、組件及成字等視作為自然部件。“取大件”要求當一個單字中包含有復合的自然部件時,應先拆分為較大的復合部件,以求得拆分的部件數(shù)量最少?!懊孔植怀牟考保疵總€單字拆分的自然部件不超過四個,因此對多筆畫和多筆畫構(gòu)件的單字,采用字形全部信息的原則,部首或交連筆畫構(gòu)件組合的方式,拆分成部族表內(nèi)存在的組件。
      3.根據(jù)權(quán)利要求1所述的漢字自然部件編碼,其特征在于部族表的一個坐標依順序排列部件,另一個坐標依順序排列部件族。族碼是該族部件共碼的一種表達,而部碼是該族部件共碼表達的一種補充。它們形成一種編碼單碼選擇的常用備用條件。部族表中每一個族的前幾個部件是常用字部件,常用字部件的前面部分是高頻部件,常用字部件后面是重碼字部件,低頻部件,古籍字部件等。部族表中同一個族內(nèi)的每一個自然部件與本族內(nèi)其他自然部件相互拼形組合,不會產(chǎn)生實際存在的漢字;在對編碼進行解碼時,如果把編碼充當單碼的部碼當作了族碼,該族中的各個部件不會與這個部件拼形組合成實際存在的漢字。
      4.根據(jù)權(quán)利要求1所述的漢字自然部件編碼,其特征在于重碼處理方法為,部件相同,部件書寫成字的順序也相同的二部件重碼字,統(tǒng)一在部件橫排字的編碼后加上末筆部件的部碼,構(gòu)成其區(qū)別碼;首筆部件不同但又共碼,其他部件又完全相同的二或三部件重碼字,在首筆部件族碼后增加該部件的部碼作為編碼的單碼,構(gòu)成其區(qū)別碼;首筆部件和其他部件都不相同,但它們又都共碼的重碼字,當它是二部件字時,將兩個部件的部碼分別加到自己的族碼之后作為編碼的單碼,構(gòu)成其區(qū)別碼;當它是三部件字時,將首筆部件的部碼加在自己的族碼后作為編碼的單碼,構(gòu)成其區(qū)別碼。
      5.根據(jù)權(quán)利要求1所述的漢字自然部件編碼,其特征在于族碼表是部族表中各個自然部件按“點起筆”、“橫起筆”、“豎起筆”、“撇起筆”分成四個大類形成的,“橫起筆”類里又分成“橫不出頭”和“橫出頭”兩個部分。各個自然部件都根據(jù)首筆、第二筆、第三筆等的筆形順序,排定各個自然部件的線性位置順序,部件的下面附上族碼,部件之間具有一種形體相近而又漸變的規(guī)律,形成一種形體相近的自然部件段。
      全文摘要
      漢字自然部件編碼是一個拼形的編碼方案。它以漢字自然部件為設(shè)碼基礎(chǔ),以不飽和共碼方法為編碼技巧,把上萬的全部漢字,拆分為數(shù)百種自然部件,再從20-40范圍內(nèi)任取一個數(shù),作為自然部件分族總數(shù)。本方案使用附標數(shù)字符號,把自然部件分成35個族,組成一個二維部件拼字表。編碼時,取部件族序碼或族序碼加部序碼組成每個單字不多于四碼的沒有重碼的編碼,表達出漢字的全部形體信息;字典檢字時,按數(shù)字和附標順序排列編碼順序,解決了漢字無重碼和漢字排序的技術(shù)難題。
      文檔編號G06F3/023GK1124366SQ9411111
      公開日1996年6月12日 申請日期1994年8月8日 優(yōu)先權(quán)日1994年8月8日
      發(fā)明者曹述交 申請人:曹述交
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1