国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種泰文數(shù)據(jù)檢測方法

      文檔序號:6458558閱讀:375來源:國知局
      專利名稱:一種泰文數(shù)據(jù)檢測方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種數(shù)據(jù)檢測方法,尤其是一種泰文數(shù)據(jù)檢測方法。
      技術(shù)背景隨著計(jì)算機(jī)應(yīng)用普及大量的文字、影音、及圖像可數(shù)字化而利用這些計(jì) 算機(jī)媒介儲存以及整合成數(shù)據(jù)庫,以供使用者查詢。目前維護(hù)這些數(shù)據(jù)庫的 數(shù)字內(nèi)容(特別是維護(hù)數(shù)據(jù)庫的文字內(nèi)容)的主要流程如下程序員檢視數(shù) 據(jù)庫存放的格式,以判斷是否有例如文字格式不符等狀況,若有此狀況則回 報(bào)數(shù)據(jù)維護(hù)人員以更正數(shù)據(jù)庫的文字內(nèi)容。倘若數(shù)據(jù)庫的文字內(nèi)容包括跨國 語言,例如英文、日文、或韓文等,則數(shù)據(jù)維護(hù)人員又需再次跟熟知這些語 言的人士進(jìn)行溝通確認(rèn),以修改上述文字格式不符之處。目前泰文數(shù)據(jù)庫的維護(hù)多半采用上述流程。然而,上述維護(hù)流程的缺陷 在于找出一段(或整篇)文件數(shù)據(jù)的問題點(diǎn)過于隨機(jī)、不完全。舉例而言,程序人員僅分析一段(或整篇)文件數(shù)據(jù)對應(yīng)的單一碼(Unicode)是否為泰 文的單一碼范圍(0x0e01 0x0e68)內(nèi),或判斷此段(或整篇)文件數(shù)據(jù)的編 碼是否合乎泰文編碼。當(dāng)發(fā)現(xiàn)其中某段文字不合乎單一碼或泰文編碼時,則 回報(bào)數(shù)據(jù)維護(hù)人員發(fā)生錯誤之處。然而對于泰文單詞的文字構(gòu)造的錯誤(例 如自動找出錯誤的泰文單字或單詞),則無法完全由程序人員分析出。另外, 若數(shù)據(jù)維護(hù)人員也不熟悉泰文語法,則需再通過熟悉泰文的第三人確認(rèn)并修 復(fù)數(shù)據(jù)錯誤處。多方溝通往往會讓修復(fù)(或更新)數(shù)據(jù)庫的效率降低,且提 高維護(hù)的成本。 發(fā)明內(nèi)容為了解決背景技術(shù)中所述的技術(shù)問題,本發(fā)明提供了一種泰文數(shù)據(jù)檢測 方法,通過內(nèi)建的泰文字構(gòu)及泰文語法規(guī)則對存放在數(shù)據(jù)庫中的文件進(jìn)行文 字的合法性分析及檢驗(yàn),而輸出錯誤報(bào)告供維護(hù)者參考,以進(jìn)一步維護(hù)數(shù)據(jù)庫中的文件。本發(fā)明的技術(shù)方案是本發(fā)明是一種泰文數(shù)據(jù)檢測方法,其特殊之處在 于該方法包括以下步驟1) 、讀入文件數(shù)據(jù)并保存該文件數(shù)據(jù)中的泰文部分;2) 、依據(jù)數(shù)據(jù)庫中儲存的泰文字構(gòu)規(guī)則及泰文語法規(guī)則分析比對步驟1) 中保存的泰文部分,并輸出錯誤報(bào)告。上述步驟2)中依據(jù)泰文字構(gòu)規(guī)則分析比對步驟l)中保存的泰文部分包 括以下步驟2.1)、讀入步驟l)中保存的泰文部分的泰文單詞; 2. 2)、依序讀入這個泰文單詞中所包含的至少一個泰文部首; 2.3)、判斷步驟2.2)中讀入的泰文單詞的泰文部首當(dāng)一個泰文單詞的 部首的個數(shù)大于3時,則輸出第一錯誤訊息;當(dāng)一個泰文單詞的部首個數(shù)等 于3,且最后的泰文部首不是上上部部首時,則輸出第二錯誤訊息;當(dāng)泰文 單詞包含的泰文部首中,同時存在一個上下部以及下部的部首時,則輸出第 三錯誤訊息。上述步驟2)之后還包括步驟3)依據(jù)步驟2)輸出的錯誤報(bào)告修正步驟 1)保存的數(shù)據(jù)。上述步驟2)數(shù)據(jù)庫中儲存的泰文字構(gòu)規(guī)則及泰文語法規(guī)則可進(jìn)行更新。 上述步驟1)中文件數(shù)據(jù)中的泰文部分以單一碼或本地碼的格式編碼儲存。上述步驟1)中文件數(shù)據(jù)中的泰文部分是以空格來區(qū)分出至少一個泰文單詞的。上述步驟2)中的錯誤報(bào)告包括文件數(shù)據(jù)中發(fā)生問題的數(shù)據(jù)的行列號碼及錯誤類型。綜上所述,本發(fā)明是由一個內(nèi)儲的泰文字構(gòu)規(guī)則及泰文語法規(guī)則來判斷 泰文單詞是否合法,進(jìn)而自動產(chǎn)生錯誤報(bào)告,用來供數(shù)據(jù)維護(hù)者快速找出數(shù) 據(jù)庫中需維護(hù)的部分,并可修正或加入上述的判斷泰文字構(gòu)或語法規(guī)則,使 判斷文件數(shù)據(jù)的正確性更趨精確,并減少多方維護(hù)溝通是否須修正數(shù)據(jù)庫所浪費(fèi)的人力支出及時間成本。


      圖l是本發(fā)明的流程圖;圖2為本發(fā)明的泰文字構(gòu)規(guī)則分析比對文件數(shù)據(jù)的流程圖; 圖3為本發(fā)明的操作接口示意圖; 圖4為本發(fā)明的錯誤報(bào)告示意圖;圖5為本發(fā)明的另一使用者操作接口示意圖。
      具體實(shí)施方式
      參見圖1,本發(fā)明包括下列步驟步驟S110,讀入文件數(shù)據(jù),這些文件 數(shù)據(jù)可以是中文、泰文夾雜的文件數(shù)據(jù);步驟S120,保留文件數(shù)據(jù)中的泰文 部分,并去除非泰文部分,此時可將這些泰文部分以單一碼(Unicode)或本 地碼的編碼方式儲存另存于一個文本文件或是暫存于執(zhí)行泰文數(shù)據(jù)檢測方法 的設(shè)備的內(nèi)存中,而且這些泰文部分可包括至少一個泰文單詞,在泰文單詞 之間以空格的方式來區(qū)分,每一個泰文單詞的組成皆包括至少一個泰文部首, 這些泰文部首例如為上部部首、中部部首、下部部首、上上部部首、以及上 下部部首等五大類,這些泰文部首對應(yīng)的本地碼或單一碼會介于一定之范圍 內(nèi),例如上部部首對應(yīng)到本地碼(0x95 0x97),以及對應(yīng)到單一碼 (0x0e60 0x0e62),因此可用來判斷泰文單詞內(nèi)包含的泰文部首種類,用來 辨識泰文單詞是否合法;步驟S130,將本實(shí)施例中泰文字構(gòu)規(guī)則及泰文語法 規(guī)則儲存于類似于專家系統(tǒng)的規(guī)則數(shù)據(jù)庫(rule base),以檢測文件數(shù)據(jù)的泰 文部分;步驟S140,依據(jù)步驟S130,匯集問題發(fā)生的信息而輸出錯誤報(bào)告; 步驟S150,依據(jù)步驟S140輸出的錯誤報(bào)告修正文件數(shù)據(jù),或是更新儲存的 泰文字構(gòu)規(guī)則及泰文語法規(guī)則,以增加?xùn)蓑?yàn)文件數(shù)據(jù)的泰文部分的正確性。參照圖2,文件數(shù)據(jù)的泰文部分依據(jù)泰文字構(gòu)規(guī)則來分析驗(yàn)證泰文單詞 的正確性,包括以下步驟步驟S210,讀入文件數(shù)據(jù)的泰文部分的泰文單詞; 步驟S220,依序讀入泰文單詞包含的至少一個泰文部首;步驟S230,判斷泰 文單詞包含的泰文部首的個數(shù)是否大于3,若超過3則輸出第一錯誤訊息; 步驟S240,泰文單詞包含的泰文部首個數(shù)等于3且最后的泰文部首不是上上部部首時,輸出第二錯誤訊息;步驟S250,在一個泰文單詞中,若同時存在 一個上下部以及一個下部的部首時,輸出第三錯誤訊息。依據(jù)泰文字構(gòu)規(guī)則來分析驗(yàn)證泰文單詞的正確性時,在判斷出一個泰文 單詞后,遞歸的抓取下一個泰文單詞來驗(yàn)證,直到整份文件數(shù)據(jù)的泰文部分皆查驗(yàn)完畢。其中,第一錯誤訊息、第二錯誤訊息、以及第三錯誤訊息將匯整為一個 錯誤報(bào)告,當(dāng)中包含了問題數(shù)據(jù)的行列號碼、不合法的泰文單詞發(fā)生的位置、 以及錯誤類型以供使用者參考。為讓本發(fā)明更趨明了易懂,以下段落特舉較佳實(shí)施例說明泰文數(shù)據(jù)檢測方法。參見圖3、 4,首先以一臺可執(zhí)行本發(fā)明的泰文數(shù)據(jù)檢測方法的設(shè)備,加 載例如為文件l.dbs的文件數(shù)據(jù),在文件數(shù)據(jù)檢測接口 300的文件數(shù)據(jù)窗口 310便會出現(xiàn)加載的文件數(shù)據(jù)的內(nèi)容。之后,保留泰文部分并顯示于泰文數(shù) 據(jù)窗口 320,而泰文部分包含多個泰文單詞,在各個泰文單詞之間以一個空 格區(qū)分開來。當(dāng)按下開始分析選項(xiàng)330后,即逐字的判斷每一個泰文單詞的 合法性。使用語法規(guī)則進(jìn)一步判斷各個泰文單詞的詞性的關(guān)聯(lián)性,熟知泰文 語法者可增刪語法規(guī)則來驗(yàn)證文件數(shù)據(jù),在此不限定其范圍。當(dāng)檢驗(yàn)完文件 數(shù)據(jù)的泰文部分的各個泰文單詞的正確性后,會進(jìn)一步產(chǎn)生一個錯誤報(bào)告 400,使用者查看此錯誤報(bào)告400即知道例如在第5032行第51列的泰文單詞 起始字構(gòu)不是中部部首的錯誤,使用者便可根據(jù)此修改文件數(shù)據(jù)中發(fā)生的錯 誤。參見圖5,使用者更可通過一個增刪泰文判斷規(guī)則接口 500來增刪泰文 字構(gòu)規(guī)則及泰文語法規(guī)則。加載一個泰文字構(gòu)規(guī)則(例如規(guī)則l.dbs),判斷 泰文單詞合法性的所有規(guī)則敘述便會顯示于判斷規(guī)則列表510,熟知泰文者 可通過輸入規(guī)則窗口 520更新或修改泰文字構(gòu)規(guī)則。
      權(quán)利要求
      1、一種泰文數(shù)據(jù)檢測方法,其特征在于該方法包括以下步驟1)、讀入文件數(shù)據(jù)并保存該文件數(shù)據(jù)中的泰文部分;2)、依據(jù)數(shù)據(jù)庫中儲存的泰文字構(gòu)規(guī)則及泰文語法規(guī)則分析比對步驟1)中保存的泰文部分,并輸出錯誤報(bào)告。
      2.3)、判斷步驟2.2)中讀入的泰文單詞的泰文部首當(dāng)一個泰文單詞的 部首的個數(shù)大于3時,則輸出第一錯誤訊息;當(dāng)一個泰文單詞的部首個數(shù)等 于3,且最后的泰文部首不是上上部部首時,則輸出第二錯誤訊息;當(dāng)泰文 單詞包含的泰文部首中,同時存在一個上下部以及下部的部首時,則輸出第 三錯誤訊息。
      3、 根據(jù)權(quán)利要求1或2所述的泰文數(shù)據(jù)檢測方法,其特征在于所述步 驟2)之后還包括步驟3)依據(jù)步驟2)輸出的錯誤報(bào)告修正步驟l)保存的數(shù)據(jù)。
      4、 根據(jù)權(quán)利要求1所述的泰文數(shù)據(jù)檢測方法,其特征在于所述步驟2) 數(shù)據(jù)庫中儲存的泰文字構(gòu)規(guī)則及泰文語法規(guī)則可進(jìn)行更新。
      5、 根據(jù)權(quán)利要求1所述的泰文數(shù)據(jù)檢測方法,其特征在于所述步驟1) 中文件數(shù)據(jù)中的泰文部分以單一碼或本地碼的格式編碼儲存。
      6、 根據(jù)權(quán)利要求1所述的泰文數(shù)據(jù)檢測方法,其特征在于所述步驟1) 中文件數(shù)據(jù)中的泰文部分是以空格來區(qū)分出至少一個泰文單詞的。
      7、 根據(jù)權(quán)利要求1所述的泰文數(shù)據(jù)檢測方法,其特征在于所述步驟2) 中的錯誤報(bào)告包括文件數(shù)據(jù)中發(fā)生問題的數(shù)據(jù)的行列號碼及錯誤類型。
      全文摘要
      本發(fā)明涉及一種泰文數(shù)據(jù)檢測方法,該方法包括以下步驟1)讀入文件數(shù)據(jù)并保存該文件數(shù)據(jù)中的泰文部分;2)依據(jù)數(shù)據(jù)庫中儲存的泰文字構(gòu)規(guī)則及泰文語法規(guī)則分析比對步驟1)中保存的泰文部分,并輸出錯誤報(bào)告。本發(fā)明所提供的泰文數(shù)據(jù)檢測方法通過內(nèi)建的泰文字構(gòu)及泰文語法規(guī)則對存放在數(shù)據(jù)庫中的文件進(jìn)行文字的合法性分析及檢驗(yàn),而輸出錯誤報(bào)告供維護(hù)者參考,以進(jìn)一步維護(hù)數(shù)據(jù)庫中的文件。
      文檔編號G06F17/30GK101256556SQ20081001772
      公開日2008年9月3日 申請日期2008年3月17日 優(yōu)先權(quán)日2008年3月17日
      發(fā)明者星 朱, 陳淮琰 申請人:無敵科技(西安)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1