字庫校驗裝置和字庫校驗方法
【技術(shù)領域】
[0001] 本發(fā)明涉及計算機技術(shù)領域,具體而言,涉及一種字庫校驗裝置和一種字庫校驗 方法。
【背景技術(shù)】
[0002] 隨著計算機技術(shù)的不斷發(fā)展,對漢字信息化的需求日益增加,越來越多的用戶對 字體從風格和數(shù)量方面都有了新的需求。同時,與西文和日文相比,中文字體較少。針對這 種現(xiàn)狀,越來越多的字體廠商為了滿足市場需求,投入了大量的人力、物力盡可能的開發(fā)多 樣式的字體。隨著新字體開發(fā)的增加,除字體制作增加工作量外,還有一部分不小的工作量 就是字體檢驗,每增加一款新字體,就會增加字體檢驗的工作量。
[0003] 目前,絕大多數(shù)字體開發(fā)商檢驗字體的方法都是通過人工查看的方式,即將字庫 中包括的所有字符打印出來,同時打印的還有參照字符,就是已經(jīng)通過檢驗的字庫字符,然 后人工逐個字符進行查驗,將查驗結(jié)果反饋給字體前期開發(fā)人員,對錯誤字符進行修改,修 改完成后再次進行人工查庫,直到未發(fā)現(xiàn)新的錯字為止,一般一款字庫基本需要進行三次 人工查庫。這種方式既浪費人力,又浪費時間,而且人工查驗過程中很容易出現(xiàn)查字錯誤, 這樣嚴重影響成品字庫的開發(fā)效率和質(zhì)量。
[0004] 因此,需要一種新的字庫校驗方法,避免人工查驗字庫所導致的效率低下以及錯 誤率高的問題。
【發(fā)明內(nèi)容】
[0005] 考慮到相關技術(shù)中出現(xiàn)的技術(shù)問題,本發(fā)明所要解決的技術(shù)問題在于,提供一種 字庫校驗技術(shù),用以解決相關技術(shù)不能快速且準確地對新字庫進行校驗的問題。
[0006] 有鑒于此,根據(jù)本發(fā)明的一個方面,提供了一種字庫校驗裝置,包括:解析單元,用 于對參考字庫中的每一字符進行解析,生成第一字符信息數(shù)據(jù),以及對新字庫中的每一字 符進行解析,生成第二字符信息數(shù)據(jù);校驗單元,連接至所述解析單元,用于根據(jù)所述第一 字符信息數(shù)據(jù)校驗所述第二字符信息數(shù)據(jù),輸出校驗結(jié)果為不一致的字符,所述字符為所 述新字庫中的錯誤字符。
[0007] 參考字庫與新字庫的區(qū)別在于字體風格不一樣,兩個字庫中的字符編碼是相同 的,在成品之前,雖然字符編碼是相同的,但形成的字形有可能出錯,因此需要對得到的新 字庫進行校驗,來防止呈現(xiàn)的字形出錯。在本方案中,對參考字庫中的字符進行解析,同樣 對新字庫中的字符也進行解析,將參考字庫的字符信息數(shù)據(jù)與新字庫中的字符信息數(shù)據(jù)進 行比較,如果發(fā)現(xiàn)比較結(jié)果不一樣,則認為新字庫中的相應字符是錯誤的字符,整個檢驗過 程無需人工參與,因此,提高了校驗效率,也提高了校驗準確率,得到了快速且準確地對新 字庫進行校驗的目的。
[0008] 根據(jù)本發(fā)明的另一方面,還提供了一種字庫校驗方法,包括:對參考字庫中的每一 字符進行解析,生成第一字符信息數(shù)據(jù);對新字庫中的每一字符進行解析,生成第二字符信 息數(shù)據(jù);根據(jù)所述第一字符信息數(shù)據(jù)校驗所述第二字符信息數(shù)據(jù),輸出校驗結(jié)果為不一致 的字符,所述字符為所述新字庫中的錯誤字符。
[0009] 參考字庫與新字庫的區(qū)別在于字體風格不一樣,兩個字庫中的字符編碼是相同 的,在成品之前,雖然字符編碼是相同的,但形成的字形有可能出錯,因此需要對得到的新 字庫進行校驗,來防止呈現(xiàn)的字形出錯。在本方案中,對參考字庫中的字符進行解析,同樣 對新字庫中的字符也進行解析,將參考字庫的字符信息數(shù)據(jù)與新字庫中的字符信息數(shù)據(jù)進 行比較,如果發(fā)現(xiàn)比較結(jié)果不一樣,則認為新字庫中的相應字符是錯誤的字符,整個檢驗過 程無需人工參與,因此,提高了校驗效率,也提高了校驗準確率,得到了快速且準確地對新 字庫進行校驗的目的。
【附圖說明】
[0010] 圖1示出了根據(jù)本發(fā)明的一個實施例的字庫校驗裝置的框圖;
[0011] 圖2示出了根據(jù)本發(fā)明的一個實施例的字庫校驗方法的流程圖;
[0012] 圖3示出了根據(jù)本發(fā)明的另一實施例的字庫校驗方法的流程圖;
[0013] 圖4示出了根據(jù)本發(fā)明的實施例的生成單個字符信息數(shù)據(jù)的流程圖;
[0014] 圖5示出了根據(jù)本發(fā)明的實施例的單個字符的校驗流程圖。
【具體實施方式】
[0015] 為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實 施方式對本發(fā)明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施 例及實施例中的特征可以相互組合。
[0016] 在下面的描述中闡述了很多具體細節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可 以采用其他不同于在此描述的其他方式來實施,因此,本發(fā)明并不限于下面公開的具體實 施例的限制。
[0017] 圖1示出了根據(jù)本發(fā)明的一個實施例的字庫校驗裝置的框圖。
[0018] 如圖1所示,根據(jù)本發(fā)明的實施例的字庫校驗裝置100,可以包括:
[0019] 解析單元102,用于對參考字庫中的每一字符進行解析,生成第一字符信息數(shù)據(jù), 以及對新字庫中的每一字符進行解析,生成第二字符信息數(shù)據(jù);校驗單元104,連接至所述 解析單元102,用于根據(jù)所述第一字符信息數(shù)據(jù)校驗所述第二字符信息數(shù)據(jù),輸出校驗結(jié)果 為不一致的字符,所述字符為所述新字庫中的錯誤字符。
[0020] 參考字庫與新字庫的區(qū)別在于字體風格不一樣,兩個字庫中的字符編碼是相同 的,在成品之前,雖然字符編碼是相同的,但形成的字形有可能出錯,因此需要對得到的新 字庫進行校驗,來防止呈現(xiàn)的字形出錯。在本方案中,對參考字庫中的字符進行解析,同樣 對新字庫中的字符也進行解析,將參考字庫的字符信息數(shù)據(jù)與新字庫中的字符信息數(shù)據(jù)進 行比較,如果發(fā)現(xiàn)比較結(jié)果不一樣,則認為新字庫中的相應字符是錯誤的字符,整個檢驗過 程無需人工參與,因此,提高了校驗效率,也提高了校驗準確率,得到了快速且準確地對新 字庫進行校驗的目的。
[0021] 在上述技術(shù)方案中,優(yōu)選的,所述第一字符信息數(shù)據(jù)和第二字符信息數(shù)據(jù)均包括 以下至少一種:字符編碼、字符包含的筆畫數(shù)、字符的筆畫特征。
[0022] 在上述任一技術(shù)方案中,優(yōu)選的,字庫校驗裝置100還可以包括:標識單元106,為 每一筆畫特征設置一筆畫特征標識,以及在所述字符包含多個筆畫時,在所述第一字符信 息數(shù)據(jù)或所述第二字符信息數(shù)據(jù)中,按照所述字符的書寫順序排列分別與所述多個筆畫對 應的多個筆畫特征標識,形成筆畫特征標識序列。
[0023] 為了便于校驗兩個字符的字形是否一致,需要為每一個筆畫特征設置一筆畫特征 標識,在識別出字符的筆畫特征之后,比較兩個字符的筆畫特征標識是否一致就可以判斷 兩個字符是否是相同的,在筆畫數(shù)為多個時,可以按照順序逐個比較兩個字符的筆畫標識, 若兩個字符的筆畫數(shù)均是5個筆畫,再比較至第三個筆畫時,若兩個字符的第三個筆畫的 筆畫標識不一樣,則認為新字庫中的該字符是錯誤字符,無需再比較接下來的兩個筆畫,這 樣可以提商校驗效率。
[0024] 在上述任一技術(shù)方案中,優(yōu)選的,所述校驗單元104可以包括:讀取單元1042,用 于讀取所述第二字符信息數(shù)據(jù)中的一條字符數(shù)據(jù);獲取單元1044,用于獲取所述第一字符 信息數(shù)據(jù)中與所述一條字符數(shù)據(jù)中的字符編碼相同的對應字符數(shù)據(jù);比較單元1046,用于 判斷所述一條字符數(shù)據(jù)與所述對應字符數(shù)據(jù)之間的筆畫數(shù)以及筆畫標識序列是否一致,若 筆畫數(shù)不一致或筆畫標識序列不一致,則確定與所述一條字符數(shù)據(jù)對應的字符是錯誤字 符。
[0025] 在校驗時,比較的前提是兩個字符的字符編碼是相同的,為了加快校驗速度,可以 先比較兩個字符的筆畫數(shù),如果筆畫數(shù)不一樣,則認為新字庫中的字符出錯,無需再比較筆 畫特征,在筆畫數(shù)相同的情況下才比較筆畫特征。
[0026] 在上述任一技術(shù)方案中,優(yōu)選的,所述解析單元102可以包括:提取單元1022,用 于提取所述字符的輪廓信息;識別單元1024,用于逐一讀取并識別所述輪廓信息中的單個 筆畫特征;計算單元1026,用于將識別的筆畫特征進行累加,得到所述字符的筆畫數(shù);記錄 單元1028,用于記錄所述字符的筆畫數(shù)以及筆畫特征,以生成所述第一字符信息數(shù)據(jù)和所 述第二字符信息數(shù)據(jù)。
[0027] 在解析字符時,首先獲取字符的輪廓信息,一個筆畫的輪廓是封閉回路,基于此, 可從輪廓信息中逐一讀取筆畫進行識別,每識別出一個筆畫就加一,從而確定字符的筆畫 數(shù)以及相應的筆畫特征。
[0028] 圖2示出了根據(jù)本發(fā)明的一個實施例的字庫校驗方法的流程圖。
[0029] 如圖2所示,根據(jù)本發(fā)明的實施例的一種字庫校驗方法,可以包括以下步驟:
[0030] 步驟202,對參考字庫中的每一字符進行解析,生成第一字符信息數(shù)據(jù);步驟204, 對新字庫中的每一字符進行解析,生成第二字符信息數(shù)據(jù);步驟206,根據(jù)所述第一字符信 息數(shù)據(jù)校驗所述第二字符信息數(shù)據(jù),輸出校驗結(jié)果為不一致的字符