用于字庫(kù)的查庫(kù)方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種用于字庫(kù)的查庫(kù)方法,包括:將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出;采用圖像分析技術(shù),對(duì)從基準(zhǔn)字庫(kù)中輸出的字符與從待比較字庫(kù)中輸出的字符進(jìn)行字形比較;將字形不一致的字符予以提示。本發(fā)明還提供了一種用于字庫(kù)的查庫(kù)裝置,包括:輸出模塊,用于將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出;字形比較模塊,用于采用圖像分析技術(shù),對(duì)從基準(zhǔn)字庫(kù)中輸出的字符與從待比較字庫(kù)中輸出的字符進(jìn)行字形比較;字形提示模塊,用于將字形不一致的字符予以提示。本發(fā)明提高了字庫(kù)查庫(kù)的準(zhǔn)確率。
【專利說(shuō)明】 用于字庫(kù)的查庫(kù)方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及字庫(kù)【技術(shù)領(lǐng)域】,具體而言,涉及用于字庫(kù)的查庫(kù)方法和裝置。
【背景技術(shù)】
[0002]大家都將字庫(kù)中的字符字形作為標(biāo)準(zhǔn),因此字庫(kù)字形的正確性很重要。每一個(gè)字庫(kù)產(chǎn)品都要經(jīng)過(guò)測(cè)試部門的嚴(yán)格檢測(cè),查庫(kù)是檢測(cè)的一個(gè)重要環(huán)節(jié),用來(lái)檢查字庫(kù)中字形是否正確,是否缺字等等。目前多數(shù)字庫(kù)廠商處理的方式,打印測(cè)試樣張,里面有編碼,正確字形,當(dāng)前字庫(kù)字形的一個(gè)對(duì)照關(guān)系,需要人工核對(duì)字形是否正確,是否缺失字等等。
[0003]由于查庫(kù)的單調(diào)性容易使人疲勞,不僅耗時(shí),耗力,在字符字形的正確性上,也不能保證,通常由不同的人查好幾遍,即便這樣,字庫(kù)廠商也不能保證字庫(kù)沒(méi)有錯(cuò)字,只能保證常見字符沒(méi)有錯(cuò)字,不常用字符某個(gè)水平錯(cuò)誤率之內(nèi)。
[0004]例如,當(dāng)某款字庫(kù)進(jìn)行升級(jí)(更新、添加或者刪除某些字符字形等因素字庫(kù)發(fā)生變化)后,升級(jí)字庫(kù)的查庫(kù),不僅需要檢查修改過(guò)的字庫(kù),還需要人工核查一下未修改的字符,因?yàn)榭赡艽嬖谀硞€(gè)環(huán)節(jié)引起未修改的字符字形與原來(lái)字庫(kù)字符字形不一致。傳統(tǒng)的檢查方法是將升級(jí)后的字庫(kù)字符以及升級(jí)前的字庫(kù)字符,同時(shí)打印在樣張上,人工進(jìn)行對(duì)比;當(dāng)某款字體字庫(kù)例如從GB2312擴(kuò)充到GBK或者GB18030,如果前面GB2312已經(jīng)檢查通過(guò),如何測(cè)試保證相同字符的字形沒(méi)有變化;同一廠商,相同字體不同存儲(chǔ)格式的曲線字庫(kù)(TrueType字庫(kù),OpenType字庫(kù),CID字庫(kù)),字符字形是否有差異。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在提供用于字庫(kù)的查庫(kù)方法和裝置,以解決上述的問(wèn)題。
[0006]在本發(fā)明的實(shí)施例中,提供了一種用于字庫(kù)的查庫(kù)方法,包括:將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出;采用圖像分析技術(shù),對(duì)從基準(zhǔn)字庫(kù)中輸出的字符與從待比較字庫(kù)中輸出的字符進(jìn)行字形比較;將字形不一致的字符予以提示。
[0007]在本發(fā)明的實(shí)施例中,提供了一種用于字庫(kù)的查庫(kù)裝置,包括:輸出模塊,用于將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出;字形比較模塊,用于采用圖像分析技術(shù),對(duì)從基準(zhǔn)字庫(kù)中輸出的字符與從待比較字庫(kù)中輸出的字符進(jìn)行字形比較;字形提示模塊,用于將字形不一致的字符予以提示。
[0008]本發(fā)明上述實(shí)施例的用于字庫(kù)的查庫(kù)方法和裝置因?yàn)椴捎脠D像分析技術(shù)來(lái)比較字形,所以克服了人工查庫(kù)容易出錯(cuò)的問(wèn)題,提高了字庫(kù)查庫(kù)的準(zhǔn)確率。
【專利附圖】
【附圖說(shuō)明】
[0009]此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0010]圖1示出了根據(jù)本發(fā)明實(shí)施例的用于字庫(kù)的查庫(kù)方法的流程圖;[0011]圖2示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例的用于字庫(kù)的查庫(kù)方法的流程圖;
[0012]圖3示出了根據(jù)本發(fā)明實(shí)施例的用于字庫(kù)的查庫(kù)裝置的示意圖。
【具體實(shí)施方式】
[0013]下面將參考附圖并結(jié)合實(shí)施例,來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0014]圖1示出了根據(jù)本發(fā)明實(shí)施例的用于字庫(kù)的查庫(kù)方法的流程圖,包括:
[0015]步驟S10,將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出;
[0016]步驟S20,采用圖像分析技術(shù),對(duì)從基準(zhǔn)字庫(kù)中輸出的字符與從待比較字庫(kù)中輸出的字符進(jìn)行字形比較;
[0017]步驟S30,將字形不一致的字符予以提示。
[0018]現(xiàn)有技術(shù)中,采用人工肉眼觀察的方式來(lái)逐一地檢查字庫(kù)中的每個(gè)字形。而本方法采用了圖像分析技術(shù),這可以通過(guò)計(jì)算機(jī)編程來(lái)實(shí)現(xiàn)自動(dòng)化地查庫(kù),排除了因人為因素漏掉的字形錯(cuò)誤,提高了查庫(kù)精準(zhǔn)度。
[0019]另外,計(jì)算機(jī)自動(dòng)查庫(kù)顯然效率更高,縮短了字庫(kù)產(chǎn)品制作發(fā)布周期,省事省力,同時(shí)節(jié)約成本。
[0020]本方法從圖像角度比對(duì)字形差異性,要求將字形輸出為單色位圖格式再進(jìn)行圖像匹配,這樣做的好處如下:
[0021]一、獲取字符位圖和在計(jì)算機(jī)中同字號(hào)下的最終顯示效果是一致的,排除了字庫(kù)中由于添加了指令引起的字符字形顯示效果差異,以及由于字庫(kù)基線不同引起的差異;二、擴(kuò)大了字庫(kù)可比較的范圍,由于比較的是圖像,因此既可以比較相同格式的字庫(kù),也可以比較不同存儲(chǔ)格式的字庫(kù)。比如比較兩個(gè).ttf字庫(kù),兩個(gè).0tf,或者一個(gè)是.ttf,另一個(gè)是.0tf,甚至是.0tf與CID字庫(kù)的比較。三、可以采用的匹配度算法比較多,而且比較成熟,這個(gè)可以依據(jù)實(shí)際需要選擇。
[0022]優(yōu)選地,預(yù)先設(shè)定匹配度,將字形比較的圖像相似度小于匹配度的字符確定為字形不一致。通過(guò)設(shè)定匹配度,可以根據(jù)用戶的需求控制圖像匹配的精確度。
[0023]優(yōu)選地,本方法還包括:預(yù)先將基準(zhǔn)字庫(kù)和待比較字庫(kù)設(shè)置為以相同的字號(hào)進(jìn)行輸出。兩款字庫(kù)生成的位圖是在相同字號(hào)下生成,這樣生成的字符位圖的尺寸一樣,從而避免了歸一化處理,提高自動(dòng)比對(duì)的精準(zhǔn)度。
[0024]優(yōu)選地,字號(hào)設(shè)置為48磅。由于是從位圖角度出發(fā),位圖的大小影響匹配效果,位圖尺寸越大匹配的精度越高,準(zhǔn)確率也越高,但是會(huì)導(dǎo)致字形比對(duì)效率下降,因此設(shè)置的字號(hào)也不是越大越好,發(fā)明人經(jīng)過(guò)大量的測(cè)試發(fā)現(xiàn),字號(hào)選用48磅時(shí)比較通用,轉(zhuǎn)化為位圖尺寸64*64,匹配效果較好。
[0025]優(yōu)選地,本方法還包括:預(yù)先將基準(zhǔn)字庫(kù)的所有字符編碼和待比較字庫(kù)的所有字符編碼進(jìn)行比較,判斷是否一致;將字符編碼不一致的字符予以提示。
[0026]有一款基準(zhǔn)字庫(kù),另外一款與其比較的字庫(kù)為待比較字庫(kù)。如果是升級(jí)字庫(kù)查庫(kù),使用本方法,原字庫(kù)便是基準(zhǔn)字庫(kù),升級(jí)后的字庫(kù)便是待比較字庫(kù),如果是同字體,不同格式的曲線字庫(kù)字形比較,選其他任一個(gè)為基準(zhǔn)字庫(kù),另一個(gè)為待比較字庫(kù)即可。
[0027]圖2示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例的用于字庫(kù)的查庫(kù)方法的流程圖,其步驟如下:
[0028]步驟S15:對(duì)基準(zhǔn)字庫(kù)和待比較字庫(kù)設(shè)置字號(hào)。由于是從位圖角度出發(fā),位圖的大小影響匹配效果,位圖尺寸越大匹配的精度越高,準(zhǔn)確率也越高,但是會(huì)導(dǎo)致字形比對(duì)效率下降,因此設(shè)置的字號(hào)也不是越大越好,測(cè)試發(fā)現(xiàn)選用48磅時(shí)比較通用,轉(zhuǎn)化為位圖尺寸64*64。
[0029]步驟S25:基準(zhǔn)字庫(kù)字符生成相應(yīng)的單色位圖圖像格式,獲取該字庫(kù)中所有字符編碼信息。這里獲取的字符顯示圖像,是字庫(kù)在這個(gè)字號(hào)下的在屏幕顯示或打印紙上實(shí)際顯不效果圖。
[0030]步驟S35:待比較字庫(kù)字符生成相應(yīng)的單色位圖圖像格式,獲取該字庫(kù)中所有字符編碼信息。兩款字庫(kù)生成位圖時(shí)設(shè)置相同字號(hào);這樣生成的字符位圖的尺寸一樣,從而避免了歸一化處理,提高自動(dòng)比對(duì)的精準(zhǔn)度。
[0031]步驟S45:比較兩款字庫(kù)包含的字符編碼是否一致。如果待比較字庫(kù)與基準(zhǔn)字庫(kù)相比,缺失某些字符或者包含更多字符,則直接進(jìn)行提示,該部分字符需要人工核查。
[0032]步驟S55:設(shè)定兩個(gè)字符位圖匹配度。如果滿足設(shè)定的匹配度,則可認(rèn)定兩個(gè)字符字形一致,反之兩個(gè)字符字形不一致。設(shè)定字符位圖的匹配度算法比較多,而且比較成熟,這個(gè)可以依據(jù)實(shí)際需要選擇。
[0033]步驟S65:比較相同編碼字符對(duì)應(yīng)的位圖,將不能匹配的字符結(jié)果輸出,同時(shí)保留相應(yīng)的位圖,便于查看問(wèn)題。
[0034]如果待測(cè)試字庫(kù)是升級(jí)字庫(kù),或者是從某個(gè)字庫(kù)擴(kuò)充后的新字庫(kù),那么該測(cè)試字庫(kù)便存在基準(zhǔn)字庫(kù),此時(shí)可以使用本方法自動(dòng)檢測(cè)出待測(cè)試字庫(kù)與原字庫(kù)不一致的字形,編碼不一致的也將輸出,只需人工核對(duì)有差異的那部分字形。
[0035]特別的,本方法可用于同一字體不同曲線字庫(kù)格式間的字形比較,查看相同字符字形是否一致。
[0036]圖3示出了根據(jù)本發(fā)明實(shí)施例的用于字庫(kù)的查庫(kù)裝置的示意圖,包括:
[0037]輸出模塊10,用于將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出;
[0038]字形比較模塊20,用于采用圖像分析技術(shù),對(duì)從基準(zhǔn)字庫(kù)中輸出的字符與從待比較字庫(kù)中輸出的字符進(jìn)行字形比較;
[0039]字形提示模塊30,用于將字形不一致的字符予以提示。
[0040]優(yōu)選地,預(yù)先設(shè)定匹配度,將字形比較的圖像相似度小于匹配度的字符確定為字形不一致。
[0041]優(yōu)選地,還包括:預(yù)先將基準(zhǔn)字庫(kù)和待比較字庫(kù)設(shè)置為以相同的字號(hào)進(jìn)行輸出。
[0042]優(yōu)選地,字號(hào)設(shè)置為48磅。
[0043]優(yōu)選地,本裝置還包括:編碼比較模塊,用于預(yù)先將基準(zhǔn)字庫(kù)的所有字符編碼和待比較字庫(kù)的所有字符編碼進(jìn)行比較,判斷是否一致;編碼提示模塊,用于將字符編碼不一致的字符予以提示。
[0044]本裝置排除了因人為因素漏掉的字形錯(cuò)誤,提高了查庫(kù)精準(zhǔn)度。
[0045]從以上的描述可以看出,本發(fā)明消除了因?yàn)樽謳?kù)添加指令引起最終字形顯示的差異,可以比較相同字體不同格式曲線字庫(kù)間的字形差異,提高了查庫(kù)精準(zhǔn)度,省事省力,同時(shí)節(jié)約成本。
[0046]顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0047]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種用于字庫(kù)的查庫(kù)方法,其特征在于,包括: 將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出; 采用圖像分析技術(shù),對(duì)從所述基準(zhǔn)字庫(kù)中輸出的字符與從所述待比較字庫(kù)中輸出的字符進(jìn)行字形比較; 將字形不一致的字符予以提示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,預(yù)先設(shè)定匹配度,將字形比較的圖像相似度小于所述匹配度的字符確定為字形不一致。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 預(yù)先將所述基準(zhǔn)字庫(kù)和所述待比較字庫(kù)設(shè)置為以相同的字號(hào)進(jìn)行輸出。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述字號(hào)設(shè)置為48磅。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 預(yù)先將所述基準(zhǔn)字庫(kù)的 所有字符編碼和所述待比較字庫(kù)的所有字符編碼進(jìn)行比較,判斷是否一致; 將字符編碼不一致的字符予以提示。
6.一種用于字庫(kù)的查庫(kù)裝置,其特征在于,包括: 輸出模塊,用于將基準(zhǔn)字庫(kù)中以及待比較字庫(kù)中的字符編碼一致的字符,分別均以單色位圖格式輸出; 字形比較模塊,用于采用圖像分析技術(shù),對(duì)從所述基準(zhǔn)字庫(kù)中輸出的字符與從所述待比較字庫(kù)中輸出的字符進(jìn)行字形比較; 字形提示模塊,用于將字形不一致的字符予以提示。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,預(yù)先設(shè)定匹配度,將字形比較的圖像相似度小于所述匹配度的字符確定為字形不一致。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 預(yù)先將所述基準(zhǔn)字庫(kù)和所述待比較字庫(kù)設(shè)置為以相同的字號(hào)進(jìn)行輸出。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述字號(hào)設(shè)置為48磅。
10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 編碼比較模塊,用于預(yù)先將所述基準(zhǔn)字庫(kù)的所有字符編碼和所述待比較字庫(kù)的所有字符編碼進(jìn)行比較,判斷是否一致; 編碼提示模塊,用于將字符編碼不一致的字符予以提示。
【文檔編號(hào)】G06F17/30GK103902532SQ201210567463
【公開日】2014年7月2日 申請(qǐng)日期:2012年12月24日 優(yōu)先權(quán)日:2012年12月24日
【發(fā)明者】唐英敏, 王玉欣 申請(qǐng)人:北京大學(xué), 北大方正集團(tuán)有限公司, 北京北大方正電子有限公司